Colnet Sito e SEO Immobiliare | P.IVA 10848460019 | Tel. 347.3606898 | info at colnet.it
colnet sito e seo immobiliare su facebookcolnet web marketing immobiliare su google pluscolnet siti web per agenzie immobiliari su twittercolnet seo e posizionamento immobiliare su linkedin
home » sito web, posizionamento siti, seo e web marketing per tutti

Indicizzare il Sito Web su Google e gli altri Motori di Ricerca gratuitamente

L'indicizzazione del Sito Web è il processo con cui le pagine del Sito vengono registrate all'interno di un apposito database.
L'indicizzazione è materialmente gestita da un software chiamato crawler o spider, che scansiona l'intera rete internet saltando da un sito all'altro attraverso i collegamenti ipertestuali disseminati sul web.
Quando si interroga un motore di ricerca, per velocizzare il processo di restituzione dei risultati o SERP (search engine results page), viene interrogato il databaseIndicizzazione del sito web sui motori di ricerca contenente il risultato della scansione.
Tanto migliore è l'algoritmo che regola la raccolta e la restituzione dei dati, tanto più apprezzato dall'utente sarà il risultato ottenuto.
E' proprio sulla base della qualità della SERP che Google è diventato il miglior motore di ricerca al mondo; in particolare Google aggiorna con maggior frequenza gli indici e le SERP sono molto più coerenti alle interrogazioni rispetto a qualsiasi altro motore di ricerca.

Problemi relativi all'Indicizzazione del Sito Web

Il problema della semplice indicizzazione del Sito Web è un falso problema, in quanto basterà che un solo collegamento punti ad una pagina qualsiasi del nostro sito per indicizzare tutto il sito.
L'indicizzazione di un sito è quindi un'operazione banale e il più delle volte automatica, ben diversa dal posizionamento del sito, che consiste nel raggiungere la migliore posizione nei risultati di ricerca per interrogazioni con parole chiave o keywords che riguardano il tema della pagina web o del sito.
Detto ciò, non significa che l'indicizzazione vada sempre a buon fine, infatti è possibile incorrere in diversi problemi riguardanti sia la prima indicizzazione (nuovo dominio), sia i successivi aggiornamenti:
  • il sito web non è ben collegato e quindi gli spider (e i navigatori) non possono raggiungere e indicizzare tutte le pagine del sito
  • a livello di collegamento o di pagina sono presenti attributi noindex (informa il motore di ricerca di non indicizzare) e/o nofollow (informa il motore di ricerca di ignorare/non seguire il collegamento)
  • il file robots preclude l'indicizzazione a determinati spider o determinate sezioni del sito o addirittura dell'intero sito
  • il sito potrebbe essere oggetto di gravi penalizzazioni

Indicizzazione mancante per problemi strutturali del sito

Il Sito Web non è ben collegato se da una pagina non si riesce a passare a tutte le altre con un numero limitato di collegamenti
In presenza di un numero eccessivo di collegamenti gli spider potrebbero avere difficoltà ad indicizzare velocemente e frequentemente il sito, mentre in assenza di collegamenti interni ed esterni, ovvero da parte di altri siti, c'è la certezza che quelle pagine web non verranno mai indicizzate
Per risolvere il problema occorre riprogettare i collegamenti e utilizzare una mappa del sito.
Altri contenuti normalmente non indicizzati, a meno di ricorrere a stratagemmi particolari, sono quelli delle finestre popup e flash, che inoltre concorrono pesantemente a ridurre l'usabilità del sito.

Indicizzazione mancante per presenza di direttive noindex e nofollow

In presenza di attributi noindex e/o nofollow alcune pagine o l'intero sito potrebbero essere esclusi dal processo di indicizzazione
Per risolvere il problema occorre accedere al codice html della pagina e rimuovere il metatag "robots" che si tova all'interno del tag "head" nella parte superiore della pagina oppure l'attributo "rel" del tag html "a" che identifica il collegamento

Indicizzazione mancante per errori nel file Robots

Il file robots contiene informazioni di indicizzazione per il motore di ricerca e a volte per fare un test o per distrazione può rimanere un'istruzione di troppo.
Per risolvere il problema verifichiamo l'esistenza del file semplicemente accedendo al collegamento del tipo http://miositoweb.it/robots.txt
Se appare un errore generico, di pagina non trovata o contenuto bianco significa rispettivamente che il file non esiste e non è stata gestito il caso di pagina non trovata, il file non esiste o il file esiste ed è vuoto e non esiste un problema di indicizzazione dovuto al file robots.
In presenza di file non vuoto, le istruzioni più comuni sono User-agent per specificare lo spider di un determinato motore di ricerca e Disallow per specificare quali elementi non indicizzare, quindi nel seguente caso:

User-agent: Googlebot-Image
Disallow: /
User-agent: *
Disallow: /*.pdf$
Disallow: /admin/

stiamo dicendo che lo spider "Googlebot-Image" che indicizza le immagini non deve indicizzare nessuna pagina del sito, mentre tutti gli altri possono indicizzare tutti i contenuti ad esclusione dei file pdf e del contenuto della cartella "admin".
La presenza del simbolo "#" davanti ad un'istruzione indica che si tratta di un commento e quel contenuto non verrà valutato dai motori di ricerca.

Indicizzazione mancante per Penalizzazioni gravi del sito

Le penalizzazioni più gravi possono causare la cancellazione del sito dagli indici del motore di ricerca che ha inflitto la penalizzazione.
Per verificare tale condizione su Google è sufficiente utilizzare l'operatore "site" seguito dall'url da verificare

site:www.miosito.it/pagina-sito.php per verificare una singola pagina
site:www.miosito.it per ottenere l'elenco di tutte le pagine indicizzate per il sito segnalato.

Ovviamente una pagina appena pubblicata non sarà indicizzata e potrebbero essere necessarie da poche ore a diversi giorni prima che gli spider si accorgano della pagina e la indicizzino.
La presenza nell'indice ovviamente non esclude altre penalizzazioni.

Un altro motivo di mancata indicizzazione può essere dovuto al fatto che la pagina rappresenta un contenuto duplicato, ossia un contenuto già presente all'interno del sito o su altri siti.

Indicizzare il sito manualmente

Gli spider lavorano in continuazione e per quanto detto un collegamento su un portale, un social network o qualsiasi altro sito, garantirà l'indicizzazione del nostro sito.
Tanto che spesso il problema è opposto, ovvero vogliamo fare in modo che un sito non venga indicizzato completamente o in parte, perchè magari è un sito di test o c'è un'area riservata.
In questi casi come visto possiamo combinare l'uso del file robots.txt e del metatag noindex e nofollow.
Ma se non avessimo la certezza, la possibilità o la voglia di creare un collegamento esterno che non sia noindex e/o nofollow al nostro sito cosa potremmo fare?
Sostanzialmente 2 cose:
  • Creare una sitemap e segnalarla ai principali motori di ricerca in modo da favorire la prima indicizzazione e tutte quelle a venire ed è per questo che tale pratica è consigliata in ogni caso.
    La sitemap è un semplice file di testo che sostanzialmente contiene tutti i collegamenti interni del sito web
    Per segnalare la mappa del sito ai principali motori di ricerca regista il sito agli strumenti per web master di Google e di Bing/Yahoo e aggiungi la sitemap nell'apposita sezione.
  • Utilizza lo strumento per l'aggiunta di url di Google e di Bing/Yahoo
Non è necessario e produttivo perdere tempo ad indicizzare il sito su altri motori di ricerca minori che tanto prima o poi indicizzeranno i contenuti del sito, in quanto Bing/Yahoo e soprattutto Google coprono quasi il 100% delle ricerche web.
I cookie permettono di offrire un servizio migliore, utilizzando il sito accetti l'uso di cookie anche di terze parti.infook