How Search Engines Operate

I motori di ricerca hanno 4 funzioni - scansione (crawling) del web, costruzione dell'indice, calcolo della rilevanza e dell'ordine dei risultati delle ricerche e presentazione dei risultati delle ricerche.

Crawling and Indexing

Immagina il World Wide Web come una rete di fermate della metropolitana di una grande città.

Ogni fermata è un documento univoco (tipicamente una pagina web, ma anche un PDF, un JPG o altri tipi di file). I motori di ricerca hanno bisogno di un modo per "esplorare" l'intera città e trovare tutte le fermate, perciò usano il miglior percorso disponibile - i collegamenti (link).

  1. Crawling e Indicizzare

    Esplorare e indicizzare i miliardi di documenti, pagine, file, notizie video e altre media presenti sul world wide web.

  2. Fornire Risposte

    Fornire risposte alle richieste degli utenti, molto frequentemente attraverso liste di pagine rilevanti recuperando e ordinando le informazioni.

"La struttura dei link del web serve a collegare insieme tutte le pagine esistenti"

(O, almeno tutte quelle accessibili dai motori di ricerca). Attraverso i link i robot automatici dei motori di ricerca, detti "crawler" o "spider", possono raggiungere tutti i miliardi di documenti tra loro interconnessi.

Quando i motori trovano queste pagine passano quindi all'analisi del codice in esse contenuto e archiviano parti selezionate delle pagine in enormi hard drive, per poterle poi richiamare quando necessario in una ricerca. Per realizzare questa monumentale attività di archiviazione di miliardi di pagine da rendere accessibili in una frazione di secondo, le società che gestiscono i motori di ricerca hanno costruito enormi data center in varie città di tutto il mondo.

Questi mostruosi data center contengono migliaia di server che processano un'inimmaginabile quantità di informazioni. D'altra parte quando una persona effettua una ricerca attraverso un qualsiasi motore di ricerca si aspetta un risultato immediato e anche 3 o 4 secondi di ritardo possono lasciare insoddisfatti. Per questo i motori fanno di tutto per poter fornire i risultati nel più breve tempo possibile.

Large Hard Drive
Providing Answers

Quando una persona fa una ricerca online i motori devono setacciare i miliardi di pagine indicizzate e fare due cose - primo restituire solo quei risultati rilevanti o utili rispetto alla ricerca effettuata e secondo ordinare quei risultati in base ad un criterio di qualità (o di importanza). Il processo di ottimizzazione sui motori di ricerca ha proprio lo scopo di influenzare sia la "rilevanza" che "l'importanza" dei risultati presentati dai motori.

Per i motori di ricerca "rilevanza" significa molto di più che presentare semplicemente una pagina che contiene in modo particolarmente evidente le parole che hai utilizzato nel fare la ricerca. Agli albori di Internet i motori di ricerca non andavano molto al di là di questo semplice controllo, con conseguenze sulla qualità dei risultati presentatati. In questo modo, attraverso un'evoluzione iterativa, gli ingegneri al lavoro sui motori di ricerca hanno elaborato dei modi migliori per individuare i risultati di qualità apprezzabili dagli utenti. Oggi, centinaia di fattori influenzano la rilevanza dei risultati, molti dei quali saranno discussi nel corso della guida.

"L'importanza" dei risultati é un concetto ugualmente difficile da quantificare, ed i motori fanno il loro meglio per farlo.

Attualmente la maggior parte dei motori di ricerca identifica l'importanza di un sito con la sua "popolarità" - quanto più popolare è un sito, una pagina o un documento, tanto maggiore deve essere il valore dell'informazione presente in questi contenuti. Questo assunto si é dimostrato nella pratica piuttosto efficace visto che i motori hanno continuato a migliorare la soddisfazione degli utenti utilizzando metriche che interpretano la popolarità.

Popolarità e rilevanza non sono determinati manualmente (e grazie al Cielo perché quei trilioni di ore uomo richiederebbero di avere al lavoro tutta la popolazione della Terra). I motori utilizzano invece delle equazioni matematiche - detti algoritmi - per separare i buoni risultati dai cattivi e quindi ordinare quelli "buoni". Questi algoritmi sono spesso costituiti da centinaia di componenti. Nell'ambito del search marketing siamo soliti definire tali componenti come "ranking factor" (o fattori che determinano l'ordine dei risultati). Per chi é particolarmente interessato, SEOmoz ha preparato alcune informazioni specifiche su questo argomento - Search Engine Ranking Factors (in Inglese).

Keep Reading Search Engine Results

Puoi pensare che i motori di ricerca credano che lo stato dell'Ohio sia la pagina più rilevante e popolare per la ricerca "University", mentre il risultato Harvard sia meno rilevante/popolare.

Come faccio quindi ad avere successo con motori di ricerca ?

ovvero come gli esperti dei motori di ricerca studiano e imparano come riuscire sui Motori di ricerca

I complicati algoritmi dei motori di ricerca potrebbero sembrare a prima vista impenetrabili ed i motori stessi forniscono poche informazioni su come raggiungere migliori risultati e ottenere maggiore traffico. Le poche informazioni e pratiche sull'ottimizzazione fornite direttamente dai motori sono riportate di seguito:

How Do I Get Success
Yahoo!

Informazioni SEO tratte dalle linee guida per webmaster di Yahoo!

Molti fattori influenzano la possibilità di un sito di comparire e di posizionarsi nei risultati dei motori:

  • Il Numero di altri siti che linkano al sito
  • Il Contenuto delle pagine
  • Gli aggiornamenti apportati all'indice
  • Il test di nuove versioni del prodotto
  • La scoperta di nuovi siti
  • I cambiamenti all'algoritmo di ricerca - e altri fattori
Bing

Informazioni SEO tratte dalle linee guida per webmaster di Bing

Gli ingegneri di Bing alla Microsoft raccomandano quanto segue per migliorare il proprio posizionamento nei motori:

  • Nella parte di testo visibile in pagina, includere le parole che gli utenti potrebbero scegliere come termini di ricerca per trovare l'informazione sul tuo sito.
  • Limitare il peso della pagina ad una dimensione ragionevole. Raccomandiamo un argomento per pagina. Una pagina HTML senza foto dovrebbe pesare meno di 150KB.
  • Assicurati che ciascuna pagina sia accessibile da al meno un link testuale statico.
  • Non inserire il testo che vuoi venga indicizzato dentro le immagini. Per esempio se vuoi che il nome o l'indirizzo della tua azienda vengano indicizzate, assicurati che non compaiono dentro il logo dell'azienda.
Google

Informazioni SEO tratte dalle linee guida per webmaster di Google

I Googlers raccomandano quanto segue per svettare nei risultati:

  • Progetta le tue pagine per gli utenti, non per i motori di ricerca. Non ingannare i tuoi utenti o sottoporre ai motori di ricerca contenuti diversi da quelli che mostri agli utenti, pratica comunemente nota come "cloaking".
  • Crea un sito con una chiara gerarchia e link testuali. Ogni pagina dovrebbe essere raggiungibile da almeno un link statico.
  • Crea un sito utile e ricco di informazioni, con pagine che descrivano in modo chiaro e accurato i contenuti del sito.Assicurati che i tag <title> e gli attributi ALT siano descrittivi e precisi.
  • Mantieni un numero ragionevole di link per ogni data pagina (meno di 100).

 

Negli oltre 12 anni dalla nascita delle ricerche sul web, gli esperti di search marketing hanno trovato metodologie per scoprire come i motori ordinano i risultati delle ricerche e utilizzato questi dati per aiutare i loro siti ed i loro clienti a raggiungere un migliore posizionamento.

Inaspettatamente, i motori supportano molti di questi sforzi, sebbene la cosa sia poco visibile in pubblico. Le conferenze sul search marketing, come Search Marketing Expo, WebMasterWorld, Search Engine Strategies ed i SEOmoz's SEO Training Seminars, attirano ingegneri e rappresentanti provenienti da tutti i motori di ricerca. I rappresentanti dei motori offrono occasionalmente supporto agli stessi webmaster partecipando online su blog, forum e gruppi.

Tip of the Iceburg Image
Time for an Experiment

Non c'é probabilmente miglior strumento disponibile per i webmaster che cercano informazioni sui motori di ricerca che usare i motori stessi per fare esperimenti, testare delle teorie e formarsi delle opinioni. E' attraverso questo processo iterativo, talvolta certosino, che si é creata una considerevole quantità di conoscenze sul funzionamento dei motori di ricerca.

  1. Registra un nuovo sito con parole chiave senza senso (es. ishkabibbell.com)
  2. Crea diverse pagine sul sito, tutte relative ad uno stesso termine senza senso (es. yoogewgally)
  3. Testa l'uso di differenti posizioni di testo, formattazioni, uso di parole chiave, strutture di link etc. creando pagine il più uniformi possibili facendo variare una variabile alla volta
  4. Fai puntare il sito da link presenti in pagine ben indicizzate e visitate dai motori su altri domini.
  1. Registra le attività dei motori ed il posizionamento delle pagine
  2. Fai piccole variazioni su pagine identiche per determinare quali fattori possono spingere un risultato su o giù rispetto alle altre
  3. Tieni traccia di ogni risultato che sembra efficace e testa nuovamente su altri domini con altri termini - se molti test restituiscono coerentemente gli stessi risultati, ci sono buone probabilità che tu abbia individuato una regola utilizzata dai motori di ricerca.
 

 

In questo test abbiamo iniziato formulando l'ipotesi che un link posizionato in alto nel codice di una pagina pesi di più di un link posto in basso nel codice della pagina. Abbiamo effettuato il test creando un dominio senza senso con link a tre pagine, tutte contenenti una volta lo stesso termine privo di senso. Dopo che i motori hanno "visitato" le pagine, abbiamo scoperto che la pagina collegata al link posizionato più in alto in home si presentava al primo posto nei risultati e abbiamo continuato il nostro test in modo iterativo.

Questo tipo di processo non é di certo l'unico possibile per migliorare le conoscenze degli esperti di search marketing.

Un altro modo per scoprire come i motori funzionano e ordinano i risultati consiste nel fare un po' di intelligence sui brevetti depositati dai principali motori di ricerca all'Ufficio Brevetti negli Stati Uniti. Forse il più famoso di tutti é il sistema che ha originato Google nei dormitori di Stanford alla fine degli anni '90 - il PageRank - depositato come brevetto #6285999 – Method for node ranking in a linked database. Il documento originale sull'argomento – Anatomia di un motore di ricerca web ipertestuale su larga scala – è stato anche oggetto di diversi studi. Per quelli che non sono a proprio agio con la matematica niente paura. Sebbene queste equazioni siano interessanti dal punto di vista accademico, la loro completa comprensione sfugge anche a molti tra i search marketer più talentuosi e di maggior successo - la conoscenza del calcolo integrale non é un requisito necessario per esercitarsi nelle attività di posizionamento sui motori di ricerca.

Attraverso metodi come l'analisi dei brevetti, gli esperimenti, i test live e le attività di messa a punto, la community dei search marketer ha imparato a conoscere molte delle operazioni base effettuate dai motori ed i componenti critici per creare siti e pagine con migliori posizionamenti e maggiore traffico.

Il resto di questa guida é dedicato a spiegare queste pratiche in modo chiaro e conciso. Buon divertimento!

Step 1 Step 2
Torna all'inizio

This content was re-published with permission. SEOmoz is not affiliated with this site.
Traduzione autorizzata dalla SEOmoz Beginners's Guide, Capitolo 1 How Search Engine Operate