How People Interact with Search Engines

I motori di ricerca hanno dei limiti nel crawling del web, nella capacità di interpretare i contenuti da recuperare e da presentare nei risultati. In questa sezione della guida ci concentreremo sugli aspetti tecnici specifici di costruzione (e modifica) delle pagine web per renderle ottimamente strutturate agli occhi dei motori e degli utenti. Questa é un capitolo della guida che ti consigliamo di condividere con i tuoi programmatori, architetti dell' informazione e designer, in modo che tutti gli attori coinvolti nella costruzione di un sito possano pianificare e sviluppare un sito gradito ai motori di ricerca.

Contenuto indicizzabile

Per essere elencati nei risultati dei motori di ricerca, i tuoi contenuti - il materiale disponibile ai visitatori del tuo sito - deve essere in formato testuale HTML. Immagini, file Flash, Applet Java e altri contenuti non testuali sono virtualmente invisibili ai crawler dei motori di ricerca, nonostante i progressi nella tecnologia di crawling. Il modo più semplice per assicurarsi che parole e frasi presentate ai tuoi utenti siano anche visibili ai motori di ricerca consiste nell'inserirle nel testo HTML della pagina. Sono tuttavia disponibili metodi più avanzati per coloro che hanno bisogno di una formattazione più accattivante o stili di presentazione visuali:

  1. Alle immagini in formato gif,jpg, o png possono essere assegnati in HTML degli "attributi alt", che forniscono ai motori di ricerca una descrizione testuale del contenuto visivo.
  2. Le immagini possono anche essere mostrate ai visitatori come sostituti del testo usando i fogli di stile CSS.
  1. I contenuti inseriti in Flash o plug-in Java possono essere ripetuti in formato testuale nella pagina.
  2. I contenuti audio & video dovrebbero essere accompagnati da una trascrizione testuale se si vuole che vengano indicizzati dai motori.
 

Facciamo ora qualche doppio controllo

La maggior parte dei siti non han particolari problemi di indicizzazione dei contenti, ma controllare due volte non guasta. Utilizzando strumenti come Google's cache, SEO_browser.com SEO-browser.com, la mozBar or Yellowpipe puoi verificare quali elementi dei tuoi contenuti sono visibili e indicizzabili dai motori di ricerca.

Juggling Panda Image I think I have a problem with getting found.  I built this huge flash site for juggling pandas and I’m showing up nowhere on Google. What’s up?
Juggling Pandas Comparison

Però ! E' cosi come ci vede il motore ?

Utilizzando la funzionalità di Google Cache, possiamo vedere che agli occhi di un motore di ricerca, la home page di JugglingPandas.com é semplicemente un link ad un'altra pagina. Questo é molto problematico perché rende difficile al motore interpretare la rilevanza della pagina.

I'm totally going to check out my Axe Battling Monkeys blog! Axe Battling Monkeys

Ci sono un sacco di scimmie, e il motore vede solo un titolo ?

Hey, cosa é successo ?

Uh oh...attraverso Google Cache, possiamo vedere che la pagina é desolatamente vuota. Non c'é neppure un po' di testo che dica che la pagina contiene Axe Battling Monkeys. Il sito é interamente costruito in Flash, ma ahimé questo significa che i motori non possono indicizzare nessun testo in esso contenuto e neppure i link ai singoli giochi.

Se sei curioso di sapere esattamente quali parole e frasi i motori possono vedere su una pagina web, abbiamo un tool sfizioso chiamato "Term Extractor" che elenca parole e frasi ordinate per frequenza. È saggio comunque non solo controllare il contenuto testuale ma anche utilizzare un tool come SEO Browser per fare un doppio controllo che le pagine siano visibili ai motori di ricerca. E' molto difficile essere presenti nei risultati se non appari neppure nei database di parole chiave dei motori di ricerca.

Struttura di link esplorabile dal crawler

I motori di ricerca hanno bisogno di vedere i contenuti per poter inserire le pagine nei loro enormi indici basati su parole chiave. Hanno anche bisogno di accedere ad una struttura di link "esplorabile" - una struttura che permetta agli spider di muoversi attraverso i percorsi del sito. - al fine di trovare tutte le pagine di un sito. Centinaia di migliaia di siti commettono il grave errore di nascondere o rendere difficoltosa la navigazione del sito per i motori, influenzando in questo modo l'opportunità di vedere le proprie pagine indicizzate dai motori di ricerca. Di seguito vi illusriamo come pué verificarsi il problema:

Index Diagram

Nell'esempio sopra lo spider di Google ha raggiunto la pagina "A" e vede i link alle pagine "B" ed "E". Tuttavia, anche se C & D possono essere pagine importanti del sito, lo spider non ha modo di raggiungerle (o anche solo di sapere che esistono) perché nessun link diretto e raggiungibile punta a quelle pagine. Agli occhi di Google, queste pagine potrebbero anche non esistere del tutto - ottimi contenuti, buon keyword targeting e ottimo marketing non servono a nulla se le pagine non sono in primo luogo raggiungibili dai motori.

Shephard
Link Anatomy
Let’s look at some common reasons why pages may not be reachable.

Link in moduli che richiedono compilazione ed invio.

I moduli online possono includere dei semplici menù a cascata o possono essere particolarmente articolati come questionari complessi. In ognuno dei due casi i motori di ricerca non possono completare i moduli ed in questo modo qualsiasi contenuto o link accessibile solo a valle della compilazione di un modulo risulta invisibile ai motori.

Link in Javascript non analizzabile

Se usi i Javascript per i link, potresti scoprire o che i motori non riescono a leggere questi link o che danno loro poco peso. I link standard HTML dovrebbero sostituire il Javascript (o accompagnarlo) su qualsiasi pagina che vuoi che venga letta dai motori.

Link che puntano a pagine bloccate dai tag meta robot o dal file robots.txt

I Tag Meta Robot ed il file Robots.txt (descritti qui) possono entrambi permettere al proprietario di un sito di restringere l'accesso ad una pagina. Fai attenzione al fatto che molti webmaster hanno utilizzato involontariamente questi strumenti nel tentativo di bloccare l'accesso a bot maligni, per poi scoprire che anche i motori di ricerca avevano smesso di visitarli.

Link in frame o I-frame

Tecnicamente sia i link in frame che I-frame sono letti dai motori, ma entrambi presentano problemi strutturali per i motori in termini di organizzazione e possibilità di essere seguiti. A meno che tu non sia un utente esperto con le conoscenze giuste per capire come i motori di ricerca indicizzano e seguono i link nei frame, é meglio starne alla larga.

Link accessibili solo attraverso ricerche

Sebbene questo punto sia strettamente legato al precedente sui moduli online, é un problema cosi diffuso che vale la pena parlarne. Gli spider non proveranno a fare ricerche per trovare i contenuti e proprio per questo si stima che milioni di pagine siano nascoste dietro muri inaccessibili, destinate all'anonimato fino a che una pagina accessibile dai motori non avrà un link a queste ultime.

Link in flash, java o in altri plug-in

I link all'interno del sito esempio sui Panda giocolieri (di cui abbiamo parlato sopra), sono una perfetta illustrazione di questo problema. Sebbene dozzine di Panda siano elencati e linkati dalla home page del sito, nessuno spider può raggiungerli attraverso l'architettura del sito, rendendoli di fatto invisibili ai motori (e quindi non recuperabili come risultati dai motori in caso di ricerche).

Link su pagine con diverse centinaia o migliaia di link

I motori tendono a leggere solo circa 100 link per ogni pagina. Questo limite é necessario per ridurre lo spam e preservare la qualità dei posizionamenti.

 
If you avoid these pitfalls, you’ll have clean, spiderable HTML links that will allow the spiders easy access to your content pages.
rel nofollow

Rel=”nofollow” può essere utilizzato con la seguente sintassi:

<a href=http://www.seomoz.org rel="nofollow">Lousy Punks!</a>

I link possono avere molti attributi, ma i motori li ignorano quai tutti, con l'importante eccezione del tag rel="nofollow". Nell'esempio sopra, aggiungendo l'attributo rel=nofollow al link, abbiamo detto ai motori di ricerca che noi, i proprietari del sito, non vogliamo che questo link sia interpretato come un normale "voto editoriale". Il Nofollow é stato introdotto come metodo per aiutare a bloccare i commenti automatici nei blog, nei guestbook e in generale per combattere lo spam generato dall'inserimento di link (a questa pagina potete trovare piu informazioni sul suo lancio), ma si é modificato nel tempo in un modo per dire ai motori di ricerca di "scontare" qualsiasi valore il link avrebbe normalmente trasferito. Puoi leggere di più su questo tema e sul PageRank sculpting in questo post.

Google

I link in nofollow non hanno alcun peso o impatto e sono interpretati come semplice testo HTML (come se il link non esistesse). I rappresentanti di Google hanno detto che non considereranno mai questi link nel loro grafo di link del web.

Yahoo! & Bing

Entrambi questi motori sostengono che i link in nofollow non impattano i risultati delle ricerche o il posizionamento, ma potrebbero essere utilizzati dai loro crawler come un modo per individuare nuove pagine. Che equivale a dire che mentre "potrebbero" seguire i link, non li considereranno come metodo per influenzare positivamente il posizionamento dei risultati delle ricerche.

Ask.com

Ask é l'unico motore a pensarla diversamente, sostenendo che i link in nofollow non vengono trattati diversamente dagli altri link. Secondo la posizione ufficiale di Ask i loro algoritmi (basati su un concetto di popolarità locale anziché globale) sono già immuni dalla maggior parte dei problemi che il nofollow é nato per risolvere.

NoFollow Graph


Utilizzo e Targeting delle parole chiave [Keyword Usage & Targeting]

Le parole chiave sono fondamentali nel processo di ricerca - sono le fondamenta della lingua e della ricerca. In effetti, l'intera scienza relativa al recupero delle informazioni (inclusi i motori di ricerca web-based come Google) si basa sulle parole chiave. Poiché i motori leggono e indicizzano i contenuti delle pagine nel web, tengono traccia di quelle pagine in indici basati su parole chiave. In questo modo, invece di archiviare 25 miliardi di pagine web in un database (che diventerebbe piuttosto grande), i motori hanno milioni e milioni di database più piccoli, ognuno focalizzato su una particolare parola chiave o frase. Ciò aiuta i motori a rendere molto più veloce il recupero dei dati di cui hanno bisogno in una frazione di secondo.

Ovviamente, se vuoi avere delle possibilità che la tua pagina compaia tra i risultati di ricerca se uno cerca "cane", é estremamente importante assicurarsi che la parola "cane" faccia parte del contenuto indicizzabile della tua pagina.

Steps Diagram
Keyword Map

Il dominio delle parole chiave

Le parole chiave dominano anche le nostre intenzioni di ricerca e l'interazione con i motori. Per esempio, un modello di ricerca comune potrebbe funzionare più o meno cosi.

Quando la ricerca viene effettuata, il motore sa quali pagine recuperare in base alle parole inserite nel box di ricerca. Altri dati come l'ordine delle parole, l'ortografia, i segni di punteggiatura, l'uso di lettere maiuscole forniscono ulteriori informazioni che i motori possono utilizzare per cercare le pagine giuste e ordinarle propriamente.

Per ovvie ragioni i motori di ricerca misurano i modi in cui le parole chiave sono utilizzate nelle pagine per determinare la rilevanza di un particolare documento rispetto alla ricerca effettuata. Uno dei modi migliori per "ottimizzare" il posizionamento di una pagina consiste perciò nell'assicurarsi che le parole chiave siano ben in vista nei titoli, nel testo e nei meta dati.

La mappa grafica a sinistra mostra la rilevanza del termine generico "libri" rispetto ad uno specifico titolo "Tale of Two Cities". Notate che mentre ci sono molti risultati (dimensione del Paese) per il termine generico "libri", ci sono molti meno risultati e quindi competizione per un risultato più specifico.

Il mito della densità di parole chiave

Ogni volta che si parla insieme di utilizzo delle parole chiave e di motori di ricerca, nasce spontanea la tendenza ad utilizzare la frase "densità di parole chiave". Questo é abbastanza mortificante. La densità di parole chiave, senza ombra di dubbio, NON costituisce un componente dei moderni algoritmi dei motori di ricerca per il semplice fatto che fornisce risultati peggiori di molti e più avanzati metodi di analisi delle parole chiave. Piuttosto che soffermarsi oltre su questo mito in questa guida, vi rimandiamo semplicemente al lavoro svolto su questo tema dal Dr. Edel Garcia - The Keyword Density of Non-Sense.

La nozione dell'importanza della densità di parole chiave é nata prima dei motori di ricerca commerciali e di Internet e può essere difficilmente considerato un concetto applicabile al recupero delle informazioni. Quel che é peggio é che la densità di parole chiave non svolge alcun ruolo nel processo utilizzato dai motori di ricerca per analizzare i testi, indicizzare i documenti o assegnare un peso ai termini.

L'esperienza del Dr. Garcia nella teoria del recupero delle informazioni e le sue prove matematiche dovrebbero mettere in ridicolo qualsiasi argomentazione a sostegno dell'uso della densità di parole chiave come strumento per ottimizzare il posizionamento sui motori di ricerca. Tuttavia lo stesso documento illustra la sfortunata verità sull'ottimizzazione delle parole chiave - senza l'accesso ad un indice globale delle pagine web (per calcolare il peso dei termini) ed un insieme rappresentativo dei documenti raccolti su Internet (per supportare la costruzione di una biblioteca semantica), abbiamo poche possibilità di creare formule che sarebbero utili per una vera ottimizzazione.

Ottimizzazione On-site

Ciò detto, anche se l'utilizzo di parole chiave ed il targeting influiscono solo in piccola parte sugli algoritmi di posizionamento dei motori di ricerca,é possibile comunque adottare efficacemente alcune pratiche di utilizzo delle parole chiave per migliorare l'ottimizzazione delle pagine. Qui a SEOmoz conduciamo molti test e vediamo cambiare un enorme numero di risultati di ricerche ed il loro posizionamento in base all'applicazione di tecniche di utilizzo di parole chiave. Lavorando con i vostri siti vi suggeriamo questo processo:

  • Usa la parola chiave nel tag title almeno una volta e possibilmente due volte (o come variazione) se ha senso e suona bene (questo é soggettivo ma necessario). Cerca di mantenere la parola chiave più vicino possibile all'inizio del tag title. Ulteriori dettagli sui tag title sono illustrati successivamente nel capitolo.
  • Inserisci la parola chiave una volta nel tag header H1 della pagina.
  • Almeno 3 volte nel corpo della pagina (all'occorrenza anche qualche volta in più se c'è molto contenuto testuale. Potresti anche trovare un ulteriore beneficio nell'aggiungere la parola chiave più di 3 volte, ma nella nostra esperienza, aggiungere altre volte la parola o la frase tende ad avere un impatto minimo o nullo sul posizionamento.
  • Almeno una volta in grassetto. Puoi usare sia il tag <strong> sia il tag <b>, visto che i motori li considerano equivalenti.
  • Almeno una volta nell'attributo alt di un'immagine nella pagina. Questo non solo aiuta con la ricerca web, ma anche con la ricerca per immagini che può occasionalmente portare del traffico di valore.
  • Una volta nella URL. Ulteriori regole per le URL e le parole chiave sono discusse in seguito in questa sezione.
  • Almeno una volta (e qualche volta 2 quando ha senso) nel tag meta description. Da notare che il tag meta description non é utilizzato dai motori per il posizionamento, ma piuttosto aiuta ad attrarre click dalla pagina dei risultati di ricerca (visto che é il riassunto di testo utilizzato dai motori di ricerca nella presentazione dei risultati).
  • Generalmente non nell'anchor text di un link sulla stessa pagina che punta ad altre pagine sul tuo sito o a diversi domini (questo é un po' complesso - vedi questo post sul blog per dettagli .

Un esempio del mito sulla densità delle parole chiave

Se due documenti D1 e D2 contengono 1000 parole (l=1000) con un termine ripetuto 20 volte (tf=20), allora un analizzatore di densità di parole chiave ti dirà che enrambi i documenti hanno una Densità di Parole Chiave (DPC) DPC = 20/1000 = 0,020 (o 2%) per quel termine. Valori identici si ottengono quanto tf=10 e l=500. Evidentemente un analizzatore di densità di parole chiave non può definire quale dei documenti è più rilevante. Un'analisi di densità o un tasso di densità di parole chiave non ci dice nulla circa:

  1. La distanza relativa tra le parole chiave in un documento
  2. Dove il termine ricorre nel documento (distribuzione)
  3. La frequenza di co-citazione tra i termini (co-occorrenza)
  4. Il principale tema, argomento e sotto-argomenti dei documenti.

La conclusione:

La densità delle parole chiave é indipendente dal contenuto, dalla qualità dalla semantica e dalla rilevanza.

 

Running Shoes
TV Football

Il tag title di qualsiasi pagina appare in cima al browser Internet, ma sembra che gli utenti prestino poca attenzione a questa parte dello schermo, rendendola meno importante delle tre di seguito illustrate.

Yahoo Football

Utilizzare le parole chiave nel tag title fa in modo che i motori di ricerca evidenzino in grassetto quei termini nei risultati quando un utente ha effettuato una ricerca utilizzando quelle parole.

Digg Football

L'ultimo importante motivo per creare tag title descrittivi e pieni di parole chiave è legato al posizionamento nei risultati delle ricerche. Lo screenshot qui sopra si riferisce ad un'indagine SEOmoz effettuata su 37 professionisti e influenzatori del mondo SEO sui fattori rilevanti che influenzano il posizionamento. In questa ricerca 35 dei 37 partecipanti hanno confermato che l'utilizzo delle parole chiave nei tag title è il posto più importante dove utilizzare le medesime per migliorare il proprio posizionamento sui motori.

I tag title

L'elemento tag title di una pagina dovrebbe essere una descrizione concisa e puntuale del contenuto della pagina. Crea valore in tre specifiche aree (descritte a sinistra) ed é critica sia per l'esperienza utente sia per l'ottimizzazione sui motori.

Poiché i tag title sono una parte cosi importante dell'ottimizzazione sui motori di ricerca, seguire le migliori prassi per la creazione dei tag title consente di cogliere facilmente lato SEO delle enormi opportunità. I suggerimenti seguenti coprono le parti critiche per l'ottimizzazione dei tag tigle a fini SEO e di usabilità utente:

Attenzione alla lunghezza

Il numero massimo di caratteri visualizzabile nei risultati delle ricerche per i tag title é 70 (oltre questo numero i motori visualizzeranno un'ellissi - "..." per indicare che un title é stato tagliato), attenersi a questo limite é cosa saggia. Tuttavia, se vuoi indirizzare molte parole chiave (o una frase particolarmente lunga), averle nel title é essenziale per il posizionamento, può essere consigliato utilizzare più caratteri.

Metti le parole chiave importanti all'inizio

Tanto più vicino all'inizio del tag title metti le parole chiave , tanto più facile sarà posizionarsi nei motori e avere più probabilità che gli utenti clicchino sul tuo link nei risultati di ricerca (almeno secondo i test e l'esperienza di SEOmoz).

Fai leva sul brandingg

A noi di SEOmoz piace inserire all'inizio di ogni tag title il brand (es. il nome del sito), poiché questo aiuta ad aumentare la conoscenza del marchio e a migliorare il click-through per le persone che conoscono e amano il brand. Molte agenzie SEO consigliano invece di utilizzare il nome del brand alla fine del tag title e ci sono volte in cui questo approcio è effettivamente piu efficace - pensa a cosa è importante per il tuo sito (ed i clienti del tuo sito) e a quanto è forte il tuo brand.

Pensa alla leggibilitè e all'impatto emotivo

Creare un tag title convincente aiuta ad attrarre più visite dai risultati di ricerca e può aiutare i visitatore a spendere del tempo sul tuo sito. Cosi è importante non solo pensare all'ottimizzazione e all'uso delle parole chiave, ma a tutta l'esperienza utente. Il tag tigle è il primo elemento con cui il visitatore interagisce con il tuo marchio e dovrebbe trasmettere il più possibile un'impressione positiva.

Best Practices for Title Tags

I Meta tag

In origine i meta tag erano stati pensati per fornire una proxy informativa sul contenuto del sito. Ognuno dei meta tag di base é elencato di seguito con una descrizione sul loro uso.

Meta Robots

I tag Meta Robots possono essere utilizzati per controllare l'attività dello spider dei motori di ricerca (almeno per la maggior parte dei motori) a livello di pagina. Ci sono diversi modi per utilizzare i meta robots per controllare come i motori trattano una pagina:

  • Index/NoIndex dice ai motori se la pagina deve essere letta e archiviata nell'indice. Se usi l'opzione "noindex" la pagina sarà esclusa dall'indice dei motori. Normalmente i motori assumono che tutte le pagine siano indicizzabili, quindi usare il valore "index" di norma non serve.
  • Follow/NoFollow dice ai motori se i link all'interno della pagina devono essere letti. Se scegli di usare "nofollow", i motori non considereranno i link sulla pagina né per esplorare il sito né per il calcolo del posizionamento. Di regola si assume che tutte le pagine abbiano l'attributo "follow"
  • Noarchive é usato per impedire ai motori di ricerca di salvare una copia cache della pagina. Di regola i motori conservano copie visibili di tutte le pagine che indicizzano che risultano accessibili attraverso i link "copia cache" nei risultati di ricerca.
  • Nosnippet dice ai motori di astenersi dal presentare un blocco di testo descrittivo vicino al titolo della pagina e all'URL nei risultati di ricerca.
  • NoODP é un tag specifico che dice ai motori di non recuperare una sintesi descrittiva della pagina dall'Open Directory Project (DMOZ) nella visualizzazione della pagina nei risultati delle ricerche.
  • NoYDir, come NoODP, é specifico per Yahoo!, e dice al motore di non usare nei risultati delle ricerche la descrizione della pagina/sito disponibile sulla Yahoo! Directory.

Meta Description

Il tag meta description fornisce una breve descrizione del contenuto della pagina. I motori di ricerca non usano le parole chiave o le frasi presenti in questo tag per definire il posizionamento dei risultati. Le meta description sono però la principale fonte utilizzata dai motori per generare la sintesi testuale riportata sotto ciascun risultato.

Il tag meta description ha la funzione del "copy" di una pubblicità, attira i lettori verso il tuo sito dai risultati di ricerca ed é una componente estremamente importante del search marketing. Scrivere una descrizione leggibile e convincente usando le più importanti parole chiave (considera che Google evidenzia in neretto le parole chiave cercate nella descrizione) può aumentare in modo significativo il tasso di click through sui risultati verso le tue pagine.

Le Meta description possono avere qualsiasi lunghezza, ma i motori normalmente estraggono una sintesi non più lunga di 160 caratteri (come nell'esempio del Balboa Park qui a destra), cosi è generalmente raccomandabile attenersi ai giusti limiti.

Altri meta tag poco importanti

Meta Keywords

I tag meta keywords una volta avevano importanza, ma non hanno più valore ai fini dell'ottimizzazione sui motori. Per saperne di più sulla storia di questo metag e sul perché sia caduto in disuso, leggete Meta Keywords Tag 101 su SearchEngineLand.

Meta refresh, meta revisit-after, meta content type, ecc.

Sebbene questi tag possano essere utilizzati con finalità SEO, sono meno critici nel processo, perciò vi rimandiamo a John Mueller di Google Webmaster Central per maggiori dettagli - Meta Tags & Web Search.

Meta Description

Struttura delle URL

Le URL, gli indirizzi web di un documento particolare, sono di enorme valore dal punto di vista della ricerca. Appaiono in molti punti critici.

Google URL

Nell'immagine sopra il testo verde mostra l'URL della pagina degli awards 2.0 di SEOmoz. Poiché i motori di ricerca mostrano le URL nei risultati, esse possono impattare il click-through e la visibilità. Le URL sono anche utilizzate per il posizionamento e quelle pagine nelle cui URL sono inclusi i termini cercati ricevono un beneficio da un'appropriata (e descrittiva) inclusione delle parole chiave.

Browser URL

Le URL appaiono nella barra di navigazione del browser e anche se questo normalmente ha scarso impatto sui motori di ricerca, dedicare scarsa attenzione alla progettazione e strutturazione delle URL può influire negativamente sull'esperienza utente.

Blog URL

L'URL qui sopra é usata come anchor text del link che punta alla pagina di SEOmoz precedentemente citata (la pagina degli awards 2.0 di SEOmoz).

Linee guida per la costruzione di URL

Usa l'empatia

Mettiti nei panni di un utente e guarda la tua URL. Se puoi prevedere in modo facile e preciso il contenuto che ti aspetti di trovare sulla pagina, allora le tue URL sono scritte bene. Non serve spiegare ogni singolo dettaglio di una URL, ma averne un'idea di massima è un buon punto di partenza.

Breve è meglio

Se è importante avere una URL descrittiva, minimizzarne la lunghezza e ridurre l'uso delle trailing slash ("/") renderà più semplice copiare e incollare l'URL (nelle email, nei post del blog, nei messaggi dei testo, etc.) e sarà completamente visibile nei risultati di ricerca (non troncata).

L'uso delle parole chiave è importante (ma l'abuso è pericoloso)

Se la tua pagina indirizza uno specifico termine o frase, assicurati di includerlo nell'URL. Tuttavia non esagerare nell'inserire parole chiave nelle URL ai fini SEO - l'abuso genererà delle URL meno usabili e può attivare filtri anti spam (da parte dei client email, dei motori di ricerca e anche della gente !).

Scegli URL statiche

Con tecnologie come il mod_rewrite per Apache e ISAPI_rewrite per Microsoft, non ci sono più scuse per non creare URL semplici e statiche. Anche singoli parametri dinamici in una URL possono influire negativamente su indicizzazione e posizionamento sui motori (noi stessi di SEOmoz siamo passati da URL dinamiche - cioé www.seomoz.org/blog?id=123, a URL statiche - cioé www.seomoz.org/blog/11-best_practices-for-urls nel 2007 e abbiamo visto un incremento di traffico del 15% nelle successive 6 settimane).

Scegli di essere descrittivo quando possibile

Invece di scegliere numeri o cifre prive di significato per classificare le informazioni, usa parole vere. Per esempio una URL come www.thestore.com/hardware/screwdrivers è di gran lunga più usabile e di valore rispetto a www.thestore.com/cat33/item4326.

Usa il trattino per separare le parole

Non tutti i motori di ricerca interpretano correttamente segni di separazione come il trattino basso "_", il simbolo dell'addizione "+" o lo spazio "%20", quindi meglio usare il trattino "-" per separare le parole in una url, come nell'esempio sopra delle 11 Best Practices per URL.

URL.com

Contenuti Canonici e versioni duplicate

Meta Description

La canonicalizzazione può essere un concetto difficile da capire (e difficile da pronunciare), ma è fondamentale per creare e ottimizzare i siti. I problemi fondamentali nascono dal fatto che le stesse porzioni di testo possono essere utilizzate più volte nel sito - un paragrafo o più spesso un'intera pagina di contenuto potrebbero apparire in più posti all'interno di un sito, o anche su più siti. Per i motori di ricerca questo pone un enigma: quale versione del contenuto dovrebbero mostrare agli utenti che hanno effettuato una ricerca ? Nei circoli SEO, questa problematica viene spesso definita come "contenuti duplicati", meglio descritta di seguito.

Duplicate Gems

I motori fanno gli schizzinosi quando si tratta di versioni duplicate di un singolo pezzo di materiale. Per fornire la migliore esperienza d'uso ai propri utenti i motori mostrano raramente pezzi di contenuto duplicati e per questo sono obbligati a scegliere quale versione è quella che ha più possibilità di essere quella originale (o migliore).

La prassi della canonicalizzazione prevede l'organizzazione del contenuto in modo tale che ogni singolo pezzo abbia una ed una sola URL. Seguendo questo processo puoi assicurarti che i motori troveranno una singola versione del tuo contenuto e le assegneranno il più alto posizionamento raggiungibile in base all' autorevolezza e trust del tuo dominio, alla rilevanza e ad altri fattori. Se lasci più versioni del tuo contenuto su un sito (o su più siti), potresti finire in una situazione come quella rappresentata a destra.

Discount Gems
Single Gem

Se, invece, il proprietario del sito prendesse quelle 3 pagine e facesse un redirect con un comando 301 ad una singola pagina, i motori di ricerca avrebbero un'unica e rafforzata pagina da mostrare nei risultati per quel sito.

When multiple pages with the potential to rank well are combined into a single page, they not only no longer compete with one another, but create a stronger relevancy and popularity sigan overall. This will positively impact their ability to rank well in the search engines.

Vuoi comunque un'altra opzione?

Una diversa opzione, nota come "Tag URL Canonico", offre un'altra possibilità per ridurre i contenuti duplicati su un singolo sito e per canonicalizzare verso una singula URL (si può anche usare da una URL su un dominio ad una diversa URL su un altro dominio).

Il tag fa parte dell'header HTML della pagina web, la stessa sezione descritta nell' elemento Title e nel tag Meta Description. In questo caso si usa semplicemente un nuovo parametro "rel".

The Inner Workings
<link rel=”canonical” href=”http://www.seomoz.org/blog”/> Questo dice a Yahoo!, Bing e Google che la pagina in questione dovrebbe essere trattata come se fosse una copia della URL www.seomoz.org/blog e che tutte le metriche applicate dai motori ai link e al contenuto di quella pagina dovrebbero tecnicamente fluire verso quella URL.

Il tag URL Canonico è un attributo simile per molti versi al redirect 301 da un punto di vista SEO. In sintesi stai dicendo ai motori che molte pagine dovrebbero essere considerate come una sola (cosa che fa il 301), senza di fatto ridirigere i visitatori verso una nuova URL (spesso evitando al tuo team di sviluppo forti angosce).

Come lo applichiamo

SEOmoz ha lavorato su diversi casi dove erano presenti per ogni pagina di contenuto due versioni una in formato web standard, una in versione per la stampa. In un caso il proprietario del sito aveva link ad entrambe le versioni e molti link esterni puntavano ad entrambe (si tratta di un fenomeno diffuso dal momento che blogger e persone attive sui social media preferiscono inserire link a versioni delle pagine per la stampa per evitare la pubblicità). Abbiamo lavorato per ridirigere con un 301 tutte le pagine in formato per la stampa alle pagine originali e creato un'opzione CSS per mostrare la pagina per la stampa come opzione sulla URL originale. Questo ha prodotto un incremento del traffico del 20% in 60 giorni. Non male per un progetto che ha richiesto solo un'ora di lavoro per identificare il problema e poche regole da implementare sul file htaccess.

Easy as Pie

Difendere l'onore dei tuoi siti

Sfortunatamente il web é pieno di centinaia di migliaia (se non milioni) di siti senza scrupoli i cui modelli di business e traffico si basano sul razziare il contenuto di altri siti e riutilizzarli (qualche volta modificandoli) sul proprio. Questa pratica basata sulla raccolta di contenuti e sulla loro ripubblicazione é chiamata "scraping" e gli "scrapers" fanno degli ottimi guadagni superando nel ranking i siti con i loro stessi contenuti e mostrando pubblicità (ironicamente attraverso lo stesso programma Google Adsense).

Quando pubblichi contenuti con qualsiasi tipo di formato feed - RSS/XML/etc - assicurati di segnalarlo ai principali servizi di tracciamento dei blog (come Google, Technorati, Yahoo!, etc.). Puoi trovare le istruzioni su come segnalare i tuoi contenuti appena pubblicati a servizi come Google e Technorati direttamente dai rispettivi siti o attraverso un servizio come Pingomatic per automatizzare il processo. Se il tuo software per la pubblicazione dei contenuti é custom, é buona cosa che gli sviluppatori includano una funzionalità automatica di segnalazione dei contenuti a valle della loro pubblicazione.

Puoi usare la pigrizia degli scrapers contro di loro. La maggior parte degli scrapers sul web ripubblica il contenuto senza modificarlo e cosi, includendo i link verso il tuo sito nel post che hai scritto, puoi garantirti che i motori di ricerca vedano la maggior parte dei contenuti copiati con link verso il tuo contenuto (segno che la tua fonte é probabilmente quella originale). Per fare questo devi usare link assoluti, non relativi, nella tua struttura di link interni. Cosi invece di inserire un link verso la tua home page utilizzando:

<a href="../>Home</a> dovresti invece utilizzare: <a href="http://www.seomoz.org">Home</a>

In questo modo se uno scraper prende e copia un contenuto, il link continua a puntare al tuo sito.

Ci sono altri modi più raffinati per proteggersi dallo scraping e per gli utenti di Wordpress Joost de Valk ha un plugin utile, ma nessuno di questi é facilissimo da applicare. Devi aspettarti che quanto più famoso e visibile diventa il tuo sito, tanto più spesso troverai i tuoi contenuti copiati e pubblicati altrove. Molte volte puoi ignorare questo problema, ma se diventa serio e vedi gli scraper portarti via il posizionamento ed il traffico, puoi valutare di avviare una procedura legale chiamata rimozione DMCA. Fortunatamente il legale interno di SEOmoz - Sarah Bird, ha scritto un ottimo pezzo per aiutare a risolvere questo problema – Four Ways to Enforce Your Copyright: What to Do When Your Online Content is Being Stolen.

Elephant and Mouse
Torna all'inizio

This content was re-published with permission. SEOmoz is not affiliated with this site.
Traduzione autorizzata dalla SEOmoz Beginners's Guide, Capitolo 4 Basics of Search Engine friendly design and development