23
dic/06

Google sui contenuti duplicati

Grazie alla segnalazione di Deborah e all’aiuto di Gino, pubblico la traduzione di questo importante documento.
Lo reputo importante in quanto consiste nella risposta da parte di Google alla varie domande sorte attorno ad un argomento di cui si parla molto in questo periodo, soprattutto dopo il boom dei feed rss e del loro utilizzo: Google definisce il contenuto duplicato.

Al recente SES tenutosi a Chicago, molti utenti hanno fatto domande circa i contenuti duplicati. Abbiamo realizzato che ci sono parecchie sfumature e un po’ di confusione a riguardo, così abbiamo deciso di aiutare a rafforzare il concetto.

Cos’è un contenuto duplicato?
Il contenuto duplicato si riferisce generalmente a blocchi sostanziali di contenuto all’interno dello stesso dominio o tra diversi domini che combaciano esattamente con altri contenuti o sono molto simili tra loro.
La maggiorparte delle volte è del tutto non intenzionale o per lo meno non fatto con malizia: forum che generano pagine normali o pagine dinamiche prese da altri siti, negozi che mostrano (e, peggio ancora, linkano) diversi URL, e così via.
In qualche caso i contenuti duplicati sono creati nell’intento di manipolare il posizionamento sui motori di ricerca o guadagnare più traffico per chiavi più o meno popolari.

Cosa non è un contenuto duplicato?
I nostri algoritmi non vedono come contenuto duplicato lo stesso articolo scritto in Inglese e Spagnolo. Similarmente, non dovreste preoccuparvi che snippets occasionali (virgolette e altro) vengano evidenziati come contenuto duplicato.

Perchè Google si preoccupa dei contenuti duplicati?
I nostri utenti, tipicamente, voglio vedere diverse sezioni dello stesso unico contenuto quando eseguono le ricerche. Al contrario, sono annoiati quando vedono lo stesso sostanziale contenuto in più risultati di ricerca.
Anche i webmaster diventano tristi quando mostriamo url complessi piuttosto che semplici url.

Cosa fa Google con il contenuto duplicato?
Durante i nostri crawling e quando serve nei risultati di ricerca, proviamo a indicizzare e mostrare pagine con diversi contenuti. Questo filtraggio significa che se il vostro sito contiene articoli in versione “regolare” e “da stampare” e non c’è nessun limite nel robots.txt o attraverso il meta tag noindex, scegliamo solo una delle due versioni da mostrare. Nei rari casi in cui percepiamo che il contenuto duplicato vuole essere mostrato per manipolare il ranking e deviare i nostri utenti, facciamo il giusto accorgimento all’indicizzazione e al posizionamento dell’intero sito coinvolto. Tuttavia, preferiamo focalizzarci sui filtri piuttosto che sull’accorgimento del ranking…così, nella maggiorparte dei casi, la peggior cosa che può accadere è che venga mostrata, tra le due versioni, quella “meno desiderata” dai webmaster.

Come possono comportarsi, i webmaster, con i contenuti duplicati?
1. Invece di lasciare che siano i nostri algoritmi a determinare quale sia la miglior versione di un documento, potreste aiutarci indicandoci la versione da voi preferita. Per esempio, se non volete che vengano indicizzate le versioni stampabili degli articoli del vostro sito, disabilitate tali directory o fate uso di espressioni regolari nel file robots.txt
2. Usare il 301: Se avete ristrutturato il sito, usate il redirect 301 (redirect permanente) nel vostro file .htaccess per redirezionare velocemente utenti, Googlebot, e gli altri spider
3. Essere costistenti: per mantenere la consistenza del vostro linking interno non linkate una volta a /pagina/, poi a /pagina e poi a /pagina/index.htm
4. Usare TLD: per aiutarci a capire qual è la più appropriata versione di un documento, usate domini di secondo livello e quando possibile con la specifica della provenienza; preferiamo sapere che un .de indica un sito con contenuti circa la Germania, piuttosto che un /de o un de.esempio.com
5. Condividete con attenzione: se condividete i vostri contenuti in altri siti, assicuratevi che essi contengano un link verso il contenuto originale, in ogni articolo condiviso. Noi comunque mostreremo la versione che pensiamo più appropriata per gli utenti che fanno la ricerca, che potrebbe essere come no, la versione che voi preferite
6. Usate l’opzione “dominio preferito” nel pannello per i webmaster: se altri siti linkano al vostro sito utilizzando sia l’url con www che quella senza, potete dirci quale delle due versioni preferiate venga indicizzata
7. Minimizzate le ripetizioni: invece di inserire nel fondo di ogni pagina lunghi testi di copyright, inserite un piccolo sommario con il link alla pagina con più dettagli.
8. Evitate di pubblicare bozze: gli utenti non gradiscono pagine “vuote”, così evitate [...] dove possibile. Questo significa non pubblicare (o almeno limitare) pagine senza recensioni, senza liste di hotel, etc, così gli utenti (e gli spider) non sono soggetti a una marea di casi di: “Di seguito troverai una magnifica lista delle più grandi opportunità per le tue vacanze a [nome città]…” senza una lista aggiornata.
9. Conoscete il vostro CMS: siate sicuri di sapere per bene come i contenuti vengono visualizzati nel vostro sito, in modo particolare se include blog, forum o sistemi correlati che spesso mostrano lo stesso contenuto in formati diversi
10. Don’t worry be happy: non preoccupatevi troppo dei siti che vi prendono i contenuti. E’ molto improbabile che questi siti possano negativamente influenzare la presenza in Google del vostro sito. Se comunque volete segnalare un caso particolarmente frustrante, siete i benvenuti nel DMCA request, per reclamare la proprietà dei contenuti e permetterci di occuparci del sito che ha copiato.

In breve, una generale consapevolezza del concetto di contenuto duplicato e qualche minuti di premurosa e preventiva manutenzione dovrebbero aiutarvi ad aiutarci nel condurre gli utenti verso contenuti unici e rilevanti.

Per il documento originale, rimando al post sul blog ufficiale di Google.

Abbonati al Feed RSSSe questo post ti è piaciuto, puoi decidere di ricevere gratuitamente gli aggiornamenti del blog abbonandoti al Feed RSS. Clicca qui.

in Google, SEO · TrackBack URL

Commenti

|► Google definisce il contenuto duplicato scrive,

dicembre 23, 2006 @ 19:34

[...] Giorgiotave Ottimo davvero Servirebbe una traduzione per tutti quelli che non conoscono l’inglese detto…fatto… Google e i contenuti duplicati __________________ Ecco cosa pensa Google dei contenuti duplicati! Vuoi organizzare un link contest: leggi come fare! contribuisci anche tu a fare un regalo di Natale a Niccolò! < prenota il tuo hotel in veneto su virtualveneto.it > [...]

sitionweb scrive,

dicembre 23, 2006 @ 19:46

Ottimo Marco :)

marco scrive,

dicembre 23, 2006 @ 21:22

grazie gino. e grazie per l’aiuto! ;-)

Marco scrive,

dicembre 25, 2006 @ 18:09

Ciao Marco,
post molto interessante. Avevo un commento piuttosto lungo da fare…quindi mi viene meglio un link ad alcune mie considerazioni che spero possano essere interessanti.
A prestissimo.
Marco

marco scrive,

dicembre 27, 2006 @ 08:23

Ciao Marco,
interessante questa tua esperienza, soprattutto per quanto riguarda Yahoo!
Chissà questo discorso del robots.txt come verrà integrato tra le varie pagine di un sito?!? Staremo a vedere…ah, e se la notizia di giunge prima di noi all’orecchio…tienici aggiornati! ;-)

Marco scrive,

dicembre 27, 2006 @ 12:14

Lo farò di sicuro anche se come sai non sono proprio un “tennnico”…quindi è molto probabile che scriva cosa già note o magari poco precise. Mi impegnerò comunque!

Hit Parade Del Web Marketing / Seo - Ultimo Appuntamento Dicembre 2006 scrive,

dicembre 29, 2006 @ 09:40

[...] MARCO ZIERO, si merita una citazione per la traduzione di un importante documento di Google dedicato ai contenuti duplicati. [...]

I Motori di Ricerca e il Web Google e il contenuto duplicato scrive,

gennaio 2, 2007 @ 12:11

[...] Posted by LucaC on 02 Jan 2007 at 12:11 pm | Tagged as: Motori di Ricerca Pubblico di seguito, i punti salienti di un importante documento apparso recentemente sul blog ufficiale di Google, e ripreso e tradotto da Marco Ziero, riguardo ai contenuti duplicati e ai feed rss. [...]

Top Ten Hit Parade Web Marketing Dicembre 2006 scrive,

gennaio 8, 2007 @ 09:50

[...] [10] Marco Ziero Google e i contenuti duplicati [...]

Marco scrive,

gennaio 8, 2007 @ 14:48

Ciao Marco,
vorrei chiedere a te ed ai tuoi attivissimi lettori un parere da esperti in merito a questo problemino. Grazie in anticipo!
Marco

Anti-duplicazione scrive,

gennaio 10, 2007 @ 15:06

Contenuto duplicato

[...]Google chiarisce cosa si intende per Contenuto Duplicato[...]

Fra_T scrive,

gennaio 15, 2007 @ 21:59

Grazie Marco, post interessante e… utile! :D

Contenuti duplicati e posizionamento scrive,

agosto 31, 2007 @ 12:00

[...] 4 mesi fa, Adam Lasnik è intervenuto sull’Official Google Webmaster Central Blog per fare il punto sui contenuti duplicati; il pezzo è stato ottimamente tradotto in italiano da Marco Ziero. Riassumendolo in 2 punti: [...]

Come NON fare un contest: TuxStyle e contenuto duplicato scrive,

aprile 14, 2008 @ 00:11

[...] cosa ci sia di tanto sbagliato nel modo in cui è portato avanti il contest, vi invito a leggere cosa ne pensa Google dei contenuti duplicati sul blog di Marco Ziero. E visto che siamo in tema, anche quello su come [...]

Google e il contenuto duplicato scrive,

settembre 16, 2008 @ 11:46

[...] apparso recentemente sul blog ufficiale di Google, e ripreso e tradotto da Marco Ziero, riguardo ai contenuti duplicati e ai feed [...]

Soluzione ai contenuti duplicati su Blogger provocati da ?showComment scrive,

settembre 18, 2008 @ 15:36

[...] la guida per rimuovere ogni traccia di link riportante il parametro ?showComment= (che genera dei contenuti duplicati) dal tuo template di Blogger / [...]

Serena scrive,

settembre 25, 2008 @ 10:22

Ciao a tutti,
su questo indirizzo http://blog.imevolution.it/91/cose-veramente-la-sanzione-del-contenuto-duplicato/ potete trovare la traduzione completa di un nuovo ed interessante articolo dove google chiarisce cosa si intende per “contenuto duplicato” ed in quali casi avviene la sua penalizzazione.

Coscheboy scrive,

settembre 27, 2008 @ 15:46

E’ possibile che un sito con contenuti duplicati a causa di URL scritti male venga penalizzato da Google?
Ovvero Google si accorge dei contenuti duplicati all’interno di un sito nel quale ci sono due pagine con gli stessi contenuti e url diversi. Il motore di ricerca se ne accorge ed elimina una delle due pagine dalla serp ma mi chiedo viene penalizzato in qualche modo anche tutto il resto del dominio?

Marco scrive,

settembre 28, 2008 @ 12:50

Il filtro di antiduplicazione, dal mio punto di vista, è un meccanismo ancora non del tutto svelato e chiaro.
Per me è fortemente legato al tema/settore che il sito web descrive.
In ogni caso credo questo:
- se si tratta di contenuti duplicati interni, la “penalizzazione” consiste proprio nello stampare in serp uno dei due contenuti “eliminando” l’altro;
- qualora questa situazione dovesse “espandersi” ad un sacco di URL interne, allora credo che potrebbe scattare una sorta di flag anche per il dominio intero (credo!);
- caso assolutamente diverso, se, invece, i contenuti duplicati sono cloni di URL appartenenti ad un altro sito web. Per me è in questi casi che il filtro scatta, sempre a seconda del settore.

IMHO

DEVILIO scrive,

maggio 10, 2009 @ 15:00

Ottimo articolo, Grazie per la traduzione, VERAMENTE UTILE!

Contenuti duplicati: Cause e Soluzioni scrive,

novembre 8, 2009 @ 12:01

[...] è disponibile sul blog ufficiale di Google. La traduzione italiana non ufficiale la trovate qui. Tags: contenuti [...]

Come pubblicare un articolo su siti diversi evitando il filtro antiduplicazione | www.web-marketer.it scrive,

dicembre 10, 2009 @ 18:31

[...] questo post con due risorse sull’argomento che possono essere utili: alcuni tool che fanno conoscere se e chi copia il contenuto dei nostri siti e la posizione di Google sui contenuti [...]

Ciccio scrive,

luglio 22, 2010 @ 13:02

Grazie ero indeciso se tradurre un articolo i ninglese e postarlo su Google era da considerarsi duplicato della versione italiana. Adesso so che non è così.
Grazie !!!

Marco scrive,

luglio 22, 2010 @ 14:24

Di nulla. ;)

Lascia un commento

Forse potranno interessarti...

.