11
apr/07

Permalink, categorie, Google e contenuti duplicati

Della serie: non si finisce mai di imparare!
Scrivo questo post sulla base di una mia recente esperienza con questo blog.
Spero possa essere d’aiuto a qualcuno indicando alcuni passaggi relativi all’ottimizzazione di WordPress.

Primo consiglio che funge anche un po’ da premessa: nella definizione del permalink, se doveste scegliere la versione personalizzabile, non riportate nella URL la categoria di appartenza del vostro post, nonostante essa consista in una parola chiave.
I consigli che seguono si riferiscono solo al caso in cui, come me, abbiate deciso, appunto, di inserire la categoria nell’URL.

Non inserite il post in più di una categoria e fate in modo che non si arrivi ad avere una categoria contenente un solo post.
Ora, di questi due punti, vediamo i pro ed i contro.

1.Inserimento del post in più di una categoria
Se decidete di inserire un post in più di una categoria, WordPress genererà due o più URL diverse che indicano il medesimo contenuto. Scatta in questo caso il filtro di antiduplicazione di Google e succede che solo una delle diverse URL sarà mostrata agli utenti nelle serp di Google.
D’altrocanto, però, inserendo un post in più categorie, si procede anche ad aggiornarne più di una contemporaneamente e più di frequente.
Quindi è necessario pesare questi due aspetti.
Il filtro di antiduplicazione contro l’aggiornamento più “massiccio” del blog.
Poichè sono trascorsi diversi giorni dalla concezione alla pubblicazione di questo post e, alla luce della conclusione alla quale siamo arrivati sopra, mi sento di dire che non c’è troppo da preoccuparsi qualora dovesse scattare il filtro di antiduplicazione: alla fine il vostro post finirà comunque nelle serp, con una o con l’altra URL.
Dall’altra parte della medaglia c’è, per giunta, l’aggiornamento di più porzioni del blog che considero aspetto molto più importante, soprattutto ultimamente che i contenuti originali e “freschi” contano come non mai.
A dir la verità, c’è un altro aspetto che si è aggiunto alle mie recenti considerazioni: i backlink.
Se un utente decide di linkare il vostro post dopo averlo raggiunto dall’index del blog, quasi sicuramente l’URL che linkerà sarà “la prima”, quella che compare cliccando sul titolo del post dall’index.
Però se l’utente arriva al vostro post dalle serp? E se il post che è finito nelle serp è “l’altro”, quello che non si raggiunge direttamente dall’index ma solo navigando tra archivi e categorie?
In questo caso bisogna considerare il fatto che i backlink saranno distribuiti (difficile dire la proporzione) tra le due o più URL dispendendo PageRank e, perchè no, TrustRank.
Quindi, per chiudere il punto 1. consiglio di tenere presente il filtro di antiduplicazione, l’aggiornamento frequente di una porzione del blog, che va oltre la singola categoria, e la dispersione di PR e TR.
Personalmente credo che, delle tre, continuerò ad esprimere la mia preferenza per l’aggiornamento.
Questo non significa che infilerò il post in quante più categorie possibili, perchè deve essere saldo il concetto che devo cercare di rimanere più a tema possibile con il topic principale.
2.Categorie con un solo post
A meno che non abbiate qualche plugin che, subito sotto il titolo della categoria, aggiunge delle righe di testo, se la vostra categoria contiene un solo post si verifica uno dei casi riportati sopra, ovvero che il mesesimo contenuto è raggiungibile da più URL: quella del singolo post e quella della categoria.
Quindi consiglio di non creare categorie destinate a contenerere un solo post o, quantomeno, di tornare a farvi ogni tanto il giro delle categorie per verificare che non ve ne siano alcune con un solo post al loro interno.

Inoltre, anche se non ho avuto modo di affrontare la cosa, sarebbe interessante come WordPress si comporta in situazioni simili qualora io mi trovassi ad avere categoria e sottocategoria, con un post che, chiaramente, è raggiungibile sia dalla prima che dalla seconda.

Ne ho già discusso con i miei due colleghi, Manuel e Marco, ma qualora dovessero esserci delle osservazioni, ben venga!
Penso possa essere interessante intavolare una discussione sull’argomento, anche se non ci troviamo in un forum.
:-D

Abbonati al Feed RSSSe questo post ti è piaciuto, puoi decidere di ricevere gratuitamente gli aggiornamenti del blog abbonandoti al Feed RSS. Clicca qui.

in Wordpress · TrackBack URL

Commenti

marco scrive,

giugno 6, 2007 @ 18:48

aggiungo una considerazione venuta fuori dal corso di madri (25 maggio 2007, Milano) al quale ho assistito:
google infligge una sorta di penalizzazione al dominio, oltre al fatto di non pubblicare uno dei due link, però, domanda che mi viene in mente ora: vale per due siti diversi…ma se due pagine fanno riferimento al medesimo dominio?

marco scrive,

giugno 6, 2007 @ 18:50

credo che, posto il fatto che ogni post dovrebbe essere di qualità, dedicherei comunque maggiore attenzione ai post ai quali dedico maggiori risorse, individuando precisamente la categoria più a tema col topic; per i post di qualità “inferiore” non mi preoccuperei della dispersione di PR e TR e li utilizzerei, sempre che io rimanga a tema, per “rinfrescare” più di una categoria.

dechigno scrive,

giugno 6, 2007 @ 19:55

Ciao Marco,

a mio avviso, la penalizzazione per duplicazione è una condizione piuttosto remota. Nel senso, mi sembra più che altro un modo per bloccare lo spam in rete più che limitare le scopiazzate da webmaster a webmaster.. :)

A mio avviso, un dominio può essere penalizzato se duplica contenuti in modo regolare e programmatico (proprio come funzionano gli spam engine) e quando si parla di un notevole numero di pagine e contenuti copiati.

Per esperienza personale, il filtro anti-duplicazione non penalizza il dominio, basta fare una semplice query su un mio articolo (su Google.it: “google da ballerino a surfista”) per rendersene conto.

Il filtro anti-duplicazione quindi non penalizza e non sempre riesce a rilevare il contenuto duplicato di una pagina, perchè giustamente ne conta anche il layout ed il contorno… :)

Il massimo che può accadere è, nel caso le due pagine fossero praticamente identiche, di vederne sparire una delle due dalle SERP, come risultato omesso oppure addirittura non indicizzato.

Forse, il tutto cambierà con l’introduzione del nuovo algoritmo del pharserank.. ma ora è prematuro fare qualsiasi altra considerazione. :)

ciao e complimenti per il blog,
davvero interessante!

Michele

sitionweb scrive,

giugno 7, 2007 @ 08:26

Io personalmente preferisco inserire il post in una sola categoria, proprio per evitare il filtro.

E’ pur vero che bisogna pensare prima all’utente e poi alle regole dei motori, ma, pensandoci, un utente di due post uguali (seppur in due categorie diverse), che se ne fa?

Inoltre, dovendo inserire un post in due categorie, IMHO, quello che finirà in SERP è quello linkato dalla index (ovvio, non è una verità assoluta, ma secondo me ha più probabilità). Questo renderebbe “inutile” il post duplicato.

Relativamente, invece, al secondo punto, anche secondo me è bene non lasciare categorie con un solo post, altrimenti il filtro potrebbe scattare.

Relativamente a quello detto al corso di Madri, in caso di contenuti duplicati all’interno di uno stesso dominio, Google non pubblica un URL e amen. Ovvio che se il 70% del sito è fatto di contenuti duplicati, beh, allora Google si inizia a preoccupare (e dovremmo farlo anche noi :) ). Tutto questo, ovviamente, IMHO.

marco scrive,

giugno 7, 2007 @ 15:24

grazie michele e gino, ottimi spunti!
appena ho un attimo rispondo… ;-)

Fra_T scrive,

giugno 25, 2007 @ 12:17

Però… :D

- Anche se il post è inserito in più categorie il link che punta al post è sempre lo stesso.

- I sistemi di catalogazione in cui un item è rigidamente abbinato ad una categoria non sono ideali per “ritrovare” il contenuto catalogato (chi è che riesce a ritrovare un file in Windows?! Io a volte fatico un po’ :D ): domani cercherò questo post sotto WordPress, SEO o Considerazioni?
In certi casi poter raggiungere tramite diversi percorsi uno stesso contenuto può aumentare di molto la user experience.

- Teoricamente non è l’unica struttura di permalink che può dare problemi: %post_id%-%post_name% ad esempio. Per ritrovare il post viene usato l’id e ignorato il nome, quindi:

11-contenuti-dupplicati

e

11-nejwklnfcrewnvreqklvklnyre

Ritornano lo stesso post.
Volendo risolvere si può usare il plugin Permalink redirect, ma non so se funziona con tutte le strutture di link.

marco scrive,

giugno 25, 2007 @ 12:27

Ottime osservazioni, Francesco.
Direi che hai messo il punto sulla questione!
;-)
Grazie per l’intervento

Alessandro scrive,

luglio 18, 2010 @ 10:59

Ciao Vorrei capire una cosa, ma se io ripubblico un’articolo o un post di un’altro blog citandone la fonte, questo viene visto lo stesso come contenuto duplicato ?
Saluti

Marco scrive,

luglio 19, 2010 @ 09:43

@Alessandro
Tenendo in considerazione che:
- hai citato la fonte (link);
- l’articolo originale è stato pubblicato/indicizzato prima;
non credo che Google abbia difficoltà a capire chi è l’autore; in questo senso non penso che lo consideri come contenuto duplicato a danno della copia originale.
Dal mio punto di vista, una strategia basata su questa dinamica (ripubblicare e citare), non è comunque scalabile perché chi “copia” ;) non gioverebbe nemmeno di una visibilità di riflesso.
#imho

Risparmiando scrive,

marzo 27, 2011 @ 20:34

Tutto esatto, raccomando a tutti gli utenti di non usare mai FeedWordpress aggregando news perchè moltiplica le categorie monopost e con l’ultimo aggiornamento di Google si finisce bannati.

Il mio sito Risparmiando.net non faceva nulla di illecito, usava FeedWordpress per aggregare notizie dai pochi blog partner ed è finito sottola falce dell’aggironamento, ora nei risultati di Google non appare più.

Lascia un commento

Forse potranno interessarti...

.