04
set/07

Domanda su Google Webmaster Tools

A volte non mi ritrovo con certi dati letti su Google Webmaster Tools.
Ad oggi, alla voce “URL non trovati“, vedo che la numerazione dice 44.
Non mi allarmo mai poichè, in casi di down del server, per esempio, oppure di un’errata catalogazione di un post, della quale mi accorgo solo qualche ora dopo, dopo un paio di giorni tali errori vengono aggiornati ed eliminati, insomma, era una cosa temporanea, dovuta al fatto che lo spider dedicato a tale funzione era passato proprio in quel momento.
Però, il comune denominatore, in questi casi, è che le URL che il Webmaster Tools mi indicava erano raggiungibili, erano corrette, esistenti insomma.
Ad oggi, invece, il pannello di controllo mi indica delle URL che non esistono.
La cosa è strana poichè vi è un comune denominatore anche in questo caso: la struttura delle URL è errata, non è addirittura mai esistita, come se, per intenderci, avessi modificato la struttura del permalink, ovvero /%postname%/, quando quella reale è invece /%category%/%postname%/; non so proprio come Google abbia potuto rilevare certe URL.
Qualcuno può darmi una mano nel comprendere questa cosa?
Qui uno screenshot per aiutare a comprendere.

google webmaster tools screenshot

(tra l’altro vi è una seconda cosa strana in questo screenshot: i primi due link sono uguali e sono stati riportati come se fossero due documenti diversi, come si può vedere dalla data che li fa “sembrare diversi tra loro”).
E’ il mio Google Webmaster Tools che sta impazzendo o cosa?

Abbonati al Feed RSSSe questo post ti è piaciuto, puoi decidere di ricevere gratuitamente gli aggiornamenti del blog abbonandoti al Feed RSS. Clicca qui.

in Google · TrackBack URL

Commenti

Andrea Micheloni scrive,

settembre 5, 2007 @ 11:06

I primi due URI non sono uguali, in effetti, uno ha una backslash finale e l’altro no: un buon SEO dovrebbe sempre linkare una versione (e al massimo redizionare in auto tutte le altre versioni a quelle giuste) per evitare contenuti duplicati.

Le url non trovate non si spiegano in effetti, a meno che il tuo sitemap generator non abbia dato i numeri, o qualche sito internet linkasse quelle esatte pagine (ma non so perchè ti appaiano lì, allora…)

marco scrive,

settembre 5, 2007 @ 12:08

ciao andrea, rispondo qui al primo punto da te indicato: :-)

mi lascia un po’ perplesso che vengano identificate quelle pagine da eventuali link in entrata piuttosto che da una sitemap, oppure da una mappa-del-sito.htm oppure ancora da una navigazione dello spider.

mi lascia perplesso che Google non capisca da solo che le pagine che finiscono con una “/” o senza di essa siano le medesime, anche perchè i SEO sono un’infima percentuale della gente che vive in internet, quindi non può pretendere che i link che citano siti siamo sempre e solo con lo “/” o senza.

spero davvero che Google non li consideri contenuti duplicati anche perchè, con il boom di WordPress e con il fatto che esso viene utilizzato non solo da utenti avanzati, mi sa che ci troviamo di fronte ad un universo di contenuti duplicati.

in ogni caso, nello specifico, è successo solo con quella URL.

circa il secondo punto ti confermo che il sitemap generator, da quello che ho notato io non ha mai sbarellato! :-D

Andrea Micheloni scrive,

settembre 5, 2007 @ 17:39

Beh, i contenuti duplicati ci sono :) perchè si ottiene lo stesso contenuto a due diversi indirizzi, ma, come sosteneva nonricordochi qualche tempo fa, Google comunque si aspetta i duplicati, dato che WP di default mostra gli stessi articoli nell’index, nel post singolo, negli archivi e nelle categorie…

ma di certo chi rispetta certi criteri viene premiato nelle SERP

marco scrive,

settembre 5, 2007 @ 18:10

sì, chiaro, sono contenuti duplicati, ma, personalmente, dò peso a come Google considera questi contenuti duplicati.

comunque, se prendiamo WP ed un singolo post, non si tratta di contenuti duplicati perchè nella index, negli archivi e nelle categorie ci sono altri post sotto che modificano i contenuti di queste pagine.

prendiamo pure questo post
http://www.marcoziero.it/google/domanda-google-webmaster-tools/

è raggiungibile dalla index
http://www.marcoziero.it

dall’archivio
http://www.marcoziero.it/2007/09/

e dalla categoria
http://www.marcoziero.it/category/google/

ma nelle ultime tre URL indicate, sotto al post in questione, ci sono altri post, più vecchi che fanno sì che queste tre URL non vengano considerate come contenuto duplicato, anche se le prime righe (quelle corrispondenti all’ultimo post) sono uguali.

tecnicamente dovrei avere, di default, sempre 2x pagine di contenuto duplicato, dove x è il numero di pagine che compongono questo blog.

considerando un deficit del genere, allora non mi aspetterei proprio che così tanti blog si posizionano così tanto bene.

in ogni caso, come riporti tu, Google si aspetta e prende in considerazione (credo con poca) questi effetti.

ma la domanda iniziale rimane.
da dove vengono fuori le pagine che mi mostra il Google Webmaster Tools?

:-)

Lascia un commento

Forse potranno interessarti...

.