03
set/07

Google e il numero di risultati di ricerca. Marketing?

Tempo fa Johnnie mi fece notare che, per esempio, nonostante la query “marco” restituisca circa 190 milioni di risultati, di fatto, il numero di documenti consultabili era sempre 1.000. Per buttarla giù con una battuta, J mi disse: “Perchè Google vuole far vedere quanto son bravi”, e sinceramente, come risposta mi può andar bene.
Ora penso ad un’altra query che sta uscendo dalla sua stagionalità, e nella quale non rientrerà più: “mondiali germania 2006“. Ad oggi questa query restituisce poco più di 2 milioni di risultati quando, ne sono certo, poco più di un anno fa ne restituiva molti di più.

Per andare avanti con il ragionamento, introduco un altro concetto, appreso da chi mi insegna questo lavoro per mezzo di consigli e input vari da diverso tempo: Google NON cancella i documenti, in caso li flegga perchè non vengano pubblicati tra le SERP, ma non li cancella (a meno che non esistano più), perchè va contro la sua politica, alla fine lui non fa altro che “collezionare” documenti (per dirla in soldoni) e ce lo vuole far vedere bene, indicando che la query “marco“, per tornare sull’esempio, restituisce 190 milioni di risultati quando posso prendere visione solo dei primi 1.000.
Allora, se io “sommo” le due considerazioni, arrivo a chiedermi: ma se quel numero è “marketing“, perchè ancora oggi, ad un anno di distanza, non ci fa vedere che “mondiali germania 2006“, in realtà restituisce una marea di documenti (che poi, alla fine, sono “solo” 1.000 quelli che possiamo consultare)? Perchè non coglie l’occasione di far vedere ancora che “sono tanto bravi”?
Se non è così, allora mi sorge il dubbio: che Google cancelli i documenti vecchi dai propri database? Forse è per risparmiare risorse? Ma gli archivi storici menzionati in uno degli ultimi brevetti utilizzati per capire la storia e l’andamento di un sito web? Non valgono più?
Oppure, potrebbe essere che Google, dal numero di ricerche effettuate quotidianamente, capisca quali query “tirano di più” e quindi riesca ad individuare dove valga la pena far vedere “quanto sono bravi” per mezzo del numero dei risultati di ricerca, risparmiando risorse per quelle query dove, invece, non ne vale la pena?

Voi che ne dite?

Abbonati al Feed RSSSe questo post ti è piaciuto, puoi decidere di ricevere gratuitamente gli aggiornamenti del blog abbonandoti al Feed RSS. Clicca qui.

in Google · TrackBack URL

Commenti

Johnnie Maneiro scrive,

settembre 3, 2007 @ 11:39

Ciao Marco, hai fatto bene a dire che la mia è stata una battuta, sinceramente queste cose su Google mi preoccupano relativamente poco :)
Le due query sono molto diverse, fai un controllo incrociato tra -mondiali germania 2006- e -“mondiali germania 2006″- (tra virgolette) è vedrai come cambia tutto, non capita la stessa cosa con le keyword singole.
Cmq, non torneranno mai più i mondiali del 2006, anche se sarà sempre un bel ricordo. :)

marco scrive,

settembre 3, 2007 @ 12:36

sì, nemmeno io ci perdo le ore, è solamente uno dei tanti misteri che aleggiano attorno a Google.
circa l’esempio, vedo che i risultati cambiano, ma volevo piuttosto confrontare il numero di documenti realmente visionabili con quelli che Google mi indica alla fine della ricerca.

poi, spesso, mi capita di imbattermi in query che restituiscono meno di 1000 risultati su Google, allora mi metto a scorrere tutte le SERP perchè dico: “se sono meno di 1000 risultati, dovrei riuscire ad arrivare alla fine della ricerca” e scopro invece che il numero di documenti dei quali posso prendere visione sono ancora minori del numero indicato, nonostante questo fosse inferiore a 1000.

quindi, in sostanza, Google la spara sempre un po’ più grossa.
e più la query è sotto osservazione da parte degli utenti (trend), più lui la spara grossa!

chissà perchè?!?
:-)

carlo amoroso scrive,

settembre 3, 2007 @ 13:13

Avevo giocato anch’io qualche settimana fa con questo storia dei risultati. Una cosa che avevo notato è che, ad esempio, più avanzi con le pagine e più si avvicinano i due numeri; Ad esempio per “marco dal pozzo”
(Risultati 1 – 100 su circa 917 per “marco dal pozzo”)
(Risultati 301 – 400 su circa 915 per “marco dal pozzo”) e la pagina successiva – finale (Risultati 401 – 458 su 458 per “marco dal pozzo”) ..quindi i forse ogni query avviene su una “cache” di livello diverso o chissà. :-)

marco scrive,

settembre 3, 2007 @ 13:50

vero vero, l’ho notato pure io! :-)

Mattia Soragni scrive,

settembre 3, 2007 @ 14:52

non faccio in tempo a capire un post di marco e a studiare il fenomeno che subito mi mette nuovi punti di domanda…

ora sono ancora in ferie quindi non ho il cervello per rispondere correttamente, tuttavia, credo che sia comunque un fattore sia di marketing (anche se poco) sia di logistica…

consideriamo il fatto che serovono risorse molto ingenti per gestire la quantità di documenti web… recuparne solo in parte potrebbe significare risparmiare… ma la cosa mi fa più pensare a quello che dice carlo…

marco scrive,

settembre 3, 2007 @ 15:52

la questione marketing è giusta, secondo me.
ma allora è solo proprio per dire: “guarda quanto siamo bravi?” :-D

Mattia Soragni scrive,

settembre 3, 2007 @ 22:19

secondo me non è solo per quello…
mettiamo a confronto due ricerche correlate (ma anche non troppo):
marco: 187.000.000
ziero: 39.300

se google mostrasse il numero massimo di risultati che potrebbe fornire (per motivi suoi, non è questo il luogo di discussione), mostrerebbe per la quasi totalità delle ricerche 1000. da questo ricaviamo, che sia marco che ziero hanno la stessa popolarità, quando, invece (purtroppo per te ;-) ) non è così…

marco ha più risultati ed è giusto che siano indicati i numeri.

a questo punto c’è da chiedersi come mai google abbia decisto di mostrare “solo” i primi 1000 risultati e non che so i primi 500 o 5000… di risposte (se qualcuno sa la risposta esatta, mi inchino :-) ) ne possiamo fare e dire tante ma potrebbe essere un’idea quella dei 1000 risultati che sono in qualche modo “pre confezionati”. Ora sta a noi scoprire il motivo: da una parte abbiamo la teoria degli autori del libro “the dark side of google” che dicono che i suoi risultati non sono meritocratici ma in base a criteri da lui stabiliti per un ritorno economico (e vi devo dire che questa non è una risposta da intelligenti… perchè si sa, google è un’azienda)… oppure che, oltre a far passare qualche spider per le nostre pagine, uno con una sua funzione ben precisa, ve ne sia uno che crea i risultati ad hoc… ma questa teoria viene smentita dal fatto che se effettuiamo ricerche da due diversi computer, che si collegano a db di google differenti, i risultati sono diversi (anche se in minima parte), il che starebbe a significare che per ogni datacenter c’è il suo spider che crea le sue query e memorizza i suoi risultati, ma andrebbe contro una logica di risparmio…

io ho butttato li un po di idee, se mi riprendo un po da questa malattia delle ferie, magari riesco ad elaborare qualcosa di migliore…

fatevi avanti voi ora.. (e che devo lavorare sempre io ???? :-) )
ciao!

marco scrive,

settembre 3, 2007 @ 23:31

sono d’accordo quando dici che ANCHE il numero di risultati serve a far capire quanto una query sia più popolare rispetto ad un’altra.
non servirebbe nemmeno confrontare due query diverse, ma bensì la stessa magari a intervalli temporali lunghi oppure, come per i mondiali, verificarla prima e dopo l’evento (offline).

a parte il fatto che mi viene in mente un’altra domanda:
visto che “noi SEO” non credo siamo il target preferito da Google, sia sicuri che voglia davvero comunicare quanto una query è più popolare rispetto ad un’altra?
se un utente cerca adesso le crocs, lo fa perchè ne ha sentito parlare dovunque, non perchè Google gli ha detto che questa estate “tirano le crocs”.

ma a parte questa domanda resta sempre sospesa la principale: perchè dirmi che hai in db qualche milione di risultati se poi ne posso vedere solo 1000? e perchè, se una query restituisce meno di 1000 risultati, non me li fai neancora vedere tutti e 1000? speri forse che non arrivi all’ultima SERP e non capisca che in realtà sono consultabili molti meno documenti di quelli che tu indichi?
la domanda non è tanto sul 1000 o sul 500, quanto sul perchè, ad ogni query, indichi un valore (il numero dei risultati di ricerca) che non corrisponde al vero e, chissà perchè, è sempre più alto.

:-)

Marco Dal Pozzo scrive,

settembre 4, 2007 @ 09:46

Marco,
proprio qualche sera fa parlavo con il mio amico Carlo della stessa cosa (Carlo ha commentato piu’ in alto!): perche’ Google ci dice che ha milioni di risultati e poi ne mostra (al piu’) solo 1000?

Non ho conoscenze tali da poter dare una risposta precisa e quindi mi affido solo alle sensazioni.

Dalle letture che sto facendo sul calcolo del PageRank sto scoprendo che i processi di Google non sono del tutto deterministici ma sono ottimizzati con delle approssimazioni (coefficienti e cose del genere che rappresentano delle probabilita’ che…).

La mia sensazione e’, quindi, che il numero che ci restituisce non e’ tanto per farci vedere quant’e’ bravo ma semplicemente una stima delle pagine che ha indicizzato.

Ho pensato sta’ cosa anche perche’, se ci facciamo caso, il numeretto e’ sempre un numero “bello rotondo”: e.g. marco ziero circa 25700 (perche’ non 25731?), marco dal pozzo 936000 (perche’ non 936847?) seguito da un “circa”…

Magari piu’ in la’ ne avro’ anche un’altra (di sensazione) sulla ragione per cui ci si ferma a 1000…

marco scrive,

settembre 4, 2007 @ 13:13

direi che è un’ottima spiegazione.
potrebbe essere la stima dei reali documenti indicizzati relativi a quella query, ma, scusatemi se può sembrare una sega mentale (cmq la notte dormo :-D ), non capisco allora perchè non posso prendere visione di tutti questi, anche se sono una stima.
ottima osservazione quella relativa al fatto che i numeri sono sempre tondi.
:-)

Sprunk scrive,

aprile 22, 2008 @ 15:36

salve a tutti. Ho appena letto il post e testato di persona… è vera,mente assurdo!
ho cercato sprunl e mi sono venuti circa 324000 risultati (numero bello tondo). Ho messo num=100 nei parametri di ricerca, così da mostrare 100 risultati per pagina. vado alla pagina 10 e che succede? mi apèpare la famosa stringa
Al fine di …..molto simili alle 813 già visualizzate.
bene, clicco e… il numero dei risultato è sempre 324000, ma alla pagina 10 la stringa è diversa!! anzi, cliccando sulla pagina 10 si vede benissimo che in realtà sono solo 6 pagine, e la stringa è
..ci molto simili alle 547 ….
Ma come? non dovevo aggiungere risultati? invece me li toglie. Continuo con il giochetto.. risultati sempre a 324000 e totali visitabili=547. Ora, capisco che all’atto pratico un risultato dovrei trovarlo nelle prime pagine, ma perchè fanno questo? se veramente ho 324000 risultati, ho una modesta probabilità di trovare quello ce cerco, ma perchè all’atto pratico ne posso vedere solamente 813, o addirittura 547? questo molto probabilmente rimarrà un mistero… Grazie per avermi illuminato su questa cosa che ignoravo. Cordiali saluti. Ciaooo

marco scrive,

aprile 23, 2008 @ 09:23

Grazie a te per l’ottimo contributo! ;)
Ciao

Lascia un commento

Forse potranno interessarti...

.