NIKON
TOPPS

Documenti trafugati spiegano i segreti della Ricerca di Google

L’algoritmo di ricerca di Google è forse il sistema più prezioso su Internet, poiché detta quali siti vivono e muoiono e come appaiono i contenuti sul web. Ma il modo esatto in cui Google classifica i siti web è stato a lungo un mistero, che si è cercato di scardinare da una imprevista coalizione di giornalisti, ricercatori e persone che lavorano nell’ottimizzazione dei motori di ricerca. Ora, una fuga di notizie esplosiva pretende di mostrare migliaia di pagine di documenti interni e vuole offrire uno sguardo senza precedenti su come funziona la Ricerca (Search). Queste informazioni suggeriscono che Google non è stato del tutto sincero in merito alla Search, per anni. Finora, Google non ha risposto a molteplici richieste di commenti sulla legittimità dei documenti.

Rand Fishkin, che ha lavorato nell’ottimizzazione Seo per più di un decennio, sostiene che una fonte ha condiviso con lui 2.500 pagine di documenti nella speranza che la segnalazione della fuga di notizie potesse contrastare le “bugie” che i dipendenti di Google avevano condiviso su come funziona l’algoritmo di ricerca. Secondo Fishkin, i documenti descrivono l’API di ricerca di Google e analizzano quali informazioni sono a disposizione dei dipendenti. I dettagli condivisi da Fishkin sono densi e tecnici, probabilmente più leggibili per gli sviluppatori e gli esperti Seo che per i non addetti ai lavori. Inoltre, i contenuti della fuga di notizie non sono necessariamente la prova che Google utilizzi i dati specifici e i segnali menzionati per il posizionamento nelle ricerche. Piuttosto, la fuga di notizie delinea quali dati Google raccoglie da pagine web, siti e ricercatori e offre suggerimenti indiretti agli esperti Seo su ciò che sembra interessare a Google, come ha scritto l’esperto di Seo Mike King nella sua panoramica dei documenti.

I documenti trapelati toccano argomenti come il tipo di dati che Google raccoglie e analizza, quali siti Google eleva per argomenti sensibili come le elezioni, come Google gestisce i piccoli siti Web e altro ancora. Secondo Fishkin e King, alcune informazioni contenute nei documenti sembrano essere in conflitto con le dichiarazioni pubbliche dei rappresentanti di Google. “‘Bugiardo’ è duro, ma è l’unica parola precisa da usare qui” – scrive King – “Anche se non biasimo necessariamente i rappresentanti pubblici di Google per aver protetto le loro informazioni proprietarie, sono in disaccordo con i loro sforzi per screditare attivamente le persone nei mondi del marketing, della tecnologia e del giornalismo che hanno presentato scoperte riproducibili”.

Google non ha risposto alle richieste di commento di alcune testate, tra cui The Verge, in merito ai documenti, inclusa una richiesta diretta di confutare la loro legittimità. Fishkin ha dichiarato a The Verge in una e-mail che la società non ha contestato la veridicità della fuga di notizie, ma che un dipendente gli ha chiesto di cambiare il linguaggio nel post riguardo al modo in cui è stato caratterizzato un evento.

L’algoritmo di ricerca segreto di Google ha dato vita a un intero settore di professionisti del marketing che seguono da vicino la guida pubblica di Google e la eseguono per milioni di aziende in tutto il mondo. Le tattiche pervasive e spesso fastidiose hanno portato a una narrazione generale secondo cui i risultati di ricerca di Google stanno peggiorando, affollati di spazzatura che gli operatori di siti web si sentono obbligati a produrre per far vedere i loro siti. In risposta agli articoli sulle tattiche guidate dalla Seo, i rappresentanti di Google spesso ripiegano su una difesa familiare: non è quello che dicono le linee guida di Google.

Ma alcuni dettagli nei documenti trapelati mettono in dubbio l’accuratezza delle dichiarazioni pubbliche di Google riguardo al funzionamento della Ricerca. Un esempio citato da Fishkin e King è se i dati di Google Chrome vengono utilizzati nel ranking. I rappresentanti di Google hanno ripetutamente indicato che non sono utilizzati i dati di Chrome per classificare le pagine, ma Chrome è specificamente menzionato nelle sezioni su come appaiono i siti web nella Ricerca. Nello screenshot qui sotto, i collegamenti che appaiono sotto l’URL principale di vogue.com potrebbero essere creati in parte utilizzando i dati di Chrome, secondo i documenti.

Uno screenshot della Ricerca Google del risultato Vogue.com, con collegamenti secondari sotto la home page principale. I collegamenti indirizzano a sezioni come “Met Gala 2024” e “Bellezza”.

Un’altra questione sollevata è quale ruolo gioca, se del caso, l’EEAT nella classifica. EEAT sta per esperienza, competenza, autorevolezza e affidabilità, una metrica di Google utilizzata per valutare la qualità dei risultati. I rappresentanti di Google hanno precedentemente affermato che l’EEAT non è un fattore di ranking. Fishkin nota di non aver trovato molto nei documenti che menzionino l’EEAT per nome. King, tuttavia, ha spiegato in dettaglio come Google sembra raccogliere i dati dell’autore da una pagina e ha un campo per indicare se un’entità sulla pagina è l’autore. In una parte dei documenti condivisi da King si legge che il campo è stato “sviluppato e ottimizzato principalmente per articoli di notizie… ma è popolato anche per altri contenuti (ad esempio, articoli scientifici)”. Sebbene ciò non confermi che le firme siano una metrica di ranking esplicita, mostra che Google almeno tiene traccia di questo attributo. I rappresentanti di Google hanno in precedenza insistito sul fatto che i sottotitoli degli autori sono qualcosa che i proprietari di siti web dovrebbero fare per i lettori, non per Google, perché non influiscono sulle classifiche.

Sebbene i documenti non siano esattamente una pistola fumante che indichi una qualche colpevolezza di Google, in qualsiasi termine la si intenda, sono utili perché forniscono uno sguardo profondo e senza filtri su un sistema di scatole nere strettamente sorvegliato. Il caso antitrust del governo degli Stati Uniti contro Google , che ruota attorno alla Ricerca, ha anche portato a rendere pubblica la documentazione interna, offrendo ulteriori approfondimenti sul funzionamento del prodotto principale dell’azienda.

La generale cautela di Google su come funziona la ricerca ha portato i siti web ad avere lo stesso aspetto mentre gli esperti di marketing Seo cercano di superare in astuzia Google sulla base dei suggerimenti offerti dall’azienda. Fishkin denuncia anche le pubblicazioni che sostengono credulosamente le affermazioni pubbliche di Google come vere senza ulteriori analisi. “Storicamente, alcune delle voci più forti del settore della ricerca e gli editori più prolifici sono stati felici di ripetere acriticamente le dichiarazioni pubbliche di Google. Scrivono titoli come ‘Google afferma che XYZ è vero’ anziché ‘Google afferma XYZ; Le prove suggeriscono il contrario’” – scrive Fishkin – “Per favore, fai di meglio. Se questa fuga di notizie e il processo del Dipartimento di Giustizia possono creare un solo cambiamento, spero che sia questo”.

TOPPS
GAMEPEOPLE
DIFUZED
FIZZ
PALADONE
OTL
CROCKPOT
TOPPS
SUBSONIC