Nei giorni scorsi è arrivata la notizia di un Data Leak di Google Search (Google’s internal Content API Warehouse), apparso su GitHub ancora il 13 marzo 2024 e visto, condiviso, solo nei giorni scorsi. Simile a quanto era accaduto con Yandex a gennaio 2023.
In termini di dimensione, questo Data Leak di Google è uno dei più grandi della storia, si tratta di 2596 moduli (documentazione delle API) e 14014 attributi.
Dato che l'algoritmo di Google è molto complesso e in continua evoluzione, con questo furto di dati qualcuno, molto ingenuamente, crede di "poter dominare il ranking su Google", come trovando l'importanza dei cosiddetti "fattori SEO", scritti in una bella lista. La realtà è ovviamente un'altra, come riporta sia SearchEngineJournal sia Pedro Dias in un tweet:
At this point in time there is no hard evidence that this “leaked” data is actually from Google Search… and not related in any way to how websites are ranked in Google Search.
Quindi se l'algoritmo di Google è estremamente complesso e in continua evoluzione, dominato dal lavoro dell'IA, cosa vogliamo fare con qualche dato estrapolato e visto fuori contesto? Questo non fa altro che allontanarci dal reale focus creando solo contenuti inutili, spazzatura, ovvero come si diceva in Guida ai contenuti SEO che piacciono a Google (e non solo):
- dovremmo produrre contenuti di qualità, utili alle persone, in modo tale che poi veniamo premiati anche con il ranking per determinate query di ricerca che intercettano i bisogni delle persone (vedi anche: attenzione alle Vanity Metrics)
- cercare di copiare da "chi sta davanti", copiare le keyword sperando che questo ci porti ad un posizionamento migliore, fregandosene dell'utilità dei nostri contenuti, non ha alcun senso, non è una vera strategia
Google non ha rilasciato dichiarazioni ufficiali a riguardo e possiamo pure confermare che in Borsa Google (Alphabet Inc) non ha fatto nemmeno una piega, sebbene questa "notizia" compaia quasi ovunque sui canali e piattaforme che si occupano di SEO e Digital Marketing. Il punto chiave quindi è quanto detto prima: in un panorama così complesso e variegato, un'informazione senza contesto è inutile (e persino potenzialmente dannosa, fuorviante). Ci allontanerebbe dal corretto focus, quindi nella pratica sono 2500 pagine di fuffa.