Può essere interessante vedere l'ultima scansione di una pagina del nostro sito, da parte di Google. Dopo che è stato introdotto il nuovo report pagine valide / non valide, la cosa è ancora più semplice e immediata.
Come vedere l'ultima scansione Su Search Console
- aprire Google Search Console
- andare nella sezione "Pagine"
- fra le voci che compaiono (utili per altri scopi, es. scoprire le pagine che non sono indicizzate), selezionare "visualizza i dati sulle pagine indicizzate"; queste sono ordinate per "ultima scansione" e vengono registrate le ultime 1000 in totale
- si può visualizzare l'elenco direttamente da browser oppure, forse più comodo, fare "esporta" e aprire il file CSV con un foglio di calcolo, es. Excel; in questo modo è anche più semplice filtrare i 1000 risultati (ad esempio ho un sito diviso in sito.it/prodotti e sito.it/blog, mi interessa conoscere l'ultima scansione delle pagine di Blog piuttosto che solo dei prodotti)
- come superare il limite dei 1000 risultati: in modo simile a quanto avviene per le query (approfondimento: superare il limite di 1000 query su GSC), è possibile aggirare questo limite, procedendo per scompartimenti; in alto a sinistra è indicato "tutte le pagine note", se il nostro sito web è grande e ha più Sitemap (ad esempio la Sitemap dei prodotti e quella degli articoli di Blog), posso filtrare per Sitemap specifica oppure "pagine inviate" o "pagine non inviate" (e quindi indicizzate da sole, senza la nostra azione)
Analisi tramite la Sitemap XML
Come visto nella discussione Sitemap XML per studiare i competitor! Foglio di calcolo, la Sitemap (oppure "le Sitemap" nel caso ce ne sia più di una, es. sito web di grandi dimensioni) contiene una lista di informazioni utili per tutte le pagine del sito web:
- URL
- data di ultima modifica
- changefreq (facoltativo): frequenza in cui in media la pagina potrebbe venire modificata, giusto un'indicazione generale per i motori di ricerca
- priority (facoltativo): si può suggerire quali pagine siano secondo noi le più importanti e quindi un'informazione per il crawler; tuttavia non è necessario e la cosa si ppuò benissimo gestire in altro modo, soprattutto tramite Internal Linking, in base all'architettura del nostro sito web
Ho sottolineato "data di ultima modifica" per fare un confronto con quanto detto prima, ovvero:
- analisi tramite Google Search Console: possiamo vedere l'ultima scansione della pagina da parte del crawler di Google
- analisi tramite Sitemap: possiamo vedere quando è stata fatta l'ultima modifica della pagina (diciamo, magari col tempo tecnico affinché la Sitemap venga aggiornata, magari può essere un giorno); giusto per comprenderne l'importanza, in questo modo possiamo studiare il lavoro dei nostri competitor!
Conoscere questi dati può essere interessante, perché Googlebot (analogamente a quanto avviene con Bing e gli altri motori di ricerca) passa a visitare il nostro sito web, le nostre pagine, per vedere se ci sono aggiornamenti (la frequenza di questi passaggi è variabile, approfondimento: crawl budget): in base agli aggiornamenti può cambiare la nostra posizione (ranking) nei risultati di ricerca e i vari "punteggi di qualità" che assegna al nostro sito e alle relative pagine.
Quindi in particolare se abbiamo effettuato aggiornamenti su alcune pagine, vedere se il crawler è già passato oppure no, per capire se eventuali variazioni nel ranking dovute all'aggiornamento non sono avvenute o potrebbero ancora avvenire. Allo stesso modo, grazie alla Sitemap abbiamo un ottimo strumento per tenere d'occhio la concorrenza!