Quando inizio un SEO Audit di un sito web, una delle prime cose che guardo sono quanti URL sono indicizzati in Google. Successivamente confronto quel numero con il numero di URL che individuo con il mio spider (Screaming Frog oppure Website Auditor) e al numero di URL presenti nella Sitemap.xml.
La Sitemap.xml è un file in formato XML che dovrebbe rispettare degli standard ben precisi, sia sulle sue modalità di compilazione, sia sulla location esatta dove andrebbe collocata. Il protocollo è definito nel sito ufficiale: https://www.sitemaps.org/
Tuttavia, molti webmaster ignorano questi standard ed inseriscono la Sitemap.xml, o qualcosa che assomiglia ad una sitemap, un po’ dove capita. Per maggiori dettagli potrebbe interessarti la guida per come costruire una Sitemap Perfetta.
Come trovare la Sitemap.xml
Se il webmaster l’ha creata, la Sitemap.xml dovrebbe risiedere nella root del web server.
1. URL comuni
Alcuni URL comuni dove potresti trovarla sono:
- esempio.com/sitemap.xml
- esempio.com/sitemap.xml.gz (se è stata compressa)
- esempio.com/wp-sitemap.xml (la sitemap standard di WordPress)
- esempio.com/sitemapindex.xml (un sito con molte pagine potrebbe usare un indice di sitemap)
- esempio.com/sitemap-index.xml
- esempio.com/sitemap_index.xml
- esempio.com/sitemapindex.xml
- esempio.com/sitemap.php
- esempio.com/sitemap.txt
- esempio.com/sitemap/
- esempio.com/sitemap/sitemap.xml
- esempio.com/sitemap/index.xml
- esempio.com/sitemap1.xml
- …
I file XML sono solo uno dei modi per descrivere una mappa del sito. Esistono anche formati RSS e Atom. Quindi, vediamo altri possibili URL che potrebbero essere disponibili:
- esempio.com/rss/
- esempio.com/rss.xml
- esempio.com/atom.xml
2. Indicata nel robots.txt
La Sitemap.xml dovrebbe sempre essere linkata alla fine del file Robots.txt, il quale dovrebbe essere nella root. Se il webmaster ha fatto un buon lavoro, troverai l’ubicazione della sitemap indicata qui:
- www.website.com/robots.txt
3. Fatti aiutare da alcuni strumenti
Per trovare la Sitemap.xml puoi anche avvalerti di strumenti gratuiti come URLsMatch.eu che è disponibile anche in italiano.
4. Operatori di ricerca
L’ultimo metodo prevede di interrogare il grande fratello. Se Google ha indicizzato la sitemap la puoi trovare usando alcune combinazioni di operatori di ricerca, ad esempio digitando in Google:
filetype:xml site:esempio.com inurl:sitemap
5. Google Search Console
Nel caso avessi accesso al profilo del sito web in Google Search Console, potresti dare un occhio alla sezione Sitemap, magari qualcuno l’ha inserita prima di te.
Hai altri metodi da consigliare? Lascia un commento e verrà inserito nella guida!
Commenti |6
Lascia un commentoIn quanti lasciano inalterato il nome della sitemap in… sitemap? Penso un po’ tutti, come me d’altronde, troppo pigro per cambiarlo, alla fine il terzo metodo di ricerca funzionerà comunque.
Io però credo che il secondo almeno da la sicurezza sul nome della sitemap.
Il terzo è il primo funzionano se non la si è inviata in formato tar.gz ma comunque c’è sempre un file xml che la identifica.
Un altro modo potrebbe essere quello di realizzare la ricerca su un altro motore come Yahoo! e/o Bing. Se Google non indicizza il sito non è detto che non lo faccia un altro motore, solo non ne conosco i comandi. (Mia moglie sta ancora con me perché come nerd faccio schifo :-D ).
M.
Ciao Marco, grazie per il commento! :D
Articolo letto con molta attenzione e molto interessante.
Il mio problema è con un sito di cartomanzia: non riesco a far leggere la sitemap.xml, utilizzando il plugin rankmath restituisce sempre l’errore “impossibile leggere”. Sapete darmi qualche consiglio? Grazie.
Ciao Claudio, il problema con la tua sitemap.xml è che ha uno status code 404.
Per correggere il problema potresti provare a:
1 cancellare la cache ed evitare che la sitemap.xml venga messa in cache da qualche plugin.
2 ri-salvare le impostazioni dei permalink in WordPress (Settings > Permalinks)
Giovanni Sacheli è per me il top SEO d’Italia. A ogni domanda problema o dubbio sa sempre darti la soluzione. Sempre super complimenti!
Ciao Matteo, grazie mille ma non esagerare ;)