Quando inizio un SEO Audit di un sito web una delle prime cose che guardo sono quanti URL sono indicizzati in Google e confronto quel numero con il numero di URL che individuo con il mio spider (Screaming Frog oppure Website Auditor) e al numero di URL presenti nella Sitemap.xml (vedi la guida: Come calcolare e valutare l’indicizzazione di un sito web su Google).
La Sitemap.xml è un file appunto in formato XML che dovrebbe rispettare degli standard ben precisi, sia sulle sue modalità di compilazione, sia sulla location esatta dove andrebbe collocata. Tuttavia molti webmaster ignorano questi standard ed inseriscono la Sitemap.xml un po’ dove capita. Per approfondire leggi questo articolo che spiega come costruire una Sitemap Perfetta.
[adsense]
4 modi per trovare la Sitemap.xml
- La Sitemap.xml dovrebbe risiedere nella root del web server: www.website.com/sitemap.xml, oppure sitemap.xml.gz se è stata compressa. Un sito con molte pagine potrebbe usare un indice di sitemap: www.website.com/sitemapindex.xml
- La Sitemap.xml dovrebbe essere linkata alla fine del file Robots.txt, il quale dovrebbe essere nella root: www.website.com/robots.txt

- Per trovare la Sitemap.xml puoi anche avvalerti di un paio di strumenti gratuiti come questo oppure con il nuovo arrivato URLsMatch.eu che è disponibile anche in italiano.
- L’ultimo metodo prevede di interrogare il grande fratello. Se Google ha indicizzato la sitemap la puoi trovare usando alcune combinazioni di operatori di ricerca, ad esempio digitando in Google: filetype:xml site:esempio.com inurl:sitemap

Hai altri metodi da consigliare? Lascia un commento e verrà inserito nella guida!
Marco Grazi
Ha contribuito con 3 commentiIn quanti lasciano inalterato il nome della sitemap in… sitemap? Penso un po’ tutti, come me d’altronde, troppo pigro per cambiarlo, alla fine il terzo metodo di ricerca funzionerà comunque.
Io però credo che il secondo almeno da la sicurezza sul nome della sitemap.
Il terzo è il primo funzionano se non la si è inviata in formato tar.gz ma comunque c’è sempre un file xml che la identifica.
Un altro modo potrebbe essere quello di realizzare la ricerca su un altro motore come Yahoo! e/o Bing. Se Google non indicizza il sito non è detto che non lo faccia un altro motore, solo non ne conosco i comandi. (Mia moglie sta ancora con me perché come nerd faccio schifo :-D ).
M.
Giovanni Sacheli
👽 725 risposteCiao Marco, grazie per il commento! :D
Roberto
Ha contribuito con 1 commentoArticolo letto con molta attenzione e molto interessante.
Il mio problema è con un sito di cartomanzia: non riesco a far leggere la sitemap.xml, utilizzando il plugin rankmath restituisce sempre l’errore “impossibile leggere”. Sapete darmi qualche consiglio? Grazie.
Giovanni Sacheli
👽 725 risposteCiao Claudio, il problema con la tua sitemap.xml è che ha uno status code 404.
Per correggere il problema potresti provare a:
1 cancellare la cache ed evitare che la sitemap.xml venga messa in cache da qualche plugin.
2 ri-salvare le impostazioni dei permalink in WordPress (Settings > Permalinks)
Matteo
Ha contribuito con 1 commentoGiovanni Sacheli è per me il top SEO d’Italia. A ogni domanda problema o dubbio sa sempre darti la soluzione. Sempre super complimenti!
Giovanni Sacheli
👽 725 risposteCiao Matteo, grazie mille ma non esagerare ;)