Skip to content

Un errore 404 è un codice di stato (HTTP Status Code in inglese) inviato dal web server al client (il browser ad esempio, o gli spider dei motori di ricerca) quando si richiede una risorsa che non esiste.

Trovare e correggere gli errori 404 nei link interni e backlink non serve soltanto a garantire una corretta navigazione dell’utente ma anche (e a volte soprattutto) a non perdere il “juice” proveniente dai link in uscita, ovvero quella piccola parte di PageRank proveniente dalla pagina di origine del collegamento, che viene persa in caso di errori 404.

Come dico spesso nei miei corsi SEO: “il 20% delle attività SEO sono quelle che portano l’80% dei risultati”. Credo che correggere gli errori 404 sia una attività molto importante che, tuttavia, viene spesso sottovalutata e tralasciata.

Gli errori 404 sono comuni nel web, Internet è in continua evoluzione, vengono creati ogni giorno nuovi contenuti e quelli vecchi a volte spariscono. Quando una pagina viene rimossa è normale trovare un errore 404. I motori di ricerca sono consapevoli di questo, ci sono errori 404 anche sui siti di Google. In realtà, è esattamente così che funziona il web, quando ci si libera di una pagina dal sito, è buona norma assicurarsi che il web server restituisca uno status code 404 o 410 (piuttosto che un “soft 404”).

Un soft 404 è quando un web server restituisce un codice di risposta diverso da 404 (o 410) per un URL che, in effetti, non esiste.
  • Un esempio comune è quando un proprietario di un sito vuole mostrare una pagina 404 con informazioni utili per i suoi utenti, e pensa che al fine di servire i contenuti agli utenti debba restituire un codice di risposta 200. Questo è un errore che ho trovato più volte durante gli audit SEO. È possibile (e dovresti) mostrare una pagina 404 custom, ma assicurati che lo status code sia 404.
  • Un altro esempio è quando si migra un sito web oppure per qualsiasi ragione si modifica la sua struttura di URL e, per pigrizia (o ignoranza), il webmaster reindirizza qualsiasi URL alla homepage, invece di mandare le pagine in 404 o meglio ancora redirezionare le pagine una a una. Per approfondimenti sulla corretta migrazione SEO di un sito web ti rimando a questa guida.

Entrambi questi casi possono avere effetti negativi sull’indicizzazione del tuo sito nei motori di ricerca, quindi il consiglio è quello di utilizzare gli status code per quello per cui sono stati inventati: il tuo web server deve restituire gli status code adeguati (404 o 410) per i contenuti inesistenti.

Ricordati che una pagina che dice “404 Not Found,” non significa in realtà che restituisca uno status code 404. Per verificare lo status code di una pagina web puoi usare questa estensione per Google Chrome, oppure la funzione Fetch as Google in Google Search Console.

Ricordati che se blocchi l’accesso alla pagina con il robots.txt, il crawler di Google non sarà in grado di leggere lo status code.

Gli errori 404 danneggiano il posizionamento?

Il posizionamento di un sito web può essere rovinato dagli errori 404? Google nel 2011 dichiarò che gli errori 404 non impattano sul ranking delle pagine con status code 200. In genere infatti gli errori 404 non creano problemi, ma ci sono casi in cui è consigliabile correggerli con delle redirezioni.

Ad esempio, quando un contenuto non viene rimosso ma spostato, allora è necessario fare una redirezione. Oppure se trovi un backlink che finisce in errore 404, generato da un URL errato (www.esempio.it/prodoti invece di www.esempio.it/prodotti). In questo caso è probabile che il webmaster abbia semplicemente sbagliato a digitare l’indirizzo. Invece di restituire un 404, si potrebbe reindirizzare con 301 l’URL errato all’URL corretto e acquisire il traffico previsto da quel collegamento (ed il PageRank). È anche consigliabile avere delle pagine 404 customizzate con informazioni utili a navigare il contenuto cercato, piuttosto che dire semplicemente “404 Not Found”.

In certi casi Google Search Console segnala errori 404 di cui non si capisce la provenienza. Possono essere pagine di una vecchia versione del sito web. oppure URL generati da plugin o temi di bassa qualità, i motivi possono essere moltissimi. Google non conosce l’importanza degli errori 404 del tuo sito web, quindi li segnala tutti a prescindere. Sei tu che devi valutare la necessità di redirezionare la pagina oppure mantenere lo status code 404.

Come trovare gli errori 404

Per trovare gli errori 404 si possono usare diversi strumenti SEO, i più accessibili sono sicuramente Google Search Console, Screaming Frog e Xenu.

Trovare errori 404 con Google Search Console

Per usare Google Search Console (GSC) ti serve ovviamente un sito verificato con GSC. Entra nel tuo pannello di controllo, naviga nella sezione “Salute” e poi clicca su “Errori di scansione”. A destra sono visualizzate alcune tab che contengono diverse tipologie di errori individuati da Googlebot. Gli errori 404 li trovi sotto il titolo “Non trovato”.

Trovare Errori 404

Tutti gli errori sono elencati in una lista che puoi scaricare cliccando su “Download” ed analizzare successivamente con Excel. Ogni elemento i n riga se cliccato apre un pop-up con informazioni sulle sorgenti dei link rotti in modo da poter individuare e correggere l’errore.

Quando un errore 404 è generato da un backlink ti consiglio di redirezionarlo. Quando un errore 404 è generato da un link interno errato ti consiglio di correggere il puntamento del link verso la risorsa corretta.
Trovare Errori 404 non trovato

Io generalmente scarico il database da GSC e inizio a correggere i link 404 in ordine, segnando in GSC tutte le correzioni effettuate tramite l’apposito bottone “Segna come corretto”. GSC tuttavia non è il infallibile ed è sempre consigliabile eseguire test con altri strumenti, meglio con crawler in tempo reale.

Trovare errori 404 con Screaming Frog

Per trovare gli errori 404 con Screaming Frog esegui la scansione del sito e verifica gli status code. Per ogni link rotto puoi visualizzare nella tab sottostante “Inlinks” tutte le pagine che lo contengono. Per maggiori dettagli ti rimando alla guida completa in italiano.

Trovare errori 404 con Xenu

Xenu è un software gratuito (scaricalo qui) che permette di esegue scansioni di siti web per individuare link interni e backlink con errore 404 (e molto altro che non starò a spiegare in questo articolo).

Per eseguire la scansione esegui il programma e clicca sul menu “File” e poi su “Check URL”. Compila il primo spazio della maschera inserendo l’URL del sito da verificare, non dimenticare di iniziare l’URL con http:// e di mettere la slash finale “/”. Se vuoi verificare gli errori 404 anche su link esterni devi marcare la cella “Check external links” e cliccare su “Ok” per avviare la scansione degli errori 404.

Trovare Errori 404 con Xenu

Una volta terminata la scansione clicca su “View” e poi su “Show broken links only” per visualizzare soltanto gli errori 404 (evidenziati in colore ROSSO). Questo elenco può essere esportato in .csv e quindi analizzato con Excel.

Per sapere quali sono le pagine da correggere che contengono i link con errore 404 basta cliccare col tasto destro su uno qualsiasi dei link 404 (rossi) e selezionare la voce “URL properties”. Si aprirà una finestra con due box, in quello inferiore sono elencate la pagine che contengono il link 404.

Errori 404 Xenu
Clicca sull’immagine per ingrandirla

Come hai visto non è difficile individuare gli errori 404, serve soltanto molta pazienza! Ricorda che ogni link 404 è un link inesistente e tutto il potenziale che potresti ricevere viene disperso nel nulla, preservare il flusso di juice verso il tuo sito web è sempre una buona pratica.

Come correggere gli errori 404

Errori 404


Gli errori 404 sono comuni a praticamente tutti i siti web, ma non tutti sono un male. Vediamo come distinguere un 404 da correggere da un 404 da lasciare tra quelli segnalati da Google Search Console.

Un errore 404 – not found è un errore comunicato dal web server al browser (o chi per esso) quando si richiede una risorsa che non esiste. Una risorsa che non esiste può essere richiesta per due motivi:

  1. la risorsa è stata cancellata o spostata
  2. il backlink è errato
  3. la risorsa non è mai esistita

I tre casi devono essere gestiti in modo differente, vediamo come risolverli.

La risorsa è stata cancellata o spostata

La pagina web o più in generale la risorsa richiesta potrebbe essere stata spostata verso un altro URL, oppure è stata semplicemente cancellata perché obsoleta o sbagliata.

Dato che la risorsa in passato “è esistita” è ragionevole pensare che sia stata indicizzata e perché no, abbia ottenuto autority via condivisione o backlink. Un’analisi dei backlink dell’URL richiesto ci toglierebbe ogni dubbio: usiamo Google Search Console – GSC, Majestic, Ahrefs o quello che preferisci per verificare.

Nel caso la risorsa ottenga authority è buona cosa redirezionare 301 il vecchio URL in 404 verso un nuovo URL. Per fare un buon lavoro la risorsa in 404 andrebbe redirezionata verso una risorsa sostitutiva o quantomeno simile.

Facendo una redirezione 301 salviamo il Link Juice che la risorsa aveva ottenuto nel tempo, che ora viene attribuita al nuovo URL (ripeto – purché sia simile, redirezionare tutto alla homepage avrebbe poco senso IMHO).

Capita che qualche distratto linki a nostre pagine sbagliando l’URL. Se il backlink proviene da una pagina valida e di qualità avrebbe senso correggerlo attraverso una redirezione 301 che punta alla risorsa corretta. Salviamo il PageRank proveniente da quel dominio, a noi non piace sprecare niente ;)

La risorsa non è mai esistita

Può capitare che GSC indichi errori 404 di cui non capiamo la provenienza, pagine che non conosciamo e non abbiamo mai creato.

Questi errori possono essere generati dall’indicizzazione di un sito precedente o di pagine dimostrative. A volte i webmaster lavorano su siti live, caricano template e creano il sito mentre Googlebot lo scansiona allegramente. Questa cattiva abitudine fa si che Googlebot indicizzi pagine che poi non esisteranno.

Hai presente un tema WordPress che contiene tutte le pagine dimostrative? Ecco, se carichiamo un tema su un sito live senza contenuti, è probabile che Google salvi qualche pagina che poi a sito terminato non esisterà più. Ecco la provenienza di questi strani 404 indicat in GSC.

Ha senso redirezionare queste risorse? A mio parere no. I 404 non sono il male assoluto, sono stati fatti apposta per indicare risorse che non esistono. Quando in GSC trovo errori 404 di questo tipo semplicemente li ignoro dato che sono pagine senza authority e senza contenuto di qualità. GSC dopo un pò di tempo (possono essere anche 12 mesi) toglierà quell’errore e non lo mostrerà più.

Inoltre – Proteggersi dalla Negative SEO

Nella mia carriera ho visto CMS proprietari e non solo, redirezionare in automatico tutti i 404 ricevuti. Questa cosa mi fa rizzare i 3 capelli che mi sono rimasti in testa, ogni santissima volta.

bambino-roger-rabbit

Cosa succederebbe se un competitor scorretto decidesse di fare negative SEO verso di noi? Una delle pratiche di negative SEO è quella di linkare un sito con ancore spam, da siti spam e verso URL spam, così da indurre Google a pensare che il nostro sito web non sia di qualità o addirittura sia pericoloso.

Se il CMS redireziona un backlink maligno che punta ad esempio a miosito.com/cialis, stiamo dicendo a Google e più in generale a tutti i motori di ricerca che quella pagina esiste. Infatti la catena di status code sarà: 301 e 200. 301 per la redirezione e 200 per la destinazione finale, che a questo punto verrà associata all’ancora spam del backlink spam.

Se invece il webserver rispondesse con un errore 404, i motori di ricerca non associerebbero il backlink spam al nostro sito web, il nostro sito web si proteggerebbe praticamente da solo.

Detto questo avrai capito quanto sia importante impostare il webserver affinchè gestisca correttamente gli errori 404.

Hai dubbi o domande? Lascia un commento.

Articoli correlati

Autore

Commenti |4

Lascia un commento Lascia un commento
  1. Raffaele 1 commento

    Ciao. Grazie per le utili info. Io mi sono approcciato Xenu ma ho un problema: non mi da la possibilità di esportare il file in .csv e quindi in excel. Come mai secondo te? ne selezionando da FILe “save as..” oppure “Export to TAB separated File” o altre opzioni su FILE.
    Mi sapresti dare una mano? grazie mille ciaoo
    Raffaele

    1. Giovanni Sacheli 754 risposte

      Ciao Raffaele, se vuoi aprire il file in Excel devi usare l’opzione “Export to TAB separated file”. Il file creato sarà utilizzabile con Excel.
      Una volta aperto il file in Excel dovrai usare la funzione “Text to Colums” (sotto a “Dati”) per formattare il file in colonne.
      That’s it!

  2. Giulio 1 commento

    Ottimo articolo Giovanni. Chiaro e primo in serp! Ti chiedo, circa un anno fa ho chiuso un sito ed ho importato degli articoli su un altro sito attuale.
    Ora, andando appunto a scansionare il nuovo sito con Xenu mi ritrovo un mixed content, cioè degli url che puntano al vecchio dominio. C’è un modo “massivo” per fare una sorta di rediretc?
    Grazie

    1. Giovanni Sacheli 754 risposte

      Ciao Giulio, per fare un cerca e sostituisci di massa devi fare una query mySQL nella tabella wp_posts. Se hai phpmyadmin lo fai ancora più facilmente.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Ultimi articoli aggiornati

Richiedi un preventivo SEO e Google Ads

Porta il tuo sito web al livello successivo con l’expertise di EVE Milano. La nostra agenzia di Search Marketing ha ricevuto oltre 1126 richieste di preventivo, un segnale chiaro della fiducia che imprenditori e manager, come te, ripongono nella nostra specializzazione tecnica e verticale nella SEO e PPC. Se la tua organizzazione cerca competenze specifiche per emergere nei risultati di Google, noi siamo pronti a fornire quel valore aggiunto. Affidati alla nostra esperienza per fare la differenza.
Richiedi un preventivo

Non perderti altre guide, iscriviti per ricevere un avviso mensile con gli aggiornamenti del blog!

Iscriviti alla newsletter!

Informativa sui cookies

Noi e terze parti selezionate utilizziamo cookie o tecnologie simili per finalità tecniche e, con il tuo consenso, anche per le finalità di esperienza e misurazione come specificato nella cookie policy. Puoi liberamente prestare, rifiutare o revocare il tuo consenso, in qualsiasi momento, accedendo al pannello delle preferenze. Il rifiuto del consenso può rendere non disponibili le relative funzioni. Usa il pulsante “Accetta” per acconsentire. Usa il pulsante “Rifiuta” per continuare senza accettare.