Sapevi che il meta tag robots noindex può essere dichiarato anche attraverso l’intestazione HTTP senza inserire il meta robots nel codice HTML?

Cosa sono gli HTTP headers? Gli HTTP headers, intestazioni HTTP, trasmessi attraverso il protocollo HTTP, sono informazioni prodotte durante la comunicazione tra il browser del client che invia delle richieste e il server che le raccoglie e invia delle risorse in risposta.

L’intestazione X-Robots-Tag noindex può essere utilizzata come elemento della risposta dell’intestazione HTTP per un determinato URL. Le istruzioni utilizzabili in un meta tag robots possono essere specificate anche come X-Robots-Tag.

Di seguito è riportato un esempio di risposta HTTP con un’intestazione X-Robots-Tag che comunica a Googlebot di applicare nofollow su tutti i link in pagina. Metre otherbot non dovrà nemmeno indicizzare la pagina oltre a non seguire i suoi link.

Le istruzioni specificate senza user-agent sono valide per tutti i crawler.

HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
(…)
X-Robots-Tag: googlebot: nofollow
X-Robots-Tag: otherbot: noindex, nofollow
X-Robots-Tag: unavailable_after: 25 Jun 2010 15:00:00 PST
(…)

Tramite intestazione HTTP è impossibile inviare a Google diverse direttive disponibili con i tag meta robots, come ad esempio:

notranslate – non proporre la traduzione della pagina nei risultati di ricerca.
unavailable_after: [RFC-850 date/time] – Non mostrare questa pagina nei risultati di ricerca dopo la data/l’ora specificata. La data/l’ora deve essere specificata nel formato RFC 850.

Utilizzi?

Ti è mai capitato di dover impedire l’indicizzazione di tutti i file .pdf che hai sul webserver? Oppure le immagini… Ecco che torna utile usare le intestazioni HTTP X-Robots.

Come implementare l’intestazione X-Robots-Tag noindex per PDF

Nginx

Devi definire la cartella nel web server che contiene i pdf. Usa il comando location, e al suo interno inserisi il tag x-robots con le direttive che preferisci.

location ~ .*/(?:pdf)/.* {
    add_header X-Robots-Tag "noindex, follow" always;      
}

La riga deve essere aggiunta nel blocco di configurazione del sito web, di solito in /etc/nginx/sites-avalable/sito_web.

Se non hai una cartella specifica che contiene i pdf, puoi definire la tipologia di file.

location ~* \.(pdf|txt|log|xml|css|js)$ {
    add_header X-Robots-Tag noindex, nofollow;
}

Valuta cosa aggiungere nel tuo file di configurazione: non copiare e incollare lo script, magari ti serve solo il nofollow.

Apache

# Per aggiungere un'intestazione X-Robots-Tag di tipo noindex, 
# nofollow alla risposta HTTP per tutti i file .PDF del sito, 
# aggiungi il seguente snippet al file .htaccess o httpd.conf principale del sito:

<Files ~ "\.pdf$">
  Header set X-Robots-Tag "noindex, nofollow"
</Files>

# Puoi utilizzare l'intestazione X-Robots-Tag per i file 
# non HTML come i file immagine in cui non è possibile 
# utilizzare i meta tag robot. Di seguito è riportato 
# un esempio di aggiunta di un'istruzione X-Robots-Tag 
# di tipo noindex per tutti i file immagine (.png, .jpeg, .jpg, .gif) del sito:

<Files ~ "\.(png|jpe?g|gif)$">
  Header set X-Robots-Tag "noindex"
</Files>

Il supporto delle espressioni regolari consente un elevato livello di flessibilità.

Approfondimenti

Specifiche relative al meta tag robots e all’intestazione HTTP X-Robots-Tag

Articoli correlati

11 min lettura

Analisi tecnica del meta tag robots noindex per il controllo granulare dell'indicizzazione. Gestione strategica delle direttive follow e nofollow applicate a thank you page, aree riservate e pruning di contenuti a basso valore per ottimizzare il crawl budget.

06/05/2026, Giovanni Sacheli

98 mi piace

31 min lettura

La corretta gestione SEO di paginazioni e archivi richiede un approccio tecnico aggiornato dopo la deprecazione dei tag rel=next e rel=prev. Linee guida per sviluppatori su come strutturare elenchi numerati, ridurre i livelli di navigazione ed evitare errori critici di crawling.

06/05/2026, Giovanni Sacheli

38 mi piace

14 min lettura

L'analisi del rendering di un sito web da parte di Googlebot è essenziale per diagnosticare criticità di indicizzazione. Metodi tecnici per verificare l'esecuzione di JavaScript e l'interpretazione del DOM, garantendo che il motore processi correttamente ogni singola pagina web.

06/05/2026, Giovanni Sacheli

38 mi piace

20 min lettura

Analisi tecnica degli HTTP status code e degli header server per la diagnostica SEO avanzata. Dalla classe 1xx ai codici 5xx, come interpretare le risposte HTTP di successo o errore per risolvere anomalie di scansione e ottimizzare il crawl budget tramite log o Screaming Frog.

06/05/2026, Giovanni Sacheli

16 mi piace

11 min lettura

Analisi tecnica delle architetture in JavaScript e impatto sulla SEO. Confronto tra server-side rendering (SSR) e client-side rendering (CSR) per ottimizzare il rendering budget, risolvere problemi di indicizzazione e bilanciare metriche vitali come FCP, TTI e TTFB.

06/05/2026, Giovanni Sacheli

16 mi piace

Autore

Giovanni Sacheli Consulente in Search Marketing @Eve Milano

Mi chiamo Giovanni Sacheli e dal 2009 aiuto le aziende a farsi trovare online. Sono specializzato in SEO tecnica e PPC, competenze che applico quotidianamente nella mia agenzia, Searcus Swiss Sagl. Mi piace sviluppare strumenti a supporto del mio lavoro, ho creato SEOdata.app e cluster.army e co-scritto il libro SEO Audit Avanzato. Curo maniacalmente questo blog per colleghi e appassionati, dove mi "appunto" quello che imparo. Sono un NERD anni '80, motociclista e orgoglioso papà di due bambini.

Link:
Giovanni Sacheli
SEO Audit Avanzato
Searcus Swiss Sagl
SEOdata.app
cluster.army

Guida tecnica 2026 ai crawler AI: tassonomia degli user-agent (GPTBot, ClaudeBot, Google-Extended…), quando bloccarli e quando lasciarli per farti citare, controllo via robots.txt ed enforcement lato server.

22/06/2026, Giovanni Sacheli

Configurare il file robots.txt secondo il Robot Exclusion Protocol permette di governare il traffico dei bot e ottimizzare il crawl budget. Analisi tecnica della sintassi e delle direttive di scansione, distinguendo il controllo del crawling dalle regole di indicizzazione noindex.

22/06/2026, Giovanni Sacheli

Proteggere i contenuti proprietari dal web scraping di OpenAI richiede la corretta configurazione del file robots.txt. Implementazione tecnica delle direttive Disallow per inibire in modo selettivo o globale l'accesso agli user-agent GPTBot e ChatGPT-User.

22/06/2026, Giovanni Sacheli

Walkthrough completo del tool Cloudflare isitagentready.com: i 18 standard tecnici verificati su robots.txt, MCP, OAuth, Web Bot Auth e protocolli di pagamento agentico.

27/05/2026, Giovanni Sacheli

Guida tecnica completa su come funzionano gli LLM: Transformer, attention, training, scaling laws, modelli moderni e implicazioni per SEO e AI Search.

27/05/2026, Giovanni Sacheli

Superare i limiti dei tool GUI analizzando i dati grezzi da riga di comando. Utilizza pipeline CLI con curl, jq e awk per ispezionare header HTTP, log server e catene di redirect, costruendo audit SEO tecnici riproducibili e output deterministici direttamente dal terminale.

27/05/2026, Giovanni Sacheli

Commenti |4

Lascia un commento

RobyGola 2 commenti

12/10/2015 alle 22:30

Grazie Giò, ottima anche la guida linkata in mezzo :)

Immagino non si possa implementare X-Robots in un server condiviso (shared hosting)?

Rispondi
1. Giovanni Sacheli 775 risposte
  
  15/10/2015 alle 10:40
  
  Dipende Roby, è abbastanza raro che su un hosting condiviso si dia accesso al file .htaccess ma alcuni lo permettono.
  
  Rispondi
Cris Pellecchia 2 commenti

07/05/2020 alle 14:55

Ciao Giovanni, è possibile utilizzare l’X-Robots Tag in file .htaccess per impedire l’indicizzazione di file html, come ad esempio, un’intera categoria di un sito o un’intera sezione blog?
Inoltre, è possibile utilizzare lo stesso Tag per impedire l’indicizzazione di una sola pagina di un sito web?

Grazie :)

Rispondi
1. Giovanni Sacheli 775 risposte
  
  07/05/2020 alle 23:15
  Ciao Cris, certo che si può, è anche indicato in questa guida sotto la sezione Apache. Devi solo cambiare .pdf con .html ed editare il file htaccess nella cartella che vuoi de-indicizzare.
```
<Files ~ "\.html$">
  Header set X-Robots-Tag "noindex, nofollow"
</Files>
```
  Se le pagine non hanno estensione .html dovrai usare le Regex.
  Per le singole pagine invece puoi elencare il path relativo di ciascuna pagina:
```
<Files mypage.html>
```
  Rispondi

Come funziona l’Intestazione HTTP X-Robots-Tag Noindex

Utilizzi?

Come implementare l’intestazione X-Robots-Tag noindex per PDF

Nginx

Apache

Approfondimenti

Articoli correlati

Autore

Commenti |4

Lascia un commento Annulla risposta

Ultimi articoli aggiornati

Richiedi un preventivo SEO e Google Ads

Vuoi ricevere un avviso al mese con le nuove guide pubblicate?

Utilizzi?

Come implementare l’intestazione X-Robots-Tag noindex per PDF

Nginx

Apache

Approfondimenti

Articoli correlati

Autore

Commenti |4

Lascia un commento Annulla risposta

Ultimi articoli aggiornati

Non perderti altri articoli