
Credo che non sia mai stato tanto in voga come in questi mesi il link pruning, ovvero l’analisi dei links in entrata, l’individuazione di quelli pericolosi e l’eventuale rimozione. Tutti temono penalizzazioni da parte di Google Penguin e le agenzie di web marketing offrono specifici servizi SEO per risolvere nel modo meno doloroso possibile questo genere di problemi.
Vediamo nel dettaglio cosa significa fare Link Pruning. Quali sono i dettagli più importanti da analizzare? Quali strumenti si utilizzano e soprattutto come si riparano gli errori? In questo articolo cercherò di mostrarvi la strada migliore per correggere le penalizzazioni da parte di Google Penguin.
1) Il processo di Link Pruning
2) Cosa si deve analizzare dei link in ingresso o backlinks?
- La qualità dei siti che ci forniscono il o i link, ovvero la “Domain Authority“. Siti con DA inferiore a 30 sono da considerarsi di bassa autorità e/o qualità ed eventuali link provenienti da questi siti andrebbero rimossi oppure “taggati” nofollow.
- Il “PageRank” dei domini che hanno un link verso il nostro sito. Siti con PR inferiore a 3 sono da considerarsi di bassa autorità e/o qualità ed eventuali link andrebbero rimossi oppure “taggati” nofollow.
- Le tematiche trattate nei vari siti dai quali parte il link e nello specifico nei testi attorno al link. I siti devono trattare argomenti attinenti o correlati al sito di destinazione e il link deve essere contestualizzato da testo descrittivo per dargli il massimo valore
- Le anchor text utilizzate dovrebbero essere per lo più brand o navigazionali e in minor parte transazionali*. Eccessivi link transazionali potrebbero causare una penalizzazione da parte di Google per la parola chiave utilizzata nell’anchor text. Di seguito troverete il grafico con la distribuzione ottimale del backlinks.
- Come conseguenza del punto appena analizzato sarebbe buona norma verificare che la pagina più linkata del nostro sito sia la homepage e non una pagina di prodotto/servizio.
*Esempi di Anchor text:
- Anchor text Brand: “EVE Milano” (contiene il nome del marchio oppure l’URL)
- Anchor text Navigazionale: ”Web Marketing EVE Milano” (contiene una parola chiave più il nome del marchio)
- Anchor text Transazionale: ”Consulenza SEO”, “Servizi SEO”, “Creazione siti web”, etc (contiene soltanto la parola chiave del servizio o prodotto venduto)

3) Quali tools utilizzare
Ci tengo a precisare che ad oggi non esiste il Sacro Graal dell’analisi dei backlinks, ogni strumento ha un suo indice che genera con spider propri e caratteristiche differenti. Gli indici non coincidono mai al 100% e proprio per questa diversità è consigliabile non affidarsi ad un solo strumento, quanto invece unire più database scaricati da strumenti differenti per avere un quadro della situazione il più completo possibile.

Google Webmastertools è sicuramente la fonte più consistente ed affidabile per quanto riguarda la quantità di link forniti, tuttavia ha molte carenze per quanto riguarda la classificazione dei link forniti.
GWMT fornisce un elenco di backlink ma non ci indica se siano buoni o cattivi, non indica la qualità dei siti di origine e altre importanti informazioni. Inoltre le anchor text vengono mostrate in una visualizzazione a parte ma senza il dettaglio dell’url che li fornisce… Si sa, Google rilascia informazioni a spizzichi e bocconi :)
Tramite il menu laterale di G-WMT potete scaricare i dati relativi ai backlink cliccando sulla voce “Traffico –> Link che rimandano al tuo sito”. In questa pagina ci sono tre sezioni importanti: “Chi utilizza più link”, “I tuoi contenuti con più link” e “Come sono collegati i tuoi dati”.
Espandendo la voce “Chi utilizza più link” potrete controllare quale sito vi sta fornendo il maggior numero di link in ingresso. Da questa visuale è facile capire se avete firme nei footer o sidebar di qualche sito poichè genererebbero molti link dallo stesso url. Considerate che generalmete avere molti link da pochi siti è peggio che avere un link solo per molti siti diversi.
La sezione ”I tuoi contenuti con più link” mostra quali pagine del sito ricevono più link. La homepage dovrebbe essere la prima pagina nella lista ma non l’unica!
Nella sezione “Come sono collegati i tuoi dati” si possono controllare gli Anchor Text dei backlinks. La cosa più importante da analizzare è l’eventuale presenza di troppi Anchor Text transazionali che andrebbero rimossi o cambiati in navigazionali. La schermata non ci dice da quali domini partono quelle Anchor Text ma confrontando i dati con la prima tabella ”Chi utilizza più link” è facile fare un paragone numerico ed individuare il colpevole.
Tutte e tre le sezioni sono scaricabili tramite file .csv per essere analizzate nel dettaglio con Excel.

Opensiteexplorer è un tool di SEOmoz, rinomata firma SEO a livello internazionale, che permette di ottenere importanti informazioni sui link in ingresso al nostro sito scaricabili in un file .csv. Il dato forse più interessante fornito da Opensiteexplorer è la Domain Authority dei vari siti a noi collegati. La DA è un indice con range da 1 a 100 che rappresenta l’affidabilità, la fama e l’autorità di un dato sito. Il numero è calcolato in base alla quantità di link che il sito stesso riceve a sua volta.
Avere link da siti con alta Domain Authority è importante poichè quei link saranno quelli che ci passeranno maggior PageRank (se dofollow) ed importanza. Viceversa i link provenienti da siti con bassa DA hanno poco valore anzi, potrebbero anche causare problemi. Spesso rimuovere i link dai siti con bassa DA migliora il punteggio del nostro sito poichè alza la qualità media dei backlink.
Tramite questo tool è possibile studiare l’Anchor Text di ogni link, sapere se sono dofollow o nofollow, sapere quali sono le pagine del nostro sito più linkate e molto altro ancora. Tuttavia i dati non sono aggiornati in tempo reale ma resta comunque uno degli strumenti più validi ed in voga.
TIP: Spesso si utilizza Opensiteexplorer in accoppiata con Google Webmastertools per individuare eventuali siti SPAM collegati al nostro sito. Considerate l’esempio:
Il sito SPAM ha un link verso il nostro sito, il sito SPAM viene individuato da Google e penalizzato nonchè rimosso dal suo indice. Il sito SPAM essendo penalizzato abbassa la qualità del nostro sito a causa del link che ha verso di noi. Google Webmastertools non mostrerà il sito SPAM nella tabella “Chi utilizza più link” poichè quel sito è stato rimosso dal suo indice. Noi veniamo penalizzati e non sappiamo a causa di chi. A questo punto si confrontano i dati e se un sito è presente nel database di SEOmoz e non in quello di G-WMT probabilmente sarà un sito da controllare in modo approfondito per capire se potrebbe recarci danno.

Ahrefs è un tool relativamente nuovo ma che sta crescendo molto velocemente, non nego che è il mio preferito! Fornisce molti dati utili ed interessanti soprattutto per chi sta eseguendo operazioni di Link Pruning, infatti tramite la voce del menu “New” e “Lost” è possibile monitorare giorno per giorno i link guadagnati e quelli persi. Il loro spider non è ancora ai livelli di Opensiteexplorer ma resta comunque uno strumento molto interessante da affiancare a quelli già citati.
Altro punto forte di Ahrefs sono i grafici che possono tornare utili nei vari report per i clienti. Tramite un account gratuito potrete salvare alcuni siti dopo averli verificati tramite l’upload di un piccolo file sul server FTP. Dopo la verifica si possono vedere report dettagliati sulle caratteristiche dei backlink.
MajesticSEO è uno strumento di analisi dei backlink che permette di crearsi un report del proprio sito previa registrazione gratuita. Il tool è a pagamento per le funzionalità più avanzate e per avere i dati completi. Le funzionalità sono simili a quelle offerte da Opensiteexplorer ma utilizzando spider diversi i dati sono molto spesso differenti.
Anche MajesticSEO classifica i backlink con due particolari indici: Citation flow e Trust flow. Questi indici vengono così definiti:
- Citation flow is a Majestic SEO flow metric, which is weighted by the number citations to a given URL, or Domain.
- Trust flow is a Majestic SEO flow metric, which is weighted by the number of clicks from a seed set of trusted sites to a given URL, or Domain.
Questi indici servono a qualificare i vari siti che ci forniscono link per individuare quelli di bassa o alta qualità.
4) Come uscire da una penalizzazione di Google Penguin?
Essenzialmente sono due le cose da controllare: la distribuzione delle anchor text e la qualità dei link in ingresso. Google si aspetta un rapporto di anchor text a favore di quelli navigazionali e brand. Se la maggior parte dei link utilizza una anchor text troppo spinta (transazionale) potreste trovarvi penalizzati per la parola chiave presente nell’anchor text.
Con gli strumenti appena suggeriti dovreste essere in grado di individuare (se ci sono) link potenzialmente dannosi. Quando visitate una pagina che vi linka dovreste verificare il suo PageRank, la Domain/Page Page Authority, l’anchor text e la contestualizzazione del link. Se reputate che il link sia poco naturale o quella pagina non abbia niente a che fare con il vostro sito, forse lo pensa anche Google…
Una volta individuati i link di bassa qualità bisogna sporcarsi le mani, ovvero richiedere la rimozione ai vari admin dei siti oppure attivarsi internamente per risolvere il problema.
Per eliminare un link di cattiva qualità ci sono diverse opzioni:
- Rimuovere il link chiedendone semplicemente la rimozione al proprietario del sito via telefono, email, whois, etc.
- Richiedere al proprietario del sito l’aggiunta della tag nofollow al backlink
- Taggare la nostra pagina di destinazione con noindex (se possibile…)
- Usare il Disallow nel robots.txt sulla pagina di destinazione per impedire allo spider di leggerla e quindi evitare di ricevere la penalizzazione
- applicare alla pagina una regola di redirect 410
- applicare alla pagina una regola di redirect 404
Nel malaugurato caso in cui il link puntasse ad una pagina importante interna al nostro sito e che non può essere rimossa, si può duplicare tale pagina e spostare i link interni sulla nuova pagina, mentre lasciare i link inbound che puntano sulla vecchia. Sulla vecchia pagina orfana dovranno essere eliminati tutti i link interni e dovrà essere implementata la tag noindex oppure noindex/nofollow. Non usare mai il redirect 301 poiché passa le penalizzazioni e ricordarsi eventualmente di aggiornare i rel canonical.
Per chi facesse largo uso di backlink “site wide”, ovvero posizionati nel footer o nella sidebar che generano tanti backlink quante sono le pagine del sito partner, potrebbe tornare utile richiedere la modifica del link seguendo questo schema:

Ottimizzare la struttura dei backlink
In pratica invece che far puntare il link nel footer del sito partner direttamente al nostro, lo si fa puntare ad una pagina interna al sito partner, la pagina a sua volta avrà un unico link che punta al nostro sito. Il link dovrà avere una anchor text ben studiata poichè è un link importante. La pagina dedicata ricevendo molti link interni presumibilmente otterrà un buon PageRank, parte del quale verrà trasmesso dall’unico link on-page verso di noi.
Una volta terminata la pulizia di tutti i link pericolosi dovrete attendere 25/50 giorni affinché il pinguino passi di nuovo a trovare voi e chi vi linkava. Quando avrà aggiornato il suo database potrete confrontare i dati e nel caso abbiate risolto il problema il ranking delle parole chiave potrebbe migliorare. Queste attività sono relativamente veloci da eseguire su siti di piccole dimensioni ma aumentano esponenzialmente per siti “sostanzioni”.
Spero che queste informazioni vi siano state utili e nel caso abbiate commenti o domande non esitate ad usare i commenti e magari regalate un like all’articolo :)
Vuoi un software professionale per monitorare la posizione delle pagine del tuo sito nei motori di ricerca? Rank Tracker è la soluzione SEO più venduta. Acquista ora la tua copia!







E se i link nocivi puntano al dominio principale?
Ciao Cristian, quello che menzioni è il caso peggiore. Se i link maligni puntano alla homepage devi costruire nuovi backlink “ottimi” in grado di contrastare l’effetto di quelli negativi.
Da Bing puoi eliminare i link che non vuoi e a breve lo si potrà fare anche da G-WMT.
Tramite i siti con funzionalità WHOIS potresti cercare le email degli admin dei siti dai quali vuoi eliminare i backlinks se non sono segnalate sul sito stesso.
Good luck!
Ciao,
hai scritto davvero un bell’articolo. Ma c’è un punto che non mi convince, ovvero:
“Usare il Disallow nel robots.txt sulla pagina di destinazione per impedire allo spider di leggerla e quindi evitare che venga penalizzata”.
Poniamo che la pagina in questione riceva un sacco di link spam. Come risposta io dico al motore di non scaricarla (quindi non potrà nemmeno valutare se la pagina in questione ha a sua volta contenuti spam o meno): non ne vedo il vantaggio.
1) perchè rendo ancor più sospetta la situazione. Link spam e pagina non spiderizzabile. Gatta ci cova.
2) la pagina in questione continuerà ad essere indicizzata (infatti se riceve link esterni il robots gli fa un baffo: doveri stamparci sopra un bel noindex…) il che secondo me non attenua (o lo attenua di poco) il problema.
3) in ogni caso quella risorsa a quel punto ha due problemi: i link e il robots.
A questo punto preferisco un bel 404/410, che almeno salvo il contenuto (anche se dovrà ricominciare la sua faticosa storia su un’altra url nuova di zecca..) Oppure il disavow di recente sviluppo…
Ciao Emanuele, grazie per il commento!
Rispondo con ordine: bloccare una pagina col robots.txt o con la tag noindex (in teoria) è la stessa cosa. Bloccare una pagina che riceve link spam serve ad evitare che il sito riceva la penalizzazione dai siti che linkano a lui. Infatti un sito penalizzato spam che linka al sito X rischia di passare la penalizzazione assieme al link, indipendentemente se la pagina a sua volta contiene spam o meno. Bloccare la pagina di destinazione aiuta a proteggersi.
Il link disavow giustamente adesso è la soluzione a gran parte dei problemi e la via da percorrere per prima. In bocca al lupo!
Complimenti per l’articolo Giovanni!
Grazie Michele :)