Link pruning: analizzare e correggere i link in ingresso (backlinks)

Ultimo aggiornamento: Gennaio 2014

Indice

1. Il processo di Link Pruning
2. Cosa si deve analizzare dei link in ingresso o backlink?
3. Come Classificare gli Anchor Text
4. Quali tools utilizzare
5. Come uscire da una penalizzazione di Google Penguin?
6. Per eliminare un link di cattiva qualità ci sono diverse opzioni
7. Infografica


Credo che non sia mai stato tanto in voga come in questi mesi il link pruning, ovvero l’analisi dei link in entrata, l’individuazione di quelli pericolosi e l’eventuale rimozione. Tutti temono penalizzazioni da parte di Google Penguin e le agenzie di web marketing offrono specifici servizi SEO per risolvere nel modo meno doloroso possibile questo genere di problemi.

Vediamo nel dettaglio cosa significa fare Link Pruning. Quali sono i dettagli più importanti da analizzare? Quali strumenti si utilizzano e soprattutto come si riparano gli errori? In questo articolo cercherò di mostrarvi la strada migliore per correggere le penalizzazioni da parte di Google Penguin.

1. Il processo di Link Pruning


Il processo di link pruning serve ad analizzare tutti i link in ingresso al nostro sito, identificare eventuali situazioni attaccabili da Google Penguin e correggerli nel modo migliore. Per chi non conoscesse lo zoo di Google invito la lettura di un mio precedente articolo nel quale spiegavo le differenze tra Google Panda e Penguin.

2. Cosa si deve analizzare dei link in ingresso o backlink?


Più che la quantità è importante la qualità dei link. Attraverso diversi strumenti si deve analizzare:

  • La qualità dei siti che ci forniscono il o i link, ovvero la “Domain Authority“. Siti con DA inferiore a 30 non tematici sono da considerarsi di bassa autorità e/o qualità ed eventuali link provenienti da questi siti andrebbero valutati attentamente, rimossi oppure “taggati” nofollow.
  • Il “PageRank” dei domini che hanno un link verso il nostro sito. Siti con PR inferiore a 3 non tematici sono da considerarsi di bassa autorità e/o qualità ed eventuali link andrebbero valutati attentamente, rimossi oppure “taggati” nofollow.
  • Le tematiche trattate nei vari siti dai quali parte il link e nello specifico nei testi attorno al link. I siti devono trattare argomenti attinenti o correlati al sito di destinazione e il link deve essere contestualizzato da testo descrittivo per dargli il massimo valore
  • Le anchor text utilizzate dovrebbero essere per lo più brand o navigazionali e in minor parte transazionali*. Eccessivi link transazionali potrebbero causare una penalizzazione da parte di Google per la parola chiave utilizzata nell’anchor text. Di seguito troverete il grafico con la distribuzione ottimale del backlink. I valori sono indicativi, il senso del grafico è avvertire sulla pericolosità di profili molto spinti su anchor text transazionali.
  • Come conseguenza del punto appena analizzato sarebbe buona norma verificare che la pagina più linkata del nostro sito sia la homepage e non una pagina di prodotto/servizio.


3. Come Classificare gli Anchor Text

  • Anchor text Brand: EVE Milano“, “www.evemilano.com” (contiene il nome del marchio oppure l’URL)
  • Anchor text Navigazionale: “Clicca qui” (contiene una parola chiave generica)
  • Anchor text Transazionale: “Consulenza SEO”, “Servizi SEO”, “Creazione siti web”, etc (contiene soltanto la parola chiave del servizio o prodotto venduto)

Distribuzione ideale anchor text

Distribuzione ideale anchor text



4. Quali tools utilizzare


Ci tengo a precisare che ad oggi non esiste il Sacro Graal dell’analisi dei backlink, ogni strumento ha un suo indice che genera con spider propri e caratteristiche differenti. Gli indici non coincidono mai al 100% e proprio per questa diversità è consigliabile non affidarsi ad un solo strumento, quanto invece unire più database scaricati da strumenti differenti per avere un quadro della situazione il più completo possibile.

Google Webmastertools

Google Webmastertools è sicuramente la fonte più consistente ed affidabile per quanto riguarda la quantità di link forniti, tuttavia ha molte carenze per quanto riguarda la classificazione dei link forniti.

GWMT fornisce un elenco di backlink ma non ci indica se siano buoni o cattivi, non  indica la qualità dei siti di origine e altre importanti informazioni. Inoltre le anchor text vengono mostrate in una visualizzazione a parte ma senza il dettaglio dell’url che li fornisce… Si sa, Google rilascia informazioni a spizzichi e bocconi :)

Tramite il menu laterale di G-WMT potete scaricare i dati relativi ai backlink cliccando sulla voce “Traffico –> Link che rimandano al tuo sito”. In questa pagina ci sono tre sezioni importanti: “Chi utilizza più link”, “I tuoi contenuti con più link” e “Come sono collegati i tuoi dati”.

Espandendo la voce “Chi utilizza più link” potrete controllare quale sito vi sta fornendo il maggior numero di link in ingresso. Da questa visuale è facile capire se avete firme nei footer o sidebar di qualche sito poichè genererebbero molti link dallo stesso url. Considerate che generalmete avere molti link da pochi siti è peggio che avere un link solo per molti siti diversi.

La sezione “I tuoi contenuti con più link” mostra quali pagine del sito ricevono più link. La homepage dovrebbe essere la prima pagina nella lista ma non l’unica!

Nella sezione “Come sono collegati i tuoi dati” si possono controllare gli Anchor Text dei backlink. La cosa più importante da analizzare è l’eventuale presenza di troppi Anchor Text transazionali che andrebbero rimossi o cambiati in navigazionali. La schermata non ci dice da quali domini partono quelle Anchor Text ma confrontando i dati con la prima tabella “Chi utilizza più link” è facile fare un paragone numerico ed individuare il colpevole.

Tutte e tre le sezioni sono scaricabili tramite file .csv per essere analizzate nel dettaglio con Excel.

Open Site Explorer

Opensiteexplorer è un tool di SEOmoz, rinomata firma SEO a livello internazionale, che permette di ottenere importanti informazioni sui link in ingresso al nostro sito scaricabili in un file .csv. Il dato forse più interessante fornito da Opensiteexplorer è la Domain Authority dei vari siti a noi collegati. La DA è un indice con range da 1 a 100 che rappresenta l’affidabilità, la fama e l’autorità di un dato sito. Il numero è calcolato in base alla quantità di link che il sito stesso riceve a sua volta.

Avere link da siti con alta Domain Authority è importante poichè quei link saranno quelli che ci passeranno maggior PageRank (se dofollow) ed importanza. Viceversa i link provenienti da siti con bassa DA hanno poco valore anzi, potrebbero anche causare problemi. Spesso rimuovere i link dai siti con bassa DA migliora il punteggio del nostro sito poichè alza la qualità media dei backlink.

Tramite questo tool è possibile studiare l’Anchor Text di ogni link, sapere se sono dofollow o nofollow, sapere quali sono le pagine del nostro sito più linkate e molto altro ancora. Tuttavia i dati non sono aggiornati in tempo reale ma resta comunque uno degli strumenti più validi ed in voga.

TIP: Spesso si utilizza Opensiteexplorer in accoppiata con Google Webmastertools per individuare eventuali siti SPAM collegati al nostro sito. Considerate l’esempio:

Il sito SPAM ha un link verso il nostro sito, il sito SPAM viene individuato da Google e penalizzato nonchè rimosso dal suo indice. Il sito SPAM essendo penalizzato abbassa la qualità del nostro sito a causa del link che ha verso di noi. Google Webmastertools non mostrerà il sito SPAM nella tabella “Chi utilizza più link” poichè quel sito è stato rimosso dal suo indice. Noi veniamo penalizzati e non sappiamo a causa di chi. A questo punto si confrontano i dati e se un sito è presente nel database di SEOmoz e non in quello di G-WMT probabilmente sarà un sito da controllare in modo approfondito per capire se potrebbe recarci danno.

ahrefs

Ahrefs è un tool relativamente nuovo ma che sta crescendo molto velocemente, non nego che è il mio preferito! Fornisce molti dati utili ed interessanti soprattutto per chi sta eseguendo operazioni di Link Pruning, infatti tramite la voce del menu “New” e “Lost” è possibile monitorare giorno per giorno i link guadagnati e quelli persi. Il loro spider non è ancora ai livelli di Opensiteexplorer ma resta comunque uno strumento molto interessante da affiancare a quelli già citati.

Altro punto forte di Ahrefs sono i grafici che possono tornare utili nei vari report per i clienti. Tramite un account gratuito potrete salvare alcuni siti dopo averli verificati tramite l’upload di un piccolo file sul server FTP. Dopo la verifica si possono vedere report dettagliati sulle caratteristiche dei backlink.

majesticSEO
MajesticSEO è uno strumento di analisi dei backlink che permette di crearsi un report del proprio sito previa registrazione gratuita. Il tool è a pagamento per le funzionalità più avanzate e per avere i dati completi. Le funzionalità sono simili a quelle offerte da Opensiteexplorer ma utilizzando spider diversi i dati sono molto spesso differenti.

Anche MajesticSEO classifica i backlink con due particolari indici: Citation flow e Trust flow. Questi indici vengono così definiti:

  • Citation flow is a Majestic SEO flow metric, which is weighted by the number citations to a given URL, or Domain.
  • Trust flow is a Majestic SEO flow metric, which is weighted by the number of clicks from a seed set of trusted sites to a given URL, or Domain.

Questi indici servono a qualificare i vari siti che ci forniscono link per individuare quelli di bassa o alta qualità.

5. Come uscire da una penalizzazione di Google Penguin?


Essenzialmente sono due le cose da controllare: la distribuzione delle anchor text e la qualità dei link in ingresso. Google si aspetta un rapporto di anchor text a favore di quelli navigazionali e brand. Se la maggior parte dei link utilizza una anchor text troppo spinta (transazionale) potreste trovarvi penalizzati per la parola chiave presente nell’anchor text.

Con gli strumenti appena suggeriti dovreste essere in grado di individuare (se ci sono) link potenzialmente dannosi. Quando visitate una pagina che vi linka dovreste verificare il suo PageRank, la Domain/Page Page Authority, l’anchor text e la contestualizzazione del link. Se reputate che il link sia poco naturale o quella pagina non abbia niente a che fare con il vostro sito, forse lo pensa anche Google…

Una volta individuati i link di bassa qualità bisogna sporcarsi le mani, ovvero richiedere la rimozione ai vari admin dei siti oppure attivarsi internamente per risolvere il problema.

6. Per eliminare un link di cattiva qualità ci sono diverse opzioni


Il Link Graph è il database di Google dove vengono memorizzati i collegamenti (link) tra una risorsa e l’altra. Immaginiamo graficamente ogni risorsa come un nodo e i link come una freccia che connette i nodi. Quando Google decide di penalizzare un sito perchè riceve link cattivi (non conformi alle linee guida di Google Webmaster) vuol dire che quei link portano qualcosa al sito che lo aiuta ad aumentare la visibilità nei risultati di ricerca. L’obiettivo è individuare la connessione, ovvero il link negativo, e rimuoverla.

Per uscire dalla penalizzazione bisogna rimuovere la connessione negativa e ci sono diversi metodi per ottenere questo risultato:

  • Usare il Disavow Tools di Google Webmastertools per chiedere a Google di ignorare quei link
  • Rimuovere il link chiedendone semplicemente la rimozione al proprietario del sito via whois, telefono, email, etc.
  • Richiedere al proprietario del sito l’aggiunta della tag nofollow al backlink incriminato
  • Taggare la nostra pagina di destinazione con noindex (se possibile…)
  • Usare il Disallow nel robots.txt sulla pagina di destinazione per impedire allo spider di leggerla e quindi evitare di ricevere la penalizzazione
  • far rispondere alle pagine incriminate con uno status code HTTP 404 oppure 410, in questo caso il nodo verrà cancellato dal Link Graph

Nel malaugurato caso in cui il link puntasse ad una pagina importante interna al nostro sito e che non può essere rimossa, si può duplicare tale pagina e spostare i link interni sulla nuova pagina, mentre lasciare i link inbound che puntano sulla vecchia. Sulla vecchia pagina orfana dovranno essere eliminati tutti i link interni e dovrà essere implementata la tag noindex oppure noindex/nofollow. Non usare mai il redirect 301 poiché passa le penalizzazioni e ricordarsi eventualmente di aggiornare i rel canonical.

Per chi facesse largo uso di backlink “site wide”, ovvero posizionati nel footer o nella sidebar che generano tanti backlink quante sono le pagine del sito partner, potrebbe tornare utile richiedere la modifica del link seguendo questo schema:

Ottimizzare la struttura dei backlink

Ottimizzare la struttura dei backlink

In pratica invece che far puntare il link nel footer del sito partner direttamente al nostro, lo si fa puntare ad una pagina interna al sito partner, la pagina a sua volta avrà un unico link che punta al nostro sito. Il link dovrà avere una anchor text ben studiata poichè è un link importante. La pagina dedicata ricevendo molti link interni presumibilmente otterrà un buon PageRank, parte del quale verrà trasmesso dall’unico link on-page verso di noi.

Una volta terminata la pulizia di tutti i link pericolosi dovrete attendere 30/60 giorni affinché il pinguino passi di nuovo a trovare voi e chi vi linkava. Quando avrà aggiornato il Link Graph potrete confrontare i dati e nel caso abbiate risolto il problema il ranking delle parole chiave potrebbe migliorare e di conseguenza anche le visite organiche. Queste analisi dettagliate dei backlink sono relativamente veloci da eseguire su siti di piccole dimensioni mentre per siti “sostanziosi” le ore di lavoro necessarie aumentano esponenzialmente.

Spero che queste informazioni vi siano state utili e nel caso abbiate commenti o domande non esitate ad usare i commenti e magari regalate un like all’articolo :)

7. Infografica


Google Backlink Factors

Comments

  1. says

    Ciao Cristian, quello che menzioni è il caso peggiore. Se i link maligni puntano alla homepage devi costruire nuovi backlink “ottimi” in grado di contrastare l’effetto di quelli negativi.
    Da Bing puoi eliminare i link che non vuoi e a breve lo si potrà fare anche da G-WMT.
    Tramite i siti con funzionalità WHOIS potresti cercare le email degli admin dei siti dai quali vuoi eliminare i backlinks se non sono segnalate sul sito stesso.

    Good luck!

  2. says

    Ciao,
    hai scritto davvero un bell’articolo. Ma c’è un punto che non mi convince, ovvero:

    “Usare il Disallow nel robots.txt sulla pagina di destinazione per impedire allo spider di leggerla e quindi evitare che venga penalizzata”.

    Poniamo che la pagina in questione riceva un sacco di link spam. Come risposta io dico al motore di non scaricarla (quindi non potrà nemmeno valutare se la pagina in questione ha a sua volta contenuti spam o meno): non ne vedo il vantaggio.

    1) perchè rendo ancor più sospetta la situazione. Link spam e pagina non spiderizzabile. Gatta ci cova.
    2) la pagina in questione continuerà ad essere indicizzata (infatti se riceve link esterni il robots gli fa un baffo: doveri stamparci sopra un bel noindex…) il che secondo me non attenua (o lo attenua di poco) il problema.
    3) in ogni caso quella risorsa a quel punto ha due problemi: i link e il robots.

    A questo punto preferisco un bel 404/410, che almeno salvo il contenuto (anche se dovrà ricominciare la sua faticosa storia su un’altra url nuova di zecca..) Oppure il disavow di recente sviluppo…

  3. says

    Ciao Emanuele, grazie per il commento!
    Rispondo con ordine: bloccare una pagina col robots.txt impedisce al bot di leggerla, la tag noindex dice al bot di non indicizzarla, il robots è in teoria più forte e per eliminare una pagina che ha ricevuto una penalizzazione risulta essere una buona soluzione.
    Bloccare una pagina che riceve link spam serve ad evitare che il sito riceva la penalizzazione. Infatti un sito penalizzato spam che linka al sito X rischia di passare la penalizzazione assieme al link, indipendentemente se la pagina a sua volta contiene spam o meno. Bloccare la pagina di destinazione aiuta a proteggersi.

    Il link disavow giustamente adesso è la soluzione a gran parte dei problemi e la via da percorrere per prima. In bocca al lupo!

  4. says

    Che sei appassionato di ottimizzazione onpage si vede dalla cura del tuo articolo, complimenti. una domanda : spesso noto esempi di colleghi che posizionano vari siti con centinaia di link spam autogenerati. questi backlink però, se li cerchi in ogni tool compreso swm non vengono visualizzati ( almeno io nn li ho mai trovati). esistono a tuo avviso tool o metodi che consentono di verificare la presenza di questi link in ingresso ? ciao e buon lavoro

    • says

      Ciao Roberto, grazie per i complimenti :) In risposta alla tua domanda posso dire che i crawler per backlinks, come majestic, ahrefs, moz e google/bing webmaster tools difficilmente trovano gli stessi risultati. Per eseguire una analisi approfondita io unisco i database di tutti questi tool (e se necessario altri ancora) e con excel pulisco il database finale.
      Basarsi su uno strumento limita la quantità di dati da analizzare, ad ogni modo i siti di bassa qualità o addirittura spam possono benissimo venire snobbati da molti cralwer, quindi quello che dici è abbastanza normale. A presto!

Lascia un Commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *

È possibile utilizzare questi tag ed attributi XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">