Introduzione
Lo spam web si riferisce ad alcune tecniche che tentano di manipolare gli algoritmi di posizionamento dei motori di ricerca al fine di aumentare la posizione di alcune pagine nei risultati in SERP.
Nel migliore dei casi gli spammer incoraggiano gli utenti a visitare i loro siti web ottenendo guadagni pubblicitari immeritati. Nel peggiore dei casi, usano contenuti dannosi nelle loro pagine e provano a installare malware sul computer delle vittime.
3 macro tipologie di tecniche SPAM
Gli spammer utilizzano generalmente tre tipi di tecniche di per ottenere un posizionamento più alto nei risultati dei motori di ricerca. Queste tecniche sono classificate in:
- Tecniche SPAM basate sui link.
- URL spamming o “Spamdexing”: lo spamdex è la manipolazione deliberata degli indici dei motori di ricerca. Implica una serie di metodi, come la creazione di collegamenti e la ripetizione di frasi non correlate, per manipolare la pertinenza o la rilevanza delle risorse indicizzate, in modo incompatibile con lo scopo del sistema di indicizzazione.
- Ad esempio, in passato alcuni siti porno hanno indicizzato le loro pagine per parole che non avevano nulla a che fare con il porno, ricevendo quindi traffico aggiuntivo.
- Link spamming: altro noto sistema che include anche spamming delle ancore di testo. I motori di ricerca considerano non solo il numero di link spam, ma anche il testo di ancoraggio in quanto questo è uno dei segnali più importanti dal punto di vista del ranking. Questa tipologia include ovviamente anche l’inserimento di link di bassa qualità su pagine per aumentare il valore delle pagine linkate (forum, commenti, guestbook, ecc.) E ovviamente le tecniche di hack and drop più nefaste.
- URL spamming o “Spamdexing”: lo spamdex è la manipolazione deliberata degli indici dei motori di ricerca. Implica una serie di metodi, come la creazione di collegamenti e la ripetizione di frasi non correlate, per manipolare la pertinenza o la rilevanza delle risorse indicizzate, in modo incompatibile con lo scopo del sistema di indicizzazione.
- Tecniche SPAM di occultamento. Ad esempio, quando si utilizzano metodi generalmente non evidenti e visibili per migliorare il posizionamento di una pagina web. Questi aspetti sono certamente più problematici e i motori di ricerca tendono a trattarli con maggiore attenzione.
- Nascondere contenuto: si tratta di tecniche obsolete in cui parole chiave e collegamenti sono nascosti quando il browser esegue il rendering di una pagina. Gli approcci più comuni utilizzano combinazioni di colori che rendono gli elementi in questione invisibili agli utenti meno esperti.
- Cloaking: il cloaking è quando si identifica un crawler del motore di ricerca e si cerca di mostrare allo spider una versione diversa della pagina rispetto a quella fornita all’utente finale.
- Reindirizzamento: la pagina viene automaticamente reindirizzata quando il visitatore è un utente ma non per gli spider dei motori di ricerca.
- Tecniche SPAM basate sul contenuto
- Term spamming: coloro che cercano di manipolare elementi come la pagina tag title, meta description o meta keywords. Come molti di noi sanno, due su tre di questi tag sono stati abusati al punto che la maggior parte dei moderni motori di ricerca non li usa affatto come segnali di ranking.
Web SPAM Taxonomy
Per Google è importante mostrare solo risultati di qualità per non perdere la fiducia dei suoi utenti (che cliccano anche gli annunci pubblicitari). Per questo motivo, per combattere il problema crescente dello spam, Google ha creato un team dedicato. Il capo (e portavoce) di questa squadra era un gentiluomo di nome Matt Cutts (ora non più dipendente di Google).
Le pagine spam esistenti destano sfiducia nei risultati dei motori di ricerca. Questo non solo fa perdere tempo ai visitatori, ma spreca anche molte risorse dei motori di ricerca. Pertanto, sono stati proposti metodi di rilevamento dello spam come soluzione al fine di ridurre gli effetti negativi di queste pagine, alcune di queste tecniche stanno funzionando bene.
Il documento Web Spam Taxonomy pubblicato nel 2004 da Zoltán Gyöngyi e Hector Garcia-Molina per la Stanford University, classifica le tecniche di spam web e i relativi metodi di rilevamento. Vediamo un paio di estratti dal testo originale:
… all types of actions intended to boost ranking, without improving the true value of a page, are considered spamming…
… any deliberate human action that is meant to trigger an unjustifiably favorable relevance or importance for some web page, considering the page’s true value…
Web Spam Taxonomy – March 14, 2004
Penso che possiamo essere tutti d’accordo: lo spam fa schifo! Chiunque usi il web sa quanto sia frustrante atterrare su una pagina che sembra promettente nei risultati di ricerca ma finisce per essere inutile quando la visiti.
Detto questo, ci sono un sacco di pagine web che non sono spam ma che lo sembrano. I professionisti notano subito queste cose, alla fine passiamo la vita navigando siti web e dopo un po’ l’occhio diventa esperto. Gli utenti normali potrebbero non notare gli stessi aspetti che considera Google (o un SEO). In questa breve guida cerco di riassumere quali fattori curare per evitare che le tue pagine web possano essere considerate spam (o di bassa qualità).
Sei un SEO? Allora sono sicuro che sai esattamente cosa dicono le Linee guida per i webmaster di Google sullo spam. Se stai solo giocando a fare il SEO, ecco la risposta rapida: non cercare di ingannare i motori di ricerca con testo nascosto, collegamenti nascosti, uso eccessivo di parole chiave, contenuti duplicati o pagine doorway.
Mentre leggi questo articolo, chiediti: “Io o qualcuno che lavora sul mio sito web ha mai utilizzato queste pratiche?”
Quali sono i segnali che rendono una pagina SPAM agli occhi di Google?
Testo o collegamenti nascosti
Sebbene sia una pratica vecchia come il cucù, c’è ancora qualcuno che nasconde testo e link nelle pagine HTML. Inutile dire quanto sia banale, inutile e pericolosa questa pratica.
Vuoi fregare Google? Sappi che ci sono milioni di spammer che ci provano tutti i giorni da quando Google è nato. Fidati, non avrai vita facile.
Reindirizzamenti subdoli
Meta redirect, redirezioni Javascript inattese, redirezioni tra domini, non sono cose che Google vede di buon occhio. Spostare l’utente dove vuoi tu (e non dove si aspettava di atterrare) non è corretto.
Eccesso di parole chiave
Inserire parole chiave seguendo una data “keyword density” non ha alcun senso, Google non considera la frequenza di una parola chiave per posizionare i tuoi risultati. Anzi, eccedere con un termine rende il testo poco naturale e poco leggibile, Google se ne accorge e di conseguenza la tua pagina non otterrà buoni risultati organici.
Anche questa pratica è molto vecchia e veniva usata con motori di ricerca molto meno avanzati di quanto lo sia oggi Google.
Abusare degli annunci PPC
Cercare di monetizzare un sito non è sbagliato, ma superare il limite del “ragionevole” invece sì, è sbagliato. Un sito con troppi banner è controproducente:
- Rende difficile per l’utente godersi il contenuto
- Rende il sito confusionario
- Rende il sito lento a caricare
- La pagina perde di trust agli occhi del lettore
Nella mia carriera ho visto molti siti web perdere traffico solo a causa di un eccesso di ads nelle pagine. Tolti gli annunci il sito riprendeva il traffico originario. Il segreto è trovare il giusto trade-off tra introiti e traffico.
Contenuto copiato
Copiare contenuti da altri siti non è mai stata una strategia lungimirante.
I contenuti copiati non si posizionano e a volte nemmeno vengono indicizzati. Perché Google dovrebbe dedicare tempo e risorse per indicizzare delle informazioni che ha già? Se i contenuti del tuo sito web sono copiati, Google etichetterà il sito web come low quality e difficilmente otterrà traffico organico.
Feed con annunci PPC
Attenzione a riempire il feed file RSS con troppi annunci, non è un segnale tanto positivo che trasmetti a Google.
Pagine doorway
Cos’è una pagina doorway? Le pagine doorway sono definite come pagine di bassa qualità (o gruppi di pagine o interi siti web) ottimizzate per posizionarsi per parole chiave specifiche che fungono da porta tra utenti e contenuti. Tipicamente, offrono poco valore ai visitatori e servono al solo scopo di posizionarsi su singole parole chiave.
Hai presente i siti web che hanno molte pagine di questo tipo:
- Siti web Milano
- Siti web Monza
- Siti web Varese
- Siti web Bergamo
- … tutte pagine uguali dove cambia solo il nome città…
… e l’agenzia magari è a Roma! Capisci che stanno cercando di fregare Google e gli utenti? Se cerco “siti web Pavia” è chiaro che cerco un’agenzia o un web master a Pavia! Bene, queste caxxate è meglio evitarle, anche per una questione di serietà e affidabilità.
Pagine generate automaticamente
In passato io e tanti altri colleghi abbiamo fatto test ed esperimenti cercando di posizionare siti web con contenuti totalmente generati automaticamente.
Sapete cosa è successo?
Niente.
Magari per qualche giorno i siti web ricevono traffico, magari ne ricevono anche volumi importanti, ma appena gli algoritmi di Google finiscono le loro analisi il traffico organico verso il sito web crolla.
Il tempo è denaro? Allora evita di perdere tempo con queste attività, sono anni che si prova senza grande successo ed in futuro sarà sempre più difficile.
Pagine di ricerca false con annunci PPC
Ci sono e ci sono stati molti portali con pagine generate automaticamente, ad esempio facendo indicizzare le ricerche degli utenti ed inserendo nei risultati tonnellate di annunci. Le pagine senza contenuto o senza qualità non valgono nulla agli occhi di Google e abbassano la qualità globale del sito web. Google è sempre più bravo a scovare questi trucchi.
Blog falsi con annunci PP
A volte vedo ancora blog pieni di contenuti copiati o low quality creati con il solo intento di riempirli di annunci. Pensate che i proprietari siano diventati ricchi? Probabilmente se avessero dedicato quel tempo a fare qualcosa di costruttivo e qualitativo oggi starebbero meglio, sia dentro che fuori.
Siti web che usano l’hotlinking sulle immagini
Avevo descritto 6 anni fa cosa fosse l’hotlinking delle immagini e come proteggersi. Oggi ci sono ancora siti web che “rubano” immagini ad altri siti con la speranza di fare traffico da Google Images. Questa pratica oltre a non essere corretta non porta nemmeno risultati. Rischiate solo di fare incazzare il proprietario del sito a cui rubate le immagini.
Se il webmaster a cui rubate fosse scaltro, potrebbe anche sostituire automaticamente le immagini che prendete con altre… I furbi capiscano, gli stolti sorvolino.
Pagine vuote
Partiamo dal concetto che per Google una pagina vuota vale zero.
In una serie di numeri, uno zero abbassa la media, concordi?
Se il tuo sito ha due pagine, una vuota che vale zero, e una eccellente che vale 10, il sito globalmente vale 5.
Togli la pagina vuota ed il sito vale 10.
Concetto tanto semplice quanto ignorato.
Domini parcheggiati
Acquistare domini scaduti che hanno backlink e redirezionare verso il tuo sito primario pensi sia una genialata? In rari casi ha funzionato, in passato.
Oggi rischi di buttare i soldi che spendi per l’acquisto del dominio. Tieni presente che la maggior parte dei SEO che conosco ritiene che:
- l’acquisto di un dominio scaduto
- la modifica simultanea di hosting, WHOIS, DNS
- impostazione di un 301
- un cambio radicale nelle finalità del sito web
resettano il valore SEO del dominio e io sono pienamente d’accordo con loro. Non prenderei in considerazione l’acquisto di un dominio scaduto come una soluzione immediata a qualsiasi problema di posizionamento.
Un sito senza canali social e senza contatti
Quando entro in un sito e non trovo riferimenti alla società, alla sede, l’indirizzo, il telefono, ai social… Magari trovo solo una mail di uno dei tanti servizi gratuiti (vedi gmail)… Allora mi sorgono molti dubbi. Se non vuoi farti trovare non trasmetti fiducia.
Conclusione
Come abbiamo visto lo spam è uno dei peggiori nemici di Google e degli utenti. Google investe ogni anno molti soldi nella lotta allo spam e negli ultimi 10 anni ha fanno passi da gigante. I suoi algoritmi ora sono in grado di individuare automaticamente contenuti spam con molta più precisione rispetto a quanto facesse in passato.
Quindi, se nonostante tutti gli avvertimenti tu volessi iniziare una carriera da spammer, devi essere davvero bravo, altrimenti rischi di perdere molto tempo e soldi.