Skip to content

Oggi mi hanno chiesto cos’è la LSI. Il concetto di LSI è storicamente legato al concetto di indicizzazione dei dati.

Come funziona l’indicizzazione dei motori di ricerca (in brevissimo)

LSI è una tecnica di NLP – Natural Language Processing, che comprende la manipolazione automatica del linguaggio naturale, come la parola e il testo, da parte di un software.

In passato la LSI veniva usata per la ricerca interna ad archivi e database. Quando un utente cercava una parola, il motore di ricerca controllava nel suo indice la presenza di documenti che contenevano quella data parola. Un documento poteva contenere il termine o non contenerlo. Tutti i documenti che non includevano il termine venivano accantonati mentre i documenti che contenevano il termine venivano passati ad un sistema che li ordinava (ranking). Ogni documento era indipendente dagli altri, non erano calcolate correlazioni tra più documenti e venivano valutati soltanto per i loro contenuti.

Cos’è la Latent Semantic Indexing

La prima volta che si parlò di LSI fu il 1988. In quegli anni la tecnica di LSI migliorò il processo di indicizzazione dei documenti: oltre a registrare le parole contenute nel documento, questo metodo esamina vail contenuto a livello globale e cercava di trovare altri documenti che contenevano insiemi di parole in comune.

La LSI considera due documenti semanticamente vicini se hanno molte parole chiave in comune, mentre li considera semanticamente distanti se hanno poche parole chiave in comune.

Quando si effettuava una ricerca in un database indicizzato con la tecnica LSI, il motore di ricerca restituiva il documento considerato il più vicino semanticamente parlano in risposta alla query.

Due documenti possono essere molto vicini semanticamente anche senza avere termini in comune, la LSI non necessita infatti una corrispondenza esatta per poter trovare dei risultati utili, e a dirla tutta non serve nemmeno che capisca il significato dei termini.

Come abbiamo visto il concetto di LSI è tutt’altro che recente, venne infatti discusso per la prima volta intorno agli anni ’60 e il primo brevetto registrato risale al 1989. Latent Semantic Indexing (LSI) è un metodo di indicizzazione e Information retrieval che usa una tecnica matematica chiamata singular value decomposition (SVD) per identificare modelli nelle relazioni tra parole e concetti contenuti in un documento.

La LSI si basa sul principio che le parole usate nello stesso contesto tendono ad avere significati simili. Una caratteristica fondamentale della LSI è la capacità di estrarre il concetto espresso in un testo creando associazioni con i termini che occorrono in documenti che trattano contesti simili.

Lo studio della LSI ha dato origine negli anni a funzioni più evolute e complesse usate per indicizzare i documenti del web, una materia interessante in questo senso è, ad esempio, la probabilistic LSI.

Le teorie di LSI applicate ai motori di ricerca nel passato

La tecnica di LSI cerca di andare oltre il concetto di exact match, ovvero la corrispondenza esatta tra query e risultato, il modello crea associazioni per significati semantici, quindi anche tra termini diversi ma sinonimi o correlati.

In linea teorica: più termini rilevanti ed attinenti contiene un articolo e maggiore sarà il suo valore secondo le logiche LSI.
Sebbene la LSI non sia usata da Google per indicizzare i documenti del web, il concetto che sta alla base di questa funzione può aiutare a scrivere documenti più rilevanti grazie allo studio delle parole chiave semanticamente vicine all’argomento della pagina.

Non sottovalutare i termini sinonimi

LSI e parole chiave
LSI e parole chiave

In tutte le Strategie SEO si ha sempre dato molta importanza alla corretta scrittura del tag title e degli headings, H1 in particolare. Anche le alt tag, le parole in grassetto o in corsivo sono importanti ma non bastano per una SEO solida ed efficace. E’ molto importante a questo fine conoscere il funzionamento della LSI , in quanto può influenzare le parole chiave per le quali il tuo sito web è indicizzato.

Quando un contenuto contiene sinonimi rilevanti delle parole chiave usate nel tag title, i motori di ricerca tendono a valutare meglio la pagina rispetto a contenuti che non contengono sinonimi. Il motivo è semplice: il contenuto risulta più chiaro (evita possibili incomprensioni), completo ed attinente all’argomento. Utilizzare termini sinonimi aiuta i motori di ricerca ad individuare più precisamente l’argomento trattato ed aiuta il contenuto ad apparire più rilevante.

Vediamo un esempio molto semplice:

Documento 1

  • title tag: Apple
  • parole ricorrenti: apple, pear, apricot, strawberry, fruits

Documento 2

  • title tag: Apple
  • parole ricorrenti: Steve, iPhone, Mac, Jobs

Note: L’esempio preso è volutamente elementare per rendere semplice e comprensibile la teoria che sta dietro la tecnica di LSI. Ottimizzare testi complessi con parole chiave competitive è molto più difficile, richiede tempo e attenzione nella selezione dei termini correlati più adatti e nell’individuare le posizioni migliori per posizionare le parole chiave.

Prima considerazione:

Sebbene i titoli dei due documenti siano identici, la LSI aiuta i motori di ricerca a capire che i topic discussi sono in effetti molto diversi, nel primo caso si parla di apple come frutto, nel secondo come azienda. I termini correlati e sinonimi aiutano l’interpretazione dei contenuti al fine di evitare incomprensioni e per fornire i risultati più attinenti possibile.

Seconda considerazione:

Dati due contenuti che parlano di frutta, in particolare di mele, il contenuto che include sinonimi, termini alternativi, rilevanti e semanticamente rilevanti avranno un valore maggiore agli occhi di Google rispetto a contenuti poveri di questi elementi.

Come identificare termini correlati

Ricerche  Correlate
Ricerche Correlate

Latent Semantic Indexing non è una scienza, è semplice buon senso e buon uso delle parole attraverso l’analisi semantica. Ecco alcune semplici linee guida :

  • Se il titolo della pagina è “Impara ad andare in moto”, assicurati che il tuo articolo parli di moto :)
  • Non eccedere nell’uso delle stesse parole chiave nel contenuto, potrebbe sembrare keyword stuffing che i motori di ricerca non gradiscono…
  • Non usare mai strumenti automatici per lo spinning di articoli. I risultati sono molto spesso di bassa qualità e Google se ne accorge!
  • Se fai scrivere gli articoli per il tuo sito da società o copywriter esterni, assicurati che sappiano di cosa scrivono e che lo facciano a regola d’arte.
  • Controlla sempre Google Search Console per vedere quali parole chiave generano traffico prezioso per il tuo sito. Concentrati su quelle parole generando contenuti freschi ed interessanti (trovi queste info sotto il menu “Traffico di ricerca” e successivamente in “Query di ricerca”)
  • Fatti consigliare da Google le migliori parole chiave rilevanti: esegui una ricerca specifica e scorri alla fine della pagina dei risultati, vedrai un box chiamato “Ricerche correlate” che elenca alcune ricerche simili effettuate dagli utenti
  • Usa il Keyword Planner di AdWords per trovare idee e parole chiave attinenti al topic sul quale vuoi scrivere, e magari anche il mio tool per le parole chiave correlate
  • Usa un dizionario dei sinonimi :)
Le tecniche di Latent Semantic Indexing non sono un trucco per ingannare i motori di ricerca, quanto invece un metodo per migliorare la rilevanza dei contenuti tramite l’utilizzo di termini rilevanti.

Fonti e approfondimenti:

Articoli correlati

Autore

Commenti |2

Lascia un commento Lascia un commento
  1. Gualtiero Rodi 1 commento

    Ottimi spunti per spingere il copy all’analisi delle parole correlate. Oggi se uno dice LSI viene subito aggredito dai sapientoni. E’ scritto chiaramente nel tuo articolo che Google sia più evoluto di queste tecniche, ma è il concetto ad approfondire la semantica che è verissimo e altrettanto valido ai giorni nostri. Ripetere la stessa parole n volte è inutile, costruire un articolo che risponda a tutte le possibili domande dell’utente è invece un metodo vincente.

    Grazie e continua così!

    1. Giovanni Sacheli 752 risposte

      Eheheh hai ragione, un sacco di volte ho letto critiche a chi parla di LSI ma come ben sai nel web trovi anche chi crede che la terra sia piatta. A me interessa l’argomento e ne ho scritto con piacere e curiosità.

      Ci vuole occhio critico e un pizzico di cervello per leggere e capire le cose, tanti hanno il paraocchi e giudicano fermandosi al titolo (ah Facebook…).

      Come tu ben hai capito la guida non afferma che LSI sia usata da Google, ma è un argomento che aiuta a capire che strada seguire per creare contenuti migliori, aiuta a capire come estendere l’argomento, come arricchire di dettagli la pagina.

      A buon intenditor poche parole!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Ultimi articoli aggiornati

Richiedi un preventivo SEO e Google Ads

Porta il tuo sito web al livello successivo con l’expertise di EVE Milano. La nostra agenzia di Search Marketing ha ricevuto oltre 1121 richieste di preventivo, un segnale chiaro della fiducia che imprenditori e manager, come te, ripongono nella nostra specializzazione tecnica e verticale nella SEO e PPC. Se la tua organizzazione cerca competenze specifiche per emergere nei risultati di Google, noi siamo pronti a fornire quel valore aggiunto. Affidati alla nostra esperienza per fare la differenza.
Richiedi un preventivo

Vuoi rimanere aggiornato su tutte le novità SEO e Google Ads?

Iscriviti alla nostra newsletter!

Informativa sui cookies

Noi e terze parti selezionate utilizziamo cookie o tecnologie simili per finalità tecniche e, con il tuo consenso, anche per le finalità di esperienza e misurazione come specificato nella cookie policy. Puoi liberamente prestare, rifiutare o revocare il tuo consenso, in qualsiasi momento, accedendo al pannello delle preferenze. Il rifiuto del consenso può rendere non disponibili le relative funzioni. Usa il pulsante “Accetta” per acconsentire. Usa il pulsante “Rifiuta” per continuare senza accettare.