Oggi facendo crawling sul sito ho notato la segnalazione di alcuni link rotti su un articolo. Non serve che ti spieghi quanto mi irritano i broken links, sono quindi corso subito su quella pagina per correggerli.
Lo zampino di Microsoft Word
Passando il mouse sopra il primo link in effetti ho notato che il link terminava con questi caratteri “%E2%80%8E“. Sono entrato nell’editor HTML di WordPress ma quei caratteri non li vedevo, i link erano corretti.
Prima di perdere tempo pensando all’ultima modifica eseguita sul sito oppure all’ultimo plugin installato ho Googolato 1 minuto… e mi è bastato per trovare la soluzione!
%E2%80%8E e la codifica UTF-8
In pratica questo problema può accadere quando si incolla nell’editor testuale di WordPress del testo da Word, Wordpad ed editor testuali simili. Infatti la sequenza di caratteri %E2%80%8E definisce la fine della riga ma è codificato in UTF-8 e quindi non è visibile su tutti gli editor.
Per risolvere il problema ti basterà copiare il testo dall’editor HTML di WordPress ed incollarlo in un editor come Notepad++, noterai subito che i link finiscono proprio con %E2%80%8E perchè Notepad++ codifica anche i caratteri UTF-8. A questo punto puoi ripulire gli URL dal codice appeso alla fine del link ed infine incollare il testo nell’editor di WordPress (cancella tutto prima). Salva e verifica, enjoy ;)