Andrea Vit
TSW SEM Project Manager
URL SEF e caratteri speciali nelle promozioni multilingua
10 ottobre 2007Oggi intendo affrontare un problema tecnico che riguarda le promozioni multilingua ed in particolare la generazione di URL Search Engine Friendly in modo automatico mediante CMS.
Le URL, infatti, sono uno dei fattori SEO on-page ed è importante che esse descrivano il contenuto delle pagine. In questo modo si hanno due vantaggi principali:
- Sono più facilmente leggibili e memorizzabili dall’utente
- Sono utili nelle SERP poiché vengono messe in evidenza con il grassetto e rendono il risultato maggiormente accattivante per l’utente
Un buon metodo per costruire URL SEF è quello di sfruttare dei dati presenti nel database per generarle automaticamente.
Ad esempio:
- il titolo di un post nel blog:
Il nuovo libro di Alessandro Manzoni = www.il-mio-sito.net/il-nuovo-libro-di-alessandro-manzoni.html - il nome prodotto e la sua descrizione in un e-commerce
Gino – barattolo = www.il-mio-sito.net/gino-barattolo.html
Per costruire delle URL valide è necessario eliminare tutti i caratteri speciali, gli spazi ed eventuali caratteri maiuscoli che potrebbero essere contenuti nei dati che andiamo ad utilizzare.
Un possibile esempio potrebbe essere:
Giosuè & Noè vivono in Valle D’Aosta = giosue-noe-vivono-in-valle-d-aosta.html
A tal proposito si rende necessaria una procedura di pulitura dei caratteri speciali.
Una delle risorse più utilizzate ed indicate a questo compito nel web è la routine sanitize_title_with_dashes() di Wordpress contenuta nel file wp-includes/formatting.php.
Questa però ha un difetto: non si comporta in maniera corretta nella gestione dei caratteri tedeschi, in particolare i caratteri con la dieresi come ö, ë, ü. Questi caratteri, infatti, vengono tradotti con una regola errata:
ä = a
ö = o
ü = u
al posto di
ä = ae
ö = oe
ü = ue
Le conseguenze sono significative in quanto le parole tradotte male:
- perdono l’evidenza nella SERP
- potrebbero addirittura assumere significati diversi come ad esempio kuchen (torta) e kuechen (cucine)
A tal proposito ho modificato la funzione remove_accents() rimpiazzando le sostituzioni errate con quelle corrette.
Potete scaricare qui un esempio dell’utilizzo del file wp-includes/formatting.php modificato. Potrete eseguire dei test e magari utilizzarla nei vostri CMS per creare delle fantastiche URL SEF!
Buone URL a tutti! :-)
Post correlati:
Tags: caratteri speciali, CMS, promozioni localizzate, SEO multilingua, tecniche SEO, URL
Categorie: Progettazione Search Engine Friendly
8 Commenti a “URL SEF e caratteri speciali nelle promozioni multilingua”
Ciao Andrea, interessante post, proprio in questo momento sto lavorando sui caratteri. Per quanto riguarda al Tedesco va tutto bene, ma il carattere “ü” si usa anche nello spagnolo per indicare che dopo la “g” la “u” viene pronunciata, ad esempio “güigüe” è diverso da “guigue”. A diferenza del tedesco la “ü” diventa “u”. In questo caso come si fa? :)
@Johnnie:
Ciao Johnnie,
la tua domanda è molto interessante, perchè si nota come le promozioni multilingua siano molto complesse e con problemi diversi a seconda dei casi.
Nel caso da te evidenziato, l’ideale è quello di tradurre il carattere “ü” con la sua relativa transcodifica “%C3%BC” in modo tale che essa venga poi visualizzata e evidenziata nelle SERP.
Per fare questo basta modificare ad hoc l’array associativo presente nel codice e personalizzarlo con la corrispondenza desiderata.
Non è la soluzione migliore dal punto di vista della “bellezza” della URL, ma è l’unico modo per avere la “parola magica” grassettata. :-)
Ciao Andrea, complimenti l’articolo è molto interessante.
Credo che la funzione di wordpress che hai citato possa essere presa come modello per crearne delle altre in altri linguaggi.
ciao
@Alessandro
ti ringrazio per i complimenti.
A dire il vero questa funzione di wordpress ha un’infinità di estensioni e spunti da approfondire. Penso:
- alla codifica differenziata in base alle lingue;
- all’eliminazione di stringhe non utili ai motori (preposizioni, articoli, … )
- traduzione in diversi linguaggi di programmazione;
- integrazione del codice su procedure di import di dati in database dei CMS;
e chi ne ha più ne metta :-)
Ciao,
interessante come articolo (che novità, visto che sono solo il 3 che te lo scrive eheh spero che qualcuno non pretenda i diritti d’autore eheh ;-)
esulo un pò dagli interventi… per caso conoscete un sito dove è possibile trovare la decodifica dei caratteri? come in questo esempio:
ä = ae
ö = oe
ü = ue
grazie ;)
ciao..mi sono imbattuto in questa discussione perchè sto tentando di risolvere un problemino..
devo registrare un sito web per una società.
per l’appunto società ( con l’accento sulla a)
esempio: http://www.societànuova.it
come si può fare??
all’inizio pensavo fosse impossibile, poi ho trovato questo:
http://www.clé.org/
sapresti dirmi come ha fatto????
@Marco
Ciao Marco,
dal 2004 è possibile acquistare anche domini con caratteri non ASCII e lettere accentate. Questi domini si chiamano IDN (Internationalized Domain Name).
Personalmente mi è capitato di rado di utilizzarli o visualizzarli nella barra del mio browser.
Qui qualche info in più:
http://en.wikipedia.org/wiki/Internationalized_domain_name
http://www.icann.org/en/topics/idn.html
Spero di esserti stato utile :-)
A presto!








Bell’articolo, complimenti.