Bien préciser la langue d’une page web

27 mai 2007,
par Romy Têtue

Mots-clefs associés à cet article :

Améliorez le confort des internautes et le référencement, en précisant correctement la langue des contenus publiés sur le Web.

Bien préciser la langue est important car cela permet aux navigateurs d’afficher, par exemple, les textes dans le bon jeu de caractères (accents, ligatures, etc.). Sans précision de langue, les logiciels vocaux, utilisés par les gens pressés et les personnes mal-voyantes et aveugles, ne peuvent pas savoir quel dictionnaire linguistique utiliser. Avez-vous déjà entendu un texte français vocalisé en anglais ? Incompréhensible ! Enfin, cela permet aux moteurs de reconnaître la langue des contenus pour les indexer d’autant mieux.

L’attribut HTML « lang » permet de spécifier la langue des contenus. Comment l’utiliser ? C’est très simple, il suffit d’y penser :

  1. D’abord déclarer la langue principale du document ;
  2. puis signaler, s’il y a lieu, chaque changement de langue, au sein de ce document.

La langue principale du document

Afin que le navigateur sache dans quelle langue est rédigé le document, indiquez la langue principale via l’attribut lang du premier élément de la page, <html>. La langue y est abrégée sur deux lettres, selon le code ISO 639-1. Toute page web doit donc commencer ainsi :

<html lang="fr" …

N’oubliez pas de préciser le sens de lecture de la page avec l’une des deux valeurs de l’attribut dir : rtl pour les langues s’écrivant de droite à gauche (de l’anglais « right to left ») et inversement ltr. Soit : <html lang="fr" dir=”ltr”> pour une page en français [*]. Exemple pour une page rédigée en arabe :

<html lang="ar" dir="rtl">

Pensez à définir le jeu de caractères, grâce à la balise meta charset [*]. La norme iso-8859-1, souvent appelée Latin-1, est utilisable pour la plupart des langues d’Europe de l’Ouest. Son adaptation, l’iso-8859-15, prend en compte le caractère euro. Dans un site plus largement multilingue, on préférera utiliser l’utf-8 :

<meta charset="utf-8">

Signalez chaque changement de langue

Lorsqu’au sein de la page, vous utilisez une autre langue que celle initialement déclarée, vous devez le signaler. Les logiciels (notamment les synthèses vocales) peuvent ainsi s’adapter pour lire cette portion de texte avec la prononciation appropriée. Pour citer des propos tenus dans une autre langue :

Je me suis penchée à leur table avec bonne volonté en disant&nbsp;:
<q lang="en">Oh, I'm sorry ! I don't speak english very well. Can you repeat please?</q>

Faites de même pour les sigles et acronymes :

Cette page est réalisée en <abbr title="HyperText Markup Language" lang="en">HTML</abbr>

Et les expressions étrangères :

<i lang="la">Mens sana in corpore sano</i> est une expression latine extraite de la dixième Satire de Juvénal.

Il est possible d’indiquer la langue de n’importe quelle partie du document et de gérer le mélange de texte s’écrivant de gauche à droite avec du texte de droite à gauche.

Enfin, vous est-il déjà arrivé de suivre un lien alléchant pour tomber sur une page rédigée dans une langue que vous ne comprenez pas ? Pensez, lorsqu’elle diffère de celle utilisée dans la page en cours, à indiquer dans quelle langue est rédigée la page visée par vos liens externes, grâce à l’attribut hreflang :

Tout ceci est expliqué sur le <a href="http://www.w3.org" title="site du W3C, en anglais" hreflang="en">site du W3C</a> !
{#TITRE,#URL_ARTICLE,#INTRODUCTION}

Vos commentaires

Répondre à cet article

forum message

Raccourcis : {{gras}} {italique} -liste [bla->url] <q> <quote> <code>.

Qui êtes-vous ? (optionnel)

Suivre les commentaires : RSS 2.0 | Atom