Cette nécessité de clarification est posée lorsque le contenu utilise des abréviations ou des acronymes. L'utilisateur n'est pas censé en connaître la signification, surtout s'il consulte un document qui couvre un domaine de connaissance qu'il ignore ou maîtrise mal. Par conséquent, une abréviation, lors de sa première occurrence dans un document, doit être explicitée, grâce aux éléments abbr et acronym et à leur attribut title.

<abbr title="Régie Autonome des Transports Parisiens">RATP</abbr>
<acronym title="Organisation du Traité de l'Atlantique Nord">OTAN</acronym>

Quant à la langue principale utilisée par le document Web, il est d'autant plus utile de la déclarer que les lecteurs d'écran en tiennent compte pour améliorer l'interprétation du contenu et éviter toute « prononciation » au mieux désagréable à l'oreille, au pire à la limite de la charabia. Les moteurs de recherche en tiennent aussi compte dans le tri et l'affichage des résultats lorsque l'utilisateur recherche des pages dans une langue précise.

Dans un document HTML, on déclare la langue dans la balise html en utilisant l'attribut lang, qui a comme valeur le code langue correspondant, tel que défini par la norme ISO 639 : pour le français, on emploiera le code fr.

<html lang="fr">
<head>
<title>Document en français</title>
</head>
<body>
<p>Contenu en français</p>
</body>
</html>

Dans un document XML, il faut utiliser l'attribut xml:lang. S'il s'agit d'un document XHTML 1.0, il est préférable d'employer les deux attributs.

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr" lang="fr">

De même que la langue principale du document doit être déclarée, de même tout changement de langue au sein d'un document Web doit être identifié clairement, pour les mêmes raisons. Dans un document HTML, l'attribut lang se place dans la balise qui encadre le contenu dont la langue diffère de la langue principale.

<html lang="fr">
<head>
<title>Document en français avec des parties en langue étrangère</title>
</head>
<body>
<p>Paragraphe en français</p>
<p lang="en">Paragraph in English</p>
<p>Paragraphe en français <span lang="es">con algunas palabras en español</span></p>
</body>
</html>

Bien entendu, dans un document XML, c'est l'attribut xml:lang qui joue ce rôle. S'il s'agit d'un document XHTML 1.0, on peut utiliser l'un ou l'autre attribut, ou les deux.