Sémantiser tous les noms propres ?

Doit-on localiser les noms propres en XML afin qu’ils soient correctement prononcés, au risque de gonfler démesurément la taille des fichiers ?

Je suis actuellement en train de faire un mémoire sur la Slovénie. Je le fais en anglais, mais j’ai beaucoup de référence à des auteurs ou des lieux slovènes. Comme toutes les langues, le slovène a une prononciation spécifique et un lecteur vocal francophone ne manquerait pas d’écorcher les sons. Ainsi la ville de Ptuj, qui se prononce « Ptouï » en slovène, mais serait prononcée « Ptuj » par un lecteur vocal francophone. La solution qui vient à l’esprit est d’entourer le nom de la ville par une balise de langue XML :

<span xml:lang="sl">Ptuj</span>

Mais il est évident que, si ceci reste raisonnable dans le cas de références isolées, ceci devient vite très lourd (dans les deux sens — difficile et gros — du terme) à gérer.

Dans ce genre de cas, ma manière de procéder est biomimétique : je m’inspire de la vie (en l’occurrence de mon cerveau) pour créer la forme technologique. Et ma réflexion me dit que, bien que ce soit en grande partie inconscient, je passe constamment de l’anglais au slovène quand je lis un texte sur la Slovénie dans la langue de Yeats ; preuve en est la difficulté que j’ai à prononcer dans ma tête certains nom compliqués comme Slovenj Gradec ou Zadlaščica. Ainsi donc, bien que le procédé soit très lourd, il me semble le plus approprié.

L’autre possibilité est, bien sûr, de balancer la sémantique et l’accessibilité par la fenêtre…

flattr this!