Lettres et images

Je vous ai traduit le premier paragraphe d’une page sur les caractères Unicode. Le reste est technique, mais ceci me semble le plus intéressant. Certaines choses semblent tellement aller de soi que l’on ne prend pas la peine de les signaler.

Dans le texte ci-dessous, l’emphase est mienne.

Pourquoi avons-nous besoin de caractères ?

Les textes gravés dans la pierre ou écrits sur du papier sont stockés sous forme d’images. Pourquoi ne codons-nous pas tous nos textes comme cela ? Après tout, il existe d’excellents standards pour cela […]. Utiliser des images permet une liberté maximale : nous pouvons dessiner les signes que nous voulons et les envoyer comme graphiques à nos lecteurs […]. Et cette technique est encore utilisée [en 1998, NdT] : de nombreuses entreprises japonaises préfèrent faxer une lettre manuscrite que rédiger un courriel si long à écrire ; de nombreux sites arabes sur la Toile présentent leurs textes comme des images GIF au lieu d’utiliser des encodages que la majeure partie des plates-formes ne gèrent pas1.

L’encodage d’images a plusieurs inconvénients, cependant : plus important que la faible compression (les images prennent plus de place, de bande passante et de temps de calcul) est le fait que votre ordinateur ne sera pas capable de :

  • déchiffrer les écritures illisibles ;
  • lire le texte à haute voix ;
  • reformater le texte dans une autre police ;
  • chercher des mots et des adresses depuis le texte vers des dictionnaires ;
  • chercher dans des tonnes de pages un certain signe, mot, ou phrase ;

sans faire appel à des techniques d’intelligence artificielle (vision informatique, OCR) qui ont tendance à utiliser des algorithmes heuristiques non sécurisés et qui ont besoin d’un encodage.

Où je reprend la main

Ceci nous emmène à une énorme différence entre les hommes et les ordinateurs : nous lisons des images, alors que les ordinateurs lisent des chaînes de caractères.

Je me demande ce qui arrivera quand nous lirons des chaînes de caractères (implants neuraux, sûrement) ; peut-être quelque chose de très proche de l’empathie (plus que la télépathie). Car finalement, nous sommes plus intellectuels que les machines…


  1. vous pouvez voir un exemple pour le laotien sur le site de RFI

flattr this!

  • UTF-8 pour tous !

    UTF-8 pour tous ! L’encodage des fichiers est très souvent mal géré ou en tout cas pas vraiment maîtrisé. Un très bon article a été écrit à ce sujet sur Openweb mais simplifions encore le concept…