Glyphes et caractères

Christophe de blog éclectique (le sien aussi !) me demandait si glyphe et caractère sont la même chose. Ma réponse pourrait intéresser autrui.

Glyphes et caractères sont différents. C’est même une différence fondamentale pour bien comprendre la typographie, surtout informatique. Si ça vous parle : structure/présentation (un peu comme HTML/CSS).

Voilà, vous avez l’essentiel. Si ceci vous suffit, vous pouvez aller voir ailleurs. Sinon, vous découvrirez diverses subtilités en lisant la suite.

  1. Des paires asymétriques
    1. Un glyphe, plusieurs caractères
    2. Un caractère, plusieurs glyphes
  2. Quatre cas particuliers
    1. Les ligatures
    2. Les diacritiques
    3. Unicode et les glyphes
    4. La casse
  3. Conclusion

Des paires asymétriques

Un glyphe, plusieurs caractères

De nombreux caractères ont un glyphe (masculin malgré le e final) identique, mais ils restent bien sûr de sens différents (sinon, ce ne seraient pas devraient pas être des caractères). Du coup, les polices concatènent souvent plusieurs caractères dans un seul glyphe (et il n’y a rien de crade à le faire).

Ceci pose cependant un problème de sécurité : EBAY.com, ΕΒΑΥ.com. Cette question de sécurité est brièvement abordée dans Déjouer un phishing. Quelques navigateurs (au moins Firefox et Safari) incluent des mécanismes pour éviter ce genre de trou de sécurité.

Quelques exemples de glyphes recouvrant plusieurs caractères :

  • Certaines capitales des alphabets copte, cyrillique, grec et latin, voire plus étranges (BВβßϐ).
  • Certaines capitales latines et les chiffres romains (X)
  • Quelques caractères plus obscurs (,)

Un caractère, plusieurs glyphes

Tout comme un glyphe peut recouvrir plusieurs caractères, un caractère peut avoir plusieurs glyphes. En fait, c’est même extrêmement fréquent : chaque police représente un même caractère de manière plus ou moins différente ; le a de la police Times n’est pas le a de la police Courier New. Mais dans ce cas-là, on parle de polices différentes et l’usage est identique.

Cependant, un même caractère peut avoir plusieurs glyphes dans une même police, parce qu’ils servent à des usages différents :

Même sens, présentation différente. Pour plus d’informations sur la différence glyphe/caractère, voir B, В, β, ß.

En-dessous des glyphes

Un glyphe n’a pas toujours une apparence unique. Les polices gérant des fonctions typographiques très avancées permettent de modifier une partie d’un glyphe, par exemple pour ajouter un paraphe en pointe du a (utile pour un a final, alors que l’on n’en veut pas dans un a intérieur — Opera a d’ailleurs toujours des problèmes à ce niveau, au moins sur Mac). Chaque modification est en fait un glyphe particulier. On parle alors des allographes d’une lettre.

Quatre cas particuliers

Les ligatures

Les ligatures sont des lettres (hyperonyme de caractère et glyphe) qui ont fusionné. Il s’agit d’un cas particulier dans le sens que le même terme englobe deux techniques aboutissant à une fonction identique : deux lettres qui semblent à l’œil n’en faire plus qu’une.

Voici les deux types de ligatures :

  • les ligatures esthétiques, (st, fi, fl, ff, ffi et ffl pour respectivement st, fi, fl, ff, ffi et ffl) qui sont en fait des glyphes
  • les ligatures « sémantiques » (œ et æ), qui ont un sens (la pertinence du sens est un autre débat) et sont donc des caractères. Attention, ne pas confondre ces ligatures-ci avec des digrammes (ai, eu, qu…) et encore moins des diphtongues (qui n’existent plus en français moderne)

Ces deux catégories ne sont pas étanches, comme le montre le cas de l’esperluette (&), historiquement une ligature esthétique (donc un glyphe) du latin et depuis devenu un caractère. On peut en dire autant du eszett allemand (ß) ou du s long (ſ) aujourd’hui tombé en désuétude. Dans ce dernier cas, les choses se compliquent avec le esh (ʃ) utilisé en phonétique ([ʃa] pour chat) et le symbole mathématique de la somme (Ʃ) qui est un s long par son caractère et un sigma (Σ) par son glyphe ! Effectuez d’ailleurs une recherche sur la page ligature de Wikipédia, vous allez voir que des caractères d’apparence très différente sont également reconnus.

Pour plus d’information sur les ligatures, lire Ligature (typographie) sur Wikipédia.

Les diacritiques

Les diacritiques sont des compléments à une lettre. Les plus connus sous nos latitudes sont les accents (d’ailleurs, on dit souvent par abus de langage lettres accentuées ; la cédille du c n’est pourtant pas un accent…).

Les diacritiques (accent grave, tréma…) sont-ils des caractères, ou bien n’accèdent-ils à ce statut qu’en combinaison avec une lettre (e accent grave, i tréma) ?

Je n’ai pas la réponse, mais Unicode (j’en parle dans la section suivante) et choisi de ne pas choisir : tant les diacritiques que les caractères diacrités ont un emplacement dans Unicode.

Unicode et les glyphes

Unicode est une norme permettant d’écrire bien plus simplement tous les caractères du monde (c’est grâce à cette norme que j’ai pu écrire tout cet article sans aller à l’hôpital).

C’est très bien. Cependant, comme Unicode a pour objectif de récupérer tout l’existant, elle a aussi récupéré les glyphes qui ont été insérés dans des encodages comme des caractères. Si vous avez suivi jusqu’ici, vous allez me dire que ça n’aurait pas dû être fait et vous avez raison. Mais le fait est que c’est là et que, si on veut assurer une compatibilité pleine et entière avec l’existant, il est nécessaire de trainer aussi les casseroles dudit existant. Cet ainsi que vous trouverez dans Unicode un emplacement pour le glyphe fi, alors même qu’il ne devrait être composé que dynamiquement, lors de la proximité entre un caractère f et un caractère i.

La casse

Dans les écritures bicamérales (= à deux casses, comme la majorité des langues européennes), une lettre peut être en capitale ou en minuscule (on oublie les majuscules, c’est autre chose). Les deux casses donnent lieu à des caractères différents, avec un sens différent : le a capital n’est pas un glyphe du a, c’est le caractère a capital. Il s’oppose à un autre caractère, le a minuscule. Ainsi, il n’existe pas de caractère a (mais on peut dire qu’il existe une lettre a, le terme lettre étant suffisamment vague).

Une question qui me tourmente, cependant : si les capitales et minuscules des lettres sont des caractères, pourquoi les chiffres minuscules sont-ils des glyphes ? Sur ce point, lire La mise en majuscule des chiffres minuscules.

Conclusion

Compliqué, n’est-ce pas ? Alors, pour résumer et étendre un peu :

Lettre
Ensemble des glyphes et des caractères, hormis les chiffres et les symboles. Quand vous ne voulez pas vous embêter ou que vous avez besoin de parler de l’ensemble.
Caractère
Unité de sens
Glyphe
Nom masculin, présentation de cette unité de sens. Les diverses options de formatage (gras, italique) sont encore autre chose : italique n’est pas un glyphe
Allographe
Variation sur un glyphe dans une même police
Ligature
Un terme imprécis désignant selon les cas deux caractères ou deux glyphes fusionnés
Diacritique
« Les accents ». Une lettre contenant un « accent » est dite diacritée (ç)
Casse
« Majuscule et minuscule ». Ce sont des caractères différents, par des glyphes

flattr this!

  • Pourquoi dis-tu que la somme est un s long pour son caractère? Est-ce que tu ne confonds pas avec l’intégrale, qui est, au moins dans son glyphe, un s long?

    A part ça, les liens vers B et consorts sont faux, ils pointent vers X et dix en chiffres romain.

    Enfin, pour ce qui est de la casse, je trouve que ça se discute: autant les majuscules sont sémantiques (début de phrase, différence entre un nom propre et un nom commun), autant les capitales sont esthétiques (elles dépendent plus de la position de la phrase dans la page que d’une fonction propre de la lettre).

  • @Laura, possible, je n’ai jamais compris très bien ce qu’est une intégrale. Il reste surprenant qu’une recherche sur l’une des glyphes donne aussi l’autre, cependant. Pour capitales et majuscules, je me refère à la nomenclature Unicode. Les sens anglais et français sont peut-être inversés, mais ça m’étonnerait, surtout pour un artisanat fortement teintée de la patte française comme la typographie.

    @François, comme tu dis, employaient. Ça se perd, vu que plus grand-monde n’a besoin d’ouvrir des tiroirs pour prendre les fontes qui se trouvent en bas de casse. Et c’est long à dire.

  • Glyphes, caractères, digrammes, Unicode…

    Excellent article d’Empyrée sur des concepts typographiques de base : la différence en caractère et glyphe, les ligatures, la casse… Encore un article que j’aurais aimé écrire et que je vais simplement lier avec plaisir…