Les atouts méconnus d’Unicode

Le support de la norme Unicode revient souvent dans la liste des fonctions qu’InDesign offre et que XPress n’offre pas (du moins jusqu’à la version 7 de ce dernier). Et vous vous êtes peut-être dit : « chic, ce sera pratique quand j’aurai des documents à faire en russe… », mais vous attendez encore un client russe… En fait, il y a une application mal connue d’Unicode qui peut vous être utile dès maintenant et quotidiennement : tirer meilleur profit de vos fontes. Et c’est justement ce que fait InDesign…

La limite des « 256 » caractères

Vous le savez sans doute, une fonte renferme plus de caractères qu’il n’y en a sur votre clavier. Mais si vous avez utilisé l’utilitaire Table de caractères sous Windows 95, 98 ou Millenium ou bien l’utilitaire Clavier sous Mac OS 8 ou 9, vous vous êtes peut-être dit que c’était là tout ce que vos fontes avaient à offrir. Erreur ! Elles sont certainement plus riches…

Pourquoi cela ? Pendant longtemps, le code qu’un caractère recevait dans une fonte était stocké sur un octet, ce qui permettait 256 valeurs différentes (1 octet = 28 en binaire, soit 256 en décimal). On parle donc souvent d’une limite à 256 caractères, mais en fait, c’est très inexact. Divers standards ont émergé au cours des années pour établir des tables de caractères pour les besoins des langues d’Europe occidentale – les principaux étant ceux d’Adobe, d’Apple et de Microsoft – et chacun a choisi d’inclure un certain nombre de caractères de contrôle (retour à la ligne, espace, tabulation, etc.), ce qui laisse un peu moins de place pour les caractères proprement dits. Ainsi, Adobe a défini sa norme ISO-Adobe (ou « Adobe-Standard ») avec 228 caractères, Apple sa norme MacRoman avec 223 caractères et Microsoft sa norme Code Page 1252 avec 215 caractères (218 depuis Windows 98 Seconde Édition). Mais le pire est sans doute que ces différentes « normes » ne se recoupent pas.

Par rapport à la page de code 1252, 20 caractères sont absents de MacRoman. Ce sont : Š, Ž, š, ž, ¤, ¦, le trait d’union conditionnel, ², ³, ¹, ¼, ½, ¾, Ð, ×, Ý, Þ, ð, ý et þ. Par rapport à MacRoman, 25 caractères sont absents de la page de code 1252. Ce sont : , , , , , , , π, , Ω, , , , , , (vraie barre de fraction), , , ı, ˘, ˙, ˚, ˝, ˛ et ˇ.

Avec ISO-Adobe, les choses se compliquent. Cette norme couvre l’ensemble des caractères de la page de code 1252, sauf trois : le trait d’union virtuel, l’ espace insécable et . Mais sous InDesign, les deux premiers caractères sont gérés par le logiciel, et donc on peut dire que ce manque n’apparaît pas. Par rapport à MacRoman, les absences sont plus nombreuses : 17 caractères. Ce sont : , , , , , , , π, , Ω, , , , , , l’espace insécable et . Traditionnellement sur Mac, ATM substitue ces caractères à l’écran et sur l’imprimante non-PostScript par ceux de la fonte Symbol, et le pilote d’impression PostScript fait de même pour les caractères qu’il envoie à l’imprimante.

ISO-Adobe, avec son large répertoire de caractères, dispose de trois caractères absents des deux autres normes : Ł, ł et (le vrai signe moins, pas un tiret demi-cadratin). Finalement, on peut dire qu’ISO-Adobe a le meilleur des deux autres normes.

Avant

Il y a quelques années, une fois qu’on avait expliqué le problème de ces différences de normes, on se retrouvait souvent sans solution. Un logiciel fait pour Windows 3.1, 95, 98 ou Millenium ne voit que les caractères de la page de code 1252, un logiciel fait pour Mac OS 7, 8 ou 9 ne voit que les caractères de MacRoman. Et ceci, quels que soient les caractères que renferme la fonte. Car, bien souvent, la fonte contient tout le répertoire ISO-Adobe, surtout si c’est une Type 1 (mais c’est aussi valable pour une TrueType), et pas seulement les fontes du fondeur éponyme : la fonte a bien trois fractions et trois chiffres supérieurs, mais vous ne pouvez les voir sous Mac. La fonte a bien une barre de fraction, les ligatures et , mais vous ne pouvez les voir sous Windows. Et si ceci est vrai pour les fontes Type 1, cela l’est encore plus pour les fontes TrueType et OpenType, qui peuvent avoir des centaines de caractères, sans qu’ils soient pour autant accessibles !

Aujourd’hui

Unicode, avec des codes de caractères stockés sur deux octets ou plus, peut résoudre tout cela : non pas en permettant de créer des fontes avec des dizaines de milliers de caractères (ce qui est possible, mais peu pratique), mais tout simplement en permettant aux différentes normes anciennes de cohabiter en les logeant dans un espace plus large. L’ennui étant que bien peu d’applications ont sauté le pas d’Unicode : certes, pour un logiciel il existe des solutions pour être compatible Unicode sur les vieux systèmes (Windows 95, 98 et Millenium ; Mac OS 8 et 9), mais la difficulté de mise en œuvre n’a pas suscité beaucoup de vocations. Les Windows NT (4.0, 2000, XP, 2003) et Mac OS X sont des systèmes parfaitement Unicode, mais ils continuent de proposer aux applications d’utiliser des routines de gestion de textes selon les anciennes normes, afin d’éviter aux développeurs d’avoir à réécrire tout leur système de gestion du texte.

Heureusement, InDesign est bien un logiciel Unicode, et ceci quel que soit le système d’exploitation. Mais cela n’a été possible que parce qu’InDesign fait sa propre gestion des fontes, indépendamment des ressources qu’offre ou n’offre pas le système. Et cela lui donne un avantage énorme : alors que XPress, avant sa version 7, continue à ne voir les ligatures et que sous Mac (et donc ne propose leur substitution automatique que sous Mac – sans parler des problèmes de compatibilité entre sa version Mac et sa version Windows), InDesign voit toute la fonte. Si par exemple elle dispose de tout ISO-Adobe, il verra tous les caractères, que ce soit sous Mac ou sous Windows. Finis, les caractères manquants lors d’un passage entre l’un et l’autre système ! Les deux ligatures classiques sont disponibles partout, la bizarrerie de l’absence des quatre signes mathématiques de base (×, ÷, +, ) est réparée ! N’hésitez pas à regarder ce qu’offrent vos fontes dans InDesign via le menu Texte · Insérer des glyphes : vous pourriez être surpris de la richesse de certaines d’entre elles.

En aparté, on peut noter que les fontes OpenType d’Adobe ont maintenant comme répertoire de caractères minimum Adobe Latin 2 (ex-Adobe Western 2), soit l’ancien ISO-Adobe plus 17 caractères : , , , , , , , π, , Ω, , , , (les 14 symboles qui lui manquaient de MacRoman, sans le logo Apple), ainsi que (appelé symbole litre), (le symbole estimé) et .


Références

Adobe Latin Character Sets

Character sets and codepages

PostScript Language Reference, third edition. Appendix E: Character Sets and Encoding Vectors