[Page Accueil BnF]

L'aventure des écritures
Le code

[Les dossiers pédagogiques]

1. D'où vient le code ?
2. Qui a le code ?
3. Ecritures codées, jeux de caractères
.

[Sommaire du dossier Ecriture]

3. Ecritures codées, jeux de caractères

Qu'il s'agisse du nombre de caractères d'un système d'écriture (vingt-six dans l'alphabet latin), de la position de chaque signe au sein de ce système (e comme cinquième lettre de l'alphabet), de sa valeur numérique éventuelle (60 pour la lettre arabe sin), de sa signification mathématique (), ou encore de codage ou de cryptage, l'écriture est depuis toujours étroitement liée aux nombres.

Une aventure vieille comme le monde : sécurité = complexité

"21.35.35.24.44, fils de 21.11.20.42" : ce sont les noms cryptés d'un père et de son fils figurant sur une tablette d'Uruk, en caractères cunéiformes, vieille de plus de deux mille ans. Cultivée depuis l'Antiquité par les devins et les mages, comme plus tard par les alchimistes, pour écarter les profanes, la cryptographie est plusieurs fois millénaire. L'idée d'attribuer un équivalent numéral aux noms, selon des systèmes cohérents de chiffrage, revient sans doute aux Mésopotamiens. Dans une civilisation où le monde céleste suivait l'harmonie des nombres (idée maintes fois reprise par les philosophes et les physiciens jusqu'à nos jours) et pour laquelle la symbolique numérale était un élément essentiel du nom d'un individu, les dieux portaient des noms de chiffres, selon un ordre hiérarchique : une tablette du Ier millénaire avant J.-C. donne ainsi pour chaque dieu un équivalent pouvant aussi servir d'idéogramme pour le représenter :
60 = Nabu, le premier dieu ;
50 = Enlil, dieu de la terre ainsi que Ninurta son fils ;
40 = Ea, dieu des eaux ;
30 = Sîn, divinité lunaire ;
20 = Shamsh, le soleil ;
15 = Ishtar, souveraine des dieux ;
14 = Nergal ;
6 ou 10 = Adad ;
10 = Marduk, ainsi que Gibil et Nusku, compagnons du dieu 20.

La cryptographie était utilisée par les Grecs et les Romains. Jules César envoyait des messages chiffrés selon une méthode qui, de nos jours, semble simple : il s'agissait de remplacer, dans un premier temps, chacune des lettres du message par le chiffre correspondant à sa position dans l'alphabet, mais en compliquant cette transposition par la décision de faire commencer l'alphabet par n'importe quelle lettre ; si l'on choisit par exemple le x comme première lettre de l'alphabet, cela a pour effet de donner à la lettre a la valeur 4. Si l'on convient ensuite de choisir comme clé la lettre a (qui a donc la valeur a = 4), on additionne dans un deuxième temps ce nombre 4 à chacun des chiffres obtenus après la première transposition ; on recommence au début de l'alphabet en cas de dépassement. On peut compliquer le système en lui ajoutant une clé périodique. Le décodage consiste à refaire toutes ces opérations dans l'autre sens, ce qui est aisé si l'on a connaissance de la clé ; ce qui demande patience et astuce dans le cas contraire.

Par exemple, pour le message "Envoyer renfort", lors du premier codage, selon la position des lettres dans l'alphabet, on obtient : " 8-17-25-18-2-8-21 21-8-17-9-18-21-23 ".
Après le second codage (en ajoutant le nombre 4, sachant que a = 4), le résultat est le suivant : "12-21-29-22-6-12-25 25-12-21-13-22-25-27".
Il suffit ensuite de reconvertir en lettres cette dernière série de chiffres, en supposant toujours que x est la première lettre de l'alphabet, ce qui donne finalement le message codé suivant : "I-r-z-s-c-i-v v-i-r-j-s-v-x ".

L'idée d'écrire les nombres grâce aux lettres de l'alphabet selon l'ordre qu'elles y occupent (et non plus seulement de coder des mots) revient en fait aux Hébreux et aux Grecs. L'ordre et les noms des lettres se sont conservés, au cours des temps et des emprunts divers, à peu près à l'identique dans la plupart des alphabets issus du phénicien ; la numération grecque alphabétique fut analogue au système des lettres numérales hébraïques. La transposition des lettres en nombres pour en additionner les valeurs numériques existe dans la Bible.
Par exemple, le nombre 26 chez les Hébreux, représente le nom de Dieu,
Yahwé (car Y-h-w-h = 10 + 5 + 6 + 5 = 26).

Chiffres, pixels, logiciels : les cryptogrammes évoluent.

Comme le langage, construction humaine qui évolue sans répit, l'écriture s'invente sans cesse de nouveaux systèmes ; les codages connaissent des développements fabuleux, parallèles à ceux des modes de transmission. Le "chiffrement" des mots ou des caractères s'est imposé au cours de l'histoire pour deux raisons majeures : soit cacher un message, soit compacter l'information pour la transmettre. Combinaisons de symboles, codages et cryptages sont devenus une science dure, fondée sur la théorie algorithmique des nombres.

Coder une écriture, c'est donner aux mots ou aux caractères de cette écriture des équivalents symboliques pour obtenir un "cryptogramme".
Déchiffrer, c'est faire de la "cryptanalyse".

Plusieurs moyens permettent d'y parvenir : tout d'abord, la "stéganographie" dissimule l'existence même de l'écriture en enrobant le caché dans l'évident ; c'est l'art de faire transiter un message, sans même que l'on soupçonne qu'il en est un.

Par exemple dans un tableau, des brins d'herbe, alternativement longs et courts, peuvent transcrire un texte en morse sans que personne ne s'en doute, sauf le destinataire averti.
On peut aussi, grâce aux nouvelles technologies, arriver à coder les pixels d'une image sur un ordinateur : il faut savoir que lors d'une "scanérisation", il se produit invariablement, lors du passage de l'original à la copie constituée de milliers de points (pixels), de petits défauts totalement imprévisibles ; il s'agit alors pour le cryptographe de remplacer ces inévitables "bruits" par d'autres points constituant le message codé, dont la disposition semblera aléatoire à toute personne non prévenue.

Un autre moyen très utilisé est le chiffrement, qui fait subir à un texte clair des transformations pour obtenir un texte chiffré, selon deux principes fondamentaux, la transposition et la substitutiton ; ces codages peuvent être à une ou plusieurs clés, à clé publique ou à clé privée ; la clé est dite symétrique si la même est utilisée pour encrypter et décrypter l'information, et asymétrique dans le cas contraire. Pour la législation, le chiffrement est "un processus de transcription d'une information intelligible en une information inintelligible par l'application de conventions secrètes dont l'effet est réversible".

Le plus célèbre des procédés de cryptage récents à clé publique, devenu un standard, bien que plus ou moins interdit, est le logiciel inventé par l'Américain Phil Zimmermann (PGPi, Pretty Good Privacy) qui permet de chiffrer des documents sur un ordinateur pour les stocker ou les transmettre sous cette forme codée.
Le plus sophistiqué est sans doute le codage à base de fréquences d'ondes lumineuses.

Les hommes n'ont pas manqué, dès l'Antiquité, de s'interroger sur l'histoire de l'écriture. Dans cette lignée, le Traicté des chiffres ou secretes manieres d'escrire, paru en 1586, dû à Blaise de Vigenère, propose de "parcourir ce qui se presentera à propos de ces beaux & cachez mysteres, adombrez sous l'escorce de l'escriture" ; une cinquantaine d'alphabets, dont des alphabets secrets, ainsi que sa fameuse méthode de cryptage connue sous le nom de "grille de Vigenère", y sont reproduits ; "l'escriture au surplus, dit-il, est double ; la commune dont on use ordinairement ; et l'occulte secrète, qu'on desguise d'infinies sortes, chacun selon sa fantaisie pour ne la rendre intelligible qu'entre soy et ses consçachans". Ce traité jalonne l'histoire de l'impossible inventaire des systèmes d'écritures tenté au cours des temps ; l'auteur, en quête d'un langage et d'une écriture universels, "vraye escriture complete, par où se peuvent exprimer toutes sortes de conceptions", représente, avant Leibniz, une étape importante.

Unicode ou Leibniz revisité

Omnibus ex nihil ducendis sufficit unum.
"Un suffit à tirer tout de rien."
Leibniz.

Code binaire et numérique engagent désormais le monde vers une "recomposition de l'économie générale des signes". Navigant sur leur océan de messages à l'aide de zéros et de uns, les hommes rythment aujourd'hui les actes les plus simples de la vie quotidienne grâce à des codes, remplissant l'univers de "combinaisons", dont chacun est souvent secrètement le dépositaire ou croit l'être. L'on s'évertue, d'autre part, à capter les émissions éventuelles de signaux venant d'ailleurs. Décrypter, extraire du sens de signes multiples est devenu une obligation. Commun aux astronomes, aux linguistes, aux archéologues, aux militaires, le concept de codage est aussi de plus en plus familier à un plus large public…

Dans cette optique, l'expérience réalisée à travers Unicode est exemplaire. C'est une tentative internationale pour faire l'inventaire général codé, permettant la transmission informatique, de tous les signes composant les alphabets et systèmes d'écriture des langues du monde, de tous les caractères et symboles graphiques actuellement en usage (un certain nombre concernant cependant les langues anciennes), y compris les signes diacritiques, les ligatures, les abréviations, etc. Cette tentative vient à la suite du fameux code ASCII (American Standard Code for Information and Interchange), utilisé par les micro-ordinateurs pour représenter les lettres de l'alphabet. Unicode est étroitement lié à la norme connue sous le nom d'ISO 10646. À leur côté, l'API, ou Alphabet Phonétique International, joue un autre rôle : système de transcription phonétique utilisé par les linguistes pour représenter les sons du langage, il est composé de lettres empruntées à des alphabets connus et de caractères créés de toutes pièces ; il a pour but de fournir un répertoire de signes correspondants aux principaux phonèmes des langues du monde, avec pour devise : "Un seul signe pour un seul son, un seul son pour un seul signe". Donc, grâce à Unicode et à API, on a, d'une part, un recensement des formes, de l'autre, un recensement des sons.

Pas de langage universel donc - un rêve demeuré rêve -, mais un "JUC ", un " Jeu de Caractères Universel" dont chaque élément est lié à un codage unique, et qui, grâce à sa référence alpha-numéro-symbolique, est identifiable et graphiquement reproductible pour et par tous, pour peu que l'on soit équipé du "fureteur" adéquat. Ainsi, après avoir inventé de réunir dans les dictionnaires tous les mots du langage, l'on s'achemine désormais, grâce à de nouveaux outils, vers une autre moisson, celle des images des signes et des variétés des sons, mais aussi vers leur standardisation ; cela ne va pas sans difficultés : conférences internationales ou régionales, groupes de réflexion, appels à suggestions, le monde entier s'y met. Les problèmes font le tour de la planète et la nécessité de cette normalisation oblige à des réflexions toujours plus poussées.

(extrait du catalogue de l'exposition "L'aventure des écritures : naissances")

1. D'où vient le code ?
2. Qui a le code ?
3. Ecritures codées, jeux de caractères
.


[Accueil] / [Dossiers pédagogiques] / [Sommaire Écriture]