L'IA aide les chercheurs à décoder les vieilles lettres secrètes

L’IA aide les chercheurs à décoder les vieilles lettres secrètes

Dans le monde d’aujourd’hui, le cryptage joue un rôle vital dans tous les aspects de la protection des données et de la cybersécurité, garantissant que les individus non autorisés ne peuvent pas accéder aux informations que vous transmettez ou stockez. Cependant, la pratique de l’envoi de messages qui ne peuvent être interprétés que par leurs destinataires prévus est antérieure à l’âge des ordinateurs par des siècles.

Depuis l’antiquité, il est courant d’utiliser ce qu’on appelle un système de chiffre pour envoyer des messages secrets.

« Un système de chiffre opère sur une sorte de formule décrite dans une clé », explique Michelle Waldispühl, professeur d’allemand à l’Université d’Oslo.

« La clé n’est partagée que parmi les personnes qui devraient être en mesure de le lire. Une personne crypte et les autres décrypte en utilisant la clé. »

Dans un système de chiffre, par exemple, chaque lettre est remplacée par un nombre. Pour le rendre plus compliqué, chaque lettre peut être substituée par plusieurs nombres différents, ce qui rend plus difficile l’identification d’un modèle. Sauf si vous avez la clé.

Découvertes de lettres de complot de Mary Stuart

Sans la clé, vous avez une tâche monumentale devant vous. À moins que vous ne fassiez comme Waldispühl et ses collaborateurs l’ont fait. Les historiens, les linguistes et les informaticiens ont uni leurs forces pour utiliser l’intelligence artificielle pour découvrir les secrets.

Dans la bibliothèque nationale française, l’un des chercheurs, George Lasry, a trouvé des documents qui apporteraient une reconnaissance internationale à l’équipe.

« Il a découvert plus de 50 lettres dans le même système de chiffre qui s’est avéré être écrit dans l’écriture de Mary Stuart. Personne n’avait compris ce qu’ils étaient, donc ils étaient archivés d’une manière très particulière », explique Waldispühl.

Les lettres ont révélé comment l’ancienne reine écossaise a conspiré contre son cousin, Elizabeth I d’Angleterre. Dans les années qui ont précédé son exécution, elle a été emprisonnée, mais elle a réussi à envoyer de nombreuses lettres cryptées de sa cellule à l’ambassadeur français en Angleterre. Le gardien décrit le décryptage comme la nouvelle découverte la plus importante de Mary Stuart en plus d’un siècle.

Négociations de paix et lettres d’amour

Waldispühl et ses collègues ont parcouru de vieilles archives à la recherche de scripts de chiffre pour tout compiler dans une base de données.

« Le matériel que nous avons maintenant dans la base de données est principalement des XVIIIe et 19e siècles, et il traite principalement de lettres diplomatiques », dit-elle.

Elle a personnellement examiné 15 lettres reçues par Axel Oxenstierna, la chancelière de Suède, qui a été envoyée par son ambassadeur en Allemagne pendant la guerre de trente années, s’étendant de 1618 à 1648.

« Les lettres contiennent des rapports de la guerre, des détails sur les pourparlers de paix, d’autres négociations en cours et les parties impliquées. Ils contiennent également une multitude d’informations personnelles », note-t-elle.

Il ne semble pas y avoir de système cohérent régissant les pièces encodées et quelles pièces sont écrites en texte brut.

« Quand ils ont été pressés par le temps, il est évident que peu de choses ont été cryptées. Principalement, les noms de lieux, les noms personnels et les informations très sensibles ont été codés. »

Toutes les questions ne tournent pas autour de la guerre et de la paix; L’amour peut aussi exiger un voile de secret.

« D’un collectionneur privé, nous avons reçu plus de 400 cartes postales contenant un script de chiffre.

Par exemple, il y a une carte postale de 1908 dans laquelle le message commence par « = voevoeoggvkov / l » et se poursuit tout aussi incompréhensible. Jusqu’à présent, seules les deux premières lignes ont été décodées. Ils se révèlent en allemand, et le message est « Meine innig Geliebte Einzige Herzensgute Miezefrau », qui en anglais se traduit grossièrement par « mon chat chéri, seulement au bon cœur ».

Le déchiffrement ne peut pas être laissé aux machines seules

Tout au long de l’histoire, les codes ont évolué pour devenir de plus en plus sophistiqué. Chaque fois qu’une clé est exposée, les conspirateurs sont obligés de développer un code plus difficile à casser. Autour de l’ère de la Seconde Guerre mondiale, les machines ont commencé à jouer un rôle important dans l’exécution et les codes de rupture. L’un des dispositifs de codage les plus renommés de cette époque est la machine nazie Enigma. Alan Turing et les Britanniques avaient besoin de machines pour casser le code.

Ainsi, la perspective d’utiliser l’intelligence artificielle et les modèles de langage moderne pour démêler ces puzzles séduisants sécables est indéniablement séduisant. Cependant, il y a un défi important:

« Les modèles linguistiques conventionnels nécessitent de grandes quantités de matériel pour la formation, ce qui n’est pas possible dans ce cas. Parfois, nous avons aussi peu que une demi-page de texte pour travailler », explique Waldispühl.

C’est pourquoi l’élément humain, souvent appelé «humain dans la boucle», devient particulièrement crucial. Par exemple, lorsqu’un informaticien a rencontré une lettre où chaque pièce a été codée, l’étape initiale était de transcrire le texte – en traduisant les caractères de la lettre dans un format que la machine pouvait traiter. La transcription a ensuite été envoyée au linguiste historique de l’Université d’Oslo pour une analyse plus approfondie.

« J’ai immédiatement vu qu’il avait raté une virgule et quelques points sur certains des personnages. Donc, je l’ai corrigé avec mon œil philologique », explique Waldispühl.

Ensuite, ils ont utilisé leurs outils informatiques pour faire correspondre le code par rapport aux textes en plusieurs langues. Malgré ces efforts, le collègue a dû avouer que le contenu de la lettre lui est resté insaisissable.

« Donc, j’ai fait une analyse manuelle pour vérifier ce que la machine aurait pu se tromper. C’est comme un puzzle où nous mettons en œuvre en permanence la clé avec laquelle la machine travaille. »

Il s’est avéré que la lettre était la propagande de campagne de l’empereur saint-romain Maximilian II, qui, dans les années 1570, faisait campagne pour devenir également roi de Pologne-Lithuanie. Il contenait des promesses de ce que les bénéficiaires recevraient s’ils le choisissaient et les menaces de force militaire s’ils ne le faisaient pas.

Développement d’outils pour des mystères plus non résolus

Waldispühl et ses collègues ont compilé des milliers de documents codés dans une base de données (decrypt.org), mais leurs ambitions s’étendent au-delà de la simple déchiffrement de lettres codées et de cartes postales codées.

« Nous visons maintenant à aller plus loin, non seulement en examinant les scripts de chiffre, mais aussi en élargissant notre concentration sur d’autres systèmes d’écriture et de symbole, même ceux qui ont des données limitées », explique Waldispühl.

Elle mentionne des exemples tels que la langue grecque précoce connue sous le nom de « linéaire B » et le disque Phaistos de 4000 ans de Crète, qui n’est pas respectant à ce jour. Cependant, l’objectif principal est de simplifier les tâches quotidiennes lors de la rencontre d’un document de contenu inconnu.

« L’objectif principal est de développer des modèles de transcription et de déchiffrement, puis de développer des outils qui peuvent profiter à tout le monde », explique Waldispühl.

Si les rêves de Waldispühl se réalisent, dans quelques années, vous pourrez simplement télécharger une image sur votre téléphone et obtenir un décryptage complet en quelques secondes.