Traduction automatique pour les tablettes cunéiformes

Un aperçu schématique du pipeline du modèle NMT. Les désignations courtes entre parenthèses suivent les conventions de l’ensemble de test fourni dans le SI : la source ou l’entrée est S, le HT d’origine est T et la traduction automatique de sortie est D. Image de la tablette ND.2438 disponible sur le site Web de l’initiative de bibliothèque numérique cunéiforme (CDLI : https://cdli.ucla.edu/P393604). © Les administrateurs du British Museum. Crédit: Nexus PNAS (2023). DOI : 10.1093/pnasnexus/pgad096

Un modèle d’IA a été développé pour traduire automatiquement un texte akkadien écrit en cunéiforme en anglais. Des centaines de milliers de tablettes d’argile de l’ancienne Mésopotamie, écrites en cunéiforme et datant d’aussi loin que 3 400 avant notre ère, ont été trouvées par des archéologues, bien plus que ce qui pourrait être facilement traduit par le nombre limité d’experts qui peuvent les lire.

Shai Gordin et ses collègues présentent un nouveau modèle d’apprentissage automatique capable de traduire automatiquement le cunéiforme akkadien en anglais. Deux versions du modèle ont été formées. La recherche est publiée dans la revue Nexus PNAS.

Une version traduit l’akkadien à partir des représentations des signes cunéiformes en écriture latine (translittérations). Une autre version du modèle se traduit à partir des représentations unicode des signes cunéiformes.

La première version, utilisant la translittération latine, a donné des résultats plus satisfaisants dans cette étude, obtenant un score de 37,47 au Best Bilingue Evaluation Understudy 4 (BLEU4), un test du niveau de correspondance entre la traduction automatique et humaine d’un même texte.

Le programme est plus efficace lors de la traduction de phrases de 118 caractères ou moins. Dans certaines des phrases, le programme a produit des « hallucinations » – une sortie qui était syntaxiquement correcte en anglais mais pas exacte au sens akkadien.

Mais dans la majorité des cas, la traduction serait utilisable comme premier passage au texte. Les auteurs proposent que la traduction automatique puisse être utilisée dans le cadre d’une « collaboration homme-machine », dans laquelle les chercheurs humains corrigent et affinent la sortie des modèles.

Fourni par PNAS Nexus