Les modèles de langues grandes ignorent l'identité la plus profonde du Mexique. La réponse du gouvernement est de créer le vôtre

Chatgpt, Gemini, Claude, Llama, Deepseek. Aujourd'hui, il existe des dizaines de modèles conversationnels à la disposition de tous. Certains sont ouverts, d'autres gratuits. Alors pourquoi le Mexique a-t-il décidé de créer le sien? Que peut contribuer à un modèle national que la Silicon Valley, l'Europe ou les géants de Pékin ne contribuent pas? La réponse a moins à voir avec la technologie et plus avec la culture.

Le Mexique a annoncé le développement de son propre modèle de langue d'intelligence artificielle avec l'identité culturelle mexicaine et l'inclusion de langues autochtones.

Quand l'IA ne comprend pas tout. Les modèles les plus connus d'aujourd'hui sont puissants et polyvalents, mais n'ont pas été conçus pour comprendre la diversité linguistique et culturelle de tous les pays. Leurs données de formation donne la priorité à l'anglais et, bien que de nombreuses autres langues telles que l'espagnol parlent, généralement un péché de faible sensibilité aux expressions locales ou aux langues originales.

Une étude récente de IDB Lab, LLYC et Microsoft montre que seulement 54% des réponses dans les langues autochtones étaient correctes (les 46% restants ont présenté des erreurs ou des mélanges de langues). En particulier, dans Maya et Quichés, la compréhension et l'expression ont à peine atteint 1,25 / 10, tandis qu'à Nahuatl, il était de 3,42 / 10 et dans Guaraní 2,77 / 10

Qu'a dit le gouvernement mexicain. Le secrétaire à l'économie, Marcelo Ebrard, a annoncé que le Mexique présenterait en novembre (12 et 13 ans, Expo Santa Fe, CDMX) les progrès de sa propre langue pendant le forum «Mexico IA + Accelerated Investment». « Si nous ne nous dépêchons pas de dominer cet alphabet, nous ferons face à un désavantage très important dans ce nouveau contexte qui émerge aujourd'hui », a-t-il déclaré.

Qui le fait et combien cela coûte. Le ministère de l'économie, sous la direction de Marcelo Ebrard, dirige l'initiative avec le Business Coordinating Council (CCE) et avec le soutien technologique de NVIDIA, qui fournira une formation et du matériel sans investir de capital dans le projet. Selon le CCE, la construction des centres de données nécessitera un investissement approximatif de 9 000 millions de dollars.

Comment le modèle sera-t-il. Le modèle prévoit de s'entraîner avec les données culturelles du Mexique, des langues mexicaines espagnoles et autochtones actives. Le Mexique reconnaît 68 groupes linguistiques et 364 variantes (INALI), Forces Corpus's Fine Collection and Healing Work.

Que font les autres pays. En Amérique latine, une coalition de pays lancera LATAM-GPT en septembre 2025, dirigé par Cenia (Chili) avec le soutien de plus de 30 institutions. Il est né pour représenter la diversité culturelle et linguistique régionale et fonctionne comme un projet collaboratif régional. En Europe, l'Espagne promeut Alia, une infrastructure publique de modèles en espagnol et en langues officielles.

Images | Simseo avec gemini 2.5 flash

Dans Simseo | L'Institut électoral du Mexique a utilisé une voix synthétique comme celle du narrateur Dragon Ball. Les acteurs sont sortis