OpenEurollm: L’UE fait un pas vers la souveraineté numérique
L’Union européenne a commencé OpenEurollmune initiative visant à renforcer la souveraineté numérique du continent en développant de grands modèles linguistiques (LLM) open source sur le supercalculateur européen. Ce programme ambitieux, avec un budget initial de 37,4 millions d’euros, fait partie des investissements européens croissants dans les infrastructures numériques et l’intelligence artificielle, mais soulève des questions sur sa faisabilité et l’ouverture réelle des données utilisées.

Objectifs et leadership du projet
Le 3 février 2025, l’Europe a annoncé OpenEurollm, un projet de développement de l’open source du LLMS dans les 24 langues officielles de l’Union européenne et dans celles des pays candidats à l’entrée du marché de l’UE, comme l’Albanie. Conduit par Jan Hajič de l’Université Charles de Prague E Peter Sarlin Par Silo AI, le projet vise à promouvoir la souveraineté numérique européenne, avec des infrastructures critiques les plus proches du continent.
Budget et défis
Le consortium, financé par la Commission européenne, a commencé ses travaux le 1er février 2025. Malgré l’ambition, le budget semble limité aux investissements des grandes sociétés d’IA et la participation de plus de 20 organisations soulève des doutes quant à la capacité de maintenir un Focus claire.
Collaborations internationales et participation
OpenEurollm implique des organisations universitaires et de recherche de divers pays européens, en plus des centres EUROHPC. Parmi les universités et les organismes de recherche participants figurent Université Charles, Alt-Edic, Université de technologie d’Eindhovenet bien d’autres. Parmi les entreprises auxquelles ils participent Silo Genai, Aleph Alpha Researchet autres. L’Italie est représentée par le Cineca Interuniversity Consortium.
Défis et opportunités pour l’ouverture des données
OpenEurollm traite du défi d’équilibrer l’ouverture des données avec des besoins de qualité. Bien que l’objectif soit de faire de tout l’open source, certaines limitations liées aux droits d’auteur européen pourraient empêcher la redistribution d’une partie des données de formation. Cependant, les données peuvent être mises à disposition pour les inspections sur demande, comme l’exige leAI actes UE.
Conclusionle
Malgré les défis, OpenEurollm représente une étape importante vers la souveraineté numérique européenne. Bien que le projet ne produise pas le meilleur modèle au monde, le développement d’un modèle avec des composants basés en Europe serait un résultat positif pour la souveraineté numérique du continent.
