Apertus

De la Suisse, voici Apertus, l'alternative open source à Chatgpt

La Suisse lance un grand modèle linguistique national (LLM), Baptized Apetus, qui vise à devenir l'alternative transparente à Chatgpt, Llam et Deepseek. Fabriqué par les principales universités du pays, il est comparable à Llama 3 de Meta, publié en 2024. Depuis lors, cependant, les Giants américains ont déjà développé des versions plus avancées.

L'équipe suisse n'a pas l'intention de poursuivre les milliardaires de la Silicon Valley: l'objectif est d'offrir un système sûr et accessible, au profit des chercheurs et des entreprises. « Notre objectif est de fournir un modèle pour le développement d'une IA fiable, souveraine et inclusive », a déclaré Martin Jaggi, professeur d'apprentissage automatique au Federal Polytechnique de Lausanne (EPFL).



Apertus, un modèle totalement transparent

Contrairement à d'autres projets, Apertus (terme latin qui représente « ouvrir ») promet de ne pas avoir de secrets: chaque composant, du code au manuel de conception, sera rendu public, y compris le « recette« Du modèle. L'intention est de renforcer la confiance et d'atténuer les préoccupations concernant l'utilisation infructueuse de l'IA.

Selon Leandro von Werra, un chercheur de visage étreint, « n'est pas entièrement unique, mais c'est toujours un pionnier pour son escalier et pour le pouvoir de calcul utilisé dans l'entraînement. Il s'agit certainement d'une nouvelle étape dans les modèles open source ».

Les premières applications sont déjà orientées vers des secteurs cruciaux: santé, éducation et climat.


Optus, Ai Suisse qui veut devenir une infrastructure publique mondiale

Avec le lancement d'Apertus, la Suisse fait un pas décisif vers une nouvelle idée de l'intelligence artificielle. « Optus n'est pas un cas conventionnel de transfert de technologie de la recherche au produit. Nous le voyons plutôt comme un moteur d'innovation et un moyen de renforcer les compétences dans le domaine de la recherche, dans la société et l'industrie », a déclaré Thomas Schulthess, directeur des CSC et professeur au Federal Polytechnic de Zurich (ETH).

Suite à sa tradition, EPFL, ETH Zurich et les CSC fournissent non seulement la technologie de base, mais aussi les infrastructures pour stimuler l'innovation tout au long du tissu économique.


Un modèle pour le bien public

Optus a été formé sur 15 milliards de jetons en plus de 1 000 langues, dont 40% pas en anglais. Il comprend des idiomes souvent négligeés par les grands modèles, comme le Suisse allemand et le Romano.

« Optus est construit pour le bien public. Il se classe parmi les quelques LLM complètement ouvertes dans cet escalier et est le premier à incorporer le multilinguisme, la transparence et la conformité en tant que principes fondateurs », a souligné Imanol Schlag, directeur technique du projet et chercheur à Hed Zurich.


Swisscom et souveraineté numérique

Le lancement d'Apertus est également soutenu par le secteur privé. « Swisscom est fier d'être parmi les premiers à distribuer ce modèle linguistique pionnier sur notre plate-forme souveraine de l'IA Suisse.


Optus comme infrastructure publique

L'accessibilité ne s'arrête pas aux frontières nationales. Grâce au public à l'inférence, Apertus sera disponible dans le monde dans le cadre d'un mouvement pour une IA publique. « Actuellement, Apertus est le principal modèle de l'IA public: construit par les institutions publiques, pour intérêt public. C'est la meilleure preuve que l'IA peut être une forme d'infrastructures publiques, telles que les routes, l'eau ou l'électricité », a déclaré Joshua Tan, coordinateur du projet.


Transparence et conformité avec les règles

L'une des caractéristiques distinctives d'Apertus est la transparence totale. En plus des modèles, l'équipe de recherche a publié la documentation complète, le code source des processus de formation, les ensembles de données utilisés et les poids du modèle, y compris les points de contrôle intermédiaires. Tout est distribué avec une licence open source permissive, également pour un usage commercial.

Le projet est conforme à la législation suisse sur la protection des données et sur le droit d'auteur, en plus des règles européennes de la loi. Le Corpus de formation est basé exclusivement sur les données publiques, filtrée pour exclure les informations personnelles et le contenu indésirable, concernant également les demandes rétroactives pour l'opt-out des sites Web.


Le début d'un chemin

« Optus montre que l'IA génératrice peut être puissante et ouverte en même temps », explique Antoine Bosselut, professeur à l'APFL et co-dirigé des Suisses à l'initiative. « La libération n'est pas un point d'arrivée, mais le début d'un chemin: un engagement à long terme envers le fondement de l'ouverture, fiable et souverain, pour le bien public mondial ».

Les prochaines versions du modèle viseront à étendre la famille Apertus, à améliorer leur efficacité et à développer des adaptations spécifiques dans des domaines tels que le droit, le climat, la santé et l'éducation. Tout cela tout en maintenant la transparence, l'éthique et la conformité réglementaire en tant que boussole.



Opportunités de recherche et d'industrie

Le projet reçoit les consentements du monde industriel et académique, en particulier pour une attention à la sécurité des données. L'association suisse Banchieri voit « un grand potentiel à long terme » pour le secteur financier, grâce à la conformité aux règles locales sur la protection des données et le secret bancaire.

Cependant, la concurrence internationale reste féroce. UBS, la banque principale du pays, collabore déjà avec Openai et Microsoft.

SwissMem, qui représente les industries technologiques, reconnaît les avantages d'un LLM développé en Europe, mais souligne que le choix final dépendra de la capacité du modèle à garantir la performance au niveau des concurrents.