Aujourd'hui, on ne sait pas du tout ce qu'est « l'IA Open Source » et ce qu'elle n'est pas. C'est sur le point de changer
Nombreux sont ceux dans le monde de l’intelligence artificielle qui utilisent volontiers le terme « Open » et se vantent que leurs modèles sont Open Source. Ces derniers temps, ce type de message a été beaucoup critiqué, mais la vérité est que la définition des modèles d’IA Open Source n’était pas du tout claire jusqu’à présent. C'est quelque chose que l'OSI veut changer.
Qui est l'OSI. L'Open Source Initiative (OSI) est une organisation à but non lucratif dédiée à la promotion de l'open source. Créé en 1998, il est responsable de l'adoption de la définition dite Open Source pour les logiciels open source. Il s’agit donc de savoir à quelles conditions et exigences un développement logiciel doit répondre pour être considéré comme Open Source.
Allez dans l'œil de l'ouragan. Le débat sur cette définition et sur l'utilisation théoriquement injustifiée du terme Open Source a été réactivé notamment à cause de Meta. L'entreprise n'a pas cessé de parler de Llama 2 comme d'un modèle Open Source, et même si elle a un peu assoupli le discours avec Llama 3, il est facile de voir qu'ils abusent du terme. Ce n'est bien sûr pas la seule entreprise à faire cela : OpenAI elle-même, référence en la matière avec ChatGPT, utilise le mot « Open » dans son propre nom alors que son modèle et ses politiques sont parmi les plus fermés du secteur.
Ambiguïté et confusion. Bien que Llama 3 soit disponible gratuitement et autorisé, il ne correspond pas à la définition traditionnelle de l'Open Source car il impose certaines restrictions sur sa licence d'utilisation en fonction de la taille du projet ou du type de contenu. Flux, un modèle d'IA pour la génération d'images qui gagne beaucoup en popularité, soulève également cette confusion, et bien que ces projets et d'autres profitent généralement de cette keynote, la confusion pour les utilisateurs est évidente car il n'existe aucun modèle qui entre dans le classique. définition de l’Open Source.
Solution en vue. Comme indiqué dans Ars Technica, l’OSI a réuni une équipe d’environ 70 experts – chercheurs, avocats, activistes ou régulateurs – pour créer une définition des modèles d’IA Open Source. Il existe même des représentants de Meta, Google ou Amazon, et ils disposent déjà d'un brouillon (version 0.0.9) de cette définition.
Qu’est-ce que l’IA Open Source ?. Bien que le processus ne soit pas achevé, le projet se concentre sur « quatre libertés fondamentales » inspirées de celles des logiciels Open Source. Ainsi, les utilisateurs de ces modèles d’IA Open Source devraient avoir la liberté d’utiliser ces modèles à n’importe quelle fin sans autorisation, d’étudier leur fonctionnement, de les modifier à n’importe quelle fin et de les partager avec ou sans modifications.
Au-delà des « poids ouverts ». Souvent, les modèles qui prétendent être Open Source partagent des « pondérations », qui fournissent des informations sur la manière dont leurs calculs sont effectués. L'OSI indique que le projet inclut non seulement le modèle d'IA ou ses pondérations, mais l'ensemble du système et ses composants. Cela nécessiterait d'être complètement transparent avec les données avec lesquelles le modèle a été formé (aucun des grands ne le fait), le code source utilisé pour former et exécuter le modèle, ainsi que les poids et paramètres utilisés dans le modèle.
Pas les données, mais les métadonnées. Dans cette recherche de transparence, l'OSI précise dans son projet qu'il n'est pas nécessaire de publier des données « brutes » de formation. En réalité, ce que nous recherchons, c'est d'avoir les métadonnées de cet ensemble de données de formation et les méthodes de formation : sources de données, critères de sélection, techniques de prétraitement et tout autre détail permettant à d'autres personnes ou groupes de recréer des systèmes de formation de manière similaire. C'est important, car la définition n'exige pas que les données de formation en tant que telles ne soient pas publiées.
Définition finale en octobre. Cette définition définitive d'une « IA Open Source » devrait être achevée en octobre prochain, lors de la conférence All Things Open 2024. L'OSI continue d'encourager chacun à apporter sa contribution lorsqu'il s'agit de définir cette définition définitive, et l'a fait. créé un forum de discussion public pour débattre du sujet.
Quel impact aura la définition ? L'émergence d'une définition formelle et acceptée de « l'IA Open Source » peut être particulièrement importante pour le développement de futurs modèles tant par les entreprises que par les individus ou les groupes travaillant de manière indépendante : le respect des exigences de cette définition garantira que ces exigences, qui stimuleront sans aucun doute l'Open Modèles sources, comme c'est déjà le cas depuis quatre décennies dans le cas des logiciels open source.
Images | Antoine Quintano
À Simseo | L’Open Source est en plein essor et connaît un âge d’or, mais il y a aussi quelques postures