Meta ne peut s'empêcher de se vanter que l'IA de Llama est Open Source.  Ce n'est pas vrai du tout

Meta ne peut s'empêcher de se vanter que l'IA de Llama est Open Source. Ce n'est pas vrai du tout

Même si Mark Zuckerberg avait déjà anticipé le lancement un mois plus tôt, c'est en juillet 2023 que Meta a annoncé le lancement de Llama 2. Dès le début, ils nous l'ont vendu comme une sorte de « ChatGPT Open Source », et l'entreprise n'a pas arrêté m'en vanter, mais il y a un problème.

Quoi Llama 2 n'est pas Open Source.

Ce n’est pas le cas, du moins au sens strict de la définition. Sur le site officiel, les responsables de Meta ont indiqué dès le premier instant que Llama 2 était Open Source et gratuit pour un usage commercial et de recherche.

Lorsque vous le téléchargez, vous obtenez le code du modèle, les poids appliqués à son réseau neuronal, le code d'évaluation et la documentation. Cependant, les responsables de l'Open Source Initiative ont précisé deux jours après le lancement que Llama 2 ne pouvait pas être considéré comme totalement Open Source :

« Meta confond «Open Source» avec «ressources accessibles à certains utilisateurs sous certaines conditions», deux choses très différentes. »

Comme souligné dans cette clarification, Llama 2 n'est pas conforme à la définition Open Source (OSD) qui, entre autres exigences, impose qu'il n'y ait aucune restriction contre des personnes, groupes ou domaines d'activité spécifiques.

Cependant, la licence utilisée dans les modèles et codes Llama impose des restrictions sur leur utilisation commerciale pour certains utilisateurs : si votre produit est basé sur Llama et que vous avez plus de 700 millions d'utilisateurs mensuels actifs, vous devez payer une licence à Meta.

Cela limite certes grandement les scénarios dans lesquels cette exigence sera dépassée, mais ici Meta protège ses arrières si ce produit théorique se développe beaucoup. Imaginez que quelqu'un crée une alternative à ChatGPT basée sur Llama. Au départ, vous n'aurez rien à payer à Meta, mais si le produit devient viral et finit par être adopté massivement, cela vous obligera à contracter une licence et à la payer.

De plus, chez Meta, ils ne partagent pas les données utilisées pour les former – la transparence en ce sens est nulle dans l’industrie – ni le code utilisé pour les former. À l'OSI, ils ont célébré le fait que Meta « réduisait les obstacles à l'accès à de puissants systèmes d'IA », mais ils ont critiqué cette utilisation conflictuelle du terme Open Source.

Il n'existe pas de modèles d'IA totalement Open Source

La vérité est que même sans être « complètement » Open Source, Llama 2 a réussi à devenir une référence pour les développeurs. Certains d’entre eux ont cependant voulu alerter sur les dangers de fonder leurs travaux sur des modèles aux limites d’usage.

Capture d'écran 2024 05 29 Au 16 09 04
Capture d'écran 2024 05 29 Au 16 09 04

Le tableau créé par un groupe de chercheurs néerlandais est un excellent moyen d’apprécier le degré d’ouverture des modèles d’IA. C'est beaucoup plus long, d'ailleurs, vous pouvez cliquer sur l'image pour accéder à la source. Source : FAccT'24.

Le groupe de chercheurs de l’Université Radboud de Nimègue, aux Pays-Bas, a publié un tableau fantastique. Dans celui-ci, 14 caractéristiques de différents modèles sont évaluées en fonction de leur ouverture, et grâce à cela, il est possible de savoir quels modèles correspondent plus (ou moins) à la pure définition de l'Open Source. L'appel 2 ne l'a pas fait, mais c'est juste ça En fait, aucun d’entre eux ne répond aux exigences. de cette table exigeante.

Le tableau a été mis à jour avec les nouveaux modèles publiés, y compris le dernier modèle Meta, Llama 3. Dans cette dernière version, Meta a été un peu plus prudent lorsqu'il s'agit de se vanter que le modèle est Open Source, bien que le les mêmes conditions s’appliquent à sa licence que le modèle précédent.

Capture d'écran 2024 05 29 À 16 21 30
Capture d'écran 2024 05 29 À 16 21 30

En bas du tableau se trouvent à la fois LlaMA 2 et Llama 3 et, en dernière position, avec pratiquement tous les champs étiquetés « fermés », ChatGPT-3.5.

Sur le site officiel, il est dit qu'il est « ouvertement disponible », mais dans l'article supplémentaire sur leur blog, ils ont indiqué qu'il était Open Source, mais comme pour Llama 2, ce n'est que partiellement le cas.

L'un et l'autre Ils les considèrent comme des modèles « à poids ouvert ». (« poids ouverts ») car il fournit des informations sur la manière dont ses calculs sont effectués. Dans le tableau des chercheurs des Pays-Bas, oui, les deux se trouvent en bas.

Pire encore est ChatGPT, qui échoue avec force en matière d'ouverture, ce qui est ironique étant donné qu'il est développé par OpenAI. Elon Musk tente de confronter cette entreprise depuis un certain temps, et je ne doute pas en exigeant qu'ils changent de nom, puis j'ai fait une blague sur Twitter à ce sujet.

La réalité est que la transparence dans ce domaine est très limitée, et même les modèles qui prétendent être Open Source ne le sont jamais complètement. Llama 2 et Llama 3 le démontrent tous deux, mais malgré cela, Meta a réussi à se proclamer défenseur de la philosophie Open Source.

Et chemin faisant, il a d’ailleurs racheté l’image de Mark Zuckerberg. Ils l'indiquent dans le New York Times : le PDG de Facebook, autrefois vilipendé et mis en cause pour les scandales relatifs à la vie privée du réseau social, est désormais apprécié des développeurs.

Il y est parvenu grâce à Llama 2, qui a été téléchargé 180 millions de fois et permet aux chercheurs, universitaires, startups et petits développeurs d'entrer dans le monde de l'IA avec des ressources de départ notables. Llama 3 semble suivre le même chemin et réussit déjà Hugging Face. Là, il est possible de l'utiliser facilement et il a déjà été téléchargé un million de fois en seulement un mois.

Mark Zuckerberg et Meta ont certainement beaucoup à remercier le monde de l'Open Source. Bien que votre utilisation du terme ne soit pas tout à fait correcte.

Images | Antoine Quintano

À Simseo | Yann LeCun, responsable de l'IA chez Meta, est clair : des modèles comme ChatGPT ne pourront pas rivaliser avec l'intelligence humaine