Les alternatives "ouvertes" à ChatGPT sont en augmentation, mais à quel point l'IA est-elle vraiment ouverte ?

Les alternatives « ouvertes » à ChatGPT sont en augmentation, mais à quel point l’IA est-elle vraiment ouverte ?

Crédit : domaine public Unsplash/CC0

Le ChatGPT d’OpenAI semble omniprésent, mais les versions open source des générateurs de texte réglés sur les instructions prennent le dessus. En seulement six mois, au moins 15 alternatives sérieuses ont vu le jour, qui ont toutes au moins un avantage important sur ChatGPT : elles sont beaucoup plus transparentes. La connaissance des données et des algorithmes de formation est essentielle pour une utilisation responsable de l’IA générative, affirme une équipe de linguistes et de chercheurs en technologie linguistique de l’Université Radboud.

Les chercheurs ont cartographié ce paysage en évolution rapide dans un article et un site Web mis à jour en direct. Cela montre qu’il existe de nombreux générateurs de texte « open source » alternatifs fonctionnels, mais aussi que l’ouverture se fait par degrés et que de nombreux modèles héritent de restrictions légales. Ils sonnent une note d’optimisme prudent.

Le chercheur principal Andreas Liesenfeld a déclaré : « C’est bien de voir émerger autant d’alternatives ouvertes. ChatGPT est si populaire qu’il est facile d’oublier que nous ne savons rien des données d’entraînement ou d’autres astuces jouées dans les coulisses. C’est un responsabilité pour quiconque souhaite mieux comprendre ces modèles ou créer des applications sur eux. Les alternatives ouvertes permettent la recherche critique et fondamentale.

De plus en plus ouvert

Des entreprises comme OpenAI prétendent parfois que l’IA doit être gardée secrète parce que l’ouverture peut entraîner des « risques existentiels », mais les chercheurs ne sont pas impressionnés. Le chercheur principal Mark Dingemanse déclare : « Garder tout fermé a permis à OpenAI de cacher des pratiques de travail exploitantes. Et parler de soi-disant risque existentiel détourne l’attention des dommages réels et actuels comme la confabulation, la sortie biaisée et les raz-de-marée de contenu de spam. L’ouverture, selon les chercheurs, permet de tenir plus facilement les entreprises responsables des modèles qu’elles créent, des données qui y entrent (souvent protégées par le droit d’auteur) et des textes qui en sortent.

La recherche montre que les modèles varient dans leur degré d’ouverture : beaucoup ne partagent que le modèle de langage, d’autres fournissent également un aperçu des données de formation, et un certain nombre sont largement documentés. Mark Dingemanse déclare : « Dans sa forme actuelle, ChatGPT est impropre à une utilisation responsable dans la recherche et l’enseignement. Il peut régurgiter des mots mais n’a aucune notion de sens, de paternité ou d’attribution appropriée. Et qu’il est gratuit signifie simplement que nous fournissons à OpenAI travail gratuit et accès à notre intelligence collective. Avec des modèles ouverts, nous pouvons au moins jeter un coup d’œil sous le capot et prendre des décisions éclairées concernant la technologie.

Quelques points supplémentaires

  • De nouveaux modèles apparaissent chaque mois, le document est donc principalement un appel à l’action pour suivre leur ouverture et leur transparence de manière systématique. Un site Web d’accompagnement rend cela possible
  • De nombreux modèles empruntent des éléments les uns aux autres, ce qui peut conduire à des situations juridiques troubles. Par exemple, le populaire modèle Falcon 40B-instruct s’appuie sur un ensemble de données (Baize) destiné strictement à des fins de recherche, mais les fabricants de Falcon encouragent toujours les utilisations commerciales.
  • L’une des principales raisons pour lesquelles ChatGPT semble si fluide est le travail humain qui entre dans l’étape de réglage des instructions (RLHF), dans laquelle la sortie du modèle est ajustée et élaguée pour la rendre plus docile et plus conversationnelle. Les modèles ouverts permettent de rechercher ce qui rend les gens si sensibles à la suggestion d’une véritable interactivité.

Les chercheurs présenteront leurs conclusions à la conférence internationale sur les interfaces utilisateur conversationnelles à Eindhoven, Pays-Bas, du 19 au 21 juillet, et leur article est disponible sur le arXiv serveur de préimpression.