La nouvelle plate-forme permet des interactions plus faciles, moins chères et plus sûres avec de grands modèles de langage comme ChatGPT
Des chercheurs de l’ETH Zurich ont créé une nouvelle plate-forme open source et un nouveau langage de programmation appelé LMQL. Ce langage de programmation rend l’interaction plus facile, moins chère et plus sûre avec de grands modèles de langage comme ChatGPT.
Le modèle de langage ChatGPT est largement connu des membres de la communauté technologique et du grand public. Grâce à un chatbot, on peut interagir directement avec ces modèles de langage sans avoir besoin de compétences en programmation. Au lieu d’utiliser du code, l’utilisateur peut saisir des commandes et des questions en langage naturel.
Parfois, cette interaction fonctionne bien et le résultat souhaité apparaît à l’écran. Cependant, à d’autres moments, le modèle de langage ne comprend pas la commande et la sortie générée peut s’avérer inattendue ou même insatisfaisante. Ce que les gens font habituellement comme réponse, c’est qu’ils font un suivi avec une autre requête. ChatGPT tentera alors de corriger ses erreurs et d’adapter sa réponse. Cette façon d’utiliser un modèle de langage est désordonnée et aléatoire, et cela peut prendre un certain temps pour obtenir le résultat souhaité.
Pour résoudre ce problème, les chercheurs de l’ETH ont maintenant développé un nouveau langage de programmation et une plate-forme open source appelée LMQL (Language Model Query Language). L’utilisation de LMQL permet à un utilisateur d’interagir avec de grands modèles de langage comme ChatGPT d’une manière plus élevée et contrôlée. Ce langage de programmation permet une nouvelle façon de programmer et constitue une nouvelle forme d’interaction homme-ordinateur, car l’utilisateur peut parler directement à l’ordinateur et l’instruire.
LMQL est le premier langage qui combine la puissance des langages naturels et de programmation pour interagir avec ces grands modèles de langage. Pour les requêtes simples, il suffit de guider ChatGPT en langage naturel. Cependant, pour des tâches plus complexes et spécifiques, telles que la création d’une base de données ou l’analyse de données, il est essentiel d’instruire précisément le modèle de langage. Par conséquent, le formalisme des langages de programmation est nécessaire pour guider le modèle de langage avec des constructions formelles afin de garantir que l’utilisateur obtient la sortie souhaitée.
Martin Vechev, professeur d’informatique et l’un des créateurs, précise : « Au fond, c’est une manière beaucoup plus concise d’obtenir ce que l’on veut. Diminuer les échanges nécessaires avec le modèle de langage réduit également les coûts d’interaction avec le modèle, ce qui peut être assez coûteux. L’utilisation de LMQL augmente les chances d’obtenir le résultat souhaité. Cela permet même parfois d’obtenir un résultat que vous n’auriez jamais obtenu autrement, car vous pouvez formuler votre requête avec plus de précision.
Un avantage clé
Les ensembles de données avec lesquels les grands modèles de langage sont formés et sur lesquels ils sont basés sont si volumineux que l’utilisateur ne peut pas contrôler et comprendre ce qui se passe en interne dans le modèle. Pour cette raison, ces modèles peuvent parfois produire des résultats inattendus ou controversés. Selon les chercheurs, l’un des problèmes substantiels pour les personnes utilisant ces grands modèles de langage est qu’ils ne peuvent pas comprendre pourquoi un certain résultat a été produit et comment l’empêcher.
LMQL permet à son utilisateur d’exprimer des contraintes de sécurité qui peuvent aider à guider le modèle dans la bonne direction et essayer de l’éloigner des sorties indésirables ou inattendues. « En utilisant LMQL, vous pouvez restreindre votre modèle de langage pour qu’il suive strictement un cadre spécifique que vous avez conçu. Cela vous permet de mieux contrôler le comportement du modèle de langage. Bien sûr, la prévention complète et garantie des mauvais comportements est encore très difficile à atteindre, mais LMQL est un pas dans cette direction », explique Luca Beurer-Kellner, l’un des chercheurs. Par exemple, LMQL permet à l’utilisateur d’exclure des mots spécifiques ou empêche le modèle d’aller dans certaines directions de raisonnement.
La transparence est la clé
De nombreuses entreprises développent leurs grands modèles linguistiques à huis clos. De ce fait, les grands modèles de langage deviennent opaques et leur raisonnement derrière une sortie particulière est incompréhensible pour l’utilisateur. Selon les chercheurs, pour contrebalancer cela, le milieu universitaire doit produire des outils open source comme LMQL qui sont transparents, accessibles et adaptables pour les gens.
Marc Fischer, qui a également développé le nouveau langage de programmation, déclare en outre : « Je pense que pour une foule technique et non technique, il est crucial d’avoir cette source ouverte pour voir ce qui se passe plutôt que LMQL soit une boîte noire magique. . D’autant plus que la recherche sur les modèles linguistiques évolue à un rythme effréné, il est crucial que LMQL offre à la fois de la transparence et permette un développement rapide. »
Un outil utile même pour les utilisateurs moins expérimentés
LMQL est un langage déclaratif de type SQL d’un point de vue syntaxique. Par conséquent, c’est un langage très accessible nécessitant moins d’expertise pour atteindre les résultats souhaités. Le nouveau langage de programmation peut également fonctionner comme un outil innovant pour les chercheurs de diverses disciplines. « Si vous n’êtes pas trop investi dans le codage ou si vous n’avez pas le temps de coder parce que ce n’est pas une partie essentielle de votre travail, alors LMQL le rend beaucoup plus accessible pour interagir avec de grands modèles de langage de manière précise mais simple », explique Beurer-Kellner.
De plus, il peut servir de base utile pour les utilisateurs avancés et une communauté d’experts, car vous pouvez ajouter différentes constructions de programmation à la requête en langage naturel. Les utilisateurs de programmeurs techniques peuvent utiliser LMQL comme bloc de construction et créer leurs propres programmes par-dessus pour interagir avec de grands modèles de langage.
Un vaste intérêt et une communauté interdisciplinaire commencent déjà à se former autour du nouveau langage de programmation. Les chercheurs déclarent LMQL un projet à long terme et prévoient plusieurs suivis et articles. Ils ont également été acceptés pour présenter leurs travaux en juin à l’ACM PLDI, une conférence internationale sur la conception et la mise en œuvre des langages de programmation.