Les chercheurs pèsent les avantages et les inconvénients de ChatGPT Code Interpreter et attendent les mises à niveau
Alors que les chercheurs de l’Université de Virginie occidentale voient le potentiel du tout nouveau plugin officiel ChatGPT, appelé Code Interpreter, dans les contextes éducatifs, ils ont découvert des limites à son utilisation par les scientifiques qui travaillent avec des données biologiques en utilisant des méthodes informatiques pour prioriser le traitement ciblé du cancer et des troubles génétiques.
« Code Interpreter est une bonne chose et il est utile dans un cadre éducatif car il rend le codage dans les domaines STEM plus accessible aux étudiants », a déclaré Gangqing « Michael » Hu, professeur adjoint au département de microbiologie, d’immunologie et de biologie cellulaire de la WVU. École de médecine et directeur du noyau de bioinformatique.
« Cependant, il ne possède pas les fonctionnalités dont vous avez besoin pour la bioinformatique. Ce sont des problèmes techniques qui peuvent être surmontés. Les développements futurs de Code Interpreter sont susceptibles d’étendre son utilisation à de nombreux domaines tels que la bioinformatique, la finance et l’économie. »
Depuis sa sortie en décembre 2022, le populaire chatbot d’intelligence artificielle ChatGPT a attiré l’attention des entreprises, des enseignants et du grand public. Cependant, il n’a pas tout à fait répondu aux besoins des personnes travaillant dans la recherche biomédicale, notamment en bioinformatique (le domaine où l’informatique rencontre la biologie), qui attendaient avec impatience le plugin Code Interpreter d’OpenAI, espérant qu’il comblerait les lacunes.
Hu et son équipe ont testé Code Interpreter sur diverses tâches pour évaluer ses fonctionnalités. Leurs conclusions, publiées dans Annales du génie biomédicalmontre que le plugin élimine certaines barrières, mais pas toutes.
Par exemple, les personnes sans formation scientifique auront facilement accès au codage ou à la programmation informatique grâce à Code Interpreter. Hu a déclaré que c’était également rentable et suscitait la curiosité des étudiants pour explorer l’analyse des données et renforçait leur intérêt pour l’apprentissage. Il souligne cependant que les utilisateurs devront comprendre comment interpréter les données, reconnaître si les résultats sont exacts et savoir comment interagir avec le chatbot.
Les bioinformaticiens s’appuient sur un codage précis, des logiciels informatiques et un accès à Internet pour stocker, analyser et interpréter des données biologiques telles que l’ADN et le génome humain, utilisées pour les progrès de la médecine moderne.
Malgré le besoin d’améliorations spécifiques à la bioinformatique, a déclaré Hu, Code Interpreter aide les utilisateurs à déterminer si une réponse est exacte ou s’il s’agit d’une réponse fictive présentée avec confiance, connue sous le nom d’hallucination.
« Les gens savent que ChatGPT peut faire beaucoup de choses impressionnantes, mais il n’est pas doué pour fournir une citation ou une référence pour étayer sa réponse. Si on lui pose des questions sur la source pour étayer l’affirmation d’une réponse, il peut commencer à inventer des références, « , a expliqué Hu. « Code Interpreter fournit une solution pour minimiser les hallucinations. Pour les questions qui peuvent être résolues par le codage, le code lui-même sert de source ou de citation. C’est un pas en avant important. »
Lei Wang, chercheur postdoctoral au département de microbiologie, d’immunologie et de biologie cellulaire de la WVU, travaillait avec Hu ; Xijin Ge, de l’Université d’État du Dakota du Sud ; et Li Liu, de l’Université d’État de l’Arizona.
L’équipe a trouvé des résultats positifs dans la capacité de Code Interpreter à convertir des données en tableaux et graphiques.
Les suggestions de mises à niveau de Code Interpreter incluent l’accès à Internet pour le téléchargement de données génomiques, l’installation de logiciels spécifiques à la bioinformatique, l’extension de la capacité de stockage et la prise en charge de langages de programmation supplémentaires. En outre, les chercheurs ont découvert qu’il était nécessaire que les applications de confidentialité et de sécurité soient conformes aux réglementations telles que HIPAA.
En testant l’analyse des données, ils ont découvert plusieurs limites. Le plugin ne prend en charge qu’un seul programme informatique, Python, et peu de ses progiciels sont dédiés à la bioinformatique. De plus, il ne permet pas l’accès aux données Internet et n’a pas la capacité de travailler avec des fichiers volumineux.
« Cela autorise environ 100 mégaoctets, mais les fichiers que nous traitons sont au niveau du gigaoctet », a déclaré Hu. « De plus, il ne prend pas en charge le traitement parallèle nécessaire pour les grands ensembles de données, ce qui entraîne un ralentissement des performances. »
Hu a déclaré que même s’il prévoyait davantage de mises à niveau pour Code Interpreter, il prévoyait d’aider les étudiants à en apprendre davantage sur les avantages du plugin actuel.
« Dans ma classe au printemps prochain, je prévois d’introduire ce plugin pour aider les étudiants à en apprendre davantage sur la visualisation des données », a déclaré Hu. « L’IA est un domaine en évolution rapide. J’espère qu’à ce moment-là, OpenAI pourra surmonter certaines limitations afin de pouvoir être utilisée pour un large éventail de codage bioinformatique. »
Plus tôt cette année, Hu a mené une autre étude pour préparer les étudiants du secondaire et du collège à exploiter la puissance de ChatGPT en en apprenant davantage sur le codage. Le processus a utilisé OPTIMAL (Optimisation des invites grâce au mentorat et à l’évaluation itératifs) pour améliorer la communication avec un chatbot.
À long terme, Hu a déclaré qu’il continuerait à surveiller et à tester les nouveaux programmes et fonctionnalités de l’IA.
« Au fur et à mesure que de nouveaux produits se développent, je continuerai », a déclaré Hu. « Il existe certainement de nombreuses autres utilisations innovantes à découvrir. »