Un nouvel ensemble de données sur les chefs apporte l’IA à la cuisine
L’intelligence artificielle (IA) peut aider les gens à magasiner, à planifier et à écrire, mais pas à cuisiner. Il s’avère que les humains ne sont pas les seuls à avoir du mal à suivre les recettes étape par étape dans le bon ordre, mais de nouvelles recherches du College of Computing du Georgia Institute of Technology pourraient changer cela.
Les chercheurs ont créé un ensemble de données appelé ChattyChef, qui utilise des modèles de traitement du langage naturel pouvant aider un utilisateur à cuisiner une recette. À l’aide du grand modèle de langage open source GPT-J, l’ensemble de données de dialogues de cuisine de ChattyChef suit les recettes avec l’utilisateur.
Les chercheurs ont présenté leur IA dans l’article « Improved Instruction Ordering in Recipe-Grounded Conversation », présenté lors de la 61e réunion annuelle de l’Association for Computational Linguistics, et l’étude est également publiée sur le arXiv serveur de préimpression
Bien que d’autres chercheurs aient théorisé la possibilité d’un chef IA, les travaux de Georgia Tech font avancer le domaine. « Nous sommes l’une des premières équipes de recherche à analyser les défis liés à l’utilisation de grands modèles de langage pour construire un chef IA », a déclaré Duong Le, titulaire d’un doctorat. étudiant à l’école d’informatique interactive.
La plupart des tentatives d’utilisation de modèles de langage pour cuisiner échouent parce que GPT-J ne comprend pas ce que l’utilisateur veut faire ensuite, ou l’intention de l’utilisateur, et a du mal à suivre jusqu’où l’utilisateur se trouve dans la recette – ce que les chercheurs appellent « l’état de la conversation. » Il ne peut pas non plus répondre facilement aux questions de clarification, comme sur les quantités d’ingrédients ou les temps de cuisson.
Par exemple, quelqu’un essaie peut-être de cuisiner des pommes de terre rissolées. L’IA leur dit de faire fondre le beurre dans la poêle et d’ajouter les pommes de terre. L’utilisateur demande alors quelle est la prochaine étape. Un mauvais bot peut brouiller la commande et lui dire de servir le hashbrown même s’il n’a pas encore fini de le faire cuire. Ou un utilisateur pose une question de suivi sur la durée de cuisson du hashbrown, et l’IA ne sera pas assez précise, donnant à la place un temps général et ne spécifiant pas le temps de cuisson de chaque côté.
Dans cet esprit, les chercheurs se sont assurés que leur modèle avait deux caractéristiques clés :
- Détection de l’intention de l’utilisateur pour déterminer l’intention actuelle de l’utilisateur dans un ensemble fixe de possibilités, telles que « Demander la prochaine instruction » ou « Demander des détails sur les ingrédients ».
- Suivi de l’état des instructions pour identifier à quelle étape de la recette se trouve l’utilisateur, ce qui fonctionne avec une précision de 80 %.
Les informations combinées de ces fonctionnalités prennent en charge la troisième innovation de ChattyChef : la génération de réponses. L’intention de l’utilisateur aide à générer la meilleure réponse pour répondre à la question d’un utilisateur. L’état d’instruction sélectionne les parties les plus pertinentes de la recette plutôt que d’inclure la recette entière, pour éviter de confondre l’utilisateur ou de le surcharger avec des étapes supplémentaires pendant la cuisson.
L’ensemble de données ChattyChef est construit à partir de recettes WikiHow avec des notes positives et moins de huit étapes. Les chercheurs ont recruté des personnes pour jouer un rôle sur la manière dont elles pourraient utiliser ChattyChef afin de déterminer quelles instructions seraient les meilleures à inclure dans l’ensemble de données.
Les chercheurs pensent que les innovations de ChattyChef pourraient être utilisées dans de nombreux domaines autres que la cuisine, tels que les manuels de réparation ou la documentation des logiciels.