L'algorithme Quiet-STaR permet au chatbot de réfléchir à sa réponse possible avant de répondre

Une collaboration entre des chercheurs en IA de l'Université de Stanford et Notbad AI Inc. a abouti au développement d'un algorithme qui permet aux chatbots actuels de réfléchir aux réponses possibles à une requête avant de donner sa réponse finale. L'équipe a publié un article sur arXiv serveur de prépublication décrivant leur nouvelle approche et le fonctionnement de leur algorithme lorsqu'il est associé à un chatbot existant.

Comme le notent les chercheurs, l’approche générale adoptée par les chatbots actuels consiste à développer une réponse à une requête posée par un humain à l’aide de données d’entraînement. Aucun des chatbots actuellement utilisés par le public ne s’arrête pour réfléchir à plusieurs réponses possibles à une requête avant de donner celle qui, selon lui, est la plus susceptible d’être celle que l’humain voulait. Si un humain répondait de cette manière, cela serait simplement décrit comme laissant échapper une réponse.

Dans cette nouvelle étude, l’équipe de recherche a donné aux chatbots un moyen de réfléchir un peu avant de répondre et, ce faisant, prétend avoir créé un moyen permettant aux chatbots d’être beaucoup plus précis et de répondre aux questions de manière plus humaine.

L'algorithme Quiet-STaR fonctionne en demandant d'abord au chatbot de produire plusieurs réponses à une requête donnée. Il compare les réponses avec la requête d'origine pour décider laquelle semble être la meilleure. Il demande ensuite au chatbot de renvoyer cette réponse à l'utilisateur. L’équipe a également donné à l’algorithme la possibilité d’apprendre de son propre travail, améliorant ainsi ses capacités de réflexion au fil du temps.

Pour tester leur algorithme, les chercheurs l'ont ajouté au chatbot open source Mistral 7B et l'ont testé à l'aide d'un test de raisonnement standard : il a obtenu un score de 47,2 %. Sans l'algorithme, Mistral 7B n'a obtenu que 36,3 %. Il a également obtenu de bien meilleurs résultats à un test de mathématiques.

L’équipe de recherche note que leur algorithme pourrait être connecté à n’importe lequel des chatbots actuellement utilisés, même si cela devrait être fait par leurs créateurs, ce qui, selon eux, pourrait améliorer la précision des chatbots en général.