Une approche de la chaîne de brouillon permet aux modèles d'IA d'effectuer des tâches en utilisant beaucoup moins de ressources

Une approche de la chaîne de brouillon permet aux modèles d’IA d’effectuer des tâches en utilisant beaucoup moins de ressources

Une petite équipe d’ingénieurs d’IA chez Zoom Communications a développé une nouvelle approche de la formation des systèmes d’IA qui utilise beaucoup moins de ressources que l’approche standard actuellement utilisée. L’équipe a publié ses résultats sur le arxiv serveur de préimprimée.

La nouvelle approche développée chez Zoom est appelée chaîne de projet (COD), une mise à jour de l’approche traditionnelle maintenant utilisée appelée chaîne de pensée (COT). COT utilise une approche étape par étape pour résoudre un problème, similaire à bien des égards à la résolution de problèmes humains. L’équipe de recherche a noté que le COT a tendance à générer plus d’étapes que nécessaire pour résoudre un problème et a trouvé un moyen de les réduire.

Les humains ne pensent généralement pas à chaque étape impliquée dans la résolution d’un problème, surtout s’ils les écrivent, car certaines étapes sont considérées comme des connaissances de base. Au lieu de cela, ils sautent ou combinent certains d’entre eux. Le résultat est une liste d’étapes essentielles.

C’est que les chercheurs suggèrent que l’essence de la morue. Ils ont accompli cela en pratique en limitant un moteur rapide pour permettre un maximum de cinq mots. Cela a forcé le moteur à être plus concis et plus clair, et a réduit le nombre d’étapes nécessaires pour décrire comment un problème doit être résolu.

Pour tester leurs idées, les chercheurs ont modifié les modèles d’IA de test, tels que Claude 3.5 Sonnet, pour les forcer à utiliser COD au lieu de COT. Ils ont constaté que le nombre de jetons nécessaires pour résoudre un problème était considérablement réduit.

Dans une ligne de questions liées au sport, par exemple, ils ont constaté que les jetons utilisés par le système ont été réduits de 189,4 à seulement 14,3, même si la précision s’est améliorée de 93,2 à 97,35. Leur approche a permis aux LLMS de fournir des réponses en utilisant moins de mots – dans certains cas, en utilisant 7,6% des mots utilisés par les modèles traditionnels à l’aide de COT, tout en améliorant la précision.

L’utilisation de COD au lieu de COT dans de nombreuses applications, telles que les mathématiques, le codage ou toute autre logique, pourrait utiliser beaucoup moins de ressources de calcul, ce qui signifierait à son tour une réduction du temps de traitement et des coûts associés. L’équipe affirme que les organisations utilisant des applications d’IA basées sur le COT pourraient être commutées sur COD avec un minimum d’effort.

Le code et les données pour son utilisation ont été publiés sur GitHub.