La collaboration Microsoft développe DroidSpeak pour une meilleure communication entre les LLM

La collaboration Microsoft développe DroidSpeak pour une meilleure communication entre les LLM

Une équipe d'ingénieurs informaticiens et de spécialistes de l'IA de Microsoft, en collaboration avec deux collègues de l'Université de Chicago, a conduit au développement d'un nouveau langage qui permet aux LLM de communiquer plus efficacement entre eux. Le groupe a publié un document décrivant les idées derrière le nouveau langage, son fonctionnement et les types d'améliorations d'efficacité qu'il peut conduire, sur le arXiv serveur de préimpression.

Les chercheurs travaillant au développement de systèmes d'IA plus puissants ont noté que l'un des domaines de recherche les plus prometteurs consiste à créer des modèles d'IA spécifiques à un problème, qui sont vraiment efficaces pour résoudre un type de problème (faire des prévisions météorologiques ou économiques, par exemple) et permettre ensuite ces applications pour communiquer entre elles afin de créer un système d'IA universel.

Dans ce nouvel effort, l’équipe de recherche a noté que les LLM se parlent actuellement principalement en anglais, ce qui est logique car c’est la langue qu’ils utilisent pour interagir avec les humains, du moins dans les pays anglophones. Mais ils ont également noté que cela pourrait être le moyen le plus efficace de parler aux humains, mais que ce n’est pas le moyen le plus efficace pour eux de se parler. Pour résoudre le problème, ils ont créé un tout nouveau langage parlé uniquement par les LLM : DroidSpeak.

L'idée derrière DroidSpeak était de permettre aux LLM de communiquer en utilisant le langage mathématique qui sous-tend les LLM eux-mêmes. Le nom est un clin d’œil au langage utilisé par les robots dans les films Star Wars. Les chercheurs ont également noté que le plus gros goulot d'étranglement dans la communication LLM à LLM vient des systèmes qui signalent chaque étape qu'ils effectuent : une écoute LLM devrait donc traiter toutes les informations à chaque étape. De tels goulots d’étranglement peuvent s’aggraver rapidement à mesure que les LLM se répondent les uns les autres.

Pour briser ce goulot d'étranglement, les chercheurs ont créé un langage qui permet aux LLM de partager uniquement les données générées, plutôt que tout ce qui a conduit à leur découverte. Son utilisation a permis à deux LLM de test de communiquer 2,78 fois plus rapidement.

Pour que leur langage fonctionne de manière optimale, l’équipe de recherche a découvert qu’elle devait utiliser le même type de modèle LLM à chaque extrémité. Il y a donc encore place à l’amélioration. Ils suggèrent que DroidSpeak évoluera probablement avec le temps, comme c'est le cas avec les langages humains, ce qui le rendra plus robuste.