Les agents IA pourraient être la prochaine révolution
Ce petit lapin va avoir du mal à réussir. Non pas parce que c’est une mauvaise idée, mais bien au contraire. Lorsque Jesse Lyu présentait son Rabbit R1, il nous révélait le potentiel futur des chatbots à intelligence artificielle : ils ne se contenteraient plus de répondre à nos questions, mais pourraient agir en conséquence. Cet appareil est un parfait exemple de ce qu’on appelle les agents IA, et ici nous verrons probablement (beaucoup) de mouvement bientôt.
Une bonne idée. Lors de cette présentation début 2024, le petit et original Rabbit R1 a démontré comment il était capable de réserver un Uber ou de commander une table dans un restaurant. Il est donc allé plus loin que ChatGPT et ses concurrents, car ils sont capables de vous indiquer comment se déplacer d'un endroit à un autre ou de vous recommander un restaurant, mais ils ne vont pas au-delà. Non .
Agents IA. Mais le Rabbit R1 le fait, et le secret réside dans son modèle d'IA, appelé LAM (Large Action Model), qui est une sorte de « majordome » qui se connecte à certaines plateformes pour exécuter les actions suggérées par l'autre partie (le chatbot). C'est comme un ChatGPT survitaminé, car il répond d'abord à nos questions (« Où manger des sushis ? ») puis agit en conséquence (« Je te réserve une table au restaurant X si tu veux »). C’est ce que font les agents dits IA, et tous constituent une révolution intéressante dans ce domaine.
Une idée qui est venue il y a des mois. Bien que Rabbit R1 ait été la démonstration la plus claire de ce que les agents d’IA peuvent faire, l’idée vient de quelque chose de plus ancien. Nous avons commencé à en parler sans utiliser ce terme il y a presque un an, lorsque nous avons découvert AutoGPT. Ce modèle d'IA, dont le code est disponible sur GitHub, est un « créateur d'agents » qui font des choses pour nous. A cette époque il était essentiellement axé sur la programmation, mais ses options vont plus loin et un agent créé avec AutoGPT est par exemple capable de contrôler un ordinateur en utilisant les mêmes entrées et sorties dont un utilisateur humain profiterait.
Et ils vont plus loin. Ces derniers jours, nous avons assisté à la naissance d’un autre agent d’IA prometteur. Son nom est Devin et il a été décrit par ses créateurs comme « le premier ingénieur logiciel en IA », capable de détecter et de corriger lui-même les erreurs de code. Un concurrent de Devin appelé MAGIS est récemment apparu, développé par des chercheurs chinois et qui est également capable de résoudre de manière autonome les erreurs dans les projets GitHub.
Aussi dans les jeux vidéo. Ces types de modèles d’IA sont également intéressants dans le monde du jeu vidéo. Google DeepMind l'a démontré il y a deux semaines en dévoilant SIMA, un agent IA formé pour apprendre à jouer seul à des jeux vidéo, même dans des mondes ouverts. Selon les responsables, cette interaction avec les mondes virtuels peut s'avérer importante pour pouvoir ensuite appliquer cet apprentissage dans le monde réel.
Chez OpenAI (et autres), ils le font déjà. Comme nous l'avons dit, le mauvais côté d'avoir une bonne idée comme celle de Rabbit est que quelqu'un finira probablement par la copier. C'est ce que fera apparemment OpenAI, qui, selon des sources proches de l'entreprise, prépare « un type d'agent logiciel qui automatise des tâches complexes en prenant le contrôle efficace de l'appareil du client ». Pendant ce temps, l'ancien PDG de Salesforce, Bret Taylor, et son partenaire, Clay Bavor, ancien cadre de Google, préparent également un projet appelé Sierra pour amener des agents d'IA dans les entreprises.
Mais ils doivent le faire correctement. Le plus grand défi à ce stade n’est pas tant que les chatbots soient actifs et non passifs, mais que lorsqu’ils agissent, ils ne commettent pas d’erreurs. ChatGPT et ses concurrents font souvent des erreurs et inventent des choses, donc si cela se traduit par une action concrète, les conséquences pourraient être désastreuses. Pour l'instant, le Rabbit R1 a résolu le problème de la manière la plus logique : son agent IA vous le demande avant de faire quoi que ce soit. Si vous ne confirmez pas cette réservation Uber ou au restaurant, tout reste tel qu'il était.
Images | Darrencoxon avec Midjourney
À Simseo | Gemini Nano va être une révolution et c'est ce que je veux que Siri soit dans iOS 18