des "agents" qui font des choses pour nous

des « agents » qui font des choses pour nous

ChatGPT est très bon. Il est capable de répondre à nos questions, et même s'il fait parfois des erreurs ou se trompe, lui et ses rivaux peuvent être très utiles. Le problème, bien sûr, c’est qu’ils ne répondent qu’à ces questions. Ils ne sont pas en mesure d'agir en conséquence.

Si vous demandez à ChatGPT ou à n’importe quel chatbot la recette des spaghettis carbonara, il vous la proposera sans problème. Le problème est que j'y resterai: C'est nous qui devrons acheter les ingrédients et les cuisiner.

C’est là qu’interviennent les agents d’intelligence artificielle. Non seulement ils ont cette réponse, mais ils peuvent également agir en conséquence. Dans notre exemple, l'agent IA nous dirait non seulement comment préparer ce plat, mais serait également capable de créer une liste de courses dans un supermarché et passez la commande pour nous. L'agent IA nous demandera une confirmation pour que l'achat soit finalisé, bien sûr, mais cela nous fera gagner du temps. Et c’est là l’idée : ce qui s’applique à l’exemple de recette s’applique à de nombreux autres cas et scénarios.

La course aux agents IA a déjà commencé

C’est là que se trouvent les grandes entreprises technologiques. Contrairement à un simple « bot » qui suit une séquence grossière d’instructions, les agents autonomes sont censés être capables d’interagir avec leur environnement, d’apprendre des retours que nous leur donnons et de prendre des décisions sans intervention constante des humains. De nombreuses entreprises sont impliquées dans cette course ; Passons en revue leurs progrès :

  • Esprit profond. L'entreprise vient d'embaucher Tim Brooks, qui travaillait jusqu'ici chez OpenAI. Il l’a fait en tant que l’un des principaux responsables du développement de Sora, le modèle d’IA vidéo qui nous a déjà étonné il y a quelques mois. Son travail s’orientera désormais vers un scénario différent : les agents IA pour les jeux vidéo. La technologie, appelée SIMA (Scalable Instructable Multiworld Agent), permettra la création de quelque chose comme des « PNJ intelligents » comme ceux que NVIDIA développe également. L’intention finale n’est même pas cela, mais que « la recherche sur les agents puisse utiliser les jeux vidéo comme des bacs à sable pour mieux comprendre comment les systèmes d’IA peuvent devenir quelque chose de plus utile ». Ou ce qui revient au même : que ces avancées puissent ensuite être appliquées au monde réel.
  • Anthropique. Il y a quelques mois, l'entreprise a introduit un nouvel outil appelé « fonction d'appel » pour son chatbot Claude qui permettait à quiconque de créer un agent pour diverses fonctions telles que l'assistance à la rédaction d'e-mails ou même un robot pour acheter des chaussures. L'idée est relativement simple : l'outil peut analyser des données (notre historique d'achat) avec lesquelles il crée une série de recommandations de produits personnalisées.
  • OpenAI. Lors de la présentation de son modèle o1, les responsables d'OpenAI ont confirmé leur objectif de commercialiser des agents d'IA l'année prochaine. Kevin Weil, chef de produit de l'entreprise, a expliqué dans le Financial Times comment « nous voulons permettre d'interagir avec l'IA de la même manière que vous interagissez avec un autre être humain ». Sam Altman a expliqué en juillet comment ces agents autonomes feraient apparemment partie intégrante de GPT-5, la future version tant attendue de son grand modèle de langage pour son chatbot génératif d'IA. En mai dernier, Sam Altman avait indiqué dans le MIT Technology Review que ce que nous attendons vraiment de l’IA, c’est qu’elle nous aide. Bien sûr, avec un inconvénient inquiétant, car ce système serait « un collègue super compétent qui sait tout de nous ».
  • amazone. Le géant du commerce électronique reste dans un contexte étrange dans le domaine de l'IA, même si tout indique qu'il proposera bientôt des nouveautés importantes. Trishul Chilimbi, l'un des responsables de leurs efforts dans ce domaine, a indiqué dans Wired qu'ils travaillent déjà sur des agents IA capables de recommander des produits et même de les ajouter au panier. Il semble naturel de penser qu'avec tout ce qu'Amazon sait sur nos habitudes d'achat, avoir un assistant spécialisé dans ces deux tâches semble réalisable.

Comment garantir que l’intelligence artificielle ne devienne pas incontrôlable

  • Microsoft. Mustafa Suleyman, qui dirige la division IA de l'entreprise, a récemment expliqué que nous en sommes à la première des trois phases de ce déploiement d'IA générative. Pour l’instant, les chatbots nous parlent, mais la prochaine étape consiste à leur donner une mémoire persistante afin de pouvoir devenir plus tard des agents d’IA qui font des choses pour nous. Ils ont déjà des prototypes en développement, mais ces modèles expérimentaux sont encore verts. En fait, ils ont déjà des agents d’IA qui travaillent – ​​comme d’autres projets, nous l’avons vu avec Devin – dans leur suite de solutions destinées aux développeurs, mais l’objectif est d’appliquer ces solutions à de nombreux autres scénarios.
  • But. Lors du récent Meta Connect 24, nous avons pu voir comment Mark Zuckerberg a présenté Llama 3.2, une nouvelle version de son LLM qui veut conquérir encore plus de terrains, y compris les téléphones mobiles. La fusion de ce modèle et de ses futures versions avec la prometteuse Ray-Ban Meta signifie qu'à moyen terme nous pourrons avoir quelque chose de similaire à ce que Google a proposé avec son Projet Astra. Ici, l'interaction avec d'autres applications semble également réalisable, et l'entreprise semble actuellement suivre une voie un peu plus académique, à la manière de DeepMind. Nous en avons la preuve avec Cicéron, un agent d'IA autonome conçu pour vaincre les humains dans des jeux complexes.
  • Pomme. L'entreprise dirigée par Tim Cook commence désormais à déployer ses premières fonctions d'IA sur sa plateforme Apple Intelligence, mais elle a déjà une certaine expérience en matière d'automatisation de tâches avec des solutions telles que les raccourcis iOS et il faut s'attendre à ce que cette interaction entre le système et le les applications seront bientôt étendues à d’autres appareils. Dans Bloomberg, ils ont parlé hier du rôle prometteur de la robotique et de la domotique dans le catalogue d'Apple et y ont déclaré : « l'objectif de l'entreprise est de proposer sa nouvelle plateforme Apple Intelligence pour offrir une automatisation survitaminée dans la maison ». Ils ont également mis en avant un nouveau système « App Intents » qui permettra à Siri de manipuler les fonctionnalités des applications. Pas seulement baisser ou augmenter le volume, non, mais probablement – à l'avenir – utiliser Siri pour commander un taxi avec une simple commande vocale afin qu'il le recherche et que nous devions simplement confirmer que nous sommes d'accord avec la réponse qu'il nous donne cet ordre.
  • Google. Ce que nous avons vu du projet Astra il y a quelques mois a précisément marqué cet avenir dans lequel nous ne parlerons pas seulement à notre assistant-chatbot, mais nous lui demanderons de faire des choses avec nous en pouvant interagir avec d'autres applications sur notre mobile, par exemple exemple. Étant donné que DeepMind fait partie de l'entreprise et qu'ils progressent également dans ce domaine, il faut s'attendre à ce que les avancées des uns finissent par être importantes pour celles des autres.

Il y a un long chemin entre dire et faire

Bien entendu, des défis colossaux nous attendent. Non seulement il y a le fait que les agents d’IA peuvent commettre des erreurs et commettre des erreurs comme le font déjà les chatbots, mais il y a aussi la crainte qu’ils soient utilisés – inévitablement – ​​pour des scénarios toxiques. Qui peut être utilisé pour commettre des fraudes de toutes sortesPar exemple. Ce que nous constatons déjà avec les deepfakes et le phishing généré par l’IA pourrait atteindre un nouveau niveau avec les agents IA.

Il existe d’autres problèmes, et le plus urgent pour ces entreprises est de démontrer que l’IA peut être bien plus utile. Bien que les plateformes et modèles d’IA générative se soient révélés utiles dans des domaines tels que la programmation ou le design, ils ne sont pas vraiment réglés par exemple parmi les utilisateurs finaux.

Une partie de la faute est que le déploiement massif de la technologie est exaspérant : Google, Apple et Microsoft nous ont fait comprendre qu'à ce stade, l'IA serait partout et nous aiderait à faire beaucoup plus pour beaucoup moins, mais les fonctions qui ont atteint nos téléphones mobiles et les ordinateurs sont actuellement rares ou, dans le cas de l’Espagne et de l’Europe, inexistants.

Mais ici, les géants technologiques (et pas si géants) qui n’arrêtent pas d’investir des sommes absurdes dans l’IA doivent démontrer qu’ils disposent de produits utiles. Ils brûlent de l'argent à un rythme effréné, et s'il est nécessaire de maintenir ces investissements créer tout le battage médiatique et les attentes possibles – comme le fait souvent Sam Altman – qu’il en soit ainsi. Bien sûr, c’est dangereux.

À Simseo | La révolution de l'IA de Microsoft dans Build n'a qu'un seul objectif : automatiser (presque) tout dans l'entreprise