Apprendre à des robots à apprendre à d'autres robots

Qu'est-ce qu'un agent IA ? Un informaticien explique la prochaine vague d'outils d'intelligence artificielle

Interagir avec des chatbots IA comme ChatGPT peut être amusant et parfois utile, mais le prochain niveau de l'IA au quotidien va au-delà de répondre aux questions : les agents IA effectuent des tâches pour vous.

De grandes entreprises technologiques, notamment OpenAI, Microsoft, Google et Salesforce, ont récemment publié ou annoncé leur intention de développer et de publier des agents d'IA. Ils affirment que ces innovations apporteront une nouvelle efficacité aux processus techniques et administratifs sous-jacents aux systèmes utilisés dans les soins de santé, la robotique, les jeux et d’autres entreprises.

De simples agents d’IA peuvent apprendre à répondre aux questions standard envoyées par courrier électronique. Les plus avancés peuvent réserver des billets d’avion et d’hôtel pour des voyages d’affaires transcontinentaux. Google a récemment présenté aux journalistes Project Mariner, une extension de navigateur pour Chrome qui peut raisonner sur le texte et les images sur votre écran.

Lors de la démonstration, l'agent a aidé à planifier un repas en ajoutant des articles à un panier sur le site Web d'une chaîne d'épicerie, trouvant même des substituts lorsque certains ingrédients n'étaient pas disponibles. Une personne doit toujours être impliquée pour finaliser l’achat, mais l’agent peut être chargé de prendre toutes les mesures nécessaires jusqu’à ce stade.

Dans un sens, vous êtes un agent. Chaque jour, vous prenez des mesures dans votre monde en réponse aux choses que vous voyez, entendez et ressentez. Mais qu’est-ce qu’un agent IA exactement ? En tant qu'informaticien, je propose cette définition : les agents d'IA sont des outils technologiques qui peuvent en apprendre beaucoup sur un environnement donné, puis, avec quelques instructions simples d'un humain, travailler pour résoudre des problèmes ou effectuer des tâches spécifiques dans cet environnement.

Règles et objectifs

Un thermostat intelligent est un exemple d’agent très simple. Sa capacité à percevoir son environnement se limite à un thermomètre qui lui indique la température. Lorsque la température dans une pièce descend en dessous d’un certain niveau, le thermostat intelligent réagit en augmentant le chauffage.

Le Roomba est un prédécesseur familier des agents IA d’aujourd’hui. Le robot aspirateur apprend par exemple la forme d'une pièce recouverte de moquette et la quantité de saleté présente sur la moquette. Ensuite, il prend des mesures sur la base de ces informations. Au bout de quelques minutes, le tapis est propre.

Le thermostat intelligent est un exemple de ce que les chercheurs en IA appellent un simple agent réflexe. Il prend des décisions, mais ces décisions sont simples et basées uniquement sur ce que l'agent perçoit à ce moment-là. Le robot aspirateur est un agent axé sur un objectif unique : nettoyer tout le sol auquel il peut accéder. Les décisions qu’il prend – quand tourner, quand lever ou abaisser les brosses, quand retourner à sa base de chargement – ​​sont toutes au service de cet objectif.

Un agent axé sur un objectif réussit simplement en atteignant son objectif par tous les moyens nécessaires. Les objectifs peuvent toutefois être atteints de diverses manières, dont certaines peuvent être plus ou moins souhaitables que d’autres.

De nombreux agents d'IA actuels sont basés sur des utilitaires, ce qui signifie qu'ils accordent davantage d'attention à la manière d'atteindre leurs objectifs. Ils pèsent les risques et les avantages de chaque approche possible avant de décider comment procéder. Ils sont également capables de considérer des objectifs qui entrent en conflit les uns avec les autres et de décider lequel est le plus important à atteindre. Ils vont au-delà des agents basés sur des objectifs en sélectionnant des actions qui tiennent compte des préférences uniques de leurs utilisateurs.

Prendre des décisions, agir

Lorsque les entreprises technologiques font référence aux agents IA, elles ne parlent pas de chatbots ou de grands modèles de langage comme ChatGPT. Bien que les chatbots qui fournissent un service client de base sur un site Web soient techniquement des agents IA, leurs perceptions et leurs actions sont limitées. Les agents chatbot peuvent percevoir les mots qu'un utilisateur tape, mais la seule action qu'ils peuvent entreprendre est de répondre avec un texte qui, espérons-le, offrira à l'utilisateur une réponse correcte ou informative.

Les agents d'IA auxquels les sociétés d'IA font référence constituent des avancées significatives par rapport aux grands modèles de langage comme ChatGPT, car ils possèdent la capacité d'agir au nom des personnes et des entreprises qui les utilisent.

Selon OpenAI, les agents deviendront bientôt des outils que les particuliers ou les entreprises pourront laisser fonctionner de manière indépendante pendant des jours ou des semaines, sans avoir besoin de vérifier leurs progrès ou leurs résultats. Les chercheurs d'OpenAI et de Google DeepMind affirment que les agents constituent une autre étape sur la voie de l'intelligence artificielle générale ou de l'IA « forte », c'est-à-dire une IA qui dépasse les capacités humaines dans une grande variété de domaines et de tâches.

Les systèmes d’IA que les gens utilisent aujourd’hui sont considérés comme une IA étroite ou une IA « faible ». Un système peut être compétent dans un domaine – les échecs, peut-être – mais s’il était lancé dans un jeu de dames, la même IA n’aurait aucune idée de comment fonctionner parce que ses compétences ne se traduiraient pas. Un système d’intelligence artificielle générale serait plus à même de transférer ses compétences d’un domaine à un autre, même s’il n’avait jamais vu le nouveau domaine auparavant.

Les risques en valent-ils la peine ?

Les agents IA sont-ils en passe de révolutionner la façon dont les humains travaillent ? Cela dépendra de la capacité des entreprises technologiques à prouver que leurs agents sont équipés non seulement pour accomplir les tâches qui leur sont assignées, mais également pour surmonter les nouveaux défis et les obstacles inattendus lorsqu'ils se présentent.

L'adoption d'agents IA dépendra également de la volonté des gens de leur donner accès à des données potentiellement sensibles : selon ce que votre agent est censé faire, il peut avoir besoin d'accéder à votre navigateur Internet, à votre courrier électronique, à votre calendrier et à d'autres applications ou systèmes. pertinent pour une mission donnée. À mesure que ces outils deviennent plus courants, les utilisateurs devront réfléchir à la quantité de données qu’ils souhaitent partager avec eux.

Une violation du système d'un agent IA pourrait faire tomber des informations privées sur votre vie et vos finances entre de mauvaises mains. Êtes-vous prêt à prendre ces risques si cela signifie que les agents peuvent vous épargner du travail ?

Que se passe-t-il lorsque les agents d’IA font un mauvais choix, ou un choix avec lequel son utilisateur ne serait pas d’accord ? Actuellement, les développeurs d'agents d'IA tiennent les humains informés, en s'assurant que les gens ont la possibilité de vérifier le travail d'un agent avant que toute décision finale ne soit prise. Dans l'exemple de Project Mariner, Google ne laissera pas l'agent effectuer l'achat final ni accepter les conditions de service du site. En vous tenant au courant, les systèmes vous donnent la possibilité de revenir sur tout choix fait par l'agent et que vous n'approuvez pas.

Comme tout autre système d’IA, un agent d’IA est sujet à des biais. Ces biais peuvent provenir des données sur lesquelles l’agent est initialement formé, de l’algorithme lui-même ou de la manière dont les résultats de l’agent sont utilisés. Tenir les humains informés est une méthode pour réduire les préjugés en garantissant que les décisions sont examinées par les gens avant d'être mises en œuvre.

Les réponses à ces questions détermineront probablement la popularité des agents d’IA et dépendront de la mesure dans laquelle les entreprises d’IA pourront améliorer leurs agents une fois que les gens commenceront à les utiliser.