Agents de l'IA - voici ce qu'il faut savoir sur ce qu'ils peuvent faire et comment ils peuvent mal tourner

Nous entrons dans la troisième phase de l'IA générative. Les chatbots sont venus pour la première fois, suivis des assistants. Maintenant, nous commençons à voir des agents: des systèmes qui aspirent à une plus grande autonomie et peuvent travailler dans des « équipes » ou utiliser des outils pour accomplir des tâches complexes.

Le dernier produit chaud est l'agent Chatgpt d'Openai. Cela combine deux produits préexistants (opérateur et recherche profonde) dans un système unique plus puissant qui, selon le développeur, « pense et agit ».

Ces nouveaux systèmes représentent une étape par rapport aux outils d'IA antérieurs. Savoir comment ils fonctionnent et ce qu'ils peuvent faire – ainsi que leurs inconvénients et leurs risques – deviennent rapidement essentiels.

Des chatbots aux agents

Chatgpt a lancé l'ère Chatbot en novembre 2022, mais malgré sa popularité énorme, l'interface conversationnelle a limité ce qui pourrait être fait avec la technologie.

Entrez l'assistant AI ou Copilot. Ce sont des systèmes construits au-dessus des mêmes modèles de langues qui alimentent les chatbots IA générateurs, seulement conçus maintenant pour effectuer des tâches avec une instruction et une supervision humaines.

Les agents sont une autre étape. Ils sont destinés à poursuivre des objectifs (plutôt que de terminer les tâches) avec des degrés d'autonomie divers, soutenus par des capacités plus avancées telles que le raisonnement et la mémoire.

Plusieurs systèmes d'agents d'IA peuvent être en mesure de travailler ensemble, communiquant entre eux pour planifier, planifier, décider et coordonner pour résoudre des problèmes complexes.

Les agents sont également des «utilisateurs d'outils» car ils peuvent également appeler des outils logiciels pour des tâches spécialisées – des choses telles que les navigateurs Web, les feuilles de calcul, les systèmes de paiement et plus encore.

Une année de développement rapide

L'IA agentique se sentait imminente depuis la fin de l'année dernière. Un grand moment est venu en octobre dernier, quand Anthropic a donné à son chatbot Claude la possibilité d'interagir avec un ordinateur de la même manière qu'un humain. Ce système pourrait rechercher plusieurs sources de données, trouver des informations pertinentes et soumettre des formulaires en ligne.

D'autres développeurs d'IA ont rapidement suivi. OpenAI a publié un agent de navigation Web nommé opérateur, Microsoft a annoncé des agents de copilote, et nous avons vu le lancement de Google's Vertex AI et des agents LLAMA de Meta.

Plus tôt cette année, la startup chinoise Monica a démontré son agent manus AI achetant des biens immobiliers et convertissant les enregistrements de conférences en billets de résumé. Une autre startup chinoise, Genspark, a publié un agent de moteur de recherche qui renvoie un aperçu d'une page (similaire à ce que Google fait maintenant) avec des liens intégrés vers des tâches en ligne telles que la recherche des meilleures offres d'achat. Une autre startup, Cluely, offre un agent « tricher à tout » quelque peu déchaîné qui a attiré l'attention mais n'a pas encore fourni de résultats significatifs.

Tous les agents ne sont pas faits pour une activité à usage général. Certains sont spécialisés pour des domaines particuliers.

Le codage et l'ingénierie logicielle sont à l'avant-garde ici, avec l'agent de codage de Copilot de Microsoft et le codex d'Openai parmi les frontrunners. Ces agents peuvent écrire, évaluer et commettre indépendamment le code, tout en évaluant le code manuscrit par l'homme pour les erreurs et les décalages de performance.

Recherche, résumé et plus

La recherche et la résumé des modèles d'IA génératrices sont l'une des modèles d'IA. Les agents peuvent l'utiliser pour effectuer des tâches de recherche qui pourraient prendre un jour expert humain à terminer.

La recherche approfondie d'OpenAI s'attaque aux tâches complexes à l'aide de la recherche en ligne en plusieurs étapes. L'IA de Google « co-scientifique » est un système multi-agents plus sophistiqué qui vise à aider les scientifiques à générer de nouvelles idées et propositions de recherche.

Les agents peuvent faire plus et se tromper

Malgré le battage médiatique, les agents de l'IA sont chargés de mises en garde. Anthropic et OpenAI, par exemple, prescrivent une supervision humaine active pour minimiser les erreurs et les risques.

Openai affirme également que son agent Chatgpt est « à haut risque » en raison du potentiel d'aide à la création d'armes biologiques et chimiques. Cependant, la société n'a pas publié les données derrière cette affirmation, il est donc difficile de juger.

Mais le type de risques que les agents peuvent poser dans des situations réelles sont montrés par le projet de projet d'Anthropic. Vend a attribué à un agent d'IA pour gérer un distributeur automatique de personnel en tant que petite entreprise – et le projet s'est désintégré en hallucinations hilarantes mais choquantes et un réfrigérateur plein de cubes de tungstène au lieu de la nourriture.

Dans un autre conte de prudence, un agent de codage a supprimé la base de données entière d'un développeur, disant plus tard qu'elle avait « paniqué ».

Agents au bureau

Néanmoins, les agents trouvent déjà des applications pratiques.

En 2024, Telstra a largement déployé des abonnements Microsoft Copilot. La société affirme que les résumés des réunions générés par l'IA et les ébauches de contenu permettent d'économiser en moyenne 1 à 2 heures par semaine.

De nombreuses grandes entreprises recherchent des stratégies similaires. Les petites entreprises expérimentent également des agents, tels que l'utilisation par la société de construction basée à Canberra, GeoCon, un agent d'IA interactif pour gérer les défauts de ses développements d'appartements.

Coût humain et autres

À l'heure actuelle, le principal risque des agents est le déplacement technologique. À mesure que les agents s'améliorent, ils peuvent remplacer les travailleurs humains dans de nombreux secteurs et types de travail. Dans le même temps, l'utilisation des agents peut également accélérer la baisse des travaux de col blanc d'entrée de gamme.

Les personnes qui utilisent des agents d'IA sont également à risque. Ils peuvent trop compter sur l'IA, déchargeant des tâches cognitives importantes. Et sans supervision et garde-corps, les hallucinations, les cyberattaques et les erreurs de composition peuvent très rapidement faire dérailler un agent de sa tâche et des objectifs pour causer des dommages, des pertes et des blessures.

Les coûts réels ne sont pas non plus clairs. Tous les systèmes d'IA génératifs utilisent beaucoup d'énergie, ce qui affectera à son tour le prix de l'utilisation d'agents, en particulier pour des tâches plus complexes.

En savoir plus sur les agents et construire le vôtre

Malgré ces préoccupations en cours, nous pouvons nous attendre à ce que les agents de l'IA deviendront plus capables et plus présents dans nos lieux de travail et nos vies quotidiennes. Ce n'est pas une mauvaise idée de commencer à utiliser (et peut-être de construire) des agents vous-même et de comprendre leurs forces, leurs risques et leurs limitations.

Pour l'utilisateur moyen, les agents sont les plus accessibles via Microsoft Copilot Studio. Cela est livré avec des garanties intégrées, une gouvernance et un magasin d'agent pour les tâches communes.

Pour les plus ambitieux, vous pouvez construire votre propre agent d'IA avec seulement cinq lignes de code en utilisant le cadre Langchain.