De l’IA générative à l’IA agentique : architectures, agents et nouveaux enjeux
Il y a huit ans, exactement à cette époque de l'année, lors de la première édition de l'Observatoire IIAI, le comité scientifique introduisait une définition de l'intelligence artificielle : « L'IA est la branche de l'informatique qui étudie le développement de systèmes matériels et logiciels dotés de capacités typiques de l'être humain et capables de poursuivre de manière autonome un objectif défini, en prenant des décisions qui jusque-là étaient habituellement confiées à l'être humain ».
C’est une définition très complexe, très riche, avec de nombreuses idées. Je voudrais souligner la dernière partie : « jusqu'à ce moment-là ». Nous introduisons donc la notion de temps, qui est centrale dans mon discours.
Nous étendons le temps au concept de vitesse et d'accélération de la recherche scientifique et de l'évolution technologique.
Trois chiffres pour trois exemples
Je vais vous raconter trois exemples à travers trois chiffres.
La première : 30 ans se sont écoulés entre l’introduction du perceptron et l’algorithme rétropropagationqui a permis de former les réseaux de manière efficace et efficiente, donnant ainsi corps au paradigme de l'apprentissage automatique.
La seconde : 15 années se sont écoulées entre l’introduction des premiers réseaux d’apprentissage profond, notamment les réseaux convolutifs, et leur dépassement de la vision par ordinateur traditionnelle, complétant le paradigme du deep learning.
Le troisième : 6 ans se sont écoulés entre la publication du journal »L'attention est tout ce dont vous avez besoin», qui a introduit l’architecture Transformer sous-jacente à l’IA générative, et l’arrivée de GPT.
C’est justement cette accélération de la recherche scientifique qui nous amène en 2024 à parler d’IA Agentic. En novembre 2024, les agents étaient présentés comme un paradigme d’IA capable de porter pleinement ses fruits l’IA générative. Exactement un an plus tard, on pouvait déjà trouver des vidéos sur YouTube apprenant à un enfant de cinq ans comment créer son propre agent IA. Il convient donc de clarifier et de mieux définir la notion d’agent IA.
Les agents IA, ce qu'ils sont réellement
Essayons de le faire d'un point de vue scientifique, en citant la définition d'Andrew Ng sur l'IA agentique :
« Agent AI représente une nouvelle façon de développer des logiciels qui exploitent les grands modèles de langage pour effectuer une partie ou la totalité des étapes de tâches complexes.
Au lieu de générer des réponses uniques, les flux agents permettent à l’IA de planifier des processus en plusieurs étapes, de les exécuter de manière itérative, d’améliorer les résultats et de les évaluer grâce à des mécanismes d’auto-évaluation.
Cette définition nous donne les quatre principaux ingrédients des agents :
- Grand modèle de langage,
- tâches complexes,
- traitement en plusieurs étapes
- compétences d’auto-évaluation.
Trois perspectives actuelles
Le premier est la RPA avancée, ou l'intégration de l'automatisation des documents avec les grands modèles linguistiques. Il existe des outils grâce auxquels un agent peut, par exemple, intercepter la réception d'un e-mail et déclencher un processus ultérieur via une extraction sémantique. Dans ce cas, cependant, la structure reste très rigide et les compétences d’auto-évaluation ne sont pas pleinement développées.
Le deuxième exemple concerne les petits modèles de langage. Un article de Nvidia et Cortical cite l’utilisation de modèles simplifiés et verticalisés comme ingrédients clés de l’IA agentique. Ces modèles fonctionnent comme des modules au sein de tâches complexes, mais le traitement en plusieurs étapes et l'auto-évaluation ne sont pas encore terminés.
La troisième perspective est celle du Large Action Model (LAM), des agents dotés de la capacité d'utiliser un ordinateur, c'est-à-dire d'utiliser directement notre ordinateur.
Un exemple de Microsoft de janvier 2025 clarifie la différence entre LLM et LAM : si l'invite est « Je veux acheter une veste pour homme », un LLM génère uniquement un texte avec la séquence d'étapes à suivre ; un modèle à grande action, quant à lui, effectue des actions, prend le contrôle du navigateur, saisit l'URL, clique sur les catégories et procède à l'achat.
On commence alors à avoir la capacité de s’auto-évaluer, avec la possibilité de réessayer si une action échoue. Toutefois, les tâches complexes restent difficiles à gérer, car elles nécessitent des interfaces bien définies et stables dans le temps.
Alors, qu’est-ce que l’IA agentique ? Un agent IA est un écosystème technologique, où l’agent n’est pas un monolithe, mais le résultat de l’orchestration de modules coordonnés via un moteur cognitif. L’ingrédient principal est l’utilisation du Large Language Model non pas pour générer du contenu, mais pour générer du raisonnement. Grâce à cela, les modèles peuvent interpréter les objectifs des utilisateurs, planifier, exécuter des stratégies et évaluer les résultats.
Architectures logicielles
D'un point de vue technologique, on peut parler d'architectures logicielles. L'architecture agentique se compose de quatre modules principaux :
- moteur cognitif,
- mémoire,
- orchestrateur,
- outils et interfaces.
Le moteur cognitif offre des capacités de raisonnement : il existe des modèles spécialisés dans le raisonnement, des modèles plus lents mais plus précis, et des modèles plus rapides spécialisés dans l'appel de fonctions.
La mémoire est divisée en deux grands domaines : les bases de données vectorielles pour la mémoire sémantique à long terme et les graphes de connaissances pour définir le contexte et réduire les hallucinations.
L'orchestrateur représente le système nerveux de l'architecture : un framework logiciel qui coordonne la mémoire, les tâches et l'évaluation des actions.
Les outils et interfaces sont les connecteurs qui permettent à l'agent d'interagir avec le monde extérieur, transformant les étapes de décision en actions via des API et des protocoles. Parmi ceux-ci, il est indispensable de citer le MCP (Model Context Protocol).
Vue à travers les yeux de l'informatique, cette architecture est pratiquement identique à l'architecture classique de Von Neumann : le moteur cognitif est l'unité de traitement, la mémoire est la mémoire, l'orchestrateur est le bus système et les outils sont les périphériques.
La différence cruciale réside dans le passage du calcul déterministe – basé sur la séquence, la sélection et la répétition – au calcul probabiliste. Dans un système classique, si une facture est inférieure à 10 000 euros elle est payée, sinon elle passe à l'homme. Cependant, avec un moteur cognitif, nous laissons le Large Language Model identifier les anomalies dans la description de manière probabiliste, appuyant ainsi la décision.
Trois perspectives de mise en œuvre
Le premier est le centralisé (Agent as a Service) : via API vous vous connectez à un système « boîte noire», dans une approche similaire à celle d’OpenAI.
La seconde est omniprésente : les modules sont séparés et intégrés dans des solutions spécifiques à l'entreprise, dans une approche plus proche de Google.
Le troisième est open source : des modules et des architectures totalement ouvertes sont utilisés, s'affranchissant de la contrainte de verrouillage. L’entreprise passe ainsi du rôle de simple utilisateur à celui de concepteur et gestionnaire d’architectures IA.
Les enjeux de l’IA Agentique
En conclusion, Agentic AI est encore confronté à deux défis majeurs. La première est qu’il est basé sur des modèles de langage étendus : tant que nous n’aurons pas surmonté leurs limites et leurs problèmes critiques, les agents risqueront d’échouer car le moteur interne ne fonctionne pas de manière fiable. Il est nécessaire d'intégrer des capacités logiques plus robustes, suivant les concepts Système 1 et Système 2 de Kahneman.
Le deuxième défi concerne la transition du contrôle du curseur sur les sites conçus pour les humains vers ce que l'on appelle le Web des machines, dans lequel les agents accèdent à des services et des données standardisés pour les machines. Tant que ces défis ne seront pas résolus, la gouvernance restera toujours entre les mains des humains (humain dans la boucle), même si l’agent gérera la partie opérationnelle.
Discours tiré de la Conférence : « Intelligence artificielle : adoption, transformation, équilibre » de l'Observatoire de l'Intelligence Artificielle de l'École Polytechnique de Milan – 5 février 2026
