Modèles mondiaux : une IA qui simule la réalité de l'entreprise

La dernière décennie de l’intelligence artificielle a été dominée par des systèmes capables de reconnaître des modèles et de prédire du texte avec une précision étonnante. Cependant, la frontière technologique s’oriente vers une nouvelle catégorie d’architectures : i modèles du monde.

Si les Large Language Models (LLM) nous ont habitués à des machines qui conversent couramment, les nouveaux « modèles du monde » promettent des systèmes capables de comprendre le fonctionnement de la réalité, de simuler des scénarios et de raisonner sur les conséquences de leurs actions avant même de les réaliser.

Pour le monde des affaires, « il ne s’agit pas seulement d’un progrès technique, mais d’un changement de paradigme dans la façon dont les machines soutiennent les décisions commerciales », comme le révèle une nouvelle analyse du Goldman Sachs Global Institute, intitulée «Quand l’IA apprend comment le monde fonctionne.

La limite des modèles linguistiques dans le contexte opérationnel

Ces dernières années, les LLM ont démontré des compétences transformatrices dans la rédaction de documents, la traduction de textes et la rédaction de code. Cependant, ces machines n’ont pas de sens interne du monde qu’elles décrivent ; ils sont puissants pour compléter des modèles statistiques, mais ont du mal à naviguer dans des environnements où les erreurs ont des coûts réels.

« Lorsque l’IA est sollicitée pour gérer des chaînes d’approvisionnement complexes ou coordonner des robots dans un entrepôt, la corrélation statistique à elle seule s’avère insuffisante », constate Dan Keyserling, directeur du Goldman Sachs Global Institute.

Ce qui explique : « l’intelligence, dans des contextes de grande valeur, nécessite une compréhension des liens de causalité et un modèle interne de la réalité qui permet de naviguer même dans l’imprévisible ou l’inattendu. »

Le développement de la prospective machine

Au cœur de ces « modèles mondiaux » se trouve une question simple mais puissante que le système pose continuellement : « Si je fais cela, que se passera-t-il ensuite ?

C’est ce que les humains appellent l’instinct, l’intuition, la capacité de prédiction. Jusqu’à présent, les machines ne parvenaient pas à faire cela correctement. Apprendre à un robot à reconnaître un objet est simple, mais lui apprendre à le manipuler sans le casser dans un environnement non structuré nécessite une compréhension de la gravité, du frottement et de la force.

Image contenant de l'art, des graphiques, une capture d'écran, des graphiques, le contenu généré par l'IA peut ne pas être correct.

Les modèles mondiaux créent des simulateurs internes qui permettent aux machines d’effectuer des millions d’« expériences de pensée » en quelques instants, en tirant les leçons des échecs dans un environnement numérique où le coût de l’erreur est nul. Ainsi, lorsque l’IA agit dans le monde réel, elle le fait selon un plan basé sur la prévision des conséquences.

Modèles physique et social : deux piliers pour l’entreprise

Les recherches actuelles, menées par des personnalités comme Yann LeCun (Meta et AMI Labs) et Fei-Fei Li (Stanford University et World Labs), se divisent sur deux fronts complémentaires. D’une part, « les modèles du monde physique absorbent les lois de la thermodynamique et de la mécanique, rendant enfin possible la robotique autonome dans des espaces surpeuplés et dynamiques, comme les ports et les centres logistiques », souligne Keyserling.

D’un autre côté – souligne le directeur du Goldman Sachs Global Institute – « apparaissent des modèles de monde virtuel ou social, où les forces en jeu ne sont pas la gravité, mais les incitations économiques, les normes et le pouvoir ».

Ces systèmes peuplent les environnements numériques d’agents d’IA qui simulent le comportement de groupes humains. Pour une entreprise, cela signifie être capable de tester une stratégie de marché ou une structure de gouvernance par rapport à des composants adaptatifs avant, par exemple, qu’une crise ne survienne réellement.

De la prévision statistique à la simulation stratégique

Il existe une distinction cruciale entre la prévision classique et la simulation offerte par les modèles mondiaux. « Tandis que le prévision Cherchant traditionnellement à identifier un résultat unique et correct, les modèles du monde révèlent un éventail de possibilités, des chemins alternatifs et des boucles de rétroaction », explique George Lee, codirecteur du Goldman Sachs Global Institute.

Ces nouveaux modèles montrent comment un système se comporte sous pression. Pour un chef d’entreprise, cette connaissance de la situation est bien plus précieuse qu’une estimation statique.

« Imaginons la chaîne d’approvisionnement du futur », suggère Lee : « tandis que les modèles physiques guident les robots dans les entrepôts, les modèles virtuels simulent simultanément des chocs de demande ou des perturbations géopolitiques, faisant de la planification un processus continu et non plus épisodique. »

L’impact sur les investissements dans les infrastructures technologiques

Cette évolution « soulève également des questions sur l’ampleur réelle des investissements nécessaires dans l’IA », souligne l’analyse du scénario : « les prévisions actuelles sur les puces, l’énergie et le calcul sont principalement calibrées sur l’évolutivité des LLM. Cependant, les modèles mondiaux nécessitent pipeline spécifications, générateurs de données synthétiques et moteurs physiques qui vont bien au-delà des fonctions des LLM.

Et « même si les investissements dans ces modèles ne représenteront qu’une fraction des dépenses totales à court terme, leur trajectoire suggère que les besoins informatiques globaux pourraient dépasser les estimations actuelles ».

Dans les secteurs où les erreurs sont coûteuses, la valeur générée par la simulation machine et la prospective dépassera rapidement les coûts d’infrastructure.

Vers une IA dotée d’une connaissance de la situation

L’avenir de l’intelligence artificielle ne verra probablement pas la victoire d’un paradigme sur l’autre, mais l’intégration des deux.

« Tout comme le cerveau humain coordonne des régions spécialisées pour le langage, la vision et le mouvement, les architectures avancées combineront les LLM comme interface de communication et les modèles du monde comme moteurs de planification », prédit Lee.

L’avantage concurrentiel des organisations ne dépendra plus uniquement de celle qui dispose du modèle le plus large, mais de celle qui est capable de construire les simulations les plus fidèles de leur réalité opérationnelle.

Passer de la reconnaissance de formes à la compréhension des systèmes est donc le défi qui attend les entreprises dans les années à venir : l’IA ne produira pas seulement des réponses, mais deviendra un guide conscient pour naviguer dans la complexité du monde réel.