La CNMV teste depuis dix mois l’IA pour investir en Bourse. Les conclusions sont très révélatrices

Ces derniers mois, il y a eu un discours récurrent que l’on voit sur les réseaux sociaux qui nous vend une fois de plus ce message « devenez riche vite ». Ce message est « utilisez l’IA pour investir en bourse ». Ce qui est intéressant, c’est de voir comment la CNMV a publié une étude dans laquelle elle a précisément tenté d’analyser cette prémisse. Même si cette organisation met en garde contre les risques liés à l’investissement avec l’IA, les conclusions contiennent un autre message important : les LLM ne sont pas de mauvais investisseurs en soi. Ils ne parviennent pas à suivre des instructions vagues, ce qui est exactement la façon dont la plupart des gens les utilisent.

L’étude CNMV. Deux chercheurs du CNMV, Ricardo Crisóstomo et Diana Mykhalyuk, ont publié une étude méthodologiquement sérieuse (mais imparfaite) et très intéressante : ils ont utilisé quatre modèles d’IA pendant dix mois en direct, d’avril 2025 à janvier 2026. Ils ont choisi ChatGPT, Gemini, DeepSeek et Perplexity comme modèles. Le processus était simple mais exigeant : chaque mois, ils demandaient à chaque modèle d’identifier les cinq actions de l’indice Ibex35 avec la meilleure performance attendue (pour acheter) et les cinq avec la pire performance attendue (pour vendre à découvert). Ensuite, le résultat réel a été mesuré à la fin du mois, et ici aucune donnée historique n’a été sélectionnée simplement parce que : le marché réel était le seul arbitre de tout le fonctionnement des modèles.

Les modèles ont évolué. L’un des aspects les plus significatifs de l’étude est que ses créateurs ont reconnu un problème méthodologique difficile à éviter : au cours de ces dix mois, les versions des quatre modèles ont été mises à jour à plusieurs reprises. Le Gémeaux d’avril 2025 n’était pas le même que celui de janvier 2026 par exemple, et cela pourrait influencer les résultats. Les chercheurs ont fait remarquer qu’il était impossible de savoir avec certitude si une amélioration ou une détérioration de la performance était due à la stratégie rapide, aux conditions du marché au cours de cette période ou simplement à un changement de modèle.

L’invite est tout. Trois types d’invites très différents ont également été testés, ce qui a donné lieu à des conclusions qui n’étaient ni alarmistes ni créatrices de fausses attentes : elles étaient « ça dépend ». Ainsi, leurs résultats ont montré que tout dépendait du type d’encadrement dont disposaient ces modèles :

Si l’on posait aux LLM des questions génériques telles que « Quelles actions dois-je acheter ? », ils échouaient à plusieurs reprises. Il y a eu des erreurs de calcul, des interprétations erronées et aussi les fameuses hallucinations des chatbots. Curieusement, le seul à avoir réalisé des bénéfices était ChatGPT. Le problème est que les personnes qui utilisent l’IA pour investir utilisent probablement ce mode d’action.
Mais si des invites préparées avec des examens itératifs et une supervision humaine à chaque étape étaient utilisées, Perplexity a obtenu un rendement mensuel de 3,5 % sur l’IBEX35. Gemini et ChatGPT ont également amélioré leurs performances s’ils recevaient des instructions plus précises, et DeepSeek a été classé pire dans l’ensemble.
Il existe un autre résultat : lorsque les modèles reçoivent des documents réglementaires officiels ou des rapports sur les résultats commerciaux, leur précision prédictive s’améliore considérablement. Les LLM raisonnent mieux sur des faits concrets et vérifiés que de générer des analyses de toutes pièces sur des informations qu’ils recherchent eux-mêmes sur le Web.

Hallucinations financières. L’étude du CNMV souligne que les marchés financiers sont particulièrement exigeants en modèles d’IA car ils nécessitent des processus complexes. Ils doivent récupérer et collecter des informations de manière dynamique, ils doivent raisonner en plusieurs étapes, ils doivent être numériquement précis et ils doivent connaître ce marché, et tout cela en temps réel. Les chatbots sont formés pour générer du texte « convaincant », l’incitation ici est donc que la recommandation d’investissement « sonne bien », même si elle est complètement fausse. La confiance avec laquelle les modèles d’IA présentent une analyse financière incorrecte est proportionnelle au risque qu’ils font courir à ceux qui les utilisent sans vérifier si ce qu’ils disent a du sens. En bref : ne faites pas confiance à l’IA pour investir dès le départ.

L’expérience de l’utilisateur de Reddit était tout aussi frappante, mais peu concluante. Source : Reddit.

L’expérience Reddit. Un utilisateur de Reddit nommé Blotter-fyi a créé une plateforme appelée Rallies.ai en novembre 2024 qui a permis à plusieurs agents d’IA d’accéder à des données financières en temps réel et à de l’argent pour effectuer des opérations boursières. Quatre mois plus tard, alors que l’indice S&P a baissé de 7 % depuis le début, cinq des modèles surperforment cet indice, même si deux seulement affichent des rendements positifs en termes absolus. L’auteur lui-même a été le premier à avertir que quatre mois ne suffisent pas pour parvenir à une conclusion : cela peut être dû à la chance, au marché ou simplement à l’incitation.

L’expérience de Nof1 était fascinante, mais elle a clairement montré que les modèles d’IA ne rapportent généralement pas d’argent en investissant dans la cryptographie. Source : Nof1.

Nof1 et la fascination de la crypto. Une autre expérience particulièrement marquante est celle que la société nof1.ai a réalisée avec son Alpha Arena. Il a mis six modèles d’IA en compétition, leur a donné 10 000 dollars réels chacun et leur a donné deux semaines pour échanger des dérivés de crypto-monnaie sans intervention humaine. Le résultat le plus frappant n’est pas de savoir qui a gagné, mais qui a perdu : GPT-5 s’est terminé avec plus de 25 % de pertes et Gemini avec près de 40 % de pertes. Pendant ce temps, les modèles chinois Qwen et DeepSeek ont dominé en termes de bonnes performances. Ils ont itéré avec d’autres modèles, 32 au total, et parmi eux seuls six ont obtenu un rendement positif : les autres ont perdu de l’argent. Grok-4.20 a été le grand gagnant devant GPT-5.1 et DeepSeek v3.1.

Peut-être que vous ne devriez pas laisser l’IA investir à votre place. Les conclusions de ces expériences sont claires. Quatre mois d’un modèle surperformant l’indice S&P dans un marché baissier ne prouvent pas que l’IA est un bon investisseur. C’est juste qu’au cours de cette période spécifique, avec ce marché spécifique, ce modèle a pris des décisions qui se sont révélées moins mauvaises que celles de l’indice. Pour voir si cela a du sens, il faut des années, plusieurs conditions de marché et de nombreuses instances de la même expérience se déroulant en parallèle.

Il en va de même avec Nof1 – particulièrement court – et avec un processus plus sérieux et méthodique comme celui de la CNMV, qui a également été entouré d’événements dont l’impact sur le résultat final était incertain. Face à tant d’inconnues, la conclusion semble claire : utiliser l’IA pour investir peut certes être risqué, mais avec une bonne supervision – ce que tout le monde ne peut pas faire – elle peut devenir un outil puissant.

Images | Yorgos Ntrahas

À Simseo | Intel a récupéré en avril ce qu’il avait mis quatre ans à perdre : la confiance du marché et 100 milliards