En 2025, l’IA semblait avoir heurté un mur de progrès. Un mur volatilisé en février 2026

Je me souviens avec tendresse de l'époque où Intel et AMD se battaient pour créer le premier processeur capable d'atteindre une fréquence d'horloge de 1 GHz. Cette course a été remportée (surprise !) par AMD, mais jusqu'à ce que cette étape se produise, le rythme était vertigineux. C’est du moins ce qu’il nous a semblé, car avec l’IA, le rythme des lancements est absolument fou.

Que de semaines nous avons eu, chers lecteurs. Voyons:

27 janvier : Kimi.ai lance Kimi J2.5
5 février : Anthropic sort Claude Opus 4.6
5 février : le même jour, OpenAI publie GPT-5.3-Codex
5 février : Kuaishou lance Kling 3.0
12 février : Z.ai lance GLM-5
12 février : ByteDance lance Seedance 2.0
12 février : MiniMax lance MiniMax 2.5
16 février : Alibaba lance Qwen3.5-397B-A17B
Prochainement : DeepSeek v4, Est-ce que ça appelle ?, Gemini 3.1, …

Le rythme est absolument frénétique, et les LLM d'il y a quelques années ~~mois~~ les semaines semblaient fantastiques, maintenant elles ne le sont plus tellement. Les nouvelles versions de ces modèles linguistiques ne cessent d’évoluer, et les sociétés d’IA continuent de proposer en permanence de nouveaux développements. Presque vertigineux.

Bien sûr, cela a ses bons et ses mauvais côtés. Nous avons terminé 2025 avec un certain ennui face à une IA qui promettait beaucoup mais qui ne changeait finalement presque rien. Ce n'est qu'à la fin de l'année qu'une révolution palpable s'opère avec cette combinaison spectaculaire qui forme Claude Code et Opus 4.5.

Le binôme Anthropic a étonné les développeurs, qui pour la première fois ont semblé d'accord lorsqu'il s'agissait de déclarer qu'avec ce type de plateforme, ils pouvaient demander à l'IA ce qu'ils voulaient, et qu'elle le programmerait pour vous immédiatement et presque toujours sans problèmes. Bien sûr, il y avait une certaine exagération dans ce discours, mais la capacité de l'Opus 4.5 et le degré d'autonomie et de polyvalence de Claude Code semblaient marquer un tournant.

Puis OpenClaw est arrivé et cela a encore une fois fait monter les attentes envers les agents IA, mais en parallèle on assiste à une véritable fièvre de lancements de nouveaux modèles d'IA génératifs, aussi bien en vidéo (Kling 3.0 et surtout Seedance 2.0 ont été des phénomènes viraux en eux-mêmes) qu'en texte/code. Et à chaque nouveau modèle, la promesse de performances dépassant la génération précédente. Au moins, bien sûr, dans les benchmarks.

À gauche, les benchmarks internes d'Alibaba pour Qwen3.5. A droite, ceux d'Anthropic pour l'Opus 4.6. Chacun se compare à celui qu'il juge approprié.

Ces graphiques à barres dans l'image ci-dessus sont devenus une constante, surtout lorsque le modèle est lancé par une entreprise chinoise. Si le launcher est OpenAI, Google ou Anthropic, les tables sont privilégiées. Quoi qu'il en soit, le résultat nous amène toujours à la même chose : chaque modèle est meilleur que son prédécesseur et, normalement, que beaucoup de concurrents.

Fatigue des abonnements à l'IA

Le problème est que cette course ne semble jamais se terminer, et un modèle qui semble fantastique aujourd'hui ne le sera pas demain, lorsque son concurrent pourra à peine le surpasser, mais il peut aussi être considérablement moins cher – les modèles chinois le sont généralement – ou offrir d'autres avantages tels que des fenêtres de contexte plus grandes afin que nous puissions saisir des textes de plus en plus longs – par exemple, de grands référentiels de code – dans le cadre de l'invite.

Et bien sûr, cela pose problème aux utilisateurs. Si l'Opus 4.5 était si bon, on pourrait souscrire au forfait Pro ou Max et payer un an à l'avance, mais c'est a priori risqué, car même si vous aurez accès aux nouveaux modèles lors de leur sortie, vous aurez dédié votre investissement en abonnements IA au modèle Anthropic sans avoir autant de marge pour essayer ceux des concurrents.

Les abonnements courts sont ici indispensables : souscrire à un modèle pendant un mois pour avoir une marge de manœuvre au cas où je voudrais essayer un autre modèle le mois suivant (ou essayer deux ou trois modèles le même mois, ce qui est aussi un cas courant).

Les prix des abonnements aux services d’IA ne sont pas non plus des facilitateurs de ces multiples épreuves. La chose normale est de payer 20 euros pour un abonnement d'un mois, et même si les modèles chinois sont généralement beaucoup moins chers, ils sont aussi généralement en retard en termes de capacité si l'on a besoin de performances maximales.

Mais ici, le problème se répète encore et encore : si je m'abonne maintenant au GPT-5.3-Codex, que tout le monde dit fantastique, combien de temps dois-je payer pour cela, un mois ? Ou est-ce que je m'abonne aussi à GLM-5 pour essayer, et le mois prochain j'essaierai Opus 4.6 et MiniMax 2.5 ?

"Bonjour, ordinateur" : le futur que nous peint désormais l'IA d'Anthropic est le même que celui proposé par Star Trek en 1986

Toutes ces décisions sont difficiles car la perception de chaque modèle dépend de chaque utilisateur. Chacun d'eux a ses besoins, son budget et ses propres expériences avec chaque modèle, donc peu importe à quel point les benchmarks disent une chose, avec les modèles d'IA, cela nous arrive comme avec les vins : peu importe à quel point ils nous disent que l'un est meilleur que l'autre, nous les percevons de manière très personnelle.

Et cette avancée frénétique signifie également que l’attente de modèles qui font vraiment la différence a été retrouvée. Le Vibe coding n’est pas parfait, mais il répond de mieux en mieux à nos besoins, et il en va de même pour les agents d’IA comme OpenClaw, qui, avec leurs lumières et leurs ombres, démontrent que l’avenir dans lequel nous avons un employé d’IA – même s’il peut être un peu maladroit au début – travaillant 24 heures sur 24, 7 jours sur 7, ne semble pas si loin.

Nous vivons une époque vertigineuse et fascinante pour l’IA. Encore.

Images | Mohamed Rahmani

À Simseo | La Chine a amené des robots humanoïdes à la plus grande émission de télévision du pays : elle leur a fait pratiquer le kung-fu avec une précision millimétrique