Les nouveaux grands modèles de génération de l'IA n'arrêtent pas de retarder. C'est une indication dangereuse que nous avons touché le toit

Nous nous attendions à ce que GPT-5 soit disponible au début de l’année, mais Openai nous a donné GPT-4.5. Le modèle d’IA génératif, qui représentait théoriquement un saut remarquable par rapport à ses prédécesseurs, s’est retrouvé décevant et la société a annoncé qu’elle l’éliminerait de son API en juillet. C’était trop cher et n’a tout simplement pas compensé. C’était déjà un mauvais signe d’avance de l’IA, mais il y en a plus.

Et GPT-5, quoi? Le GPT-5 devait arriver au milieu de l’année. Sam Altman crée depuis des mois, mais en décembre, nous savions que l’arrivée de ce modèle était problématique. Le bond des avantages ne s’attendait pas et le coût de développement est énorme. Qu’ont-ils fait à Openai? Retarder et lancer à sa place GPT-4.5 qui, comme nous l’avons vu, a été l’une des grandes déceptions de l’histoire d’Openai. Mauvais signal un signal.

Behemoth est retardé. Comme indiqué dans le Wall Street Journal, Meta retardera le lancement et le déploiement de son modèle le plus ambitieux à ce jour, appelez le 4 géant. Ce « monstre » avec 288 000 millions de paramètres actifs (deux milliards au total) est le troisième membre des appels familiaux nouvellement présentés 4. Cependant, selon les ingénieurs de l’entreprise, « ont des difficultés considérablement améliorées » leurs capacités. Il aurait dû arriver en avril, mais il est maintenant estimé qu’il arrivera à l’automne, ou même plus tard.

Frustration. Des sources proches de l’entreprise indiquent que les managers sont frustrés par les performances de l’équipe qui développe des appels 4 Behemoth. Des « changements de gestion significatifs » sont déjà envisagés qui augmenteraient les mouvements internes (et qui sait si les licenciements) en raison de ces mauvais résultats. Et ce n’est pas que les modèles de flamme disponibles ont une bonne réception, à dire. Mauvais signal numéro deux.

Déséquilibré. Dans le WSJ, souligne également comment la première version de Flame a été créée par son équipe de recherche fondamentale, formée par des universitaires et des chercheurs. Depuis lors, 11 des 14 chercheurs ont quitté l’entreprise.

Anthropic ne progresse pas non plus. Nous nous attendions également à un saut « ronde » à Claude, le changement génératif de l’anthropique, mais en février, la société a présenté Claude 3.7. Il est vrai que ce modèle a offert des avantages frappants, mais pour le moment sa version OPUS, la plus ambitieuse, n’apparaît toujours pas, et rien n’est connu sur Claude 4.0. Mauvais signal numéro trois.

Les sauts non, tout au plus. Ce que nous voyons ces derniers mois ne sont pas des sauts significatifs dans la capacité des modèles, mais des améliorations frappantes uniquement dans certaines sections ou des caractéristiques efficaces. Cela s’est produit avec Gemini 2.5 Pro, particulièrement puissant en programmation et qui a permis à Google de gagner des entiers, mais aussi avec Openai et les images célèbres qui imitent Ghibli Oa Grok 3, qui est devenue plus célèbre pour son manque de censure qu’en raison de sa précision ou de sa qualité (ce qui n’est pas mal).

Ralentissement. Tout cela déclenche le débat sur une «décélération» potentielle de l’IA: la montée ne semble plus fonctionner si bien, et celle d’utiliser plus de GPU et plus de données pour former des modèles n’offre pas le rendement attendu. Jaime Sevilla, PDG de Cophai, croyait que le rythme de l’amélioration était attendu, mais ces retards font bien sûr les progrès futurs de l’IA génératrice.

Les agents et l’IA que « raison » sont l’espoir. Les modèles ayant une capacité de «raisonnement» ont permis de proposer des améliorations frappantes dans certains domaines, et les entreprises ont lancé pour présenter ce type de variantes et des modes de recherche profonds pour des utilisations spécialisées. L’autre grand espoir de 2025 sont les agents de l’IA capables de terminer les séquences de tâches de manière autonome pour résoudre un problème, même en se connectant à d’autres services ou sources de données. Pour le moment, nous avons déjà des exemples remarquables dans le domaine de la programmation, mais les applications pratiques pour les utilisateurs finaux sont limitées.

Image | But

Dans Simseo | Il y a trop de modèles d’IA. Cela augmente une véritable condamnation à mort pour anthropique et Claude