GPT-4.5 Ce n'est pas mieux que ses rivaux dans presque tout. C'est la preuve que les modèles d'IA traditionnels ne progressent presque pas

GPT-4.5 Ce n’est pas mieux que ses rivaux dans presque tout. C’est la preuve que les modèles d’IA traditionnels ne progressent presque pas

Sam Altman avait déjà averti qu’ils avaient prévu de lancer GPT-4.5 très bientôt. Nous attendions le successeur de GPT-4 depuis des mois, mais au fil du temps, les attentes ont baissé: il a été question de la décélération de l’IA et de la façon dont l’escalade des données et plus de GPU pour former des modèles – cela ne fonctionnait pas tellement. Précisément, GPT-4.5 allait être la preuve que ce n’était peut-être pas vrai. Savez-vous quoi? C’était probablement, car GPT-4.5 est un modèle avec de nombreux problèmes de départ.

GPT-4.5 est déjà avec nous. Hier Openai a finalement présenté GPT-4.5, le successeur théorique de GPT-4. Sam Altman a expliqué que c’était « le premier modèle qui me fait sentir que je parle à une personne attentive ».

Gigantesque et cher. Mais Altman a également reconnu autre chose. « Mauvaise nouvelle: c’est un modèle géant et cher. » Le chef d’Openai a affirmé avoir manqué de GPU suffisants pour effectuer un lancement de masse, et la disponibilité de GPT-4.5 est très limitée: seuls les utilisateurs de ChatGpt Pro peuvent l’utiliser pour le moment.

Capture d'écran 2025 02 28 à 9 13 56

Caro non, très cher. L’utilisation du modèle GPT-4.5 via l’API OpenAI est extraordinairement coûteux: il coûte 75 $ par million de jetons d’entrée et 150 $ par million de jetons de sortie. Le GPT-4O coûte respectivement 2,5 et 10 dollars (30 et 15 fois moins), et O1, jusqu’à présent le plus cher, coûte respectivement 15 et 60 dollars.

Et ce n’est pas non plus un modèle « frontière ». Le rapport technique d’OpenAI indique qu’il ne s’agit pas d’un modèle «  » comme GPT-4, par exemple. C’est important, car malgré son plus grand LLM, les modèles de frontières sont plus capables, à grande échelle et augmentent les risques pour générer une désinformation ou être obligé de sortir des normes. Dans GPT-4.5, ils semblent avoir beaucoup concentré sur l’évitement des erreurs (c’est l’un de ses avantages, il semble mettre moins la jambe selon certaines banques d’essai).

Capture d'écran 2025 02 28 à 9 26 46
Capture d'écran 2025 02 28 à 9 26 46

Ça ne semble pas mieux dans presque rien. Les preuves et les repères auxquels il a été soumis semble clairement indiquer que le saut dans les avantages est particulièrement décevant, surtout si nous le comparons avec les nouveaux modèles de ses rivaux. Il est pire dans la précision des faits que la recherche approfondie de la perplexité est pire que Claude 3.7 Sonnet dans la programmation selon TechCrunch et plusieurs experts, et est également pire dans le raisonnement (bien qu’il ne soit certainement pas orienté vers elle) que le modèle de profondeur R1, O3-MinI ou Claude 3.7 (qui est un modèle « hybride »).

Sentiment doux-amer. Des experts tels que Simon Willison ou Andrej Karpathy ont partagé leurs premières impressions et dans les deux cas, la sensation est que GPT-4.5 est lent, il n’est mis à jour qu’en octobre 2023 et ne représente pas une avance vraiment remarquable. Willinson est venu analyser le débat selon lequel des dizaines d’utilisateurs ont maintenu sur GPT-4.5, et dans un résumé généré par les conclusions était également clair: la numérotation elle-même était inappropriée, le modèle est trop cher, le ratio des prix / avantages était très discutable et les performances n’étaient pas celle qui était attendue après autant de temps. La conclusion de la Karpathy est que « c’est un peu mieux et c’est génial, mais pas exactement dans des sections triviales de mise en évidence ».

Chatgpt, O1, O3-Mini, GPT-4O: Openai a un problème très évident avec ses modèles AI et c'est son nom

Plus humain? L’appréciation d’Altman à propos de sa conversation comment il avait été surpris par la capacité de conversation de GPT-4.5 peut-être qu’il pointe la direction dans laquelle ce modèle se démarque. La Karpathy a également souligné cet aspect en disant que l’amélioration pourrait être démontrée dans « la créativité, la réalisation des analogies, la compréhension générale et l’humour », qui fait peut-être des effets efficacement avec GPT-4.5 donnent le sentiment d’être encore plus proche de ceux que nous aurions avec un être humain.

La montée ne fonctionne pas, la décélération est là. GPT-4.5 C’est un exemple clair de la façon dont nous avons atteint les limites de la mise à l’échelle. Avoir un gigantesque LLM ne semble plus offrir des avantages par rapport à ses prédécesseurs, et consacrer plus de données et plus de GPU pour former ces modèles ne semble pas avoir beaucoup de sens. Altman lui-même a clairement indiqué que le GPT-4.5 serait le dernier modèle non renvoyé de l’entreprise. C’est un autre signe qui démontre que la décélération de l’IA générative, du moins en ce qui concerne les modèles traditionnels, est une réalité.

Pourquoi l’avez-vous lancé alors? Dans le blog d’Openai, cela indique comment « nous partageons le GPT-4.5 à mesure qu’une enquête progresse pour mieux comprendre ses forces et ses limites. Nous explorons toujours de quoi il est capable et nous sommes impatients de voir comment les gens l’utilisent d’une manière que nous ne nous attendions pas. » Cela semble montrer des doutes que leurs propres créateurs ont avec le modèle et la question de savoir pourquoi ils l’ont jeté.

Ils doivent continuer à générer « . D’autant plus que les rivaux sont très forts ces derniers temps. Claude 3.7, Grok 3 et bien sûr Deepseek R1 ont réussi à transformer la tortilla et à relever un défi pour Openai, qui jusqu’à il n’y a pas longtemps, il semble que ce soit une longueur d’avance sur leurs rivaux. Maintenant, ce n’est pas clair, et dans de nombreuses sections, ses concurrents dépassent déjà les avantages de leurs modèles. OpenAI doit allaiter et dire « Me voici », mais peut-être avec GPT-4.5, ce mouvement va mal, car au moins a priori les avantages sont décevants.

Et les investisseurs serrent. Certains indiquent une autre théorie probable pour ce lancement. OpenAI aurait pu être contraint de lancer GPT-4.5 et à des investisseurs de contenu, qui ont investi des milliards de dollars dans l’entreprise et qui doivent être calmes avec leur investissement. Une fois de plus, Openai a un problème, car il ne semble pas que le GPT-4.5 puisse les rendre calmes. Il sera difficile pour les nouveaux investisseurs de s’associer à ce lancement.

Dans Simseo | Openai a une occasion en or de balayer tous ses rivaux: lancer un chatppt illimité et plein de publicité