une manœuvre qui vise à gagner du terrain sur le Gemini 3 de Google
Dans la course au développement de l’intelligence artificielle, le rythme est devenu une succession de mouvements liés. Le 12 novembre, GPT-5.1 est arrivé, une mise à jour visant à peaufiner l'expérience et à satisfaire les utilisateurs. Quelques jours plus tard, le 18 novembre, Google répondait avec Gemini 3, une évolution de son modèle phare qui a laissé de très bons sentiments à ceux qui ont commencé à l'essayer.
À la suite de ce lancement, des rumeurs ont commencé à circuler : la startup dirigée par Sam Altman avait activé un supposé « code rouge » en voyant comment son rival direct en profitait. Et cela semble être le premier résultat de ce mouvement interne. Pas même un mois ne s'est écoulé depuis la précédente mise à jour de son modèle phare et GPT-5.2 est là. La promesse ici est de résoudre certains problèmes connus, de diminuer la latence et de gagner en raison.
Une évolution au sein de la série 5. GPT-5.2 apparaît comme une version conçue pour dynamiser le travail de connaissances, avec des avancées en matière de codage, de vision, d'analyse de documents et de projets en plusieurs étapes. OpenAI l'intègre comme une évolution directe de GPT-5.1, et non comme un saut générationnel. Selon l'entreprise, la mise à jour améliore la gestion des contextes longs, réduit les erreurs et augmente la capacité de coordination des outils.
Couches d'utilisation plus différenciées. Les trois variantes habituelles sont un peu plus différenciées dans leur utilisation, non pas en raison de nouvelles fonctions, mais en raison de la manière dont elles intègrent les améliorations annoncées par OpenAI. La réflexion absorbe une grande partie des progrès en matière de raisonnement, de gestion de documents volumineux et de coordination des outils. Pro place la barre plus haut dans les tâches spécialisées, notamment dans le code et les calculs techniques. Instant, quant à lui, bénéficie d’explications plus stables et d’une réduction des erreurs. Le résultat est une séparation plus claire entre les tâches quotidiennes, les tâches complexes et les besoins des experts.
Une amélioration visible dans plusieurs évaluations. OpenAI présente des chiffres qui montrent que GPT-5.2 est en avance sur GPT-5.1 dans des domaines très différents, du raisonnement scientifique à la programmation et aux tâches de connaissance. Dans GDPval, l'évaluation qui mesure des emplois bien spécifiés dans 44 professions, le modèle obtient 70,9 % de victoires ou d'égalités contre les professionnels humains. Dans GPQA Diamond, il atteint 92,4% et dans AIME 2025, il atteint 100%. La tendance se répète dans les tests techniques tels que FrontierMath ou ARC-AGI, où les performances augmentent également par rapport à la version précédente.

Les améliorations sont visibles lors du passage des chiffres aux tâches quotidiennes. Dans les évaluations internes des propres travaux des analystes financiers, comme la modélisation à trois états ou les simulations de rachat par emprunt, Thinking relève sa note moyenne de 59,1 % à 68,4 %. La société promet également des progrès dans la génération de feuilles de calcul et de présentations avec une structure plus claire. De plus, selon OpenAI, des entreprises telles que Notion, Box, Shopify ou Harvey ont observé des améliorations dans le raisonnement à long terme et dans l'utilisation d'outils dans leurs propres flux de travail. Si ces résultats sont consolidés dans des environnements réels, ils pourraient réduire le travail manuel dans des processus qui nécessitent précision et cohérence.


Un environnement plus stable pour les développeurs. GPT-5.2 Thinking, disent-ils, permet d'obtenir des performances plus élevées dans les tests logiciels exigeants, en particulier ceux qui évaluent la capacité à appliquer des modifications complètes et cohérentes dans des projets réels. L'entreprise indique que le modèle coordonne mieux les séquences d'étapes, ce qui se reflète dans les évaluations internes et les retours de plateformes telles que Windsurf ou Charlie Labs.
Moins d’erreurs en vue. OpenAI affirme que GPT-5.2 Thinking réduit la fréquence des réponses contenant des erreurs d'environ 30 % par rapport à GPT-5.1. Il s’agit d’une amélioration qu’ils associent à un raisonnement plus stable et à une plus grande capacité à détecter les erreurs avant de générer la réponse finale. L'entreprise souligne également des avancées dans la gestion des situations sensibles, comme les conversations liées à la détresse émotionnelle ou à la santé mentale. Même s'il rappelle que le modèle est encore imparfait, il maintient que ces ajustements contribuent à une expérience plus fiable au quotidien.

Où vous pouvez utiliser GPT-5.2 aujourd'hui. OpenAI indique que GPT-5.2 commencera à être déployé sur ChatGPT pour les forfaits payants, notamment Plus, Pro, Go, Business et Enterprise. Dans l'API, GPT-5.2 Thinking est disponible sous le nom gpt-5.2 et la version instantanée apparaît sous le nom gpt-5.2-chat-latest. La société a également promis de conserver GPT-5.1 pendant trois mois sur ChatGPT avant de le supprimer des forfaits payants. En termes de prix, GPT-5.2 s'élève à 1,75 $ par million de jetons d'entrée et 14 $ par million de jetons de sortie, soit plus cher que GPT-5.1, bien qu'OpenAI affirme que sa plus grande efficacité réduit le coût final des tâches exigeantes.
Images | OpenAI
À Simseo | OpenAI sait qu’elle doit continuer à générer des mèmes et des virus. C'est pourquoi elle est prête à payer beaucoup d'argent à Disney pour son contenu.
