Google mène une fois de plus la course à l'IA et possède quelque chose qu'aucun rival ne peut égaler
Google a lancé Gemini 3.1 Pro, une mise à jour incrémentielle de son modèle phare pleine de surprises. Et selon ses benchmarks, le modèle a bien plus à dire qu’il n’y paraît. Dans un raisonnement abstrait, Google veut commencer à donner le ton sur Anthropic et OpenAI. Mais leur atout n’est pas seulement cela, car ils ont quelque chose que d’autres startups ne peuvent pas reproduire : l’ensemble de leur écosystème et la manière dont ils y intègrent l’IA.
Ce qui vient de se passer. Trois mois seulement après le lancement de Gemini 3 Pro, Google a publié Gemini 3.1 Pro. Ce qui est curieux, c’est que le saut est bien plus impressionnant qu’il n’y paraît si l’on regarde seulement le « .1 » devant lui. Selon l'entreprise, le nouveau modèle améliore considérablement le raisonnement du précédent et représente la base de renseignement qui alimentait déjà la mise à jour Gemini 3 Deep Think, présentée la semaine dernière.
Il est disponible dès aujourd'hui dans l'application Gemini, dans NotebookLM (pour les abonnés Pro et Ultra), dans l'API via AI Studio et dans les environnements d'entreprise via Vertex AI.

Données. Dans le benchmark ARC-AGI-2, conçu pour évaluer la capacité à résoudre des modèles logiques complètement nouveaux, sans possibilité de les avoir vus pendant l'entraînement, Gemini 3.1 Pro a atteint 77,1 %. Pour mettre les choses en contexte : Gemini 3 Pro était à 31,1 %, tandis que Claude Sonnet 4.6 était à 58,3 % et Opus 4.6 à 68,8 %. Autrement dit, Google a non seulement comblé l’écart, mais l’a même dépassé.
Il convient de noter que jamais une revue à mi-parcours de ses modèles n’avait enregistré une avancée aussi prononcée du raisonnement.
Ce que disent les chiffres dans le reste des benchmarks. Dans le tableau comparatif qui accompagne l'annonce, Gemini 3.1 Pro est en tête dans la majorité des catégories évaluées : il obtient le meilleur résultat au Dernier examen de l'humanité sans outils (44,4 %), il est en tête du GPQA Diamond avec 94,3 % en connaissances scientifiques, et il double le modèle précédent dans APEX-Agents, la référence pour les tâches à long terme. Il excelle également dans MCP Atlas (flux de travail en plusieurs étapes), BrowseComp (recherche d'agents) et MMMLU (questions et réponses multilingues).

Il convient de noter que, selon ces benchmarks, il n'est pas meilleur en tout : dans GDPval-AA Elo, qui évalue les tâches dans des environnements de travail réels, Claude Sonnet 4.6 surpasse Gemini 3.1 Pro avec 1 633 points contre 1 317. Et dans SWE-Bench Verified, le test de programmation avec des agents, Opus 4.6 obtient un score de 80,8 %, contre 80,6 % pour Google. Cependant, dans le calcul global, la balance penche clairement en faveur du nouveau modèle de Google.
Dans Arena Leaderboard (le classement basé sur les votes des utilisateurs), Claude Opus 4.6 est toujours en tête dans le texte et le code, bien qu'ici « les sensations » de chaque utilisateur prennent plus d'importance en matière de notation qu'autre chose.
Un avantage concurrentiel évident. L’argument le plus fort en faveur de Google ne concerne même pas la puissance de son dernier modèle. L’entreprise n’a pas besoin de vous convaincre d’utiliser son IA : elle est déjà là où vous en êtes. Search, Gmail, YouTube, Android, Docs, Drive, Google Photos, Maps… Son IA ne dépend pas de l'ouverture d'une application spécifique, mais s'intègre dans l'écosystème que des millions de personnes utilisent déjà quotidiennement.
Pour le reste des startups (OpenAI, Anthropic…), elles ont besoin que vous utilisiez leurs modèles dans des environnements spécifiques (ChatGPT, Claude). Google est tout simplement déjà là. Il s’agit d’un fossé que même le meilleur modèle au monde ne pourrait peut-être pas balayer à l’heure actuelle.
Et puis il y a le prix. Gemini 3.1 Pro est proposé aux utilisateurs disposant d'un abonnement à Google AI Plus, Pro et Ultra, bien que vous puissiez également l'essayer de manière limitée dans le plan gratuit. A noter qu'il en est actuellement à une version préliminaire.
Le récit que Google veut que nous ayons en tête est que, pour un prix modeste, vous avez accès à ce modèle, ainsi qu'à tout ce que l'entreprise propose dans son écosystème, y compris le stockage. C’est très difficile à surmonter à l’heure actuelle. De plus, pour les développeurs, l’API est également proposée à un prix très compétitif. Ainsi, d'un point de vue pratique et de poche, Google donne tout pour que tous ses utilisateurs continuent à utiliser son écosystème, avec ou sans la meilleure IA.
Le « .1 ». La course à l’IA se déroule à un rythme effréné depuis des mois. Et le plus intéressant de tous, c'est que Google, arrivé tardivement dans la course, a connu une sacrée année au cours de laquelle il a structuré tout le désordre qu'il a eu avec son IA. Le passage de Gemini 3 à 3.1 en termes de raisonnement est supérieur à ce que de nombreux concurrents ont réalisé entre les versions complètes. Et cela tout en conservant l’avantage d’être l’entreprise qui contrôle les points d’entrée les plus pertinents sur Internet. Il reste à voir comment ils résolvent la monétisation de leur intelligence artificielle, mais ils ont certainement pris leurs mesures.
Image de couverture | Alex Dudar et Google
À Simseo | Le scientifique qui a rendu possible l’IA que nous connaissons aujourd’hui vient de récolter 1 milliard. Son nouvel objectif est de lui apprendre à voir l'espace
