Gemini 3 promet plus de qualité et de précision que jamais dans ses réponses. La question est de savoir si nous remarquerons réellement la différence

Gemini 3 promet plus de qualité et de précision que jamais dans ses réponses. La question est de savoir si nous remarquerons réellement la différence

Google a annoncé le lancement de Gemini 3, son nouveau modèle d'intelligence artificielle. La société affirme qu'il s'agit de son modèle de raisonnement le plus avancé car « il a été conçu pour comprendre la profondeur et les nuances ».

Gemini 3 sera également disponible en standard dans le cadre du mode AI dans le moteur de recherche Google renouvelé (dans ce cas et pour le moment, uniquement aux États-Unis). C'est la première fois que Google propose les avantages de son modèle d'IA dès le premier jour dans le moteur de recherche, mais il atteint également l'application Gemini et les développeurs qui travaillent avec AI Studio et Vertex AI.

Après le succès de Gemini 2.5 Pro et Flash, la nouvelle version arrive dans 30 nouvelles langues, dont le catalan, le basque et le galicien, et comme on dit, vous pouvez commencer à la tester dès aujourd'hui aux États-Unis… ou ailleurs en utilisant un VPN.

Gémeaux 3 promet. Au moins dans les tests

Google souligne à quel point le comportement du modèle a été exceptionnel lors de divers tests synthétiques. Ainsi, Gemini 3 est en tête du classement LMArena avec 1 501 points, le premier à franchir la barre des 1 500 points.

Capture d'écran 2025 11 18 à 10 34 00

Selon Google, les résultats des tests du Gemini 3 le placent devant tous ses concurrents dans pratiquement tous les scénarios.

En effet, il parvient à raisonner « au niveau d'un doctorat » selon les tests de Humanity's Last Exam (dépasse 37,5% du test sans outils) et GPQA Diamond (91,9%). Il fait également des progrès spectaculaires en mathématiques, comme le démontrent les 23,4% au test MathArena Apex : GPT 5.1 obtient 1,0% et Claude Sonnet 4,5 1,6% au même test, par exemple.

Le mannequin se veut également plus direct : ses réponses sont plus « concises (…) et il préfère offrir des informations précieuses plutôt que de recourir aux clichés et à la flatterie. Il vous dit ce que vous avez besoin d'entendre, pas seulement ce que vous voulez entendre ».

Nous avons un problème avec l'IA : il n'existe aucun moyen fiable de savoir si ChatGPT est meilleur que Gemini, Copilot ou Claude

Le mode 'Deep Think' de Gemini 3 va encore plus loin dans les tests : dans le Humanity's Last Exam, il atteint 41,0%, mais en plus dans l'exigeant ARC-AGI 2, il atteint 45,1% (avec exécution de code), ce qui démontre également les progrès dans ce raisonnement abstrait et cette compréhension visuelle.

Gemini 3 vous explique le monde de manière simple

Le modèle dispose d'une fenêtre contextuelle pouvant contenir jusqu'à un million de jetons, ce qui lui permet d'être utilisé, par exemple, pour analyser d'énormes référentiels de code ou de texte, puis de travailler sur ces données.

Capture d'écran 2025 11 18 À 15 18 37
Capture d'écran 2025 11 18 À 15 18 37

Son support multimodal vous permet d'analyser tous types d'informations. Par exemple, Gemini 3 peut déchiffrer et traduire des recettes manuscrites dans différentes langues pour créer un livre de recettes familial que vous pourrez partager.

Ou analysez vos matchs de pickleball (nous supposons que la même chose se produit dans d'autres sports) et identifiez les domaines dans lesquels vous pouvez vous améliorer et générer un plan d'entraînement. Ou examinez les données d'un document de recherche et générez à partir de celui-ci le code d'un guide interactif qui nous aide à mieux comprendre ces études.

En fait, l'intégration avec la recherche Google est une partie particulièrement importante de Gemini 3, qui, étant « embarqué » en mode AI, a la capacité de générer des éléments visuels interactifs (widgets, calculatrices, simulations) en temps réel. Chez Google, nous voulons que la recherche soit plus interactive que jamais, ce qui signifie que parfois les réponses ne seront pas simplement du texte, mais plutôt une petite application Web interactive qui nous permettra de mieux comprendre la réponse.

Programmation (et agents) au pouvoir

L’autre élément crucial du modèle est sa capacité en matière de programmation. Ses résultats aux tests de ce type sont encore une fois remarquables et il arrive par exemple en tête du classement WebDev Arena avec un score de 1 487 ELO.

Capture d'écran 2025 11 18 À 15 26 25
Capture d'écran 2025 11 18 À 15 26 25

Le modèle se comporte désormais de manière beaucoup plus puissante dans la partie visuelle.

Il obtient également un score de 54,2 % au Terminal-Bench 2.0, qui évalue la capacité d'un modèle à utiliser des outils et à faire fonctionner un ordinateur via un terminal. De plus, il surpasse de loin 2,5 Pro dans SWE-bench Verified (76,2 %), un test de référence qui mesure l'efficacité des agents de planification.

Ces capacités de programmation de Gemini 3 sont destinées à être utilisées dans une nouvelle plateforme de développement d'agents appelée Google Antigravity. L'expérience du développeur utilise un environnement de développement intégré (IDE) d'IA « conventionnel », mais vos agents peuvent avoir accès à l'éditeur, au terminal et au navigateur.

Nous ne savons pas ce que mesurent les benchmarks de l’IA. Nous avons donc parlé à l'Espagnol qui a créé l'un des plus difficiles

Cela signifie que ces agents peuvent planifier et exécuter de manière autonome des tâches logicielles complexes et valider leur propre code, ce qui permet aux développeurs humains d'examiner et d'auditer ce code plus facilement que jamais.

Le véritable défi des modèles les plus récents

Sur le papier, le Gemini 3 est postulé comme un modèle pouvant réellement faire la différence par rapport à ses concurrents. Les résultats des tests et la propre trajectoire de Gemini nous laissent penser que le comportement de ce modèle sera effectivement remarquable.

Gémeaux2
Gémeaux2

Cependant, la question est de savoir si nous remarquerons réellement la différence. Ces derniers mois, nous avons vu comment d'autres sociétés d'IA ont lancé de nouveaux modèles, mais l'impact pour une grande majorité d'utilisateurs a été discret : les modèles précédents fonctionnaient déjà très bien, et bien que les nouveaux apportent sans aucun doute des améliorations, pour de nombreuses consultations, ces améliorations nous permettent de percevoir ce saut de performances.

Nous voyons ici deux manières pour Google de démontrer efficacement les capacités de ces modèles. La première opportunité pour Gemini 3 sera probablement dans le domaine de la programmation, et ce seront ces professionnels qui pourront probablement tirer le meilleur parti de ces capacités supplémentaires.

Google est la grande couverture de l'IA : avec Gemini, il fait pratiquement tout correctement

Mais pour le reste des utilisateurs, ce sera le nouveau mode AI et l'application Gemini qui devront nous faire remarquer ces fonctionnalités. Nous sommes intrigués par cette capacité à répondre avec de petits éléments interactifs – graphiques, widgets – et peut-être qu’avec eux nous découvrirons vraiment cette nouvelle capacité de ce chatbot.

À Simseo | Disons au revoir à Google Assistant une décennie plus tard. Google a commencé à supprimer son code pour ne laisser qu'une seule option : Gemini