Sundar Pichai (PDG Google): "Nous sommes entrés dans une nouvelle phase de l'évolution des plates-formes d'IA: les années de recherche sont concrétisées dans des applications réelles"

« Je suis particulièrement enthousiaste à propos du progrès rapide du modèle (Gemini, ED). Le score ELO, qui mesure les performances de grands modèles linguistiques, a augmenté de plus de 300 points par rapport à Gemini Pro de première génération. Aujourd’hui, Gemini 2.5 Pro domine le classement Larena dans toutes les catégories«.

Comme, Sundar Pichai, PDG de Google, Il a fait ses débuts à la Google I / O 2025 le 20 mai 2025.

Nous rapportons les principaux points de l’intervention complète.

Le monde adopte l’IA

« This improvement of the model is made possible by our leading leading infrastructure. Our seventh generation TPU, Ironwood, is the first designed to support on large scale the workloads of artificial intelligence oriented towards reasoning and inference. It offers ten times higher compared to the previous generation and integrates an incredible calculation capacity of 42.5 Exaflop par pod: Un résultat vraiment extraordinaire « , a déclaré Pichar.

« La solidité de notre infrastructure, qui atteint le niveau des TPU, est ce qui nous permet d’offrir des modèles beaucoup plus rapides, même dans un contexte de forte réduction des coûts. Nous avons toujours été en mesure d’offrir les meilleurs modèles au prix le plus pratique. Google ne se limite pas à dominer la loi de Pareto: nous avons changé les limites fondamentales, la redéfinant », a-t-il ajouté.

Le PDG de Google a souligné que « de plus en plus d’intelligence est disponible pour tout le monde partout ». Le monde réagit, adoptant rapidement. Voici quelques indicateurs importants du changement, selon Pichar.

«L’année dernière, en cette même période, nous avons développé 9.7 Trion de jeton par mois dans nos produits et abeilles. Maintenant, nous élaborons plus de 480 milliards de dollars, soit 50 fois plus.
Plus de 7 millions de développeurs créent avec des Gémeaux, cinq fois plus que l’an dernier au cours de la même période, et l’utilisation des Gémeaux sur Vertex AI a augmenté de 40 fois.
L’application Gemini compte désormais plus de 400 millions d’utilisateurs actifs mensuels. Nous assistons à une forte croissance et une forte implication, en particulier avec la série 2.5 modèles. Pour ceux qui utilisent 2.5 Pro dans l’application Gemini, l’utilisation a augmenté de 45% « .

De la recherche à la réalité

Selon Pichai, ces développements indiquent que « Nous sommes entrés dans une nouvelle phase de l’évolution des plateformes d’IA: les années de recherche se concrétisent dans de véritables applications pour les utilisateurs, les entreprises et les communautés du monde entier ».

Project Starline → Google Beam + Traduction vocale

Pichai a ensuite rappelé qu’à l’occasion d’une E / S il y a quelques années, Project Starline avait été présenté, la technologie des vidéos 3D. « Le but était de créer le sentiment de partager la même pièce avec une autre personne, tout en se trouvant à une grande distance ».

« Aujourd’hui, nous sommes prêts à présenter un nouveau chapitre: Google Beam, une nouvelle plate-forme de communication vidéo orientée vers l’IA », a déclaré Pichai.

Beam prend un modèle vidéo de dernière génération pour transformer des flux vidéo 2D en une expérience 3D réaliste: en utilisant un système de caméra à six vides et l’IA, les flux vidéo sont unis et fabriqués sur un écran 3D avec une technologie Lightfield. Le système garantit un suivi de piste presque parfait, avec une précision millimétrique et 60 images par seconde, le tout en temps réel. « Le résultat est une expérience conversationnelle beaucoup plus naturelle et immersive », a déclaré Pichai.

En collaboration avec HP, les premiers appareils Google Beam seront disponibles pour les premiers clients d’ici la fin de l’année.

Pichai a ensuite parlé de Google Rencontre Et d’expériences de plus en plus immersives. Parmi ceux-ci, « il y a une technologie qui aide à surmonter les barrières linguistiques grâce à la traduction vocale, à venir à Google.

La traduction anglaise et espagnole est en phase de lancement pour les abonnés à Google avec les pros et ultra en version bêta, d’autres langues seront ajoutées dans les semaines à venir. Les clients commerciaux de Workspace pourront tester cette fonction d’aperçu cette année.

Project Astra → Gemini Live

Un autre projet de recherche présenté pour la première fois à l’E / S était le projet Astra, qui explore les compétences futures d’un assistant d’universel capable de comprendre le monde environnant. « Gemini Live intègre désormais les fonctionnalités de partage d’écran et le projet Astra Camera », a déclaré Pichai. « Les gens l’utilisent déjà de manière intéressante, de la préparation des entretiens d’embauche à la formation d’un marathon. Cette fonctionnalité est déjà disponible pour tous les utilisateurs d’Android et sera étendue aux utilisateurs iOS ».

Pichai a également déclaré que Google introduit des fonctionnalités similaires dans des produits tels que la recherche.

Project Mariner → Mode d’agent

«Réfléchissons à agents Quant aux systèmes qui combinent l’intelligence des modèles avancés de l’IA avec l’accès aux outils, afin que vous puissiez agir en votre nom et sous votre contrôle « , a-t-il déclaré.

Project Mariner représente une première étape vers les agents capables d’utiliser l’ordinateur pour interagir avec le Web et effectuer des activités pour vous. Libéré en tant que prototype de recherche en décembre, depuis lors, il a fait des pas significatifs, en particulier avec de nouvelles fonctionnalités multitâches et avec une méthode appelée « signe et répéter », ce qui permet à l’agent d’apprendre une activité après l’avoir observé une seule fois et d’appliquer ce qui a été appris à des activités similaires à l’avenir. Les compétences d’utilisation du projet Mariner Computer seront mises à la disposition des développeurs via l’API Gemini. Certains testeurs de confiance, tels que l’automatisation n’importe où et l’UIPATH, commencent déjà à créer des solutions basées sur cette technologie, qui sera distribuée plus largement cet été.

L’ordinateur n’est qu’un des outils fondamentaux nécessaires pour construire un écosystème d’agents efficaces. «Notre protocole ouvert est un exemple Agent2agentqui permet aux agents de communiquer entre eux, ou le protocole Contexte du modèle d’Anthropicce qui permet aux agents d’accéder aux services externes. Aujourd’hui, nous sommes heureux d’annoncer que Nos API Gemini et notre SDK sont désormais compatibles avec les outils MCP«, A affirmé Pichai.

Google commence également à intégrer les fonctionnalités agentiques dans Chrome, Google Research et Gemini App. Par exemple, le nouveau Mode agent Dans l’application Gemini. « Si vous recherchez une maison, l’agent peut trouver des annonces conformément à vos critères sur des sites comme Zillow, ajuster les filtres, utiliser MCP pour accéder aux annonces et même réparer une visite », a expliqué Pichai. Une version expérimentale du mode Agent arrivera bientôt pour les abonnés dans l’application Gemini. C’est une zone nouvelle et en évolution rapide.

La puissance de la personnalisation

La meilleure façon de transformer la recherche en réalité concrète est de la rendre très utile dans la vie quotidienne. Et c’est ici que la personnalisation devient extrêmement puissante. « Nous travaillons à atteindre cet objectif à travers ce que nous appelons le contexte personnel. Avec votre consentement, les modèles Gemini pourront utiliser des informations contextuelles personnelles pertinentes à partir des applications Google dans un privé, transparent et complètement sous votre application de contrôle », a déclaré Pichai.

Un exemple est les nouvelles réponses rapides personnalisées dans Gmail. « Si un contact écrit pour vous demander des conseils sur un voyage sur la route que vous avez déjà fait, les Gémeaux peuvent automatiquement rechercher dans les anciens e-mails et dans les fichiers de Google Drive, des éléments tels que, par exemple, les itinéraires enregistrés dans les documents Google, pour suggérer une réponse pleine de détails utiles.

Des réponses rapides personnalisées seront disponibles pour les abonnés d’ici la fin de l’année.

À la mode dans la recherche

Les modèles Gemini contribuent à rendre Google Research plus intelligent, agent et personnalisé.

Depuis le lancement de l’année dernière, plus de 1,5 milliard d’utilisateurs dans 200 pays et territoires ont été étendus aux OvServiews. « Au fil du temps, nous observons que les utilisateurs sont plus satisfaits des résultats et ont tendance à effectuer des recherches plus fréquemment. Dans nos principaux marchés tels que les États-Unis et l’Inde, elle génère une croissance de plus de 10% des types de questions qui les montrent. Et la croissance continue d’augmenter avec le temps », a déclaré Pichai.

Pour ceux qui veulent une expérience de recherche entièrement basée sur l’IA, Google présente des modes, en version renouvelée. Grâce à une capacité de raisonnement plus avancée, ce sera possible Demandez à la mode de questions plus longues et plus complexes. Le Testeur précoce Ils ont déjà commencé à poser des questions deux à trois fois plus longues que la recherche traditionnelle, avec la possibilité de continuer avec des questions supplémentaires.

« Cette fonctionnalité est disponible en tant que nouvelle carte au sein de la recherche. Je l’ai utilisé très souvent et j’ai radicalement transformé ma façon d’utiliser la recherche. Je suis heureux d’annoncer que des modes sont disponibles à partir d’aujourd’hui pour tous les utilisateurs des États-Unis. Grâce aux derniers modèles Gemini, les réponses aux plus rapides de la qualité et de la précision. Research, « Pichai.

Améliore le modèle le plus sophistiqué: Gemini 2.5

Le modèle le plus puissant et le plus efficace, Gémeaux 2.5 Flashest très apprécié par les développeurs pour sa vitesse et son faible coût. Le nouveau Flash 2.5 est meilleur dans presque tous les aspects, avec des progrès significatifs dans les références clés concernant le raisonnement, la multimodalité, le code et les contextes étendus. Il est deuxième à 2,5 Pro dans le classement Larena.

«Nous améliorons également 2.5 Pro avec l’introduction d’un nouveau mode de raisonnement avancé, Pensée profondequi est basé sur nos recherches les plus récentes sur la pensée et le raisonnement, et comprend des techniques de raisonnement parallèle « , a déclaré le PDG de Google.

Une application Gemini plus personnelle, proactive et puissante

La recherche approfondie devient plus personnelle, pour vous permettre de télécharger des fichiers et, bientôt, de vous connecter à Google Drive Ed Gmail, améliorant la possibilité de générer des rapports de recherche personnalisés. « De plus, nous effectuons une intégration avec la toile, pour permettre la création d’infographies dynamiques, de quiz et même de podcasts dans de nombreuses langues en un seul clic. En plus de cela, nous assistons à l’adoption passionnante de codage d’ambiance avec Canvas, ce qui permet à de plus en plus de gens de créer des applications fonctionnelles, conversant simplement avec GEMINI », a expliqué Pichai.

En ce qui concerne Gémeaux en directune fonctionnalité qui a trouvé une grande appréciation entre les utilisateurs, Google met à disposition gratuitement le partage de la caméra et l’écran pour tout le monde, y compris les utilisateurs iOS. Bientôt, il sera également possible de connecter des Gémeaux en direct aux applications Google préférées, pour une assistance encore plus fluide.

Le dernier modèle vidéo à découper, Veo 3inclut désormais la génération de l’audio indigène. «Nous présentons également Imagen 4notre modèle de génération d’images plus récentes et plus puissantes. Les deux sont disponibles dans l’application Gemini, qui ouvre un monde complètement nouveau à la créativité. Nous offrons aux directeurs ces opportunités grâce à un nouvel outil, Flow. Vous pouvez créer des clips de film et transformer un court clip en une scène plus longue « , a déclaré Pichai.

« Une occasion de rendre la vie meilleure«

« L’opportunité offerte par l’IA est vraiment énorme. Ce sera la tâche de cette nouvelle génération de développeurs, d’innovateurs et de résolutions de problèmes s’assurant que les avantages de l’IA peuvent atteindre autant de personnes que possible. Il est particulièrement stimulant de penser que la recherche que nous travaillons aujourd’hui sera la base de la réalité de demain, de la robotique à Google Calcul.