Google dévoile le dernier modèle d'IA, Gemini 2.0

Google a annoncé mercredi le lancement de Gemini 2.0, son modèle d'intelligence artificielle le plus avancé à ce jour, alors que les géants mondiaux de la technologie s'efforcent de prendre la tête de cette technologie en développement rapide.

Le PDG Sundar Pichai a déclaré que le nouveau modèle marquerait ce que l'entreprise appelle « une nouvelle ère agentique » dans le développement de l'IA, avec des modèles d'IA conçus pour comprendre et prendre des décisions sur le monde qui vous entoure.

« Gemini 2.0 vise à rendre l'information beaucoup plus utile », a déclaré Pichai dans l'annonce, soulignant la capacité améliorée du modèle à comprendre le contexte, à réfléchir à plusieurs étapes et à prendre des mesures supervisées au nom des utilisateurs.

Ces développements « nous rapprochent de notre vision d'un assistant universel », a-t-il ajouté.

Cette publication a fait grimper les actions de Google de plus de 4% à Wall Street, un jour après que l'action ait déjà gagné 3,5% après la sortie d'une puce quantique révolutionnaire.

Les géants de la technologie prennent furieusement des mesures pour lancer des modèles d’IA plus puissants, malgré leur coût immense et certaines questions quant à leur utilité immédiate pour l’économie au sens large.

Un « agent » d'IA, la dernière tendance de la Silicon Valley, est un assistant numérique censé détecter son environnement, prendre des décisions et entreprendre des actions pour atteindre des objectifs spécifiques.

Les géants de la technologie promettent que les agents seront la prochaine étape d’une révolution de l’IA déclenchée par le lancement en 2022 de ChatGPT, qui a pris d’assaut le monde.

Gemini 2.0 est initialement déployé auprès des développeurs et des testeurs de confiance, avec des plans pour une intégration plus large dans les produits Google, en particulier dans la recherche et la plate-forme Gemini.

La plupart des formations en IA ont été monopolisées par le géant des puces Nvidia, qui a été catapulté par l'explosion de l'IA pour devenir l'une des entreprises les plus valorisées au monde.

Pas de Nvidia

La technologie est alimentée par le matériel TPU (Tensor Processing Unit) de sixième génération de Google, baptisé Trillium, que la société a désormais mis à la disposition de ses clients.

Google a souligné que les processeurs Trillium étaient utilisés exclusivement pour la formation et l'exécution de Gemini 2.0.

La plupart des formations en IA ont été monopolisées par le géant des puces Nvidia, qui a été catapulté par l'explosion de l'IA pour devenir l'une des entreprises les plus valorisées au monde.

Google a déclaré que des millions de développeurs créent déjà des applications avec la technologie Gemini, qui a été intégrée dans sept produits Google, chacun desservant plus de deux milliards d'utilisateurs.

Les pouvoirs de Gemini 2.0 devraient arriver début 2025 à l'application de recherche de Google, qui reste la principale source de revenus de l'entreprise.

La première version de la famille de modèles 2.0 sera Flash, offrant des performances plus rapides tout en gérant plusieurs types d'entrée (texte, images, vidéo, audio) et de sortie (y compris les images et la parole générées).

Les utilisateurs de Gemini dans le monde entier peuvent déjà accéder à une version de Flash réservée au chat, a indiqué la société, les testeurs ayant accès à une version multimodale capable d'interpréter les images et l'environnement.

Google a également déclaré qu'il expérimentait un produit capable d'utiliser des applications logicielles, des sites Web et d'autres outils en ligne, un peu comme un utilisateur humain. OpenAI et Anthropic ont dévoilé des fonctionnalités similaires.

La société a également présenté une nouvelle version de Project Astra, un assistant numérique pour smartphone comme Siri d'Apple qui répond aux images ainsi qu'aux commandes verbales.