Google lance Gemini, augmentant les enjeux dans la course mondiale à l’IA
Google a franchi une nouvelle étape dans l’intelligence artificielle mercredi avec le lancement du projet Gemini, un modèle d’IA entraîné à se comporter de manière humaine, susceptible d’intensifier le débat sur les promesses et les périls potentiels de la technologie.
Le déploiement se déroulera par phases, avec des versions moins sophistiquées de Gemini appelées « Nano » et « Pro » étant immédiatement intégrées au chatbot Bard de Google, alimenté par l’IA, et à son smartphone Pixel 8 Pro.
Avec l’aide de Gemini, Google promet que Bard deviendra plus intuitif et meilleur dans les tâches impliquant une planification. Sur le Pixel 8 Pro, Gemini pourra résumer rapidement les enregistrements réalisés sur l’appareil et fournir des réponses automatiques sur les services de messagerie, à commencer par WhatsApp, selon Google.
Les plus grandes avancées de Gemini n’interviendront qu’au début de l’année prochaine, lorsque son modèle Ultra sera utilisé pour lancer « Bard Advanced », une version améliorée du chatbot qui ne sera initialement proposée qu’à un public test.
Dans un premier temps, l’IA ne fonctionnera qu’en anglais dans le monde entier, même si les dirigeants de Google ont assuré aux journalistes lors d’un point de presse que la technologie n’aurait aucun problème à se diversifier à terme dans d’autres langues.
Basé sur une démonstration de Gemini pour un groupe de journalistes, le « Bard Advanced » de Google pourrait être capable d’un multitâche IA sans précédent en reconnaissant et en comprenant simultanément des présentations impliquant du texte, des photos et des vidéos.
Gemini finira également par être intégré au moteur de recherche dominant de Google, bien que le moment de cette transition n’ait pas encore été précisé.
« Il s’agit d’une étape importante dans le développement de l’IA et le début d’une nouvelle ère pour nous chez Google », a déclaré Demis Hassabis, PDG de Google DeepMind, la division IA derrière Gemini. Google a pris le dessus sur d’autres soumissionnaires, y compris la société mère de Facebook, Meta, pour acquérir la société DeepMind, basée à Londres, il y a près de dix ans, et l’a depuis fusionné avec sa division « Brain » pour se concentrer sur le développement de Gemini.
Les capacités de résolution de problèmes de cette technologie sont présentées par Google comme étant particulièrement compétentes en mathématiques et en physique, alimentant l’espoir des optimistes de l’IA qu’elle pourrait conduire à des percées scientifiques qui amélioreraient la vie des humains.
Mais un côté opposé du débat sur l’IA s’inquiète du fait que la technologie finisse par éclipser l’intelligence humaine, entraînant la perte de millions d’emplois et peut-être des comportements encore plus destructeurs, comme l’amplification de la désinformation ou le déclenchement du déploiement d’armes nucléaires.
« Nous abordons ce travail avec audace et responsabilité », a écrit le PDG de Google, Sundar Pichai, dans un article de blog. « Cela signifie être ambitieux dans nos recherches et rechercher les capacités qui apporteront d’énormes avantages aux personnes et à la société, tout en intégrant des garanties et en travaillant en collaboration avec les gouvernements et les experts pour faire face aux risques à mesure que l’IA devient plus performante. »
L’arrivée de Gemini est susceptible de faire monter la barre dans une compétition d’IA qui s’est intensifiée au cours de l’année écoulée, avec la startup de San Francisco OpenAI et son rival de longue date dans l’industrie, Microsoft.
Soutenu par la puissance financière et la puissance de calcul de Microsoft, OpenAI était déjà en train de développer son modèle d’IA le plus avancé, GPT-4, lorsqu’il a publié l’outil gratuit ChatGPT à la fin de l’année dernière. Ce chatbot alimenté par l’IA est devenu célèbre dans le monde entier, faisant le buzz sur la promesse commerciale de l’IA générative et faisant pression sur Google pour qu’il repousse Bard en réponse.
Au moment même où Bard arrivait, OpenAI a publié GPT-4 en mars et a depuis intégré de nouvelles fonctionnalités destinées aux consommateurs et aux entreprises, notamment une fonctionnalité dévoilée en novembre qui permet au chatbot d’analyser les images. Elle est en compétition commerciale avec d’autres startups d’IA rivales telles qu’Anthropic et même avec son partenaire Microsoft, qui détient les droits exclusifs sur la technologie OpenAI en échange des milliards de dollars qu’il a investis dans la startup.
Jusqu’à présent, l’alliance a été une aubaine pour Microsoft, qui a vu sa valeur marchande grimper de plus de 50 % depuis le début de l’année, principalement en raison de la conviction des investisseurs que l’IA deviendra une mine d’or pour l’industrie technologique. La société mère de Google, Alphabet, a également surfé sur la même vague, sa valeur marchande ayant augmenté de plus de 500 milliards de dollars, soit environ 45 %, depuis le début de l’année. Malgré l’anticipation entourant Gemini ces derniers mois, son lancement n’a pratiquement pas fait bouger le titre d’Alphabet mercredi matin.
L’implication croissante de Microsoft dans OpenAI au cours de l’année écoulée, associée aux tentatives plus agressives d’OpenAI pour commercialiser ses produits, a fait naître des inquiétudes quant au fait que l’organisation à but non lucratif s’est éloignée de sa mission initiale de protéger l’humanité à mesure que la technologie progresse.
Ces inquiétudes se sont amplifiées le mois dernier lorsque le conseil d’administration d’OpenAI a brusquement licencié le PDG Sam Altman dans un différend portant sur des questions de confiance non divulguées. Après des réactions négatives qui ont menacé de détruire l’entreprise et d’entraîner un exode massif de talents en ingénierie de l’IA vers Microsoft, OpenAI a ramené Altman au poste de PDG et a remanié son conseil d’administration.
Avec la sortie de Gemini, OpenAI pourrait se retrouver à essayer de prouver que sa technologie reste plus intelligente que celle de Google.
« Je suis impressionné par ce dont il est capable », a déclaré Eli Collins, vice-président des produits de Google DeepMind, à propos de Gemini.
Lors d’une conférence de presse virtuelle, Google a refusé de partager le nombre de paramètres de Gemini, une mesure mais pas la seule de la complexité d’un modèle. Un livre blanc publié mercredi décrit la version la plus performante de Gemini surpassant GPT-4 dans les examens à choix multiples, les mathématiques à l’école primaire et d’autres critères, mais reconnaît les difficultés en cours pour amener les modèles d’IA à atteindre des compétences de raisonnement de plus haut niveau.
Certains informaticiens voient les limites de ce qui peut être fait avec les grands modèles de langage, qui fonctionnent en prédisant de manière répétée le mot suivant dans une phrase et sont enclins à inventer des erreurs connues sous le nom d’hallucinations.
« Nous avons fait beaucoup de progrès dans ce qu’on appelle la factualité avec Gemini. Gemini est donc notre meilleur modèle à cet égard. Mais c’est encore, je dirais, un problème de recherche non résolu », a déclaré Collins.