« Il y aura des gens qui tomberont amoureux d'une IA et il faut s'y préparer »
C'est le film de la semaine dans la Silicon Valley. Un peu plus d'une décennie s'est écoulée depuis la sortie de « Her » et nous pouvons déjà dire que cela a cessé d'être de la science-fiction et est devenu quelque chose de très réel. Cette semaine, les deux grandes sociétés d'intelligence artificielle ont présenté deux projets (GPT-4o et Astra) qui rappellent clairement Samantha, l'assistante vocale virtuelle de Scarlett Johansson.
Le niveau d’attente à l’égard des nouveaux agents IA vocaux est si élevé que Même Sundar Pichai, PDG de Google, a dû donner sa vision à ce propos. Lors d'une réunion avec des journalistes internationaux organisée lors de Google I/O 2024 et à laquelle nous de Simseo avons participé, il a été interrogé sur les relations que nous aurons avec l'IA, sur les futures lunettes Google et sur la manière dont Gemini se propage rapidement dans l'entreprise. . « Une nouvelle ère commence », dit-on chez Google. C’est ainsi que l’explique son haut responsable.
La première chose que défend Sundar Pichai est que « chez Google, nous sommes sur la voie de l'IA depuis très, très longtemps. C'est formidable de voir que nous profitons désormais de ces avantages de l'IA dans tous nos produits ».
Même si le moment qui a changé la tendance a été l’arrivée de ChatGPT, Google profite de toute opportunité pour justifier qu’il était déjà une référence bien avant. C’était une époque où l’équipe DeepMind réalisait un travail spectaculaire, bien que typique du monde académique et très éloigné des services Google que nous utilisons.
L'année où nous parlerons à l'IA (et elle verra ce que nous faisons)
« En raison de la taille de nos produits, nous pensons pouvoir vraiment aider les utilisateurs à très grande échelle. Nos modèles Gemini ont été construits nativement de manière multimodale et maintenant, avec le projet Astra, nous voyons cela devenir une réalité », décrit Pichai.
Sergueï Brin, le fondateur de Google, que nous avons également eu l'occasion de rencontrer cette semaine, va dans le même sens. « Je ne m'attendais pas à ce que nos expériences aillent aussi loin », nous a expliqué Brin, faisant référence au fait que Gemini a été créé en pensant au texte, mais étant multimodal, la porte était déjà ouverte à ce que nous allons voir. année. « C'est une vision que nous avions déjà lorsque nous avons été parmi les premiers à former, de toutes pièces, un modèle multimodal natif« , explique Pichai, défendant encore une fois que Google ne suit pas les traces d'autres entreprises, malgré le fait que ses démonstrations arrivent plus tard.
Nous voulons dire être capable de parler à l’IA. Le New York Times a été l'un des premiers cette semaine à affirmer que l'ère de « Elle » était arrivée. Et même si, comme le souligne El País, cette comparaison n’est rien d’autre qu’une stratégie marketing visant à amplifier les possibilités de l’IA, il est amusant de discuter de ses implications sociales.
« Avant de dire quoi que ce soit d'autre, je dois dire que j'aime ma femme », a plaisanté Pichai avant de répondre à propos de « Elle ». « Avec chaque technologie, au fur et à mesure de son évolution, il existe de nombreux cas de double usage. Avec la voix, par exemple, certains voudront utiliser l'IA pour préserver les souvenirs de leurs proches décédés. C'est une technologie très puissante. Et oui, aussi Il y aura des gens qui, au fil du temps, pourront établir des relations plus profondes avec ces assistants ou agents IA.. Et oui, je pense aussi que nous devrions nous préparer à toutes ces possibilités. Je pense que c'est pourquoi il est si important que cette technologie soit mise en œuvre de manière responsable. Et nous nous engageons à le faire. Je pense à des protections comme SynthID, que nous avons mises en place avec les images et que nous allons également appliquer à la voix et à la vidéo. »
Pichai n'est pas tombé amoureux d'une IA, mais il nous explique quand il est tombé amoureux de l'IA. « C'est lorsque j'ai vu une démo de Google Brain, maintenant sur DeepMind. Quand les réseaux de neurones étaient capables de reconnaître l'image d'un chat. Ce moment était la première fois dans mon esprit que c'était quelque chose de spécial. Un moment où j'ai réalisé que cette technologie allait fonctionner », se souvient le PDG de Google.
Dans cette Google I/O, que Pichai lui-même décrit en plaisantant comme la version technologique du « Eras Tour » de Taylor Swift mais « avec moins de changements de garde-robe », des avancées au-delà de la multimodalité ont également été présentées. Non seulement l’IA fonctionnera désormais avec la voix et la vidéo, mais elle bénéficiera également d’un meilleur contexte. C'est ce que représente Google avec la version de Gemini Pro pouvant contenir jusqu'à deux millions de tokens, disponible en avant-première. La mémoire et le contexte auxquels les IA auront accès seront bien plus vastes, ce qui nous permettra d’avoir des conversations plus longues avec davantage de facteurs en jeu. Quelque chose qui nous rappelle aussi « Elle ».
Le troisième aspect que défend Pichai est celui des agents IA. Dans le sens où ils pourront faire des actions à notre place : « qu'il s'agisse d'une recherche faisant des requêtes complexes, ou de Gémeaux essayant de planifier un voyage. Au fil du temps, nous pourrons ayez-le dans Chrome, en arrière-plan, pour nous aider dans nos projets. « Je crois que nous sommes bien positionnés en raison de notre leadership en matière de recherche, d'infrastructures, d'innovation et de notre empreinte mondiale. »
Google pourrait désormais s'appeler Gemini
Google internalise Gemini d'un seul coup. Ce n'est pas une tâche facile. Google compte environ 180 000 employés dans le monde. Et en un peu plus d’un an, ils ont obligé toutes les équipes à faire de l’IA un élément central de leur travail. La preuve de la priorité accordée est que Demis Hassabis, PDG de DeepMind, a joué un rôle très important lors de Google I/O et semble même être un possible successeur de Pichai au poste de PDG. Quelque chose a priori difficile à concevoir, puisque Hassabis a un profil plus technique et, comme le décrit Business Insider, l'idée de gérer des dizaines d'équipes variées et des centaines de milliers de travailleurs chaque jour « serait un cauchemar pour lui ».
« Nous sommes à un stade où tous les différents produits et projets de Google internalisent Gemini et repensent notre façon de faire les choses. Et c'est vraiment excitant, car nous réfléchissons à la manière de passer à l'étape suivante et de déterminer quelle est la bonne façon de le faire. travailler pour les utilisateurs. « utilisateurs », décrit Pichai.
« On parle de « l'une des technologies les plus importantes sur lesquelles l'humanité aura jamais travaillé. », déclare le PDG de Google. Pas dans le passé, mais dans le futur. Comme si une fois que nous rendrions l’IA complètement autonome, nous n’aurions plus de tâches dans lesquelles les humains auraient un meilleur rôle.
« C'est un tournant. Chez Google, nous investissons dans ce domaine depuis longtemps, en construisant des modèles de référence et en travaillant à leur mise en œuvre dans la vie quotidienne de milliards de personnes. J'aime l'innovation et pour moi, je pense que cela a été un tournant. une belle semaine pour être dans le monde de la technologie », est-il fier.
D'Android aux lunettes
La démo du Projet Astra montre un utilisateur interagissant par voix et vidéo à travers des lunettes. Sundar Pichai confirme le projet de Google de lancer ses propres lunettes avec Astra et ouvre la porte à la création d'un nouvel écosystème autour d'elles : « Le projet Astra fait partie de notre technologie mobile, mais je pense qu'il est réellement utilisé avec des lunettes au format de type. Cela a toujours été notre vision. Nous allons investir dans la création d'un écosystème de lunettes intelligentes à réalité augmentée. Bientôt, nous aurons des produits intéressants à vous présenter. »
Dans le passé, Google I/O tournait entièrement autour d’Android. Cette fois, il a été déplacé au deuxième jour. Ce sont d’autres moments. Parmi les nouvelles fonctionnalités d’Android 15, nous avons le projet de mettre fin aux appels SPAM grâce à l’IA. Et il sera basé sur Gemini Nano.
« C'est une période incroyable pour voir comment les systèmes d'exploitation évoluent. Chaque année, nous allons pouvoir en intégrer davantage dans l'appareil. Ce qui est maintenant Gemini Flash finira par devenir Gemini Nano. Je pense que la capacité d'investir plus d'intelligence dans l'appareil va étendre considérablement les capacités. » possibilités. Comme ce que nous avons vu avec la détection d'arnaques en privé, si vous choisissez de participer. Mais ce n'est que la pointe de l'iceberg. L'IA de l'appareil nous aidera avec nos documents, avec les photos… à tout moment, disons », décrit joyeusement Pichai, qui souligne également qu'il pense sur le long terme : « Je ressens cela. Dans ma tête, il y a une décennie de plans avec tous les projets que je souhaite que les équipes construisent. Et là, nous avons commencé à travailler. Et ce qui représente une décennie peut finir par se résumer à quelques années. »
Google, au milieu des grands problèmes du monde
C'est une année électorale. Plus de 3 milliards de personnes vont voter cette année. Chez Google, ils prêtent attention au rôle que l'IA peut jouer en eux, mais Pichai est confiant.
« C'est probablement l'un des problèmes les plus importants du moment. Chez Google, nous investissons depuis longtemps dans la protection de l'intégrité des élections. C'est l'une de nos principales priorités en tant qu'entreprise, en particulier dans des produits comme Search et YouTube. Nous avons déployé SynthID et l'équipe RED « Nous enquêtons également avec le projet Jigsaw. Nous comprenons d'abord les modèles, puis nous agissons. Et nous partageons ces informations avec les bonnes personnes et les gouvernements concernés. »
« Je pense que nous avons fait un excellent travail et je pense Nous sommes à une époque où, en tant que société, nous savons déjà discerner facilement ce qui est réel et ce qui ne l’est pas.. Je suis prudemment optimiste quant à notre capacité à jouer notre rôle correctement. « Je pense que les enjeux pour l'avenir sont plus difficiles, mais pour cette année, je suis prudemment optimiste. »
En tant que l'un des managers les plus puissants au monde, Sundar Pichai a une réponse diplomatique prête à répondre aux questions les plus controversées. Concernant le projet Nimbus et le licenciement de près d'une trentaine de travailleurs pour protestation, le PDG de Google répond que ces licenciements « n'ont rien à voir avec l'expression d'inquiétudes ». Pichai défend que Google « plus que toute autre entreprise», permet à ses salariés de « s'exprimer ». Il justifie cela par l'établissement d'un « code de conduite, d'une manière qui ne soit pas destructrice pour le lieu de travail ».
« Nous sommes clairs sur le fait que nous ne voulons pas que nos systèmes d'IA soient déployés dans des systèmes d'urgence pour les armes, etc. Project Nimbus est une entreprise qui a signé des accords commerciaux avec un gouvernement, comme beaucoup d'autres accords commerciaux. Dans ces accords, il y a des conditions d'utilisation et ils sont toujours d'actualité », décrit James Manyika, vice-président de la recherche, de la technologie et de la société chez Google.
Concernant les gouvernements, Pichai termine en évoquant l’importance de la réglementation de l’IA. « Il me semble logique que les pays réfléchissent à cette question extraordinaire et importante. Si je me mets à leur place, lorsque l'on pense à l'impact de l'IA sur la société, il est logique de vouloir avoir un débat et trouver un équilibre. .IA Cela apportera une grande opportunité économique, mais cela affectera également de nombreuses industries au fil du temps. Je suis clair que nous avons besoin de cadres plus mondiaux. Ce qui fait d’Internet la force qu’il est aujourd’hui, c’est parce qu’il s’agit d’un bien mondial ; parce que nous sommes tous d’accord sur des normes communes et sur une manière de travailler ensemble. J'espère qu'avec l'IA, cela pourra également être appliqué. »
À Simseo | Il y a trois ans, j'ai créé un robot inspiré de Scarlett Johansson, maintenant je veux vous aider pour que vous puissiez le faire aussi