L'IA Gemini de Google laisse entrevoir le prochain grand pas en avant pour la technologie : l'analyse des informations en temps réel

Google a lancé Gemini, un nouveau système d’intelligence artificielle (IA) capable de comprendre et de parler intelligemment de presque tous les types d’invites : images, texte, parole, musique, code informatique et bien plus encore.

Ce type de système d’IA est connu sous le nom de modèle multimodal. C’est une étape au-delà de la simple capacité à gérer du texte ou des images comme les précédents. Et cela donne une bonne idée de la direction que pourrait prendre l’IA : être capable d’analyser et de répondre aux informations en temps réel provenant du monde extérieur.

Bien que les capacités de Gemini ne soient peut-être pas aussi avancées qu’elles le paraissent dans une vidéo virale, éditée à partir de textes et d’images fixes soigneusement sélectionnés, il est clair que les systèmes d’IA progressent rapidement. Ils se dirigent vers une capacité à gérer des entrées et des sorties de plus en plus complexes.

Pour développer de nouvelles capacités, les systèmes d’IA dépendent fortement du type de données de « formation » auxquelles ils ont accès. Ils sont exposés à ces données pour les aider à améliorer ce qu’ils font, notamment en faisant des déductions telles que reconnaître un visage sur une image ou rédiger un essai.

À l’heure actuelle, les données sur lesquelles des entreprises telles que Google, OpenAI, Meta et d’autres entraînent leurs modèles sont encore principalement collectées à partir d’informations numérisées sur Internet. Cependant, des efforts sont déployés pour élargir radicalement la portée des données sur lesquelles l’IA peut travailler. Par exemple, en utilisant des caméras, des microphones et d’autres capteurs toujours allumés, il serait possible de faire savoir à une IA ce qui se passe dans le monde au moment où cela se produit.

Données en temps réel

Le nouveau système Gemini de Google a montré qu’il pouvait comprendre des contenus en temps réel tels que des vidéos en direct et la parole humaine. Grâce à de nouvelles données et capteurs, l’IA sera capable d’observer, de discuter et d’agir sur des événements du monde réel.

L’exemple le plus évident est celui des voitures autonomes, qui collectent déjà d’énormes quantités de données lorsqu’elles circulent sur nos routes. Ces informations aboutissent sur les serveurs des constructeurs où elles sont utilisées non seulement au moment de la conduite du véhicule, mais aussi pour créer des modèles informatiques à long terme de situations de conduite qui peuvent favoriser une meilleure fluidité du trafic ou aider les autorités à identifier les comportements suspects ou criminels. .

À la maison, des capteurs de mouvement, des assistants vocaux et des caméras de sécurité sont déjà utilisés pour détecter l’activité et capter nos habitudes. D’autres appareils « intelligents » apparaissent régulièrement sur le marché. Même si les premières utilisations de cette technologie sont familières, comme l’optimisation du chauffage pour une meilleure utilisation de l’énergie, la compréhension des habitudes deviendra beaucoup plus avancée.

Cela signifie qu’une IA peut à la fois déduire les activités dans la maison et même prédire ce qui se passera dans le futur. Ces données pourraient ensuite être utilisées, par exemple, par les médecins pour détecter l’apparition précoce de maladies telles que le diabète ou la démence, ainsi que pour recommander et suivre des changements de mode de vie.

À mesure que les connaissances de l’IA sur le monde réel deviennent encore plus complètes, elle agira comme un compagnon dans toutes les situations de la vie. Chez l’épicier, je peux discuter des ingrédients les meilleurs et les plus économiques pour un repas que je prépare. Au travail, l’IA sera capable de me rappeler les noms et les intérêts des clients lors d’une réunion en face à face et de suggérer la meilleure façon de sécuriser leur entreprise. Lors d’un voyage dans un pays étranger, il sera capable de maintenir une conversation continue sur les attractions touristiques locales, tandis que l’IA gardera un œil sur toute situation potentiellement dangereuse que je pourrais rencontrer.

Implications en matière de confidentialité

Toutes ces nouvelles données offrent d’énormes opportunités positives, mais il existe également un risque d’atteinte excessive et d’intrusion dans la vie privée des gens. Comme nous l’avons vu, les utilisateurs ont jusqu’à présent été plus qu’heureux d’échanger une quantité impressionnante de leurs informations personnelles en échange d’un accès à des produits gratuits, tels que les réseaux sociaux et les moteurs de recherche.

Les compromis à l’avenir seront encore plus importants et potentiellement plus dangereux, à mesure que l’IA apprendra à nous connaître et à nous soutenir dans tous les aspects de la vie quotidienne.

Si on lui en donne l’occasion, l’industrie continuera d’étendre sa collecte de données à tous les aspects de la vie, même hors ligne. Les décideurs politiques doivent comprendre ce nouveau paysage et veiller à ce que les avantages équilibrent les risques. Ils devront surveiller non seulement la puissance et l’omniprésence des nouveaux modèles d’IA, mais également le contenu qu’ils collectent.

Lorsque l’IA étendra ses capacités vers la prochaine frontière – le monde réel – seule notre imagination limitera les possibilités.