Gemini Robotics est son plan pour que les robots agissent dans le monde réel

Gemini Robotics est son plan pour que les robots agissent dans le monde réel

La robotique et l’intelligence artificielle (IA) vont de pair. Il serait inutile de développer des robots humanoïdes capables de soulever des tonnes, avec des capteurs d’état-art, si nous n’avions pas de système intelligent qui leur permettrait d’interpréter l’environnement et d’agir en conséquence. Sans IA, un robot moderne ne serait guère plus que beaucoup de matériel sophistiqué mais inutile. Ce sont les Algorithmes avancés Ceux qui transforment cette puissance brute en machines capables d’apprendre, optimisent leurs performances et répondent de manière autonome aux défis qui leur sont présentés.

De Asimo, l’emblématique robot Honda des années 2000 à Sophia, Optimus de Tesla ou Figure, l’IA a fait son chemin dans la robotique humanoïde. Cependant, nous sommes encore loin de voir des machines qui correspondent vraiment à la polyvalence du corps humain. Aussi avancés qu’ils soient, ils ont encore du mal à se déplacer dans des environnements contrôlés des Nations Unies et la manipulation des objets du quotidien peut être un véritable défi.

Gemini Robotics: Google’s Bari pour apporter l’IA dans le monde physique

Pendant ce temps, dans le monde numérique, l’IA avance à un rythme complètement différent. Il est déjà en mesure d’avoir des conversations très proches de celles d’une personne, de surmonter les examens avec des scores surprenants et de résoudre des problèmes complexes avec une vitesse qui jusqu’à il y a quelques années sembler de la science-fiction. Un contraste qui montre clairement que, bien que l’intelligence artificielle progresse à pas de géant, il y a encore beaucoup Chemin à parcourir dans son intégration avec la robotique.

Ces défis mènent à une nouvelle génération de modèles d’IA spécifiquement pour cette discipline. Google, comme prévu, ne veut pas être laissé pour compte et travaille déjà sur des solutions qui promettent de prendre des robots humanoïdes un peu plus loin. Son pari passe par Gemini 2.0, qui dispose désormais de deux versions conçues pour améliorer l’interaction et le contrôle de ces machines.

D’une part, Gémeaux robotique Il se concentre sur la vision, le langage et l’action (VLA), qui vous permet de prendre le contrôle direct des robots et d’améliorer votre capacité de réponse dans des environnements dynamiques. De l’autre, Gemini Robotics-er Il est conçu pour les experts en robotique, leur donnant les outils nécessaires pour développer et exécuter leurs propres programmes avec des compétences de raisonnement avancées.

Gemini Robotics 2

Gemini Robotics-Er se démarque dans un raisonnement spatial avec détection et signalisation des objets 3D

Google a identifié trois qualités essentielles qui, comme elles l’expliquent, doivent avoir des robots pour être très utiles pour les gens.

  • Généralité. Un bon robot devrait non seulement exécuter des tâches prédéfinies, mais également s’adapter aux situations non publiées et résoudre des problèmes lors de la marche. Il doit être capable de fonctionner dans de nouveaux environnements, de gérer des objets inconnus et d’interpréter des instructions variées sans dépendre de la formation préalable. Selon les tests internes, ses performances dans les tâches imprévues duplicité de loin celle des autres modèles de la vision-Modèle-Génération.
  • Interactivité Dans un monde en changement constant, les robots doivent être en mesure de communiquer naturellement et de répondre aux instructions en temps réel. Gemini Robotics comprend des commandes dans le langage quotidien et dans plusieurs langues, en adaptant leur comportement en fonction de la conversation ou de l’environnement. De plus, il surveille continuellement ce qui se passe autour de lui et ajuste ses actions en fonction de nouvelles commandes ou changements dans la scène.
  • Compétence. De nombreuses tâches que les humains exercent sans effort nécessitent une motricité extrêmement précise, ce que la plupart des robots n’ont pas encore réussi à dominer. Gemini Robotics, cependant, est capable d’effectuer des tâches complexes de plusieurs étapes qui nécessitent une manipulation complète, telles que le pliage d’origami ou l’emballage d’une collation dans un sac Ziploc, démontrant un niveau de compétence plus élevé.

Gemini Robotics se démarque non seulement dans la résolution des tâches imprévues, mais sa capacité de généralisation en tant que performance d’autres modèles d’action en vision-action. Selon le rapport technique de Google, il est en mesure de s’adapter aux scénarios non publiés et de prendre des décisions sans formation préalable, rapprochant les robots de la véritable autonomie.

De plus, il a été conçu pour fonctionner avec différents types de robots. Bien qu’il se soit entraîné principalement avec Aloha 2, une plate-forme à deux armes, il a également prouvé qu’il contrôlait des systèmes tels que Armes Frankautilisé dans les laboratoires, et des humanoïdes encore plus avancés tels que Apollo, développé par Apptronik. Sa flexibilité en fait un modèle adaptable à diverses applications, de l’industrie à l’assistance.

Pour l’instant, il n’y a pas de date prévue pour un déploiement généralisé de Gemini Robotics ou Gemini Robotics-ER. La technologie se développe toujours et, pour le moment, seul un petit groupe d’entreprises a accès à ces outils.

Deepseek est devenu la compagnie de mode de l'IA. Contrairement aux autres, il refuse d'accepter l'investissement externe

Google Deepmind collabore avec Apptronik dans la construction de la prochaine génération de robots humanoïdes, explorant comment intégrer ces modèles d’IA dans des systèmes plus avancés. De plus, certains testeurs de confiance, tels que Robots agiles, robotique d’agilité, dynamique de Boston et outils enchantésils testent déjà Gemini Robotics-ER, bien qu’il ne soit pas clair si cet accès sera élargi à l’avenir.

Pendant ce temps, Google DeepMind continue de travailler sur de nouvelles cadres de sécurité et repères pour évaluer les risques possibles de l’IA dans les environnements physiques. Tout cela indique clairement que, bien que le projet progresse, il reste encore un long chemin avant que cette technologie n’atteigne le grand public.

Images | Google Deepmind

Dans Simseo | Face à une IA qui dit oui à tout, une préoccupation: cela ne créera jamais un einstein ou un Newton