Cet étonnant robot humanoïde est capable d'interagir avec les humains
Mi-2021, OpenAI a dissous son équipe de robotique. La société dirigée par Sam Altman a décidé de concentrer ses efforts sur autres projets lié au rêve de parvenir à l’intelligence générale artificielle (AGI). Cette décision ne signifie toutefois pas qu’OpenAI se désintéresse de cette discipline.
Alors que le monde voyait apparaître les robots humanoïdes Optimus de Tesla et Digit d'Agility Robotics, une startup appelée Figure AI a reçu des millions de dollars d'investissement de la part de sociétés géantes telles que Microsoft et NVIDIA et a conclu un accord de collaboration avec OpenAI. Le temps a passé et voici ses premiers fruits.
Figure 01, le robot surprenant de Figure AI
Il y a exactement un an, Figure AI rendait publique son existence et se présentait au monde comme une entreprise émergente avec l'objectif ambitieux de développer une robot humanoïde usage général. Il l'a fait avec une vidéo contenant des images générées par ordinateur. A cette époque, il n’y avait pas de robot, juste une grande promesse.
Le projet a progressé jusqu'à l'annonce de la figure 01 en octobre de l'année dernière. Il s'agissait d'un prototype d'un brillant robot humanoïde. Cet engin pouvait déjà marcher de manière dynamique, une caractéristique non négligeable dans le monde de la robotique. La figure 01 est désormais capable d'accomplir d'autres tâches, notamment de converser avec des humains.
Brett Adcock, le fondateur de l'entreprise, Ce lundi, il a partagé une vidéo très intéressante à propos du robot. « Hey Figure One, que vois-tu en ce moment ? » demande quelqu'un au robot. Et il répond : « je vois une pomme rouge sur l'assiette au centre de la table, des égouttoirs avec des tasses et une assiette, et vous debout à proximité, la main sur la table.
« Super, je peux manger quelque chose ? », demande la personne. « Bien sûr », répond le robot en ramassant la pomme et en la laissant tomber sur la main de l'humain. Le robot est capable de comprendre que la pomme est la seule cible comestible devant lui. La figure 01 peut également effectuer diverses tâches de manière autonome. Il n'est pas contrôlé à distance.
Un détail très important de la séquence est que, selon la figure AI, elle montre les performances du robot humanoïde à une vitesse de 1,0X. C'est-à-dire, pas de trucs d'édition pour donner l'impression d'une plus grande vitesse. De même, il présente le résultat des « réseaux neuronaux de bout en bout ». C’est précisément ici que se démarque l’apport d’OpenAI.
Il n'y a pas trop de détails techniques sur le projet. On sait cependant que les caméras fonctionnent grâce à un modèle de langage de vision (VLM) entraîné par OpenAI. Nous ne savons pas s'il s'agit d'un produit nouveau et indépendant de la société dirigée par Sam Altman ou d'une variante de GPT-4 avec vision. Nous aurons probablement plus de données à l’avenir.
Images | Figure IA
À Simseo | « Ce qui est autorisé en Chine ne pourra jamais l'être en Europe » : les députés espagnols de la Commission spéciale sur l'IA s'expriment