Utiliser une IA générative pour aider les robots à sauter plus haut et à atterrir en toute sécurité
Les modèles de diffusion comme Dall-E d'Openai deviennent de plus en plus utiles pour aider à réfléchir à de nouvelles conceptions. Les humains peuvent inciter ces systèmes à générer une image, à créer une vidéo ou à affiner un plan et à revenir avec des idées qu'ils n'avaient pas considérées auparavant.
Mais saviez-vous que les modèles génératifs de l'intelligence artificielle (Genai) font également des progrès dans la création de robots de travail? Des approches récentes basées sur la diffusion ont généré des structures et les systèmes qui les contrôlent à partir de zéro. Avec ou sans entrée d'un utilisateur, ces modèles peuvent faire de nouvelles conceptions, puis les évaluer en simulation avant d'être fabriqués.
Une nouvelle approche du Laboratoire d'intelligence informatique et d'intelligence artificielle du MIT (CSAIL) applique ce savoir-faire génératif pour améliorer les dessins robotiques des humains. Les utilisateurs peuvent rédiger un modèle 3D d'un robot et spécifier quelles pièces ils aimeraient voir un modèle de diffusion modifier, fournissant ses dimensions au préalable. Genai réfléchit ensuite à la forme optimale de ces zones et teste ses idées dans la simulation. Lorsque le système trouve la bonne conception, vous pouvez enregistrer puis fabriquer un robot de travail et un monde réel avec une imprimante 3D, sans nécessiter de réglages supplémentaires.
Les chercheurs ont utilisé cette approche pour créer un robot qui bondit en moyenne d'environ 2 pieds, soit 41% plus élevé qu'une machine similaire qu'ils ont créée par elles-mêmes. Les machines sont presque identiques en apparence: elles sont toutes deux composées d'un type de plastique appelé acide polylactique, et bien qu'elles apparaissent initialement à plat, elles jaillissent en forme de diamant lorsqu'un moteur tire sur le cordon attaché à eux. Alors, qu'est-ce que l'IA a fait exactement différemment?
Un examen plus approfondi révèle que les liaisons générées par l'AI sont incurvées et ressemblent à des manchets épais (les batteurs d'instruments de musique utilisent), tandis que les pièces de connexion du robot standard sont droites et rectangulaires.
De meilleurs blobs
Les chercheurs ont commencé à affiner leur robot de saut en échantillonnant 500 conceptions potentielles en utilisant un vecteur d'intégration initial – une représentation numérique qui capture des caractéristiques de haut niveau pour guider les conceptions générées par le modèle d'IA. À partir de ceux-ci, ils ont sélectionné les 12 principales options en fonction des performances de la simulation et les ont utilisées pour optimiser le vecteur d'intégration.
Ce processus a été répété cinq fois, guidant progressivement le modèle d'IA pour générer de meilleurs conceptions. La conception résultante ressemblait à un blob, donc les chercheurs ont incité leur système à faire évoluer le projet pour s'adapter à leur modèle 3D. Ils ont ensuite fabriqué la forme, constatant que cela améliorait en effet les capacités de saut du robot.
L'avantage de l'utilisation de modèles de diffusion pour cette tâche, selon l'auteur co-dirigé et CSAIL Postdoc Byungchul Kim, est qu'ils peuvent trouver des solutions non conventionnelles pour affiner les robots.
« Nous voulions faire sauter notre machine plus haut, nous avons donc pensé que nous pouvions simplement faire en sorte que les liens relient ses pièces aussi minces que possible pour les rendre légers, » dit Kim. « Cependant, une telle structure mince peut facilement se casser si nous utilisons simplement des matériaux imprimés en 3D. Notre modèle de diffusion a eu une meilleure idée en suggérant une forme unique qui a permis au robot de stocker plus d'énergie avant qu'il ne saute, sans rendre les liens trop minces. Cette créativité nous a aidés à découvrir la physique sous-jacente de la machine. »
L'équipe a ensuite chargé son système de rédiger un pied optimisé pour s'assurer qu'il a atterri en toute sécurité. Ils ont répété le processus d'optimisation, choisissant éventuellement la conception la plus performante pour se fixer au bas de leur machine. Kim et ses collègues ont constaté que leur machine conçue par l'IA était tombée beaucoup moins souvent que sa ligne de base, à hauteur d'une amélioration de 84%.
La capacité du modèle de diffusion à mettre à niveau les compétences de saut et d'atterrissage d'un robot suggère qu'elle pourrait être utile pour améliorer la conception d'autres machines. Par exemple, une entreprise travaillant sur la fabrication ou les robots ménagères pourrait utiliser une approche similaire pour améliorer leurs prototypes, ce qui fait gagner du temps aux ingénieurs normalement réservés à l'itération de ces changements.
L'équilibre derrière le rebond
Pour créer un robot qui pourrait sauter haut et atterrir de manière stable, les chercheurs ont reconnu qu'ils devaient trouver un équilibre entre les deux objectifs. Ils représentaient à la fois la hauteur de saut et le taux de réussite de l'atterrissage en tant que données numériques, puis ont entraîné leur système pour trouver un point idéal entre les deux vecteurs d'intégration qui pourraient aider à construire une structure 3D optimale.
Les chercheurs notent que si ce robot assisté par l'IA a surpassé son homologue conçu par l'homme, il pourrait bientôt atteindre de nouveaux sommets encore plus importants. Cette itération impliquait en utilisant des matériaux compatibles avec une imprimante 3D, mais les versions futures sauteraient encore plus haut avec des matériaux plus légers.
Auteur co-dirigé et MIT CSAIL Ph.D. Étudiant Tsun-Hsuan « Johnson » Wang affirme que le projet est un point de départ pour les nouveaux conceptions de robotique avec lesquelles une IA générative pourrait aider.
« Nous voulons nous promener à des objectifs plus flexibles, » dit Wang. « Imaginez utiliser le langage naturel pour guider un modèle de diffusion pour rédiger un robot qui peut ramasser une tasse ou faire fonctionner une perceuse électrique. »
Kim dit qu'un modèle de diffusion pourrait également aider à générer une articulation et des idées sur la façon dont les pièces se connectent, améliorant potentiellement la hauteur du robot. L'équipe explore également la possibilité d'ajouter plus de moteurs pour contrôler la direction que la machine saute et peut-être améliorer sa stabilité d'atterrissage.