Le chercheur explique pourquoi les robots sont à la traîne derrière les chatbots d'IA
Les chatbots IA ont progressé rapidement au cours des dernières années, à tel point que les gens les utilisent maintenant comme assistants personnels, représentants du service client et même thérapeutes.
Les grands modèles de langue (LLMS) qui alimentent ces chatbots ont été créés à l'aide d'algorithmes d'apprentissage automatique formés sur les vastes touches de données de texte trouvées sur Internet. Et leur succès a de nombreux leaders technologiques, notamment Elon Musk et le PDG de Nvidia, Jensen Huang, affirmant qu'une approche similaire donnera des robots humanoïdes capables d'effectuer une intervention chirurgicale, de remplacer les travailleurs d'usine ou de servir de majordomes à domicile en quelques années.
Mais les experts en robotique ne sont pas d'accord, explique le robotique UC Berkeley Ken Goldberg. Il est professeur de recherche en génie industriel et des opérations et William S. Floyd Jr. Chaire distingué en ingénierie à UC Berkeley
Dans deux nouveaux articles publiés en ligne aujourd'hui (27 août) dans la revue Robotique scientifiqueGoldberg décrit comment ce qu'il appelle « l'écart de données de 100 000 ans » empêchera les robots d'obtenir des compétences réelles aussi rapidement que les chatbots d'IA gagnent la maîtrise du langage.
Dans le deuxième article, les principaux roboticiens du MIT, Georgia Tech et Eth-Zurich résument le débat houleux parmi les roboticiens sur le fait que l'avenir du domaine réside dans la collecte de données pour former des robots humanoïdes ou s'appuyer sur « le bon ingénierie à l'ancienne » pour programmer des robots pour effectuer des tâches réelles.
Ci-dessous, UC Berkeley News a parlé avec Goldberg du «battage médiatique humanoïde», le changement de paradigme émergent dans le domaine de la robotique et si l'IA est vraiment sur le point de prendre les emplois de tout le monde.
Récemment, des dirigeants technologiques comme Elon Musk ont fait des revendications sur l'avenir des robots humanoïdes, comme ce que les robots surpassent les chirurgiens humains au cours des cinq prochaines années. Êtes-vous d'accord avec ces affirmations?
Non; Je suis d'accord que les robots progressent rapidement mais pas si rapidement. Je pense que cela est un battage médiatique car il est si loin en avance sur les capacités robotiques que les chercheurs dans le domaine connaissent.
Nous sommes tous très familiers avec Chatgpt et toutes les choses incroyables que cela fait pour la vision et le langage, mais la plupart des chercheurs sont très nerveux à propos de l'analogie que la plupart des gens ont, c'est-à-dire que nous avons résolu tous ces problèmes, nous sommes prêts à résoudre [humanoid robots]et ça va arriver l'année prochaine.
Je ne dis pas que cela ne se produira pas, mais je dis que cela ne se produira pas au cours des deux prochaines années, ou de cinq ans, voire 10 ans. Nous essayons simplement de réinitialiser les attentes afin que cela ne crée pas une bulle qui pourrait conduire à une grande réaction.
Quelles sont les limites qui nous empêcheront d'avoir des robots humanoïdes effectuant une intervention chirurgicale ou en servant de majordomes dans un avenir proche? Qu'est-ce qu'ils ont encore vraiment du mal?
Le grand est la dextérité, la capacité de manipuler des objets. Des choses comme pouvoir ramasser un verre à vin ou changer une ampoule. Aucun robot ne peut le faire.
C'est un paradoxe – nous l'appelons le paradoxe de Moravec – parce que les humains le font sans effort, et nous pensons donc que les robots devraient également le faire. Les systèmes d'IA peuvent jouer à des jeux complexes comme les échecs et aller mieux que les humains, il est donc compréhensible que les gens pensent: « Eh bien, pourquoi ne peuvent-ils pas simplement prendre un verre? » Cela semble beaucoup plus facile que de jouer Go. Mais le fait est que ramasser un verre nécessite que vous ayez une très bonne perception de l'endroit où se trouve le verre dans l'espace, déplacez vos doigts vers cet emplacement exact et fermez vos doigts de manière appropriée autour de l'objet. Il s'avère que c'est toujours extrêmement difficile.
Dans votre nouvel article, vous discutez de ce que vous appelez l'écart de 100 000 ans. Quelle est l'écart de données et comment contribue-t-elle à cette disparité entre les capacités linguistiques des chatbots d'IA et la dextérité du monde réel des robots humanoïdes?
Pour calculer cet écart de données, j'ai examiné la quantité de données de texte sur Internet et calculé combien de temps il faudrait un humain pour s'asseoir et lire tout. J'ai trouvé que cela prendrait environ 100 000 ans. C'est la quantité de texte utilisé pour former des LLM.
Nous n'avons pas près de cette quantité de données pour former des robots, et 100 000 ans est juste la quantité de texte que nous devons former des modèles de langue. Nous pensons que les robots de formation sont beaucoup plus complexes, nous aurons donc besoin de beaucoup plus de données.
Certaines personnes pensent que nous pouvons obtenir les données des vidéos des humains – par exemple, de YouTube – mais regarder des photos d'humains faisant des choses ne vous dit pas les mouvements détaillés réels que les humains effectuent, et passer de 2D à 3D est généralement très difficile. Donc, cela ne le résout pas.
Une autre approche consiste à créer des données en exécutant des simulations de mouvements de robot, ce qui fonctionne assez bien pour les robots exécutant et effectuant des acrobaties. Vous pouvez générer beaucoup de données en ayant des robots en simulation à faire des backflips et, dans certains cas, qui se transfère en vrais robots.
Mais pour la dextérité – où le robot fait en fait quelque chose d'utile, comme les tâches d'un travailleur de la construction, d'un plombier, d'un électricien, d'un travailleur de la cuisine ou d'une personne dans une usine faisant des choses avec leurs mains – cela a été très insaisissable et la simulation ne semble pas fonctionner.
Actuellement, les gens ont fait cette chose appelée téléopération, où les humains exploitent un robot comme une marionnette afin qu'il puisse effectuer des tâches. Il y a des entrepôts en Chine et aux États-Unis où les humains sont payés pour le faire, mais c'est très fastidieux. Et toutes les huit heures de travail ne vous donnent que huit heures de données supplémentaires. Il faudra beaucoup de temps pour atteindre 100 000 ans.
Les roboticiens croient-ils qu'il est possible de faire avancer le domaine sans d'abord créer toutes ces données?
Je crois que la robotique subit un changement de paradigme, c'est-à-dire lorsque la science fait un grand changement – comme passer de la physique à la physique quantique – et le changement est si massif que le champ est divisé en deux camps, et ils se battent pendant des années. Et nous sommes au milieu de ce type de débat en robotique.
La plupart des robotiques croient toujours en ce que j'appelle une bonne ingénierie à l'ancienne, qui est à peu près tout ce que nous enseignons à l'école d'ingénierie: physique, mathématiques et modèles de l'environnement.
Mais il y a un nouveau dogme qui prétend que les robots n'ont besoin d'aucun de ces anciens outils et méthodes. Ils disent que les données sont tout ce dont nous avons besoin pour nous amener à des robots humanoïdes pleinement fonctionnels.
Cette nouvelle vague est très inspirante. Il y a beaucoup d'argent derrière cela et beaucoup d'étudiants et professeurs plus jeunes sont dans ce nouveau camp. La plupart des journaux, Elon Musk, Jensen Huang et de nombreux investisseurs sont entièrement vendus sur la nouvelle vague, mais dans le domaine de la recherche, il y a un débat déchaîné entre les anciennes et les nouvelles approches de la construction de robots.
Que voyez-vous comme la voie à suivre?
J'ai préconisé que l'ingénierie, les mathématiques et les sciences sont toujours importants car ils nous permettent de faire fonctionner ces robots afin qu'ils puissent collecter les données dont nous avons besoin.
C'est une façon de bootstrap le processus de collecte de données. Par exemple, vous pouvez obtenir un robot pour effectuer une tâche suffisamment bien pour que les gens l'achètent, puis collecter des données au fur et à mesure.
Waymo, l'entreprise automobile autonome de Google, le fait. Ils collectent des données tous les jours à partir de vraies voitures de robot et leurs voitures s'améliorent de plus en plus au fil du temps.
C'est aussi l'histoire derrière Ambi Robotics, qui fait des robots qui trient les packages. Alors qu'ils travaillent dans de vrais entrepôts, ils collectent des données et s'améliorent au fil du temps.
Dans le passé, il y avait beaucoup de crainte que l'automatisation robotique vole des emplois en usines à col bleu, et nous avons vu cela arriver dans une certaine mesure. Mais avec la montée en puissance des chatbots, la discussion est maintenant passée à la possibilité que les LLM prennent le contrôle des emplois en col blanc et des professions créatives. Comment pensez-vous que l'IA et les robots auront un impact sur quels travaux sont disponibles à l'avenir?
À mon avis en tant que robotique, les emplois en col bleu, les métiers, sont très sûrs. Je ne pense pas que nous allons voir des robots faire ces travaux pendant longtemps.
Mais il y a certains emplois – ceux qui impliquent de remplir régulièrement des formulaires, tels que l'admission dans un hôpital – ce sera plus automatisé.
Un exemple qui est très subtil est le service client. Lorsque vous avez un problème, comme votre vol a été annulé et que vous appelez la compagnie aérienne et un robot répond, vous êtes juste plus frustré. De nombreuses entreprises souhaitent remplacer les emplois du service à la clientèle par des robots, mais la seule chose qu'un ordinateur ne peut pas vous dire est: « Je sais ce que vous ressentez. »
Un autre exemple est les radiologues. Certains prétendent que l'IA peut lire mieux les rayons X que les médecins humains. Mais voulez-vous qu'un robot vous informe que vous avez un cancer?
La crainte que les robots se déroulent et volent nos emplois depuis des siècles, mais je suis convaincu que les humains ont de nombreuses bonnes années à venir – et la plupart des chercheurs sont d'accord.
