Sélectionner une page

Une équipe du MIT a appris à son Mini Cheetah à courir. Pour cela, il a fallu une bonne dose d’intelligence artificielle et de machine learning. En trois heures, le robot a appris cent jours de parcours virtuels pour ensuite adapter sa vitesse de déplacement en fonction du sol et des obstacles. Résultat, un record de vitesse.

La vitessevitesse de déplacement est l’un des gros reproches faits aux robots. Qu’il s’agisse d’un humanoïde, de Spot le chien ou encore récemment de Bex le bouquetin, les articulationsarticulations mécanisées et son poids empêchent le robot de se déplacer rapidement. Par ailleurs, comme l’engin ne connaît pas les éventuels obstacles qu’il va croiser, le robot est toujours dans l’appréhension et l’analyse avant d’effectuer un pas. Autre obstacle de taille : le coût des matériaux. Vu le prix d’un robot, les chercheurs évitent de le pousser dans ses derniers retranchements.

Sauf que les chercheurs en robotique du CSAIL du Massachusetts Institute of Technology (MIT) ont eu l’idée d’utiliser des simulations alimentées par l’Intelligence artificielle (IA) pour apprendre rapidement au robot à adapter son stylestyle de marche selon les besoins. En l’occurrence, il s’agissait de leur robot-panthère à qui ils souhaitaient apprendre à adapter sa démarche selon les terrains. Jusqu’à présent, ils lui avaient appris à courir vite sur un tapis roulanttapis roulant ou à effectuer des sauts périlleux. Là, il s’agit de lui apprendre à courir dans un milieu naturel.

Apprentissage par renforcement

En seulement trois heures, le robot, connu sous le nom de Mini Cheetah, a emmagasiné 100 jours d’aventures virtuelles sur une grande variété de terrains. Seul, « l’animal » a appris des techniques pour modifier sa démarche en fonction des terrains et des texturestextures avec toujours le même objectif : se rendre d’un point A à un point B. Comme on le voit dans la vidéo ci-dessous, c’est forcément amusant.

Pour que le félinfélin apprenne de lui-même, les chercheurs ont opté pour l’apprentissage par renforcement (reinforcement learning). Ce type d’apprentissage automatique fonctionne avec un système de récompenses ou de pénalités, ou plutôt d’essais et d’erreurs. Le robot est incapable de reconnaître le type de sol, qu’il soit sec ou mouillé, lisse ou irrégulier, mais en fonction du ressenti sur un pas, il est capable d’adapter sa foulée et ses mouvementsmouvements. C’est d’autant plus efficace lorsqu’il effectue plusieurs passages dans un même endroit, et il peut alors se mouvoir encore plus rapidement.

Une nouvelle méthode permet au Mini Cheetah du MIT d’apprendre à courir vite et à adapter sa démarche sur des terrains difficiles. © YouTube, MIT

Une très bonne allure

Résultat, la panthère a atteint la vitesse de 3,9 m/s, soit du 14 km/h. C’est plus rapide qu’un humain lambda puisque, pour un coureur, cela représente du 4 min 15 sec du kilomètre. Il faut déjà être un très bon coureur pour tenir une telle allure. C’est un record pour un robot de manière autonome, et la prochaine étape sera désormais d’aller plus loin dans l’autonomie comportementale, qu’il s’agisse de saisir des objets ou d’apprendre à se déplacer sur un sol inconnu, sans entraînement avec une IA.

« Au cœur de la recherche sur l’intelligence artificielle se trouve le compromis entre ce que l’humain a besoin d’intégrer (la nature) et ce que la machine peut apprendre par elle-même (construire), explique un ingénieur du MIT. Le paradigme traditionnel de la robotique est que les humains disent au robot à la fois quelle tâche accomplir et comment l’accomplir. Le problème est qu’un tel cadre n’est pas évolutif, car il faudrait un immense effort d’ingénierie humaine pour programmer manuellement un robot avec les compétences nécessaires pour fonctionner dans de nombreux environnements divers. Une façon plus pratique de construire un robot avec de nombreuses compétences diverses est de dire au robot quoi faire et de le laisser comprendre comment. Notre système en est un exemple.

Nos confrères Gizmodo évoquent aussi les dronesdrones qui, eux aussi, pourraient profiter de ce type d’apprentissage pour être « lancés » dans des espaces inconnus et pourtant voler de manière autonome.