Quand les robots apprennent à jouer au football. Pour de vrai et vraiment très vite !
Publié par Joel Chevrier, le 6 septembre 2023 1.4k
Un robot apprend à une vitesse inouïe dans l’espace virtuel, pour ensuite agir dans l’espace réel, directement à partir de cet apprentissage virtuel. C’est déjà aujourd’hui un résultat époustouflant, issu de la combinaison entre l’IA et la robotique.
Dépêchez-vous de gagner !
Imaginons un instant ce futur : vous jouez une partie de ping-pong bien réelle, mais contre un robot totalement débutant. Pendant que vous prenez le temps de ramasser la balle tranquillement, il apprend à jouer à une fréquence inhumaine, dans sa tête, sans bouger. A chacun de vos services, vous faites face à un nouvel adversaire. Dépêchez-vous de gagner, avant de perdre pour toujours ! On n’en est pas là, mais la question se pose déjà : des robots qui apprennent dans l’espace virtuel, à une vitesse stupéfiante, et utilisent ensuite cet apprentissage virtuel directement dans le monde réel. Radicalement inhumain ! La démonstration à partir du football a été faite par le chercheur Tuomas Haarnoja et al, chez Google DeepMind à Londres. Google DeepMind est l’entreprise spécialisée dans l'intelligence artificielle appartenant à Google. Leur article date d’avril 2023. Cette évolution récente m'a surpris. Si Tuomas Haarnoja n'a pas changé mon constat de physicien, il vient le détourner en jouant de la combinaison de l’espace virtuel et de l’espace réel. Le résultat est impressionnant, et devrait avoir des conséquences importantes dans nos vies sous peu.
Le monde réel impose sa lenteur
En physicien, je pensais que, pour toujours, l'intelligence artificielle, l’IA, serait immensément rapide dans l'espace virtuel, et lente dans le monde réel. La raison : dans l'espace réel, la physique dominera toujours. Bouger des masses coûte de l'énergie, use les mécanismes et d'autant plus que l'on veut aller vite. Finalement rien ne va vraiment vite dans l'espace réel, celui dans lequel nous bougeons. Les voitures sur terre ont une vitesse moyenne de quelques dizaines de kilomètres par heure. Cela ne changera pas.
L’IA situe l’apprentissage dans l’espace virtuel, et détourne la question
Un élément clé de l'IA actuellement est la capacité d'apprentissage massif et rapide largement au-delà des performances humaines. Exemple, la succession AlphaGo, AlphaGoZero et AlphaZero, les logiciels qui jouent au Go, maintenant propriétés de Google DeepMind. En mars 2016, AlphaGo a battu un des meilleurs joueurs du monde Lee Sedol. Le logiciel suivant AlphaGoZero a ensuite battu AlphaGo après un auto-apprentissage de quelques dizaines de jours, et le fut à son tour par AlphaZero. On rapporte que l’auto-apprentissage de AlphaZero qui lui permit de devenir le meilleur joueur de Go de l'univers connu, a duré environ une journée. Les détails ici sont sans importance tant le constat est saisissant : quelques heures pour apprendre ce qui prend une vie aux meilleurs humains pour des résultats sans aucune comparaison.
Le film Her de Spike Jonze en 2013 était bâti sur cette vitesse inhumaine dans le traitement de l'information. Le personnage incarné par l’acteur Joaquin Phoenix perdait pied en réalisant qu'il n'était qu'un des humains dans « une relation amoureuse » avec l’I.A. nommée Her. Cette dernière entretenait simultanément une même relation avec une multitude d'amants et d'amantes sans y voir le moindre problème.
Quand l’I.A. Samantha annonce son départ à la fin du livre, et avec la voix de Scarlett Johansson :
Il y a une éternité dans une nanoseconde…
La BD Carbone&Silicium de Mathieu Bablet est remarquable.
Page de la bande dessinée de Mathieu Bablet « Carbone&Silicium » 2020
L’histoire montre des robots finalement abandonner « leur corps » de robot soumis aux aléas du réel, ce qui génère leur individualité, en fait des personnes. Naissance de la souffrance aussi. Ils préfèrent ne plus être que pure information indifférenciée dans un espace virtuel. L’alimentation électrique nécessaire pourrait ne pas tenir plus d’une journée mais le robot nommé Silicium le dit : « il y a une éternité dans une nanoseconde… ». Un peu exagéré mais si les évènements se succèdent à la nanoseconde dans l’espace virtuel comme ils le font à la seconde dans notre monde, alors une de nos journées bien réelles, est alors l’équivalent de 3 millions d’années dans l’espace virtuel, et donc une éternité… C’est une fiction, les chiffres sont exagérés mais elle illustre bien la question.
Accélérer le cerveau avec Elon Musk ?
Elon Musk avec son entreprise NeuraLink cherche explicitement à augmenter la bande passante du cerveau. En clair, il s'agit ainsi d'augmenter la vitesse de notre cerveau par des implants technologiques. S'agit-il de garder le contact avec une IA championne de trading à haute fréquence avec des opérations en bourse effectuées à la microseconde ? Clairement rien ne se passe dans une vie humaine à la microseconde. Et en fait pas grand-chose en dessous de 0,1 seconde. Au quotidien, nous ne comptons les durées qu’à partir de la seconde. Par contre, ce qui se passe dans la microseconde peut changer nos vies. Cette extrême rapidité existe notamment dans la mémoire des ordinateurs, et là pas de mouvement de corps, de véhicules ou d'objets dans l'espace réel.
Au fait, pourquoi le cerveau est-il si lent ?
Daniel Wolpert, professeur à l’université de Columbia à New York, chercheur en neurosciences se demande depuis des décennies pourquoi nous avons un cerveau.
Dans sa conférence, « The real reason for brains », il déclare :
« Nous avons un cerveau pour une raison et une seule, qui est de produire des mouvements adaptables et complexes. Il n'y a pas d'autre raison d'avoir un cerveau. »
En le suivant, on comprend alors pourquoi notre cerveau est si lent : il n'a pas de raison d'être rapide puisque nos mouvements sont lents. Faites un simple test, comptez à haute voix de 1 à 10, puis « dans votre tête ». En passant bien par tous les nombres. Comparez alors. Oui, c'est certainement plus rapide dans la tête. Mais pas 1000 fois plus rapide, c'est évident. Si le cerveau est d'abord là pour contrôler des mouvements, aller très vite ne semble pas très utile. Il y a mieux à faire.
L'IA n'est pas d'abord construite pour bouger ou faire bouger, mais pour traiter de l'information. Pour cela, un processeur avec une fréquence d'horloge au-delà d’un gigahertz est courant. Cela fait plus d’un milliard d'opérations par seconde. Comparée à celle de notre cerveau, la vitesse d'une IA qui ne bouge rien est immense.
Il faut apprendre dans l’espace virtuel, pour apprendre très vite
Aujourd'hui, pour apprendre à bouger, un robot peut utiliser les techniques d’apprentissage de l’IA, c’est-à-dire finalement faire comme un enfant : tomber, se relever, toujours recommencer et en apprenant de ses échecs. Dans l'espace virtuel, par simulation, l'IA peut faire une multitude d'essais très vite et donc apprendre à une vitesse proprement inhumaine. Mais dans l’espace réel, le robot lui, bien matériel, ne peut pas chuter, se relever, vaciller, tomber et recommencer 1000 fois par seconde. La mécanique met le holà bien avant ! Un petit robot, par exemple de 50 kilos, une hauteur de chute de 0,5 mètre, et donc 1000 essais par seconde pour fixer les idées. Cela demande une puissance d'environ 250 kilowatts. On s'approche de la puissance d'une voiture Formule 1. Et au demeurant un moteur de voiture ne tourne qu’à 2000 tours/minute. Impossible donc !
La porte est ouverte à l'apprentissage ultra-rapide des robots
La bonne idée est alors de rester dans l'espace virtuel pour l'apprentissage, puis d'implanter le résultat de l'apprentissage dans le système réel, le robot. La physique est toujours là, mais d'abord à travers la simulation numérique de l'environnement réel. Alors ainsi, la limite est la vitesse de calcul. Tuomas Haarnoja et ses collaborateurs ont publié en avril 2023, un article intitulé : « Apprentissage des techniques de football agiles pour un robot bipède grâce à l'apprentissage par renforcement profond». Il montre, et c’est époustouflant, l'efficacité de l'apprentissage dans l'espace virtuel une fois transféré dans le monde réel.
La démonstration est faite avec deux petits robots d’un type courant qui jouent au foot. C'est très impressionnant : les auteurs parlent d'un million d'épisodes d'apprentissage. D’autres auteurs dans une étude comparable mais limitée à l’espace virtuel, ont estimé qu'un apprentissage qui prendrait 10 ans dans l'espace réel dure 10 jours dans l'espace virtuel.
L’humanité pour toujours dans le temps long, mais pas les robots
Deux temps très différents apparaissent ici. Un temps long imposé par le monde réel, décrit par la physique. Dans ce monde, rien ne peut aller vraiment vite. Nous sommes lents, et en accord avec cela mentalement aussi. L’autre est le temps court, celui de l’IA. Ce temps court est aussi court que le permet la puissance de calcul. Il permet des apprentissages ultra rapides. 10 ans en 10 jours, un rapport au-delà de 100 ! Le chercheur David Silver, un des leaders du projet AlphaZero a noté :
“AlphaZero doit tout découvrir par lui-même. Chaque étape est un saut créatif. Ces idées sont créatives parce qu'elles ne lui ont pas été données par les humains.”
Les robots et l’IA vont-ils créer une nouvelle façon de jouer au football jamais envisagée ?
Cet article a été écrit en collaboration avec le designer Adrien Husson.
Nous ne sommes pas des spécialistes de robotique et d’IA. Dans cet article, nous voulons pointer ce qui nous a particulièrement impressionné : cette capacité nouvelle des robots d’apprendre extrêmement vite dans un espace virtuel pour ensuite agir dans un espace réel. Deux temps et deux espaces interagissent par l’IA et les robots alors que les humains, en fait tous les animaux, par leur corps, ne sont que dans un temps et un espace.
De nombreux articles apparaissent sur ce sujet dont : A la RoboCup, des robots dopés à l’intelligence artificielle dans le journal Le Monde
`