27 ans après avoir battu Kasparov aux échecs, une IA désormais invincible

L'IA AlphaZero est invincible aux échecs
L'IA AlphaZero est invincible aux échecs. Photo : New Africa

Des chercheurs de Google ont combiné l’IA AlphaZero, qui pouvait battre n’importe quel joueur d’échecs, avec d’autres systèmes d’intelligence artificielle pour créer une super-IA capable de trouver des solutions créatives à des problèmes d’échecs. Une avancée technologique qui pourrait avoir de nombreuses implications. 

La défaite du grand champion soviétique Garry Kasparov face à l’ordinateur Deep Blue en 1997 a marqué l’histoire des échecs et de la recherche en intelligence artificielle. Depuis, le jeu de 64 cases est l’exemple le plus frappant du modèle qu’un ordinateur peut maîtriser plus facilement qu’un humain en assimilant des quantités astronomiques de données et en apprenant de ses erreurs. En 2017, Google développait une IA – AlphaZero – qui n’avait eu besoin que de quelques heures pour découvrir les règles du jeu et devenir une grande maîtresse internationale d’échecs. En 9 heures et à peine 44 millions de partie contre elle-même, AlphaZero était devenu imbattable. 

Des IA prises au piège

Face à ces performances surhumaines, le mathématicien britannique Roger Penrose décide alors de concevoir des sortes de puzzles pour induire les ordinateurs en erreur. L’ancien collègue de Stephen Hawking met au point des scénarios alternatifs à une partie classique d’échecs dans lesquels certaines pièces démarrent dans des positions particulièrement peu favorables, forçant le joueur – ou la machine – à trouver une solution créative. Face à ces puzzles, les IA comme AlphaZero se retrouvent souvent prises au piège, incapables de reconnaître leur incompétence et d’accepter la défaite, se mettant alors à tourner en boucle. 

En 2023, un chercheur israélien du nom de Tom Zahavy travaillant pour DeepMind – l’entreprise d’IA de Google – s’intéresse à ces échecs et postule l’idée que ces boucles infinies sont liées au fonctionnement intrinsèque du système de reinforcement learning, c’est-à-dire les IA qui sont récompensées lorsqu’elles réussissent la tâche qu’on leur a assignée. Il émet ensuite l’hypothèse qu’une IA entraînée sur le jeu standard ainsi que ces puzzles sera non seulement plus forte mais aussi plus astucieuse. 

Brainstorming computationnel

Avec d’autres scientifique de DeepMind, il met au point une super-IA – baptisée AlphaZero_db – composée de plusieurs IA, chacune experte d’une variante d’échecs différente dont les puzzles de Penrose, et supervisée par une autre IA qui calcule laquelle est la plus apte à résoudre le problème auquel elle fait face. Résultat : une machine non seulement capable de gagner n’importe quelle partie et de résoudre n’importe quel puzzle mais surtout capable de trouver des solutions créatives. Pour Tom Zahavy, ces résultats indiquent que AlphaZero_db propose des solutions résultant d’une coopération entre ses différents systèmes pour éviter de rester coincée dans une boucle. Soit une forme de brainstorming computationnel. 

Selon les chercheurs de DeepMind, ces performances « collectives » suggèrent aussi que l’intelligence humaine pourrait n’être qu’une compilation de forces de calcul surpuissantes et ayant accès à une base de données richissime. Dans son livre Deep Thinking, publié en 2017, qui revient sur sa défaite cuisante contre Deep Blue, Kasparov soulignait que « la créativité est une qualité humaine qui intègre la notion d’échec ». Peut-être que cette différence majeure entre l’humain et la machine est révolue.