La société Deepmind, rachetée par Google, a développé un système d'intelligence artificielle capable d'apprendre par lui-même, de déterminer l'action la plus judicieuse et de battre l'homme dans une vingtaine de jeux.
L’intelligence artificielle est un pan de la recherche que Google entend développer coûte que coûte. Le célèbre moteur de recherche procède depuis quelque temps à de nombreuses acquisitions de sociétés dans ce but, notamment DeepMind, une start-up londonienne rachetée en janvier 2014 pour 400 millions de dollars et dont l’IA est le coeur de réflexion.
Cette dernière est à l’origine d’un système baptisé Deep-Q-Network (DQN) au croisement de deux technologies : le Deep Neural Network (DNN) et le Q-Learning. Placé dans les mêmes conditions qu’un être humain – l’usage d’une manette devant un écran -, DQN s’est servi de sa mémoire et de son expérience pour établir des schémas de jeux pertinents. En deux semaines d’apprentissage, l’algorithme s’est montré capable de développer ses propres stratégies, jusqu’à se révéler plus performant que l’homme dans 22 des 49 jeux d’arcade testés.
Pour le moment, les jeux conçus dans les années 80 sont les plus prisés par DQN car ce sont les plus simples en terme de stratégie et de modélisation. Mais ils demandent malgré tout un minimum de réflexion. Pour Breakout et Space Invaders, par exemple, l’algorithme a su trouver seul la méthode la plus efficace pour engranger le plus de points possible. Ce qui n’a pas été le cas pour certains jeux, tel que Montezuma’s Revenge, qui sont restés incompris. Les jeux des années 90 vont également avoir droit à ce traitement mais leur complexité supérieure – du fait de la 3D et du nombre plus important de pixels à analyser – va rendre plus difficile l’apprentissage.
Vous vous demandez peut-être jusqu’où ira DQN aux jeux vidéo. Rassurez-vous, son développement impressionnant a beau être assez rapide, il n’est pas près de venir concurrencer l’homme dans des jeux plus complexes et à l’environnement plus vaste style Warcraft ou Gran Theft Auto. Car bien que l’algorithme, comme le rapporte Volodymyr Mnih, chercheur à DeepMind, soit « capable d’apprendre directement de ses expériences – et donc plus proche de la manière dont les humains apprennent, et dont nos cerveaux construisent des modèles », le nombre de paramètres des jeux actuels est tel qu’il n’est pas encore en mesure de tous les assimiler et de développer une vision du jeu à long terme comme peut le faire l’homme. On peut aussi se demander si DQN comprend réellement le sens des actions entreprises – outre le fait de savoir qu’elles rapportent des points.
Quoi qu’il en soit, tout cela est vraiment encourageant. Et même si de gros progrès sont encore attendus, cette avancée ouvre de nouvelles perspectives. Des applications pourraient en effet être envisagées à plus long terme, comme les voitures sans pilote mais aussi dans l’imagerie médicale, si l’intelligence artificielle continue son avancement.
Par Sébastien Tribot
Et aussi dans les
ressources documentaires :
Réagissez à cet article
Vous avez déjà un compte ? Connectez-vous et retrouvez plus tard tous vos commentaires dans votre espace personnel.
Inscrivez-vous !
Vous n'avez pas encore de compte ?
CRÉER UN COMPTE