Les performances derrière la victoire d’AlphaGo

Les performances derrière la victoire d’AlphaGo

Les 361 intersections du goban, le plateau de jeu, fournissent des milliards de configurations possibles des pierres blanches et noires dans une partie moyenne. L’algorythme de Monte Carlo en vigueur dans les programmes courants simule et évalue à chaque étape du jeu les positions gagnantes ou perdantes. Mais ces machines ne peuvent anticiper un grand nombre de coups, là où l’intuition humaine apprécie l’équilibre général et le potentiel local dans la disposition des pierres.

Des pierres de handicap (coups d’avance) leur sont encore attribuées dans les parties contre des professionnels.
AlphaGo explore aussi les données de cette manière, en comparant la partie en cours à des échantillons de trente ans millions de positions de parties professionnelles inventoriées.

AlphaGo a en outre été entraîné en jouant virtuellement avec 50 autres ordinateurs, améliorant son système d’interprétation et de prédiction par l’apprentissage renforcé.

Fan Hui, son adversaire, a reconnu qu’il aurait pu croire affronter un humain au jeu parfois « étrange » mais « très fort ». Il a adopté un style plus agressif après la première partie, sans déstabiliser la machine au style plus défensif, « territorial ». Il abandonne dans la cinquième partie, ayant accumulé un retard de dix points.

Un commentateur professionnel coréen sur un portail de go juge qu’AlphaGo a surpassé son adversaire par des coups « solides et souples », sans commettre de graves erreurs.

L’enthousiasme de l’équipe de Google est d’autant plus grand que personne ne s’attendait à ce qu’un ordinateur parvienne aussi rapidement à ce niveau de jeu.

Pour son artisan Demis Hassabis, AlphaGo a acquis la capacité d’inventer par lui-même des choses nouvelles, qui repoussent ce que les meilleurs humains avaient pu concevoir.

Le prochain affrontement avec le coréen Lee Sedol s’annonce ainsi ébouriffant. La communauté du go soutient son champion mais la balle est dans le camp de l’intelligence artificielle qui poursuit sa préparation depuis sa victoire d’octobre 2015.

Lee Sedol a annoncé « considérer ce match comme un moment important de l’histoire du go » mais demeurer « confiant dans le fait de pouvoir gagner. » Un programmateur de Deep Mind se demande quelles ruses il trouvera à opposer à l’algorithme, « qui ressemble à un mur ».

Par Etienne Monin