Match AlphaGo - Lee Sedol

Le match AlphaGo - Lee Sedol (titre officiel : Google DeepMind Challenge Match) est un match de cinq parties de go (jouées sans handicap, avec un temps de réflexion usuel en compétition) entre Lee Sedol, joueur professionnel sud-coréen considéré comme le meilleur joueur du monde au milieu des années 2000, et AlphaGo, un programme de go développé par Google DeepMind, qui s'est tenu entre le 9 et le à Séoul. Le gagnant du match devait recevoir un million de dollars.

Vous lisez un « article de qualité ».
 
Les deux adversaires : AlphaGo et Lee Sedol.

AlphaGo a gagné toutes les parties sauf la quatrième. Ce match voit la première victoire d'un programme face à un professionnel du plus haut niveau, et a été pour cette raison comparé avec le match d'échecs historique entre Deep Blue et Garry Kasparov en 1997.

Au cours de la rencontre, AlphaGo a fait preuve d'une créativité et d'une précision de lecture et d'évaluation qui ont surpris les meilleurs professionnels et les ont amenés à déclarer devoir repenser certaines de leurs idées sur le go. Lee Sedol a cependant réussi, au cours de la quatrième partie, à découvrir une faiblesse dans le jeu d'AlphaGo, remportant ainsi une victoire qu'il a déclarée être « sans prix ».

Le match a été suivi, surtout en Asie, par plusieurs centaines de millions de spectateurs, suscitant un regain d'intérêt pour le go. Il a provoqué également de nombreuses réactions des spécialistes d'intelligence artificielle qui ont salué une avancée significative des techniques d'apprentissage automatique.

À la suite de ce match, la Hanguk Kiwon (la fédération coréenne de go) a décerné à AlphaGo un titre honorifique de 9e dan (professionnel) – le plus haut grade existant – en reconnaissance du niveau d'excellence atteint par le programme.

Contexte de la rencontre

Un défi pour l'intelligence artificielle

Le go est un jeu de stratégie combinatoire abstrait (de la même famille que les échecs ou les dames) opposant deux adversaires qui tentent de contrôler la plus grande part d'une surface quadrillée, le goban, en y déposant à tour de rôle des pierres noires et blanches[1].

Malgré ses règles simples, c'est un jeu de plateau complexe exigeant, outre des calculs précis, de l'intuition ainsi que de la pensée créative et stratégique[2]. Il a longtemps été considéré comme un défi difficile pour le domaine de l'intelligence artificielle[2],[N 1], demandant en particulier de pouvoir imiter plus d'aspects de la réflexion humaine que pour les échecs[3]. Dès 1965, le mathématicien Irving John Good écrivait[4] : « Le go par ordinateur ? – Pour programmer un ordinateur jouant de manière raisonnable (et non simplement en respectant les règles), il est nécessaire de formaliser les principes d'une bonne stratégie, ou de développer un système capable d'apprentissage. Ces principes sont plus qualitatifs et mystérieux qu'aux échecs, et dépendent plus de jugements intuitifs. Je pense donc qu'il sera encore plus difficile de programmer un ordinateur pour qu'il joue convenablement au go qu'aux échecs[C 1]. »

Avant 2006, les progrès avaient été très lents[N 2], les meilleurs programmes n'ayant guère plus que le niveau d'un amateur occasionnel, environ 8e kyu[7]. Un premier progrès essentiel fut alors apporté par une méthode de simulation probabiliste, connue sous le nom de méthode de Monte-Carlo[N 3] ; des améliorations régulières avaient amené en 2015 les meilleurs programmes au niveau de forts amateurs, environ 5e dan[6],[9]. Cependant, avant AlphaGo, certains chercheurs affirmaient que les ordinateurs ne battraient jamais un professionnel de haut niveau[10], et Elon Musk, un des premiers investisseurs de DeepMind, rappelait qu'en 2015, les experts du domaine estimaient qu'un succès contre un professionnel demanderait encore au moins une décennie[11].

Le match AlphaGo contre Lee Sedol est comparable au match d'échecs de 1997 entre Deep Blue et Garry Kasparov[7] : il marque le tournant symbolique où les ordinateurs deviennent meilleurs que les humains dans une activité donnée[12],[13]. Cependant, AlphaGo est qualitativement différent de DeepBlue[14], en ce qu'il utilise des réseaux neuronaux, qui créent et font évoluer leurs règles de comportement, par opposition à un programme utilisant des heuristiques figées codées par des humains ; il en résulte d'ailleurs que les programmeurs d'AlphaGo ne sont en général pas capables d'expliquer précisément pourquoi leur programme a choisi tel ou tel coup[7],[15].

Le match contre Fan Hui

Fan Hui en 2006.
Fan Hui (avec les Noirs) contre AlphaGo : partie 5 (diagramme interactif de cette partie, commenté par An Young-gil).

En , AlphaGo gagna par 5 à 0 un match contre Fan Hui, 2e dan professionnel et champion d'Europe ; il s'agissait de la première victoire d'une intelligence artificielle contre un joueur professionnel, sans handicap et sur un goban 19×19[16],[17]. Le match et l'existence même d'AlphaGo furent tenus secrets jusqu'à la publication dans Nature, le , d'un article technique sur AlphaGo, détaillant les méthodes utilisées, et donnant les kifu des parties jouées[9].

La publication de l'article de Nature et l'annonce du match contre Lee Sedol furent abondamment commentées dans les médias[18], de nombreux observateurs saluant en particulier l'importante avancée pour l'intelligence artificielle constituée par l'utilisation de réseaux neuronaux convolutifs pour l'apprentissage profond[19],[20].

Des doutes persistaient cependant quant à la possibilité pour ces méthodes d'atteindre le niveau des meilleurs joueurs humains, certains commentateurs soulignant l'étendue de l'écart entre Fan Hui (2e dan) et Lee Sedol (9e dan)[21],[N 4], et estimant qu'en dépit de la performance que constituait cette victoire, les chances d'AlphaGo face à ce dernier étaient infimes. Ainsi Jonathan Schaeffer, spécialiste canadien d'intelligence artificielle ayant en particulier programmé Chinook (programme ayant résolu le jeu de dames américaines), compara AlphaGo à un « enfant prodige » manquant d'expérience, et affirma que « le vrai accomplissement aura lieu quand le programme jouera contre un joueur du plus haut niveau[C 2] » ; il était alors certain que Lee Sedol gagnerait le match[17].

Entre les deux matchs

Les joueurs professionnels analysèrent les parties jouées contre Fan Hui[23] et découvrirent des faiblesses dans le jeu d'AlphaGo, en particulier un manque de « sens global » (la prise en compte du plateau entier) et de conscience du « potentiel » (l'aji, c'est-à-dire les faiblesses latentes d'une position)[24] qui les amenèrent à penser que Lee Sedol battrait aisément le programme[17] ; lui-même, ayant étudié ces parties, déclara qu'il pourrait perdre l'année suivante, mais qu'il était certain de gagner 5-0 ou 4-1 cette fois-ci[25] ; cependant, avant le match, il était en fait difficile de déterminer les progrès que le programme avait pu accomplir durant ces cinq mois[21],[26]. Précisant les informations figurant dans l'article de Nature à ce sujet, l'équipe de Google DeepMind, dans une interview donnée à la presse coréenne, expliqua que la base de données initiale du programme ne contenait que des parties de forts amateurs (et donc qu'il ignorait tout du jeu de Lee Sedol), mais que, jouant contre lui-même, il avait accumulé durant ces quelques mois l'équivalent de « mille ans d'expérience humaine »[27] ; après avoir pris connaissance de ces informations, Lee Sedol se montra nettement moins confiant qu'auparavant, déclarant à la veille du match : « ayant appris aujourd'hui comment ses algorithmes sélectionnent les choix possibles, j'ai l'impression qu'AlphaGo peut imiter l'intuition humaine jusqu'à un certain point[C 3]. »[28].

Les joueurs

AlphaGo

Logo d'AlphaGo.

AlphaGo est un programme développé par Google DeepMind. Son algorithme utilise une combinaison de techniques générales déjà anciennes comme l'algorithme minimax, de méthodes spécifiques à la programmation du go (une variante de la méthode de Monte-Carlo[8]) et d'une utilisation innovante de réseaux neuronaux[N 5], permettant en particulier l'apprentissage automatique à la fois à partir de bases de données et en laissant le programme jouer contre lui-même. AlphaGo fut initialement entraîné à partir d'un ensemble de 160 000 parties jouées sur le serveur KGS par des joueurs classés sur ce serveur entre 6e et 9e dan amateur[29],[9]. Ayant atteint une certaine compétence (lui permettant en particulier de prévoir les coups de joueurs professionnels dans près de 60 % des cas), il fut ensuite opposé à des copies du même programme, utilisant l'apprentissage par renforcement pour améliorer son jeu[30].

Le programme ne contient au départ aucune connaissance spécifique sur le go (en dehors des règles et d'un module de calcul des shichō)[9], et il ne dispose en particulier pas d'une « bibliothèque » de coups (contrairement aux programmes d'échecs) ; comme l'expliquait l'un de ses créateurs : « Bien que nous ayons programmé cette machine, nous n'avons aucune idée des coups qu'elle va jouer. Ces coups sont un phénomène émergent de son apprentissage. Nous avons seulement créé la base de données et les algorithmes d'apprentissage. Mais les coups que trouve le programme nous échappent, et sont d'ailleurs bien meilleurs que ceux que nous pourrions trouver en tant que joueurs de go[C 4]. »[15].

La version d'AlphaGo pour ce match utilisait à peu près la même puissance de calcul que pour le match contre Fan Hui[31],[N 6], laquelle était de 1 202 processeurs et 176 processeurs graphiques[9].

Lee Sedol

Lee Sedol est un joueur de go professionnel coréen classé 9e dan[34]. Né en 1983, il commença sa carrière en 1995, devenant 1er dan professionnel à l'âge de 12 ans, et remportant le titre de meilleur joueur de Corée du Sud en 2000. Entre 2003 et 2015, il a gagné 18 titres internationaux, ce qui faisait de lui le meilleur joueur du monde au milieu des années 2000[N 7],[36] ; au moment du match, il était encore classé parmi les cinq premiers[37]. Il est un « héros national » de la Corée du Sud, connu pour son style de jeu non conventionnel et créatif, et pour sa force en milieu et fin de partie[38],[N 8]. Quelques semaines avant le match, il remporta pour la quatrième fois le Myungin, le plus important des titres coréens[40].

Les parties

Conditions de la rencontre

Les cinq parties du match eurent lieu les 9, 10, 12, 13 et , à l'hôtel Four Seasons de Séoul. Chaque partie commençait à 13 heures, heure de Séoul, soit 04:00 UTC[41].

Les parties utilisaient les règles chinoises avec un komi de 7 points et demi[N 9], chaque joueur ayant un temps de réflexion principal de 2 heures, suivi de 3 périodes de byo yomi de 60 secondes[N 10],[N 11],[45] ; les joueurs jouaient en salle fermée, en présence de trois observateurs officiels, dont Fan Hui[N 12], mais aucun problème n'a amené ceux-ci à intervenir durant le match.

Les parties étaient retransmises en temps réel sur YouTube, et commentées en direct en anglais[N 13] par Michael Redmond (le seul 9e dan professionnel non asiatique) et Chris Garlock (éditeur de l'e-journal de l'AGA)[47],[48],[49]. Aja Huang, un 6e dan amateur membre de l'équipe de DeepMind, plaçait les pierres sur le goban au nom d'AlphaGo[N 14], lequel fonctionnait à l'aide de la Google Cloud Platform, le serveur étant situé aux États-Unis[51].

Avant le match, l'équipe de DeepMind avait convenu d'utiliser une version figée d'AlphaGo, qui n'apprenait par conséquent rien et ne variait pas sa stratégie d'une partie sur l'autre[27],[N 15].

Le vainqueur du match devait remporter 1 million $US. AlphaGo ayant gagné, Google DeepMind a annoncé que le prix serait versé à des associations caritatives, dont l'Unicef, ainsi qu'à des organisations de go[52],[N 16]. Lee Sedol reçut 170 000 $ (150 000 $ pour avoir joué les cinq parties, et 20 000 $ pour chaque partie gagnée)[45],[52].

Le match

Résumé

AlphaGo a gagné toutes les parties sauf la quatrième[55],[56].

Le match
Partie no Date Noirs[n 1] Blancs Résultat[n 2] Coups Temps utilisé[n 3]
1Lee SedolAlphaGoLee Sedol abandonne186Lee Sedol : 1h 32 - AlphaGo : 1 h 55
2AlphaGoLee SedolLee Sedol abandonne211Lee Sedol : 2 h - AlphaGo : 2 h
3Lee SedolAlphaGoLee Sedol abandonne176Lee Sedol : 2 h - AlphaGo : 1 h 51
4AlphaGoLee SedolAlphaGo abandonne180Lee Sedol : 2 h - AlphaGo : 1 h 59
5Lee Sedol[n 4]AlphaGoLee Sedol abandonne280Lee Sedol : 2 h - AlphaGo : 2 h
Résultat :
AlphaGo 4 – 1 Lee Sedol
Notes
  1. Après tirage au sort (nigiri) au début de la première partie, les couleurs devaient alterner, puis un nouveau tirage au sort était prévu pour la dernière partie[57].
  2. Toutes les parties ont été gagnées par abandon[N 17].
  3. Les temps sont ceux figurant sur les vidéos officielles ; 2 h signifie que le joueur a utilisé tout son temps principal et est entré en byo yomi.
  4. Lee Sedol avait demandé à avoir les Noirs dans la dernière partie, déclarant : « ... puisque j'ai gagné avec les Blancs, j'espère vraiment avoir la chance de pouvoir gagner avec les Noirs dans la cinquième partie, parce qu'une victoire avec les Noirs a beaucoup plus de valeur. »[C 5],[58]

Commentaire général

Dès la première partie, Cho Hanseung (professionnel coréen 9e dan) et Michael Redmond observèrent que le jeu d'AlphaGo s'était beaucoup amélioré depuis son match d' contre Fan Hui[59],[60]. Il devint rapidement clair qu'il était au moins de la force des meilleurs joueurs humains, Nie Weiping (célèbre 9e dan chinois) estimant par exemple qu'il était « 6e ou 7e dan professionnel dans le fuseki, et 13e à 15e dan ensuite »[39], et Lee Sedol déclarant après avoir perdu les deux premières parties : « Hier, j'ai été surpris, mais aujourd'hui, je le suis plus encore - j'en reste sans voix[C 6] »[61]. Après la troisième partie, l'espoir que Lee Sedol gagne ne serait-ce qu'une partie sembla abandonner certains commentateurs[62], Ke Jie, le meilleur joueur chinois actuel, commençant lui-même[N 18] à douter d'avoir une chance contre AlphaGo[64]. Finalement, les deux dernières parties laissèrent apercevoir quelques failles dans le jeu du programme[65], que Demis Hassabis, fondateur et vice-président de DeepMind, déclara devoir être analysées de manière détaillée ; il semble en particulier ne pas « connaître » certains tesujis classiques[N 19], et commettre ainsi parfois des erreurs tactiques ; dans la quatrième partie, après un coup brillant et inattendu de Lee Sedol, son jeu se dégrada complètement, et il fut contraint à l'abandon. Néanmoins, même si Lee Sedol a affirmé après le match avoir été vaincu psychologiquement, mais pas forcément techniquement[66], le programme a fait preuve d'une créativité qui a surpris les meilleurs joueurs (par exemple en jouant le coup 37 de la deuxième partie[15]) et, à plusieurs reprises, a joué des coups allant contre la théorie établie, mais qui se sont révélés efficaces, amenant de nombreux professionnels à s'enthousiasmer pour sa technique[N 20],[N 21], et, à commencer par Lee Sedol, à déclarer qu'ils allaient devoir modifier certaines de leurs idées sur le jeu[66]. Par ailleurs, certaines des caractéristiques du jeu d'AlphaGo ont dérouté les commentateurs : comme il ne se soucie que de probabilités de victoire, et non d'écart territorial[15], il lui arrive, lorsqu'il se sait en avance, de jouer des coups visiblement faibles, mais ne mettant pas sa victoire en péril, ce qui a pu amener à le sous-estimer dans les deux premières parties[N 22].

Quatre moments critiques

Au cours du match, certains coups exceptionnels marquèrent les observateurs ; Lee Sedol les commenta dans une série d'articles pour le Dong-a Ilbo[70] :

Première partie :
le coup qui fit s'affaisser la mâchoire de Lee Sedol[N 23].
L'invasion en 102, « qu'aucun humain n'aurait jouée »[71].
Deuxième partie :
le coup le plus créatif de tout le match[72].
Le coup 37, un coup à l'épaule « interdit » par la théorie.
Troisième partie :
une contre-attaque spectaculaire[62].
Le « saut d'éléphant » en 32 renverse l'attaque et la partie.
Quatrième partie :
le « coup divin »[N 24] de Lee Sedol
Après ce « brillant tesuji »[73] en 78,
le jeu d'AlphaGo se détériora.

Analyse détaillée des parties

Partie 1

Dans la première partie, Lee Sedol, ayant les Noirs, et ayant adopté une stratégie d'ouverture inhabituelle, sembla contrôler les combats jusqu'à une sévère invasion d'AlphaGo au coup 102, après laquelle il devint clair qu'il n'avait en fait pas l'avantage ; après quelques imprécisions, il abandonna au coup 186[71].

Plus précisément, le quatrième coup de Lee Sedol (le coup 7) a été décrit par David Ormerod[59],[N 25] comme « un coup étrange destiné à tester la force d'AlphaGo dans le fuseki »[C 9] ; il a estimé finalement que ce coup était une erreur, sanctionnée par AlphaGo de manière « précise et efficace ». La position d'AlphaGo est jugée favorable avant le coup 80, « important, mais moins urgent que 81 », et qui semble redonner l'avantage à Lee Sedol[N 22], jusqu'à l'invasion violente et inattendue[N 23] en 102, après laquelle Lee Sedol joue deux coups « discutables » en 119 et 123, et finalement le « coup perdant » en 129[59].

Lee Sedol expliqua après le match avoir commis une erreur critique dans l'ouverture, qui l'avait poursuivi toute la partie ; il déclara que la stratégie de la machine dans la première moitié de la partie était « excellente », et qu'elle avait joué un coup[N 26] qu'aucun humain n'aurait joué[N 23],[71] ; après ce coup, il hésita sur son choix de continuation pendant plus de dix minutes[75].

Coups 1 à 78
À la fin de ce combat mettant six groupes en jeu,
le coup 7 reste mal placé[59].
Coups 79 à 102
Lee Sedol semble reprendre le dessus[N 22]...
jusqu'au coup 102[N 23].
Coups 103 à 186
Après l'invasion, Lee Sedol ne peut plus gagner.

Partie 2

La deuxième partie débuta par des innovations théoriques[N 27] que Lee Sedol n'essaya pas de contrer, se cantonnant à un jeu patient et territorial. Mais le coup 37 (un coup de pression traditionnellement « interdit », car donnant trop de points à l'adversaire) surprit tout le monde ; à partir de ce moment, AlphaGo fit preuve d'une flexibilité spectaculaire[76], échangeant librement les zones d'influence[77], et après la partie, Lee Sedol déclara que « AlphaGo avait joué de façon presque parfaite » et, dit-il, « dès le début de la partie, je n'ai jamais eu l'impression que je menais »[C 10],[61],[78].

Michael Redmond déclara que le coup 37 était « créatif » et « unique »[15], et Lee Sedol prit un temps anormalement long pour y répondre[15]. An Young-gil (8p) le décrivit comme « un coup à l'épaule rare et fascinant »[C 11], mais trouva « exquise » la réponse de Lee Sedol ; bien qu'il ait estimé que le score restait longtemps indécis, il admira particulièrement les coups 151, 157 et 159 d'AlphaGo, qu'il jugea « brillants »[72]. Cette incertitude sur le vainqueur, partagée par plusieurs commentateurs professionnels, ne reflète pas le sentiment de Lee Sedol[61], ni celui d'AlphaGo : après le match, Demis Hassabis déclara que dès le milieu de la partie, AlphaGo était confiant en sa victoire[N 28],[78].

Particulièrement vers la fin de la partie, AlphaGo joua plusieurs coups anormaux, les professionnels n'arrivant pas à décider s'il s'agissait d'erreurs, de coups faibles ou d'une stratégie globale cachée[36]. Une explication partielle fut alors donnée par un des créateurs du système : la fonction d'évaluation d'AlphaGo repose sur des simulations (utilisant la méthode de Monte-Carlo) et ne maximise pas le territoire (potentiel), mais la probabilité de gagner[15],[69] ; si AlphaGo estime qu'en perdant des points, il rend sa victoire plus probable, il choisira cette solution[15]. Dans cette partie, le coup 167 semble ainsi être une erreur grossière, mais Lee Sedol déclara que la bataille de ko qu'AlphaGo lui offrait n'était en fait pas jouable[79], et An Young-gil résuma la situation en déclarant : « Donc, lorsque AlphaGo joue un coup qui nous semble mou, nous pouvons penser que c'est une erreur, mais nous devrions peut-être plutôt le voir comme une déclaration de victoire »[C 12],[62].

Coups 1 à 37
Après ces innovations[N 27], le plan d'AlphaGo se dévoile[15].
Coups 38 à 115
AlphaGo réveille l'aji (41 et 43), puis construit au nord-ouest,
forçant l'invasion, qu'il attaque sévèrement.
Coups 116 à 211
Le groupe ayant envahi est désagrégé.

Partie 3

Après la deuxième partie, certains joueurs continuaient à douter de la force réelle d'AlphaGo. La troisième partie fut jugée par les commentateurs comme mettant fin au débat. David Ormerod[N 25] déclara par exemple que « AlphaGo gagna de manière si convaincante qu'il dissipa tous les doutes que les joueurs experts avaient pu avoir sur sa force. En fait, il joua si bien que c'en était presque effrayant ... En forçant AlphaGo à résister à une attaque sévère en milieu hostile, Lee Sedol lui permit de montrer une puissance insoupçonnée jusque-là ... L'attaque de Lee Sedol ne lui rapportait pas assez ... Un des plus grands virtuoses du milieu de partie venait de se voir souffler la vedette dans l'éclairage cru des pierres noires et blanches[C 13],[62] », et An Young-gil (8p) affirma que la partie montrait que « AlphaGo est tout simplement plus fort que tous les joueurs humains connus[C 14],[62]. ».

Contrairement à ce qu'avaient craint certains spécialistes de la programmation du go[69], AlphaGo se montra capable de gérer des batailles de ko[N 29] complexes (il n'en était pas apparu dans les parties précédentes)[80]. Le coup 148 en particulier fut largement commenté : au milieu de la bataille de ko, AlphaGo se montra suffisamment « confiant » de la gagner pour se permettre de jouer un coup important ailleurs[62].

Lee Sedol, jouant avec les Noirs, choisit la formation connue sous le nom de « fuseki chinois haut »[N 30], créant une vaste zone d'influence, et obligeant AlphaGo à l'envahir au coup 12. La défense du groupe faible ainsi créé fut jugée exceptionnelle[62], en particulier le coup 31 de Lee Sedol, bien que naturel (mais que An Young-gil décrivit comme étant peut-être le « coup perdant »[62]), est sanctionné par l'étonnant « saut d'éléphant » en 32, que Lee Sedol dit « n'avoir pas pu imaginer »[81], et après lequel l'attaque semble s'être retournée contre les Noirs ; Andy Jackson (de l'American Go Association) annonça que, selon Kim Myungwan (8p), la partie était déjà décidée au coup 35[69]. Au coup 48, AlphaGo contrôle clairement le combat, forçant Lee Sedol à défendre ses groupes, et se permettant même au coup 58 de relâcher la pression pour esquisser une vaste zone sur le bord sud, que Lee Sedol tentera en vain d'envahir jusqu'à la fin de la partie. La contre-attaque de Lee Sedol aux coups 77 et 79 est efficacement parée par AlphaGo, le coup 90 simplifiant la position, et la séquence de 102 à 112, décrite par An Young-gil comme « sophistiquée »[62], élimine les dernières possibilités de complications. Finalement, après une séquence brillante d'invasion, Lee Sedol déclenche une bataille de ko complexe au coup 131, mais ne réussit pas à pousser le programme à la faute (le coup 148, s'éloignant du combat, montre à quel point AlphaGo contrôle la situation[62]) ; manquant de menaces de ko, épuisé et découragé[62],[69], Lee Sedol abandonne au coup 176.

Coups 1 à 36
Après 32, l'attaque de Lee Sedol se retourne contre lui[69].
Coups 37 à 112
AlphaGo construit le bord sud,
et élimine toutes les possibilités de complications[62].
Coups 113 à 176
(122 en 113,154 en , 163 en 145, 164 en 151,
166 et 171 en 160, 169 en 145, 175 en )
Finalement, Lee Sedol obtient une bataille de ko,
mais ne peut la gagner.

Partie 4

La quatrième partie fut peut-être la plus spectaculaire du match : alors que la position de Lee Sedol semblait désespérée, il réussit à trouver et à exploiter une faille dans le jeu d'AlphaGo. Selon Demis Hassabis[N 28], le coup 78, un tesuji rare qu'AlphaGo n'avait pas envisagé (il lui attribuait une probabilité inférieure à une chance sur dix mille) l'amena à jouer la réponse déjà non optimale 79, qu'il estimait pourtant lui donner 70 % de chance de gagner la partie, puis une série de coups incohérents ; ce n'est pourtant qu'au coup 87 que son estimation s'effondra soudain[82],[83],[84] ; les coups qui suivirent (jusqu'au coup 101) furent caractérisés par David Ormerod[N 25] comme typiques des erreurs des programmes s'appuyant sur la méthode de Monte-Carlo[N 31],[73], et dégradèrent suffisamment la position pour que Lee Sedol, bien qu'en manque de temps, maintienne son avance jusqu'à l'abandon d'AlphaGo au coup 181[73],[N 17].

Dans les parties précédentes, AlphaGo avait montré sa maîtrise d'un style calculatoire visant à obtenir de petits avantages dans chaque échange, style connu sous le nom de souba go[N 32]. Pour tenter de l'obliger à adopter un style plus risqué, Lee Sedol choisit une stratégie appelée amashi[N 33], prenant le plus de profit possible en offrant une vaste zone d'influence, et forçant ainsi AlphaGo à attaquer les invasions de cette zone, créant une situation de « tout ou rien »[73] ; Lee Sedol espérait découvrir de cette manière une faiblesse chez un adversaire supérieur dans les situations de négociation, mais qui pourrait s'avérer incapable de trouver dans ce combat quelque chose à négocier[73].

Les 11 premiers coups furent identiques à ceux de la deuxième partie, mais Lee Sedol changea alors de joseki, pour obliger AlphaGo à défendre immédiatement son groupe[N 27]. Lee Sedol concrétisa ses territoires de coins et de bord, permettant à AlphaGo de gagner de l'influence sur le bord nord et au centre. Conformément à sa stratégie d’amashi, Lee Sedol envahit ensuite cette zone d'influence avec les coups de 40 à 48, obligeant AlphaGo à l'attaquer par un coup à l'épaule en 47, mais AlphaGo sacrifia quatre pierres (dont 47) pour gagner l'initiative et transformer le centre en territoire apparemment sûr (coups 47 à 69). Lee Sedol testa la réaction d'AlphaGo avec les coups de 72 à 76 sans réussir à provoquer d'erreur ; à ce stade, les commentateurs commençaient à désespérer de ses chances[73]. C'est alors que Lee Sedol joua le coup 78, un « brillant tesuji » que Gu Li déclara même être un « coup divin »[N 24] auquel il n'aurait jamais pensé[73]. Bien qu'il soit possible de le réfuter[73], le coup augmente la complexité de la position[85],[N 34] ; après deux coups encore plausibles d'AlphaGo (79 et 81), il joua une série de manœuvres incohérentes (de 83 à 101), laissant déchirer le centre sans grande compensation, et dégradant gravement ses chances de gain ; An Young-gil jugea que le coup 105 perdait définitivement la partie, et malgré quelques jolies séquences et la nécessité pour Lee Sedol de jouer chaque coup en moins d'une minute[N 10], AlphaGo abandonna après le coup 180[73], estimant que ses chances de gain étaient devenues inférieures à 20 %[85].

An Young-gil conclut que la partie était « un chef d'œuvre de Lee Sedol, qui deviendra presque sûrement une partie célèbre de l'histoire du go »[C 16],[73]. Lee Sedol déclara après le match, sous les acclamations du public, que cette victoire était « sans prix »[87], et qu'il n'avait jamais été aussi heureux d'avoir gagné une unique partie ; estimant qu'il était plus facile de gagner avec Blanc, il demanda à jouer la dernière partie avec Noir, dans l'espoir d'une victoire ayant plus de valeur encore[58].

Coups 1 à 77
La partie semble perdue pour Blanc.