Матч AlphaGo — Ли Седоль (или Google DeepMind Challenge Match) — матч по игре го, проходивший c 9 по 15 марта 2016 года между компьютерной программой AlphaGo, разработанной британской компанией Google DeepMind, и корейским профессионалом 9 дана Ли Седолем. Всего было сыграно 5 партий. Игра велась по китайским правилам, величина коми составляла 7,5 очков. Контроль времени классический — каждому игроку на партию даётся по два часа и 3 бёёми по 60 секунд. Для работы AlphaGo использовались 1920 процессоров и 280 графических процессоров, работающих в распределённой сети[1]. Игры транслировались в прямом эфире на YouTube[2]. Матч завершился победой AlphaGo со счётом 4:1[3][4]. Событие сравнивают с историческим шахматным матчем между программой Deep Blue и Гарри Каспаровым 1997 года, в некоторой степени предопределившим судьбу шахмат[5][6][7].
Победителю матча предназначалась награда в 1 миллион долларов; поскольку победителем стала AlphaGo, представители Google DeepMind заявили, что призовые деньги будут отданы на благотворительные цели, в том числе фонду ЮНИСЕФ и го-организациям[8]. Ли Седоль получил 170 тысяч долларов (150 тысяч за участие и дополнительные 20 тысяч за победу в одной из партий)[9].
После победы в матче Корейская ассоциация падук присвоила AlphaGo наивысший ранг го — «почётный 9 дан» за «искренние усилия» программы в овладении мастерством игры[10].
Го — сложная настольная игра, требующая помимо логики применение интуиции, творческого и стратегического мышления[11][12]. В течение длительного времени обучить компьютерные программы играть в го на уровне сильного любителя было крайне сложно[13]. По сравнению с шахматами, в го перед искусственным интеллектом ставится больше задач, решение которых требует имитацию мыслительного процесса человека[14]. Ещё в 1965 году математик Ирвинг Джон Гуд писал:
Го на компьютере? — Для того, чтобы запрограммировать компьютер на осмысленную партию в го, а не просто партию по правилам, необходимо оформить принципы хорошей стратегии или создать обучающуюся программу. Принципы игры в го качественнее и загадочнее, чем в шахматах, и больше зависят от оценочного суждения. Поэтому я полагаю, что создать компьютерную программу, разумно играющую в го даже намного сложнее, чем шахматную программу[15]. |
До 2015 года[16] лучшие программы, играющие в го, могли достичь лишь уровня любительского дана[17]. Компьютер достиг бо́льших успехов на доске размером 9×9, где некоторые программы смогли выиграть у профессиональных игроков. До появления AlphaGo некоторые разработчики заявляли, что компьютеры никогда не смогут победить лучших игроков среди людей[18]. Илон Маск, один из первых инвесторов компании Deepmind, в 2016 году заявил, что по мнению экспертов, искусственный интеллект находится в 10 годах от победы над лучшим из профессиональных игроков[19].
Матч AlphaGo против Ли Седоля можно сравнить с шахматным матчем между программой Deep Blue и Гарри Каспаровым 1997 года, где победа программы, созданной IBM, над действовавшим чемпионом стала символической точкой отсчёта новой эпохи, когда компьютеры превзошли людей в шахматах[20].
AlphaGo имеет значительные отличия от программ-предшественников. Она задействует нейронные сети, где эвристические оценки не основываются на конкретных значениях переменных, закодированных людьми, а в значительной степени, извлекаются самой программой, путём десятков миллионов просмотров сыгранных партий и собственных партий с самой собой[16][21][22]. Даже сама команда разработчиков AlphaGo не в состоянии указать, каким образом AlphaGo оценивает позицию в партии и выбирает свой следующий ход[23]. Метод Монте-Карло также стал одним из основных способов повышения эффективности программы в выборе ходов. При создании программы использовались данные из теории распознавания образов и машинного обучения[16].
В начале 2016 года были опубликованы материалы о том, что в октябре 2015 года AlphaGo победила трёхкратного чемпиона Европы по го Фань Хуэя (2 профессиональный дан) со счётом 5-0; таким образом, искусственный интеллект впервые одержал победу над профессиональным игроком на доске размером 19x19 без форы[24][25]. Часть экспертов указывала на сильный разрыв в уровне игры между Фань Хуэем и Ли Седолем, обладателем наивысшего ранга — 9 профессионального дана и множества завоёванных титулов[26]. Прежде компьютерные программы Zen и Crazy Stone[en] смогли одержать победу над профессиональными игроками, имея фору в четыре или пять камней[27][28]. Канадский исследователь теории игр и искусственного интеллекта Джонатан Шеффер после победы AlphaGo над Фань Хуэем сравнил программу с «ребёнком-вундеркиндом», которому недостаёт опыта, и заявил, что настоящие достижения начнутся тогда, когда программа сыграет с настоящим топ-игроком; победу в матче он предрекал всё же Ли Седолю[25] Ли Хаджин[en], профессиональный игрок и генеральный секретарь Международной федерации го, заявила, что у AlphaGo и Ли Седоля равные шансы на победу в грядущем матче[25].
После своего поражения, Фань Хуэй заявил, что благодаря этому матчу он стал играть лучше и стал видеть те вещи в игре, которые не замечал ранее; к марту 2016 года мировой рейтинг Фань Хуэя поднялся примерно на 300 позиций[29]
Эксперты по го нашли несколько ошибок, сделанных AlphaGo в партиях против Фань Хуэя, в частности, в оценке позиции на всей доске в противовес отдельным тактическим моментам; однако, к началу матча против Ли Седоля, не было известно, насколько с тех пор усилилась программа[26][30]. AlphaGo не была настроена специально под стиль игры Ли Седоля, что и так было бы сложно сделать, поскольку «тренировка» AlphaGo включала в себя просмотр десятков миллионов партий; несколько сотен или тысяч матчей Ли Седоля не были достаточным количеством для того, чтобы изменить стиль игры программы. Вместо этого AlphaGo просматривала партии сильных игроков-любителей, сыгранные на интернет-серверах, после чего играла сама против себя; в базе данных тренировки AlphaGo не было партий Ли Седоля[31][32].
В интервью перед матчем Ли Седоль предсказывал, что он легко выиграет со счётом 4-1 или даже 5-0, затем 2-3 года Google будут дорабатывать AlphaGo, после чего захотят взять у него реванш. В этом случае играть с обновлённой версией AlphaGo будет действительно интересно, считал Ли[33][34].
Ли Седоль, профессиональный игрок, обладатель 9 профессионального дана по го[35], считается одним из сильнейших игроков в истории го[36]. Его карьера началась в 1996 году, когда он получил ранг 1 профессионального дана в возрасте 12 лет, с тех пор он завоевал множество титулов го[37]. Стиль Ли Седоля отличается нестандартными креативными ходами[38]. Предрекавший свою безоговорочную победу[38] Ли Седоль за несколько недель до матча стал обладателем одного из основных корейских титулов го — Мёнин[39].
AlphaGo — компьютерная программа, созданная компанией Google DeepMind. Алгоритм AlphaGo использует комбинацию последних достижений для поиска оптимальной стратегии в дереве игры с новейшими методами машинного обучения в сочетании с интенсивным изучением партий людей, так и тренировкой при игре с самой собой[16]. Изначально AlphaGo тренировали подражанию человеческой игре через изучение множества партий, сыгранных как профессионалами так и сильными любителями, в том числе базы данных сервера КГС[en] из около 30 миллионов ходов из 160 тысяч партий игроков от 6 до 9 дана[16][40]. После достижения определённого уровня в стратегии и тактике, программа перешла на игру против самой себя и обучение с подкреплением[41]. Система не использует базу данных ходов. Как пояснил один из создателей программы,[23],
Хоть мы и программировали эту машину, мы не знаем, какой ход она сделает. Её ходы представляют собой феномен эмерджентности, что стало результатом тренировки. Мы всего лишь создаём ряды данных и алгоритмы обучения. Но ходы, к которым она прибегает, не в наших руках, и намного лучше, чем мы, как игроки, могли бы выбрать. |
Версия программы, использовавшаяся в матче против Ли Седоля, использовала сходные компьютерные мощности, что и в партиях против Фань Хуэя, — 1920 CPU и 280 GPU[1]. В мае 2016 года представители компании Google объявили, что AlphaGo использовала при обучении TPU, процессор, разработанный Google, специально для машинного обучения[42][43].
Пять партий матча состоялись 9, 10, 12, 13 и 15 марта 2016 года в Сеуле[44].
Партии игрались по китайским правилам, коми составляло 7,5 очков; временной контроль — по 2 часа основного времени каждому игроку 3 периода бёёми по 60 секунд[9]. Партии проходили в закрытом зале в присутствии трёх официальных наблюдателей, среди которых был Фань Хуэй. За время проведения игр не было зарегистрировано каких-либо происшествий, приведших к вмешательству наблюдателей.
Прямая трансляция партий матча шла на YouTube, параллельно с ней велись трансляции с комментариями игры на английском языке от Майкла Редмонда[45] (единственный неазиатский игрок, имеющий 9 профессиональный дан[46]) и на корейском языке от Ю Чханхёка, Сон Тхэгона и других корейских профессионалов[47][48][49]. Айа Хуань (игрок, обладатель 6 любительского дана и сотрудник команды разработчиков DeepMind) ставил камни на гобан за AlphaGo[6]. Работа программы велась с помощью Google Cloud Platform, сервер располагался в США[50].
Разработчики решили перед каждой партией использовать «фиксированную» версию программы, таким образом она не использовала для самообучения партии, сыгранные в этом матче и не подстраивалась под стиль игры Ли Седоля, каждый раз заново определяя свою стратегию[51].
Победитель матча получал в качестве награды 1 миллион долларов. Представители Google DeepMind заявили, что в случае победы AlphaGo они планируют передать эти деньги в благотворительные фонды (включая ЮНИСЕФ) и организации, занимающиеся развитием го[8]. Ли Седоль получил 150 тысяч долларов за участие в матче и по 20 тысяч долларов за победы в отдельных партиях[8][9].
Игра # | Чёрные | Белые | Результат | Дата | Ходов | Затраченное время[прим. 1] |
---|---|---|---|---|---|---|
1 | Ли Седоль | AlphaGo | 0-1 (сдался) | 9 Марта 2016 | 186 | Ли Седоль: 1ч. 32мин. — AlphaGo: 1ч. 55мин. |
2 | AlphaGo | Ли Седоль | 1-0 (сдался) | 10 Марта 2016 | 211 | Ли Седоль: 2ч. — AlphaGo: 2ч. |
3 | Ли Седоль | AlphaGo | 0-1 (сдался) | 12 Марта 2016 | 176 | Ли Седоль: 2ч. — AlphaGo: 1ч. 51мин. |
4 | AlphaGo | Ли Седоль | 0-1 (сдался) | 13 Марта 2016 | 180 | Ли Седоль: 2ч. — AlphaGo: 1ч. 59мин. |
5[прим. 2][52][53] | Ли Седоль | AlphaGo | 0-1 (сдался) | 15 Марта 2016 | 280 | Ли Седоль: 2ч. — AlphaGo: 2ч. |
Общий счет: AlphaGo — Ли Седоль: 4-1 |
Комментируя первую партию матча, и Чо Хансын (9 профессиональный дан) и Майкл Редмонд отметили, что AlphaGo значительно усилилась по сравнению с октябрьским матчем против Фань Хуэя[54]. Уже на стадии фусэки стало ясно, что программа играет на уровне лучших игроков среди людей; Не Вэйпин (9 профессиональный дан, Китай) предположил, что AlphaGo играет в силу 6 или 7 профессионального дана в фусэки и 13—15 дана в тюбане[55]. Сам Ли Седоль после проигрыша во второй партии заявил: «Вчера я был удивлён, но сегодня у меня нет слов»[56]. После третьего поражения Ли Седоля AlphaGo досрочно победила в матче и комментаторы сошлись на том, что остаётся надежда на одну победу человека[57]. Кэ Цзе, возглавлявший на тот момент рейтинг игроков и также бросивший вызов AlphaGo, заявил, что он начал сомневаться в своей победе над программой[58]. В партиях со стороны программы были замечены ошибки; Демис Хассабис заявил, что они будут тщательно проанализированы, и что видимо AlphaGo «не знает некоторые классические тэсудзи и совершает тактические ошибки», что стало видно после проигранной ей партии, когда программа после ключевого победного хода Ли Седоля стала делать нелогичные ходы вместо того, чтобы сдаться[59]. После матча Ли Седоль заявил, что был побеждён психологически, но вовсе не технически[60]. Программа показала способность к креативным решениям, что удивило многих игроков (например, ход № 37 во второй партии); некоторые ходы противоречили классической теории го, но в матче доказали свою эффективность, некоторые профессионалы стали использовать эти находки в своих партиях[23]. Чо Хе Ён (9 профессиональный дан) заявила, что она хотела бы учиться игре у AlphaGo, поскольку та «знает всё»[61]. Сам Ли Седоль после матча решил изменить некоторые аспекты своей игры[60]. Комментаторы во время матча сошлись на том, что AlphaGo совершала ошибки, и были уверены, что в конечном итоге ей не хватит территории для победы[23], но в итоге ходы, изначально казавшиеся слабыми, привели к выигрышу[57].
Во время партий наблюдатели отметили четыре исключительных хода, повлиявших на исход в партиях; Ли Седоль прокомментировал их в серии статей в издании Dong-a Ilbo[en][62]:
Первая партия: Ход, поразивший Ли Седоля. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Вторжение, ход 102[63]. |
Вторая партия: Неожиданный креативный ход программы[64]. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ход 37, «удар в плечо», отвергающийся классической теорией игры. |
Третья партия : Впечатляющая контратака[57]. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ход 32 разворачивает атаку в партии. |
Четвёртая партия : «Божественный ход» Ли Седоля. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
После сыгранного тэсудзи (78 ход) оценка AlphaGo резко изменилась[65]. |
В первой партии, прошедшей 9 марта, победу одержала AlphaGo (белые). Ли Седоль держал игру под контролем большую часть времени, программа получила преимущество в течение финальных 20 минут, заставив Ли сдаться[63]. После игры Ли заявил, что он допустил критическую ошибку в начале партии, и что стратегия программы на начальной стадии игры была «великолепна», и искусственный интеллект сделал один необычный ход, который никогда бы не сыграл человек[63]. Обозреватель сайта Go Game Guru Дэвид Омерод отметил, что седьмой ход Ли Седоля был «странным ходом, сделанным с целью протестировать силу AlphaGo в фусэки», и что ответный ход программы был «точным и эффективным»; по его оценке, первая часть игры осталась за AlphaGo, а Ли начал отыгрывать преимущество с ходом 81, а затем сделал «сомнительные» ходы 119 и 123, за которыми последовал 129 ход, приведший к поражению[54]. Чо Хансын, комментировавший партию, отметил мощный прогресс AlphaGo по сравнению с матчем против Фань Хуэя в октябре 2015 года[54]. Майкл Редмонд отметил, что стиль программы стал более агрессивным по сравнению с партиями против Фань Хуэя[66].
По мнению Ким Сонрёна (9 профессиональный дан), Ли Седоль был потрясён ходом 102[67], после которого он раздумывал над ответным ходом более 10 минут[67]. Ли Седоль признал своё поражение на 186 ходу, спустя примерно три с половиной часа игры, хотя на часах у него ещё оставался запас времени 28 минут и 28 секунд[67].
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 1—99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 100—186 |
Во второй партии, прошедшей 10 марта, AlphaGo победила, играя чёрными. После игры Ли Седоль заявил, что «AlphaGo показала почти что идеальную игру»[68], и что «с самого начала партии он не ощущал ни одного момента, где он бы лидировал»[69]. Один из создателей программы, Демис Хассабис, заявил, что система была уверена в победе с середины игры, когда даже профессионалы, комментировавшие партию, не могли определить, кто был впереди[69].
Майкл Редмонд отметил, что 37 ход программы был «креативным» и «уникальным»[23]. Ли Седолю понадобился необычайно длительный период времени, чтобы ответить на него[23]. Ан Ёнгиль[en] (8 профессиональный дан) охарактеризовал ход № 37 как «редкий и интригующий удар в плечо», но при этом отметил, что ответный ход Ли был «изысканным». Он заявил, что контроль над партией переходил от одного игрока к другому несколько раз и в особенной степени отметил ходы программы № 151, 157 и 159, назвав их «блестящими»[64].
AlphaGo в этой партии отклонялась от общепринятых норм и продемонстрировала более широкий подход, который профессионалы го охарактеризовали как кажущиеся на первый взгляд ошибки, на самом деле осуществлявшие далеко идущую стратегию[70]. Создатели программы пояснили, что AlphaGo пытается максимизировать не количество очков или величину выигрыша, а вероятность своей победы[23][61]: Если AlphaGo должна выбирать между победой в 20 очков с 80 % вероятностью или победой в 1 очко с 99 % вероятностью, она выберет последнее, даже если ради этого придётся потерять очки[23]. Например, кажется, что ход 167, дающий Ли Седолю шанс на борьбу, расценивался комментаторами как очевидная ошибка; Ан Ёнгиль заявил, что «когда AlphaGo делает ход, выглядящий слабым, мы можем расценить его как ошибку, но, возможно, точнее будет считать такой ход провозглашением победы?»[57].
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 1—99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 100—199 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ходы 200—211 |
В третьей партии, состоявшейся 12 марта, AlphaGo одержала победу и досрочно выиграла весь матч[71].
После второй партии профессиональные игроки всё ещё выражали свои сомнения в том, является ли AlphaGo настолько сильным игроком, насколько таковым может быть человек. После третьей партии, согласно мнению аналитиков, эти сомнения развеялись, отмечалось мастерство программы в ведении борьбы — при кажущейся суровой атаке Ли Седоля, он не получил преимуществ от этой атаки[57].
Ан Ёнгиль и Дэвид Омерод заявили, что AlphaGo «сильнее любого известного нам игрока-человека»[57]. Выяснилось, что AlphaGo способна управлять ситуацией при ведении ко-борьбы, что ранее считалось значительной слабостью большей части программ, играющих в го, в предыдущих двух партиях важной ко-борьбы на доске не возникало[72]. Также они отметили 148 ход программы — в разгаре сложной ко-борьбы AlphaGo, имея «уверенность» в выигранной борьбе, сделала большой ход в другом месте доски[57].
Ли, играя чёрными, выбрал Высокое китайское фусэки и создал сферу влияния, в которую AlphaGo вторглась на 12 ходу, после чего программа смогла защитить свою слабую вторгшуюся группу[57]. По мнению Ана Ёнгиля, 31 ход Ли возможно стал причиной его поражения[57], Энди Джексон (Американская ассоциация го) решил, что исход партии определился уже на 35 ходу[61]. К 48 ходу AlphaGo завладела контролем над партией и заставила Ли Седоля делать защитные ходы. Контратака Ли на 77-79 ходах не принесла успеха, к 90 ходу программа упростила позицию на доске, после чего заполучила большое количество территории на нижней стороне[57]. Ли вновь попытался провести атаку, но ходы программы оказались безошибочными. На 131 ходу он попытался устроить ко-борьбу, провоцируя программу на ошибку. На 176 ходу Ли Седоль сдался[57].
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 1—99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 100—176 (122 в 113, 154 в 166 и 171 в 160, 169 в 145, 175 в |
Четвёртая партия, состоявшаяся 13 марта, завершилась победой Ли Седоля. По словам Демиса Хассабиса, программа сделала ошибку на 79 ходу, когда, по её собственным оценкам, вероятность её победы составляла 70 %; на 87 ходу эта величина резко упала[73][74]. Дэвид Омерод охарактеризовал ходы программы с 87 по 101 как типичные ошибки для программы, работающей на основе метода Монте-Карло[65] — поисковой механизм пытается отсечь некоторые последовательности, не относящиеся к конкретной ситуации; в некоторых случаях это может привести к тому, что программа отсекает правильные ходы и уже не может рассматривать их в дальнейшем[65].
В этой партии Ли Седоль выбрал стратегию амаси (территориально-ориентированный стиль, позволяющий противнику занимать ключевые пункты влияния, но при этом сам игрок получает гарантированную территорию, после чего может попытаться развалить влияние противника), решив получать территорию по сторонам, а не по центру, в противовес стратегии AlphaGo, рассчитанной на победу благодаря множеству небольших приобретений[65][75]. Сделав выбор в пользу такой стратегии, Ли Седоль надеялся загнать противника в ситуацию ва-банк, что могло быть вероятным слабым местом программы, чьей силой является оценка размена; при такой ситуации способность AlphaGo к выявлению мельчайших преимуществ не оказывала бы сильного влияние на вероятность победы[65].
Первые 11 ходов были идентичны началу второй партии, где Ли также играл белыми. В стадии фусэки Ли сконцентрировался на получении территории в углах и по сторонам доски, позволив AlphaGo построить влияние на верхней стороне и в центре. После этого Ли вторгся в зону влияния AlphaGo (ходы 40—48), следуя принципам амаси. AlphaGo пожертвовала четыре камня и захватила инициативу (ходы 47—69). В ответ на ходы Ли Седоля с 72 по 76 программа не совершила ошибок, и комментаторы начали заявлять о том, что партия вновь обернётся поражением Ли, тем не менее, 78 ход (являвшийся тэсудзи в данной ситуации) и последовавшая за ним комбинация до 82 хода полностью перевернула исход партии[65]. Ход, позволивший разделить соперника в центре, усложнил игру[76]. Ходы AlphaGo 83 и 85 были приемлемыми, но далее с 87 по 101 ход программа совершила ряд слабых, откровенно плохих ходов. На 92 ходу Ли Седоль захватил лидерство в партии, а ход 105 Ан Ёнгиль описал как окончательный ход, приведший к поражению программы; AlphaGo не смогла отыграть потерянные очки и сдалась после 180 хода[65]. По оценкам AlphaGo, её вероятность победы составляла менее 20 %[76].
Гу Ли (9 профессиональный дан, Китай) назвал 78 ход Ли Седоля «божественным ходом» (в терминологии игры го — особый, единственно верный и гениальный ход, случающийся «раз в жизни», чаще всего в критический момент партии) и отметил, что сам абсолютно не видел этот ход[65]. Ан Ёнгиль заявил, что партия стала «шедевром Ли Седоля и почти определённо станет известной в истории го»[65].
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 1—99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 100—180 (177 в |
По условиям матча, кто играет чёрными в последней партии, должно было решиться по жребию. Однако на пресс-конференции после четвёртой партии Ли Седоль заявил, что по его мнению AlphaGo сильнее, когда играет белыми, поэтому он желал бы в финальной партии сыграть чёрными, тем более, что он уже выиграл белыми. Представители AlphaGo согласились, поэтому жеребьевка не проводилась[52][53].
В последней партии, сыгранной 15 марта, победителем стала AlphaGo (белые)[77]. До самого конца в этой партии шла равная борьба. Демис Хассабис заявил, что в самом начале программа совершила грубую ошибку, что и привело к такой равной борьбе[77].
Играя чёрными, Ли Седоль, выбрал фусэки, схожее с сыгранным им в первой партии матча, после чего перешёл к территориальной стратегии, приведшей к победе в предыдущей партии. Результат казался равным до ходов с 48 по 58, где AlphaGo, сыграв ненужные форсированные ходы потеряла ко-угрозы и адзи, позволив Ли Седолю захватить лидерство[78]. Майкл Редмонд предположил, что скорее всего программа не увидела известное тэсудзи — опытные игроки чаще всего знают такую комбинацию ходов, но программе её пришлось бы просчитать с самого начала[77].
К 90 ходу, безошибочно ответив на атакующие ходы Ли Седоля, программа восстановила равновесие в партии, после чего сделала ряд ходов, названных Дэвидом Омеродом «необычными… но хитроумно впечатляющими», и позволивших захватить небольшое преимущество[78]. Ли пытался отыграть очки, но программа отвечала безошибочно. Ан Ёнгиль особо отметил ходы 154, 186 и 194. В стадии йосе AlphaGo также сыграла безупречно, оставив за собой лидерство по территории, что заставило Ли Седоля сдаться на 280 ходу[78].
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 1—99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 100—199 (118 в 107, 161 в |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 200—280 (240 в 200, 271 в 275 в |
Прямые трансляции партий матча и их разборов велись на корейском, китайском, японском и английском и русском языках. Трансляция на корейском языке шла на канале Baduk TV[79]. Первую партию на китайском языке комментировали Гу Ли и Кэ Цзе для Tencent и LeEco соответственно, трансляции собрали 60 миллионов зрителей[29]. Онлайн-трансляцию матча на английском языке вели Майкл Редмонд и Крис Гарлок, вице-президент Американской ассоциации го; в среднем количество зрителей составляло около 80 тысяч человек; наибольшее количество зрителей зафиксировано в конце 1 первой партии и составило 100 тысяч[80]. Разбор партий на YouTube вели Чо Хе Ён (9 дан) и Ким Мёнван (9 дан)[61]. В России прямые трансляции партий матча с разбором вели 3 профессиональный дан Александр Динерштейн (1 партия)[81][82], Илья Шикшин (1 профессиональный дан) и многократная чемпионка Европы среди женщин Наталья Ковалёва (2—5 партии)[83].
Победа AlphaGo стала значительным событием в сфере исследований искусственного интеллекта[84]. Ранее обучение компьютера игре в го считалось недосягаемым для существующих технологий и уровня их развития[84][85][86]. Большая часть экспертов склонялась к тому, что до появления программы уровня силы AlphaGo должно пройти ещё около 5 лет[87], некоторые эксперты полагали, что понадобится даже 10 лет, прежде чем компьютер сможет побеждать чемпионов по го[88][89]. В начале 2016 года большинство прогнозов указывало на победу Ли Седоля[84].
Когда компьютер стал побеждать сильнейших игроков среди людей в шашки, шахматы, а теперь и го, достижения компьютерных программ в сфере популярных настольных игр перестают считаться столь значительным достижением и поворотным пунктом в истории развития искусственного интеллекта по сравнению с предыдущими годами; разработчик Deep Blue Мюррей Кэмпбелл[en] назвал победу AlphaGo «концом эпохи…, с настольными играми практически покончено, и настало время двигаться дальше»[84]. Разработчики DeepMind заявляли, что рассматривают возможность проведения матча в StarCraft II с участием разработанной ими программы и Тима Мортена, чемпиона по StarCraft II[90][91]. Настольные игры с неполной информацией (покер, бридж) также могут стать объектом исследования возможностей компьютерных программ[92][93].
В сравнении с Deep Blue или Watson, алгоритмы работы AlphaGo рассчитаны на более широкие задачи, это может говорить о том, что прогресс произошёл и в сфере общего развития искусственного интеллекта[94]; победа AlphaGo может стать толчком к развитию программ с более широкими задачами. В марте 2016 года британский исследователь Сьюарт Дж. Рассел заявил, что «методы искусственного интеллекта развиваются гораздо быстрее, чем ожидалось, что делает более актуальным вопрос о долгосрочных результатах», добавив, что «для гарантии того, что все увеличивающие свою мощность системы ИИ оставались бы под полным контролем человека… предстоит совершить много работы»[95]. Физик Стивен Хокинг выступил с предостережением по поводу того, что будущие саморазвивающиеся системы ИИ могут привести к неожиданному захвату людей машинами[en][96], некоторые учёные, в частности Жан-Габриэль Ганазия, заявивший, что «такие вещи, как 'здравый смысл'… никогда не создать», отвергают такой сценарий[97]; Ганазия не видит причин «говорить о страхах. Как раз наоборот, это вселяет надежду во многих сферах, например, в здравоохранении и исследовании космоса»[95]. Ричард Саттон[en] говорит, что «людям не следует бояться… но им нужно обратить внимание на это»[98].
До публикации статьи в журнале Nature в январе 2016 года несколько организаций уже занимались исследованиями нейронных сетей для создания программ, играющих в го, в частности, в Facebook шла разработка программы Darkforest[en], впоследствии код программы был выложен в открытый доступ[99][100]. После матча началось развитие программ — конкурентов AphaGo, среди которых выделяются Deep Zen Go и Fine Art.
Программа Deep Zen Go ранее разрабатывалась под названием Zen, но именно после успеха AlphaGo разработчик добавил в Zen элемент глубокого обучения. В ноябре 2016 года состоялся матч между Deep Zen Go и самым титулованным игроком Японии Тё Тикуном[101][102]. Матч завершился победой человека со счётом 2:1[103].В марте 2017 года состоялся «Турнир четырёх», где сразились сильнейшие игроки Японии, Китая и Кореи (Юта Ияма, Ми Юйтин[en] и Пак Чжон Хван) и Deep Zen Go[104], по итогам матча компьютер выиграл одну партию из трёх (против Юты Иямы)[105][106].
Программа Fine Art разработана китайской компанией Tencent. В марте 2017 года она выиграла чемпионат по го среди программ, в котором, однако, не участвовала AlphaGo; Deep Zen Go заняла второе место. Ранее, в январе 2017, Fine Art смогла несколько раз обыграть сильнейшего игрока в го среди людей Кэ Цзе, который позже сыграл и с AlphaGo, проиграв всухую и сочтя дальнейшие игры с искусственным интеллектом бессмысленными[107].
Игра го, ранее считавшаяся сугубо азиатской игрой, не настолько распространённой в странах Запада, получила широкую популярность в различных странах мира благодаря тому, что миллионы людей смотрели и обсуждали ход матча[84]. По словам Демиса Хассабиса, этот матч посмотрело 280 миллионов людей, о нём вышло 35 тысяч статей в прессе, и продажи досок для го возросли в десять раз[108].
Многие из топ-игроков отметили, что ходы сделанные программой, нестандартны; некоторые ходы изначально казались сомнительными, но в течение партии показали свою эффективность[88]. В то время, как игроки стараются изучить и перенимать лучшие ходы из других партий, AlphaGo делает свои собственные оригинальные ходы[84]. AlphaGo значительно усилилась по сравнению с матчем против Фань Хуэя, однако Ли Седоль после своего поражения заявил, что игра программы всё ещё не идеальна[109][110]
Китайский игрок Кэ Цзе, возглавлявший мировой рейтинг игроков, до начала матча заявил, что он способен победить AlphaGo, но не пожелал играть с ней, поскольку программа начала бы «копировать его стиль»[111]. После первых трёх партий матча Кэ Цзе уже признал, что «может проиграть»[112], но после четвёртой партии вновь начал уверено говорить о своей победе, утверждая что если игра программы в четвёртой партии матча — «её истинная сила, то она не заслуживает играть с ним»[113].
Судья матча против Фань Хуэя Тоби Мэннинг и генеральный секретарь Международной федерации го Ли Хаджин[en] заявили о том, что в будущем игроки смогут учиться у компьютера, узнавать, где они совершили ошибки в партии, и совершенствовать свои игровые навыки[110].
После матча Ли Седоль принёс извинения за своё поражение и заявил, что «недооценил способности AlphaGo и чувствовал себя бессильным»[84]. Он особо подчеркнул, что результат матча — «поражение Ли Седоля», а не «поражение человечества»[96][114]. Ли признал, что его проигрыш был неизбежным, но при этом «роботы никогда не поймут красоту игры так, как люди»[96]. Результат в четвёртой партии Ли назвал «бесценной победой, которую он ни на что не променяет»[114]. Ли Седоль заявил, что многому научился, играя с AlphaGo, и его стиль стал более гибким; он понял, насколько слабой может быть человеческая интуиция, а его навык прогнозирования следующих ходов противника существенно усилился[115].
Корейская ассоциация падук присвоила AlphaGo ранг почётного 9 профессионального дана за «искренние усилия в освоении даосских фундаментальных основ го и достижение уровня игры, близкого к божественному»[10].
После завершения матча, 17 марта 2016 года представители правительства Республики Кореи заявили о том, что собираются инвестировать 863 миллиона долларов (1 триллион корейских вон) в исследования в области искусственного интеллекта в течение следующих пяти лет[116]
Многие игроки выразили желание стать следующим соперником AlphaGo[117], тем не менее среди наиболее вероятных кандидатов называли Кэ Цзе, который заявлял, что победит программу[118]. Матч с Кэ Цзе состоялся с 23 по 27 мая 2017 года, AlphaGo выиграла все три партии[119][120][121].
|author=
на позиции №57 (справка)Матч AlphaGo — Ли Седоль в Викиновостях |
Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".
Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.
Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .