Почти ровно 20 лет назад компьютер IBM Deep Blue победил чемпиона мира по шахматам Гарри Каспарова в своей собственной игре. Это был ключевой момент в истории искусственного интеллекта - компьютер впервые победил чемпиона по шахматам.
Но всем тем, кто рассматривал это как признак того, что революция ИИ началась, критики сказали, что «не так быстро». Шахматы были относительно просты для взлома. Настоящим испытанием ИИ будет компьютер, который сможет победить человека-чемпиона в Го, сложной древней китайской стратегической игре, предполагающей интуицию и понимание эстетики. И этот день вряд ли наступит в ближайшее время.
«Может пройти сто лет, прежде чем компьютер побьет людей на Го, а может быть, и дольше, - сказал астрофизик и поклонник Го Пит Хат в 1997 году.« Если разумный человек научился играть в Го, Несколько месяцев он мог побить все существующие компьютерные программы. Вам не обязательно быть Каспаровым.
Times полагает, что если компьютер победит чемпиона Go, это будет «признаком того, что искусственный интеллект действительно начинает становиться таким же хорошим, как и настоящий».
Ну, ребята, этот момент наступил, примерно на сто лет раньше срока. AlphaGo, программа, разработанная командой искусственного интеллекта Google DeepMind, обыграла чемпиона Европы по футболу Фан Хуэя со счетом 5: 0.
Результаты были опубликованы сегодня в журнале Nature .
Go начинается просто с сетки 19 на 19 и двух цветов фигур (называемых камнями): черный для одного игрока, белый для другого. Игроки по очереди кладут свои камни на пустые перекрестки - точки пересечения двух линий сетки. Медленно, каждый игрок пытается окружить камни другого игрока, после чего они захватываются и удаляются с доски. В любой момент времени на доске может происходить несколько окружений, и зачастую трудно сказать, кто кого собирается захватить.
«Игра в Го долгое время считалась самой сложной из классических игр для искусственного интеллекта из-за огромного пространства для поиска и сложности оценки позиций и ходов доски», - пишут авторы статьи.
AlphaGo «учится» как путем обучения от человеческих экспертов, так и посредством практики, играя против самого себя. Поскольку у Go слишком много возможных ходов, чтобы компьютер мог просто обработать данные при принятии следующего решения - что является серьезным камнем преткновения для прошлых усилий ИИ по игре на Go - вместо этого AlphaGo использует две разные «глубокие нейронные сети». Одна сеть называется «Сеть политик» - это дает компьютеру несколько перспективных ходов, которые следует учитывать, основываясь на прошлых играх, поэтому ему не нужно разбираться во всех возможных действиях. «Сеть ценностей» уменьшает глубину поиска, то есть, вместо того, чтобы искать до самого конца игры, за сотни шагов, программа может сделать лишь несколько шагов, чтобы сделать свой выбор.
Это большое дело: в дополнение к проверке способностей ИИ создание программы игры в Го, способной побеждать чемпионов среди людей, было чем-то вроде гонки вооружений. В течение многих лет различные программисты и компании требовали создания версии Deep Blue для Go. Некоторые приблизились. Французская программа «Сумасшедший камень» победила пятикратного чемпиона Японии по го Йошио Ишида в 2013 году, хотя Крейзи Стоун получил гандикап (AlphaGo не получил), а Исида не считался лучшим игроком в течение нескольких десятилетий. До сих пор AlphaGo побеждал другие программы Go в 99, 8% случаев.
Всего за несколько часов до того, как Google официально выпустил свои новости, Facebook, без сомнения, раздраженный тем, что его избили, отбросил объявление о том, что их собственный ИИ «приближается» к избиению чемпионов по Го.
Так почему же Го считается таким мощным тестом ИИ? Было бы слишком упрощенно говорить, что го легче, чем шахматы.
«Игра отражает умение игроков балансировать атаки и защиту, заставляя камни работать эффективно, оставаясь гибкими в ответ на меняющиеся ситуации, рассчитывая время, точно анализируя и распознавая сильные и слабые стороны противника», - объясняет Британская ассоциация го на своих веб-сайт, составляя комплексную апелляцию Го.
В то время как шахматы имеют в среднем 35 легальных ходов за ход, в Го - в среднем 200. И хотя есть около 10⁴³ В возможных конфигурациях шахматной доски доска Го имеет по крайней мере 2, 08 X 10¹⁷⁰ - больше конфигураций, чем атомов во вселенной. В отличие от шахмат, где количество фигур на доске - очень хороший показатель того, кто выигрывает, очень трудно понять, кто впереди в Го.
«Нет хорошей эвристики для определения, является ли позиция хорошей или плохой для игрока», - объясняет президент British Go Association Джон Даймонд. «Это отчасти анализ и отчасти распознавание образов. Вы оцениваете плату каким-то сложным образом, мы не научились копировать на компьютерах ».
Даймонд говорит, что он был очень удивлен, узнав об успехе AlphaGo. «Думаю, я не ожидал, что это будет от пяти до десяти лет, если честно», - говорит он. «Они чертовски хорошо поработали».
Успех AlphaGo может означать, что мы намного ближе, чем считалось ранее, к наличию ИИ, которые могут работать на человеческом уровне в других областях. По словам разработчиков, AlphaGo может стать «ступенькой» для других видов ИИ. По словам разработчиков, ИИ, который может принимать сложные, интуитивно понятные решения, необходимые для победы в Го, может, например, диагностировать больного пациента и назначить индивидуальный курс лечения.
В марте AlphaGo снова будет испытан, когда встретится с корейцем Ли Седолом, который считается лучшим игроком в покер в мире.
«Независимо от результата, это будет значимое событие в истории бадук (го)», - говорит Ли в пресс-релизе. «Я слышал, что искусственный интеллект Google DeepMind на удивление силен и становится все сильнее, но я уверен, что смогу победить, по крайней мере, в этот раз».