В прошлом году программа искусственного интеллекта под названием AlphaGo, созданная командой Google DeepMind, победила человека-чемпиона в Go, древней китайской стратегической игре, которая во многих отношениях более сложна, чем шахматы. Как сообщила в то время Эмили Матчар для Smithsonian.com, это было ошеломляющее достижение, так как уже в 1997 году некоторые люди предсказывали, что компьютеру понадобится 100 лет, чтобы победить человека на ходу.
Хотя этот подвиг впечатляет, AlphaGo научился играть в эту игру, анализируя предыдущие игры, в которые играли люди. Но, как сообщает Меррит Кеннеди из NPR, новая версия искусственного интеллекта под названием AlphaGo Zero выяснила, как справиться с игрой самостоятельно, без участия человека или манипуляций - прогресс, который имеет большое значение для будущего развития ИИ.
Согласно пресс-релизу DeepMind, предыдущие версии AlphaGo научились играть в игру, изучая матчи между профессиональными и сильными любителями, осваивая правила игры и удачные стратегии игры. AlphaGo Zero, однако, не смотрел ни на какие игры, в которые играют люди. Вместо этого ему были даны правила игры, а затем сыграли против себя, используя обучение подкреплению, чтобы научить себя правильным и неправильным движениям и долгосрочным стратегиям. По мере того, как ИИ играл в игру, он обновлял свою продвинутую нейронную сеть, чтобы лучше прогнозировать ходы своего противника.
Исследователи наблюдали, как ИИ осваивал игру в режиме реального времени. Через три дня он смог победить предыдущую версию под названием AlphaGo Lee, которая обыграла корейского мастера Go Lee Sedol в 4 из 5 игр в 2016 году. Через 21 день она одолела AlphaGo Master, версию, которая побила 60 лучших игроков Go онлайн и лучший игрок мира Ке Цзе ранее в этом году. Последняя версия превзошла AlphaGo Master 100 игр до 0. Через 40 дней она достигла уровня игры, которого никто не видел раньше. Исследование появляется в журнале Nature.
«За короткое время AlphaGo Zero поняла все знания Go, которые были накоплены людьми за тысячи лет игры», - говорит ведущий исследователь Дэвид Сильвер из Google DeepMind в видео на Youtube. «Иногда на самом деле было решено пойти дальше и открыть то, что люди даже не открыли в этот период времени, и открыть новые знания, которые являются творческими и новыми во многих отношениях».
Как сообщает Agence France-Presse, AlphaGo Zero достигла этого уровня мастерства гораздо эффективнее, чем его предшественники. В то время как предыдущая итерация имела 48 блоков обработки данных и в течение нескольких месяцев играла в 30 миллионов тренировочных игр, в Zero было только 4 блока обработки, и в течение трех дней играли в 4, 9 миллиона обучающих игр. «Люди склонны полагать, что машинное обучение - это все о больших данных и огромных объемах вычислений, но на самом деле то, что мы видели с AlphaGo Zero, это то, что алгоритмы имеют гораздо большее значение», - говорит Сильвер.
Но исследование - это больше, чем просто освоение настольной игры. Как сообщает Ian Sample в The Guardian, этот тип tabula rasa, или «чистого листа», обучения может привести к новому поколению искусственного интеллекта общего назначения, которое может помочь решить проблемы в областях, которые могут быть хорошо смоделированы на компьютере, например, состав лекарств., сворачивание белка или физика частиц. Создавая свои знания с нуля без человеческих предубеждений или ограничений, алгоритмы могут идти в направлениях, которые люди еще не думали искать.
В то время как многие в сообществе искусственного интеллекта считают AlphaGo Zero большим достижением, профессор психологии Нью-Йоркского университета Гэри Маркус, специализирующийся на искусственном интеллекте, говорит Кеннеди из NPR, что он не думает, что алгоритм действительно tabula rasa, потому что предшествующее человеческое знание пошло в построении алгоритма. Он также не думает, что AI Tabula Rasa так важен, как кажется. «[В] биологии, настоящий человеческий мозг не является tabula rasa ... Я не вижу принципиальной теоретической причины, почему вы должны это делать, почему вы должны отказаться от большого количества знаний, которые у нас есть о мире», - говорит он.
Несмотря на это, быстрое мастерство игры Alpha Go впечатляет - и немного пугает.