https://frosthead.com

Этот ИИ, играющий в покер, знает, когда держать их, а когда сложить

Компьютерная программа под названием Pluribus превзошла покерных профессионалов в серии безлимитных игр в Техасский Холдем с шестью игроками, став важной вехой в исследованиях искусственного интеллекта. Это первый бот, который победил людей в сложном многопользовательском соревновании.

Как сообщают исследователи из лаборатории ИИ Facebook и Университета Карнеги-Меллона в журнале Science, Pluribus одержал победу в матчах, в которых доминируют как люди, так и алгоритмы. Изначально Меррит Кеннеди пишет для NPR : пять версий бота против одного профессионального игрока в покер; в следующем раунде экспериментов один бот играл против пяти человек. Согласно сообщению в блоге Facebook, ИИ выигрывал в среднем около 5 долларов за руку, или 1000 долларов в час, когда играл против пяти противников. Этот показатель считается «решающим пределом победы» среди покерных профессионалов.

Разговаривая с Кеннеди, четырехкратный чемпион World Poker Tour Даррен Элиас объясняет, что он помог тренировать Pluribus, соревнуясь с четырьмя столами соперников ботов и предупреждая ученых, когда ИИ допустил ошибку. Вскоре бот «очень быстро улучшался, превращаясь из посредственного игрока в покерного игрока мирового уровня за считанные дни и недели». Элиас говорит, что опыт был «довольно страшным».

По словам Джеймса Винсента из Verge, Pluribus - удивительно недорогой ИИ, обученный с использованием ресурсов облачных вычислений стоимостью менее $ 150, - в дальнейшем овладел стратегией покера, играя против своих копий и обучаясь методом проб и ошибок. Как отмечает Дженнифер Оуэллетт для Ars Technica, бот быстро понял, что его лучший ход действий - это сочетание геймплея и непредсказуемых ходов.

Большинство профессионалов избегают «донк-беттинга», когда игрок заканчивает один раунд коллом и начинает следующий со ставки, но Плюриб с готовностью принял непопулярную стратегию. В то же время, сообщает Ouellette, AI также предлагал необычные размеры ставок и демонстрировал лучшую рандомизацию, чем противники.

«Его главная сила - это способность использовать смешанные стратегии», - сказал Элиас, согласно заявлению CMU. «Это то же самое, что люди пытаются делать. Для людей это вопрос исполнения - делать это совершенно случайным образом и делать это последовательно. Большинство людей просто не могут.

Pluribus не первый ИИ, играющий в покер, победивший людей-профессионалов. В 2017 году создатели бота, Ноам Браун и Туомас Сандхольм, разработали более раннюю итерацию программы под названием Libratus. Этот ИИ окончательно победил четырех покерных профи в 120 000 раздач техасского холдема с двумя игроками, но, как объясняется в блоге на Facebook, он был ограничен тем, что сражался только с одним противником за раз.

Согласно Will Knight из MIT Technology Review, покер представляет собой сложную задачу для ИИ, потому что в нем участвуют несколько игроков и множество скрытой информации. Для сравнения, в таких играх, как шахматы и го, участвуют только два участника, и позиции игроков видны всем.

Чтобы преодолеть эти препятствия, Браун и Сандхольм создали алгоритм, разработанный для прогнозирования следующих двух или трех ходов противника, а не для определения их шагов до конца игры. Хотя может показаться, что эта стратегия отдает приоритет краткосрочному выигрышу над долгосрочным выигрышем, Винсент из Verge пишет, что «краткосрочная резкость - это действительно все, что вам нужно».

В будущем многопользовательские программы, такие как Pluribus, могут быть использованы для разработки лекарств, способных бороться с бактериями, устойчивыми к антибиотикам, а также для улучшения кибербезопасности и военных робототехнических систем. Как Как отмечает Auel Technica Ouellette, другие потенциальные приложения включают наблюдение за многопартийными переговорами, ценообразование продуктов и стратегии мозгового штурма на аукционах.

На данный момент Браун говорит Найту, что алгоритм будет оставаться в тайне, главным образом для защиты индустрии онлайн-покера от разрушительных финансовых потерь.

Исследователь заключает: «Это может быть очень опасно для покерного сообщества».

Этот ИИ, играющий в покер, знает, когда держать их, а когда сложить