ИИ обыграл в покер пятерых профессиональных игроков
ИИ обыграл в покер пятерых профессиональных игроков

ИИ обыграл в покер пятерых профессиональных игроков

В январе 2017 года стало известно, что компьютерная программа Libratus обыграла четырех профессиональных игроков в покер и выиграла два миллиона долларов.

Однак ее создатели решили не останавливаться на достигнутом и сейчас представили миру новую версию программы - Pluribus, которая уже обыграла в техасский холдем сразу пятерых чемпионов в этой игре, "сидя" с ними всеми за одним столом, прямо как в традиционных казино.

О разработке ученых пишет журнал Science.

Как рассказал Ной Браун (Noam Brown) из Университета Карнеги-Меллона в Питтсбурге (США), один из создателей Pluribus, искусственный интеллект, вырабатывая свою стратегию, создал несколько инновационных приемов, которые могут в дальнейшем повлиять на игру профессионалов по покеру.

Авторы Pluribus оснастили его "абстрактным действием" и "абстрактной информацией" - так программа смогла отбросить лишние варианты дальнейших ходов и оставить лишь те, которые потребуются для принятия решения.

Во время тестов Pluribus, используя метод самообучения и систему "минимизации сожалений" (когда программа максимально сокращает разницу между уже принятым решением и оптимальной стратегией), сражалась в покер с пятью своими копиями, поначалу играя наугад.

Впоследствии ИИ научился анализировать ходы и понял, какие действия и с какой вероятностью ведут к победе в игре.

Главная часть эксперимента проходила на протяжении 12 дней в два этапа: один игрок против пяти копий Pluribus либо пять профессионалов против ИИ.

Ежедневно в игре участвовали пять разных чемпионов по покеру, каждый из которых в прошлом выиграл более миллиона долларов.

В итоге с помощью своей уникальной и в чем-то "парадоксальной" стратегии ИИ более чем за десять тысяч раздач обыграл всех лучших игроков и заработал полмиллиона долларов.

"Главный плюс Pluribus - способность совмещать разные стратегии.

Это то, к чему идут профессиональные игроки в покер.

Мало у кого получается менять тактику случайным образом и оставаться в плюсе.

Почти все люди не справляются с такой задачей", - рассказал рекордсмен World Poker Tour Даррен Элиас (Darren Elias), который также потерпел поражение в игре с ИИ.

Источник материала
Поделиться сюжетом