Ученые Университета Карнеги-Меллон раскрыли принцип работы искусственного интеллекта (ИИ) Libratus, который обыграл лучших игроков в покер. В статье, опубликованной в журнале Science, они описали трехсторонний подход, который использует программа для учета скрытой информации. ИИ способен предсказывать, какие карты находятся на руках у соперника и блефует ли игрок. Об этом сообщается в пресс-релизе на сайте EurekAlert!.
В январе 2017 года Libratus победил лучших игроков в безлимитный техасский холдем — самая популярная разновидность покера с пятью общими картами и двумя своими, которые используются для составления комбинаций. Соревнование длилось 20 дней, в ходе него было отыграно 120 тысяч раздач. ИИ обыграл каждого из игроков в отдельности и набрал 1,8 миллиона долларов в фишках.
Libratus состоит из трех модулей. Первый вычисляет так называемую абстракцию игры, основываясь на общих чертах между ставками и комбинациями. Например, флеши король-хай и дама-хай рассматриваются как одна рука, что уменьшает сложность игры. Это позволяет программе разработать подробную стратегию на первые раунды торговли и грубую стратегию для последующих раундов.
В ходе игры второй модуль изменяет стратегию в зависимости от действий противника. Это делается с помощью суперкомпьютера Bridges. Каждый раз, когда соперник делает ход, который не предусматривался изначальной стратегией, модуль делает соответствующие вычисления. Третий модуль предназначен для улучшения стратегии в ходе соревнования с помощью анализа размеров ставок противника.