Компьютер научился беспроигрышной стратегии карточной игры

Канадским ученым удалось написать компьютерную программу, способную на слабое решение самой популярной разновидности покера — техасского холдема (с лимитированными ставками). Иными словами, компьютер смог создать стратегию игры, настолько близкую к оптимальной, что никакой человек не способен обыграть его (со статистическим уровнем значимости) за всю свою жизнь. О программе, получившей название Cepheus («Цефей») сообщается в журнале Science.

Покер, как и другие карточные игры, относится к играм с неполной информацией — где участники обладают скрытым от остальных знанием о своих картах, а также могут использовать это знание в свою пользу (например, блефовать). Если в играх с полной информацией (например, шахматах, где оба игрока видят положение всех фигур на доске) искусственный интеллект или обыгрывает человека, или как минимум добился паритета с ним, то над покером программисты безуспешно бились с 2006 года (когда прошел первый ежегодный чемпионат по этой игре среди компьютеров).

Метод Майкла Боулинга (Michael Bowling) и его коллег основывается на принципе counterfactual regret minimization. Алгоритм реализуется на распределенных вычислительных узлах за счет того, что игра разбивается на отдельные фрагменты (около 110 тысяч), согласно доступной информации (знанию об открытых картах и прошлых ходах игроков). Кроме того, специальные техники сжатия данных обеспечивали хранение фрагментов партии на локальных дисках и возврат их в память системы для расчетов. Всего использовалось 200 вычислительных узлов (в каждом 2,1-гигагерцовые процессоры AMD, всего 24 процессорных ядра в узле, 32 гигабайта оперативной памяти, 1-терабайтный жесткий диск в каждом), а вычисления заняли в общей сложности 68 с половиной суток. За это время Cepheus провел сам с собой несколько миллиардов партий, таким образом набрав необходимый опыт игры.

Практическое преимущество новой техники в том, что ученые снизили требования к ней: не найти точное равновесие, а гарантировать лишь, что при присущей человеку скорости игры противник не сможет выиграть за всю свою жизнь. Для большинства практических приложений этого вполне достаточно. Новый алгоритм обещает найти применение всюду, где имеет место неопределенность и дефицит информации: в сфере бизнеса (модели торгов и переговоров), в медицине (разработка планов борьбы с эпидемиями) и в сфере компьютерной безопасности.

Узнать больше о Cepheus и сыграть с ним партию можно на сайте Университета Альберты.

Обсудить
00:01 Сегодня

Допрыгались

История любви мальчика и его пернатого друга: обзор игры The Last Guardian

Не твой, вот и бесишься
Что нужно продать, чтобы купить новый MacBook Pro 2016
Допрыгались
История любви мальчика и его пернатого друга: обзор игры The Last Guardian
Без царя в голове
Историки о причинах и последствиях событий 1917 года: спецпроект «Ленты.ру»
Дженис ЙостимаСама себе модель
История успеха девушки из провинции с миллионом подписчиков в сети
Кровавая пенсия
Чем занимаются знаменитые преступники, ушедшие на покой
Мохаммед, похититель Рождества
Елки и Санта-Клаусы в Европе оказались в опале
Ленинаканский пробор
История парикмахерской, пережившей землетрясение в Гюмри
Видео: Самый быстрый «МАЗ»
Дакаровский «МАЗ», десантный корабль на воздушной подушке и заброшенная авиабаза
Кёрлинг по-крупному
Массовые аварии и другие скользкие видео в честь прихода зимы
Самые продаваемые автомобили в России
25 самых популярных автомобилей ноября 2016 года
Чех, два японца и кореец: выбираем лучший компактный седан
Длительный тест четырех компактных седанов. Часть 3
От роддома до могилы
Тайны фамильных особняков, в которых живут поколения фермеров и журналистов
Извращенные вкусы
Откровения риелторов о клиентах-геях, богеме, политиках и шизофрениках
Пассажиры в зале ожидания в аэропорту СочиКвартирный вопрос их испортил
Как обманывают приезжих нечистоплотные москвичи
Халявщики и партнеры
Застройщики и банки шокируют заемщиков ипотечными условиями