Исследователи из американского университета Карнеги-Меллон, разработали алгоритм, который выиграл почти $2 млн в одной из разновидностей покера.
Программа, которая получила название Libratus, победила четырех лучших профессиональных игроков в покер в безлимитном Техасском Холдеме, пишет EurekAlert!.
В своей статье авторы программы подробно объяснили, как ей удалось добиться сверхчеловеческой производительности, разбивая игру на управляемые части и, основываясь на игре своих оппонентов, устранять возможные недостатки в своей стратегии во время соревнований. Libratus использует трехсторонний подход для учета скрытой информации.
Как отмечают разработчики, их версия искусственного интеллекта умеет находить общие черты в различных комбинациях карт, ставок и прочих элементов игры, и считать их примерно одним и тем же вариантом развития событий. Такой подход сильно упрощает игру и позволяет находить простые решения для самых очевидных комбинаций карт и вариантов ходов соперника.
«Приемы, которые разработаны нами при создании этой системы искусственного интеллекта, не специфичны для покера, их можно применять в любых ситуациях, когда нет полной информации для принятия решений», — заявил Ной Браун из Университета Карнеги-Меллон.
Libratus состоит из трех модулей. Первый вычисляет так называемую абстракцию игры, основываясь на общих чертах между ставками и комбинациями. Это позволяет программе разработать подробную стратегию на первые раунды торговли и грубую стратегию для последующих раундов.
В ходе игры второй модуль изменяет стратегию в зависимости от действий противника. Это делается с помощью суперкомпьютера Bridges. Каждый раз, когда соперник делает ход, который не предусматривался изначальной стратегией, модуль делает соответствующие вычисления. Третий модуль предназначен для улучшения стратегии в ходе партии.