Текст уведомления здесь

Ученые раскрыли принципы работы искусственного интеллекта, обыгравшего людей в покер

Исследователи из Университета Карнеги-Меллона опубликовали принципы работы искусственного интеллекта Libratus, который в начале года смог обыграть ведущих игроков в покер почти на 2 миллиона долларов.
Добавить в закладки
Комментарии

За последние несколько лет компьютерные программы победили людей в шашки и шашки. Недавно перед искусственным интеллектом «пал» го. Разработанная в Google программа Alpha Go в 2016 году победила Ли Седоля — одного из сильнейших в мире игроков го.

Шашки, шахматы и го — сложные игры, но оба игрока видят, что происходит на доске, и могут рассчитать свои действия в зависимости от предполагаемых ходов противника. В покере соперники не знают карт друг друга, единственная доступная информация — свои карты и мимика, жесты соперника.

Сотрудники Университета Карнеги-Меллона (Питтсбург, США) Ной Браун и Туомас Сандхольм несколько лет назад создали программу Claudico, которая проиграла профессиональным игрокам в покер. Ученые усовершенствовали алгоритм ИИ, который назвали Libratus (от лат. «баланс»). Программу ознакомили только с правилами покера: какие карты есть, в какой последовательности ходят игроки, какие комбинации сильнее. Система играла сама с собой, выполнив несколько триллионов раздач. Libratus научилась мыслить «абстрактно» — находить сходные черты в разных комбинациях карт, ставок и прочих элементов процесса. Если же соперник совершает неожиданный ход, то ИИ просчитывает его последствия отдельно и ищет безопасные варианты продолжения, которые помогли бы победить или хотя бы минимизировать потери.

Архитектура Libratus включает в себя три основных модуля, на первом из которых система способна просчитывать 10161 (больше числа атомов во Вселенной — примерно 1081) возможных комбинаций и способов их розыгрыша. ИИ создает свою собственную подробную стратегию для ранних раундов игры и грубую стратегию — для последующих раундов. В финальных раундах второй модуль создает новую, более тонкую стратегию, основанную на принципе наиболее безопасного действия для достижения максимальной выгоды. Третий модуль предназначен для улучшения стратегии Libratus — ИИ использует машинное обучение, чтобы найти ошибки в поведении противника и использовать их в дальнейшем.

В феврале 2017 года ученые пригласили четырех ведущих мировых игроков протестировать Libratus в игре техасский холдем, одной из наиболее популярных разновидностей покера. За 20 дней турнира профессионалы в десятках тысяч раздач совокупно проиграли компьютеру почти 1,8 млн долларов. К счастью для игроков, турнир велся исключительно в научных целях, профессионалы поделили спонсорские выплаты в размере 200 тысяч долларов за участие в эксперименте. Во время турнира Libratus выполнял это вычисление с помощью суперкомпьютера Bridges. Ученые заявляют, что большинство игроков в покер Libratus обыграет даже с обычного компьютера.

По словам создателей, алгоритм Libratus можно применять для любых задач с неполной информацией: для оценки рисков на бирже, обеспечения кибербезопасности и в стратегическом ценообразовании.

Исследование ученых опубликовано в журнале Nature.

Говорят ли успехи ИИ в играх против людей о том, что искусственный интеллект превзошел человеческий, читайте на «Чердаке».

Добавить в закладки
Комментарии
Вам понравилась публикация?
Расскажите, что вы думаете, и мы подберем подходящие материалы