27 февраля 2017, понедельник

Разработана стратегия гарантированной победы в одном из видов покера

комментировать
Пока для победы требуются длительные вычисления

Пока для победы требуются длительные вычисления

Специалисты по теории игр Университета Альберты в Канаде выпустили программу, которая может победить в покер любого человеческого игрока.

Пока говорится о "слабом решении" задачи, которое позволяет лишь гипотетически выиграть за такой срок партии, который значительно превосходит время жизни человека. Статья разработчиков опубликована в Science, кратко о ней пишет Образовач.

Максимизацию выигрыша разработали для наиболее популярноого вида покера - техасского холдема  в варианте игры один-на-один (хедзап) и ограниченными ставками. В этом варианте у каждого игрока есть две секретные карты (рука), а еще пять карт - открытые и общие, каждый игрок может добавлять их в свои комбинации.

После сдачи "руки" игроки торгуются, увеличивая ставки на каждом этапе, или выходят из игры. Для этой комбинации правил есть 3,16 × 1017 элементарных состояний игры и 3,19 × 1014 точек, где игрок должен принять решение.

Читайте также в разделе Наука:

Математики решили задачу благодаря методу "минимизации сожаления". Каждому принятому решению в игре назначается условный вес, который поясняет ошибочность этого решения с точки зрения результата партии. Компьютер должен провести множество игр (сначала принимая случайные решения), пока не соберет достаточно оценок веса для таких решений.

Объем расчетов настолько большой (262 терабайта), что авторы были вынуждены подготовить специальный алгоритм их сжатия. "Минимизация сожаления" известна с 2006 года, но в новом исследовании ученые его несколько исправили, обеспечив среди прочего ретроспективную переоценку весов.

Сложность решения задачи покера, как и ее практическое значение, поясняется тем, что карточная игра входит в категорию игр с ограниченной информацией. К примеру, в шахматах или шашках у всех игроков есть полная информацию о нынешнем состоянии игры и ее истории. В покере, как и в большинстве практических задач, как в инвестировании или медицине, доступна только часть информации, на основании которой нужно принять решение.

Игры такого типа являются значительно сложнее для анализа вычислительными методами. Авторы рассчитывают, что новый алгоритм под названием CFR+ будет использован в других задачах при принятии решений с ограниченной информацией. Математики уже начали разработку системы для работы с информацией о диабете.

Комментарии

1000

Правила комментирования
Показать больше комментариев

Последние новости

ТОП-3 блога

Фото

ВИДЕО

Читайте на НВ style

Наука ТОП-10

Подписка на новости
     
Погода
Погода в Киеве

влажность:

давление:

ветер: