ОПТИМІЗАЦІЯ НЕЙРОННОЇ МЕРЕЖІ АЛГОРИТМУ DEEPSTACK ДЛЯ ГРИ У LEDUC HOLD’EM

Abstract

В статті розглянуте питання реалізації нейронної мережі та підбору її структури, яка використовується в алгоритмі DeepStack. Наведений детальний опис алгоритму та принцип його роботи. Розглянутий алгоритм використовується для прийняття рішення під час гри в покер. Покер представлений як гра з неповною інформацією. Розрахунок стратегії відбувається на основі двох параметрів – контрфактичних значень опонента та діапазону гравця. Запропонована нейронна мережа використовується для розрахунку стратегії, а саме контрфактичних значень опонента. В якості нейронної мережі була вибрана мережа прямого розповсюдження. В якості даних для навчання використовувався набір вирішений покерних ситуацій, який включав в себе різні величини ставок та комбінації рук. Розглянуто декілька структур мереж та вибрана оптимальна. Критерієм вибору слугує оцінка вразливості стратегії. Бібл. 13, рис. 9.

Authors and Affiliations

Yaroslav Yuriiovych Dorogyi, Vasyl Vasylovych Tsurkan, Vladyslav Yuriiovych Lisoviy

Keywords

Related Articles

ОПТИМІЗАЦІЯ НЕЙРОННОЇ МЕРЕЖІ АЛГОРИТМУ DEEPSTACK ДЛЯ ГРИ У LEDUC HOLD’EM

В статті розглянуте питання реалізації нейронної мережі та підбору її структури, яка використовується в алгоритмі DeepStack. Наведений детальний опис алгоритму та принцип його роботи. Розглянутий алгоритм використовуєтьс...

МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ИССЛЕДОВАНИЯ ЗВУКОВ ЛЕГКИХ

В статье рассматриваются основные методы машинного обучения с целью применения их к задаче классификации звуков легких. На основе базы звуков легких был получен ряд параметров сигналов. Задачей исследования было провести...

ЗАСТОСУВАННЯ ГЕНЕТИЧНОГО АЛГОРИТМУ ДЛЯ АГЕНТНОГО МОДЕЛЮВАННЯ ПОВЕДІНКИ ОБ’ЄКТІВ ПРИ ВИХОДІ З ПАЛАЮЧОЇ КІМНАТИ

В статті розглянуте питання реалізації генетичного алгоритму для навчання й оптимізації нейронної мережі та її застосування для задач агентного моделювання людської поведінки. Запропоновано систему, що здійснює навчання...

Оцінка ефективності відбирання енергії від сонячної батареї

Проаналізовано умови, за яких від сонячної батареї (СБ), що працює на узгоджувальний імпульсний регулятор (ІР), буде відбиратись максимальний обсяг енергії. Виведено уточнену умову відбору максимальної енергії для випадк...

ESTIMATION OF PROBABILISTIC PROCESSES IN WIRELESS NETWORKS OF 802.11 STANDARD

The article analyzes mechanisms of collision in a wireless 802.11 network with competitive access to a radio channel. The calculated relationships for determining the probabilities of collisions in the network as a whole...

Download PDF file
  • EP ID EP295887
  • DOI 10.20535/2523-4455.2017.22.5.105016
  • Views 115
  • Downloads 0

How To Cite

Yaroslav Yuriiovych Dorogyi, Vasyl Vasylovych Tsurkan, Vladyslav Yuriiovych Lisoviy (2017). ОПТИМІЗАЦІЯ НЕЙРОННОЇ МЕРЕЖІ АЛГОРИТМУ DEEPSTACK ДЛЯ ГРИ У LEDUC HOLD’EM. Мікросистеми, Електроніка та Акустика, 22(5), 63-72. https://europub.co.uk/articles/-A-295887