ОПТИМІЗАЦІЯ НЕЙРОННОЇ МЕРЕЖІ АЛГОРИТМУ DEEPSTACK ДЛЯ ГРИ У LEDUC HOLD’EM

Abstract

В статті розглянуте питання реалізації нейронної мережі та підбору її структури, яка використовується в алгоритмі DeepStack. Наведений детальний опис алгоритму та принцип його роботи. Розглянутий алгоритм використовується для прийняття рішення під час гри в покер. Покер представлений як гра з неповною інформацією. Розрахунок стратегії відбувається на основі двох параметрів – контрфактичних значень опонента та діапазону гравця. Запропонована нейронна мережа використовується для розрахунку стратегії, а саме контрфактичних значень опонента. В якості нейронної мережі була вибрана мережа прямого розповсюдження. В якості даних для навчання використовувався набір вирішений покерних ситуацій, який включав в себе різні величини ставок та комбінації рук. Розглянуто декілька структур мереж та вибрана оптимальна. Критерієм вибору слугує оцінка вразливості стратегії. Бібл. 13, рис. 9.

Authors and Affiliations

Yaroslav Yuriiovych Dorogyi, Vasyl Vasylovych Tsurkan, Vladyslav Yuriiovych Lisoviy

Keywords

Related Articles

РЕГУЛЮВАЛЬНІ ХАРАКТЕРИСТИКИ ІМПУЛЬСНИХ РЕГУЛЯТОРІВ З УРАХУВАННЯМ ВНУТРІШНЬОГО ОПОРУ ДЖЕРЕЛА ЕЛЕКТРОЖИВЛЕННЯ

Проаналізовано особливості роботи імпульсних регуляторів від джерел постійної напруги та струму. Наведено схеми імпульсних регуляторів постійного струму, дуальні до схем імпульсних регуляторів постійної напруги. Розгляну...

МЕТОДИ І ТЕХНОЛОГІЇ ЗАХИСТУ КОМП’ЮТЕРНИХ МЕРЕЖ (ФІЗИЧНИЙ ТА КАНАЛЬНИЙ РІВНІ)

Розглянуто найбільш поширені рішення, які підтримуються виробниками обладнання для комп’ютерних мереж (комутатори 2-го та 3-го рівнів, маршрутизатори), реалізовані у операційних системах та протоколах і можуть бути викор...

ESTIMATION OF PROBABILISTIC PROCESSES IN WIRELESS NETWORKS OF 802.11 STANDARD

The article analyzes mechanisms of collision in a wireless 802.11 network with competitive access to a radio channel. The calculated relationships for determining the probabilities of collisions in the network as a whole...

СУБ’ЄКТИВНЕ ОЦІНЮВАННЯ ЯКОСТІ ТА РОЗБІРЛИВОСТІ МОВНИХ СИГНАЛІВ, СПОТВОРЕНИХ СИНТЕЗОВАНИМИ ШУМАМИ

В даній роботі наведено результати оцінювання впливу стаціонарних та нестаціонарних синтезованих шумів на якість та розбірливість мовних сигналів. Для випадку стаціонарних шумів показано, що при малих відношеннях сигнал-...

РЕФЕРЕНСНАЯ АРХИТЕКТУРА СИСТЕМ ДЛЯ АНАЛИЗА БИОМЕДИЦИНСКИХ ДАННЫХ

В данной работе были исследованы проблемы разработки универсальных и адаптивных систем анализа данных. На примере построения биомедицинских систем мониторинга состояния здоровья человека были выделены основные особенност...

Download PDF file
  • EP ID EP295887
  • DOI 10.20535/2523-4455.2017.22.5.105016
  • Views 111
  • Downloads 0

How To Cite

Yaroslav Yuriiovych Dorogyi, Vasyl Vasylovych Tsurkan, Vladyslav Yuriiovych Lisoviy (2017). ОПТИМІЗАЦІЯ НЕЙРОННОЇ МЕРЕЖІ АЛГОРИТМУ DEEPSTACK ДЛЯ ГРИ У LEDUC HOLD’EM. Мікросистеми, Електроніка та Акустика, 22(5), 63-72. https://europub.co.uk/articles/-A-295887