ОПТИМІЗАЦІЯ НЕЙРОННОЇ МЕРЕЖІ АЛГОРИТМУ DEEPSTACK ДЛЯ ГРИ У LEDUC HOLD’EM

Apply

ОПТИМІЗАЦІЯ НЕЙРОННОЇ МЕРЕЖІ АЛГОРИТМУ DEEPSTACK ДЛЯ ГРИ У LEDUC HOLD’EM

Journal Title: Мікросистеми, Електроніка та Акустика - Year 2017, Vol 22, Issue 5

Abstract

В статті розглянуте питання реалізації нейронної мережі та підбору її структури, яка використовується в алгоритмі DeepStack. Наведений детальний опис алгоритму та принцип його роботи. Розглянутий алгоритм використовується для прийняття рішення під час гри в покер. Покер представлений як гра з неповною інформацією. Розрахунок стратегії відбувається на основі двох параметрів – контрфактичних значень опонента та діапазону гравця. Запропонована нейронна мережа використовується для розрахунку стратегії, а саме контрфактичних значень опонента. В якості нейронної мережі була вибрана мережа прямого розповсюдження. В якості даних для навчання використовувався набір вирішений покерних ситуацій, який включав в себе різні величини ставок та комбінації рук. Розглянуто декілька структур мереж та вибрана оптимальна. Критерієм вибору слугує оцінка вразливості стратегії. Бібл. 13, рис. 9.

Authors and Affiliations

Yaroslav Yuriiovych Dorogyi, Vasyl Vasylovych Tsurkan, Vladyslav Yuriiovych Lisoviy

Keywords

нейронна мережа; покер; стратегія; контрфактичні значення; дерево передбачення

ВИМІРЮВАЛЬНИЙ ПЕРЕТВОРЮВАЧ КУТОВИХ ПЕРЕМІЩЕНЬ З ВИКОРИСТАННЯМ ФАЗОВИХ НАБІГАНЬ ЕЛЕКТРИЧНОГО ПОЛЯ ПОВЕРХНЕВИХ АКУСТИЧНИХ ХВИЛЬ

Запропонований і теоретично обгрунтований метод однозначного вимірювання кутових переміщень з використанням фазових набігань на поверхні п’єзоелектричного хвилеводу електричного поля кількох поверхневих акустичних хвиль...

БЕЗКОНТАКТНИЙ МОНІТОРИНГ ПАРАМЕТРІВ ВЕНТИЛЯЦІЙНОЇ ФУНКЦІЇ ЛЕГЕНЬ ЗА ДОПОМОГОЮ МЕТОДУ ОПТИЧНОГО ПОТОКУ

В статті запропоновано метод, що дозволяє отримати розширений набір параметрів вентиляційної функції легень при безконтактному моніторингу за допомогою відеокамери, зокрема тривалості вдиху та видиху під час аналізу пото...

ЕЛЕКТРОМЕХАНІЧНА ЧУТЛИВІСТЬ КРУГЛИХ ТА КІЛЬЦЕВИХ П'ЄЗОЕЛЕКТРИЧНИХ ТОНКИХ ПЛАСТИН ПРИ МЕХАНІЧНОМУ ЗБУРЕННІ

Досліджується реакція п’єзокерамічних осьових датчиків з чутливим елементом в формі круглих та кільцевих пластин на імпульсне механічне навантаження. Визначається електрорушійна сила п’єзокерамічних поляризованих по товщ...

РЕГУЛЮВАЛЬНІ ХАРАКТЕРИСТИКИ ІМПУЛЬСНИХ РЕГУЛЯТОРІВ З УРАХУВАННЯМ ВНУТРІШНЬОГО ОПОРУ ДЖЕРЕЛА ЕЛЕКТРОЖИВЛЕННЯ

Проаналізовано особливості роботи імпульсних регуляторів від джерел постійної напруги та струму. Наведено схеми імпульсних регуляторів постійного струму, дуальні до схем імпульсних регуляторів постійної напруги. Розгляну...

ОПТИМІЗАЦІЯ НЕЙРОННОЇ МЕРЕЖІ АЛГОРИТМУ DEEPSTACK ДЛЯ ГРИ У LEDUC HOLD’EM

EP ID EP295887
DOI 10.20535/2523-4455.2017.22.5.105016
Views 116
Downloads 0

How To Cite

Yaroslav Yuriiovych Dorogyi, Vasyl Vasylovych Tsurkan, Vladyslav Yuriiovych Lisoviy (2017). ОПТИМІЗАЦІЯ НЕЙРОННОЇ МЕРЕЖІ АЛГОРИТМУ DEEPSTACK ДЛЯ ГРИ У LEDUC HOLD’EM. Мікросистеми, Електроніка та Акустика, 22(5), 63-72. https://europub.co.uk/articles/-A-295887