ОПТИМІЗАЦІЯ НЕЙРОННОЇ МЕРЕЖІ АЛГОРИТМУ DEEPSTACK ДЛЯ ГРИ У LEDUC HOLD’EM
Journal Title: Мікросистеми, Електроніка та Акустика - Year 2017, Vol 22, Issue 5
Abstract
В статті розглянуте питання реалізації нейронної мережі та підбору її структури, яка використовується в алгоритмі DeepStack. Наведений детальний опис алгоритму та принцип його роботи. Розглянутий алгоритм використовується для прийняття рішення під час гри в покер. Покер представлений як гра з неповною інформацією. Розрахунок стратегії відбувається на основі двох параметрів – контрфактичних значень опонента та діапазону гравця. Запропонована нейронна мережа використовується для розрахунку стратегії, а саме контрфактичних значень опонента. В якості нейронної мережі була вибрана мережа прямого розповсюдження. В якості даних для навчання використовувався набір вирішений покерних ситуацій, який включав в себе різні величини ставок та комбінації рук. Розглянуто декілька структур мереж та вибрана оптимальна. Критерієм вибору слугує оцінка вразливості стратегії. Бібл. 13, рис. 9.
Authors and Affiliations
Yaroslav Yuriiovych Dorogyi, Vasyl Vasylovych Tsurkan, Vladyslav Yuriiovych Lisoviy
МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ИССЛЕДОВАНИЯ ЗВУКОВ ЛЕГКИХ
В статье рассматриваются основные методы машинного обучения с целью применения их к задаче классификации звуков легких. На основе базы звуков легких был получен ряд параметров сигналов. Задачей исследования было провести...
БЕЗКОНТАКТНИЙ МОНІТОРИНГ ПАРАМЕТРІВ ВЕНТИЛЯЦІЙНОЇ ФУНКЦІЇ ЛЕГЕНЬ ЗА ДОПОМОГОЮ МЕТОДУ ОПТИЧНОГО ПОТОКУ
В статті запропоновано метод, що дозволяє отримати розширений набір параметрів вентиляційної функції легень при безконтактному моніторингу за допомогою відеокамери, зокрема тривалості вдиху та видиху під час аналізу пото...
МЕХАНИЧЕСКИЕ ПОЛЯ ЦИЛИНДРИЧЕСКОГО ПЬЕЗОКЕРАМИЧЕСКОГО ИЗЛУЧАТЕЛЯ СИЛОВОЙ КОНСТРУКЦИИ В ПРИСУТСТВИИ АКУСТИЧЕСКОГО ЭКРАНА
В статье произведен численный анализ частотных и угловых зависимостей механических полей поверхности цилиндрического пьезокерамического излучателя с окружной поляризацией силовой конструкции в присутствии акустически мяг...
ЗАСТОСУВАННЯ ГЕНЕТИЧНОГО АЛГОРИТМУ ДЛЯ АГЕНТНОГО МОДЕЛЮВАННЯ ПОВЕДІНКИ ОБ’ЄКТІВ ПРИ ВИХОДІ З ПАЛАЮЧОЇ КІМНАТИ
В статті розглянуте питання реалізації генетичного алгоритму для навчання й оптимізації нейронної мережі та її застосування для задач агентного моделювання людської поведінки. Запропоновано систему, що здійснює навчання...
ESTIMATION OF PROBABILISTIC PROCESSES IN WIRELESS NETWORKS OF 802.11 STANDARD
The article analyzes mechanisms of collision in a wireless 802.11 network with competitive access to a radio channel. The calculated relationships for determining the probabilities of collisions in the network as a whole...