8
Команда Rock Band Rock Band

DeepHack.Game Rock band team

Embed Size (px)

Citation preview

Команда Rock BandRock Band

Reinforcement Learning – что это?

Данные

Алгоритм

Profit

Данные

Алгоритм

…………….Profit

Supe

rvis

ed L

earn

ing

Rein

forc

emen

t Lea

rnin

g

Настольные игры

Компьютерные игры

Аналитика динамический процессов

Обучение роботов простым действиям

Reinforcement Learning – зачем это нужно?

Q-learning – пытаемся предсказать будущееКартинка с экрана

(как её видит человек) Нейронная сеть Предсказание действия, которое принесет больше очков

Prioritized Sampling

Random Sampling (by Google DeepMind) Prioritized Sampling (based on Prioritized Sweeping 1993)

Для обучения выбираются случайные игры в прошлом

Выбираются самые «интересные игры» - те, в которых результат был

неожиданным для алгоритма

Игры отборочного тура: Gopher

Игры отборочного тура: Seaquest

Игры отборочного тура: Tutankhamon