Primjena podržanog učenja za automatsko igranje igara

Sažetak na hrvatskom: U ovom je radu obrađeno podržano učenje kao vrsta strojnog učenja čiji je cilj maksimizirati ukupnu nagradu. Objašnjena je uloga neuronskih mreža u podržanom učenju te proces treniranja neuronskih mreža. U ovom se radu primjena podržanog učenja fokusirala na automatskom igranju...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:49901/Details
Glavni autor: Rakovac, Daniel (-)
Ostali autori: Čupić, Marko (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, D. Rakovac, 2018.
Predmet:
LEADER 02651na a2200229 4500
003 HR-ZaFER
008 160221s2018 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid6265 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Rakovac, Daniel 
245 1 0 |a Primjena podržanog učenja za automatsko igranje igara :  |b završni rad /  |c Daniel Rakovac ; [mentor Marko Čupić]. 
246 1 |a Reinforcement Learning for Automatic Game Playing  |i Naslov na engleskom:  
260 |a Zagreb,  |b D. Rakovac,  |c 2018. 
300 |a 44 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2018-06-15, datum završetka: 2018-07-13 
520 3 |a Sažetak na hrvatskom: U ovom je radu obrađeno podržano učenje kao vrsta strojnog učenja čiji je cilj maksimizirati ukupnu nagradu. Objašnjena je uloga neuronskih mreža u podržanom učenju te proces treniranja neuronskih mreža. U ovom se radu primjena podržanog učenja fokusirala na automatskom igranju igara. Za početak je odabrana jednostavna igra s malim brojem stanja, nazvana FrozenLake, gdje je automatsko igranje ostvareno pomoću algoritma SARSA i Q-učenje sa spremanjem Q-vrijednosti u strukturu nazvanu Q-tablica. Kao primjer složenije igre je odabrana igra FlappyBirds s opcijom da su prepreke pomične. Problem je riješen pomoću Q-učenja aproksimacijom Q-vrijednosti pomoću neuronske mreže. Rezultati algoritama su grafički prikazani i uspoređeni. 
520 3 |a Sažetak na engleskom: This paper describes reinforcement learning as a type of machine learning aimed at maximizing total reward. It explains the role of neural networks in reinforcement learning and their training process. To start with, a simple game with a small number of states was chosen, named FrozenLake, where automatic game playing was accomplished with the help of SARSA algorithm and Q-learning where Q-values were stored in a structure called a Q-table. As an example of a more complex game, the FlappyBirds game was selected with the option to have moving obstacles. The problem was solved with the help of Q-learning where Q-values were approximated using neural network. The results of algorithms are graphically displayed and discussed. 
653 1 |a strojno učenje  |a podržano učenje  |a automatsko igranje igara  |a Markovljev proces odlučivanja  |a Q-učenje  |a SARSA  |a neuronske mreže 
653 1 |a machine learning  |a reinforcement learning  |a automatic game playing  |a Markov decision process  |a Q-learning  |a SARSA  |a neural networks 
700 1 |a Čupić, Marko  |4 ths 
942 |c Z 
999 |c 49901  |d 49901