|
|
|
|
| LEADER |
02651na a2200229 4500 |
| 003 |
HR-ZaFER |
| 008 |
160221s2018 ci ||||| m||| 00| 0 hr d |
| 035 |
|
|
|a (HR-ZaFER)ferid6265
|
| 040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
| 100 |
1 |
|
|a Rakovac, Daniel
|
| 245 |
1 |
0 |
|a Primjena podržanog učenja za automatsko igranje igara :
|b završni rad /
|c Daniel Rakovac ; [mentor Marko Čupić].
|
| 246 |
1 |
|
|a Reinforcement Learning for Automatic Game Playing
|i Naslov na engleskom:
|
| 260 |
|
|
|a Zagreb,
|b D. Rakovac,
|c 2018.
|
| 300 |
|
|
|a 44 str. ;
|c 30 cm +
|e CD-ROM
|
| 502 |
|
|
|b preddiplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2018-06-15, datum završetka: 2018-07-13
|
| 520 |
3 |
|
|a Sažetak na hrvatskom: U ovom je radu obrađeno podržano učenje kao vrsta strojnog učenja čiji je cilj maksimizirati ukupnu nagradu. Objašnjena je uloga neuronskih mreža u podržanom učenju te proces treniranja neuronskih mreža. U ovom se radu primjena podržanog učenja fokusirala na automatskom igranju igara. Za početak je odabrana jednostavna igra s malim brojem stanja, nazvana FrozenLake, gdje je automatsko igranje ostvareno pomoću algoritma SARSA i Q-učenje sa spremanjem Q-vrijednosti u strukturu nazvanu Q-tablica. Kao primjer složenije igre je odabrana igra FlappyBirds s opcijom da su prepreke pomične. Problem je riješen pomoću Q-učenja aproksimacijom Q-vrijednosti pomoću neuronske mreže. Rezultati algoritama su grafički prikazani i uspoređeni.
|
| 520 |
3 |
|
|a Sažetak na engleskom: This paper describes reinforcement learning as a type of machine learning aimed
at maximizing total reward. It explains the role of neural networks in reinforcement learning and their training process. To start with, a simple game with a small number of
states was chosen, named FrozenLake, where automatic game playing was accomplished with the help of SARSA algorithm and Q-learning where Q-values were stored in
a structure called a Q-table. As an example of a more complex game, the FlappyBirds
game was selected with the option to have moving obstacles. The problem was solved
with the help of Q-learning where Q-values were approximated using neural network.
The results of algorithms are graphically displayed and discussed.
|
| 653 |
|
1 |
|a strojno učenje
|a podržano učenje
|a automatsko igranje igara
|a Markovljev proces odlučivanja
|a Q-učenje
|a SARSA
|a neuronske mreže
|
| 653 |
|
1 |
|a machine learning
|a reinforcement learning
|a automatic game playing
|a Markov decision process
|a Q-learning
|a SARSA
|a neural networks
|
| 700 |
1 |
|
|a Čupić, Marko
|4 ths
|
| 942 |
|
|
|c Z
|
| 999 |
|
|
|c 49901
|d 49901
|