|
|
|
|
| LEADER |
02139na a2200229 4500 |
| 003 |
HR-ZaFER |
| 008 |
160221s2017 ci ||||| m||| 00| 0 hr d |
| 035 |
|
|
|a (HR-ZaFER)ferid5899
|
| 040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
| 100 |
1 |
|
|a Dugonjić, Stjepan
|
| 245 |
1 |
0 |
|a Uporaba algoritma podržanog učenja u problemima s većim prostorom stanja :
|b završni rad /
|c Stjepan Dugonjić ; [mentor Marko Čupić].
|
| 246 |
1 |
|
|a Application of reinforcement learning on large state-space problems
|i Naslov na engleskom:
|
| 260 |
|
|
|a Zagreb,
|b S. Dugonjić,
|c 2017.
|
| 300 |
|
|
|a 32 str. ;
|c 30 cm +
|e CD-ROM
|
| 502 |
|
|
|b preddiplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2017-06-09, datum završetka: 2017-07-13
|
| 520 |
3 |
|
|a Sažetak na hrvatskom: Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov predstavlja učenje rješavanja problema s velikim prostorom stanja. U ovom se radu razmatra implementacija Q-učenja, algoritma podržanog učenja uz aproksimaciju Q funkcije umjetnom neuronskom mrežom. Ispituje se sposobnost takvog sustava na primjeru savladavanja klasične igre Bomberman. Prikazani su i komentirani dobiveni rezultati, uz kratak opis funkcionalnosti razvijenog grafičkog sučelja.
|
| 520 |
3 |
|
|a Sažetak na engleskom: Development of self-learning systems is one of the key aspects of computer science. Most challenging problems are ones where the state-space domain size is astronomically large. This thesis covers implementation of Q-learning, a reinforcement learning algorithm with non-linear Q function approximation using artificial neural networks. Capabilities of the algorithm are tested on the classic game Bomberman. Results are shown and commented, and short description of developed graphical user interface is presented.
|
| 653 |
|
1 |
|a Podržano učenje
|a neuronske mreže
|a Q-učenje
|a aproksimacija
|a velik prostor stanja
|
| 653 |
|
1 |
|a Reinforcement learning
|a Q-learning
|a neural network
|a approximation
|a large state-space
|
| 700 |
1 |
|
|a Čupić, Marko
|4 ths
|
| 942 |
|
|
|c Z
|
| 999 |
|
|
|c 48486
|d 48486
|