Izrada 3D-igre s računalno upravljanim igračima

Sažetak na hrvatskom: Algoritam SARSA-lambda pripada skupini algoritama potpornog učenja, grani strojnog učenja, čija je svrha da agenti nauče samostalno obavljati neki zadatak. Algoritmom SARSA-lambda, agenti uče Q-vrijednosti za parove stanje-akcije te pomoću tih vrijednosti procjenjuju koju je ak...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:48042/Details
Glavni autor: Badak, Silvestar (-)
Ostali autori: Čupić, Marko (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, S. Badak, 2017.
Predmet:
LEADER 02085na a2200229 4500
003 HR-ZaFER
008 160221s2017 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid5131 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Badak, Silvestar 
245 1 0 |a Izrada 3D-igre s računalno upravljanim igračima :  |b diplomski rad /  |c Silvestar Badak ; [mentor Marko Čupić]. 
246 1 |a Development of 3D Game with Computer-Controlled Players  |i Naslov na engleskom:  
260 |a Zagreb,  |b S. Badak,  |c 2017. 
300 |a 41 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2017-06-29, datum završetka: 2017-07-03 
520 3 |a Sažetak na hrvatskom: Algoritam SARSA-lambda pripada skupini algoritama potpornog učenja, grani strojnog učenja, čija je svrha da agenti nauče samostalno obavljati neki zadatak. Algoritmom SARSA-lambda, agenti uče Q-vrijednosti za parove stanje-akcije te pomoću tih vrijednosti procjenjuju koju je akciju dobro obaviti u nekom stanju. Na temelju tih Q-vrijednosti, agent uporabom politike izabire jednu od akcija kada se nalaze u određenom stanju. Akcije, koje se mogu odabrati u nekom stanju, ovise o trenutnoj strategiji koja se primjenjuje. 
520 3 |a Sažetak na engleskom: SARSA-lambda algorithm is a reinforcement learning algorithm, type of machine learning. Goal of the algorithm is to learn agents how to perform tasks independently, without human supervision. In a SARSA-lambda algorithm, agents learn Q-values for state-action pairs and estimate which action is good in which state. Taking into account Q-values, agents using some policy choose one action when they are in the given state. Actions which agent can perform in each state depend on current strategy that is in the use. 
653 1 |a SARSA-lambda  |a potporno učenje  |a strojno učenje  |a unity  |a FPS-igra 
653 1 |a SARSA-lambda  |a reinforcement learning  |a machine learning  |a unity  |a FPS-game 
700 1 |a Čupić, Marko  |4 ths 
942 |c Y 
999 |c 48042  |d 48042