MARC: Uporaba algoritma podržanog učenja u problemima s većim prostorom stanja

Uporaba algoritma podržanog učenja u problemima s većim prostorom stanja

Sažetak na hrvatskom: Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov predstavlja učenje rješavanja problema s velikim prostorom stanja. U ovom se radu razmatra implementacija Q-učenja, algoritma podržanog učenja uz aproksimaciju Q funkcije umjetnom neu...

Full description

Permalink:	http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:48486/Details
Glavni autor:	Dugonjić, Stjepan (-)
Ostali autori:	Čupić, Marko (Thesis advisor)
Vrsta građe:	Drugo
Impresum:	Zagreb, S. Dugonjić, 2017.
Predmet:	Podržano učenje > neuronske mreže > Q-učenje > aproksimacija > velik prostor stanja Reinforcement learning > Q-learning > neural network > approximation > large state-space


LEADER	02139na a2200229 4500
003	HR-ZaFER
008	160221s2017 ci \|\|\|\|\| m\|\|\| 00\| 0 hr d
035			\|a (HR-ZaFER)ferid5899
040			\|a HR-ZaFER \|b hrv \|c HR-ZaFER \|e ppiak
100	1		\|a Dugonjić, Stjepan
245	1	0	\|a Uporaba algoritma podržanog učenja u problemima s većim prostorom stanja : \|b završni rad / \|c Stjepan Dugonjić ; [mentor Marko Čupić].
246	1		\|a Application of reinforcement learning on large state-space problems \|i Naslov na engleskom:
260			\|a Zagreb, \|b S. Dugonjić, \|c 2017.
300			\|a 32 str. ; \|c 30 cm + \|e CD-ROM
502			\|b preddiplomski studij \|c Fakultet elektrotehnike i računarstva u Zagrebu \|g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2017-06-09, datum završetka: 2017-07-13
520	3		\|a Sažetak na hrvatskom: Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov predstavlja učenje rješavanja problema s velikim prostorom stanja. U ovom se radu razmatra implementacija Q-učenja, algoritma podržanog učenja uz aproksimaciju Q funkcije umjetnom neuronskom mrežom. Ispituje se sposobnost takvog sustava na primjeru savladavanja klasične igre Bomberman. Prikazani su i komentirani dobiveni rezultati, uz kratak opis funkcionalnosti razvijenog grafičkog sučelja.
520	3		\|a Sažetak na engleskom: Development of self-learning systems is one of the key aspects of computer science. Most challenging problems are ones where the state-space domain size is astronomically large. This thesis covers implementation of Q-learning, a reinforcement learning algorithm with non-linear Q function approximation using artificial neural networks. Capabilities of the algorithm are tested on the classic game Bomberman. Results are shown and commented, and short description of developed graphical user interface is presented.
653		1	\|a Podržano učenje \|a neuronske mreže \|a Q-učenje \|a aproksimacija \|a velik prostor stanja
653		1	\|a Reinforcement learning \|a Q-learning \|a neural network \|a approximation \|a large state-space
700	1		\|a Čupić, Marko \|4 ths
942			\|c Z
999			\|c 48486 \|d 48486

Uporaba algoritma podržanog učenja u problemima s većim prostorom stanja

Slični primjerci