Optičko raspoznavanje glazbe temeljeno na konvolucijskim modelima

Sažetak na hrvatskom: Optičko raspoznavanje glazbe (engl. Optical Music Recognition odnosno OMR) je područje istraživanja fokusirano na ekstrakciju informacija iz slika glazbene notacije (partitura). Ovaj rad započinje kratkim pregledom postojećih istraživanja u području optičkog raspoznavanja glazb...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:49709/Details
Glavni autor: Papež, Luka (-)
Ostali autori: Kalafatić, Zoran (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, L. Papež, 2018.
Predmet:
LEADER 03462na a2200229 4500
003 HR-ZaFER
008 160221s2018 ci ||||| m||| 00| 0 en d
035 |a (HR-ZaFER)ferid5492 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Papež, Luka 
245 1 0 |a Optičko raspoznavanje glazbe temeljeno na konvolucijskim modelima :  |b diplomski rad /  |c Luka Papež ; [mentor Zoran Kalafatić]. 
246 1 |a Optical Music Recognition Based on Convolutional Models  |i Naslov na engleskom:  
260 |a Zagreb,  |b L. Papež,  |c 2018. 
300 |a 51 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2018-06-29, datum završetka: 2018-07-17 
520 3 |a Sažetak na hrvatskom: Optičko raspoznavanje glazbe (engl. Optical Music Recognition odnosno OMR) je područje istraživanja fokusirano na ekstrakciju informacija iz slika glazbene notacije (partitura). Ovaj rad započinje kratkim pregledom postojećih istraživanja u području optičkog raspoznavanja glazbe. Problem transkripcije glazbene notacije u tekst je postavljen kao problem prevođenja jezika te su primjenjene metode strojnog učenja za rješavanje. Prroblemu je pristupljeno s cjelovitim pristupom sustava s-kraja-na-kraj odnosno sustav sam uči funkcionalnost samo iz prezentiranih ulaznih slika i očekivanog izlaza. Radi toga je generiran umjetni skup podataka s visokim brojem uzoraka temeljen na metodi pronađenoj u prethodno objavljenim radovima. Cjeloviti transkripcijski sustav temeljen na enkoder-dekoder arhitekturi neuronskih mreža je implementiran i uspoređen sa srodnim usporednim modelima. Zanimljiva moguća sekundarna primjena razvijenog sustava za spajanje kompresiju ili kompresiju notnih zapisa je prikazana. Rad završava opširnim pregledom mogućih budućih istraživačkih smjerova u području cjelovitih s-kraja-na-kraj transkripcijskih sustava. 
520 3 |a Sažetak na engleskom: Optical Music Recognition (OMR) is a field of research focusing on extracting information from images of music notation (scores). The work begins with short overview of existing OMR research. The problem of score-to-text transcription is posed as a language translation problem and tackled with machine learning techniques. A decision is made to tackle the problem end-to-end meaning that the entire functionality is automatically learned by presenting the system with available input and desired output. To achieve this, a large synthetic dataset of musical scores and their textual description is created using a method based on previous research. An end-to-end OMR transcription system based on a encoder-decoder neural network architecture is implemented and evaluated against related baseline models. Although the system provides some functionality, substantial improvement for real-world application is required. Interesting possible side-applications of developed system for score fusion or compression are presented. The work ends with a large overview of possible future research directions regarding end-to-end OMR systems. 
653 1 |a strojno učenje  |a optičko raspoznavanje glazbe  |a neuronske mreže  |a konvolucijske neuronske mreže  |a rekurzivne neuronske mreže 
653 1 |a machine learning  |a optical music recognition  |a neural networks  |a convolutional neural networks  |a recurrent neural networks 
700 1 |a Kalafatić, Zoran  |4 ths 
942 |c Y 
999 |c 49709  |d 49709