Nenadzirano učenje značajki govora korištenjem neuronskih mreža baziranih na autoenkoderskim arhitekturama

Sažetak na hrvatskom: Nenadzirano učenje značajki i nižedimenzionalnih reprezentacija podataka nalazi primjene u strojnom učenju, kompresiji s gubitkom i sl. Postojeće metode poput analize osnovnih komponenata (PCA) se često baziraju na linearnim transformacijama podataka, dok su modernije metode ba...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:49498/Details
Glavni autor: Murn, Luka (-)
Ostali autori: Petrinović, Davor (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, L. Murn, 2018.
Predmet:
LEADER 02953na a2200229 4500
003 HR-ZaFER
008 160221s2018 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid5230 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Murn, Luka 
245 1 0 |a Nenadzirano učenje značajki govora korištenjem neuronskih mreža baziranih na autoenkoderskim arhitekturama :  |b diplomski rad /  |c Luka Murn ; [mentor Davor Petrinović]. 
246 1 |a Unsupervised Speech Feature Learning Using Autoencoder-Based Neural Network Architectures  |i Naslov na engleskom:  
260 |a Zagreb,  |b L. Murn,  |c 2018. 
300 |a 44 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Obradba informacija, šifra smjera: 51, datum predaje: 2018-06-29, datum završetka: 2018-07-12 
520 3 |a Sažetak na hrvatskom: Nenadzirano učenje značajki i nižedimenzionalnih reprezentacija podataka nalazi primjene u strojnom učenju, kompresiji s gubitkom i sl. Postojeće metode poput analize osnovnih komponenata (PCA) se često baziraju na linearnim transformacijama podataka, dok su modernije metode bazirane na neuronskim mrežama bolje opremljene za prepoznavanje nelinearnih odnosa u podacima. U okviru diplomskog rada implementiran je sustav za nenadzirano učenje značajki govora korištenjem rijetke autoenkoderske arhitekture neuronskih mreža. Dodatno, evaluirana je implementacija nad klasičnim problemom afektivnog računarstva (prepoznavanje emocija), uz korištenje učenja s prijenosom značajki (engl. feature transfer learning). Diskutirana je optimalna arhitektura mreže s obzirom na aktivacijsku funkciju i broj trening epoha i uspoređeni su rezultati s GeMAPS značajkama iz openSMILE alata. 
520 3 |a Sažetak na engleskom: Unsupervised feature learning and lower dimensional data representation finds application in machine learning, lossy compression, etc. Existing methods such as Principal Component Analysis (PCA) are often based on linear data transformations, while more modern methods based on neural networks are better equipped for detecting non-linear relationships in datasets. In this graduate thesis, a system for unsupervised learning of speech features was implemented, using a neural network based on a sparse autoencoder architecture. In addition, the implementation of the classical problem of emotion recognition in affective computing was evaluated, along with the use of feature transfer learning. The optimal network architecture was discussed with regards to the activation functions and number of training epochs and the results were compared with GeMAPS features from the openSMILE toolkit. 
653 1 |a govor, glas, učenje značajki, nenadzirano učenje, neuronske mreže, autoenkoderi 
653 1 |a speech, voice, feature learning, unsupervised learning, neural networks, autoencoders  
700 1 |a Petrinović, Davor  |4 ths 
942 |c Y 
999 |c 49498  |d 49498