Identifikacija višerječnih izraza zasnovana na kombinaciji jezičnih značajki

Sažetak na hrvatskom: Višerječni izrazi čine značajan udio vokabulara prirodnoga jezika, no zbog specifičnosti i nepredvidivosti obilježja, iziskuju posebnu pažnju pri razvoju sustava za automatsku identifikaciju izraza u sklopu računalne obrade prirodnog jezika. U sklopu ovoga rada, razvijen je i p...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:48280/Details
Glavni autor: Buljan, Maja (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, M. Buljan, 2016.
Predmet:
LEADER 02507na a2200229 4500
003 HR-ZaFER
008 160221s2016 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid4179 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Buljan, Maja 
245 1 0 |a Identifikacija višerječnih izraza zasnovana na kombinaciji jezičnih značajki :  |b diplomski rad /  |c Maja Buljan ; [mentor Jan Šnajder]. 
246 1 |a Multiword Identification Based on the Combination of Linguistic Features  |i Naslov na engleskom:  
260 |a Zagreb,  |b M. Buljan,  |c 2016. 
300 |a 52 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2016-07-01, datum završetka: 2016-07-04 
520 3 |a Sažetak na hrvatskom: Višerječni izrazi čine značajan udio vokabulara prirodnoga jezika, no zbog specifičnosti i nepredvidivosti obilježja, iziskuju posebnu pažnju pri razvoju sustava za automatsku identifikaciju izraza u sklopu računalne obrade prirodnog jezika. U sklopu ovoga rada, razvijen je i predstavljen sustav za identifikaciju višerječnih izraza koji iz hrvatskog korpusa tekstova ekstrahira i klasificira potencijalne višerječne izraze kombinacijom statističkih mjera i lingvističkih značajki specifičnih za višerječne izraze. Opisan je izračun vrijednosti značajki, struktura Bayesove mreže za klasifikaciju i rezultati vrednovanja u ovisnosti o određivanju zavisnosti među značajkama. 
520 3 |a Sažetak na engleskom: Multiword expressions constitute a significant portion of any natural language vocabulary, but due to their characteristic idiosyncrasy, MWEs call for particular dedication in the development of applications for automatic identification, within the scope of automated natural language processing. In this thesis, we develop and present a multiword expression identification system that extracts and classifies potential MWEs through a combination of statistical measures and linguistic features specific to MWEs. We describe the computation of feature values and the structure of the Bayesian network used in classification, and present evaluation results relative to different dependency relations between features. 
653 1 |a obrada prirodnog jezika  |a višerječni izrazi  |a Bayesova mreža  |a hrvatski jezik 
653 1 |a natural language processing  |a multiword expressions  |a Bayesian networks 
700 1 |a Šnajder, Jan  |4 ths 
942 |c Y 
999 |c 48280  |d 48280