MARC: Identifikacija višerječnih izraza zasnovana na kombinaciji jezičnih značajki

Identifikacija višerječnih izraza zasnovana na kombinaciji jezičnih značajki

Sažetak na hrvatskom: Višerječni izrazi čine značajan udio vokabulara prirodnoga jezika, no zbog specifičnosti i nepredvidivosti obilježja, iziskuju posebnu pažnju pri razvoju sustava za automatsku identifikaciju izraza u sklopu računalne obrade prirodnog jezika. U sklopu ovoga rada, razvijen je i p...

Full description

Permalink:	http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:48280/Details
Glavni autor:	Buljan, Maja (-)
Ostali autori:	Šnajder, Jan (Thesis advisor)
Vrsta građe:	Drugo
Impresum:	Zagreb, M. Buljan, 2016.
Predmet:	obrada prirodnog jezika > višerječni izrazi > Bayesova mreža > hrvatski jezik natural language processing > multiword expressions > Bayesian networks


LEADER	02507na a2200229 4500
003	HR-ZaFER
008	160221s2016 ci \|\|\|\|\| m\|\|\| 00\| 0 hr d
035			\|a (HR-ZaFER)ferid4179
040			\|a HR-ZaFER \|b hrv \|c HR-ZaFER \|e ppiak
100	1		\|a Buljan, Maja
245	1	0	\|a Identifikacija višerječnih izraza zasnovana na kombinaciji jezičnih značajki : \|b diplomski rad / \|c Maja Buljan ; [mentor Jan Šnajder].
246	1		\|a Multiword Identification Based on the Combination of Linguistic Features \|i Naslov na engleskom:
260			\|a Zagreb, \|b M. Buljan, \|c 2016.
300			\|a 52 str. ; \|c 30 cm + \|e CD-ROM
502			\|b diplomski studij \|c Fakultet elektrotehnike i računarstva u Zagrebu \|g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2016-07-01, datum završetka: 2016-07-04
520	3		\|a Sažetak na hrvatskom: Višerječni izrazi čine značajan udio vokabulara prirodnoga jezika, no zbog specifičnosti i nepredvidivosti obilježja, iziskuju posebnu pažnju pri razvoju sustava za automatsku identifikaciju izraza u sklopu računalne obrade prirodnog jezika. U sklopu ovoga rada, razvijen je i predstavljen sustav za identifikaciju višerječnih izraza koji iz hrvatskog korpusa tekstova ekstrahira i klasificira potencijalne višerječne izraze kombinacijom statističkih mjera i lingvističkih značajki specifičnih za višerječne izraze. Opisan je izračun vrijednosti značajki, struktura Bayesove mreže za klasifikaciju i rezultati vrednovanja u ovisnosti o određivanju zavisnosti među značajkama.
520	3		\|a Sažetak na engleskom: Multiword expressions constitute a significant portion of any natural language vocabulary, but due to their characteristic idiosyncrasy, MWEs call for particular dedication in the development of applications for automatic identification, within the scope of automated natural language processing. In this thesis, we develop and present a multiword expression identification system that extracts and classifies potential MWEs through a combination of statistical measures and linguistic features specific to MWEs. We describe the computation of feature values and the structure of the Bayesian network used in classification, and present evaluation results relative to different dependency relations between features.
653		1	\|a obrada prirodnog jezika \|a višerječni izrazi \|a Bayesova mreža \|a hrvatski jezik
653		1	\|a natural language processing \|a multiword expressions \|a Bayesian networks
700	1		\|a Šnajder, Jan \|4 ths
942			\|c Y
999			\|c 48280 \|d 48280

Identifikacija višerječnih izraza zasnovana na kombinaciji jezičnih značajki

Slični primjerci