Označavanje vremenskih izraza u tekstovima na hrvatskome jeziku

Sažetak na hrvatskom: Označavanje vremenskih izraza u zadnje je vrijeme postalo jedno od fokusa obrade prirodnog jezika. Ono se sastoji od identifikacije vremenskih izraza i njihove normalizacije u kanonski oblik. Nedavni uspjesi označivaća baziranih na pravilima, a posebno sustava HeidelTime, kao i...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:45188/Details
Glavni autor: Skukan, Luka (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, L. Skukan, 2014.
Predmet:
LEADER 02891na a2200241 4500
003 HR-ZaFER
005 20160516012011.0
008 160221s2014 ci ||||| m||| 00| 0 en d
035 |a (HR-ZaFER)ferid1227 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Skukan, Luka  |9 35737 
245 |a Označavanje vremenskih izraza u tekstovima na hrvatskome jeziku :  |b završni rad /  |c Luka Skukan ; [mentor Jan Šnajder]. 
246 1 |a Temporal Expression Tagging for Croatian Texts  |i Naslov na engleskom:  
260 |a Zagreb,  |b L. Skukan,  |c 2014. 
300 |a 37 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 39, datum predaje: 2014-06-13, datum završetka: 2014-07-14 
520 3 |a Sažetak na hrvatskom: Označavanje vremenskih izraza u zadnje je vrijeme postalo jedno od fokusa obrade prirodnog jezika. Ono se sastoji od identifikacije vremenskih izraza i njihove normalizacije u kanonski oblik. Nedavni uspjesi označivaća baziranih na pravilima, a posebno sustava HeidelTime, kao i nedostatak uspješnih označivaća za hrvatski jezik, potaknuli su oblikovanje skupa pravila za hrvatski za HeidelTime. Stvoren je i korpus sastavljen od članaka s hrvatske Wikipedije baziranih na člancima o ratovima. Korpus je anotiran TIMEX3 oznakama, a njegova je svrha bila pomoć u razvoju skupa pravila, ali otvara i mogućnost korištenja za druge alate i svrhe. Implementacija pravila za hrvatski postigla je rezultate uspredive s rezultatima implementacija za druge jezike, a korpus WikiWarsHR usporediv je sa sličnim korpusima na drugim jezicima po duljini i broju označenih vremenskih izraza. 
520 3 |a Sažetak na engleskom: Temporal expression extraction has recently become a popular field of natural language processing. This task consists of locating temporal expressions and normalising them into a canonical form. Recent successes achieved by rule-based temporal taggers, HeidelTime in particular, and a lack of a good temporal tagger for Croatian have inspired the construction of HeidelTime rule set for the Croatian language. Additionally, WikiWarsHR, a corpus of Wikipedia-based historical narratives tagged with TIMEX3, has been developed, both for the purpose of developing the HeidelTime rule set and for future use. Results achieved by the Croatian implementation of HeidelTime are comparable to implementations for other languages, while WikiWarsHR is close in size and density of tags to other publicly available corpora. 
653 1 |a TimeML  |a TIMEX3  |a označavanja bazirano na pravilima  |a normalizacija vremenskih izraza  |a obrada prirodnog jezika 
653 1 |a TimeML  |a TIMEX3  |a rule-based tagging  |a temporal expression normalisation  |a natural language processing 
700 1 |a Šnajder, Jan  |4 ths  |9 19016 
942 |c Z  |2 udc 
999 |c 45188  |d 45188