|
|
|
|
LEADER |
02891na a2200241 4500 |
003 |
HR-ZaFER |
005 |
20160516012011.0 |
008 |
160221s2014 ci ||||| m||| 00| 0 en d |
035 |
|
|
|a (HR-ZaFER)ferid1227
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Skukan, Luka
|9 35737
|
245 |
|
|
|a Označavanje vremenskih izraza u tekstovima na hrvatskome jeziku :
|b završni rad /
|c Luka Skukan ; [mentor Jan Šnajder].
|
246 |
1 |
|
|a Temporal Expression Tagging for Croatian Texts
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b L. Skukan,
|c 2014.
|
300 |
|
|
|a 37 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b preddiplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 39, datum predaje: 2014-06-13, datum završetka: 2014-07-14
|
520 |
3 |
|
|a Sažetak na hrvatskom: Označavanje vremenskih izraza u zadnje je vrijeme postalo jedno od fokusa obrade prirodnog jezika. Ono se sastoji od identifikacije vremenskih izraza i njihove normalizacije u kanonski oblik. Nedavni uspjesi označivaća baziranih na pravilima, a posebno sustava HeidelTime, kao i nedostatak uspješnih označivaća za hrvatski jezik, potaknuli su oblikovanje skupa pravila za hrvatski za HeidelTime. Stvoren je i korpus sastavljen od članaka s hrvatske Wikipedije baziranih na člancima o ratovima. Korpus je anotiran TIMEX3 oznakama, a njegova je svrha bila pomoć u razvoju skupa pravila, ali otvara i mogućnost korištenja za druge alate i svrhe. Implementacija pravila za hrvatski postigla je rezultate uspredive s rezultatima implementacija za druge jezike, a korpus WikiWarsHR usporediv je sa sličnim korpusima na drugim jezicima po duljini i broju označenih vremenskih izraza.
|
520 |
3 |
|
|a Sažetak na engleskom: Temporal expression extraction has recently become a popular field of natural language processing. This task consists of locating temporal expressions and normalising them into a canonical form. Recent successes achieved by rule-based temporal taggers, HeidelTime in particular, and a lack of a good temporal tagger for Croatian have inspired the construction of HeidelTime rule set for the Croatian language. Additionally, WikiWarsHR, a corpus of Wikipedia-based historical narratives tagged with TIMEX3, has been developed, both for the purpose of developing the HeidelTime rule set and for future use. Results achieved by the Croatian implementation of HeidelTime are comparable to implementations for other languages, while WikiWarsHR is close in size and density of tags to other publicly available corpora.
|
653 |
|
1 |
|a TimeML
|a TIMEX3
|a označavanja bazirano na pravilima
|a normalizacija vremenskih izraza
|a obrada prirodnog jezika
|
653 |
|
1 |
|a TimeML
|a TIMEX3
|a rule-based tagging
|a temporal expression normalisation
|a natural language processing
|
700 |
1 |
|
|a Šnajder, Jan
|4 ths
|9 19016
|
942 |
|
|
|c Z
|2 udc
|
999 |
|
|
|c 45188
|d 45188
|