Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive
Članak daje pregled obradbe hrvatskih korpusa. Navode se najznačajniji korpusni projekti od prvoga hrvatskoga računalno podržanoga korpusa - Gundulićev Osman (Bujas 1967), preko Moguševa milijunskoga korpusa do današnjih dana. Nadalje se rad usredotočuje na Hrvatski nacionalni korpus koji je središn...
Permalink: | http://skupnikatalog.nsk.hr/Record/ffzg.KOHA-OAI-FFZG:305289/Details |
---|---|
Matična publikacija: |
Suvremena lingvistika 23 (1997), 43-44 ; str. 387-394 |
Glavni autor: | Tadić, Marko (-) |
Vrsta građe: | Članak |
Jezik: | hrv |
LEADER | 01881naa a2200241uu 4500 | ||
---|---|---|---|
008 | 131105s1997 xx hrv|d | ||
022 | |a 0586-0296 | ||
035 | |a (CROSBI)69625 | ||
040 | |a HR-ZaFF |b hrv |c HR-ZaFF |e ppiak | ||
100 | 1 | |a Tadić, Marko | |
245 | 1 | 0 | |a Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive / |c Tadić, Marko. |
246 | 3 | |i Naslov na engleskom: |a Croatian Corpus Processing: History, State of the Art and Perspectives | |
300 | |a 387-394 |f str. | ||
363 | |a 23 |b 43-44 |i 1997 | ||
520 | |a Članak daje pregled obradbe hrvatskih korpusa. Navode se najznačajniji korpusni projekti od prvoga hrvatskoga računalno podržanoga korpusa - Gundulićev Osman (Bujas 1967), preko Moguševa milijunskoga korpusa do današnjih dana. Nadalje se rad usredotočuje na Hrvatski nacionalni korpus koji je središnji projekt na području korpusne lingvistike u Hrvatskoj danas. Hrvatski nacionalni korpus (Tadić 1996) čine dvije sastavnice: 1) reprezentativni 30-milijunski korpus suvremenoga hrvatskoga jezika (30M) i 2) Hrvatski elektronski tekstovni arhiv (HETA). U prvoj fazi sastavljanja Hrvatskoga nacionalnoga korpusa naglasak je na zaokruživanju 30-milijunskoga korpusa dok će se u drugoj fazi sav napor preusmjeriti na širenje obuhvata Hrvatskoga elektronskog tekstovnoga arhiva. U sadašnjem stanju rad na 30-milijunski korpusu, koji bi trebao biti završen 2000, u fazi je uznapredovala planiranja i javnoga testiranja probne inačice korpusa (7, 68 milijuna pojavnica) putem WWW-a. | ||
536 | |a Projekt MZOS |f 130718 | ||
546 | |a HRV | ||
690 | |a 6.03 | ||
693 | |a korpusna lingvistika, korpus, hrvatski jezik |l hrv |2 crosbi | ||
693 | |a corpus linguistics, corpus, Croatian language |l eng |2 crosbi | ||
773 | 0 | |t Suvremena lingvistika |x 0586-0296 |g 23 (1997), 43-44 ; str. 387-394 | |
942 | |c CLA |t 1.04 |u 1 |z Strucni - clanak | ||
999 | |c 305289 |d 305287 |