Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive

Članak daje pregled obradbe hrvatskih korpusa. Navode se najznačajniji korpusni projekti od prvoga hrvatskoga računalno podržanoga korpusa - Gundulićev Osman (Bujas 1967), preko Moguševa milijunskoga korpusa do današnjih dana. Nadalje se rad usredotočuje na Hrvatski nacionalni korpus koji je središn...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/ffzg.KOHA-OAI-FFZG:305289/Details
Matična publikacija: Suvremena lingvistika
23 (1997), 43-44 ; str. 387-394
Glavni autor: Tadić, Marko (-)
Vrsta građe: Članak
Jezik: hrv
LEADER 01881naa a2200241uu 4500
008 131105s1997 xx hrv|d
022 |a 0586-0296 
035 |a (CROSBI)69625 
040 |a HR-ZaFF  |b hrv  |c HR-ZaFF  |e ppiak 
100 1 |a Tadić, Marko 
245 1 0 |a Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive /  |c Tadić, Marko. 
246 3 |i Naslov na engleskom:  |a Croatian Corpus Processing: History, State of the Art and Perspectives 
300 |a 387-394  |f str. 
363 |a 23  |b 43-44  |i 1997 
520 |a Članak daje pregled obradbe hrvatskih korpusa. Navode se najznačajniji korpusni projekti od prvoga hrvatskoga računalno podržanoga korpusa - Gundulićev Osman (Bujas 1967), preko Moguševa milijunskoga korpusa do današnjih dana. Nadalje se rad usredotočuje na Hrvatski nacionalni korpus koji je središnji projekt na području korpusne lingvistike u Hrvatskoj danas. Hrvatski nacionalni korpus (Tadić 1996) čine dvije sastavnice: 1) reprezentativni 30-milijunski korpus suvremenoga hrvatskoga jezika (30M) i 2) Hrvatski elektronski tekstovni arhiv (HETA). U prvoj fazi sastavljanja Hrvatskoga nacionalnoga korpusa naglasak je na zaokruživanju 30-milijunskoga korpusa dok će se u drugoj fazi sav napor preusmjeriti na širenje obuhvata Hrvatskoga elektronskog tekstovnoga arhiva. U sadašnjem stanju rad na 30-milijunski korpusu, koji bi trebao biti završen 2000, u fazi je uznapredovala planiranja i javnoga testiranja probne inačice korpusa (7, 68 milijuna pojavnica) putem WWW-a. 
536 |a Projekt MZOS  |f 130718 
546 |a HRV 
690 |a 6.03 
693 |a korpusna lingvistika, korpus, hrvatski jezik  |l hrv  |2 crosbi 
693 |a corpus linguistics, corpus, Croatian language  |l eng  |2 crosbi 
773 0 |t Suvremena lingvistika  |x 0586-0296  |g 23 (1997), 43-44 ; str. 387-394 
942 |c CLA  |t 1.04  |u 1  |z Strucni - clanak 
999 |c 305289  |d 305287