Primjena metoda dubinske analize teksta na kategorizaciju novinskih članaka

Sažetak na hrvatskom: U ovom radu obrađena je dubinska analiza teksta na studijskom primjeru kategorizacije novinskih članaka Novog Lista. Problem je podijeljen u tri djela: dohvat, pripremu i obradu teksta. U dohvatu obrađeni su izvori informacija te je rečeno da su novinski članci dobar izvor poda...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:48721/Details
Glavni autor: Injac, Robert (-)
Ostali autori: Pintar, Damir (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, R. Injac, 2017.
Predmet:
LEADER 02417na a2200229 4500
003 HR-ZaFER
008 160221s2017 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid5930 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Injac, Robert 
245 1 0 |a Primjena metoda dubinske analize teksta na kategorizaciju novinskih članaka :  |b završni rad /  |c Robert Injac ; [mentor Damir Pintar]. 
246 1 |a Application of Text Mining Methods for Newspaper Article Categorization  |i Naslov na engleskom:  
260 |a Zagreb,  |b R. Injac,  |c 2017. 
300 |a 28 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2017-06-09, datum završetka: 2017-07-10 
520 3 |a Sažetak na hrvatskom: U ovom radu obrađena je dubinska analiza teksta na studijskom primjeru kategorizacije novinskih članaka Novog Lista. Problem je podijeljen u tri djela: dohvat, pripremu i obradu teksta. U dohvatu obrađeni su izvori informacija te je rečeno da su novinski članci dobar izvor podataka. U pripremi dobiveni članci su korjenovani, izbačene su zaustavne riječi i strukturirani su u format pogodan za obradu. Kod obrade teksta obrađen je algoritam stroja potpornih vektora, i pomoću njega članci su klasificirani. Rezultati klasifikacije su analizirani i prihvaćeni kao vrlo dobri. 
520 3 |a Sažetak na engleskom: In this thesis text mining methods are explained and applied on the example of newspaper article categorization. The problem was divided in three parts: retrieval, preparation and processing of text. For retrieval, the information sources were detailed and the articles were accepted as a valid source of data. For preparation, the articles were stemmed, the stop words were removed and the articles were converted into a format ready for processing. In processing, the support vector machine was explained and used to classify the articles. The results of the classification were analysed and accepted as very good. 
653 1 |a dubinska analiza teksta  |a dohvat informacija  |a klasifikacija teksta  |a kategorizacija novinskih članaka  |a strojno učenje  |a stroj potpornih vektora 
653 1 |a text mining  |a information retrieval  |a text classification  |a news article categorization  |a machine learning  |a support vector machine 
700 1 |a Pintar, Damir  |4 ths 
942 |c Z 
999 |c 48721  |d 48721