Postupci prilagodbe domeni za analizu sentimenta u tekstu

Sažetak na hrvatskom: Uobičajeni pristup izgradnji sustava za analizu sentimenta temelji se na klasifikaciji sentimenta korištenjem algoritama nadziranog strojnog učenja. Da bi takav sustav radio dobro, dokumenti, čiji sentiment će naučeni klasifikator predviđati, trebali bi biti iz iste domene kao...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:49646/Details
Glavni autor: Paradžik, Matej (-)
Ostali autori: Šnajder, Jan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, M. Paradžik, 2017.
Predmet:
LEADER 03254na a2200229 4500
003 HR-ZaFER
008 160221s2017 ci ||||| m||| 00| 0 en d
035 |a (HR-ZaFER)ferid4828 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Paradžik, Matej 
245 1 0 |a Postupci prilagodbe domeni za analizu sentimenta u tekstu :  |b diplomski rad /  |c Matej Paradžik ; [mentor Jan Šnajder]. 
246 1 |a Domain Adaptation for Sentiment Analysis from Text  |i Naslov na engleskom:  
260 |a Zagreb,  |b M. Paradžik,  |c 2017. 
300 |a 46 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2017-06-29, datum završetka: 2017-07-13 
520 3 |a Sažetak na hrvatskom: Uobičajeni pristup izgradnji sustava za analizu sentimenta temelji se na klasifikaciji sentimenta korištenjem algoritama nadziranog strojnog učenja. Da bi takav sustav radio dobro, dokumenti, čiji sentiment će naučeni klasifikator predviđati, trebali bi biti iz iste domene kao i dokumenti na kojima je klasifikator učen. Umjesto skupog označavanja dokumenata za svaku novu domenu, moguće je iskoristiti postojeće označene dokumente iz neke druge domene i primijeniti neki postupak prilagodbe domeni. U ovom radu proučeni su postupci prilagodbe domeni temeljeni na dodjeljivanju težina (engl. instance weighting) i postupci temeljeni na promjeni prostora značajki (engl. change of representation). Proučeni postupci iskorišteni su za prilagodbu domene pri učenju klasifikatora sentimenta temeljenog na stroju potpornih vektora. Postupci prilagodbe domene eksperimentalno su vrednovani pri izgradnji klasifikatora sentimenta za hrvatski i engleski jezik. Kao najbolji postupak za prilagodbu domene pokazala se primjena marginaliziranih odšumljavajućih naslaganih autoenkodera (engl. marginalized denoising stacked autoencoders). 
520 3 |a Sažetak na engleskom: Typical sentiment analysis systems are based on supervised classification algorithms which, in order to work well, assume that documents used for training of a classifier come from the same domain as documents sentiment of which classifier will be used to predict. In order to alleviate the need for labeling documents for each new domain of interest, domain adaptation techniques can be used with already available documents from some different domain. This thesis studies several domain adaptation techniques based on instance weighting and change of representation. The studied techniques were used for building domain-adapted sentiment classifiers based on linear support vector machine. The performance of domain-adapted classifiers was experimentally evaluated on texts in Croatian and English languages. Using domain adaptation technique based on marginalized denoising stacked autoencoders gave the best results across all domain adaptation tasks in both languages. 
653 1 |a obrada prirodnog jezika  |a analiza sentimenta  |a prilagodba domeni  |a klasifikacija sentimenta  |a hrvatski jezik 
653 1 |a natural language processing  |a sentiment analysis  |a domain adaptation  |a cross-domain sentiment analysis  |a Croatian language 
700 1 |a Šnajder, Jan  |4 ths 
942 |c Y 
999 |c 49646  |d 49646