|
|
|
|
LEADER |
03609na a2200241 4500 |
003 |
HR-ZaFER |
005 |
20160621142226.0 |
008 |
160221s2015 ci ||||| m||| 00| 0 hr d |
035 |
|
|
|a (HR-ZaFER)ferid2360
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Dolović, Dino
|9 37253
|
245 |
1 |
0 |
|a Model za analizu sentimenta u tvitovima na hrvatskome jeziku :
|b diplomski rad /
|c Dino Dolović ; [mentor Jan Šnajder].
|
246 |
1 |
|
|a Sentiment Analysis in Tweets in Croatian Language
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b D. Dolović,
|c 2015.
|
300 |
|
|
|a 50 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b diplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2015-06-30, datum završetka: 2015-07-14
|
520 |
3 |
|
|a Sažetak na hrvatskom: Blogovi, recenzije proizvoda, korisnički generirane poruke poput tvitova i ostali pisani tekstovi ogroman su izvor informacija i znanja. Takvi tekstovi i poruke u velikoj većini slučajeva iznose mišljenja i stavove autora o nečemu ili nekome. Agregacijom takvih mišljenja te njihovom automatskom obradom, odnosno analizom, uvelike se može doprinijeti osobama od interesa, najčešće poslovnim entitetima. Analiza sentimenta ili mišljenja zadatak je iz područja obrade prirodnog jezika te je predmet ovog diplomskog rada.
U okviru ovog diplomskog rada proučeni su postupci za analizu sentimenta u mikroblogovima, s naglaskom na metode temeljene na nadziranom strojnom učenju. Provedeno je označavanje određenog skupa podataka, kojeg čine tvitovi koji se odnose na domenu dvaju pjevačkih emisija: The Voice te X Factor Adria. Nadalje, razvijen je model za analizu sentimenta u tvitovima na hrvatskome jeziku temeljen na nadziranom strojnom učenju koji omogućuje klasifikaciju tvita na razini cijele poruke. Provedeno je iscrpno vrednovanje na odgovarajućem skupu podataka, uključujući i analizu značajki. Dobiveni rezultati usporedivi su s rezultatima dobivenim na natjecanju SemEval-2013, uz postignutu F-micro mjeru od 87%, odnosno F-macro od 71%.
|
520 |
3 |
|
|a Sažetak na engleskom: Blogs, product reviews, user generated content such as tweet messages and other written texts are huge source of information and knowledge. Such texts and messages are full of users' opinions and their attitudes towards something or someone. One can significantly contribute to the entities that were mentioned, which are mostly in business related domains, by aggregating and automatically analysing such opinions and attitudes. Sentiment analysis is a task in natural language processing and is studied in this thesis.
In this research, certain approaches have been studied that consider sentiment analysis in microblogs, focusing on supervised machine learning techniques. A sample of data was annotated, which consisted of tweets in Croatian about two popular music shows: The Voice and X Factor Adria. A system based on the supervised machine learning technique was implemented in order to classify the tweet into one possible sentiment class considering the whole tweet message. The implemented system was then evaluated and yielded results that could be measured with those achieved at SemEval-2013 competition, producing the F-micro of 87% and the F-macro of 71%.
|
653 |
|
1 |
|a Analiza sentimenta, analiza mišljenja, mikroblogovi, Twitter, tvit, nadzirano strojno učenje, hrvatski jezik
|
653 |
|
1 |
|a Sentiment analysis, opinion mining, microblogs, Twitter, tweet, supervised machine learning, Croatian
|
700 |
1 |
|
|a Šnajder, Jan
|4 ths
|9 19016
|
942 |
|
|
|c Y
|2 udc
|
999 |
|
|
|c 46429
|d 46429
|