Semantičko pretraživanje tekstualnih baza znanja u poslovnoj domeni

Sažetak na hrvatskom: Za izvlačenje korisnih informacija iz velike količine podataka potrebne su sofisticirane metode pretraživanja podataka. U slučaju sustava odgovaranja na upit potrebne su metode obrade upita, dohvaćanja podataka i odabira prikladnog odgovora. Ovaj rad bavi se izvlačenjem rečenic...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:50934/Details
Glavni autor: Bejuk, Borna (-)
Ostali autori: Pintar, Damir (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, B. Bejuk, 2019.
Predmet:
LEADER 02647na a2200229 4500
003 HR-ZaFER
008 160221s2019 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid6556 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Bejuk, Borna  |9 39775 
245 1 0 |a Semantičko pretraživanje tekstualnih baza znanja u poslovnoj domeni :  |b diplomski rad /  |c Borna Bejuk ; [mentor Damir Pintar]. 
246 1 |a Semantic Search of Text-based Knowledge Repositories in Business Domains  |i Naslov na engleskom:  
260 |a Zagreb,  |b B. Bejuk,  |c 2019. 
300 |a 36 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2019-06-28, datum završetka: 2019-07-09 
520 3 |a Sažetak na hrvatskom: Za izvlačenje korisnih informacija iz velike količine podataka potrebne su sofisticirane metode pretraživanja podataka. U slučaju sustava odgovaranja na upit potrebne su metode obrade upita, dohvaćanja podataka i odabira prikladnog odgovora. Ovaj rad bavi se izvlačenjem rečenice iz baze znanja koja predstavlja odgovor na pitanje upućeno sustavu. Većina rada posvećena je mjerenju semantičke sličnosti između pitanja i potencijalnog odgovora na hrvatskom jeziku. Implementirano je nekoliko tehnika reprezentiranja rečenica vektorom. Rad zaključuje da je običan TF-IDF vektor rečenice i kosinusna sličnost rečenica i dalje najbolja metoda usporedbe rečenica s obzirom na robusnost metode i lakoću korištenja. 
520 3 |a Sažetak na engleskom: For large amounts of textual information to be useful, appropriate search methods need to exist. In case of a question-answering system, methods of information retrieval, question processing and question answering are crucial. This thesis deals with non-factoid question answering where the answer is usually a sentence. Therefore, most of the work in the thesis is devoted to question-sentence semantic similarity task tested on Croatian language. Several sentence embedding techniques have been tested with various results. Thesis concludes that plain TF-IDF vectors of sentences combined with cosine similarity is still the preferable option for sentence comparison due to its robustness and ease of use. 
653 1 |a odgovaranje na upit  |a obrada pitanja  |a dohvaćanje podataka  |a reprezentiranje rečenica  |a obrada prirodnog jezika  |a nlp 
653 1 |a question answering  |a question processing  |a non-factoid question answering  |a information retrieval  |a sentence embedding  |a natural language processing  |a nlp 
700 1 |a Pintar, Damir  |4 ths  |9 31013 
942 |c Y 
999 |c 50934  |d 50934