Ispravljanje pravopisnih pogrešaka nastalih izostavljanjem ili dodavanjem razmaka

Sažetak na hrvatskom: Ovaj rad opisuje dosadašnji razvoj u obradi prirodnog jezika, područja u kojima se primjenjuje i izazove u pojedinim područjima. Posebna pažnja posvećena je strojnom ispravljanju pravopisa. Proučeni su najpoznatiji algoritmi za ispravljanje pravopisa, kao što su Peter Norvigov...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:51467/Details
Glavni autor: Janjić, Matej (-)
Ostali autori: Gledec, Gordan (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, M. Janjić, 2019.
Predmet:
LEADER 03117na a2200229 4500
003 HR-ZaFER
008 160221s2019 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid6648 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Janjić, Matej  |9 40754 
245 1 0 |a Ispravljanje pravopisnih pogrešaka nastalih izostavljanjem ili dodavanjem razmaka :  |b diplomski rad /  |c Matej Janjić ; [mentor Gordan Gledec]. 
246 1 |a Correcting spelling errors caused by space character insertion or deletion  |i Naslov na engleskom:  
260 |a Zagreb,  |b M. Janjić,  |c 2019. 
300 |a 44 str. ;  |c 30 cm +  |e CD-ROM 
502 |b diplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Programsko inženjerstvo i informacijski sustavi, šifra smjera: 54, datum predaje: 2019-06-28, datum završetka: 2019-07-08 
520 3 |a Sažetak na hrvatskom: Ovaj rad opisuje dosadašnji razvoj u obradi prirodnog jezika, područja u kojima se primjenjuje i izazove u pojedinim područjima. Posebna pažnja posvećena je strojnom ispravljanju pravopisa. Proučeni su najpoznatiji algoritmi za ispravljanje pravopisa, kao što su Peter Norvigov algoritam, Burkhard--Keller stabla i algoritam simetričnog brisanja. Obrađeni su pristupi ispravljanju pravopisnih grešaka nastalih dodavanjem ili izostavljanjem razmaka. Za implementaciju programa za strojno ispravljanje pravopisa koji ima mogućnost ispravljanja pravopisnih pogrešaka nastalih izostavljanjem ili dodavanjem razmaka odabran je algoritam simetričnog brisanja kojeg je implementirao Wolf Garbe. Objašnjeno je i stvaranje rječnika s brojem pojavljivanja pojedine riječi. Korišteni su podaci izvedeni iz usluge Hascheck, nadograđeni s dva dodatna korpusa. Napravljena je usporedba ispravljanja nekoliko karakterističnih tekstova. 
520 3 |a Sažetak na engleskom: This thesis describes the current state of natural language processing, the areas in which it is applied and challenges present in these areas. Particular attention is paid to automatic spelling correction. The most famous spelling correction algorithms were studied, such as Peter Norvig's algorithm, Burkhard-Keller trees and the symmetric deletion algorithm. Approaches to correcting spelling mistakes caused by adding or omitting spaces are explained. To implement a spell-correction program that has the ability to correct spelling mistakes created by omitting or adding spaces, a symmetric deletion algorithm implemented by Wolf Garbe was used. The process of creating the frequency dictionary is also explained. Data exported from Hascheck was used for the dictionary, improved with the data from two additional corpora. A comparison of the correction results of several characteristic texts was made. 
653 1 |a trojno ispravljanje pravopisa  |a udaljenost uređivanja  |a Burkhard--Keller stabla  |a algoritam simetričnog brisanja  |a rječnici  |a korpusi  |a Hascheck 
653 1 |a automatic spelling correction  |a edit distance  |a Burkhard--Keller trees  |a symmetric delete algorithm  |a dictionaries  |a corpora  |a Hascheck 
700 1 |a Gledec, Gordan  |4 ths  |9 18164 
942 |c Y 
999 |c 51467  |d 51467