|
|
|
|
LEADER |
03014na a2200229 4500 |
003 |
HR-ZaFER |
008 |
160221s2019 ci ||||| m||| 00| 0 hr d |
035 |
|
|
|a (HR-ZaFER)ferid6796
|
040 |
|
|
|a HR-ZaFER
|b hrv
|c HR-ZaFER
|e ppiak
|
100 |
1 |
|
|a Ambrošić, Dan
|9 40058
|
245 |
1 |
0 |
|a Prepoznavanje skeniranog teksta temeljeno na dubokim modelima :
|b diplomski rad /
|c Dan Ambrošić ; [mentor Marko Čupić].
|
246 |
1 |
|
|a Deep Models Based Scanned Text Recognition
|i Naslov na engleskom:
|
260 |
|
|
|a Zagreb,
|b D. Ambrošić,
|c 2019.
|
300 |
|
|
|a 46 str. ;
|c 30 cm +
|e CD-ROM
|
502 |
|
|
|b diplomski studij
|c Fakultet elektrotehnike i računarstva u Zagrebu
|g smjer: Računarska znanost, šifra smjera: 56, datum predaje: 2019-06-28, datum završetka: 2019-07-10
|
520 |
3 |
|
|a Sažetak na hrvatskom: Iako je optičko prepoznavanje znakova (OCR) uglavnom riješen problem, uvijek ima mjesta za poboljšanja, pogotovo kod obrade povijesnih dokumenata i slika slabije kvalitete. Koristeći pristup CTC, duboki modeli temeljeni na povratnim neuronskim mrežama su uspješno primijenjeni na probleme označavanja sekvenci, kao što je prepoznavanje teksta. Danas često korištena arhitektura neuronskih mreža, koja spaja konvolucijske i povratne slojeve s izlazima CTC i odgovarajućim gubitkom, je isprobana na većem javno dostupnom skupu podataka i na drugom manjem skupu koji je dobiven skeniranjem izabranih knjiga. Drugi skup je označen koristeći aplikaciju s grafičkim korisničkim sučeljem koja je razvijena u sklopu ovog rada i služi za poluautomatsko označavanje teksta na razini znakova. Pokazano je i da unaprijed naučeni model zahtijeva malu količinu novih podataka za učenje kako bi postigao zadovoljavajuće rezultate na drugačijem skupu.
|
520 |
3 |
|
|a Sažetak na engleskom: Although optical character recognition (OCR) is mostly a solved problem, there is always room for improvement, especially when dealing with historical documents and poor quality images. Using the connectionist temporal classification (CTC) approach, deep models based on recurrent neural networks are successfully applied to sequence labelling tasks, such as text recognition. A commonly used neural network architecture, that combines convolutional and recurrent layers with CTC output and the corresponding loss function, is tested on a bigger publicly available dataset and a smaller one obtained by scanning pages from several books. The second dataset is annotated using a desktop application with a graphical user interface that is developed as a part of this thesis and aids in the character-level text annotation. It is also shown that a pre-trained model requires a small amount of new training data to achieve satisfactory results on a different dataset.
|
653 |
|
1 |
|a segmentacija slike
|a duboko učenje
|a neuronske mreže
|a označavanje sekvenci
|a CTC
|a LSTM
|
653 |
|
1 |
|a image segmentation
|a deep learning
|a neural networks
|a sequence labelling
|a CTC
|a LSTM
|
700 |
1 |
|
|a Čupić, Marko
|4 ths
|9 31150
|
942 |
|
|
|c Y
|
999 |
|
|
|c 50788
|d 50788
|