Sustav za izdvajanje tabličnih podataka iz web-stranica

Sažetak na hrvatskom: Proučiti i opisati dostupne sustave za izdvajanje tabličnih podataka iz polu-strukturiranih dokumenata kao što su web-stranice ili PDF dokumenti. Osmisliti i ostvariti sustav za izdvajanje strukturiranih tabličnih podataka iz navedenih dokumenata s naglaskom na web-stranice. Su...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:49187/Details
Glavni autor: Krtalić Rusendić, Stanko (-)
Ostali autori: Vladimir, Klemo (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, S. Krtalić Rusendić, 2018.
Predmet:
LEADER 02425na a2200229 4500
003 HR-ZaFER
008 160221s2018 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid4751 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Krtalić Rusendić, Stanko 
245 1 0 |a Sustav za izdvajanje tabličnih podataka iz web-stranica :  |b završni rad /  |c Stanko Krtalić Rusendić ; [mentor Klemo Vladimir]. 
246 1 |a System for Tabular Data Extration from Web-pages  |i Naslov na engleskom:  
260 |a Zagreb,  |b S. Krtalić Rusendić,  |c 2018. 
300 |a 19 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Telekomunikacije i informatika, šifra smjera: 42, datum predaje: 2017-06-09, datum završetka: 2018-09-19 
520 3 |a Sažetak na hrvatskom: Proučiti i opisati dostupne sustave za izdvajanje tabličnih podataka iz polu-strukturiranih dokumenata kao što su web-stranice ili PDF dokumenti. Osmisliti i ostvariti sustav za izdvajanje strukturiranih tabličnih podataka iz navedenih dokumenata s naglaskom na web-stranice. Sustav treba izložiti svoje funkcionalnosti koristeći sučelje naredbenog retka za koje je potrebno osmisliti skup naredbi za jednostavni interaktivni rad. Nadalje, ostvariti i osnovno programsko sučelje sustava. Prikupiti skup web-stranica za ispitivanje rada sustava te ocijeniti uspješnost izdvajanja tabličnih podataka s obzirom na složenost strukture ulaznog dokumenta. Opisati izgrad ̄eni sustav, navesti upute za postavljanje, nacˇine korištenja, navesti literaturu i primljenu pomoć.  
520 3 |a Sažetak na engleskom: Study and describe available systems for extraction of tabular data from semi- structured documents like web sites or PDF documents. Think of and implement a system for extracting of structured tabular data from the types of documents menti- oned above with an emphesys on web sites. The system should be implemented as a command line interface with a set of commands for interactive use. Aggregate a set of web sites for testing the effectivnes of data extraction regarding the com[plexety of the input. Describe the created system, write setup instrunctions, usage instructions, cite the literature used and any help received. 
653 1 |a pdf, html, izdvajanje, tablice 
653 1 |a pdf, html, extraction, tables 
700 1 |a Vladimir, Klemo  |4 ths 
942 |c Z 
999 |c 49187  |d 49187