Integracija platformi velikih podataka sa tradicionalnim sustavima za podatkovnu analizu

Sažetak na hrvatskom: Obrada velikih podataka zahtijeva korištenje posebnih platformi koje omogućavaju paraleliziranu i raspodijeljenu obradu velikih podataka. Spark je danas jedna od vodećih platformi za velike podatke. R je vodeći programski jezik za statistiku i eksploratornu analizu podataka uz...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:51233/Details
Glavni autor: Domazet, Josip (-)
Ostali autori: Pintar, Damir (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, J. Domazet, 2019.
Predmet:
LEADER 02438na a2200229 4500
003 HR-ZaFER
008 160221s2019 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid7214 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Domazet, Josip  |9 40513 
245 1 0 |a Integracija platformi velikih podataka sa tradicionalnim sustavima za podatkovnu analizu :  |b završni rad /  |c Josip Domazet ; [mentor Damir Pintar]. 
246 1 |a Integrating Big Data Platforms with Traditional Data Analysis Systems  |i Naslov na engleskom:  
260 |a Zagreb,  |b J. Domazet,  |c 2019. 
300 |a 57 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2019-06-14, datum završetka: 2019-07-12 
520 3 |a Sažetak na hrvatskom: Obrada velikih podataka zahtijeva korištenje posebnih platformi koje omogućavaju paraleliziranu i raspodijeljenu obradu velikih podataka. Spark je danas jedna od vodećih platformi za velike podatke. R je vodeći programski jezik za statistiku i eksploratornu analizu podataka uz ograničenje da tradicionalno radi s podacima koji su učitani u radnu memoriju. R i Spark se mogu integrirati u moćan radni okvir za analizu velikih podataka i izradu prediktivnih modela uz pomoć paketa sparklyr. Osnovna ideja korištenja R-a kao sučelja prema Sparku je da se sva računanja obavljaju u Spark grozdu, dok R prima rezultate od Sparka. 
520 3 |a Sažetak na engleskom: Processing big data requires specialized platforms for parallel and distributed computing. Spark is today one of the most important big data platforms. R is the leading programming language for statistics and exploratory data analysis, but its limitation is that it traditionally works with data loaded into RAM. R and Spark can be integrated into a powerful framework for big data analysis and predictive modelling with the help of R package sparklyr. The basic idea of using R as an interface to the Spark is to let Spark cluster handle all computational jobs, while R session collects results from Spark. 
653 1 |a R  |a Spark  |a sparklyr  |a veliki podaci  |a podatkovna znanost  |a strojno učenje  |a eksploratorna analiza  |a prediktivno modeliranje 
653 1 |a R  |a Spark  |a sparklyr  |a big data  |a data science  |a machine learning  |a exploratory analysis  |a predictive modelling 
700 1 |a Pintar, Damir  |4 ths  |9 31013 
942 |c Z 
999 |c 51233  |d 51233