CURE: učinkovit algoritam za grupiranje velikih skupova podataka

Sažetak na hrvatskom: U ovom završnom radu obrađuje se tehnika grupiranja skupova podataka s naglaskom na CURE algoritam. Započinjemo definiranjem pojma grupe i udaljenosti među grupama. Objašnjena je osnovna podjela strategija za grupiranje skupova podataka. Obrađeno je nekoliko algoritama koji pre...

Full description

Permalink: http://skupnikatalog.nsk.hr/Record/fer.KOHA-OAI-FER:48039/Details
Glavni autor: Torbarina, Lovre (-)
Ostali autori: Srbljić, Siniša (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, L. Torbarina, 2017.
Predmet:
LEADER 02647na a2200229 4500
003 HR-ZaFER
008 160221s2017 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid5273 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Torbarina, Lovre 
245 1 0 |a CURE: učinkovit algoritam za grupiranje velikih skupova podataka :  |b završni rad /  |c Lovre Torbarina ; [mentor Siniša Srbljić]. 
246 1 |a CURE: An Effective Algorithm for Clustering Large Datasets  |i Naslov na engleskom:  
260 |a Zagreb,  |b L. Torbarina,  |c 2017. 
300 |a 42 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2017-06-09, datum završetka: 2017-07-10 
520 3 |a Sažetak na hrvatskom: U ovom završnom radu obrađuje se tehnika grupiranja skupova podataka s naglaskom na CURE algoritam. Započinjemo definiranjem pojma grupe i udaljenosti među grupama. Objašnjena je osnovna podjela strategija za grupiranje skupova podataka. Obrađeno je nekoliko algoritama koji pretpostavljaju Euklidski prostor i očekivan broj grupa. Prvo obrađujemo hijerarhijski algoritam, zatim obrađujemo k-means algoritam te naposljetku CURE algoritam. Za svaki od algoritama objašnjena je njegova prostorna i vremenska složenost, te je napisan detaljan pseudokod s dodatnim obrazloženjima. Rad zaključujemo eksperimentima nad nekoliko malih i velikih skupova podataka pomoću kojih ukazujemo na prednost CURE algoritma u odnosu na druga dva obrađena u konkretnim situacijama. 
520 3 |a Sažetak na engleskom: In this bachelor thesis, we discuss data clustering technique with emphasis on CURE algorithm. We start by defining notation of the group and the distance between the groups. Then, we describe the basic classification of data clustering strategies. We process several algorithms that suggest Euclidean space and that the expected number of groups is known in advance. First, we analyze the hierarchical clustering algorithm, then we analyze k-means algorithm and at the last CURE algorithm. For every described algorithm, space and time complexity is given so as the detailed pseudocode with additional explanations. We conclude the bachelor thesis with experiments on a couple of small and big data sets with the aim to show the advantages of the CURE algorithm over the other two in concrete situations. 
653 1 |a k-means  |a hijerarhijsko grupiranje  |a CURE  |a grupiranje skupova podataka 
653 1 |a k-means  |a hierarchical clustering  |a CURE  |a dataset clustering 
700 1 |a Srbljić, Siniša  |4 ths 
942 |c Z 
999 |c 48039  |d 48039