Analisis Cluster

30
Laporan Praktikum Analisis Multivariat Analisis Kluster Disusun untuk memenuhi praktikum Analisis Multivariat oleh:  Nama : Suprianto  NIM : 0910950069 Asisten : 1. Danny Prasetyo Hartanto 2. Aris Wicaksono Tanggal : 8 Mei 2012 LABORATORIUM STATISTIKA JURUSAN MATEMATI KA FAKULTAS MATEMATIKA DAN ILMU PEGETAHUAN ALAM UNIVERSITAS BRAWIJAYA MALANG 2012

Transcript of Analisis Cluster

Page 1: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 1/30

Laporan Praktikum Analisis Multivariat

“Analisis Kluster” 

Disusun untuk memenuhi praktikum Analisis Multivariat

oleh:

 Nama : Suprianto NIM : 0910950069

Asisten : 1. Danny Prasetyo Hartanto

2. Aris Wicaksono

Tanggal : 8 Mei 2012

LABORATORIUM STATISTIKA

JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PEGETAHUAN ALAM

UNIVERSITAS BRAWIJAYA

MALANG

2012

Page 2: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 2/30

 

Page 3: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 3/30

BAB I

TINJAUAN PUSTAKA

1.1 Analisis Cluster (Cluster Analysis) .Analisis Cluster adalah teknik yang digunakan untuk 

mengidentifikasi objek atau individu yang serupa denganmemperhatikan beberapa kriteria (Kuncoro, 2003:242).

Analisis cluster yaitu analisis untuk mengelompokkanelemen yang mirip sebagai objek penelitian menjadikelompok (cluster) yang berbeda dan mutually exclusive

(Supranto, 2004:26).Analisis cluster termasuk dalam analisis statistik 

multivariat metode interdependen. Sebagai alat analisisinterdependen maka tujuan analisis cluster tidak untuk menghubungkan ataupun membedakan dengansampel/variabel lain. Analisis cluster merupakan salah satualat analisis yang berguna sebagai peringkas data. Dalammeringkas data ini dapat dilakukan dengan jalan

mengelompokkan objek-objek berdasarkan kesamaankarakteristik tertentu di antara objek-objek yang hendak diteliti (Tim Penelitian dan Pengembangan, 2005:120).

Analisis cluster adalah suatu alat untuk mengelompokkansejumlah n obyek berdasarkan  p variat yang secara relatif mempunyai kesamaan karakteristik diantara obyek  –  obyek tersebut, sehingga keragaman di dalam suatu kelompok tersebut lebih kecil dibandingkan keragaman antar kelompok.

Obyek dapat berupa barang, jasa, tumbuhan, binatang danorang (responden, konsumen, atau yang lainnya). Obyek tersebut akan diklasifikasikan ke dalam satu atau lebihcluster (kelompok) sehingga obyek  – obyek yang beradadalam satu cluster akan mempunyai kemiripan ataukesamaan karakter.

Jika terdapat n obyek dan  p variat, maka observasi xij

dengan i = 1, 2,…, n dan j = 1, 2, …,  p, dapat digambarkansebagai berikut:

Page 4: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 4/30

 

Var 1 Var 2 … Var j  … Var p 

Obyek 1 x11

x12

  … x1j  … x

1p 

Obyek 2 x21

x22

  … x2j

  … x2p

 

: : : : : : :

Obyek i xi1

xi2

: xij

: xip 

: : : : : : :

Obyek n xn1

xn2

: xnj

: xnp

Adapun ciri-ciri cluster adalah:1. Homogenitas (kesamaan) yang tinggi antar anggota dalam

satu cluster (within-cluster ).2. Heterogenitas (perbedaan) yang tinggi antar cluster yang

satu dengan cluster yang lainnya (between-cluster ).Analisis cluster mempunyai beberapa istilah penting,

antara lain:1.  Skedul aglomerasi (agalomeration schedule), ialah

 jadwal yang memberikan informasi tentang objek ataukasus yang akan dikelompokkan pada setiap tahap padasuatu proses analisis cluster yang hierarkis.

2.  Rata-rata cluster (cluster centroid ), ialah nilai rata-ratavariabel dari semua objek atau observasi dalam cluster tertentu.

3.  Pusat cluster (cluster centers), ialah titik awal dimulainya pengelompokkan di dalam cluster nonhierarki.

4.  Keanggotaan cluster (cluster membership), ialahkeanggotaan yang menunjukkan cluster untuk setiap

objek yang menjadi anggotanya.5.   Dendogram, disebut juga grafik pohon, output SPSSyang memvisualisasikan hasil analisis cluster yangdilakukan peneliti. Garis vertikal atau tegak menunjukkan cluster yang digabung bersama. Posisigaris pada pada skala menunjukkan jarak untuk manacluster digabung. Dendogram harus dibaca dari kiri kekanan.

6.   Distances between cluster centers, ialah jarak yangmenunjukkan bagaimana terpisahnya pasangan individucluster (Supranto, 2004:146).

Page 5: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 5/30

1.2 Tujuan Analisis Cluster

Setelah mengelompokkan n buah obyek pengamatankedalam m kelompok berdasarkan p variat dapat diketahui bahwa tujuan utama dari pengclusteran obyek adalah untuk 

mendapatkan kelompok obyek yang memiliki nilai relatif sama. Sehingga kelak dalam interpretasi, obyek-obyek yang berada pada satu cluster memiliki peluang yang cukup tinggiakan muncul bersamaan pada satu individu.

1.3 Konsep Dasar dalam Analisis Cluster

Analisis cluster merupakan suatu kelas teknik,dipergunakan untuk mengklasifikasi obyek atau kasus ke

dalam kelompok yang relatif homogen, yang disebut cluster.Obyek dalam setiap kelompok cenderung mirip satu samalain dan berbeda jauh (tidak sama) dengan obyek dari cluster lainnya (Supranto, 2004:142).

Pengelompokkan dilakukan berdasarkan kemiripan( similarity) antar obyek. Kemiripan diperoleh denganmeminimalkan jarak antar obyek dalam kelompok (within-

cluster ) dan memaksimalkan jarak antar kelompok (between-

cluster ).1.4 Proses Analisis Cluster

Untuk melakukan analisis cluster ada beberapa prosesyang harus dilakukan . Proses analisis cluster tersebutmeliputi :1. Menentukan ukuran ketakmiripan antar dua objek.

Sesuai prinsip daftar cluster yaitu mengelompokkanobjek yang mempunyai kemiripan, maka proses pertama

adalah mengukur seberapa jauh ada kesamaan antar objek.Dengan memiliki sebuah ukuran kuantitatif untuk mengatakan bahwa dua obyek tertentu lebih miripdibandingkan dengan obyek lain, akan menghilangkankebingungan dan mempermudah proses formal dalam pengclusteran. Salah satu yang jelas bisa menjadi ukuranketakmiripan adalah fungsi jarak antara objek a dan b,yang biasa dinotasikan dengan d(a,b).

Page 6: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 6/30

Sifat – sifat ukuran ketakmiripan adalah :1) d(a.b) ≥ 0

2) d(a,a) = 03) d(a,b) = d(b,a)

4) (a,b) meningkat seiring semakin tidak miripkedua objek a dan b.

5) d(a,c) ≤ d(a,b) + d(b,c) (Sartono, 2003:216).

Jarak yang paling umum digunakan adalah jarak euclidean. Ukuran jarak atau ketidaksamaan antar obyek ke-i dengan obyek ke-h, disimbolkan dengan d

ih. Nilai d

ih

diperoleh melalui perhitungan jarak kuadrat Euclidean

sebagai berikut ∑

 

dimana:d

ih= jarak kuadrat Euclidean antar obyek ke-i dengan

obyek ke-h. p = jumlah variabel cluster.

xij

= nilai atau data dari obyek ke-i pada variabel ke-j.

xhj

= nilai atau data dari obyek ke-h pada variabel ke-j

(Everitt, 1993).2. Membuat Cluster 

Proses cluster atau pengelompokan data bisadilakukan dengan dua metode:a.  Metode Hirarki

Metode ini memulai pengelompokan dengan dua ataulebih objek yang mempunyai kesamaan paling dekat.

Kemudiaan operasi diteruskan ke objek lain yangmempunyai kedekatan kedua. Demikian seterusnyasehingga cluster akan membentuk semacam ‘pohon’

dimana ada hirarki (tingkatan) yang jelas antar objek,dari yang paling mirip sampai paling tidak mirip.Metode yang digunakan untuk proses Clustering secarahirarki adalah Single Linkage (Pauatan Tunggal).Metode ini akan mengelompokan dua objek yang

mempunyai jarak terdekat dahulu. Jadi padasetiaptahapan, banyaknya cluster berkurang satu.

Page 7: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 7/30

Secara formal, dua buah cluster Br dan B

s, jarak antara

Br dan B

smisalkan h(B

r ,B

s) didefinisikan sebagai :

h(Br ,B

s) = min{d(x

i,x

 j); x

ianggota B

r , x

 janggota

Bs}Hasil berupa  single linkage clustering  dapat disajikandalam bentuk suatu dendogram atau diagram pohon.Cabang-cabang pohon menunjukkan cluster/kelompok.Cabang-cabang tersebut bertemu bersama-sama(menggabung) pada simpul yang posisinya sepanjangsuatu sumbu jarak (kemiripan) menunjukkan tingkatdimana penggabungan terjadi.

 b.  Metode Non-hirarkiMetode ini dimulai dengan proses penentuan jumlah

cluster terlebih dahulu. Metode Non-hirarki yangdigunakan adalah k-means. Metode k-means digunakansebagai alternatif metode cluster untuk data denganukuran yang besar karena memiliki kecepatan yang lebihtinggi dibandingkan metode hirarki.

Mac Queen menyarankan bahwa penggunaan k-

means untuk menjelaskan algoritma dalam penentuansuatu objek ke dalam cluster tertentu berdasarkan rataanterdekat. Proses Pengelusteran dengan metode k-means

adalah :1) Menetukan besarnya k, yaitu banyaknya cluter dan

menentukan centroid di tiap cluster.2) Menghitung jarak tiap objek dengan setiap centroid .

3) Menghitung kembali rataan (centroid ) untuk cluster yang baru terbentuk.4) Mengulangi langkah 2 sampai tidak ada lagi

 pemindahan objek antar cluster (Sartono, 2003:230).

3. Setelah cluster terbentuk, baik dengan metode hirarkimaupun non hirarki, langkah selanjutnya melakukan

interpretasi terhadap cluster yang terbentuk,yang padaintinya memberi nama spesifik untuk menggambar isicluster tersebut.

Page 8: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 8/30

4. Melakukan validasi cluster.Untuk menguji validasi cluster digunakan uji parsial F.Hipotesis:

H0: variabel i bukan variabel pembeda dalam

 pengclusteran.H

1: variabel i merupakan variabel pembeda dalam

 pengclusteranTaraf signifikansi α

Statistik uji

 

Kriteria Uji :Tolak H0 jika F > F

α, k -1,n-k  

Page 9: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 9/30

BAB II

METODOLOGI

2.1  Sumber Data

Data yang digunakan untuk analisis kluster adalah Data Dataindikator kesejahteraan beberapa negara. Data ini di peroleh dari

contoh data SPSS world95.sav. 

2.2  Tahapan Analisis

2.2.1 Standarisasi dan Analisis Komponen Utama1.  Masukkan data ke SPSS 16.

2.  Kemudian lakukan transformasi (standarisasi) Klik Analyze  Descriptive Statistics  DescriptivesSeperti di bawah ini :

Page 10: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 10/30

3.  Akan muncul kotak dialog seperti di bawah ini, masukkansemua variable kedalam kolom Variable(s), kemudiancentang Save standardized values as variables. Lalu klik OK.

4.  Maka akan muncul hasilnya, seperti di bawah ini

5.  Menghitung korelasi pearson.  Analyze  Correlate   Bivariate.

Page 11: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 11/30

6.  Akan muncul kotak dialog seperti di bawah ini, masukkansemua variable Zscore ke kolom Variables. Lalu klik OK .

7.  Selanjutnya, melakukan Analisis Komponen karena adavariabel-variabel yang berkorelasi.

 Klik Analyze  Data Reduction  Factor.

8.  Dan akan muncul kotak dialog seperti dibawah ini :

Masukkan variabel  Zscore ke dalam kotak variables, karenanilai standar deviasi antar variabel besar.

Page 12: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 12/30

9.  Pilih Extraction,maka akan muncul kotak dialog, seperti di bawah ini.

Selanjutnya centang Covariance matrix karena data yangdigunakan adalah variabel  standardized . Dan number of 

 factor diisi 7 atau sesuai banyaknya variabel. lalu Continue.

10. Pilih Scores, maka akan muncul kotak dialog, seperti di bawah ini, setelah itu centang Save as

variables Regression, dan centang juga  Display factor  score coefficient matrix. Lalu continue.

11. Klik OK . Maka akan muncul hasil seperti berikut ini :

Page 13: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 13/30

2.2.2 Analisis Cluster Hierarchy1.  Klik  Analyze  Classify  Hierarchical cluster  

2.  Dan akan muncul kotak dialog seperti dibawah ini :

Masukkan variabel Country ke dalam kotak  Label Cases By,dan juga masukkan Komponen utama yang terbentuk ( REGR

 Factor Score) ke dalamVariable(s).

3.  PilihStatistics, maka akan muncul kotak dialog, seperti di

 bawah ini.

Selanjutnya centang  Aglomeration schedule dan  Proximitymatrix. Pada Cluster membership pilih none. lalu Continue.

Page 14: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 14/30

4.  Pilih Plots,akan muncul kotak dialog seperti di bawah ini

Selanjutnya centang  Dendogram dan icicle  pilih none laluContinue.

5.  Pilih Methods, akan muncul kotak dialog seperti di bawah ini

setelah itu pada Cluster Method  pilih Between-Group

linkage dan pada Measure  pilih  Euclidean Distance. Lalucontinue.

6.  Pilih Save, maka akan muncul kotak dialog seperti di bawahini

setelah itu pada Cluster Membership  pilih  None. Lalu

continue.

7.  Klik OK. 

Page 15: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 15/30

2.2.3 Penentuan Jumlah Cluster1.  Copy tabel  Aglomeration Schedule  pada Output SPSS ke

 Microsoft Excel  

2.  Selanjutnya cari selisih dari stage-stage secara berurutan dariniai Coefficiens. Kemudian cari nilai stage terkecil dari

selisih terbesar untuk menentukan jumlah kluster denganrumus:Jumlah Cluster = banyaknya Objek -stage terkecil dari

selisih terbesar 

Page 16: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 16/30

3.  Untuk melihat iterasi sampai terbentuk jumlah kluster dengan mengurutkan mulai dari stage 1 dengan anggotaCluster 1 dan Cluster 2 dan stage selanjutnya dengan melihatnext stage. Dan seterusnya sampai diperoleh iterasi sampai

akhir (diberi warna hijau).

2.2.4 menentukan Anggota Kluster1.  Klik  Analyze  Classify  Hierarchical cluster  

Page 17: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 17/30

2.  Dan akan muncul kotak dialog seperti dibawah ini :

Masukkan variabel Country ke dalam kotak  Label Cases By,dan juga variabel awal yang lain ke Variable(s).

3.  PilihStatistics, maka akan muncul kotak dialog, seperti di bawah ini.

Selanjutnya centang  Aglomeration schedule dan  Proximity

matrix. Pada Cluster membership  pilih  single solution dan pada Number of cluster isi dengan 3. lalu Continue.

4.  Pilih Plots, maka akan muncul kotak dialog, seperti di bawahini.

Selanjutnya centang  Dendogram dan icicle pilih all cluster lalu Continue.

Page 18: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 18/30

5.  Pilih  Methods, maka akan muncul kotak dialog seperti di bawah ini

setelah itu pada Cluster Method  pilih Between-Group

linkage dan pada Measure  pilih  Euclidean Distance. Lalucontinue.

6.  Pilih Save, akan muncul kotak dialog seperti di bawah ini

Setelah itu Pada Cluster membership  pilih  single solutiondan pada Number of cluster isi dengan 3. lalu Continue.

7.  Klik OK.Dan akan muncul sebagai berikut

Page 19: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 19/30

2.2.5 Menentukan Karakteristik Tiap Kluster1.  Klik  Data Select CaseSeperti di bawah ini :

2.  Lalu akan muncul kotak dialog seperti di bawah ini dan Pilih If Cinditional issatisfied    If… 

3.  Masukkan average linkage pada dialog dan tuliskan

CLU3_1=1 pada dialog dan klik continue 

Page 20: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 20/30

4.  Klik OK dan akan muncul sebagai berikut.

5.  Cari nilai mean,  Klik Analyze   Descriptive Statistics    Descriptives 

6.  Akan muncul kotak dialog seperti di bawah ini, masukkansemua variable ke dalam kolom Variable(s), kemudian. Laluklik OK.

Page 21: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 21/30

7.  Pilih Optios pilih Mean. Klik Continue 

8.  Klik OK 

9.  Lakukan dengan cara yang sama untuk CLU3_1=2 danCLU3_1=3

10. Kemudian dari mean ketiga kluster tersebut dicari meanterbesar tiap-tiap kriteria dan mean terbesar tersebutmerupakan karakteristik dari kluster dengan mean terbesar itu sendiri.

Page 22: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 22/30

BAB III

HASIL DAN PEMBAHASAN

3.1 Data dan Kasus

Data indikator kesejahteraan beberapa negara. 

COUNTRY

DE

 NSITY

UR BA

 N

LIFEEXPF

LIFEEXPM

LITER ACY

BABYMOR T

GDP _ CAP

Afghanistan 25 18 44 45 29 168 205

Bangladesh 800 16 53 53 35 106 202

Cambodia 55 12 52 50 35 112 260

China 124 26 69 67 78 52 377

Hong Kong 5494 94 80 75 77 5.8 14641

India 283 26 59 58 52 79 275

Indonesia 102 29 65 61 77 68 681

Japan 330 77 82 76 99 4.4 19860

Malaysia 58 43 72 66 78 25.6 2995

 N. Korea 189 60 73 67 99 27.7 1000

Pakistan 143 32 58 57 35 101 406

Philippines 221 43 68 63 90 51 867

S. Korea 447 72 74 68 96 21.7 6627

Singapore 4456 100 79 73 88 5.7 14990

Taiwan 582 71 78 72 91 5.1 7055

Thailand 115 22 72 65 93 37 1800

Vietnam 218 20 68 63 88 46 230

Sumber data : Contoh data SPSS world95.sav

Page 23: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 23/30

Keterangan variabel :

Variabel Penjelasan

 Density Banyaknya penduduk per km persegi

Urban Persentase penduduk yang tinggal di perkotaan

 Lifeexpf  Harapan hidup penduduk perempuan (tahun)

 Ligeexpm Harapan hidup penduduk laki-laki (tahun)

 Literacy Persentase penduduk yang bisa baca-tulis

 Babymort  Banyaknya kematian bayi per 1000 kelahiran

Gdp_cap Penghasilan penduduk per kapita pertahun (US$)

Tujuan penelitian:

1.  Mengetahui banyaknya kelompok yang terbentuk 2.  Mengidentifikasi indikator kesejahteraan dari kelompok tersebut

3.2 Output dan Interpretasi Descriptive Statistics 

N Minimum Maximum Mean Std. Deviation

DENSITY 17 25 5494 802.47 1594.105

URBAN17 12 100 44.76 28.556

LIFEEXPF 17 44 82 67.41 10.886

LIFEEXPM 17 45 76 63.47 8.726

LITERACY 17 29 99 72.94 25.168

BABYMORT 17 4 168 53.88 46.441

GDP_CAP 17 202 19860 4263.00 6291.046

Valid N (listwise) 17

Dari tabel di atas dapat dilihat bahwa variabel-variabel

tersebut memiliki keragamana yang besar sehingga harus distandarisasi.

Page 24: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 24/30

 

Dari tabel Correlation di atas dapat diketahui ada variabel-variabel yang berkorelasi maka harus dilakukan analisiskomponen utama.

Total Variance Explained 

Component

Initial Eigenvaluesa 

Extraction Sums of SquaredLoadings

Total% of 

VarianceCumulative

% Total% of 

VarianceCumulative

%

Raw 15.317 75.959 75.959 5.317 75.959 75.959

2 1.171 16.727 92.686 1.171 16.727 92.686

3 .292 4.173 96.859 .292 4.173 96.859

4 .116 1.662 98.521 .116 1.662 98.521

5 .081 1.161 99.682 .081 1.161 99.682

6 .020 .279 99.961 .020 .279 99.961

7 .003 .039 100.000 .003 .039 100.000

Rescaled

15.317 75.959 75.959 5.317 75.959 75.959

2 1.171 16.727 92.686 1.171 16.727 92.686

3 .292 4.173 96.859 .292 4.173 96.859

4 .116 1.662 98.521 .116 1.662 98.521

5 .081 1.161 99.682 .081 1.161 99.682

6 .020 .279 99.961 .020 .279 99.961

7 .003 .039 100.000 .003 .039 100.000

Extraction Method: Principal Component Analysis.

a. When analyzing a covariance matrix, the initial eigenvalues are the sameacross the raw and rescaled solution.

Page 25: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 25/30

  Dari tabel di atas terbentuk 2 komponen utama dengankeragaman kumulatif sebesar 92,686%. Dan untuk selanjutnya 2komponen utama ini yang akan digunakan untuk analisiskluster.

Agglomeration Schedule 

Stage

Cluster CombinedCoefficient

s

Stage Cluster First Appears

NextStageCluster 1 Cluster 2 Cluster 1 Cluster 2

1 4 12 .177 0 0 4

2 13 15 .257 0 0 12

3 10 16 .370 0 0 6

4 4 17 .399 1 0 6

5 3 11 .421 0 0 8

6 4 10 .476 4 3 9

7 7 9 .614 0 0 9

8 2 3 .676 0 5 10

9 4 7 .687 6 7 12

10 2 6 .833 8 0 13

11 5 14 .953 0 0 15

12 4 13 1.297 9 2 14

13 1 2 1.409 0 10 14

14 1 4 2.175 13 12 15

15 1 5 3.194 14 11 16

16 1 8 3.925 15 0 0

Tabel di atas digunakan untuk menentukan jumlahcluster yang terbentuk. Dari cari selisih dari stage-stage

secara berurutan dari niai Coefficiens. Kemudian cari nilai stageterkecil dari selisih terbesar untuk menentukan jumlah kluster 

dengan rumus:Jumlah Cluster = banyaknya Objek - stage terkecil dari

selisih terbesar Dengan bantuan excel didapatkan selisih terbesar yaitu

selisih antara stage 14 dan 15 yaitu sebesar 1,01844133. Dannilai yang koeficeient terkecil yaitu stage 14 sehinggadiperolehJumlah Cluster = 17 – 14 = 3 cluster.

Page 26: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 26/30

Agglomeration Schedule 

Stage

Cluster CombinedCoefficient

s

Stage Cluster First Appears

NextStageCluster 1 Cluster 2 Cluster 1 Cluster 2

1 4 12 .177 0 0 4 2 13 15 .257 0 0 12

3 10 16 .370 0 0 6

4 4 17 .399 1 0 6

5 3 11 .421 0 0 8

6 4 10 .476 4 3 9

7 7 9 .614 0 0 9

8 2 3 .676 0 5 10

9 4 7 .687 6 7 12

10 2 6 .833 8 0 13

11 5 14 .953 0 0 15

12 4 13 1.297 9 2 14

13 1 2 1.409 0 10 14

14 1 4 2.175 13 12 15

15 1 5 3.194 14 11 16

16 1 8 3.925 15 0 0

Baris yang di warna kuning merupakan banyaknya iterasisampai diperoleh 3 cluster. Yaitu sebanyak 8 iterasi.

Page 27: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 27/30

1.  Anggota Cluster Cluster Membership 

Case 3 Clusters

1:Afghanistan 1

2:Bangladesh 1

3:Cambodia 1

4:China 1

5:Hong Kong 2

6:India 1

7:Indonesia 1

8:Japan 3

9:Malaysia 1

10:N. Korea 111:Pakistan 1

12:Philippines 1

13:S. Korea 1

14:Singapore 2

15:Taiwan 1

16:Thailand 1

17:Vietnam 1

Dari tabel di atas diperoleh bahwa terdapat 3 cluster denganrincian:Cluster 1 : Afghanistan, Bangladesh, Cambodia, China, India,

Indonesia, Malaysia, N. Korea, Pakistan, Philippines,S. Korea, Taiwan, Thailand, dan vietnam.

Cluster 2 : Hongkong dan Singapore.Cluster 3 : Japan.

Page 28: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 28/30

2.  Karakteristik Cluster 

Cluster 1 Cluster 2 Cluster 3

MaxDescriptive Statistics Descriptive Statistics Descriptive Statistics

 N Mean N Mean N Mea

n

DENSITY14

240,1429 DENSITY

2 4975DENSITY

1 3304975

URBAN14

35URBAN

2 97URBAN

1 7797

LIFEEXPF

14

64,64286

LIFEEXPF

2 79,5LIFEEXPF

1 8282

LIFEEXPM

14

61,07143

LIFEEXPM

2 74LIFEEXPM

1 7676

LITERACY

14

69,71429

LITERACY

2 82,5LITERACY

1 9999

BABYMORT 14 64,29286 BABYMORT 2 5,75 BABYMORT 1 4,4 64,29286

GDP_CAP

14

1641,429

GDP_CAP

214815

,5GDP_CAP

119860 19860

Valid N(listwise)

14

Valid N(listwise)

2Valid N(listwise)

1

Dari tabel di atas dapat diketahui bahwa karakteristik dari tiap-tiap kluster yaituCluster 1 : Banyaknya kematian bayi per 1000 kelahiran yang

tinggi.

Cluster 2 : Banyaknya penduduk per km persegi dan Persentase penduduk yang tinggal di perkotaan yang tinggi.

Cluster3 :Harapan hidup penduduk perempuan (tahun), Harapanhidup penduduk laki-laki (tahun), Persentase

 penduduk yang bisa baca-tulis, dan Penghasilan penduduk per kapita pertahun (US$) yang tinggi.

Page 29: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 29/30

BAB IV

KESIMPULAN DAN SARAN

4.1 Kesimpulan

Data kesejahteraan dari berbagai negara dengan 7 indikator kesejahteraan diperoleh 3 cluster.Cluster 1 terdiri dari negara-negara Afghanistan, Bangladesh, Cambodia, China, India,Indonesia, Malaysia, N. Korea, Pakistan, Philippines, S. Korea,Taiwan, Thailand, dan vietnam dengan karakteristik Banyaknyakematian bayi per 1000 kelahiran yang tinggi. Sehingga cluster 1 dapat digolongkan ke negara-negara dengan kesejahteraanrendah.

Cluster 2 terdiri dari Hongkong dan Singapore dengan

karakteristik Banyaknya penduduk per km persegi danPersentase penduduk yang tinggal di perkotaan yang tinggi.Sehingga cluster 2 dapat digolongkan ke negara-negara dengankesejahteraan sedang.

Cluster 3 hanya terdiri dari Japan dengan karakteristik Harapan hidup penduduk perempuan (tahun), Harapan hidup

 penduduk laki-laki (tahun), Persentase penduduk yang bisa baca-tulis, dan Penghasilan penduduk per kapita pertahun (US$)

yang tinggi.Sehingga cluster 3 dapat digolongkan ke negara-negara dengan kesejahteraan tinggi.

4.2 SaranPerlu adanya penambahan indikator kesejahteraan dan juga

 jumlah negara ditambah lebih banyak lagi.

Page 30: Analisis Cluster

7/16/2019 Analisis Cluster

http://slidepdf.com/reader/full/analisis-cluster-563388bc05da2 30/30

DAFTAR PUSTAKA

Everitt, B.S. 1993. Cluster Analysis. Third Edition. Halsted Pressan Imprint of John Wiley and Sons Inc. New York 

Kuncoro, M . 2003.  Metode Riset Untuk Bisnis dan Ekonomi.Jakarta: ErlanggaSartono, B dkk. 2003. Analisis Peubah Ganda.Bogor: IPBSupranto, J. 2000. Teknik Sampling Untuk Survei dan

 Eksperimen, Edisi Baru. Jakarta: PT. Rineka Cipta---------. 2004.  Analisis Multivariat: Arti dan Interprestasi.

Jakarta: PT. Rineka CiptaTim Penelitian dan Pengembangan, Wahana Komputer. 2005.

 Pengembangan Analisis Multivariate dengan SPSS 12,Edisi Pertama. Jakarta: Salemba