data mining fuzzy c-means

102
1 PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS DENGAN ALGORITMA FUZZY C-MEANS Oleh : BAHAR P31.2008.00539 Tesis diajukan sebagai salah satu syarat untuk memperoleh gelar Magister Komputer PROGRAM PASCA SARJANA MAGISTER TEKNIK INFORMATIKA UNIVERSITAS DIAN NUSWANTORO SEMARANG 2011

description

data mining fuzzy c-means

Transcript of data mining fuzzy c-means

Page 1: data mining fuzzy c-means

1

PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS

DENGAN ALGORITMA FUZZY C-MEANS

Oleh :

BAHAR

P31.2008.00539

Tesis diajukan sebagai salah satu syarat

untuk memperoleh gelar

Magister Komputer

PROGRAM PASCA SARJANA

MAGISTER TEKNIK INFORMATIKA

UNIVERSITAS DIAN NUSWANTORO

SEMARANG

2011

Page 2: data mining fuzzy c-means

1

UNIVERSITAS DIAN NUSWANTORO

PENGESAHAN STATUS TESIS

JUDUL : PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS DENGAN ALGORITMA FUZZY C-MEANS

NAMA : BAHAR NPM : P31.2008.00539 mengijinkan Tesis Magister Komputer ini disimpan di Perpustakaan UniversitasDian Nuswantoro dengan syarat-syarat kegunaan sebagai berikut: 1. Tesis adalah hak milik Universitas Dian Nuswantoro 2. Perpustakaan Universitas Dian Nuswantoro dibenarkan membuat salinanuntuk

tujuan referensi saja. 3. Perpustakaan juga dibenarkan membuat salinan Tesis ini sebagai

bahanpertukaran antar institusi pendidikan tinggi. 4. Berikan tanda √ sesuai dengan kategori Tesis □ Sangat Rahasia □ Rahasia □ Biasa Disahkan oleh:

……………………………………… ……………………….……………

Bahar Dr. Abdul Syukur

Alamat Tetap: Jl. Ir. PM. Noor- Perum. GADIK B/14 Sei Ulin Banjarbaru Tanggal : Tanggal :

Page 3: data mining fuzzy c-means

2

UNIVERSITAS DIAN NUSWANTORO

PERNYATAAN PENULIS

JUDUL : PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS DENGAN ALGORITMA FUZZY C-MEANS

NAMA : BAHAR NPM : P31.2008.00539

“Saya menyatakan dan bertanggungjawab dengan sebenarnya bahwa Tesis ini

adalah hasil karya saya sendiri kecuali cuplikan dan ringkasan yang masing-

masing telah saya jelaskan sumbernya. Jika pada waktu selanjutnya ada pihak lain

yang mengklaim bahwa Tesis ini sebagai karyanya, yang disertai dengan bukti-

bukti yang cukup, maka saya bersedia untuk dibatalkan gelar Magister Komputer

saya beserta segala hak dan kewajiban yang melekat pada gelar tersebut”.

Semarang, 17 Maret 2011

BAHAR Penulis

Page 4: data mining fuzzy c-means

3

UNIVERSITAS DIAN NUSWANTORO

PERSETUJUAN TESIS

JUDUL : PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS DENGAN ALGORITMA FUZZY C-MEANS

NAMA : BAHAR

NPM : P31.2008.00539

Tesis ini telah diperiksa dan disetujui,

Semarang, 17 Maret 2011

Dr. Ing.Vincent Suhartono Romi Satria Wahono, M.Eng Pembimbing Utama Pembimbing Pembantu

Dr. Abdul Syukur Direktur MTI UDINUS

Page 5: data mining fuzzy c-means

4

UNIVERSITAS DIAN NUSWANTORO

PENGESAHAN TESIS

JUDUL : PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS DENGAN ALGORITMA FUZZY C-MEANS

NAMA : BAHAR

NPM : P31.2008.00539

Tesis ini telah diujikan dan dipertahankan dihadapan Dewan Penguji pada Sidang

Tesis tanggal 16 Maret 2011. Menurut pandangan kami, Tesis ini memadai dari segi

kualitas maupun kuantitas untuk tujuan penganugrahan gelar

Magister Komputer (M.Kom.)

Semarang, 17 Maret 2011

Dewan Penguji:

Dr. Stefanus Santosa, M.Kom M. Arief Soeleman, M.Kom Ketua Anggota 1

Dr. Ing. Vincent Suhartono H. Himawan, M.Kom Pendamping Anggota 2

Page 6: data mining fuzzy c-means

5

ABSTRACT

Appropriate curriculum applicable across Indonesia, 10th grade high school student who went up to class 11 will experience a selection of majors (majors). Majors are available at the high school fields of interest include the Natural Sciences, Social Sciences, and Language Sciences. Majors will be tailored to students' abilities in areas of interest that exist, the aim for later in life, lessons will be given to students to be more focused because it has been in accordance with capability in the field of interest. One consideration for selecting students are majoring in determining student achievement in semesters one and two (grade 10) in the form of a score value. Less accurate election process majors with manual systems at high schools or cause the need for a use of computational methods to classify students majoring in the election process. Fuzzy C-Means algorithm is an algorithm that is easy and often used in data clustering technique kerana efsien make an estimate and does not require many parameters. Several studies have concluded that the Fuzzy C-Means algorithm can be used to classify data based on certain attributes. This research will be used Fuzzy C-Means algorithm to cluster high school student data based on the value of core subjects for the majors. This study also examined the accuracy of Fuzzy C-Means algorithm in determining the majors in high school.

Application of Fuzzy C-Means algorithm in determining the majors in high school students in 81 samples tested in this study show that the Fuzzy C-Means algorithm has a higher degree of accuracy (average 78.39%), compared with the method manually determining the direction has been done (only have an average accuracy level of 56.17%).

Keywords: Clustering, Majors Students, Completeness Minimum Criteria, Fuzzy C-Means

Page 7: data mining fuzzy c-means

6

ABSTRAK

Sesuai kurikulum yang berlaku di seluruh Indonesia, siswa kelas 10 SMA yang naik ke kelas 11 akan mengalami pemilihan jurusan. Penjurusan yang tersedia di SMA meliputi bidang minat Ilmu Alam, Ilmu Sosial, dan Ilmu Bahasa. Penjurusan akan disesuaikan dengan kemampuan siswa pada bidang minat yang ada, tujuannya agar kelak di kemudian hari, pelajaran yang akan diberikan kepada siswa menjadi lebih terarah karena telah sesuai dengan kemampuan pada bidang minatnya. Salah satu pertimbangan untuk menyeleksi siswa dalam menentukan jurusan adalah prestasi siswa pada semester satu dan dua (kelas 10) dalam bentuk skor nilai. Kurang akuratnya proses pemilihan jurusan dengan sistem manual pada Sekolah Menengah Atas menyebabkan perlunya suatu penggunaan metode komputasi untuk mengelompokkan siswa dalam proses pemilihan jurusan.

Algoritma Fuzzy C-Means merupakan satu algoritma yang mudah dan sering digunakan di dalam teknik pengelompokan data kerana membuat suatu perkiraan yang efsien dan tidak memerlukan banyak parameter. Beberapa penelitian telah menghasilkan kesimpulan bahwa algoritma Fuzzy C-Means dapat dipergunakan untuk mengelompokkan data berdasarkan atribut-atribut tertentu. Pada penelitian ini akan digunakan algoritma Fuzzy C-Means untuk mengelompokkan data siswa Sekolah Menengah Atas berdasarkan Nilai mata pelajaran inti untuk proses penjurusan. Penelitian ini juga menguji tingkat akurasi algoritma Fuzzy C-Means dalam penentuan jurusan pada Sekolah Menengah Atas.

Penerapan algoritma Fuzzy C-Means dalam penentuan jurusan di Sekolah Menengah Atas pada 81 sampel data siswa yang diuji dalam penelitian ini menunjukkan bahwa Algoritma Fuzzy C-Means memiliki tingkat akurasi yang lebih tinggi (rata-rata 78,39%), jika dibandingkan dengan metode penentuan jurusan secara manual yang selama ini dilakukan (hanya memiliki tingkat akurasi rata-rata 56,17 %).

Kata Kunci : Klastering, Penjurusan Siswa, Kriteria Ketuntasan Minimum Fuzzy C-Means

Page 8: data mining fuzzy c-means

7

ACKNOWLEDGMENTS Puji dan syukur kepada Tuhan Yang Maha Esa, karena atas berkat dan

rakhmat- Nya sehingga tesis dengan judul “Penentuan Jurusan Sekolah Menengah

Atas Dengan Algoritma Fuzzy C-Means” ini dapat diselesaikan dengan baik.

Disadari bahwa tanpa bantuan dan dukungan beberapa pihak, tesis ini tidak dapat

diselesaikan dengan baik. Oleh karena itu pada kesempatan ini diucapkan terima

kasih kepada:

1. Bapak DR. Abdul Syukur selaku Direktur Magister Teknik Informatika yang

telah memfasilitasi selama perkuliahan berlangsung hingga terselesaikannya

penulisan tesis ini.

2. Bapak DR. Ing. Vincent Suhartono dan bapak Romi Satria Wahono, M.Eng

selaku pembimbing tesis, yang telah meluangkan waktu dan mengarahkan

selama penyusunan tesis.

3. Seluruh Staf Pengajar Magister Teknik Informatika Universitas Dian

Nuswantoro, yang telah membagi pengetahuannya selama proses perkuliahan.

4. Seluruh Staf Administrasi Magister Teknik Informatika Universitas Dian

Nuswantoro, yang telah membantu urusan administratif selama proses

perkuliahan dan penyusunan tesis ini.

5. Staf Akademik SMA Negeri 2 Banjarbaru, yang telah membantu kelancaran

proses peneliatain.

6. Keluarga tercinta dan kawan-kawan yang telah membantu secara moril dan

materil selama perkuliahan dan penyusunan tesis ini.

Disadarari bahwa dalam penulisan tesis ini masih terdapat banyak kekurangan,

sehingga saran dan koreksi sangat dibutuhkan dalam proses penyempurnaannya.

Semoga tesis ini memberikan manfaat dalam pengembangan ilmu pengetahuan.

Semarang, Maret 2011

PENULIS

Page 9: data mining fuzzy c-means

8

DAFTAR ISI

Halaman HALAMAN JUDUL ..................................................................................................... i

PENGESAHAN STATUS TESIS ............................................................................... 1

PERNYATAAN PENULIS ........................................................................................ iii

PERSETUJUAN TESIS ............................................................................................. iv

PENGESAHAN TESIS ............................................................................................... v

ABSTRACT .................................................................................................................. vi

ABSTRAK ................................................................................................................. vii

ACKNOWLEDGMENTS ........................................................................................ viii

DAFTAR ISI ............................................................................................................... ix

DAFTAR GAMBAR ................................................................................................. 10

DAFTAR TABEL ................................................................................................... x10

BAB I. PENDAHULUAN ........................................................................................... 1

1.1. Latar Belakang ...................................................................................................... 1

1.2. Rumusan Masalah ................................................................................................. 5

1.3. Tujuan Penelitian .................................................................................................. 6

1.4. Manfaat Penelitian ................................................................................................ 6

1.5. Metode Penelitian ................................................................................................. 6

BAB II. LANDASAN TEORI ..................................................................................... 9

2.1. Tinjauan Studi ....................................................................................................... 9

2.2. Tinjauan Pustaka ................................................................................................. 10

2.2.1. Konsep Clustering dalam Data Mining ..................................................... 10

2.2.2. Algoritma Clustering ................................................................................. 13

2.2.3. Algoritma Fuzzy Clustering C-Means (FCM) ........................................... 15

2.2.4. Contoh Kasus Penerapan Fuzzy C-Means ................................................. 18

2.2.5. Sistem Penilaian dan Penjurusan di Sekolah Menengah Atas ................... 34

BAB III. METODOLOGI PENELITIAN ................................................................ 37

3.1. Metode Penelitian .............................................................................................. 37

3.1.1 Jenis Penelitian ........................................................................................ 37

Page 10: data mining fuzzy c-means

9

3.1.2 Metode Pengumpulan Data ..................................................................... 37

3.1.3 Metode Pengukuran ................................................................................ 43

3.2. Penerapan Fuzzy C-Means dalam Penentuan Jurusan ........................................ 43

BAB IV. HASIL DAN PEMBAHASAN ................................................................. 76

4.1. Hasil Penelitian ................................................................................................... 76

4.2. Pembahasan ......................................................................................................... 79

BAB V. KESIMPULAN DAN SARAN ................................................................... 84

5.1. Kesimpulan ......................................................................................................... 84

5.2. Saran ................................................................................................................... 84

DAFTAR PUSTAKA ................................................................................................ 86

Page 11: data mining fuzzy c-means

10

DAFTAR GAMBAR

Halaman Gambar 1.1 Skema Kerangka Pemikiran ......................................................................... 7

Gambar 2.1 Kategori Algoritma Clustering................................................................... 13

Gambar 2.2 Dendogram ................................................................................................. 14

Gambar 3.1 Diagram Korelasi Antar Mata Pelajaran dengan Peminatan ...................... 44

Gambar 3.2 Posisi Klaster Untuk Data Pertama (Peminatan IPA) ................................ 68

Gambar 3.3 Posisi Klaster Untuk Data Kedua (Peminatan IPS) ................................... 69

Gambar 3.3 Posisi Klaster Untuk Data Ketiga (Peminatan Bahasa) ............................. 70

Gambar 4.1 Garafik Akurasi Hasil Peminatan Algoritma FCM pada Peminatan di

SMA Tahun Pertama (Kelas XI) ................................................................ 83

Gambar 4.2 Garafik Akurasi Hasil Peminatan Algoritma FCM pada Peminatan di

SMA Tahun Kedua (Kelas XII) ................................................................. 83

Page 12: data mining fuzzy c-means

11

DAFTAR TABEL

Halaman

Tabel 1.1 Data Prestasi Siswa di Sebuah Sekolah Menengah Atas Setelah Proses

Penjurusan ........................................................................................................ 2

Tabel 2.1 Data Industri Kecil ......................................................................................... 18

Tabel 2.2 Hasil Perhitungan Pusat Klaster Pertama....................................................... 21

Tabel 2.3 Lanjutan Tabel 2.2 ........................................................................................ 22

Tabel 2.4 Detail Perhitungan Fungsi Objektif ............................................................... 23

Tabel 2.5 Lanjutan Tabel 2.4 ........................................................................................ 24

Tabel 2.6 Lanjutan Tabel 2.5 ......................................................................................... 25

Tabel 2.7 Detail Perhitungan Derajat Keanggotaan Baru ............................................. 26

Tabel 2.8 Lanjutan Tabel 2.7 ......................................................................................... 27

Tabel 2.9 Derajat Keanggotaan Tiap Data Pada Setiap Cluster dengan FCM .............. 33

Tabel 3.1 Sampel Data Nilai Rata-rata Siswa pada Bidang Minat Tertentu Sebelum

Peminatan ....................................................................................................... 38

Tabel 3.2 Sampel Data Nilai Rata-rata Siswa pada Bidang Minat Siswa Angkatan

2008 SMA N 2 Banjarbaru Tahun 2010 Setelah Peminatan ......................... 40

Tabel 3.3 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Klaster ke- ........47

Tabel 3.4 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Klaster ke-2.. ....50

Tabel 3.5 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Klaster ke-3... .....52

Tabel 3.6 Hasil Perhitungan Fungsi Objektif Pada Iterasi Pertama .............................. 55

Tabel 3.7 Hasil Perhitungan Derajat Keanggotaan Baru .............................................. 59

Tabel 3.8 Derajat Keanggotaan Tiap Data Pada Setiap Klaster Dengan FCM

Pada Iterasi Terakhir ..................................................................................... 73

Tabel 4.1 Hasil Peminatan yang Dipilih dan Hasil Peminatan yang Dihasilkan

Oleh FCM ..................................................................................................... 77

Tabel 4.2 Akurasi Hasil Peminatan Algoritma FCM .................................................... 80

Page 13: data mining fuzzy c-means

12

BAB I

PENDAHULUAN

1.1 Latar Belakang Dalam proses pendidikan di sekolah, perbedaan masing-masing siswa harus

diperhatikan karena dapat menentukan baik buruknya prestasi belajar siswa. Tujuan

sekolah yang mendasar adalah mengembangkan semua bakat dan kemampuan siswa

selama proses pendidikan. Perbedaan individual antara siswa di sekolah di antaranya

meliputi perbedaan kemampuan kognitif, motivasi berprestasi, minat dan kreativitas.

Dengan adanya perbedaan individu tersebut, maka fungsi pendidikan tidak hanya

dalam proses belajar mengajar, tetapi juga meliputi bimbingan/konseling, pemilihan

dan penempatan siswa sesuai dengan kapasitas individual yang dimiliki, rancangan

sistem pengajaran yang sesuai dan strategi mengajar yang disesuaikan dengan

karakteristik individu siswa. Kemungkinan yang akan terjadi jika siswa mengalami

kesalahan dalam penempatan yang tidak sesuai dengan kapasitas individual yang

dimiliki adalah rendahnya prestasi belajar siswa [1]. Oleh karena itu, manajemen

sekolah memegang peranan penting untuk dapat mengembangkan potensi diri yang

dimiliki oleh siswa.

Penempatan siswa sesuai dengan kapasitas kemampuannya atau sering disebut

dengan penjurusan siswa di sekolah menengah ditentukan oleh kemampuan

akademik yang didukung oleh faktor minat, karena karakteristik suatu ilmu menuntut

karakteristik yang sama dari yang mempelajarinya. Dengan demikian, siswa yang

mempelajari suatu ilmu yang sesuai dengan karakteristik kepribadiannya akan

merasa senang ketika mempelajari ilmu tersebut. Minat dapat mempengaruhi kualitas

pencapaian hasil belajar siswa dalam bidang studi tertentu. Seorang siswa yang

berminat pada Matematika misalnya, akan memusatkan perhatiannya lebih banyak

ke bidang Matematika daripada siswa lain. Karena pemusatan perhatian

intensif terhadap materi, siswa akan belajar lebih giat dan mencapai prestasi yang

diinginkan [1].

Sesuai kurikulum yang berlaku di seluruh Indonesia, siswa kelas X SMA yang

naik ke kelas XI akan mengalami pemilihan jurusan (penjurusan). Penjurusan yang

tersedia di SMA meliputi Ilmu Alam (IPA), Ilmu Sosial (IPS), dan Ilmu Bahasa.

Penjurusan akan disesuaikan dengan kemampuan dan minat siswa. Tujuannya adalah

Page 14: data mining fuzzy c-means

13

agar kelak di kemudian hari, pelajaran yang akan diberikan kepada siswa menjadi

lebih terarah karena telah sesuai dengan kemampuan dan minatnya. Salah satu

pertimbangan untuk menyeleksi siswa dalam menentukan jurusan adalah prestasi

siswa pada semester satu dan dua (kelas X) dalam bentuk nilai mata pelajaran[1].

Proses penjurusan diselenggarakan untuk menyeleksi dan mengumpulkan

kemampuan peserta didik yang sama untuk menempuh satu program pendidikan

yang sama juga. Disamping itu, penjurusan juga diselenggarakan untuk

menyesuaikan kemampuan dan minat peserta didik terhadap bidang yang dipilihnya.

Penempatan penjurusan yang sesuai akan meningkatkan minat dan memberikan

kenyamanan seseorang dalam belajar. Dengan dasar kemampuan yang sama

diharapkan dalam kegiatan pembelajaran dapat berjalan dengan lancar tanpa ada

yang mengalami kesulitan dan dapat meningkatkan minat serta prestasi belajar

peserta didik. Sebaliknya, kurangnya minat untuk belajar akibat kesalahan dalam

memilih jurusan menyebabkan kelesuan dan hilangnya gairah dalam belajar. Peserta

didik sering tidak masuk belajar, membuat kelas gaduh, meninggalkan jam pelajaran

dan sebagainya sehingga menyebabkan prestasinya menurun[2].

Tabel 1.1 berikut ini memperlihatkan data prestasi siswa di sebuah Sekolah

Menengah Atas setelah proses penjurusan dilaksanakan:

Tabel 1.1 Data Prestasi Siswa di Sebuah Sekolah Menengah Atas Setelah Proses Penjurusan (Peminatan)

Kelas XI Kelas XII

1 Bahasa 75,50 74,20

2 IPS 77,00 75,50

3 IPA 75,50 78,00

4 Bahasa 72,00 74,50

5 IPA 72,80 71,50

6 IPA 71,50 74,50

7 IPS 69,00 65,50

8 IPA 70,50 72,50

9 Bahasa 76,25 75,50

10 Bahasa 74,50 72,50

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/ PenjurusanSiswa

Jurusan Yang Dipilih

Page 15: data mining fuzzy c-means

14

Kelas XI Kelas XII

11 Bahasa 78,00 76,50

12 IPS 73,00 74,80

13 IPS 71,50 74,00

14 IPS 67,50 65,00

15 Bahasa 75,50 69,50

16 IPA 84,30 81,30

17 IPS 80,70 82,50

18 Bahasa 76,00 80,50

19 Bahasa 81,50 82,50

20 IPA 74,00 71,00

21 IPA 69,50 73,50

22 IPS 82,50 79,50

23 IPS 72,50 70,75

24 Bahasa 65,50 70,50

25 IPA 66,00 68,30

26 IPS 78,00 76,50

27 IPA 72,50 71,00

28 Bahasa 71,00 67,50

29 Bahasa 82,00 80,00

30 IPA 72,50 67,80

31 Bahasa 71,90 73,50

32 IPA 80,70 75,50

33 Bahasa 80,50 88,50

34 IPS 82,75 80,50

35 IPS 83,50 81,50

36 IPA 78,20 75,50

37 IPA 74,50 72,00

38 Bahasa 79,00 81,30

39 IPS 70,70 72,00

40 IPS 69,50 77,50

41 IPA 79,50 70,30

42 IPS 75,80 72,30

43 Bahasa 80,50 82,50

44 IPS 78,50 75,80

45 IPA 74,50 72,80

46 IPA 74,00 72,70

47 IPA 73,60 71,80

SiswaJurusan Yang

Dipilih

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/ Penjurusan

Page 16: data mining fuzzy c-means

15

Kelas XI Kelas XII

48 Bahasa 73,80 74,50

49 Bahasa 78,50 82,00

50 IPA 80,50 79,40

51 IPS 77,50 80,00

52 Bahasa 85,00 81,70

53 Bahasa 73,80 69,80

54 IPA 75,50 80,60

55 IPA 83,60 84,50

56 Bahasa 78,50 82,60

57 IPS 79,60 75,50

58 IPS 74,20 72,50

59 Bahasa 75,80 77,00

60 IPA 70,50 74,30

61 Bahasa 75,00 75,20

62 IPA 78,10 75,80

63 IPS 77,50 81,20

64 Bahasa 66,90 68,20

65 Bahasa 74,50 74,00

66 IPA 77,60 78,00

67 IPS 79,00 80,60

68 IPA 77,50 78,00

69 IPS 80,20 82,80

70 Bahasa 76,40 78,10

71 IPS 74,00 74,50

72 IPA 70,80 69,50

73 IPA 84,20 82,50

74 IPS 75,80 75,00

75 IPS 87,60 82,80

76 Bahasa 74,50 72,10

77 Bahasa 75,80 77,10

78 IPA 72,40 74,00

79 IPA 78,60 82,10

80 Bahasa 80,20 79,60

81 IPS 67,80 74,00

SiswaJurusan Yang

Dipilih

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/ Penjurusan

Sumber: Akademik SMU Negeri 2 Banjarbaru, 2010

Page 17: data mining fuzzy c-means

16

Data pada tabel 1.1 memperlihatkan 81 sampel data dari 115 anggota

populasi siswa kelas X yang telah melaksanakan penjurusan. Pada tabel tersebut,

ada 42 siswa (41,98%) saat di kelas XI dan 46 siswa (45,68%) saat di kelas XII yang

memiliki nilai rata-rata Mata Pelajaran peminatan kurang dari Kriteria Ketuntasan

Minimal (KKM) yang ideal sebesar 75 [3].

Pembentukan klaster atau kelompok data merupakan salah satu teknik yang

digunakan dalam mengekstrak pola kecenderungan suatu data. Analisis klaster atau

klastering merupakan proses membagi data dalam suatu himpunan ke dalam

beberapa kelompok yang kesamaan datanya dalam suatu kelompok lebih besar

daripada kesamaan data tersebut dengan data dalam kelompok lain[4]. Suatu cara

yang sangat terkenal dalam pengklasteran data set adalah dengan penerapan

algoritma klastering [5]. Ada beberapa algoritma klastering data, salah satu

diantaranya adalah Fuzzy C-Means. Penelitian yang dilakukan oleh Ernawati dan

Susanto [6] mengkaji tentang penerapan Fuzzy Clustering untuk membagi peserta

kuliah berdasarkan nilai mata kuliah prasyarat/pendukung yang pernah mereka

peroleh. Penelitian ini berhasil membagi kelas para peserta kuliah sebagai hasil

penerapan algoritma Fuzzy Clustering, dan merekomendasikan peserta kelas dengan

valid.

Penelitian ini akan menganalisis penerapan algoritma Fuzzy Clustering

C-Means untuk pengelompokan siswa Sekolah Menengah Atas (SMA) dalam

penentuan jurusan berdasarkan prestasi siswa.

1.2 Rumusan Masalah

Berdasarkan uraian pada latar belakang, dirumuskan suatu permasalahan

yaitu rendahnya prestasi akademik siswa Sekolah Menengah Atas (SMA) pada

kelompok mata pelajaran peminatan akibat salah memilih bidang minat (jurusan)

yang sesuai dengan kemampuan akademik pada saat proses peminatan (penjurusan).

Penggunaan metode Fuzzy Clustering C-Means akan menjadi solusi yang diharapkan

lebih tepat dan akurat dalam pemilihan jurusan di SMA berdasarkan kemampuan

akademik siswa.

Page 18: data mining fuzzy c-means

17

1.3 Tujuan Penelitian Penelitian ini bertujan untuk menerapkan algoritma Clustering Fuzzy

C-Means untuk mengelompokkan siswa Sekolah Menengah Atas (SMA)

berdasarkan nilai (prestasi) akademik mata pelajaran peminatan dalam proses

penentuan jurusan.

1.4 Manfaat Penelitian

Manfaat yang diharapkan dari hasil penelitian ini adalah sebagai berikut:

1. Manfaat teoritis: diharapkan dapat menjadi referensi untuk penggunaan model

Algoritma Clustering Fuzzy C-Means bagi praktisi atau peneliti lain untuk

diterapkan pada kasus penelitian yang lain, dengan melihat karakteristik

penggunaan algoritma ini dalam pengolahan (pengelompokan) data siswa SMA

untuk pemilihan jurusan berdasarkan nilai prestasi akademik.

2. Manfaat praktis: diharapkan dapat membantu pihak sekolah (khususnya

manajemen Sekolah Menengah Atas) untuk meningkatkan akurasi dalam proses

pengelompokan siswa dalam pemilihan jurusan berdasarkan nilai prestasi siswa.

3. Manfaat kebijakan: diharapkan metode Fuzzy C-Means akan menjadi metode

standar yang digunakan oleh jajaran manajemen Sekolah Menengah Atas (SMU)

dalam proses penjurusan siswa.

1.5 Metode Penelitian Secara umum metode penelitian yang telah dilaksanakan mengacu pada

kerangka pemikiran seperti pada gambar 1.1:

Page 19: data mining fuzzy c-means

18

Gambar 1.1 Skema Kerangka Pemikiran

1. Identifikasi Permasalahan: merupakan studi pendahuluan untuk mengkaji

permasalahan pada proses pengelompokan siswa SMA berdsarkan nilai

prestasi akademik dalam proses penjurusan.

2. Pendekatan dalam Penyelelesaian Masalah: merupakan tahapan menemukan

metode yang tepat dalam penyelesaian permasalahan berdasarkan kajian

pustaka. Algoritma Clustering Fuzzy C-Means , yang sudah teruji melalui

beberapa penelitian untuk kasus pengelompokan data akan diuji coba dalam

pengelompokan data nilai prestasi akademik untuk proses penjurusan siswa.

3. Penerapan dan Pengujian serta analisis hasil: merupakan tahapan proses

pengujian hasil klaster metode Fuzzy C-Means dalam mengelompokan

siswa SMA berdasarkan nilai prestasi akademik dalam proses penjurusan,

Proses Pemilihan Jurusan (Penjurusan) di Sekolah Menengah Atas Berdasarkan Nilai (Prestasi) Akademik Siswa Tidak Akurat

Pengelompokan siswa SMA dalam Proses Pemilihan Jurusan Berdasarkan Nilai Akademik menggunakan Algoritma Fuzzy C-Means

Tools

Activity Diagram dan Software MATLAB

HASIL

Manajemen akademik Sekolah Menengah Atas (SMA) Akurat dalam melakukan penjurusan siswa berdasarkan nilai prestasi akademik

Pendekatan Komputasi

Pengujian dan Analisis

Uji dan Analisis komparasi hasil klastering algoritma Fuzzy C-Means dengan data empiris Penjurusan di Sekolah Menengah Atas (SMA)

Masalah

Page 20: data mining fuzzy c-means

19

dengan data traning berupa data nilai prestasi akademik siswa kelas X. Hasil

penerapan metode Fuzzy C-Means diuji dengan uji komparasi terhadap

kondisi real hasil Penjurusan di SMA.

4. Penarikan kesimpulan hasil penelitian

Page 21: data mining fuzzy c-means

20

BAB II LANDASAN TEORI

2.1 Tinjauan Studi

Ernawati dan Susanto dari Program Studi Teknik Informatika Universitas

Atma Jaya Yogyakarta, meneliti tentang penerapan Fuzzy Clustering untuk

pembagian kelas peserta kuliah [ 6]. Penelitian ini menggunakan sampel 121 orang

mahasiswa Jurusan Teknik Informatika Universitas Atma Jaya Yogyakarta yang

menempuh perkuliahan Struktur Data Lanjut. Setiap mahasiswa dicirikan oleh dua

atribut, yaitu nilai yang pernah mereka peroleh untuk dua mata kuliah prasyarat

(Algoritma dan Pemrograman dan Struktur Data). Dalam pembahasan untuk menilai

anggota kelompok yang sah dan valid, menggunakan ukuran Fukuyama-Sugeno’s

Fuzzy Cluster Validity Index. Hasil dari penelitian ini adalah pembagian kelas para

peserta kuliah sebagai hasil penerapan algoritma Fuzzy Clustering terhadap data ke-

121 peserta mata kuliah Struktur Data Lanjut untuk pelbagai kemungkinan jumlah

kelas, dan rekomendasi peserta kelas yang valid.

Arwan Ahmad Khoiruddin dari Jurusan Teknik Informatika Universitas

Islam Indonesia, meneliti tentang Penentuan Nilai Akhir Kuliah dengan Fuzzy C-

Means [7]. Penelitian menyimpulkan bahwa metode Fuzzy C-Means dapat digunakan

untuk menentukan nilai akhir kuliah secara alami karena didasarkan pada

kecenderungan masing-masing data pada clusternya.

Emha Taufiq Luthfi dari STMIK Amikom Yogyakarta, meneliti tentang

algoritma Fuzzy C-Means untuk Clustering Data Performance Mengajar Dosen [8].

Dalam penelitian tersebut dilakukan percobaan untuk mengetahui kemungkinan

adanya cluster-cluster dari data performance mengajar dosen. Penelitian

menggunakan beberapa kriteria sebagai acuan dalam proses clustering yaitu:

penguasaan dan kemampuan dalam menjelaskan materi, kemampuan dalam

menjawab pertanyaan, kemampuan dalam member motivasi mahasiswa, kemampuan

dalam membuat suasana kelas menyenangkan dan kedisiplinan hadir dalam

perkuliahan. Penelitian ini berhasil memunculkan beberapa custer data yang dapat

dianalisis lebih lanjut persamaan dan perbedaannya. Dari 4 pusat cluster yang di set

Page 22: data mining fuzzy c-means

21

di awal iterasi, ada 2 cluster yang mempunyai nilai sama, yaitu cluster 3 dan cluster

4, dengan demikian hanya dihasilkan 3 buah cluster performance mengajar dosen.

2.2 Tinjauan Pustaka 2.2.1 Konsep Clustering dalam Data Mining Konsep dasar data mining adalah menemukan informasi tersembunyi dalam

sebuah basis data dan merupakan bagian dari Knowledge Discovery in Databased

(KDD) untuk menemukan informasi dan pola yang berguna dalam data [9]. Data

mining mencari informasi baru, berharga dan berguna dalam sekumpulan data

dengan melibatkan komputer dan manusia serta bersifat iteratif baik melalui proses

yang otomatis ataupun manual. Secara umum sifat data mining adalah:

a. Predictive: menghasilkan model berdasarkan sekumpulan data yang dapat

digunakan untuk memperkirakan nilai data yang lain. Metode yang termasuk

dalam prediktif data mining adalah:

- Klasifikasi: pembagian data ke dalam beberapa kelompok yang telah

ditentukan sebelumnya

- Regresi: memetakan data ke suatu prediction variable

- Time Series Analisys: pengamatan perubahan nilai atribut dari waktu ke

waktu

b. Descriptive: mengidentifikasi pola atau hubungan dalam data untuk

menghasilkan informasi baru. Metode yang termasuk dalam Descriptive Data

Mining adalah:

- Clustering: identifikasi kategori untuk mendeskripsikan data

- Association Rules: Identifikasi hubungan antar data yang satu dengan

yang lainnya.

- Summarization: pemetaan data ke dalam subset dengan deskripsi

sederhana.

- Sequence Discovery: identifikasi pola sekuensial dalam data

Clustering membagi data menjadi kelompok-kelompok atau cluster

berdasarkan suatu kemiripan atribut-atribut diantara data tersebut [9]. Karakteristik

tiap cluster tidak ditentukan sebelumnya, melainkan tercermin dari kemiripan data

Page 23: data mining fuzzy c-means

22

yang terkelompok di dalamnya. Oleh sebab itu hasil clustering seringkali perlu

diinterprestasikan oleh pihak-pihak yang benar-benar mengerti mengenai karakter

domain data tersebut. Selain digunakan sebagai metode yang independen dalam data

mining, clustering juga digunakan dalam pra-pemrosesan data sebelum data diolah

dengan metode data mining yang lain untuk meningkatkan pemahaman terhadap

domain data.

Karakteristik terpenting dari hasil clustering yang baik adalah suatu instance

data dalam suatu cluster lebih ”mirip” dengan instance lain di dalam cluster tersebut

daripada dengan instance di luar dari cluster itu [10]. Ukuran kemiripan (similarity

measure) tersebut bisa bermacam-macam dan mempengaruhi perhitungan dalam

menentukan anggota suatu cluster. Jadi tipe data yang akan di-cluster (kuantitatif

atau kualitatif) juga menentukan ukuran apa yang tepat digunakan dalam suatu

algoritma. Selain kemiripan antar data dalam suatu cluster, clustering juga dapat

dilakukan berdasarkan jarak antar data atau cluster yang satu dengan yang lainnya.

Ukuran jarak (distance atau dissimilarity measure) yang merupakan kebalikan dari

ukuran kemiripan ini juga banyak ragamnya dan penggunaannya juga tergantung

pada tipe data yang akan di-cluster. Kedua ukuran ini bersifat simetris, dimana jika A

dikatakan mirip dengan B maka dapat disimpulkan bahwa B mirip dengan A.

Ada beberapa macam rumus perhitungan jarak antar cluster. Untuk Tipe data

numerik, sebuah data set X beranggotakan x1 ∈ X, i = 1, ..., n, tiap item

direpresentasikan sebagai vektor X1= {Xi1, Xi2, Xim} dengan m sebagai jumlah

dimensi dari item. Rumus-rumus yang biasa digunakan sebagai ukuran jarak antara

Xi dan Xj untuk data numerik ini antara lain:

a. Euclidean Distance

��(��� − ��)��� � �

�� … … … … … … … … … … … … … … … (2.1)

Ukuran ini sering digunakan dalam clustering karena sederhana. Ukuran ini

memiliki masalah jika skala nilai atribut yang satu sangat besar dibandingkan

nilai atribut lainnya. Oleh sebab itu, nilai-nilai atribut sering dinormalisasi

sehingga berada dalam kisaran 0 dan 1.

Page 24: data mining fuzzy c-means

23

b. City Block Distance atau Manhattan Distance

����� − ��� … … … … … … … … … … … … … … … … … (2.2)�� �

Jika tiap item digambarkan sebagai sebuah titik dalam grid, ukuran jarak ini

merupakan banyak sisi yang harus dilewati suatu titik untuk mencapai titik

yang lain seperti halnya dalam sebuah peta jalan.

c. Minkwoski Metric

��(��� − ��)��� � �

�� … … … … … … … … … … … . . … … . . (2.3)

Ukuran ini merupakan bentuk umum dari Euclidean Distance dan

Manhattan Distance. Euclidean Distance adalah kasus dimana nilai p=2

sedangkan Manhattan Distance merupakan bentuk Minkwoski dengan p=1.

Dengan demikian, lebih banyak nilai numerik yang dapat ditempatkan pada

jarak terjauh di antara 2 vektor. Seperti pada Euclidean Distance dan juga

Manhattan Distance, ukuran ini memiliki masalah jika salah satu atribut

dalam vektor memiliki rentang yang lebih besar dibandingkan atribut-atribut

lainnya.

d. Cosine – Corelation (ukuran kemiripan dari model Euclidean n-dimensi)

∑ (����� � . ��)�∑ ���� . ∑ ����� �

… … … … … … … … … … … … … … … … . . … (2.4)

Ukuran ini bagus digunakan pada data dengan tingkat kemiripan tinggi

walaupun sering pula digunakan bersama pendekatan lain untuk membatasi

dimensi dari permasalahan.

Dalam mendefenisikan ukuran jarak antar cluster yang digunakan beberapa

algoritma untuk menentukan cluster mana yang terdekat, perlu dijelaskan mengenai

atribut-atribut yang menjadi referensi dari suatu cluster [10]. Untuk suatu cluster Km

berisi N item {Xm1, Xm2, ..., Xmn}:

Page 25: data mining fuzzy c-means

24

- Centroid: suatu besaran yang dihitung dari rata-rata nilai dari setiap item

dari suatu cluster menurut rumus:

�� = ∑ |���|�� � … … … … … … … … … … … … … … … … … . . (2.5)

- Medoid: item yang letaknya paling tengah Metode-metode untuk mencari jarak antar cluster:

- Single Link: jarak terkecil antar suatu elemen dalam suatu cluster dengan

elemen lain di cluster yang berbeda.

- Complete Link: jarak terbesar antar satu elemen dalam suatu cluster

dengan elemen lain di cluster yang berbeda.

- Average: jarak rata-rata antar satu elemen dalam suatu cluster dengan

elemen lain di cluster yang berbeda

- Centoid: jarak antar centroid dari tiap cluster dengan centroid cluster

lainnya.

- Medoid: jarak antar medoid dari tiap cluster dengan medoid cluster

lainnya.

2.2.2 Algoritma Clustering

Secara umum pembagian algoritma clustering dapat digambarkan sebagai

berikut:

Gambar 2.1 Kategori Algoritma Clustering

Clustering

Hierarchical Partitional Clustering Large Data

Agglomerative Divisive

Page 26: data mining fuzzy c-means

25

Hierarchical clustering menentukan sendiri jumlah cluster yang dihasilkan.

Hasil dari metode ini adalah suatu struktur data berbentuk pohon yang disebut

dendogram dimana data dikelompokkan secara bertingkat dari yang paling bawah

dimana tiap instance data merupakan satu cluster sendiri, hingga tingkat paling atas

dimana keseluruhan data membentuk satu cluster besar berisi cluster-cluster seperti

gambar 2.2

Gambar 2.2 Dendogram

Divisive hierarchical clustering mengelompokkan data dari kelompok yang terbesar

hingga ke kelompok yang terkecil, yaitu masing-masing instance dari kelompok data

tersebut. Sebaliknya, agglomerative hierarchical clustering mulai mengelompokkan

data dari kelompok yang terkecil hingga kelompok yang terbesar [10]. Beberapa

algoritma yang menggunakan metode ini adalah: RObust Clustering Using LinKs

(ROCK), Chameleon, Cobweb, Shared Nearest Neighbor (SNN).

Partitional clustering yang mengelompokkan data ke dalam k cluster dimana

k adalah banyaknya cluster dari input user. Kategori ini biasanya memerlukan

pengetahuan yang cukup mendalam tentang data dan proses bisnis yang

memanfaatkannya untuk mendapatkan kisaran nilai input yang sesuai. Beberapa

algoritma yang masuk dalam kategori ini antara lain: K-Means, Fuzzy C-Means,

Clustering Large Aplications (CLARA), Expectation Maximation (EM), Bond

Energy Algorithm (BEA), algoritma Genetika, Jaringan Saraf Tiruan.

A B C D E

1

2

3

4

Page 27: data mining fuzzy c-means

26

Clustering Large Data, dibutuhkan untuk melakukan clustering pada data

yang volumenya sangat besar sehingga tidak cukup ditampung dalam memori

komputer pasa suatu waktu. Biasanya untuk mengatasi masalah besarnya volume

data, dicari teknik-teknik untuk meminimalkan berapa kali algoritma harus membaca

seluruh data. Beberapa algoritma yang masuk dalam kategori ini antara lain:

Balanced Iteratif Reducing and clustering using hierarchies (BIRCH), Density

Based Spatial Clustering of Application With Noise (DCSCAN), Clustering

Categorical Data Using Summaries (CACTUS).

2.2.3 Algoritma Fuzzy Clustering C-Means (FCM)

Pada proses pengklasteran (clustering) secara klasik (misalnya pada

algoritma Clustering K-Means), pembentukan partisi dilakukan sedemikian rupa

sehingga setiap obyek berada tepat pada satu partisi. Namun, adakalanya tidak dapat

menempatkan suatu obyek tepat pada suatu partisi, karena sebenarnya obyek tersebut

terletak di antara 2 atau lebih partisi yang lain. Pada logika fuzzy, metode yang dapat

digunakan untuk melakukan pengelompokan sejumlah data dikenal dengan nama

fuzzy clustering. Fuzzy Clustering lebih alami jika dibandingkan dengan

pengklasteran secara klasik. Suatu algoritma clustering dikatakan sebagai fuzzy

clustering jika algoritma tersebut menggunakan parameter strategi adaptasi secara

soft competitive. Sebagian besar algoritma fuzzy clustering didasarkan atas optimasi

fungsi obyektif atau modifikasi dari fungsi obyektif tersebut [11].

Salah satu teknik fuzzy clustering adalah Fuzzy C-Means (FCM). FCM adalah

suatu teknik pengklasteran data yang keberadaan tiap-tiap data dalam suatu cluster

ditentukan oleh nilai/derajat keanggotaan tertentu. Teknik ini pertama kali

diperkenalkan oleh Jim Bezdek pada tahun 1981 [11]. Berbeda dengan teknik

pengklasteran secara klasik (dimana suatu obyek hanya akan menjadi anggota suatu

klaster tertentu), dalam FCM setiap data bisa menjadi anggota dari beberapa cluster.

Batas-batas cluster dalam FCM adalah lunak (soft). Konsep dasar FCM, pertama

kali adalah menentukan pusat cluster yang akan menandai lokasi rata-rata untuk tiap-

tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap data

memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki

Page 28: data mining fuzzy c-means

27

pusat cluster dan nilai keanggotaan tiap-tiap data secara berulang, maa akan terlihat

bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini

didasarkan pada minimasi fungsi obyektif. Fungsi Obyektif yang digunakan pada

FCM adalah[11]:

Jw(U,V;X) = ∑ ∑ ("#$)%(&#$)' … … … … … … … … … … … … … . … . . ((# )*$ ) 2.6)

dengan + ∈ ,1, ∞), &#$ = &(/$ − 0#) = 1 ∑ (/$2 − 30#2456 … … … … … … … … … . … … … … (72 ) 32.7)

x adalah data yang akan diklaster:

/ = 8/)) ⋯ /)7⋮ ⋮/*) ⋯ /*7; …………………………….…………………… (2.8)

dan v adalah matriks pusat cluster :

0 = 8 0)) ⋯ 0)7⋮ ⋮07) ⋯ 077; ………………………………………………… (2.9)

nilai Jw terkecil adalah yang terbaik, sehingga:

<%∗ (>∗, ?∗; A) = min <(>, ?, A) …………………………………………(2.10)

Jika &#$ > 0, ∀H, I; + > 1 dan X setidaknya memiliki m elemen, maka (>, ?) ∈ JK7 / L7M dapat meminimasi Jw hanya jika:

"#$ = N∑ OPQR S TUR V6WRX5 Y Z5[Z5∑ N∑ OPQR S TUR V6WRX5 YWUX5

Z5[Z5; 1 ≤ i ≤ m; 1 ≤ k ≤ n ………………………..…(2.11)

dan

?$2 = ∑ ((\QU)[]QX5 ∗ PQR )∑ (\QU)[]QX5 ; 1 ≤ i ≤ m; 1 ≤ j ≤ m ……………………………………(2.12)

Page 29: data mining fuzzy c-means

28

Algoritma Fuzzy C-Means (FCM) diberikan sebagai berikut [12]:

1. Menentukan data yang akan di cluster X, berupa matriks berukuran n x m

(n=jumlah sampel data, m = atribut setiap data). Xij = data sampel ke-i

(i=1,2,...,n), atribut ke-j (j=1,2,...,m).

2. Menentukan:

- Jumlah cluster = c

- Pangkat = w

- Maksimum interasi = MaxIter

- Error terkecil yang diharapkan = ξ

- Fungsi objektif awal = Po = 0

- Interasi awal = t =1

3. Membangkitkan bilangan random µik, i=1,2,3 ..., n; k=1,2,3 ...c; sebagai

elemen-elemen matriks partisi awal U.

Menghitung jumlah setiap kolom: ^# ∑ \QU _UX5 dengan j=1,2,...n.

Menghitung:

"#$ = \QU`Q

4. menghitung pusat cluster ke-k: Vkj, dengan k=1,2,...c; dan j=1,2,...m

?$2 = ∑ ((\QU)[]QX5 ∗ PQR )∑ (\QU)[]QX5

5. menghitung fungsi objektif pada interasi ke-t : ab ∑ ∑ cN∑ OPQR S TUR V6WRX5 Y(\QU)[d_UX5]QX5

6. menghitung perubahan matriks partisi :

"#$ = N∑ OPQR S TUR V6WRX5 Y Z5[Z5∑ N∑ OPQR S TUR V6WRX5 Y_UX5

Z5[Z5 …………………….……( 2.17)

……………......…… ( 2.16)

…………...……………..………( 2.15)

…………...……………..………………………..…( 2.14)

…………...…………………...………..………( 2.13)

Page 30: data mining fuzzy c-means

29

dengan: i=1,2,...n; dan k=1,2,...c.

7. Memeriksa kondisi berhenti:

- Jika: (|Pt – Pt-1|< ξ) atau (t > MaxIter) maka berhenti

- Jika tidak: t=t+1, mengulang langkah ke-4.

2.2.4 Contoh Kasus Penerapan Fuzzy C-Means

Misalkan pada suatu Pemerintah Daerah di sutau kabupaten mendata 30

industri kecil di lingkungannya berdasarkan modal awal yang mereka miliki, rata-

rata penjualan per bulan dan rata-rata laba setiap bulan. Data lengkap disajikan pada

tabel 2.1 berikut [12]:

Tabel 2.1 Data Industri Kecil

No Modal Awal

(Rp) Rata-rata Penjualan

per Bulan (Rp)

Lama Beroperasi

(Bulan)

Rata-rata Laba per Bulan (Rp)

1 15.000.000 25.000.000 42 5.000.000 2 20.000.000 26.420.000 72 5.230.000 3 17.820.000 22.025.000 35 5.200.000 4 16.205.000 18.500.000 12 4.250.000 5 8.000.000 15.200.000 5 3.500.000 6 14.260.000 19.640.000 15 4.023.000 7 7.025.000 15.230.000 19 5.000.000 8 25.032.000 34.000.000 28 8.000.000 9 24.320.000 35.100.000 39 12.500.000 10 25.602.000 38.200.000 43 13.250.000 11 19.872.000 28.000.000 27 10.500.000 12 19.000.000 25.000.200 41 6.350.000 13 16.540.200 30.000.200 29 7.525.000 14 28.920.000 41.000.000 58 15.620.000 15 15.870.200 26.750.000 19 4.025.000 16 26.840.320 39.000.200 47 13.025.000 17 24.601.200 38.450.000 64 11.000.250 18 21.650.000 37.525.000 60 9.850.000 19 18.602.000 30.500.000 74 11.230.000 20 35.024.000 52.000.000 73 18.230.000

Page 31: data mining fuzzy c-means

30

Untuk memberikan pengarahan lebih intensif ke setiap industri kecil,

pemerintah kabupaten tersebut membagi industri-industri ini menjadi beberapa

kelompok, di mana setiap kelompok terdiri atas industri-industri dengan latar

belakang modal, rata-rata penjualan dan rata-rata laba yang senada.

Apabila diinginkan industri-industri tersebut terbagi dalam 5 kelompok, maka

dengan menggunakan algoritma Fuzzy C-Means (FCM) clustering dapat ditetapkan

nilai awal sebagai berikut:

1. Jumlah cluster (c) = 5

2. Pangkat (w) = 2

3. Maksimum interasi (MaxIter) = 100

4. Error terkecil yang diharapkan (ξ) = 10-5

5. Fungsi objektif awal (ae) = 0

6. Interasi Awal (t) = 1

Misalnya matrik partisi awal U yang terbentuk (secara random) adalah sebagai

berikut :

No Modal Awal

(Rp) Rata-rata Penjualan

per Bulan (Rp)

Lama Beroperasi

(Bulan)

Rata-rata Laba per Bulan (Rp)

21 39.024.300 52.050.000 26 15.725.000 22 27.500.000 36.500.000 6 10.560.000 23 32.500.500 45.600.000 10 16.583.000 24 27.963.000 40.250.000 38 13.670.000 25 37.250.020 51.000.000 68 18.530.000 26 16.523.000 26.750.000 9 8.500.000 27 25.690.000 39.565.000 48 15.250.000 28 34.500.000 51.065.000 37 21.500.000 29 9.850.000 1.350.000 13 2.000.000 30 16.950.000 24.580.000 18 4.500.000

Page 32: data mining fuzzy c-means

31

0,198 0,302 0,144 0,329 0,027 0,153 0,188 0,258 0,201 0,199 0,149 0,219 0,277 0,029 0,326 0,290 0,191 0,080 0,277 0,163 0,267 0,154 0,351 0,026 0,202 0,132 0,387 0,151 0,306 0,024 0,144 0,202 0,176 0,228 0,250 0,034 0,266 0,224 0,235 0,242 0,290 0,087 0,118 0,271 0,233 0,046 0,068 0,208 0,314 0,364 0,312 0,205 0,113 0,164 0,205 0,063 0,323 0,372 0,232 0,011 0,308 0,231 0,266 0,035 0,161 0,141 0,062 0,313 0,315 0,169 0,300 0,046 0,273 0,241 0,139 0,221 0,338 0,228 0,088 0,125 0,087 0,227 0,189 0,214 0,283 0,040 0,176 0,340 0,098 0,347 0,105 0,250 0,216 0,198 0,231 0,392 0,142 0,167 0,128 0,171 0,129 0,178 0,227 0,327 0,138 0,066 0,261 0,274 0,009 0,390 0,262 0,102 0,095 0,257 0,284 0,273 0,131 0,250 0,125 0,222 0,315 0,063 0,150 0,198 0,273 0,284 0,230 0,222 0,044 0,221

Pada Interasi pertama, dengan menggunakan persamaan 2.15:

?$2 = ∑ (("#$)'fg# ) ∗ A#2 )∑ ("#$)'fg# )

U =

Page 33: data mining fuzzy c-means

32

V =

Dapat dihitung 5 pusat cluster, ?$2 dengan k = 1,2,...,5; dan j = 1,2,3,4 dengan hasil

sebagai berikut :

Berikut adalah hasil perhitungan pusat cluster selengkapnya untuk pusat

cluster yang pertama:

Tabel 2.2 Hasil Perhitungan Pusat Cluster Pertama

Derajat Keanggotaan

Cluster 1

Data yang di Cluster

µi1 Xi1 Xi2 Xi3 Xi4 0,198 15.000.000 25.000.000 42 5.000.000 0,153 20.000.000 26.420.000 72 5.230.000 0,149 17.820.000 22.025.000 35 5.200.000 0,290 16.205.000 18.500.000 12 4.250.000 0,267 8.000.000 15.200.000 5 3.500.000 0,132 14.260.000 19.640.000 15 4.023.000 0,144 7.025.000 15.230.000 19 5.000.000 0,034 25.032.000 34.000.000 28 8.000.000 0,29 24.320.000 35.100.000 39 12.500.000 0,046 25.602.000 38.200.000 43 13.250.000 0,312 19.872.000 28.000.000 27 10.500.000 0,063 19.000.000 25.000.200 41 6.350.000 0,308 16.540.200 30.000.200 29 7.525.000 0,141 28.920.000 41.000.000 58 15.620.000 0,300 15.870.200 26.750.000 19 4.025.000 0,221 26.840.320 39.000.200 47 13.025.000 0,087 24.601.200 38.450.000 64 11.000.250 0,040 21.650.000 37.525.000 60 9.850.000 0,105 18.602.000 30.500.000 74 11.230.000 0,392 35.024.000 52.000.000 73 18.230.000 0,129 39.024.300 52.050.000 26 15.725.000 0,066 27.500.000 36.500.000 6 10.560.000

23415237,321 34458605,766 35,679 11053343,091

19786121,906 28318197,338 33,243 7997495,834 21650776,799 31860653,544 37,392 9587036,692 22289318,266 31476609,100 33,699 9653529,753 23805225,136 34502849,349 36,530 11243922,161

Page 34: data mining fuzzy c-means

33

Derajat Keanggotaan

Cluster 1

Data yang di Cluster

Derajat Keanggotaan

Cluster 1

Data yang

di Cluster

Derajat Keanggotaan

Cluster 1 0,262 32.500.500 45.600.000 10 16.583.000 0,273 27.963.000 40.250.000 38 13.670.000 0,315 37.250.020 51.000.000 68 18.530.000 0,284 16.523.000 26.750.000 9 8.500.000 0,113 25.690.000 39.565.000 48 15.250.000 0,188 34.500.000 51.065.000 37 21.500.000 0,072 9.850.000 1.350.000 13 2.000.000 0,105 16.950.000 24.580.000 18 4.500.000

Tabel 2.3 Lanjutan Tabel 2.2

Derajat Keanggota-an Cluster 1

( µi1)

(µi1)² (µi1)² x Xi1 (µi1)² x Xi2 (µi1)² x

Xi3 (µi1)² x Xi4

0,198 0,039 588.060,000 980.100,000 1,647 196.020,000

0,153 0,023 468.180,000 618.465,780 1,685 122.429,070

0,149 0,022 395.621,820 488.977,025 0,777 115.445,200

0,290 0,084 1.362.840,500 1.555.850,000 1,009 357.425,000

0,267 0,071 570.312,000 1.083.592,800 0,356 249.511,500

0,132 0,017 248.466,240 342.207,360 0,261 70.096,752

0,144 0,021 145.670,400 315.809,280 0,394 103.680,000

0,034 0,001 28.936,992 39.304,000 0,032 9.248,000

0,290 0,084 2.045.312,000 2.951.910,000 3,280 1.051.250,000

0,046 0,002 54.173,832 80.831,200 0,091 28.037,000

0,312 0,097 1.934.419,968 2.725.632,000 2,628 1.022.112,000

0,063 0,004 75.411,000 99.225,794 0,163 25.203,150

0,308 0,095 1.569.069,533 2.845.938,973 2,751 713.851,600

0,141 0,020 574.958,520 815.121,000 1,153 310.541,220

0,300 0,090 1.428.318,000 2.407.500,000 1,710 362.250,000

0,221 0,049 1.310.908,069 1.904.808,768 2,296 636.154,025

0,087 0,008 186.206,483 291.028,050 0,484 83.260,892

0,040 0,002 34.640,000 60.040,000 0,096 15.760,000

0,105 0,011 205.087,050 336.262,500 0,816 123.810,750

0,392 0,154 5.381.927,936 7.990.528,000 11,217 2.801.294,720

0,129 0,017 649.403,376 866.164,050 0,433 261.679,725

Page 35: data mining fuzzy c-means

34

Fungsi objektif pada interasi pertama a) dapat dihitung dengan menggunakan

persamaan (2.16) sebagai berikut :

ab ∑ ∑ cN∑ OPQR – TUR V6WRX5 Y(\QU)[d _UX5]QX5

= 1.665.619.664.535.720

Detail penghitungan fungsi objektif ini dapat dilihat pada tabel 2.3 berikut :

Tabel 2.4 Detail Perhitungan Fungsi Objektif

Kuadrat Derajat Keanggotaan Cluster data ke-i

N∑ OA#2 – ?)2 V'i2 ) Y ("#))' N∑ OA#2 – ?'2 V'i2 ) Y ("#')'

µi1² µi2² µi3² µi4² µi5² L1 L2 0,039 0,091 0,021 0,108 0,001 7.720.224.365.103,210 3.912.868.460.121,970

0,023 0,035 0,067 0,040 0,040 2.579.539.618.196,020 399.667.483.779,781

0,022 0,048 0,077 0,001 0,106 4.872.945.725.051,790 2.443.941.356.677,160

0,084 0,036 0,006 0,077 0,027 29.683.103.194.213,500 4.496.836.232.640,330

0,071 0,024 0,123 0,001 0,041 47.448.278.087.206,400 7.855.385.218.135,080

0,017 0,150 0,023 0,094 0,001 6.147.800.023.503,830 18.218.762.255.676,300

0,021 0,041 0,031 0,052 0,063 13.997.258.715.998,100 14.001.163.152.330,100

0,001 0,071 0,050 0,055 0,059 14.042.099.435,308 4.231.359.137.954,440

Derajat Keanggota-an Cluster 1

( µi1)

(µi1)² (µi1)² x Xi1 (µi1)² x Xi2 (µi1)² x

Xi3 (µi1)² x Xi4

0,066 0,004 119.790,000 158.994,000 0,026 45.999,360

0,262 0,069 2.230.964,322 3.130.166,400 0,686 1.138.323,452

0,273 0,075 2.084.054,427 2.999.792,250 2,832 1.018.811,430

0,315 0,099 3.696.133,235 5.060.475,000 6,747 1.838.639,250

0,284 0,081 1.332.679,088 2.157.548,000 0,726 685.576,000

0,113 0,013 328.035,610 505.205,485 0,613 194.727,250

0,188 0,035 1.219.368,000 1.804.841,360 1,308 759.896,000

0,072 0,005 51.062,400 6.998,400 0,067 10.368,000

0,105 0,011 186.873,750 270.994,500 0,198 49.612,500 ∑ 1,303 30.506.884,551 44.894.311,975 46,485 14.401.013,846

∑ ((\QU)6jkQX5 ∗ PQR )∑ (\QU)6jkQX5

23.415.230,704 34.458.145,683 35,679 11.053.343,091

Page 36: data mining fuzzy c-means

35

0,084 0,008 0,014 0,073 0,054 279.462.554.388,776 657.158.355.554,766

0,002 0,005 0,043 0,099 0,132 49.949.662.822,808 735.513.901.452,197

0,097 0,042 0,013 0,027 0,042 5.312.481.411.666,050 267.747.649.933,025

0,004 0,104 0,138 0,054 0,000 520.245.392.776,487 1.496.217.296.665,790

0,095 0,053 0,071 0,001 0,026 7.550.484.274.578,620 725.090.307.601,494

0,020 0,004 0,098 0,099 0,029 1.867.752.473.920,500 1.162.265.757.082,430

0,090 0,002 0,075 0,058 0,019 14.917.301.787.237,900 71.043.452.440,576

0,049 0,114 0,052 0,008 0,016 1.770.227.417.668,660 21.608.417.448.907,700

0,008 0,052 0,036 0,046 0,080 131.250.655.377,892 6.948.939.936.103,020

0,002 0,031 0,116 0,010 0,120 22.346.993.588,814 2.839.601.778.570,260

0,011 0,063 0,047 0,039 0,053 428.530.954.141,854 1.038.218.170.565,490

0,154 0,020 0,028 0,016 0,029 75.905.142.853.697,400 18.101.723.827.778,700

0,017 0,032 0,052 0,107 0,019 9.567.316.392.719,060 31.462.854.380.431,800

0,004 0,068 0,075 0,000 0,152 91.894.019.047,561 9.060.926.640.990,590

0,069 0,010 0,009 0,066 0,081 16.285.773.140.198,500 5.556.016.859.625,990

0,075 0,017 0,063 0,016 0,049 4.551.432.811.638,660 4.142.777.867.056,500

0,099 0,004 0,023 0,039 0,075 51.668.220.868.096,200 3.692.700.258.442,220

0,081 0,053 0,049 0,002 0,049 9.150.027.911.853,230 706.729.077.003,233

0,013 0,009 0,070 0,055 0,086 623.915.513.761,899 1.890.419.463.315,080

0,035 0,000 0,040 0,076 0,109 17.946.867.943.955,500 22.905.821.466,548

0,005 0,052 0,029 0,091 0,053 7.061.429.459.062,650 44.416.974.761.411,900

0,011 0,043 0,006 0,199 0,027 2.010.215.274.100,410 1.467.586.130.471,130

Tabel 2.5 Lanjutan Tabel 2.4

Kuadrat Derajat Keanggotaan Cluster data ke-i

N∑ OA#2 – ?f2 V'i2 ) Y ("#f)' N∑ OA#2 – ?i2 V'i2 ) Y ("#i)'

µi1² µi2² µi3² µi4² µi5² L3 L4 0,039 0,091 0,021 0,108 0,001 2.329.530.030.149,130 12.635.617.628.628,300 0,023 0,035 0,067 0,040 0,040 3.415.368.471.012,940 2.035.317.101.180,840 0,022 0,048 0,077 0,001 0,106 9.984.792.815.163,180 108.179.503.347,340 0,084 0,036 0,006 0,077 0,027 1.514.544.055.806,240 18.001.348.204.248,200 0,071 0,024 0,123 0,001 0,041 61.720.386.821.658,200 342.717.498.936,832 0,017 0,150 0,023 0,094 0,001 5.356.558.192.697,360 22.124.139.177.567,700 0,021 0,041 0,031 0,052 0,063 15.845.242.797.196,100 26.959.269.330.946,700 0,001 0,071 0,050 0,055 0,059 929.668.908.774,938 918.058.487.685,752 0,084 0,008 0,014 0,073 0,054 363.472.194.124,566 1.862.128.056.226,970 0,002 0,005 0,043 0,099 0,132 2.994.628.893.264,170 6.814.275.823.723,410 0,097 0,042 0,013 0,027 0,042 241.362.123.987,962 501.522.996.403,418 0,004 0,104 0,138 0,054 0,000 8.935.572.093.028,470 3.427.339.992.485,760

Page 37: data mining fuzzy c-means

36

0,095 0,053 0,071 0,001 0,026 2.393.765.901.008,750 48.709.409.881,146 0,020 0,004 0,098 0,099 0,029 16.925.703.031.674,000 16.894.016.916.755,000 0,090 0,002 0,075 0,058 0,019 6.742.646.078.385,730 5.530.836.411.574,050 0,049 0,114 0,052 0,008 0,016 4.664.216.259.680,020 686.759.978.319,491 0,008 0,052 0,036 0,046 0,080 1.933.279.661.002,670 2.554.804.654.979,920 0,002 0,031 0,116 0,010 0,120 3.716.999.056.718,750 355.639.585.921,216 0,011 0,063 0,047 0,039 0,053 645.987.147.290,085 667.853.460.354,075 0,154 0,020 0,028 0,016 0,029 18.382.677.069.689,900 10.763.264.570.158,200 0,017 0,032 0,052 0,107 0,019 38.498.532.618.545,200 79.147.431.955.012,400 0,004 0,068 0,075 0,000 0,152 4.255.578.343.515,930 4.309.795.234,713 0,069 0,010 0,009 0,066 0,081 3.207.752.475.585,150 23.233.129.456.437,800 0,075 0,017 0,063 0,016 0,049 7.930.992.817.032,320 1.957.735.711.687,230 0,099 0,004 0,023 0,039 0,075 15.516.620.188.558,100 26.806.797.924.525,300 0,081 0,053 0,049 0,002 0,049 2.641.352.487.190,650 110.200.780.628,826 0,013 0,009 0,070 0,055 0,086 7.509.146.831.390,960 5.981.264.171.948,270 0,035 0,000 0,040 0,076 0,109 27.304.133.267.892,100 51.277.467.907.595,700 0,005 0,052 0,029 0,091 0,053 32.208.852.005.231,700 102.232.910.503.968,000 0,011 0,043 0,006 0,199 0,027 630.235.906.851,786 20.414.829.748.224,900

Tabel 2.6 Lanjutan Tabel 2.5

Kuadrat Derajat Keanggotaan Cluster data ke-i

l�OA#2 – ?m2 V'i2 )

n ("#m)' L1+L2+L3+L4+L5

µi1² µi2² µi3² µi4² µi5² L5

0,039 0,091 0,021 0,108 0,001 150.773.747.861,210 26.749.014.231.863,800 0,023 0,035 0,067 0,040 0,040 4.592.902.266.538,090 13.022.794.940.707,700 0,022 0,048 0,077 0,001 0,106 24.164.565.495.812,700 41.574.424.896.052,200 0,084 0,036 0,006 0,077 0,027 9.638.424.349.289,580 63.334.256.036.197,800 0,071 0,024 0,123 0,001 0,041 27.843.566.866.939,600 145.210.334.492.876,000 0,017 0,150 0,023 0,094 0,001 209.754.622.381,640 52.057.014.271.826,800 0,021 0,041 0,031 0,052 0,063 43.250.327.599.814,400 114.053.261.596.285,000 0,001 0,071 0,050 0,055 0,059 719.216.579.115,121 6.812.345.212.965,560 0,084 0,008 0,014 0,073 0,054 119.404.125.799,660 3.281.625.286.094,740 0,002 0,005 0,043 0,099 0,132 2.772.085.354.351,400 13.366.453.635.614,000 0,097 0,042 0,013 0,027 0,042 2.450.508.420.179,920 8.773.622.602.170,370 0,004 0,104 0,138 0,054 0,000 16.618.261.892,453 14.395.993.036.849,000 0,095 0,053 0,071 0,001 0,026 2.252.141.508.035,600 12.970.191.401.105,600 0,020 0,004 0,098 0,099 0,029 2.499.771.414.412,770 39.349.509.593.844,700 0,090 0,002 0,075 0,058 0,019 3.384.732.655.025,810 30.646.560.384.664,100

Page 38: data mining fuzzy c-means

37

0,049 0,114 0,052 0,008 0,016 509.534.405.940,872 29.239.155.510.516,700 0,008 0,052 0,036 0,046 0,080 1.303.284.322.071,650 12.871.559.229.535,200 0,002 0,031 0,116 0,010 0,120 1.892.999.128.534,330 8.827.586.543.333,370 0,011 0,063 0,047 0,039 0,053 2.299.674.927.425,360 5.080.264.659.776,860 0,154 0,020 0,028 0,016 0,029 14.059.554.514.093,700 137.212.362.835.418,000 0,017 0,032 0,052 0,107 0,019 10.657.075.614.348,600 169.333.210.961.057,000 0,004 0,068 0,075 0,000 0,152 2.754.184.446.488,760 16.166.893.245.277,600 0,069 0,010 0,009 0,066 0,081 18.329.907.539.413,600 66.612.579.471.261,000 0,075 0,017 0,063 0,016 0,049 2.769.893.182.042,630 21.352.832.389.457,300 0,099 0,004 0,023 0,039 0,075 37.712.077.858.772,800 135.396.417.098.395,000 0,081 0,053 0,049 0,002 0,049 5.893.476.667.536,190 18.501.786.924.212,100 0,013 0,009 0,070 0,055 0,086 3.909.189.555.860,410 19.913.935.536.276,600 0,035 0,000 0,040 0,076 0,109 53.782.462.190.106,800 150.333.837.131.017,000 0,005 0,052 0,029 0,091 0,053 73.601.351.597.071,000 259.521.518.326.745,000 0,011 0,043 0,006 0,199 0,027 5.135.455.994.672,340 29.658.323.054.320,600

∑ 1.665.619.664.535.720,000

Selanjutnya memperbaiki matrik partisi U berdasarkan persamaan (2.17)

"#$ = N∑ OA#2 − ?$2 V'72 ) Y S)%S)∑ N∑ OA#2 − ?$2 V'72 ) Y($ )

S)%S)

Penghitungan derajat keanggotaan baru yang terhimpun dalam matriks

partisi seperti terlihat pada tabel 2.7. Pengaliana setiap kolom pada tabel dengan 10)i, hanya ditujukan untuk memperbesar nilai, karena hasil L1, L2, L3, L4, L5

yang sangat kecil.

Tabel 2.7 Detail perhitungan Derajat Keanggotaan Baru (Matriks Partisi)

l�OA#2 – ?)2 V'i2 )

n l�OA#2 – ?)2 V'i2 )

n l�OA#2 – ?)2 V'i2 )

n l�OA#2 – ?)2 V'i2 )

n l�OA#2 – ?)2 V'i2 )

n l�OA#2 – ?)2 V'i2 )

nS)

L1 L2 L3 L4 L5 LT=L1+L2+ L3+L4+L5

0,5078 2,3309 0,8901 0,8566 0,4835 5,0689 0,9075 8,8434 1,9490 1,9850 0,8622 14,5471

Page 39: data mining fuzzy c-means

38

0,4556 1,9624 0,7685 0,7774 0,4398 4,4037 0,2833 0,8113 0,4226 0,4262 0,2757 2,2191 0,1502 0,3019 0,1996 0,1972 0,1465 0,9954 0,2834 0,8221 0,4257 0,4232 0,2746 2,2290 0,1481 0,2914 0,1955 0,1928 0,1445 0,9723 8,2324 1,6722 5,3972 6,0154 8,1427 29,4599 30,0935 1,1518 3,8308 3,9439 45,4666 84,4866 4,2363 0,6287 1,4447 1,4469 4,7797 12,5363 1,8324 15,6957 5,2904 5,3629 1,7150 29,8964 0,7629 6,9729 1,5487 1,5704 0,7281 11,5830 1,2564 7,3592 2,9558 2,5149 1,1509 15,2372 1,0644 0,3307 0,5788 0,5873 1,1425 3,7037 0,6033 2,9785 1,1053 1,0501 0,5708 6,3080 2,7590 0,5287 1,1145 1,1276 3,0665 8,5963 5,7668 0,7415 1,8477 1,7925 6,1452 16,2937 7,1598 1,0909 3,1100 2,7005 6,3608 20,4220 2,5727 6,0199 7,2224 5,8702 2,3204 24,0056 0,2024 0,1114 0,1517 0,1522 0,2080 0,8257 0,1739 0,1007 0,1338 0,1351 0,1787 0,7222 4,7402 0,7518 1,7642 1,8794 5,5225 14,6581 0,4215 0,1873 0,2813 0,2843 0,4400 1,6144 1,6375 0,4142 0,7880 0,7981 1,7793 5,4171 0,1920 0,1075 0,1450 0,1462 0,1976 0,7883 0,8815 7,4852 1,8659 1,7568 0,8287 12,8181 2,0466 0,4674 0,9281 0,9233 2,2111 6,5765 0,1969 0,1091 0,1480 0,1486 0,2025 0,8051 0,0734 0,1160 0,0887 0,0892 0,0725 0,4398 0,5484 2,9197 0,9903 0,9744 0,5237 5,9565

Tabel 2.8 Lanjutan Tabel 2.7

"o) "o' "of "oi "om

L1/LT L2/LT L3/LT L4/LT L5/LT

0,100 0,460 0,176 0,169 0,095 0,062 0,608 0,134 0,136 0,059 0,103 0,446 0,175 0,177 0,100 0,128 0,366 0,190 0,192 0,124 0,151 0,303 0,201 0,198 0,147

Page 40: data mining fuzzy c-means

39

0,127 0,369 0,191 0,190 0,123 0,152 0,300 0,201 0,198 0,149 0,279 0,057 0,183 0,204 0,276 0,356 0,014 0,045 0,047 0,538 0,338 0,050 0,115 0,115 0,381 0,061 0,525 0,177 0,179 0,057 0,066 0,602 0,134 0,136 0,063 0,082 0,483 0,194 0,165 0,076 0,287 0,089 0,156 0,159 0,308 0,096 0,472 0,175 0,166 0,090 0,321 0,062 0,130 0,131 0,357 0,354 0,046 0,113 0,110 0,377 0,351 0,053 0,152 0,132 0,311 0,107 0,251 0,301 0,245 0,097 0,245 0,135 0,184 0,184 0,252 0,241 0,139 0,185 0,187 0,247 0,323 0,051 0,120 0,128 0,377 0,261 0,116 0,174 0,176 0,273 0,302 0,076 0,145 0,147 0,328 0,244 0,136 0,184 0,185 0,251 0,069 0,584 0,146 0,137 0,065 0,311 0,071 0,141 0,140 0,336 0,245 0,136 0,184 0,185 0,252 0,167 0,264 0,202 0,203 0,165 0,092 0,490 0,166 0,164 0,088

Page 41: data mining fuzzy c-means

40

0,100 0,460 0,176 0,169 0,095

0,062 0,608 0,134 0,136 0,059

0,103 0,446 0,175 0,177 0,100

0,128 0,366 0,190 0,192 0,124

0,151 0,303 0,201 0,198 0,147

0,127 0,369 0,191 0,190 0,123

0,152 0,300 0,201 0,198 0,149

0,279 0,057 0,183 0,204 0,276

0,356 0,014 0,045 0,047 0,538

0,338 0,050 0,115 0,115 0,381

0,061 0,525 0,177 0,179 0,057

0,066 0,602 0,134 0,136 0,063

0,082 0,483 0,194 0,165 0,076

0,287 0,089 0,156 0,159 0,308

0,096 0,472 0,175 0,166 0,090

0,321 0,062 0,130 0,131 0,357

0,354 0,046 0,113 0,110 0,377

0,351 0,053 0,152 0,132 0,311

0,107 0,251 0,301 0,245 0,097

0,245 0,135 0,184 0,184 0,252

0,241 0,139 0,185 0,187 0,247

0,323 0,051 0,120 0,128 0,377

0,261 0,116 0,174 0,176 0,273

0,302 0,076 0,145 0,147 0,328

0,244 0,136 0,184 0,185 0,251

0,069 0,584 0,146 0,137 0,065

0,311 0,071 0,141 0,140 0,336

0,245 0,136 0,184 0,185 0,252

0,167 0,264 0,202 0,203 0,165

0,092 0,490 0,166 0,164 0,088

Selanjutnya melakukan pengecekan kondisi berhenti. Karena | a) - ag | = |

1.665.619.664.535.720 – 0| = 1.665.619.664.535.720 >> ξ (10Sm), dan interasi = 1 <

MaxIter (=100), maka kita lanjutkan ke interasi ke-2 (t=2).

Pada interasi ke-2, dapat dihitung kembali 5 pusat cluster, ?$2 dengan k =

1,2,...,5; dan j = 1,2,3,4 sebagai berikut :

U =

Page 42: data mining fuzzy c-means

41

26144188,964 38057223,719 41,004 12525754,377 17391918,127 25284354,899 31,628 6528999,150 21292678,972 30928619,239 36,270 9681023,240 21624696,547 31067004,417 34,865 9705528,308 26268002,626 38079300,648 40,375 12688594,080

Fungsi objektif pada interasi a) dapat sebagai :

ab ∑ ∑ cN∑ OPQR – TUR V6WRX5 Y(\QU)[d_UX5]QX5

= 1.180.012.821.223.876,7

Selanjutnya memperbaiki matrik Partisi U :

0,019 0,827 0,070 0,065 0,019 0,028 0,649 0,152 0,143 0,027 0,025 0,779 0,087 0,083 0,025 0,057 0,594 0,149 0,144 0,056 0,094 0,440 0,189 0,184 0,093 0,053 0,616 0,141 0,136 0,053 0,096 0,430 0,192 0,187 0,095 0,187 0,052 0,273 0,309 0,178 0,363 0,024 0,127 0,140 0,345 0,474 0,001 0,005 0,005 0,515 0,032 0,160 0,417 0,358 0,032 0,009 0,891 0,047 0,044 0,009 0,046 0,349 0,297 0,263 0,045 0,416 0,023 0,055 0,058 0,447 0,026 0,750 0,102 0,096 0,026 0,436 0,002 0,007 0,007 0,549 0,498 0,010 0,035 0,037 0,420 0,296 0,046 0,187 0,196 0,275 0,039 0,088 0,456 0,380 0,038 0,317 0,083 0,137 0,140 0,322 0,308 0,090 0,144 0,147 0,312 0,449 0,015 0,052 0,056 0,427 0,360 0,055 0,105 0,109 0,370 0,443 0,011 0,028 0,030 0,488 0,314 0,085 0,139 0,143 0,319 0,021 0,731 0,119 0,108 0,021

V =

U =

Page 43: data mining fuzzy c-means

42

Selanjutnya dilakukan pengecekan kembali kondisi berhenti. Karena | a) - a) | = | 1.180.012.821.223.876,7– 1.665.619.664.535.720 | = >> ξ (10Sm), dan

interasi = 2 < MaxIter (=100), maka proses dilanjutkan ke interasi ke-3 (t=3).

Demikian seterusnya, hingga : | ab - abS) | < ξ atau t > MaxIter. Untuk kasus ini,

proses baru akan berhenti setelah interasi ke-73.

Pada interasi ke-73 ini, 5 cluster, ?$2 dengan k = 1,2,...,5; dan j = 1,2,3,4

adalah sebagai berikut :

26.097.128,366 38.367.129,554 43,168 12.708.683,466 8.234.631,216 12.525.801,532 12,189 3.783.433,770

16.681.512,964 23.440.686,716 28,951 4.873.526,540 18.413.841,096 28.798.309,673 38,362 9.035.488,840 35.965.416,453 50.846.152,565 47,930 18.284.604,166

Informasi yang bisa diperoleh dari kelima pusat cluster ini adalah: pada

kabupaten tersebut, industri-industri kecil dapat dikelompokkan menjadi 5

kelompok:

1. Kelompok pertama (cluster ke-1), berisi industri-industri kecil yang memiliki

modal awal sekitar Rp. 26.097.128,366; memiliki rata-rata penjualan per bulan

sekitar Rp. 38.367.129,554; sudah beroperasi sekitar 43,168 bulan; dan memiliki

rata-rata laba per bulan sekitar Rp. 12.708.683,466.

2. Kelompok kedua (cluster ke-2), berisi industri-industri kecil yang memiliki

modal awal sekitar Rp. 8.234.631,216; memiliki rata-rata penjualan per bulan

sekitar Rp. 12.525.801,532; sudah beroperasi sekitar 12,189 bulan; dan memiliki

rata-rata laba per bulan sekitar Rp. 3.783.433,770.

3. Kelompok ketiga (cluster ke-3), berisi industri-industri kecil yang memiliki

modal awal sekitar Rp. 16.681.512,964; memiliki rata-rata penjualan per bulan

sekitar Rp. 23.440.686,716; sudah beroperasi sekitar 28,951 bulan; dan memiliki

rata-rata laba per bulan sekitar Rp. 4.873.526,540.

4. Kelompok keempat (cluster ke-4), berisi industri-industri kecil yang memiliki

modal awal sekitar Rp. 18.413.841,096; memiliki rata-rata penjualan per bulan

V =

Page 44: data mining fuzzy c-means

43

sekitar Rp. 28.798.309,673; sudah beroperasi sekitar 38,362 bulan; dan memiliki

rata-rata laba per bulan sekitar Rp. 9.035.488,840.

5. Kelompok kelima (cluster ke-5), berisi industri-industri kecil yang memiliki

modal awal sekitar Rp. 35.965.416,453; memiliki rata-rata penjualan per bulan

sekitar Rp. 50.846.152,565; sudah beroperasi sekitar 47,930 bulan; dan memiliki

rata-rata laba per bulan sekitar Rp. 18.284.604,166.

Matrik partisi U:

0,012 0,022 0,855 0,106 0,004 0,041 0,029 0,488 0,431 0,010 0,008 0,017 0,922 0,051 0,002 0,030 0,168 0,667 0,125 0,010 0,007 0,923 0,046 0,021 0,003 0,025 0,166 0,686 0,114 0,009 0,010 0,901 0,057 0,028 0,004 0,513 0,029 0,114 0,302 0,043 0,791 0,013 0,043 0,127 0,026 0,992 0,001 0,002 0,004 0,002 0,029 0,010 0,069 0,886 0,005 0,024 0,023 0,651 0,296 0,006 0,032 0,015 0,119 0,827 0,006 0,777 0,013 0,032 0,060 0,118 0,027 0,033 0,694 0,239 0,007 0,987 0,001 0,003 0,005 0,004 0,931 0,005 0,015 0,036 0,014 0,649 0,022 0,075 0,213 0,041 0,055 0,014 0,070 0,853 0,009 0,007 0,001 0,002 0,002 0,988 0,044 0,006 0,011 0,016 0,923 0,876 0,009 0,028 0,061 0,026 0,254 0,015 0,031 0,051 0,649 0,913 0,006 0,015 0,030 0,037 0,005 0,001 0,001 0,002 0,991 0,024 0,020 0,238 0,713 0,005 0,912 0,006 0,016 0,035 0,030 0,038 0,005 0,009 0,013 0,936 0,050 0,665 0,0,16 0,099 0,026 0,004 0,006 0,953 0,036 0,001

U =

Page 45: data mining fuzzy c-means

44

Dari matriks partisi U tersebut dapat diperoleh informasi mengenai

kecenderungan suatu industri kecil untuk masuk ke kelompok (cluster) yang

mana. Suatu industri kecil memiliki derajat keanggotaan tertentu untuk menjadi

anggota suatu kelompok. Tentu saja derajat keanggotaan tersebar menunjukkan

kecenderungan tertinggi suatu industri untuk masuk menajadi anggota kelompok.

Tabel 2.9 menunjukkan derajat keanggotaan tiap industri kecil pada setiap kelompok

(cluster) beserta kecenderungan tertinggi suatu industri kecil untuk masuk

dalam suatu kelompok.

Tabel 2.9 Derajat Keanggotaan Tiap Data Pada Setiap Cluster Dengan FCM

Data Ke-

Derajat Keanggotaan Data Pada Cluster Derajat Keanggotaan Data

Pada Cluster

1 2 3 4 5 1 2 3 4 5 1 0,012 0,022 0,855 0,106 0,004 *

2 0,041 0,029 0,488 0,431 0,010 *

3 0,008 0,017 0,922 0,051 0,002 *

4 0,030 0,168 0,667 0,125 0,010 *

5 0,007 0,923 0,046 0,021 0,003 *

6 0,025 0,166 0,686 0,114 0,009 *

7 0,010 0,901 0,057 0,028 0,004 *

8 0,513 0,029 0,114 0,302 0,043 *

9 0,791 0,013 0,043 0,127 0,026 *

10 0,992 0,001 0,002 0,004 0,002 *

11 0,029 0,010 0,069 0,886 0,005 *

12 0,024 0,023 0,651 0,296 0,006 *

13 0,032 0,015 0,119 0,827 0,006 *

14 0,777 0,013 0,032 0,060 0,118 *

15 0,027 0,033 0,694 0,239 0,007 *

16 0,987 0,001 0,003 0,005 0,004 *

17 0,931 0,005 0,015 0,036 0,014 *

18 0,649 0,022 0,075 0,213 0,041 *

19 0,055 0,014 0,070 0,853 0,009 *

20 0,007 0,001 0,002 0,002 0,988 *

21 0,044 0,006 0,011 0,016 0,923 *

22 0,876 0,009 0,028 0,061 0,026 *

23 0,254 0,015 0,031 0,051 0,649 *

Page 46: data mining fuzzy c-means

45

Data Ke-

Derajat keanggotaan Data Pada Cluster Derajat

Keanggotaan Data Pada Cluster

1 2 3 4 5 1 2 3 4 5 24 0,913 0,006 0,015 0,030 0,037 *

25 0,005 0,001 0,001 0,002 0,991 *

26 0,024 0,020 0,238 0,713 0,005 *

27 0,912 0,006 0,016 0,035 0,030 *

28 0,038 0,005 0,009 0,013 0,936 *

29 0,050 0,665 0,0,16 0,099 0,026 *

30 0,004 0,006 0,953 0,036 0,001 *

Dari tabel 2.9 tersebut dapat disimpulkan bahwa :

1. Kelompok pertama (cluster ke-1), akan berisi industri-industri kecil ke: 8, 9, 10,

14, 16, 17, 18, 22, 24, dan 27

2. Kelompok kedua (cluster ke-2), akan berisi industri-industri kecil ke: 5, 7

dan 29.

3. Kelompok ketiga (cluster ke-3), akan berisi industri-industri kecil ke: 1, 2, 3, 4,

6, 12, 15, dan 30.

4. Kelompok keempat (cluster ke-4), akan berisi industri-industri kecil ke: 11, 13,

19, dan 26.

5. Kelompok kelima (cluster ke-5), akan berisi industri-industri kecil ke: 20, 21, 23,

25, dan 28.

2.2.5 Sistem Penilaian dan Penjurusan Di Sekolah Menengah Atas (SMA)

Sesuai kurikulum yang berlaku di seluruh Indonesia, maka siswa kelas X

SMA yang naik ke kelas XI akan mengalami pemilihan jurusan/penjurusan.

Penjurusan yang tersedia di SMA meliputi Ilmu Alam (IPA), Ilmu Sosial (IPS), dan

Ilmu Bahasa. Penjurusan akan disesuaikan dengan minat dan kemampuan siswa.

Tujuannya agar kelak di kemudian hari, pelajaran yang akan diberikan kepada siswa

menjadi lebih terarah karena telah sesuai dengan minatnya. Dari keseluruhan mata

pelajaran di SMA, tidak seluruhnya dijadikan dasar untuk proses penjurusan,

Page 47: data mining fuzzy c-means

46

melainkan hanya mata pelajaran inti dari tiap jurusan tersebut. Mata pelajaran inti

untuk jurusan IPA terdiri atas: Biologi, Fisika, Matematika IPA, Kimia. Mata

pelajaran inti untuk IPS adalah: Sosiologi, Geografi, Sejarah dan Ekonomi.

Sedangkan mata kuliah inti untuk jurusan Bahasa adalah: Bahasa Inggris dan Bahasa

Indonesia [3].

Tujuan dilaksanakannya penjurusan adalah [3]:

1. Mengelompokkan siswa sesuai kecakapan, kemampuan, dan bakat, yang relatif

sama.

2. Membantu mempersiapkan siswa melanjutkan studi dan memilih dunia kerja.

3. Membantu memperkokoh keberhasilan dan kecocokan atas prestasi yang akan

dicapai di waktu mendatang (kelanjutan studi dan dunia kerja).

Waktu penentuan penjurusan bagi peserta didik untuk program IPA, IPS dan

Bahasa dilakukan mulai akhir semester 2 (dua) kelas X. Pelaksanaan penjurusan

program dimulai pada semester 1 (satu) kelas XI. Kriteria penjurusan program

dilakanakan berdasarkan nilai akademik. Peserta didik yang naik kelas XI dan akan

mengambil program tertentu yaitu: Ilmu Pengetahuan Alam (IPA) atau Ilmu

Pengetahuan Sosial (IPS) atau Bahasa: boleh memiliki nilai yang tidak tuntas paling

banyak 3 (tiga) mata pelajaran pada mata pelajaran-mata pelajaran yang bukan

menjadi ciri khas program tersebut. Peserta didik yang naik ke kelas XI, dan yang

bersangkutan mendapat nilai tidak tuntas 3 (tiga) mata pelajaran, maka nilai tersebut

harus dijadikan dasar untuk menentukan program yang dapat diikuti oleh peserta

didik, misalnya :

- Apabila mata pelajaran yang tidak tuntas adalah Fisika, Kimia dan Geografi (2

mata pelajaran ciri khas program IPA dan 1 ciri khas program IPS), maka siswa

tersebut secara akademik dapat dimasukkan ke program Bahasa.

- Apabila mata pelajaran yang tidak tuntas adalah Bahasa Indonesia, Bahasa

Inggris, dan Fisika, (2 mata pelajaran ciri khas Bahasa dan 1 ciri khas IPA),

maka siswa tersebut secara akademik dapat dimasukkan ke program IPS.

- Apabila mata pelajaran yang tidak tuntas adalah Ekonomi, Sosilologi, dan

Bahasa Inggris (2 mata pelajaran ciri khas program IPS dan 1 ciri khas program

Bahasa), maka peserta didik tersebut secara akademik dapat dimasukkan ke

program IPA.

Page 48: data mining fuzzy c-means

47

- Apabila mata pelajaran yang tidak tuntas adalah Fisika, Ekonomi, dan Bahasa

Indonesia (mencakup semua mata pelajaran yang menjadi ciri khas ketiga

program di SMA) maka perlu diperhatikan prestasi nilai mata pelajaran yang

lebih unggul daripada program lainya (siswa tersebut dapat dijuruskan ke

program yang nilai prestasi mata pelajaran yang lebih unggul tersebut), atau

dengan mempertimbangkan minat peserta didik. Untuk mengetahui minat

peserta didik dapat dilakukan melalui angket/kuesioner dan wawancara, atau

cara lain yang dapat digunakan untuk mendeteksinya.

Skala penilaian penilaian yang dapat dijadikan acuan bagi sekolah-sekolah di

Indonesia adalah [3]:

1. Nilai ketuntasan belajar untuk aspek pengetahuan dan praktik dinyatakan dalam

bentuk bilangan bulat, dengan rentang 0 -100.

2. Ketuntasan belajar setiap indikator yang telah ditetapkan dalam suatu

kompetensi dasar berkisar antara 0 – 100 %. Kriteria ideal ketuntasan untuk

masing-masing indikator 75 %.

3. Satuan pendidikan dapat menentukan kriteria ketuntasan minimal (KKM)

dibawah nilai ketuntasan belajar ideal. Satuan pendidikan diharapkan

meningkatkan kriteria ketuntasan belajar secara terus menerus untuk mencapai

kriteria ketuntasan ideal.

4. KKM ditetapkan oleh forum guru pada awal tahun pelajaran.

5. KKM tersebut dicantumkan dalam LHB dan harus diinformasikan kepada

seluruh warga sekolah dan orang tua siswa.

Page 49: data mining fuzzy c-means

48

BAB III METODE PENELITIAN

3.1 Metode Penelitian 3.1.1 Jenis Penelitian

Penelitian yang dilaksanakan adalah jenis penelitian eksperimen, yaitu

melakukan pengujian tingkat akurasi algoritma Fuzzy C-Means dalam pemetaan

kesamaan minat siswa Sekolah Menengah Atas (SMA) berdasarkan nilai rata-rata

mata pelajaran bidang peminatan. Data eksperimen diambil dari tempat penelitian

yaitu di SMA Negeri 2 Banjarbaru.

3.1.2 Metode Pengumpulan Data 3.1.2.1 Jenis Data

Data yang digunakan dalam penelitian ini berupa data primer dan data

sekunder:

a. Data Primer: berupa data tentang mekanisme pelaksanaan peminatan yang

dilaksanakan di Sekolah Menengah Atas (SMA) negeri 2 Banjarbaru, yang

diperoleh dengan wawancara.

b. Data Sekunder: berupa data siswa dan nilai mata pelajaran peminatan

sebelum pelaksanaan peminatan dan setelah pelaksanaan peminatan, yang

diperoleh dari database akademik SMA Negeri 2 Banjarbaru tahun 2010.

3.1.2.2 Sampel Data

Sampel data yang digunakan adalah data nilai (sebelum dan setelah

peminatan/penjurusan) siswa SMA Negeri 2 Banjarbaru (angkatan tahun 2008)

sebanyak 81 siswa dari 115 siswa. Penetapan jumlah sampel ini di dasarkan pada

metode penentuan sampel yang dikembangkan oleh Isaac dan Michael untuk

menentukan ukuran sampel dari populasi mulai dari 10 sampai dengan 1.000.000

[13]. Tingkat kesalahan untuk menentapkan jumlah sampel yang dipilih dalam

metode ini ini adalah sekitar 10%. Parameter data yang akan digunakan dalam

Page 50: data mining fuzzy c-means

49

eksperimen berupa rata-rata nilai mata pelajaran kelompok peminatan, yaitu: jurusan

IPA (mata pelajaran Biologi, Matematika, Fisika dan Kimia), jurusan IPS (mata

pelajaran Sosiologi, Geografi, Sejarah dan Ekonomi), jurusan Bahsa (Bahasa Inggris

dan Bahasa Indonesia). Sampel data selengkapnya dapat dilihat pada tabel 3.1 dan

tabel 3.2.

Tabel 3.1 Sampel Data Nilai Rata-rata Siswa pada Bidang Minat Tertentu

Sebelum Peminatan

IPA IPS Bahasa

1 72,2 74,8 76,5

2 74,9 76,5 67,3

3 77,5 70,6 74,6

4 68,1 77,1 77,8

5 76,6 71,3 76,1

6 78,2 76,4 64,6

7 70,4 74,5 72,9

8 75,3 75,2 68,7

9 77,1 73,7 80,5

10 71,5 77,6 77,8

11 74,0 69,8 80,3

12 72,8 78,4 69,8

13 73,7 73,9 71,4

14 73,1 73,9 72,5

15 71,9 73,2 74,9

16 74,3 73,2 70,3

17 78,3 79,2 79,0

18 71,8 74,3 77,9

19 74,1 75,3 80,3

20 74,7 72,4 72,1

21 74,0 71,3 71,9

22 70,6 78,5 76,6

23 76,8 78,6 73,5

24 75,3 71,2 77,6

25 76,1 72,4 72,4

26 70,7 78,9 69,0

27 83,4 76,1 78,8

SiswaNilai Rata-rata Peminatan

Page 51: data mining fuzzy c-means

50

IPA IPS Bahasa

28 70,8 76,6 79,0

29 78,3 75,5 80,2

30 76,7 76,4 73,8

31 74,4 79,4 86,1

32 80,4 76,7 78,8

33 66,5 71,0 71,4

34 69,2 76,4 69,0

35 82,7 86,1 80,0

36 75,3 73,5 71,5

37 82,5 79,3 70,8

38 69,3 70,8 73,8

39 77,5 80,6 77,9

40 67,6 75,5 73,0

41 80,3 75,7 74,8

42 70,3 74,2 68,5

43 78,5 65,0 82,5

44 68,5 77,5 72,5

45 81,7 70,5 72,5

46 77,5 75,0 75,8

47 87,5 70,5 77,0

48 75,9 78,0 86,5

49 70,5 70,0 75,5

50 79,0 72,0 65,0

51 65,0 80,0 70,5

52 78,0 75,0 89,5

53 72,5 75,0 82,5

54 81,0 65,7 75,5

55 89,7 76,5 68,0

56 78,5 67,5 85,7

57 65,0 89,5 70,5

58 70,7 92,0 78,5

59 75,5 70,0 79,5

60 85,0 75,5 80,2

61 68,5 65,0 78,5

62 82,5 69,5 72,1

63 74,5 90,2 70,5

64 69,5 72,5 79,0

65 70,9 74,5 91,5

SiswaNilai Rata-rata Peminatan

Page 52: data mining fuzzy c-means

51

IPA IPS Bahasa

66 82,5 72,5 70,6

67 75,8 82,1 70,8

68 80,2 74,5 72,5

69 74,5 91,5 69,5

70 60,5 68,7 77,8

71 74,5 77,8 69,8

72 79,0 72,5 73,8

73 87,5 75,2 71,8

74 65,0 76,8 67,5

75 76,0 94,8 74,0

76 65,0 77,8 81,5

77 65,5 68,0 75,8

78 80,4 75,5 74,2

79 90,1 78,7 74,3

80 75,7 74,0 87,5

81 74,9 77,3 65,0

SiswaNilai Rata-rata Peminatan

Sumber: Database Akademik SMA Negeri 2 Banjarbaru, Tahun 2010.

Tabel 3.2 Sampel Data Nilai Rata-rata Bidang Peminatan Siswa Angkatan 2008 SMA Negeri 2 Banjarbaru Tahun 2010 Setelah Peminatan.

Kelas XI Kelas XII

1 Bahasa 75,50 74,20

2 IPS 77,00 75,50

3 IPA 75,50 78,00

4 Bahasa 72,00 74,50

5 IPA 72,80 71,50

6 IPA 71,50 74,50

7 IPS 69,00 65,50

8 IPA 70,50 72,50

9 Bahasa 76,25 75,50

10 Bahasa 74,50 72,50

11 Bahasa 78,00 76,50

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/ PenjurusanSiswa

Jurusan Yang Dipilih

Page 53: data mining fuzzy c-means

52

Kelas XI Kelas XII

12 IPS 73,00 74,80

13 IPS 71,50 74,00

14 IPS 67,50 65,00

15 Bahasa 75,50 69,50

16 IPA 84,30 81,30

17 IPS 80,70 82,50

18 Bahasa 76,00 80,50

19 Bahasa 81,50 82,50

20 IPA 74,00 71,00

21 IPA 69,50 73,50

22 IPS 82,50 79,50

23 IPS 72,50 70,75

24 Bahasa 65,50 70,50

25 IPA 66,00 68,30

26 IPS 78,00 76,50

27 IPA 72,50 71,00

28 Bahasa 71,00 67,50

29 Bahasa 82,00 80,00

30 IPA 72,50 67,80

31 Bahasa 71,90 73,50

32 IPA 80,70 75,50

33 Bahasa 80,50 88,50

34 IPS 82,75 80,50

35 IPS 83,50 81,50

36 IPA 78,20 75,50

37 IPA 74,50 72,00

38 Bahasa 79,00 81,30

39 IPS 70,70 72,00

40 IPS 69,50 77,50

41 IPA 79,50 70,30

42 IPS 75,80 72,30

43 Bahasa 80,50 82,50

44 IPS 78,50 75,80

45 IPA 74,50 72,80

46 IPA 74,00 72,70

47 IPA 73,60 71,80

48 Bahasa 73,80 74,50

SiswaJurusan Yang

Dipilih

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/ Penjurusan

Page 54: data mining fuzzy c-means

53

Kelas XI Kelas XII

49 Bahasa 78,50 82,00

50 IPA 80,50 79,40

51 IPS 77,50 80,00

52 Bahasa 85,00 81,70

53 Bahasa 73,80 69,80

54 IPA 75,50 80,60

55 IPA 83,60 84,50

56 Bahasa 78,50 82,60

57 IPS 79,60 75,50

58 IPS 74,20 72,50

59 Bahasa 75,80 77,00

60 IPA 70,50 74,30

61 Bahasa 75,00 75,20

62 IPA 78,10 75,80

63 IPS 77,50 81,20

64 Bahasa 66,90 68,20

65 Bahasa 74,50 74,00

66 IPA 77,60 78,00

67 IPS 79,00 80,60

68 IPA 77,50 78,00

69 IPS 80,20 82,80

70 Bahasa 76,40 78,10

71 IPS 74,00 74,50

72 IPA 70,80 69,50

73 IPA 84,20 82,50

74 IPS 75,80 75,00

75 IPS 87,60 82,80

76 Bahasa 74,50 72,10

77 Bahasa 75,80 77,10

78 IPA 72,40 74,00

79 IPA 78,60 82,10

80 Bahasa 80,20 79,60

81 IPS 67,80 74,00

SiswaJurusan Yang

Dipilih

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/ Penjurusan

Sumber: Database Akademik SMA Negeri 2 Banjarbaru, 2010.

Page 55: data mining fuzzy c-means

54

3.1.3 Metode Pengukuran Akurasi penerapan algoritma Fuzzy C-Means (FCM) dalam peminatan/

penjurusan di SMA diuji dengan cara:

1. Data sampel siswa dan nilai rata-rata mata pelajaran peminatan sebelum

peminatan dikelompokan dengan algoritma Fuzzy C-Means untuk membagi

siswa ke dalam bidang minat tertentu (Kelompok IPA, IPS dan Bahasa)

sesuai dengan kesamaan perolehan nilai rata-rata bidang peminatan tersebut.

2. Hasil peminatan Fuzzy C-Means dibandingkan dengan hasil peminatan yang

telah diaksanakan di tempat penelitian (terhadap data sampel nilai rata-rata

mata pelajaran pada peminatan yang telah dijalani oleh siswa).

3. Jika minat yang dipilih oleh siswa sama dengan peminatan FCM dan nilai

rata-rata mata pelajaran peminatan yang diperoleh setelah peminatan >=

Kriteria Ketuntasan Minimal (KKM) yang ideal (>=75), maka FCM

dinyatakan AKURAT.

4. Jika minat yang dipilih oleh siswa sama dengan peminatan FCM dan nilai

rata-rata mata pelajaran peminatan yang diperoleh setelah peminatan <

Kriteria Ketuntasan Minimal (KKM) yang ideal, maka FCM dinyatakan

TIDAK AKURAT.

5. Jika minat yang dipilih oleh siswa tidak sama dengan peminatan FCM dan

nilai rata-rata mata pelajaran peminatan yang diperoleh setelah peminatan >=

Kriteria Ketuntasan Minimal (KKM) yang ideal, maka FCM dinyatakan

TIDAK AKURAT.

6. Jika minat yang dipilih oleh siswa tidak sama dengan peminatan FCM dan

nilai rata-rata mata pelajaran peminatan yang diperoleh setelah peminatan <

Kriteria Ketuntasan Minimal (KKM) yang ideal, maka FCM dinyatakan

AKURAT.

7. Selanjutnya dihitung persen tingkat akurasi FCM dengan:

% Akurasi = (Jumlah Data Akurat / Total Sampel) * 100

3.2 Penerapan Fuzzy C-Means Dalam Peminatan/Penentuan Jurusan

Pada tahap awal dilakukan pemetaan korelasi antara peminatan dengan mata

pelajaran peminatan, hasilnya ditunjukan pada gambar 3.1 berikut:

Page 56: data mining fuzzy c-means

55

Gambar 3.1 Diagram Korelasi Antara Mata Pelajaran Dengan Peminatan

Selanjutnya ditentukan nilai bidang minat tertentu, yang diperoleh dari hasil

rata-rata mata pelajaran peminatan yang berada dalam kelompok bidang minat

tersebut sebelum dilakukan peminatan. Data ini akan digunakan sebagai data

parameter ujicoba peminatan menggunakan FCM ( tabel 3.1.)

Setelah parameter nilai rata-rata bidang minat diketahui, selanjutnya dilakukan

pemetaan/klastering data mengikuti algoritma FCM:

1. Menetapkan matriks partisi awal U berupa matriks berukuran n x m (n adalah

jumlah sampel data, yaitu=42, dan m adalah parameter/atribut setiap data,

yaitu=3). Xij = data sampel ke-i (i=1,2,...,n), atribut ke-j (j=1,2,...,m). Data

untuk matriks partisi awal yang digunakan adalah data pada tabel 3.3.

Bidang Minat Ilmu Pengetahuan Alam (IPA)

Bidang Minat Ilmu Penget. Sosial (IPS)

Bidang Minat Bahasa

Biologi

Matematika

Fisika

Kimia

Sosiologi

Geografi

Sejarah

Ekonomi

Bahasa Inggris

Bahasa Indonesia

Peminatan Jurusan Mata Pelajaran

Page 57: data mining fuzzy c-means

56

2. Menentukan Nilai Parameter Awal :

- Jumlah cluster ( c ) = 3

- Pangkat (w) = 2

- Maksimum interasi (MaxIter) = 100

- Error terkecil yang diharapkan ( ξ ) = 10--

5

- Fungsi objektif awal (P0) = 0

- Interasi awal (t) = 1

3. Membangkitkan bilangan random µik, i=1,2,...,n; k=1,2,...c; sebagai elemen-

elemen matriks partisi awal (U).

Berdasarkan persamaan 2.1, matrik partisi awal (u0) secara random

yang terbentuk dengan menggunakan Matlab adalah: >> rand('state',0)

>> X=[rand(27,3);rand(27,3);rand(27,3)]

X =

0.9501 0.6038 0.1509

0.2311 0.2722 0.6979

0.6068 0.1988 0.3784

0.4860 0.0153 0.8600

0.8913 0.7468 0.8537

0.7621 0.4451 0.5936

0.4565 0.9318 0.4966

0.0185 0.4660 0.8998

0.8214 0.4186 0.8216

0.4447 0.8462 0.6449

0.6154 0.5252 0.8180

0.7919 0.2026 0.6602

0.9218 0.6721 0.3420

0.7382 0.8381 0.2897

0.1763 0.0196 0.3412

0.4057 0.6813 0.5341

0.9355 0.3795 0.7271

0.9169 0.8318 0.3093

0.4103 0.5028 0.8385

0.8936 0.7095 0.5681

0.0579 0.4289 0.3704

0.3529 0.3046 0.7027

0.8132 0.1897 0.5466

0.0099 0.1934 0.4449

0.1389 0.6822 0.6946

0.2028 0.3028 0.6213

0.1987 0.5417 0.7948

0.9568 0.5298 0.4120

0.5226 0.6405 0.7446

Page 58: data mining fuzzy c-means

57

0.8801 0.2091 0.2679

0.1730 0.3798 0.4399

0.9797 0.7833 0.9334

0.2714 0.6808 0.6833

0.2523 0.4611 0.2126

0.8757 0.5678 0.8392

0.7373 0.7942 0.6288

0.1365 0.0592 0.1338

0.0118 0.6029 0.2071

0.8939 0.0503 0.6072

0.1991 0.4154 0.6299

0.2987 0.3050 0.3705

0.6614 0.8744 0.5751

0.2844 0.0150 0.4514

0.4692 0.7680 0.0439

0.0648 0.9708 0.0272

0.9883 0.9901 0.3127

0.5828 0.7889 0.0129

0.4235 0.4387 0.3840

0.5155 0.4983 0.6831

0.3340 0.2140 0.0928

0.4329 0.6435 0.0353

0.2259 0.3200 0.6124

0.5798 0.9601 0.6085

0.7604 0.7266 0.0158

0.0164 0.9084 0.9669

0.1901 0.2319 0.6649

0.5869 0.2393 0.8704

0.0576 0.0498 0.0099

0.3676 0.0784 0.1370

0.6315 0.6408 0.8188

0.7176 0.1909 0.4302

0.6927 0.8439 0.8903

0.0841 0.1739 0.7349

0.4544 0.1708 0.6873

0.4418 0.9943 0.3461

0.3533 0.4398 0.1660

0.1536 0.3400 0.1556

0.6756 0.3142 0.1911

0.6992 0.3651 0.4225

0.7275 0.3932 0.8560

0.4784 0.5915 0.4902

0.5548 0.1197 0.8159

0.1210 0.0381 0.4608

0.4508 0.4586 0.4574

0.7159 0.8699 0.4507

0.8928 0.9342 0.4122

0.2731 0.2644 0.9016

0.2548 0.1603 0.0056

Page 59: data mining fuzzy c-means

58

0.8656 0.8729 0.2974

0.2324 0.2379 0.0492

0.8049 0.6458 0.6932

4. Menentukan Pusat Klaster (V)

Pada iterasi pertama, dengan menggunakan persamaan 2.3 :

?$2 = ∑ (("#$)'p)# ) ∗ A#2 )∑ ("#$)'p)# )

dapat dihitung 3 pusat klaster Vkj dengan k=1,2,3 dan j=1,2,3 sebagai berikut:

Tabel 3.3 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Klaster ke-1

Derajat Keanggotaan Pada Klaster ke-1

(µi1) Xi1 Xi2 Xi3

1 0,9501 72,2 74,8 76,5 0,9027 65,2 67,5 69,1

2 0,2311 74,9 76,5 67,3 0,0534 4,0 4,1 3,6

3 0,6068 77,5 70,6 74,6 0,3682 28,5 26,0 27,5

4 0,4860 68,1 77,1 77,8 0,2362 16,1 18,2 18,4

5 0,8913 76,6 71,3 76,1 0,7944 60,9 56,6 60,5

6 0,7621 78,2 76,4 64,6 0,5808 45,4 44,4 37,5

7 0,4565 70,4 74,5 72,9 0,2084 14,7 15,5 15,2

8 0,0185 75,3 75,2 68,7 0,0003 0,0 0,0 0,0

9 0,8214 77,1 73,7 80,5 0,6747 52,0 49,7 54,3

10 0,4447 71,5 77,6 77,8 0,1978 14,1 15,3 15,4

11 0,6154 74,0 69,8 80,3 0,3787 28,0 26,4 30,4

12 0,7919 72,8 78,4 69,8 0,6271 45,7 49,2 43,8

13 0,9218 73,7 73,9 71,4 0,8497 62,6 62,8 60,7

14 0,7382 73,1 73,9 72,5 0,5449 39,8 40,3 39,5

15 0,1763 71,9 73,2 74,9 0,0311 2,2 2,3 2,3

(µi1)² x Xi3SiswaData yang diklaster

(µi1)² (µi1)² x Xi1 (µi1)² x Xi2

Page 60: data mining fuzzy c-means

59

Derajat Keanggotaan Pada Klaster ke-1

(µi1) Xi1 Xi2 Xi3

16 0,4057 74,3 73,2 70,3 0,1646 12,2 12,0 11,6

17 0,9355 78,3 79,2 79,0 0,8752 68,5 69,3 69,1

18 0,9169 71,8 74,3 77,9 0,8407 60,4 62,5 65,5

19 0,4103 74,1 75,3 80,3 0,1683 12,5 12,7 13,5

20 0,8936 74,7 72,4 72,1 0,7985 59,6 57,8 57,6

21 0,0579 74,0 71,3 71,9 0,0034 0,2 0,2 0,2

22 0,3529 70,6 78,5 76,6 0,1245 8,8 9,8 9,5

23 0,8132 76,8 78,6 73,5 0,6613 50,8 52,0 48,6

24 0,0099 75,3 71,2 77,6 0,0001 0,0 0,0 0,0

25 0,1389 76,1 72,4 72,4 0,0193 1,5 1,4 1,4

26 0,2028 70,7 78,9 69,0 0,0411 2,9 3,2 2,8

27 0,1987 83,4 76,1 78,8 0,0395 3,3 3,0 3,1

28 0,9568 70,8 76,6 79,0 0,9155 64,8 70,1 72,3

29 0,5226 78,3 75,5 80,2 0,2731 21,4 20,6 21,9

30 0,8801 76,7 76,4 73,8 0,7746 59,4 59,2 57,2

31 0,1730 74,4 79,4 86,1 0,0299 2,2 2,4 2,6

32 0,9797 80,4 76,7 78,8 0,9598 77,2 73,6 75,6

33 0,2714 66,5 71,0 71,4 0,0737 4,9 5,2 5,3

34 0,2523 69,2 76,4 69,0 0,0637 4,4 4,9 4,4

35 0,8757 82,7 86,1 80,0 0,7669 63,4 66,0 61,3

36 0,7373 75,3 73,5 71,5 0,5436 40,9 40,0 38,9

37 0,1365 82,5 79,3 70,8 0,0186 1,5 1,5 1,3

38 0,0118 69,3 70,8 73,8 0,0001 0,0 0,0 0,0

39 0,8939 77,5 80,6 77,9 0,7991 61,9 64,4 62,2

40 0,1991 67,6 75,5 73,0 0,0396 2,7 3,0 2,9

41 0,2987 80,3 75,7 74,8 0,0892 7,2 6,8 6,7

42 0,6614 70,3 74,2 68,5 0,4374 30,8 32,5 30,0

43 0,2844 78,5 65,0 82,5 0,0809 6,3 5,3 6,7

44 0,4692 68,5 77,5 72,5 0,2201 15,1 17,1 16,0

45 0,0648 81,7 70,5 72,5 0,0042 0,3 0,3 0,3

46 0,9883 77,5 75,0 75,8 0,9767 75,7 73,3 74,0

47 0,5828 87,5 70,5 77,0 0,3397 29,7 23,9 26,2

48 0,4235 75,9 78,0 86,5 0,1794 13,6 14,0 15,5

49 0,5155 70,5 70,0 75,5 0,2657 18,7 18,6 20,1

50 0,3340 79,0 72,0 65,0 0,1116 8,8 8,0 7,3

51 0,4329 65,0 80,0 70,5 0,1874 12,2 15,0 13,2

(µi1)² x Xi3SiswaData yang diklaster

(µi1)² (µi1)² x Xi1 (µi1)² x Xi2

Page 61: data mining fuzzy c-means

60

Derajat Keanggotaan Pada Klaster ke-1

(µi1) Xi1 Xi2 Xi3

52 0,2259 78,0 75,0 89,5 0,0510 4,0 3,8 4,6

53 0,5798 72,5 75,0 82,5 0,3362 24,4 25,2 27,7

54 0,7604 81,0 65,7 75,5 0,5782 46,8 38,0 43,7

55 0,0164 89,7 76,5 68,0 0,0003 0,0 0,0 0,0

56 0,1901 78,5 67,5 85,7 0,0361 2,8 2,4 3,1

57 0,5869 65,0 89,5 70,5 0,3445 22,4 30,8 24,3

58 0,0576 70,7 92,0 78,5 0,0033 0,2 0,3 0,3

59 0,3676 75,5 70,0 79,5 0,1351 10,2 9,5 10,7

60 0,6315 85,0 75,5 80,2 0,3988 33,9 30,1 32,0

61 0,7176 68,5 65,0 78,5 0,5149 35,3 33,5 40,4

62 0,6927 82,5 69,5 72,1 0,4798 39,6 33,3 34,6

63 0,0841 74,5 90,2 70,5 0,0071 0,5 0,6 0,5

64 0,4544 69,5 72,5 79,0 0,2065 14,4 15,0 16,3

65 0,4418 70,9 74,5 91,5 0,1952 13,8 14,5 17,9

66 0,3533 82,5 72,5 70,6 0,1248 10,3 9,0 8,8

67 0,1536 75,8 82,1 70,8 0,0236 1,8 1,9 1,7

68 0,6756 80,2 74,5 72,5 0,4564 36,6 34,0 33,1

69 0,6992 74,5 91,5 69,5 0,4889 36,4 44,7 34,0

70 0,7275 60,5 68,7 77,8 0,5293 32,0 36,4 41,2

71 0,4784 74,5 77,8 69,8 0,2289 17,1 17,8 16,0

72 0,5548 79,0 72,5 73,8 0,3078 24,3 22,3 22,7

73 0,1210 87,5 75,2 71,8 0,0146 1,3 1,1 1,1

74 0,4508 65,0 76,8 67,5 0,2032 13,2 15,6 13,7

75 0,7159 76,0 94,8 74,0 0,5125 39,0 48,6 37,9

76 0,8928 65,0 77,8 81,5 0,7971 51,8 62,0 65,0

77 0,2731 65,5 68,0 75,8 0,0746 4,9 5,1 5,7

78 0,2548 80,4 75,5 74,2 0,0649 5,2 4,9 4,8

79 0,8656 90,1 78,7 74,3 0,7493 67,5 59,0 55,7

80 0,2324 75,7 74,0 87,5 0,0540 4,1 4,0 4,7

81 0,8049 74,9 77,3 65,0 0,6479 48,5 50,1 42,1

∑ 26,9003 2.025,6 2.041,6 2.026,9

(µi1)² x Xi3SiswaData yang diklaster

(µi1)² (µi1)² x Xi1 (µi1)² x Xi2

75,30 75,89 75,35

Page 62: data mining fuzzy c-means

61

Tabel 3.4 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Klaster ke-2

Derajat Keanggotaan Pada Klaster ke-2

(µi2) Xi1 Xi2 Xi3

1 0,6038 72,2 74,8 76,5 0,3646 26,3 27,3 27,9

2 0,2722 74,9 76,5 67,3 0,0741 5,5 5,7 5,0

3 0,1988 77,5 70,6 74,6 0,0395 3,1 2,8 2,9

4 0,0153 68,1 77,1 77,8 0,0002 0,0 0,0 0,0

5 0,7468 76,6 71,3 76,1 0,5577 42,7 39,8 42,4

6 0,4451 78,2 76,4 64,6 0,1981 15,5 15,1 12,8

7 0,9318 70,4 74,5 72,9 0,8683 61,1 64,7 63,3

8 0,4660 75,3 75,2 68,7 0,2172 16,4 16,3 14,9

9 0,4186 77,1 73,7 80,5 0,1752 13,5 12,9 14,1

10 0,8462 71,5 77,6 77,8 0,7161 51,2 55,6 55,7

11 0,5252 74,0 69,8 80,3 0,2758 20,4 19,3 22,1

12 0,2026 72,8 78,4 69,8 0,0410 3,0 3,2 2,9

13 0,6721 73,7 73,9 71,4 0,4517 33,3 33,4 32,3

14 0,8381 73,1 73,9 72,5 0,7024 51,3 51,9 50,9

15 0,0196 71,9 73,2 74,9 0,0004 0,0 0,0 0,0

16 0,6813 74,3 73,2 70,3 0,4642 34,5 34,0 32,6

17 0,3795 78,3 79,2 79,0 0,1440 11,3 11,4 11,4

18 0,8318 71,8 74,3 77,9 0,6919 49,7 51,4 53,9

19 0,5028 74,1 75,3 80,3 0,2528 18,7 19,0 20,3

20 0,7095 74,7 72,4 72,1 0,5034 37,6 36,4 36,3

21 0,4289 74,0 71,3 71,9 0,1840 13,6 13,1 13,2

22 0,3046 70,6 78,5 76,6 0,0928 6,6 7,3 7,1

23 0,1897 76,8 78,6 73,5 0,0360 2,8 2,8 2,6

24 0,1934 75,3 71,2 77,6 0,0374 2,8 2,7 2,9

25 0,6822 76,1 72,4 72,4 0,4654 35,4 33,7 33,7

26 0,3028 70,7 78,9 69,0 0,0917 6,5 7,2 6,3

27 0,5417 83,4 76,1 78,8 0,2934 24,5 22,3 23,1

28 0,5298 70,8 76,6 79,0 0,2807 19,9 21,5 22,2

29 0,6405 78,3 75,5 80,2 0,4102 32,1 31,0 32,9

30 0,2091 76,7 76,4 73,8 0,0437 3,4 3,3 3,2

31 0,3798 74,4 79,4 86,1 0,1442 10,7 11,5 12,4

32 0,7833 80,4 76,7 78,8 0,6136 49,3 47,1 48,3

33 0,6808 66,5 71,0 71,4 0,4635 30,8 32,9 33,1

(µi2)² x Xi3SiswaData yang diklaster

(µi2)² (µi2)² x Xi1 (µi2)² x Xi2

Page 63: data mining fuzzy c-means

62

Derajat Keanggotaan Pada Klaster ke-2

(µi2) Xi1 Xi2 Xi3

34 0,4611 69,2 76,4 69,0 0,2126 14,7 16,2 14,7

35 0,5678 82,7 86,1 80,0 0,3224 26,7 27,8 25,8

36 0,7942 75,3 73,5 71,5 0,6308 47,5 46,4 45,1

37 0,0592 82,5 79,3 70,8 0,0035 0,3 0,3 0,2

38 0,6029 69,3 70,8 73,8 0,3635 25,2 25,7 26,8

39 0,0503 77,5 80,6 77,9 0,0025 0,2 0,2 0,2

40 0,4154 67,6 75,5 73,0 0,1726 11,7 13,0 12,6

41 0,3050 80,3 75,7 74,8 0,0930 7,5 7,0 7,0

42 0,8744 70,3 74,2 68,5 0,7646 53,7 56,7 52,4

43 0,0150 78,5 65,0 82,5 0,0002 0,0 0,0 0,0

44 0,7680 68,5 77,5 72,5 0,5898 40,4 45,7 42,8

45 0,9708 81,7 70,5 72,5 0,9425 77,0 66,4 68,3

46 0,9901 77,5 75,0 75,8 0,9803 76,0 73,5 74,3

47 0,7889 87,5 70,5 77,0 0,6224 54,5 43,9 47,9

48 0,4387 75,9 78,0 86,5 0,1925 14,6 15,0 16,6

49 0,4983 70,5 70,0 75,5 0,2483 17,5 17,4 18,7

50 0,2140 79,0 72,0 65,0 0,0458 3,6 3,3 3,0

51 0,6435 65,0 80,0 70,5 0,4141 26,9 33,1 29,2

52 0,3200 78,0 75,0 89,5 0,1024 8,0 7,7 9,2

53 0,9601 72,5 75,0 82,5 0,9218 66,8 69,1 76,0

54 0,7266 81,0 65,7 75,5 0,5279 42,8 34,7 39,9

55 0,9084 89,7 76,5 68,0 0,8252 74,0 63,1 56,1

56 0,2319 78,5 67,5 85,7 0,0538 4,2 3,6 4,6

57 0,2393 65,0 89,5 70,5 0,0573 3,7 5,1 4,0

58 0,0498 70,7 92,0 78,5 0,0025 0,2 0,2 0,2

59 0,0784 75,5 70,0 79,5 0,0061 0,5 0,4 0,5

60 0,6408 85,0 75,5 80,2 0,4106 34,9 31,0 32,9

61 0,1909 68,5 65,0 78,5 0,0364 2,5 2,4 2,9

62 0,8439 82,5 69,5 72,1 0,7122 58,8 49,5 51,3

63 0,1739 74,5 90,2 70,5 0,0302 2,3 2,7 2,1

64 0,1708 69,5 72,5 79,0 0,0292 2,0 2,1 2,3

65 0,9943 70,9 74,5 91,5 0,9886 70,1 73,7 90,5

66 0,4398 82,5 72,5 70,6 0,1934 16,0 14,0 13,7

67 0,3400 75,8 82,1 70,8 0,1156 8,8 9,5 8,2

68 0,3142 80,2 74,5 72,5 0,0987 7,9 7,4 7,2

69 0,3651 74,5 91,5 69,5 0,1333 9,9 12,2 9,3

(µi2)² x Xi3SiswaData yang diklaster

(µi2)² (µi2)² x Xi1 (µi2)² x Xi2

Page 64: data mining fuzzy c-means

63

Derajat Keanggotaan Pada Klaster ke-2

(µi1) Xi1 Xi2 Xi3

70 0,3932 60,5 68,7 77,8 0,1546 9,4 10,6 12,0

71 0,5915 74,5 77,8 69,8 0,3499 26,1 27,2 24,4

72 0,1197 79,0 72,5 73,8 0,0143 1,1 1,0 1,1

73 0,0381 87,5 75,2 71,8 0,0015 0,1 0,1 0,1

74 0,4586 65,0 76,8 67,5 0,2103 13,7 16,2 14,2

75 0,8699 76,0 94,8 74,0 0,7567 57,5 71,7 56,0

76 0,9342 65,0 77,8 81,5 0,8727 56,7 67,9 71,1

77 0,2644 65,5 68,0 75,8 0,0699 4,6 4,8 5,3

78 0,1603 80,4 75,5 74,2 0,0257 2,1 1,9 1,9

79 0,8729 90,1 78,7 74,3 0,7620 68,7 60,0 56,6

80 0,2379 75,7 74,0 87,5 0,0566 4,3 4,2 5,0

81 0,6458 74,9 77,3 65,0 0,4171 31,2 32,2 27,1

∑ 25,4330 1.920,2 1.914,7 1.914,3

(µi1)² x Xi3SiswaData yang diklaster

(µi1)² (µi1)² x Xi1 (µi1)² x Xi2

75,50 75,28 75,27

Tabel 3.5 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Klaster ke-3

Derajat Keanggotaan Pada Klaster ke-3

(µi3) Xi1 Xi2 Xi3

1 0,1509 72,2 74,8 76,5 0,0228 1,6 1,7 1,7

2 0,6979 74,9 76,5 67,3 0,4871 36,5 37,3 32,8

3 0,3784 77,5 70,6 74,6 0,1432 11,1 10,1 10,7

4 0,8600 68,1 77,1 77,8 0,7396 50,4 57,0 57,5

5 0,8537 76,6 71,3 76,1 0,7288 55,8 52,0 55,5

6 0,5936 78,2 76,4 64,6 0,3524 27,6 26,9 22,8

7 0,4966 70,4 74,5 72,9 0,2466 17,4 18,4 18,0

8 0,8998 75,3 75,2 68,7 0,8096 61,0 60,9 55,6

9 0,8216 77,1 73,7 80,5 0,6750 52,0 49,7 54,3

10 0,6449 71,5 77,6 77,8 0,4159 29,7 32,3 32,4

11 0,8180 74,0 69,8 80,3 0,6691 49,5 46,7 53,7

(µi3)² x Xi3SiswaData yang diklaster

(µi3)² (µi3)² x Xi1 (µi3)² x Xi2

Page 65: data mining fuzzy c-means

64

Derajat Keanggotaan Pada Klaster ke-3

(µi3) Xi1 Xi2 Xi3

12 0,6602 72,8 78,4 69,8 0,4359 31,7 34,2 30,4

13 0,3420 73,7 73,9 71,4 0,1170 8,6 8,6 8,4

14 0,2897 73,1 73,9 72,5 0,0839 6,1 6,2 6,1

15 0,3412 71,9 73,2 74,9 0,1164 8,4 8,5 8,7

16 0,5341 74,3 73,2 70,3 0,2853 21,2 20,9 20,1

17 0,7271 78,3 79,2 79,0 0,5287 41,4 41,9 41,8

18 0,3093 71,8 74,3 77,9 0,0957 6,9 7,1 7,5

19 0,8385 74,1 75,3 80,3 0,7031 52,1 52,9 56,5

20 0,5681 74,7 72,4 72,1 0,3227 24,1 23,4 23,3

21 0,3704 74,0 71,3 71,9 0,1372 10,2 9,8 9,9

22 0,7027 70,6 78,5 76,6 0,4938 34,9 38,8 37,8

23 0,5466 76,8 78,6 73,5 0,2988 22,9 23,5 22,0

24 0,4449 75,3 71,2 77,6 0,1979 14,9 14,1 15,4

25 0,6946 76,1 72,4 72,4 0,4825 36,7 34,9 34,9

26 0,6213 70,7 78,9 69,0 0,3860 27,3 30,5 26,6

27 0,7948 83,4 76,1 78,8 0,6317 52,7 48,1 49,8

28 0,4120 70,8 76,6 79,0 0,1697 12,0 13,0 13,4

29 0,7446 78,3 75,5 80,2 0,5544 43,4 41,9 44,5

30 0,2679 76,7 76,4 73,8 0,0718 5,5 5,5 5,3

31 0,4399 74,4 79,4 86,1 0,1935 14,4 15,4 16,7

32 0,9334 80,4 76,7 78,8 0,8712 70,0 66,8 68,7

33 0,6833 66,5 71,0 71,4 0,4669 31,0 33,1 33,3

34 0,2126 69,2 76,4 69,0 0,0452 3,1 3,5 3,1

35 0,8392 82,7 86,1 80,0 0,7043 58,2 60,6 56,3

36 0,6288 75,3 73,5 71,5 0,3954 29,8 29,1 28,3

37 0,1338 82,5 79,3 70,8 0,0179 1,5 1,4 1,3

38 0,2071 69,3 70,8 73,8 0,0429 3,0 3,0 3,2

39 0,6072 77,5 80,6 77,9 0,3687 28,6 29,7 28,7

40 0,6299 67,6 75,5 73,0 0,3968 26,8 30,0 29,0

41 0,3705 80,3 75,7 74,8 0,1373 11,0 10,4 10,3

42 0,5751 70,3 74,2 68,5 0,3307 23,3 24,5 22,7

43 0,4514 78,5 65,0 82,5 0,2038 16,0 13,2 16,8

44 0,0439 68,5 77,5 72,5 0,0019 0,1 0,1 0,1

45 0,0272 81,7 70,5 72,5 0,0007 0,1 0,1 0,1

46 0,3127 77,5 75,0 75,8 0,0978 7,6 7,3 7,4

47 0,0129 87,5 70,5 77,0 0,0002 0,0 0,0 0,0

(µi3)² x Xi3SiswaData yang diklaster

(µi3)² (µi3)² x Xi1 (µi3)² x Xi2

Page 66: data mining fuzzy c-means

65

Derajat Keanggotaan Pada Klaster ke-3

(µi3) Xi1 Xi2 Xi3

48 0,3840 75,9 78,0 86,5 0,1475 11,2 11,5 12,8

49 0,6831 70,5 70,0 75,5 0,4666 32,9 32,7 35,2

50 0,0928 79,0 72,0 65,0 0,0086 0,7 0,6 0,6

51 0,0353 65,0 80,0 70,5 0,0012 0,1 0,1 0,1

52 0,6124 78,0 75,0 89,5 0,3750 29,3 28,1 33,6

53 0,6085 72,5 75,0 82,5 0,3703 26,8 27,8 30,5

54 0,0158 81,0 65,7 75,5 0,0002 0,0 0,0 0,0

55 0,9669 89,7 76,5 68,0 0,9349 83,9 71,5 63,6

56 0,6649 78,5 67,5 85,7 0,4421 34,7 29,8 37,9

57 0,8704 65,0 89,5 70,5 0,7576 49,2 67,8 53,4

58 0,0099 70,7 92,0 78,5 0,0001 0,0 0,0 0,0

59 0,1370 75,5 70,0 79,5 0,0188 1,4 1,3 1,5

60 0,8188 85,0 75,5 80,2 0,6704 57,0 50,6 53,8

61 0,4302 68,5 65,0 78,5 0,1851 12,7 12,0 14,5

62 0,8903 82,5 69,5 72,1 0,7926 65,4 55,1 57,1

63 0,7349 74,5 90,2 70,5 0,5401 40,2 48,7 38,1

64 0,6873 69,5 72,5 79,0 0,4724 32,8 34,2 37,3

65 0,3461 70,9 74,5 91,5 0,1198 8,5 8,9 11,0

66 0,1660 82,5 72,5 70,6 0,0276 2,3 2,0 1,9

67 0,1556 75,8 82,1 70,8 0,0242 1,8 2,0 1,7

68 0,1911 80,2 74,5 72,5 0,0365 2,9 2,7 2,6

69 0,4225 74,5 91,5 69,5 0,1785 13,3 16,3 12,4

70 0,8560 60,5 68,7 77,8 0,7327 44,3 50,3 57,0

71 0,4902 74,5 77,8 69,8 0,2403 17,9 18,7 16,8

72 0,8159 79,0 72,5 73,8 0,6657 52,6 48,3 49,1

73 0,4608 87,5 75,2 71,8 0,2123 18,6 16,0 15,2

74 0,4574 65,0 76,8 67,5 0,2092 13,6 16,1 14,1

75 0,4507 76,0 94,8 74,0 0,2031 15,4 19,3 15,0

76 0,4122 65,0 77,8 81,5 0,1699 11,0 13,2 13,8

77 0,9016 65,5 68,0 75,8 0,8129 53,2 55,3 61,6

78 0,0056 80,4 75,5 74,2 0,0000 0,0 0,0 0,0

79 0,2974 90,1 78,7 74,3 0,0884 8,0 7,0 6,6

(µi3)² x Xi3SiswaData yang diklaster

(µi3)² (µi3)² x Xi1 (µi3)² x Xi2

Page 67: data mining fuzzy c-means

66

Derajat Keanggotaan Pada Klaster ke-3

(µi3) Xi1 Xi2 Xi3

80 0,0492 75,7 74,0 87,5 0,0024 0,2 0,2 0,2

81 0,6932 74,9 77,3 65,0 0,4805 36,0 37,1 31,2

∑ 26,0654 1.956,2 1.970,3 1.963,4

75,05 75,59 75,33

SiswaData yang diklaster

(µi3)² (µi3)² x Xi1 (µi3)² x Xi2 (µi3)² x Xi3

Pusat klaster (V) yang terbentuk pada iterasi pertama adalah:

75,30 75,89 75,35 75,50 75,28 75,27 75,05 75,59 75,33

5. Menghitung Fungsi Objektif (P)

Fungsi objektif pada iterasi pertama (p1) dihitung dengan menggunakan

persamaan 2.4:

a) ∑ ∑ cN∑ OPQR – TUR V6jRX5 Y(\QU)6d q.f)),qfpijUX5r5QX5

Hasil perhitungan secara rinci dapat dilihat pada table 3.6 berikut:

Tabel 3.6 Hasil Perhitungan Fungsi Objektif pada Iterasi Pertama

µi1² µi2² µi3²

1 0,9027 0,3646 0,0228 10,9411 4,6058 0,2303 15,7773

2 0,0534 0,0741 0,4871 3,4893 4,8434 31,8206 40,1534

3 0,3682 0,0395 0,1432 12,2932 1,0414 4,5011 17,8357

4 0,2362 0,0002 0,7396 14,0080 0,0151 41,9231 55,9462

5 0,7944 0,5577 0,7288 18,5263 9,8934 15,5960 44,0157

Siswa

Kuadrat Derajat Keanggotaan Data ke i LT= L1+L2+L3L1 L2 L3

V1 =

Page 68: data mining fuzzy c-means

67

µi1² µi2² µi3²

6 0,5808 0,1981 0,3524 72,1538 24,2478 44,2958 140,6975

7 0,2084 0,8683 0,2466 6,6570 27,9883 7,0816 41,7269

8 0,0003 0,2172 0,8096 0,0153 9,3836 35,7630 45,1619

9 0,6747 0,1752 0,6750 23,3166 5,6790 23,2908 52,2863

10 0,1978 0,7161 0,4159 4,6209 19,8944 9,4589 33,9742

11 0,3787 0,2758 0,6691 23,9654 15,8829 39,6975 79,5458

12 0,6271 0,0410 0,4359 27,1867 1,9270 18,9773 48,0909

13 0,8497 0,4517 0,1170 18,7979 9,0892 2,3537 30,2408

14 0,5449 0,7024 0,0839 9,2218 10,7731 1,2310 21,2259

15 0,0311 0,0004 0,1164 0,5905 0,0067 1,8417 2,4389

16 0,1646 0,4642 0,2853 5,5531 14,1420 9,0073 28,7024

17 0,8752 0,1440 0,5287 29,1241 5,3459 19,5945 54,0646

18 0,8407 0,6919 0,0957 17,8907 14,9222 1,8015 34,6145

19 0,1683 0,2528 0,7031 4,4259 6,8919 18,0604 29,3782

20 0,7985 0,5034 0,3227 18,4479 9,5560 6,6908 34,6948

21 0,0034 0,1840 0,1372 0,1162 5,4170 4,2903 9,8235

22 0,1245 0,0928 0,4938 3,7940 3,3538 14,7561 21,9039

23 0,6613 0,0360 0,2988 8,6078 0,5702 4,6224 13,8005

24 0,0001 0,0374 0,1979 0,0027 0,8272 4,8470 5,6768

25 0,0193 0,4654 0,4825 0,4152 7,8612 9,5835 17,8599

26 0,0411 0,0917 0,3860 2,9013 6,9185 27,0007 36,8205

27 0,0395 0,2934 0,6317 3,0621 22,1673 51,8148 77,0442

28 0,9155 0,2807 0,1697 31,1960 10,5947 5,5254 47,3161

29 0,2731 0,4102 0,5544 8,9238 13,2070 19,0100 41,1408

30 0,7746 0,0437 0,0718 3,5806 0,2123 0,4105 4,2033

31 0,0299 0,1442 0,1935 3,8516 19,5418 25,3368 48,7302

32 0,9598 0,6136 0,8712 37,0186 23,6142 36,5008 97,1337

33 0,0737 0,4635 0,4669 8,6146 52,9746 51,1794 112,7686

34 0,0637 0,2126 0,0452 4,9519 17,0638 3,3875 25,4032

35 0,7669 0,3224 0,7043 138,5136 61,6698 134,3662 334,5496

36 0,5436 0,6308 0,3954 11,1628 10,9885 7,5517 29,7031

37 0,0186 0,0035 0,0179 1,5683 0,2984 1,6074 3,4741

38 0,0001 0,3635 0,0429 0,0090 22,0533 2,5025 24,5648

39 0,7991 0,0025 0,3687 26,7897 0,0992 13,9024 40,7913

40 0,0396 0,1726 0,3968 2,5752 11,6668 24,1792 38,4213

41 0,0892 0,0930 0,1373 2,2608 2,1803 3,8237 8,2647

L2 L3 LT= L1+L2+L3Siswa

Kuadrat Derajat Keanggotaan Data ke i L1

Page 69: data mining fuzzy c-means

68

µi1² µi2² µi3²

42 0,4374 0,7646 0,3307 32,7119 56,6086 23,5300 112,8505

43 0,0809 0,0002 0,2038 14,5553 0,0376 35,7520 50,3449

44 0,2201 0,5898 0,0019 12,5385 36,3339 0,1051 48,9776

45 0,0042 0,9425 0,0007 0,3281 64,9928 0,0578 65,3787

46 0,9767 0,9803 0,0978 5,6989 4,2734 0,6426 10,6149

47 0,3397 0,6224 0,0002 61,3468 105,7030 0,0306 167,0803

48 0,1794 0,1925 0,1475 23,1606 25,7261 19,3609 68,2475

49 0,2657 0,2483 0,4666 15,3477 13,1430 24,2550 52,7457

50 0,1116 0,0458 0,0086 15,1654 5,8839 1,1643 22,2137

51 0,1874 0,4141 0,0012 27,4553 64,3008 0,1792 91,9353

52 0,0510 0,1024 0,3750 10,6300 21,3833 78,6969 110,7102

53 0,3362 0,9218 0,3703 20,0876 56,5531 21,5719 98,2126

54 0,5782 0,5279 0,0002 78,8379 64,4515 0,0333 143,3226

55 0,0003 0,8252 0,9349 0,0704 211,2334 251,6547 462,9585

56 0,0361 0,0538 0,4421 6,7851 9,5893 81,7373 98,1116

57 0,3445 0,0573 0,7576 108,4487 19,1957 240,7788 368,4233

58 0,0033 0,0025 0,0001 0,9642 0,7763 0,0292 1,7698

59 0,1351 0,0061 0,0188 7,0206 0,2813 0,9167 8,2186

60 0,3988 0,4106 0,6704 46,9636 47,0589 82,2806 176,3032

61 0,5149 0,0364 0,1851 89,9898 6,0171 30,5553 126,5623

62 0,4798 0,7122 0,7926 49,5354 65,8451 81,6599 197,0404

63 0,0071 0,0302 0,5401 1,6192 7,4502 128,0436 137,1130

64 0,2065 0,0292 0,4724 12,0697 1,6815 25,4233 39,1745

65 0,1952 0,9886 0,1198 55,0652 281,9395 33,5254 370,5301

66 0,1248 0,1934 0,0276 10,7214 15,1910 2,4090 28,3215

67 0,0236 0,1156 0,0242 1,4042 7,6970 1,5365 10,6377

68 0,4564 0,0987 0,0365 15,5483 2,9983 1,3044 19,8510

69 0,4889 0,1333 0,1785 136,1702 39,6403 51,3062 227,1167

70 0,5293 0,1546 0,7327 146,4656 42,4699 194,3769 383,3125

71 0,2289 0,3499 0,2403 8,0311 13,0402 8,5948 29,6660

72 0,3078 0,0143 0,6657 8,4906 0,3172 18,3009 27,1087

73 0,0146 0,0015 0,2123 2,3707 0,2265 35,5909 38,1881

74 0,2032 0,2103 0,2092 34,2509 36,3703 34,2643 104,8855

75 0,5125 0,7567 0,2031 184,4537 289,7453 75,5027 549,7017

76 0,7971 0,8727 0,1699 117,6194 135,6338 24,4593 277,7125

77 0,0746 0,0699 0,8129 11,8211 10,7154 121,1451 143,6816

L2 L3 LT= L1+L2+L3Siswa

Kuadrat Derajat Keanggotaan Data ke i L1

Page 70: data mining fuzzy c-means

69

µi1² µi2² µi3²

78 0,0649 0,0257 0,0000 1,7844 0,6476 0,0009 2,4329

79 0,7493 0,7620 0,0884 170,8610 172,0472 20,9827 363,8909

80 0,0540 0,0566 0,0024 8,1746 8,5603 0,3657 17,1006

81 0,6479 0,4171 0,4805 70,7925 45,8402 52,6923 169,3250

7.311,7384

L2 L3 LT= L1+L2+L3

Fungsi Objek4ve = ∑

Siswa

Kuadrat Derajat Keanggotaan Data ke i L1

dengan:

s1 = l�OA#2 – ?)2 V'f2 )

n ("#))'

s2 = l�OA#2 – ?'2 V'f2 )

n ("#')'

s3 = l�OA#2 – ?f2 V'f2 )

n ("#f)'

6. Menghitung Perubahan Matriks Partisi (U)

Perubahan matriks partisi (U) dihitung menggunakan persamaan 2.5:

"#$ = N∑ OA#2 − ?$2 V'f2 ) Y S)'S)∑ N∑ OA#2 − ?$2 V'f2 ) Y($ )

S)'S)

Hasil perhitungan secara rinci dapat dilihat pada table 3.8 berikut:

Page 71: data mining fuzzy c-means

70

Tabel 3.7 Hasil Perhitungan Derajat Keanggotaan Baru (Matriks Partisi Baru)

µi1 µi2 µi3

L1/LT L2/LT L3/LT

1 10,9411 4,6058 0,2303 15,7773 0,6935 0,2919 0,0146

2 3,4893 4,8434 31,8206 40,1534 0,0869 0,1206 0,7925

3 12,2932 1,0414 4,5011 17,8357 0,6892 0,0584 0,2524

4 14,0080 0,0151 41,9231 55,9462 0,2504 0,0003 0,7493

5 18,5263 9,8934 15,5960 44,0157 0,4209 0,2248 0,3543

6 72,1538 24,2478 44,2958 140,6975 0,5128 0,1723 0,3148

7 6,6570 27,9883 7,0816 41,7269 0,1595 0,6708 0,1697

8 0,0153 9,3836 35,7630 45,1619 0,0003 0,2078 0,7919

9 23,3166 5,6790 23,2908 52,2863 0,4459 0,1086 0,4454

10 4,6209 19,8944 9,4589 33,9742 0,1360 0,5856 0,2784

11 23,9654 15,8829 39,6975 79,5458 0,3013 0,1997 0,4991

12 27,1867 1,9270 18,9773 48,0909 0,5653 0,0401 0,3946

13 18,7979 9,0892 2,3537 30,2408 0,6216 0,3006 0,0778

14 9,2218 10,7731 1,2310 21,2259 0,4345 0,5075 0,0580

15 0,5905 0,0067 1,8417 2,4389 0,2421 0,0027 0,7551

16 5,5531 14,1420 9,0073 28,7024 0,1935 0,4927 0,3138

17 29,1241 5,3459 19,5945 54,0646 0,5387 0,0989 0,3624

18 17,8907 14,9222 1,8015 34,6145 0,5169 0,4311 0,0520

19 4,4259 6,8919 18,0604 29,3782 0,1507 0,2346 0,6148

20 18,4479 9,5560 6,6908 34,6948 0,5317 0,2754 0,1928

21 0,1162 5,4170 4,2903 9,8235 0,0118 0,5514 0,4367

22 3,7940 3,3538 14,7561 21,9039 0,1732 0,1531 0,6737

23 8,6078 0,5702 4,6224 13,8005 0,6237 0,0413 0,3349

24 0,0027 0,8272 4,8470 5,6768 0,0005 0,1457 0,8538

25 0,4152 7,8612 9,5835 17,8599 0,0232 0,4402 0,5366

26 2,9013 6,9185 27,0007 36,8205 0,0788 0,1879 0,7333

27 3,0621 22,1673 51,8148 77,0442 0,0397 0,2877 0,6725

28 31,1960 10,5947 5,5254 47,3161 0,6593 0,2239 0,1168

29 8,9238 13,2070 19,0100 41,1408 0,2169 0,3210 0,4621

30 3,5806 0,2123 0,4105 4,2033 0,8518 0,0505 0,0977

31 3,8516 19,5418 25,3368 48,7302 0,0790 0,4010 0,5199

32 37,0186 23,6142 36,5008 97,1337 0,3811 0,2431 0,3758

33 8,6146 52,9746 51,1794 112,7686 0,0764 0,4698 0,4538

34 4,9519 17,0638 3,3875 25,4032 0,1949 0,6717 0,1334

35 138,5136 61,6698 134,3662 334,5496 0,4140 0,1843 0,4016

Siswa LTL1 L2 L3

Page 72: data mining fuzzy c-means

71

µi1 µi2 µi3

L1/LT L2/LT L3/LT

36 11,1628 10,9885 7,5517 29,7031 0,3758 0,3699 0,2542

37 1,5683 0,2984 1,6074 3,4741 0,4514 0,0859 0,4627

38 0,0090 22,0533 2,5025 24,5648 0,0004 0,8978 0,1019

39 26,7897 0,0992 13,9024 40,7913 0,6567 0,0024 0,3408

40 2,5752 11,6668 24,1792 38,4213 0,0670 0,3037 0,6293

41 2,2608 2,1803 3,8237 8,2647 0,2735 0,2638 0,4627

42 32,7119 56,6086 23,5300 112,8505 0,2899 0,5016 0,2085

43 14,5553 0,0376 35,7520 50,3449 0,2891 0,0007 0,7101

44 12,5385 36,3339 0,1051 48,9776 0,2560 0,7418 0,0021

45 0,3281 64,9928 0,0578 65,3787 0,0050 0,9941 0,0009

46 5,6989 4,2734 0,6426 10,6149 0,5369 0,4026 0,0605

47 61,3468 105,7030 0,0306 167,0803 0,3672 0,6326 0,0002

48 23,1606 25,7261 19,3609 68,2475 0,3394 0,3770 0,2837

49 15,3477 13,1430 24,2550 52,7457 0,2910 0,2492 0,4598

50 15,1654 5,8839 1,1643 22,2137 0,6827 0,2649 0,0524

51 27,4553 64,3008 0,1792 91,9353 0,2986 0,6994 0,0019

52 10,6300 21,3833 78,6969 110,7102 0,0960 0,1931 0,7108

53 20,0876 56,5531 21,5719 98,2126 0,2045 0,5758 0,2196

54 78,8379 64,4515 0,0333 143,3226 0,5501 0,4497 0,0002

55 0,0704 211,2334 251,6547 462,9585 0,0002 0,4563 0,5436

56 6,7851 9,5893 81,7373 98,1116 0,0692 0,0977 0,8331

57 108,4487 19,1957 240,7788 368,4233 0,2944 0,0521 0,6535

58 0,9642 0,7763 0,0292 1,7698 0,5448 0,4387 0,0165

59 7,0206 0,2813 0,9167 8,2186 0,8542 0,0342 0,1115

60 46,9636 47,0589 82,2806 176,3032 0,2664 0,2669 0,4667

61 89,9898 6,0171 30,5553 126,5623 0,7110 0,0475 0,2414

62 49,5354 65,8451 81,6599 197,0404 0,2514 0,3342 0,4144

63 1,6192 7,4502 128,0436 137,1130 0,0118 0,0543 0,9339

64 12,0697 1,6815 25,4233 39,1745 0,3081 0,0429 0,6490

65 55,0652 281,9395 33,5254 370,5301 0,1486 0,7609 0,0905

66 10,7214 15,1910 2,4090 28,3215 0,3786 0,5364 0,0851

67 1,4042 7,6970 1,5365 10,6377 0,1320 0,7236 0,1444

68 15,5483 2,9983 1,3044 19,8510 0,7832 0,1510 0,0657

69 136,1702 39,6403 51,3062 227,1167 0,5996 0,1745 0,2259

70 146,4656 42,4699 194,3769 383,3125 0,3821 0,1108 0,5071

71 8,0311 13,0402 8,5948 29,6660 0,2707 0,4396 0,2897

72 8,4906 0,3172 18,3009 27,1087 0,3132 0,0117 0,6751

73 2,3707 0,2265 35,5909 38,1881 0,0621 0,0059 0,9320

Siswa L1 L2 L3 LT

Page 73: data mining fuzzy c-means

72

µi1 µi2 µi3

L1/LT L2/LT L3/LT

74 34,2509 36,3703 34,2643 104,8855 0,3266 0,3468 0,3267

75 184,4537 289,7453 75,5027 549,7017 0,3356 0,5271 0,1374

76 117,6194 135,6338 24,4593 277,7125 0,4235 0,4884 0,0881

77 11,8211 10,7154 121,1451 143,6816 0,0823 0,0746 0,8432

78 1,7844 0,6476 0,0009 2,4329 0,7334 0,2662 0,0004

79 170,8610 172,0472 20,9827 363,8909 0,4695 0,4728 0,0577

80 8,1746 8,5603 0,3657 17,1006 0,4780 0,5006 0,0214

81 70,7925 45,8402 52,6923 169,3250 0,4181 0,2707 0,3112

Siswa L1 L2 L3 LT

matrik partisi baru (U) untuk iterasi pertama adalah:

0,6935 0,2919 0,0146

0,0869 0,1206 0,7925

0,6892 0,0584 0,2524

0,2504 0,0003 0,7493

0,4209 0,2248 0,3543

0,5128 0,1723 0,3148

0,1595 0,6708 0,1697

0,0003 0,2078 0,7919

0,4459 0,1086 0,4454

0,1360 0,5856 0,2784

0,3013 0,1997 0,4991

0,5653 0,0401 0,3946

0,6216 0,3006 0,0778

0,4345 0,5075 0,0580

0,2421 0,0027 0,7551

0,1935 0,4927 0,3138

0,5387 0,0989 0,3624

0,5169 0,4311 0,0520

0,1507 0,2346 0,6148

0,5317 0,2754 0,1928

0,0118 0,5514 0,4367

0,1732 0,1531 0,6737

0,6237 0,0413 0,3349

0,0005 0,1457 0,8538

0,0232 0,4402 0,5366

0,0788 0,1879 0,7333

0,0397 0,2877 0,6725

U1 =

Page 74: data mining fuzzy c-means

73

0,6593 0,2239 0,1168

0,2169 0,3210 0,4621

0,8518 0,0505 0,0977

0,0790 0,4010 0,5199

0,3811 0,2431 0,3758

0,0764 0,4698 0,4538

0,1949 0,6717 0,1334

0,4140 0,1843 0,4016

0,3758 0,3699 0,2542

0,4514 0,0859 0,4627

0,0004 0,8978 0,1019

0,6567 0,0024 0,3408

0,0670 0,3037 0,6293

0,2735 0,2638 0,4627

0,2899 0,5016 0,2085

0,2891 0,0007 0,7101

0,2560 0,7418 0,0021

0,0050 0,9941 0,0009

0,5369 0,4026 0,0605

0,3672 0,6326 0,0002

0,3394 0,3770 0,2837

0,2910 0,2492 0,4598

0,6827 0,2649 0,0524

0,2986 0,6994 0,0019

0,0960 0,1931 0,7108

0,2045 0,5758 0,2196

0,5501 0,4497 0,0002

0,0002 0,4563 0,5436

0,0692 0,0977 0,8331

0,2944 0,0521 0,6535

0,5448 0,4387 0,0165

0,8542 0,0342 0,1115

0,2664 0,2669 0,4667

0,7110 0,0475 0,2414

0,2514 0,3342 0,4144

0,0118 0,0543 0,9339

0,3081 0,0429 0,6490

0,1486 0,7609 0,0905

0,3786 0,5364 0,0851

0,1320 0,7236 0,1444

0,7832 0,1510 0,0657

0,5996 0,1745 0,2259

0,3821 0,1108 0,5071

0,2707 0,4396 0,2897

Page 75: data mining fuzzy c-means

74

7. Mengecek Kondisi Berhenti Karena | a) - ag | = | 7.311,7384 – 0| = 7.311,7384 >> ξ (10Sm), dan interasi =

1 < MaxIter (=100), maka proses dilanjutkan ke iterasi kedua (t=2)

Pada iterasi kedua ditentukan kembali 3 pusat klaster Vkj (seperti langkah

perhitungan pada iterasi pertama) dengan k=1,2,3 dan j=1,2,3. Hasilnya seperti

berikut:

75,73 75,50 74,95 74,53 75,38 74,91 75,08 75,35 75,49

Fungsi objektif pada iterasi kedua (P2) juga dihitung seperti cara perhitungan fungsi

objektif pada iterasi pertama. Hasilnya adalah:

a' ∑ ∑ cN∑ OPQR – TUR V6jRX5 Y(\QU)6d f.tqt,fqmujUX5r5QX5

Hasil perbaikan matriks partisi untuk iterasi ke dua (U2) :

0,3132 0,0117 0,6751

0,0621 0,0059 0,9320

0,3266 0,3468 0,3267

0,3356 0,5271 0,1374

0,4235 0,4884 0,0881

0,0823 0,0746 0,8432

0,7334 0,2662 0,0004

0,4695 0,4728 0,0577

0,4780 0,5006 0,0214

0,4181 0,2707 0,3112

0,9124 0,0873 0,0003

0,0103 0,0195 0,9703

0,8681 0,0073 0,1247

0,1187 0,0000 0,8813

0,4977 0,1609 0,3414

0,6462 0,0773 0,2764

V2 =

U2 =

Page 76: data mining fuzzy c-means

75

0,0741 0,8527 0,0732

0,0000 0,0552 0,9448

0,5119 0,0344 0,4537

0,0559 0,7653 0,1788

0,2650 0,1098 0,6251

0,6539 0,0029 0,3432

0,8325 0,1534 0,0140

0,5256 0,4654 0,0091

0,1198 0,0000 0,8802

0,1025 0,5980 0,2995

0,6647 0,0278 0,3075

0,6737 0,3216 0,0047

0,0622 0,1408 0,7970

0,7234 0,1736 0,1030

0,0003 0,5761 0,4236

0,0715 0,0412 0,8874

0,7153 0,0043 0,2804

0,0000 0,0328 0,9672

0,0010 0,3806 0,6184

0,0106 0,0516 0,9378

0,0026 0,1757 0,8217

0,8989 0,0795 0,0217

0,1245 0,3369 0,5386

0,9651 0,0077 0,0272

0,0151 0,3879 0,5970

0,3850 0,2112 0,4038

0,0155 0,4773 0,5072

0,0896 0,8690 0,0414

0,4546 0,1003 0,4451

0,3999 0,3795 0,2206

0,4346 0,0194 0,5459

0,0000 0,9854 0,0146

0,7818 0,0000 0,2182

0,0106 0,1605 0,8290

0,1591 0,2360 0,6050

0,2498 0,6205 0,1297

0,1472 0,0000 0,8528

0,1371 0,8629 0,0000

0,0000 1,0000 0,0000

0,4246 0,5674 0,0080

0,2234 0,7766 0,0000

0,3438 0,4345 0,2217

0,2691 0,1552 0,5757

0,8572 0,1371 0,0057

Page 77: data mining fuzzy c-means

76

Karena | a' - a) | = | 7.311,7384 – 3.979,3756| = 3.332,3628 >> ᶓ (10Sm), dan

interasi = 2 < MaxIter (=100), maka proses dilanjutkan ke iterasi ketiga (t=3).

Demikian seterusnya, hingga | ab - abS) | < ξ, atau t> MaxIter. Dalam

penelitian ini, proses berhenti setelah iterasi ke-72.

>> X=load('c:\siswa.dat');

>> [center,U,ObjFcn] = fcm(X,3,[2,100,10^-5])

0,1769 0,8231 0,0000

0,0176 0,0737 0,9088

0,1087 0,7877 0,1036

0,5774 0,4226 0,0000

0,0000 0,4204 0,5796

0,0071 0,0147 0,9782

0,1696 0,0050 0,8254

0,6113 0,3882 0,0006

0,9837 0,0016 0,0148

0,1825 0,2222 0,5953

0,9017 0,0036 0,0947

0,1632 0,3398 0,4969

0,0002 0,0033 0,9966

0,2184 0,0033 0,7783

0,0374 0,9499 0,0127

0,2841 0,6990 0,0169

0,0296 0,9308 0,0397

0,9410 0,0502 0,0088

0,8116 0,0692 0,1192

0,3723 0,0273 0,6004

0,2058 0,5204 0,2738

0,1465 0,0003 0,8532

0,0039 0,0000 0,9960

0,3402 0,3288 0,3310

0,2715 0,6820 0,0465

0,4590 0,5236 0,0175

0,0104 0,0072 0,9824

0,8292 0,1708 0,0000

0,4542 0,5383 0,0075

0,4734 0,5257 0,0009

0,4930 0,2049 0,3021

Page 78: data mining fuzzy c-means

77

Iteration count = 1, obj. fcn = 3942.376703

Iteration count = 2, obj. fcn = 3295.862096

Iteration count = 3, obj. fcn = 2546.108203

Iteration count = 4, obj. fcn = 2530.106430

Iteration count = 5, obj. fcn = 2512.474976

Iteration count = 6, obj. fcn = 2493.115613

Iteration count = 7, obj. fcn = 2475.079402

Iteration count = 8, obj. fcn = 2462.425069

Iteration count = 9, obj. fcn = 2455.091763

Iteration count = 10, obj. fcn = 2450.629864

Iteration count = 11, obj. fcn = 2447.344143

Iteration count = 12, obj. fcn = 2444.570059

Iteration count = 13, obj. fcn = 2442.113530

Iteration count = 14, obj. fcn = 2439.930548

Iteration count = 15, obj. fcn = 2438.012479

Iteration count = 16, obj. fcn = 2436.351811

Iteration count = 17, obj. fcn = 2434.934267

Iteration count = 18, obj. fcn = 2433.739142

Iteration count = 19, obj. fcn = 2432.741841

Iteration count = 20, obj. fcn = 2431.916480

Iteration count = 21, obj. fcn = 2431.237870

Iteration count = 22, obj. fcn = 2430.682760

Iteration count = 23, obj. fcn = 2430.230472

Iteration count = 24, obj. fcn = 2429.863089

Iteration count = 25, obj. fcn = 2429.565387

Iteration count = 26, obj. fcn = 2429.324600

Iteration count = 27, obj. fcn = 2429.130136

Iteration count = 28, obj. fcn = 2428.973271

Iteration count = 29, obj. fcn = 2428.846858

Iteration count = 30, obj. fcn = 2428.745065

Iteration count = 31, obj. fcn = 2428.663153

Iteration count = 32, obj. fcn = 2428.597275

Iteration count = 33, obj. fcn = 2428.544318

Iteration count = 34, obj. fcn = 2428.501764

Iteration count = 35, obj. fcn = 2428.467583

Iteration count = 36, obj. fcn = 2428.440135

Iteration count = 37, obj. fcn = 2428.418099

Iteration count = 38, obj. fcn = 2428.400413

Iteration count = 39, obj. fcn = 2428.386221

Iteration count = 40, obj. fcn = 2428.374834

Iteration count = 41, obj. fcn = 2428.365700

Iteration count = 42, obj. fcn = 2428.358373

Iteration count = 43, obj. fcn = 2428.352497

Iteration count = 44, obj. fcn = 2428.347786

Iteration count = 45, obj. fcn = 2428.344008

Iteration count = 46, obj. fcn = 2428.340979

Iteration count = 47, obj. fcn = 2428.338550

Iteration count = 48, obj. fcn = 2428.336604

Iteration count = 49, obj. fcn = 2428.335043

Page 79: data mining fuzzy c-means

78

Iteration count = 50, obj. fcn = 2428.333792

Iteration count = 51, obj. fcn = 2428.332790

Iteration count = 52, obj. fcn = 2428.331986

Iteration count = 53, obj. fcn = 2428.331342

Iteration count = 54, obj. fcn = 2428.330826

Iteration count = 55, obj. fcn = 2428.330412

Iteration count = 56, obj. fcn = 2428.330081

Iteration count = 57, obj. fcn = 2428.329815

Iteration count = 58, obj. fcn = 2428.329602

Iteration count = 59, obj. fcn = 2428.329432

Iteration count = 60, obj. fcn = 2428.329295

Iteration count = 61, obj. fcn = 2428.329185

Iteration count = 62, obj. fcn = 2428.329098

Iteration count = 63, obj. fcn = 2428.329027

Iteration count = 64, obj. fcn = 2428.328971

Iteration count = 65, obj. fcn = 2428.328926

Iteration count = 66, obj. fcn = 2428.328890

Iteration count = 67, obj. fcn = 2428.328861

Iteration count = 68, obj. fcn = 2428.328837

Iteration count = 69, obj. fcn = 2428.328819

Iteration count = 70, obj. fcn = 2428.328804

Iteration count = 71, obj. fcn = 2428.328792

Iteration count = 72, obj. fcn = 2428.328782

center =

72.0635 76.3067 71.5032

73.5371 74.7951 79.7301

80.0742 75.0224 74.4123

Pada iterasi terakhir (iterasi ke-72) ini, pusat kelaster Vkj yang dihasilkan

(Software Matlab) dengan k=1,2,3; dan j=1,2,3 adalah:

Penyebaran masing-masing anggota klaster pada iterasi terakhir dapat dilihat

pada cluster interface gambar 3.1, 3.2 dan 3.3. :

> findcluster

72,0635 76,3067 71,5032

73,5371 74,7951 79,7301

80,0742 75,0224 74,4123

V =

Page 80: data mining fuzzy c-means

79

Gambar 3.1 Posisi Klaster Untuk Data Pertama (Peminatan IPA)

Berdasarkan matriks V iterasi terakhir dan gambar 3.1 dapat diperoleh informasi

bahwa pada mata pelajaran peminatan pertama (IPA) siswa dapat

dikelompokkan/diklaster dalam tiga kelompok berdasarkan nilai rata-rata mata

pelajaran peminatan, yaitu:

1. Kelompok pertama (klaster pertama), terdiri atas siswa yang memiliki nilai rata-

rata mata pelajaran peminatan sekitar 72.0635.

2. Kelompok kedua (klaster kedua), terdiri atas siswa yang memiliki nilai rata-rata

mata pelajaran peminatan sekitar 73.5371.

3. Kelompok ketiga (klaster ketiga), terdiri atas siswa yang memiliki nilai rata-rata

mata pelajaran peminatan sekitar 80.0742

Page 81: data mining fuzzy c-means

80

Gambar 3.2 Posisi Klaster Untuk Data kedua (Peminatan IPS)

Berdasarkan matriks V iterasi terakhir dan gambar 3.2 dapat diperoleh informasi

bahwa pada mata pelajaran peminatan kedua (IPS) siswa dapat

dikelompokkan/diklaster dalam tiga kelompok berdasarkan nilai rata-rata mata

pelajaran peminatan, yaitu:

1. Kelompok pertama (klaster pertama), terdiri atas siswa yang memiliki nilai rata-

rata mata pelajaran peminatan sekitar 76,3067.

2. Kelompok kedua (klaster kedua), terdiri atas siswa yang memiliki nilai rata-rata

mata pelajaran peminatan sekitar 74,7951.

3. Kelompok ketiga (klaster ketiga), terdiri atas siswa yang memiliki nilai rata-rata

mata pelajaran peminatan sekitar 75,0224.

Page 82: data mining fuzzy c-means

81

Gambar 3.3 Posisi Klaster Untuk Data ketiga (Peminatan Bahasa)

Berdasarkan matriks V iterasi terakhir dan gambar 3.3 dapat diperoleh informasi

bahwa pada mata pelajaran peminatan ketiga (Bahasa) siswa dapat

dikelompokkan/diklaster dalam tiga kelompok berdasarkan nilai rata-rata mata

pelajaran peminatan, yaitu:

1. Kelompok pertama (klaster pertama), terdiri atas siswa yang memiliki nilai rata-

rata mata pelajaran peminatan sekitar 71,5032.

2. Kelompok kedua (klaster kedua), terdiri atas siswa yang memiliki nilai rata-rata

mata pelajaran peminatan sekitar 79,7301

3. Kelompok ketiga (klaster ketiga), terdiri atas siswa yang memiliki nilai rata-rata

mata pelajaran peminatan sekitar 74,4123.

Secara keseluruhan siswa dapat dikelompokkan/diklaster dalam tiga kelompok

berdasarkan nilai rata-rata mata pelajaran peminatan, yaitu:

Page 83: data mining fuzzy c-means

82

1. Kelompok pertama, terdiri atas siswa yang memiliki nilai rata-rata mata pelajaran

peminatan IPA sekitar 72,0635; nilai rata-rata mata pelajaran peminatan IPS

sekitar 76,3067; dan nilai rata-rata mata pelajaran peminatan Bahasa sekitar

71,5032.

2. Kelompok kedua, terdiri atas siswa yang memiliki nilai rata-rata mata pelajaran

peminatan IPA sekitar 73,5371; nilai rata-rata mata pelajaran peminatan IPS

sekitar 74,7951; dan nilai rmata-rata mata pelajaran peminatan Bahasa sekitar

79,7301.

3. Kelompok ketiga, terdiri atas siswa yang memiliki nilai rata-rata mata pelajaran

peminatan IPA sekitar 80,0742; nilai rata-rata mata pelajaran peminatan IPS

sekitar 75,0224; dan nilai rata-rata mata pelajaran peminatan Bahasa sekitar

74,4123.

Matriks partisi U yang dihasilkan pada iterasi terakhir (iterasi ke-72) adalah: U =

Columns 1 through 7

0.2747 0.6732 0.2025 0.5176 0.1908 0.3856 0.8169

0.6126 0.1088 0.2436 0.3569 0.4428 0.1548 0.1153

0.1127 0.2179 0.5539 0.1255 0.3664 0.4596 0.0678

Columns 8 through 14

0.2337 0.0894 0.6452 0.0829 0.0787 0.1293 0.1134

0.1037 0.8123 0.2439 0.7761 0.0601 0.0938 0.1140

0.6626 0.0983 0.1108 0.1410 0.8612 0.7769 0.7726

Columns 15 through 21

0.3634 0.2037 0.4106 0.1196 0.0124 0.2898 0.2067

0.5475 0.1185 0.4202 0.8141 0.9770 0.1824 0.2671

0.0891 0.6778 0.1692 0.0663 0.0106 0.5278 0.5261

Columns 22 through 28

0.4390 0.4652 0.1630 0.1814 0.8208 0.1163 0.7705

0.4286 0.1772 0.2527 0.4484 0.0970 0.6719 0.1502

0.1324 0.3576 0.5843 0.3702 0.0922 0.2118 0.0794

Page 84: data mining fuzzy c-means

83

Columns 29 through 35

0.1106 0.5568 0.6224 0.1120 0.2570 0.8313 0.4290

0.5441 0.1593 0.2070 0.6210 0.5795 0.0881 0.2453

0.3453 0.2839 0.1706 0.2669 0.1635 0.0805 0.3257

Columns 36 through 42

0.3036 0.2068 0.3213 0.3773 0.7012 0.0092 0.1013

0.1406 0.1357 0.5174 0.3988 0.1974 0.0082 0.0970

0.5557 0.6575 0.1653 0.2339 0.1014 0.9826 0.8017

Columns 43 through 49

0.2005 0.7794 0.1387 0.1189 0.1655 0.6203 0.1857

0.4538 0.1387 0.7120 0.6915 0.6079 0.2219 0.4375

0.3457 0.0820 0.1493 0.1896 0.2265 0.1578 0.3768

Columns 50 through 56

0.3953 0.6289 0.1760 0.8747 0.2139 0.2390 0.1804

0.1691 0.2192 0.5502 0.0626 0.5010 0.1924 0.5095

0.4356 0.1518 0.2738 0.0626 0.2851 0.5685 0.3101

Columns 57 through 63

0.4765 0.3665 0.6629 0.2617 0.2289 0.1649 0.3087

0.2864 0.3563 0.2093 0.5963 0.4679 0.1766 0.2641

0.2371 0.2772 0.1279 0.1419 0.3033 0.6585 0.4272

Columns 64 through 70

0.6922 0.5725 0.1569 0.1793 0.0372 0.4232 0.3804

0.1980 0.2214 0.1154 0.3045 0.0511 0.2649 0.4172

0.1099 0.2061 0.7278 0.5162 0.0918 0.3119 0.2024

Columns 71 through 77

0.1433 0.0914 0.1726 0.6536 0.3676 0.5384 0.3953

0.0793 0.8140 0.1603 0.1909 0.3045 0.3011 0.4089

0.7775 0.0946 0.6671 0.1555 0.3278 0.1605 0.1958

Columns 78 through 81

0.0049 0.2110 0.1512 0.2574

0.0048 0.1987 0.6320 0.1379

0.9903 0.5903 0.2168 0.6047

Page 85: data mining fuzzy c-means

84

Dari matriks partisi U iterasi terakhir dapat diperoleh informasi mengenai

kecenderungan siswa untuk masuk ke kelompok peminatan tertentu. Setiap

peminatan memiliki derajat keanggotaan tertentu untuk menjadi anggota suatu

kelompok. Derajat keanggotaan terbesar menunjukkan kecenderungan tertinggi

seorang siswa untuk masuk menjadi anggota peminatan tertentu. Secara detail

disajikan pada table 3.9 berikut:

Tabel 3.8 Derajat Keanggotaan Tiap Data Pada Setiap Klaster dengan FCM (Pada Iterasi Terakhir)

P1 P2 P3 (µ1) (µ2) (µ3) C1 C2 C3

1 72,2 74,8 76,5 0,2747 0,6126 0,1127 *

2 74,9 76,5 67,3 0,6732 0,1088 0,2179 *

3 77,5 70,6 74,6 0,2025 0,2436 0,5539 *

4 68,1 77,1 77,8 0,5176 0,3569 0,1255 *

5 76,6 71,3 76,1 0,1908 0,4428 0,3664 *

6 78,2 76,4 64,6 0,3856 0,1548 0,4596 *

7 70,4 74,5 72,9 0,8169 0,1153 0,0678 *

8 75,3 75,2 68,7 0,2337 0,1037 0,6626 *

9 77,1 73,7 80,5 0,0894 0,8123 0,0983 *

10 71,5 77,6 77,8 0,6452 0,2439 0,1108 *

11 74,0 69,8 80,3 0,0829 0,7761 0,1410 *

12 72,8 78,4 69,8 0,0787 0,0601 0,8612 *

13 73,7 73,9 71,4 0,1293 0,0938 0,7769 *

14 73,1 73,9 72,5 0,1134 0,1140 0,7726 *

15 71,9 73,2 74,9 0,3634 0,5475 0,0891 *

16 74,3 73,2 70,3 0,2037 0,1185 0,6778 *

17 78,3 79,2 79,0 0,4106 0,4202 0,1692 *

18 71,8 74,3 77,9 0,1196 0,8141 0,0663 *

19 74,1 75,3 80,3 0,0124 0,9770 0,0106 *

20 74,7 72,4 72,1 0,2898 0,1824 0,5278 *

21 74,0 71,3 71,9 0,2067 0,2671 0,5261 *

22 70,6 78,5 76,6 0,4390 0,4286 0,1324 *

23 76,8 78,6 73,5 0,4652 0,1772 0,3576 *

24 75,3 71,2 77,6 0,1630 0,2527 0,5843 *

Kecenderungan data masuk pada klasterSiswa

Nilai Rata-rata PeminatanDerajat Keanggotaan (µ) pada

Iterasi Terakhir

Page 86: data mining fuzzy c-means

85

P1 P2 P3 (µ1) (µ2) (µ3) C1 C2 C3

25 76,1 72,4 72,4 0,1814 0,4484 0,3702 *

26 70,7 78,9 69,0 0,8208 0,0970 0,0922 *

27 83,4 76,1 78,8 0,1163 0,6719 0,2118 *

28 70,8 76,6 79,0 0,7705 0,1502 0,0794 *

29 78,3 75,5 80,2 0,1106 0,5441 0,3453 *

30 76,7 76,4 73,8 0,5568 0,1593 0,2839 *

31 74,4 79,4 86,1 0,6224 0,2070 0,1706 *

32 80,4 76,7 78,8 0,1120 0,6210 0,2669 *

33 66,5 71,0 71,4 0,2570 0,5795 0,1635 *

34 69,2 76,4 69,0 0,8313 0,0881 0,0805 *

35 82,7 86,1 80,0 0,4290 0,2453 0,3257 *

36 75,3 73,5 71,5 0,3036 0,1406 0,5557 *

37 82,5 79,3 70,8 0,2068 0,1357 0,6575 *

38 69,3 70,8 73,8 0,3213 0,5174 0,1653 *

39 77,5 80,6 77,9 0,3773 0,3988 0,2239 *

40 67,6 75,5 73,0 0,7012 0,1974 0,1014 *

41 80,3 75,7 74,8 0,0092 0,0082 0,9826 *

42 70,3 74,2 68,5 0,1013 0,0970 0,8017 *

43 78,5 65,0 82,5 0,2005 0,4538 0,3457 *

44 68,5 77,5 72,5 0,7794 0,1387 0,0820 *

45 81,7 70,5 72,5 0,1387 0,7120 0,1493 *

46 77,5 75,0 75,8 0,1189 0,6915 0,1896 *

47 87,5 70,5 77,0 0,1655 0,6079 0,2265 *

48 75,9 78,0 86,5 0,6203 0,2219 0,1578 *

49 70,5 70,0 75,5 0,1857 0,4375 0,3768 *

50 79,0 72,0 65,0 0,3953 0,1691 0,4356 *

51 65,0 80,0 70,5 0,6289 0,2192 0,1518 *

52 78,0 75,0 89,5 0,1760 0,5502 0,2738 *

53 72,5 75,0 82,5 0,8748 0,0626 0,0626 *

54 81,0 65,7 75,5 0,2139 0,5010 0,2851 *

55 89,7 76,5 68,0 0,2390 0,1924 0,5685 *

56 78,5 67,5 85,7 0,1804 0,5095 0,3101 *

57 65,0 89,5 70,5 0,4765 0,2864 0,2371 *

58 70,7 92,0 78,5 0,3665 0,3563 0,2772 *

59 75,5 70,0 79,5 0,6629 0,2093 0,1279 *

60 85,0 75,5 80,2 0,2617 0,5963 0,1419 *

61 68,5 65,0 78,5 0,2289 0,4679 0,3033 *

SiswaNilai Rata-rata Peminatan

Derajat Keanggotaan (µ) pada Iterasi Terakhir

Kecenderungan data masuk pada klaster

Page 87: data mining fuzzy c-means

86

P1 P2 P3 (µ1) (µ2) (µ3) C1 C2 C3

62 82,5 69,5 72,1 0,1649 0,1766 0,6585 *

63 74,5 90,2 70,5 0,3087 0,2641 0,4272 *

64 69,5 72,5 79,0 0,6922 0,1980 0,1099 *

65 70,9 74,5 91,5 0,5725 0,2214 0,2061 *

66 82,5 72,5 70,6 0,1569 0,1154 0,7278 *

67 75,8 82,1 70,8 0,1793 0,3045 0,5162 *

68 80,2 74,5 72,5 0,0372 0,0511 0,9118 *

69 74,5 91,5 69,5 0,4232 0,2649 0,3119 *

70 60,5 68,7 77,8 0,3804 0,4172 0,2024 *

71 74,5 77,8 69,8 0,1433 0,0793 0,7775 *

72 79,0 72,5 73,8 0,0914 0,8140 0,0946 *

73 87,5 75,2 71,8 0,1726 0,1603 0,6671 *

74 65,0 76,8 67,5 0,6536 0,1909 0,1555 *

75 76,0 94,8 74,0 0,3676 0,3045 0,3278 *

76 65,0 77,8 81,5 0,5384 0,3011 0,1605 *

77 65,5 68,0 75,8 0,3953 0,4089 0,1958 *

78 80,4 75,5 74,2 0,0049 0,0048 0,9903 *

79 90,1 78,7 74,3 0,2110 0,1987 0,5903 *

80 75,7 74,0 87,5 0,1512 0,6320 0,2168 *

81 74,9 77,3 65,0 0,2574 0,1379 0,6047 *

SiswaNilai Rata-rata Peminatan

Derajat Keanggotaan (µ) pada Iterasi Terakhir

Kecenderungan data masuk pada klaster

Dari tabel 3.9 dapat disimpulkan:

1. Kelompok/klaster Pertama berisi siswa nomor 2, 4, 7, 10, 22, 23, 26, 28, 30,

31, 34, 35, 40, 44, 48, 51, 53, 57, 58, 59, 64, 65, 69, 74, 75 dan 76.

2. Kelompok/klaster Kedua berisi siswa nomor 1, 5, 9, 11, 15, 17, 18, 19, 25,

27, 29, 32, 33, 38, 39, 43, 45, 46, 47, 49, 52, 54, 56, 60, 61, 70, 72, 77 dan 80.

3. Kelompok/klaster Ketiga berisi siswa nomor 3, 6, 8, 12, 13, 14, 16, 20, 21,

24, 36, 37, 41, 42, 50, 55, 62, 63, 66, 67, 68, 71, 73, 78, 79 dan 81.

Page 88: data mining fuzzy c-means

87

BAB IV

HASIL DAN PEMBAHASAN

4.1 Hasil Penelitian

Dari informasi pusat kelaster V yang dihasilkan (Matlab) pada iterasi terakhir,

dapat ditentukan kelompok peminatan.

Misalkan nilai tertinggi pada rata-rata kelompok mata pelajaran peminatan yang

dijadikan dasar untuk menentukan peminatan, maka:

1. Pada klaster pertama (baris pertama), nilai tertinggi berada pada kolom kedua

(peminatan IPS), sehingga klaster pertama diidentifikasi sebagai kelompok

peminatan IPS.

2. Pada klaster kedua (baris kedua), nilai tertinggi berada pada kolom ketiga

(peminatan Bahasa), sehingga klaster kedua diidentifikasi sebagai kelompok

peminatan Bahasa.

3. Pada klaster ketiga (baris ketiga), nilai tertinggi berada pada kolom pertama

(peminatan IPA), sehingga klaster ketiga dididentifikasi sebagai kelompok

peminatan IPA.

72,0635 76,3067 71,5032

73,5371 74,7951 79,7301

80,0742 75,0224 74,4123

V =

Page 89: data mining fuzzy c-means

88

Berdasarkan table 3.8 (kecenderungan siswa pada kelompok peminatan

tertentu), berikut ini disajikan data peminatan yang telah dilakukan dan hasil

peminatan/klastering dengan menggunakan Fuzzy C-Means (Tabel 4.1):

Tabel 4.1 Hasil Peminatan yang Dipilih dan Hasil Peminatan yang

Dihasilkan oleh FCM

Page 90: data mining fuzzy c-means

89

IPA IPS Bhs Yang Dipilih C-Meas Kelas XI Kelas XII

1 72,2 74,8 76,5 Bahasa Bahasa 75,50 74,20

2 74,9 76,5 67,3 IPS IPS 77,00 75,50

3 77,5 70,6 74,6 IPA IPA 75,50 78,00

4 68,1 77,1 77,8 Bahasa IPS 72,00 74,50

5 76,6 71,3 76,1 IPA Bahasa 72,80 71,50

6 78,2 76,4 64,6 IPA IPA 71,50 74,50

7 70,4 74,5 72,9 IPS IPS 69,00 65,50

8 75,3 75,2 68,7 IPA IPA 70,50 72,50

9 77,1 73,7 80,5 Bahasa Bahasa 76,25 75,50

10 71,5 77,6 77,8 Bahasa IPS 74,50 72,50

11 74,0 69,8 80,3 Bahasa Bahasa 78,00 76,50

12 72,8 78,4 69,8 IPS IPA 73,00 74,80

13 73,7 73,9 71,4 IPS IPA 71,50 74,00

14 73,1 73,9 72,5 IPS IPA 67,50 65,00

15 71,9 73,2 74,9 Bahasa Bahasa 75,50 69,50

16 74,3 73,2 70,3 IPA IPA 84,30 81,30

17 78,3 79,2 79,0 IPS Bahasa 80,70 82,50

18 71,8 74,3 77,9 Bahasa Bahasa 76,00 80,50

19 74,1 75,3 80,3 Bahasa Bahasa 81,50 82,50

20 74,7 72,4 72,1 IPA IPA 74,00 71,00

21 74,0 71,3 71,9 IPA IPA 69,50 73,50

22 70,6 78,5 76,6 IPS IPS 82,50 79,50

23 76,8 78,6 73,5 IPS IPS 72,50 70,75

24 75,3 71,2 77,6 Bahasa IPA 65,50 70,50

25 76,1 72,4 72,4 IPA Bahasa 66,00 68,30

26 70,7 78,9 69,0 IPS IPS 78,00 76,50

27 83,4 76,1 78,8 IPA Bahasa 72,50 71,00

28 70,8 76,6 79,0 Bahasa IPS 71,00 67,50

29 78,3 75,5 80,2 Bahasa Bahasa 82,00 80,00

30 76,7 76,4 73,8 IPA IPS 72,50 67,80

31 74,4 79,4 86,1 Bahasa IPS 71,90 73,50

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/

PenjurusanSiswa

Nilai Rata-rata Mata Pelajaran Peminatan Sebelum Peminatan/

Penjurusan (Kelas X)Peminatan

Page 91: data mining fuzzy c-means

90

IPA IPS Bhs Yang Dipilih C-Meas Kelas XI Kelas XII

32 80,4 76,7 78,8 IPA Bahasa 80,70 75,50

33 66,5 71,0 71,4 Bahasa Bahasa 80,50 88,50

34 69,2 76,4 69,0 IPS IPS 82,75 80,50

35 82,7 86,1 80,0 IPS IPS 83,50 81,50

36 75,3 73,5 71,5 IPA IPA 78,20 75,50

37 82,5 79,3 70,8 IPA IPA 74,50 72,00

38 69,3 70,8 73,8 Bahasa Bahasa 79,00 81,30

39 77,5 80,6 77,9 IPS Bahasa 70,70 72,00

40 67,6 75,5 73,0 IPS IPS 69,50 77,50

41 80,3 75,7 74,8 IPA IPA 79,50 70,30

42 70,3 74,2 68,5 IPS IPA 75,80 72,30

43 78,5 65,0 82,5 Bahasa Bahasa 80,50 82,50

44 68,5 77,5 72,5 IPS IPS 78,50 75,80

45 81,7 70,5 72,5 IPA Bahasa 74,50 72,80

46 77,5 75,0 75,8 IPA Bahasa 74,00 72,70

47 87,5 70,5 77,0 IPA Bahasa 73,60 71,80

48 75,9 78,0 86,5 Bahasa IPS 73,80 74,50

49 70,5 70,0 75,5 Bahasa Bahasa 78,50 82,00

50 79,0 72,0 65,0 IPA IPA 80,50 79,40

51 65,0 80,0 70,5 IPS IPS 77,50 80,00

52 78,0 75,0 89,5 Bahasa Bahasa 85,00 81,70

53 72,5 75,0 82,5 Bahasa IPS 73,80 69,80

54 81,0 65,7 75,5 IPA Bahasa 75,50 80,60

55 89,7 76,5 68,0 IPA IPA 83,60 84,50

56 78,5 67,5 85,7 Bahasa Bahasa 78,50 82,60

57 65,0 89,5 70,5 IPS IPS 79,60 75,50

58 70,7 92,0 78,5 IPS IPS 74,20 72,50

59 75,5 70,0 79,5 Bahasa IPS 75,80 77,00

60 85,0 75,5 80,2 IPA Bahasa 70,50 74,30

61 68,5 65,0 78,5 Bahasa Bahasa 75,00 75,20

62 82,5 69,5 72,1 IPA IPA 78,10 75,80

63 74,5 90,2 70,5 IPS IPA 77,50 81,20

64 69,5 72,5 79,0 Bahasa IPS 66,90 68,20

65 70,9 74,5 91,5 Bahasa IPS 74,50 74,00

Siswa

Nilai Rata-rata Mata Pelajaran Peminatan Sebelum Peminatan/

Penjurusan (Kelas X)Peminatan

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/

Penjurusan

Page 92: data mining fuzzy c-means

91

IPA IPS Bhs Yang Dipilih C-Meas Kelas XI Kelas XII

66 82,5 72,5 70,6 IPA IPA 77,60 78,00

67 75,8 82,1 70,8 IPS IPA 79,00 80,60

68 80,2 74,5 72,5 IPA IPA 77,50 78,00

69 74,5 91,5 69,5 IPS IPS 80,20 82,80

70 60,5 68,7 77,8 Bahasa Bahasa 76,40 78,10

71 74,5 77,8 69,8 IPS IPA 74,00 74,50

72 79,0 72,5 73,8 IPA Bahasa 70,80 69,50

73 87,5 75,2 71,8 IPA IPA 84,20 82,50

74 65,0 76,8 67,5 IPS IPS 75,80 75,00

75 76,0 94,8 74,0 IPS IPS 87,60 82,80

76 65,0 77,8 81,5 Bahasa IPS 74,50 72,10

77 65,5 68,0 75,8 Bahasa Bahasa 75,80 77,10

78 80,4 75,5 74,2 IPA IPA 72,40 74,00

79 90,1 78,7 74,3 IPA IPA 78,60 82,10

80 75,7 74,0 87,5 Bahasa Bahasa 80,20 79,60

81 74,9 77,3 65,0 IPS IPA 67,80 74,00

Siswa

Nilai Rata-rata Mata Pelajaran Peminatan Sebelum Peminatan/

Penjurusan (Kelas X)Peminatan

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/

Penjurusan

4.2 Pembahasan

Penetapan hasil akurasi didasarkan pada ketentuan bahwa jika nilai

peminatan yang dipilih lebih besar dari standar Kriteria Ideal Ketuntasan (KKM)

yaitu lebih besar atau sama dengan 75 maka peminatan yang dilakukan oleh

algoritma FCM dianggap TIDAK AKURAT, sedangkan jika nilai peminatan yang

dipilih lebih kecil dari KKM maka peminatan yang dilakukan oleh algoritma FCM

dianggap AKURAT. Akurasi hasil peminatan yang dilakukan oleh algoritma FCM

disajikn pada tabel 4.2 berikut:

Page 93: data mining fuzzy c-means

92

Tabel 4.2 Akurasi Hasil Peminatan Algoritma FCM

Page 94: data mining fuzzy c-means

93

Yang Dipilih C-Meas Kelas XI Kelas XII Kelas XI Kelas XII

1 Bahasa Bahasa 75,50 74,20 Akurat Tidak Akurat

2 IPS IPS 77,00 75,50 Akurat Akurat

3 IPA IPA 75,50 78,00 Akurat Akurat

4 Bahasa IPS 72,00 74,50 Akurat Akurat

5 IPA Bahasa 72,80 71,50 Akurat Akurat

6 IPA IPA 71,50 74,50 Tidak Akurat Tidak Akurat

7 IPS IPS 69,00 65,50 Tidak Akurat Tidak Akurat

8 IPA IPA 70,50 72,50 Tidak Akurat Tidak Akurat

9 Bahasa Bahasa 76,25 75,50 Akurat Akurat

10 Bahasa IPS 74,50 72,50 Akurat Akurat

11 Bahasa Bahasa 78,00 76,50 Akurat Akurat

12 IPS IPA 73,00 74,80 Akurat Akurat

13 IPS IPA 71,50 74,00 Akurat Akurat

14 IPS IPA 67,50 65,00 Akurat Akurat

15 Bahasa Bahasa 75,50 69,50 Akurat Tidak Akurat

16 IPA IPA 84,30 81,30 Akurat Akurat

17 IPS Bahasa 80,70 82,50 Tidak Akurat Tidak Akurat

18 Bahasa Bahasa 76,00 80,50 Akurat Akurat

19 Bahasa Bahasa 81,50 82,50 Akurat Akurat

20 IPA IPA 74,00 71,00 Tidak Akurat Tidak Akurat

21 IPA IPA 69,50 73,50 Tidak Akurat Tidak Akurat

22 IPS IPS 82,50 79,50 Akurat Akurat

23 IPS IPS 72,50 70,75 Tidak Akurat Tidak Akurat

24 Bahasa IPA 65,50 70,50 Akurat Akurat

25 IPA Bahasa 66,00 68,30 Akurat Akurat

26 IPS IPS 78,00 76,50 Akurat Akurat

27 IPA Bahasa 72,50 71,00 Akurat Akurat

28 Bahasa IPS 71,00 67,50 Akurat Akurat

29 Bahasa Bahasa 82,00 80,00 Akurat Akurat

30 IPA IPS 72,50 67,80 Akurat Akurat

31 Bahasa IPS 71,90 73,50 Akurat Akurat

32 IPA Bahasa 80,70 75,50 Tidak Akurat Tidak Akurat

33 Bahasa Bahasa 80,50 88,50 Akurat Akurat

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/

PenjurusanSiswa

Hasil Klastering/ Peminatan Hasil

Page 95: data mining fuzzy c-means

94

Yang Dipilih C-Meas Kelas XI Kelas XII Kelas XI Kelas XII

34 IPS IPS 82,75 80,50 Akurat Akurat

35 IPS IPS 83,50 81,50 Akurat Akurat

36 IPA IPA 78,20 75,50 Akurat Akurat

37 IPA IPA 74,50 72,00 Tidak Akurat Tidak Akurat

38 Bahasa Bahasa 79,00 81,30 Akurat Akurat

39 IPS Bahasa 70,70 72,00 Akurat Akurat

40 IPS IPS 69,50 77,50 Tidak Akurat Akurat

41 IPA IPA 79,50 70,30 Akurat Tidak Akurat

42 IPS IPA 75,80 72,30 Tidak Akurat Akurat

43 Bahasa Bahasa 80,50 82,50 Akurat Akurat

44 IPS IPS 78,50 75,80 Akurat Akurat

45 IPA Bahasa 74,50 72,80 Akurat Akurat

46 IPA Bahasa 74,00 72,70 Akurat Akurat

47 IPA Bahasa 73,60 71,80 Akurat Akurat

48 Bahasa IPS 73,80 74,50 Akurat Akurat

49 Bahasa Bahasa 78,50 82,00 Akurat Akurat

50 IPA IPA 80,50 79,40 Akurat Akurat

51 IPS IPS 77,50 80,00 Akurat Akurat

52 Bahasa Bahasa 85,00 81,70 Akurat Akurat

53 Bahasa IPS 73,80 69,80 Akurat Akurat

54 IPA Bahasa 75,50 80,60 Tidak Akurat Tidak Akurat

55 IPA IPA 83,60 84,50 Akurat Akurat

56 Bahasa Bahasa 78,50 82,60 Akurat Akurat

57 IPS IPS 79,60 75,50 Akurat Akurat

58 IPS IPS 74,20 72,50 Tidak Akurat Tidak Akurat

59 Bahasa IPS 75,80 77,00 Tidak Akurat Tidak Akurat

60 IPA Bahasa 70,50 74,30 Akurat Akurat

61 Bahasa Bahasa 75,00 75,20 Akurat Akurat

62 IPA IPA 78,10 75,80 Akurat Akurat

63 IPS IPA 77,50 81,20 Tidak Akurat Tidak Akurat

64 Bahasa IPS 66,90 68,20 Akurat Akurat

65 Bahasa IPS 74,50 74,00 Akurat Akurat

66 IPA IPA 77,60 78,00 Akurat Akurat

67 IPS IPA 79,00 80,60 Tidak Akurat Tidak Akurat

68 IPA IPA 77,50 78,00 Akurat Akurat

SiswaHasil Klastering/ Peminatan

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/

Penjurusan

Hasil

Page 96: data mining fuzzy c-means

95

Yang Dipilih C-Meas Kelas XI Kelas XII Kelas XI Kelas XII

69 IPS IPS 80,20 82,80 Akurat Akurat

70 Bahasa Bahasa 76,40 78,10 Akurat Akurat

71 IPS IPA 74,00 74,50 Akurat Akurat

72 IPA Bahasa 70,80 69,50 Akurat Akurat

73 IPA IPA 84,20 82,50 Akurat Akurat

74 IPS IPS 75,80 75,00 Akurat Akurat

75 IPS IPS 87,60 82,80 Akurat Akurat

76 Bahasa IPS 74,50 72,10 Akurat Akurat

77 Bahasa Bahasa 75,80 77,10 Akurat Akurat

78 IPA IPA 72,40 74,00 Tidak Akurat Tidak Akurat

79 IPA IPA 78,60 82,10 Akurat Akurat

80 Bahasa Bahasa 80,20 79,60 Akurat Akurat

81 IPS IPA 67,80 74,00 Akurat Akurat

SiswaHasil Klastering/ Peminatan

Nilai Rata-rata Mata Pelajaran Peminatan Setelah Peminatan/

Penjurusan

Hasil

Pada tabel 4.2 hasil peminatan yang dilakukan oleh algoritma Fuzzy C-

Means (FCM) dapat dijelaskan bahwa pada tahun pertama pelaksanaan peminatan

(kelas XI), sebanyak 64 dari 81 data sampel siswa atau 79,01% yang tepat dalam

memilih peminatan. Pada tahun kedua pelaksanaan peminatan (kelas XII), sebanyak

33 dari 81 data sampel siswa atau 77,77% yang tepat dalam memilih peminatan.

Jika dibandingkan dengan tingkat akurasi peminatan yang dilakukan secara

manual, terdapat kenaikan rata-rata tingkat akurasi sebesar 22% (78,39% - 56,17%)

dengan menggunakan algoritma Fuzzy C-Means.

Akurasi peminatan algoritma FCM disajikan pada grafik berikut ini.

Page 97: data mining fuzzy c-means

96

Gambar 4.1 Grafik Akurasi Hasil Peminatan Algoritma FCM pada

Peminatan di SMA Tahun Pertama (Kelas XI)

Gambar 4.2 Grafik Akurasi Hasil Peminatan Algoritma FCM pada

Peminatan di SMA Tahun Kedua (Kelas XII)

79,01%

20,99%

Tingkat Akurasi FCM Pada Peminatan di SMA

Tahun Pertama (Kls XI)

Akurat

Tidak Akurat

77,77%

22,23%

Tingkat Akurasi FCM Pada Peminatan di SMA

Tahun kedua (Kelas XII)

Akurat

Tidak Akurat

Page 98: data mining fuzzy c-means

97

BAB V KESIMPULAN DAN SARAN

5.1 Kesimpulan

1. Dari hasil pengujian algoritma Fuzzy C-Means (FCM) dalam penentuan

jurusan di Sekolah Menengah Atas pada 81 sampel data siswa yang diuji

dalam penelitian ini, menunjukkan bahwa Algoritma FCM memiliki tingkat

akurasi yang lebih tinggi (yaitu rata-rata 78,39%), jika dibandingkan dengan

metode penentuan jurusan secara manual yang selama ini dilakukan (hanya

memiliki tingkat akurasi rata-rata 56,17 %).

2. Dari data yang dilatih, diperoleh tiga kelompok berdasarkan nilai rata-rata

mata pelajaran peminatan, yaitu:

- Kelompok pertama, terdiri atas siswa yang memiliki nilai rata-rata mata

pelajaran peminatan IPA sekitar 72,0635; nilai rata-rata mata pelajaran

peminatan IPS sekitar 76,3067; dan nilai rata-rata mata pelajaran

peminatan Bahasa sekitar 71,5032.

- Kelompok kedua, terdiri atas siswa yang memiliki nilai rata-rata mata

pelajaran peminatan IPA sekitar 73,5371; nilai rata-rata mata pelajaran

peminatan IPS sekitar 74,7951; dan nilai rmata-rata mata pelajaran

peminatan Bahasa sekitar 79,7301.

- Kelompok ketiga, terdiri atas siswa yang memiliki nilai rata-rata mata

pelajaran peminatan IPA sekitar 80,0742; nilai rata-rata mata pelajaran

peminatan IPS sekitar 75,0224; dan nilai rata-rata mata pelajaran

peminatan Bahasa sekitar 74,4123.

3. Proses klastering dalam penelitian ini dilakukan dengan menentukan jumlah

klaster yang terbentuk di awal proses sesuai dengan jumlah kelompok

(Jurusan) yang diinginkan. Dengan demikian, tidak dapat dipastikan berapa

sesungguhnya jumlah klaster ideal yang terbentuk dari data nilai siswa yang

ada, sehingga akurasi hasil pengelompokkan tidak dapat terukur.

Page 99: data mining fuzzy c-means

98

5.2 Saran

1. Dalam penelitian ini hanya menggunakan variabel prestasi siswa dalam

bentuk nilai mata pelajaran pada semester satu dan dua sebagai variabel

komputasi dengan FCM, sesuaikan dengan metode yang diterapkan di

beberapa Sekolah Menengah Atas. Namun demikian, di beberapa Sekolah

Menengah Atas lainnya, disamping menggunakan variabel prestasi siswa

dalam bentuk nilai mata pelajaran, juga menjadikan minat (yang diperoleh

dari test psikologi) sebagai variabel dalam proses penentuan jurusan bagi

siswa. Oleh karena itu, disarankan agar penelitian ini dikembangkan lagi

dengan menambahkan (menyertakan) variabel minat siswa sebagai variabel

komputasi dalam algoritma yang digunakan.

2. Untuk mendapatkan tingkat akurasi yang lebih baik dalam penerapan

algoritma FCM untuk pemilihan jurusan di Sekolah Menengah Atas, serta

untuk memberikan kontribusi yang lebih besar di dunia riset, disarankan agar

hasil penelitian ini dikembangkan dengan cara memodifikasi/updating

algoritma FCM yang digunakan saat ini, atau dengan menggabungkan

algoritma FCM dengan algoritma lain .

3. Keterbatasan lain dari hasil penelitian ini adalah hanya uji coba untuk menilai

tingkat akurasi penggunaan algoritma (FCM). Agar penelitian ini dapat

memberikan kontribusi yang lebih besar, disarankan untuk dikembangkan

dengan cara menerapkan algoritma (FCM) dalam suatu alat bantu (berupa

software), sehingga dapat langsung diterapkan untuk penyelesaian masalah

tingkat akurasi yang rendah dalam proses pemilihan jurusan di Sekolah

Menengah Atas.

4. Disarankan juga agar penelitian ini dikembangkan untuk melihat berapa

sesungguhnya klaster (Jurusan) yang ideal yang terbentuk dari range nilai

seluruh mata pelajaran yang menjadi dasar untuk menentukan Jurusan siswa

Sekolah Menengah Atas.

Page 100: data mining fuzzy c-means

99

DAFTAR PUSTAKA

[1] Departemen Pendidikan Nasional (2004), Panduan Penilaian Penjurusan Kenaikan Kelas dan Pindah Sekolah, Direktorat Pendidikan Menengah Umum, Jakarta

[2] Eko Sudaryanto, 2009, Pengaruh Minat Belajar dan Penjurusan Terhadap

Prestasi Belajar Siswa di SMK Katolik ST Lois Randublatung, Skripsi, Fakultas Keguruan dan Ilmu Pendidikan, Universitas Muhammadia Surakarta, Surakarta

[3] Departemen Pendidikan Nasional (2006), Panduan Penyusunan Laporan Hasil

Belajar Peserta Didik Sekolah Menengah Atas (SMA), Direktorat Jenderal Manajemen Pendidikan Dasar Dan Menengah Direktorat Pembinaan SMA, Jakarta 2006.

[4] Kusrini, 2006, Algoritma Data Mining, Penerbit ANDI, Yogyakarta. [5] Afivi, Refcan (2005), Pengelompokkan Selari Untuk Data Skala Besar dan

Dimensional Tinggi Pada Aplikasi Perlombongan Data, Proceedings of the Postgraduate Annual Research Seminar, Faculty of Computer Science and Information System, Universiti Teknologi Malaysia, Malaysia.

[6] Ernawati, Susanto (2009), Pembagian Kelas Peserta Kuliah Berdasarkan Fuzzy

Clustering dan Partition Coefficient and Exponential Separation Index, Program Studi Teknik Informatika, Universitas Atma Jaya, Yogyakarta.

[7] Arwan Ahmad Khoiruddin, 2007, Menentukan Nilai Akhir Kuliah Dengan Fuzzy C-Means, Proceeding pada Seminar Nasional Sistem dan Informatika di Bali, Jurusan Teknik Informatika, Universitas Islam Indonesia, Yogyakarta

[8] Emha Taufiq Luthfi, 2007, Fuzzy C-Means Untuk Clustering Data Performance

Mengajar Dosen, Proceeding pada Seminar Nasional Teknologi di Ygyakarta, STMIK AMIKOM, Yogyakarta

[9] Dunham, Margaret,H. (2003), Data Mining Introuctory and Advanced Topics,

New Jersey, Prentice Hall.

[10] Kantardzic, Mehmed (2003), Data Mining Concepts Models, Methods, and Algorithms, New Jersey, IEEE

Page 101: data mining fuzzy c-means

100

[11] Kusumadewi, S., Hartati, S., 2006, Fuzzy Multi Atribute Decision Making, Graha Ilmu, Yogyakarta

[12] Kusumadewi, S., Purnomo, H., 2010, Aplikasi Fuzzy Untuk Pendukung Keputusan, Graha Ilmu, Jakarta

[13] Sugiyono, 2006, Metode Penelitian Kuantitatif Kualitatif dan R & D , Alfabeta, Bandung.

Page 102: data mining fuzzy c-means

101