KLASIFIKASI PARASIT FALCIPARUM
Transcript of KLASIFIKASI PARASIT FALCIPARUM
KLASIFIKASI PARASIT FALCIPARUM
PADA SEL DARAH MERAH MANUSIA
MENGGUNAKAN RANDOMLY WIRED NEURAL NETWORK
SKRIPSI
KHARSMA MONARDO
11150940000015
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UIN SYARIF HIDAYATULLAH JAKARTA
2019 M / 1441
i
KLASIFIKASI GAMBAR SEL DARAH MERAH MANUSIA
YANG TERINFEKSI PARASIT FALCIPARUM
MENGGUNAKAN RANDOMLY WIRED NEURAL NETWORK
SKRIPSI
Diajukan kepada
Universitas Islam Negeri Syarif Hidayatullah Jakarta
Fakultas Sains dan Teknologi
Untuk Memenuhi Persyaratan dalam
Memperoleh Gelar Sarjana Matematika (S.Mat)
Oleh :
Kharisma Monardo
11150940000015
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UIN SYARIF HIDAYATULLAH JAKARTA
2019 M / 1441 H
iv
PERSEMBAHAN DAN MOTTO
Segala Puji dan Syukur ku persembahkan kepada Allah Subhanahu Wata’ala.
Seiring shalawat serta salam kepada sang pembangun peradaban manusia, Nabi
Muhammad Shallallahu ‘Alaihi Wassalam.
Persembahan kecil ini saya lantunkan untuk mereka yang senantiasa selalu
mendoakan keberhasilan saya terutama kepada mama dan papa.
Skripsi ini saya persembahkan juga untuk para sahabat dan mereka yang dengan
tulus memberikan doanya kepada saya.
“Hidup itu pilihan, apa yang membuat dirimu sedih tinggalkan dan apa yang buat
mu bahagia pertahankan”
“Ridha Allah tergantung pada ridha orang tua dan murka Allah tergantung pada
murka orang tua.” (Hasan. At-Tirmizi : 1899, HR. al-Hakim : 7249, ath-Thabrani
dalam al-Mu’jam al-Kabiir : 14368, Al-Bazzar : 2394)
“Keadaan tidak akan pernah salah, karena Allah pembuat skenarionya Yang Maha
Benar.”
“Setiap jalan yang tidak sesuai harapan, merupakan sebaik-baik jalan yang Allah
berikan”
v
KATA PENGANTAR
Alhamdulillah, puji syukur kehadirat Allah Subhanahu Wata’ala atas segala
limpahan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan
penyusunan skripsi dengan judul “Klasifikasi Gambar Sel Darah Merah
Manusia Yang Terinfeksi Parasit Falciparum Menggunakan Randomly Wired
Neural Network”. Shalawat serta salam senantiasa tercurah kepada Nabi
Muhammad Sallalahu Alaihi Wassalam, para sahabat, keluarga serta muslimin dan
muslimat. Semoga kita mendapatkan syafaat baginda Rasul kelak diakhirat. Penulis
dapat menyelesaikan skripsi ini karena adanya banyak bimbingan, saran, kerjasama
dan bantuan dari berbagai pihak. Untuk itu, pada kesempatan ini penulis ingin
menyampaikan terima kasih kepada :
1. Prof Dr. Lili Surraya Putri, M.Env.Stud, selaku Dekan Fakultas Sains dan
Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta.
2. Dr. Suma’inna, M. Si , selaku Ketua Program Studi Matematika Fakultas Sains
dan Teknologi UIN Syarif Hidayatullah Jakarta, dan Ibu Irma Fauziah, M.Sc,
selaku Sekretaris Program Studi Matematika Fakultas Sains dan Teknologi UIN
Syarif Hidayatullah Jakarta.
3. Muhaza Liebenlito, M.Si selaku Pembimbing I yang telah memberikan ilmu
pengetahuan, pengarahan, bimbingan dan membantu penulis dalam
menyelesaikan skripsi ini serta memberikan inspirasi dari mulai pemilihan topik
hingga metode penelitian yang digunakan.
vi
4. Dr. Nur Inayah, M.Si selaku Pembimbing II yang telah memberikan ilmu
pengetahuan, pengarahan, bimbingan dan membantu penulis dalam
menyelesaikan skripsi ini.
5. Sanjaya dan Eti Buanawati sebagai orang tua penulis yang telah memberikan
dukungan baik moril ataupun materil untuk penulis.
6. Alvin Refaldi, Arsy Arlina dan Abdul Hamid yang selalu memberikan motivasi
serta dukungan lainnya kepada penulis.
7. Sahabat X yaitu Aulia, Ayu, Ery, Fitria, Hamid, Intan, Khusnul, Shinta, Vika
dan Dino yang selalu memberikan semangat kepada penulis.
8. Seluruh mahasiswa matematika serta seluruh pihak yang telah membantu
penulis dalam penyelesaian skripsi ini.
9. Keluarga Himpunan Mahasiswa yang telah memberikan ilmu, kepercayaan dan
pengalaman yang luar biasa
10. Seluruh pihak yang telah membantu penulis dalam menyelesaikan skripsi yang
tidak dapat disebutkan satu persatu.
Penulis menyadari bahwa masih banyak kesalahan dalam penyusunan skripsi
ini. Oleh sebab itu, penulis sangat menerima kritik dan saran yang bersifat
membangun agar kesalahan yang telah terjadi tidak terulang di masa yang akan
datang. Penulis sangat berharap bahwa skripsi ini dapat bermanfaat bagi banyak
pihak.
ix
ABSTRAK
Kharisma Monardo, Klasifikasi Gambar Sel Darah Merah Manusia Yang
Terinfeksi Parasit Falciparum Menggunakan Randomly Wired Neural Network,
dibawah bimbingan Muhaza Liebenlito, M.Si dan Dr. Nur Inayah, M.Si .
Malaria merupakan salah satu penyakit yang ada di Indonesia yang disebabkan oleh
parasit plasmodium salah satunya adalah parasite falciparum. Parasit ini ditularkan
melalui nyamuk yang menginfeksi sel darah merah manusia. Cara standar dalam
mendianosis malaria adalah dengan menguji sel darah merah dibawah mikroskop
apakah terinfeksi penyakit atau tidak. Pengujian ini dilakukan oleh penguji yang
kompeten, cara tersebut kurang efisien karena hasil ujinya dipengaruhi oleh
pengalaman dan pengetahuan dari pengujinya. Penerapan machine learning untuk
otomatisasi klasifikasi malaria tetap membutuhkan ahli sebagai feature extractor.
Penerapan deep learning pada permasalahan diagnosis malaria dibagi menjadi 3
tahap yaitu segmentation, stagging dan classification. Penelitian kali ini akan
menerapkan salah satu model deep learning yaitu randomly wired neural network
untuk mengklasifkasikan gambar yang terdapat parasite falciparum pada sel darah
merah atau tidak.
Penelitian kali ini menggunakan data sebanyak 27.558 yang dibagi menjadi 5
bagian untuk memprosesnya dengan metode cross-validation. Klasifikasi
menggunakan randomly wired neural network dengan menggunakan 4 random graf
pada arsitekturnya menunjukkan rata-rata hasil sebesar 95.08% pada accuracy,
93.62% pada precision, 96.44% pada recall dan 95.05% pada f1-score. Performa
dari randomly wired neural network dapat mengalahkan pre-trained model
ResNet50 yang arsitekturnya menunjukkan rata-rata hasil sebesar 89.63% pada
accuracy, 80.80% pada precision, 92.12% pada recall dan 89.88% pada f1-score.
Kata Kunci: Deep Learning, Malaria, Parasite Falciparum, Randomly Wired
Neural Network
x
ABSTRACT
Kharisma Monardo, Image Classification of Human Red Blood Cells Infected by
Falciparum Parasites Using Randomly Wired Neural Networks, under the guidance
of Muhaza Liebenlito, M.Si dan Nur Inayah, M.Si.
Malaria is a disease in Indonesia caused by plasmodium parasites, one of which is
falciparum parasite. This parasite is transmitted through mosquitoes that infect
human red blood cells. The standard way to diagnose malaria is testing the red blood
cells under a microscope whether they are infected with the disease or not. This test
is carried out by competent examiner, this method is less efficient because the
results of the test are influenced by the experience and knowledge of the examiner.
The application of machine learning to automate malaria classification still requires
experts as a feature extractor. The application of deep learning in malaria diagnosis
problems is divided into 3 stages, namely segmentation, stagging and classification.
This study will apply one of the deep learning models, namely randomly wired
neural network to classify images that contain parasitic falciparum on red blood
cells or not.
This research uses 27,558 data which is divided into 5 parts to process it using
cross-validation method. Classification using randomly wired neural network using
4 random graphs in the architecture shows an average yield of 95.08% on accuracy,
93.62% on precision, 96.44% on recall and 95.05% on f1-score. The performance
of randomly wired neural networks can beat the pre-trained ResNet50 model whose
architecture shows an average yield of 89.63% in accuracy, 80.80% in precision,
92.12% in recall and 89.88% in f1-score.
Keywords: Deep Learning, Malaria, Parasite Falciparum, Randomly Wired Neural
Network
xi
DAFTAR ISI
PERNYATAAN ................................................................................................................ ii
LEMBAR PENGESAHAN ............................................................................................. iii
PERSEMBAHAN DAN MOTTO .................................................................................. iv
KATA PENGANTAR ....................................................................................................... v
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPENTINGAN AKADEMIS ..................................................................... viii
ABSTRAK ........................................................................................................................ ix
ABSTRACT ....................................................................................................................... x
DAFTAR ISI .................................................................................................................... xi
DAFTAR GAMBAR ...................................................................................................... xiii
BAB I PENDAHULUAN .................................................................................................. 1
1. 1. Latar Belakang ............................................................................................. 1
1. 2. Perumusan Masalah ..................................................................................... 3
1. 3. Tujuan Penelitian ......................................................................................... 4
1. 4. Batasan Masalah ........................................................................................... 4
1. 5. Manfaat Penelitian ....................................................................................... 4
BAB II LANDASAN TEORI ........................................................................................... 5
2. 1. Penyakit Malaria .......................................................................................... 5
2. 2. Feed Forward Neural Network .................................................................... 6
2. 3. Convolutional Neural Network .................................................................... 8
2. 4. Loss Function ............................................................................................. 10
2. 5. Activation Function .................................................................................... 10
2. 6. Optimization ............................................................................................... 11
2. 7. Regularization ............................................................................................ 12
2. 8. Backpropagation ........................................................................................ 12
2.9. Random Graph ............................................................................................ 13
2.10. Evaluasi Model .......................................................................................... 14
2.11. Transformasi Gambar ................................................................................ 15
2.12. Cross-Validation ........................................................................................ 16
xii
BAB III METODELOGI PENELITIAN...................................................................... 18
3. 1. Sumber Data ............................................................................................... 18
3.2. Tahapan Penelitian ..................................................................................... 19
BAB IV HASIL DAN PEMBAHASAN ........................................................................ 25
4. 1. Preprocessing Data .................................................................................... 25
4.2. Membuat Model .......................................................................................... 26
4.3. Training ....................................................................................................... 27
4.4. Testing ......................................................................................................... 30
BAB V PENUTUP .......................................................................................................... 31
5.1. Kesimpulan ................................................................................................ 31
5.2. Saran ........................................................................................................... 32
REFERENSI ................................................................................................................... 33
xiii
DAFTAR GAMBAR
Gambar 1. 1 Annual Parasite Insidence (API) Per 1.000 Penduduk Menurut
Provinsi Tahun 2009-2018 [1][2] ........................................................................... 2
Gambar 2. 1 Feed Forward Neural Network. ........................................................ 7
Gambar 2. 2 Proses Konvolusi. ............................................................................. 9
Gambar 2. 3 Pooling ............................................................................................. 9
Gambar 2. 4 Ilustrasi Cross-Validation. .............................................................. 16
Gambar 3. 1 Sel Darah Merah Yang Terinfeksi P.Falciparum ........................... 18
Gambar 3. 2 Sel Darah Merah Yang Tidak Terinfeksi P.Falciparum ................. 18
Gambar 3. 3 Diagram Alur Penelitian ................................................................. 20
Gambar 4. 2 Hasil Generate Random Graf Watts-Strogatsz. .............................. 26
Gambar 4. 3 Arsitektur RWNN untuk Klasifikasi Gambar Sel Darah Merah
Manusia yang Terinfeksi P.Falciparum. ............................................................... 27
Gambar 4. 4 Loss Setiap Epoch Model RWNN. ................................................. 28
Gambar 4. 5 Akurasi Setiap Epoch Model RWNN. ........................................... 28
Gambar 4. 6 Loss Setiap Epoch Model Resnet50 ............................................... 29
Gambar 4. 7 Akurasi Setiap Epoch Model Resnet50 .......................................... 30
1
BAB I
PENDAHULUAN
1. 1. Latar Belakang
Pada ayat Al-Qur’an surah Al-Anbiya ayat 83-84 yang menurut kementrian
agama Republik Indonesia terkait ayat-ayat Al-Qur’an tersebut memiliki arti“Dan
(ingatlah kisah) Ayub, ketika dia berdoa kepada Tuhannya, ‘(Ya Tuhanku),
sungguh, aku telah ditimpa penyakit, padahal Engkau Tuhan Yang Maha
Penyayang dari semua yang penyayang’.” (QS. Al-Anbiya’ : 83), “Maka Kami
kabulkan (doa) nya, lalu Kami lenyapkan penyakit yang ada padanya dan Kami
kembalikan keluarganya kepadanya, dan (Kami lipat gandakan jumlah mereka)
sebagai suatu rahmat dari Kami, dan untuk menjadi peringatan bagi semua yang
menyembah Allah.” (QS. al-Anbiya’ : 84). Berdasarkan ayat diatas yang
menceritakan kisah kaum Nabi Ayub ‘alaihissalam dengan ujian berupa penyakit,
harapannya manusia dapat menjadikan kisah tersebut sebagai peringatan bahwa
siapapun dapat mengalami ujian berupa penyakit. Upaya dalam melalui ujian
tersebut, manusia dapat melakukan dua cara yaitu berdoa dan ikhtiar. Salah satu
bentuk ikhtiar manusia dalam melalui ujian berupa penyakit yaitu dengan melalui
dokter yang mengerti penyakit tersebut dan telah mempelajari cara penanganannya.
Begitupun upaya penyembuhan pada penyakit malaria, dimana dokter harus
melakukan diagnosa terlebih dahulu apakah pasien terinfeksi penyakit atau tidak
untuk memutuskan tindakan yang harus segera dilakukan.
Penyakit malaria merupakan penyakit yang dapat menyerang semua golongan
baik itu laki-laki atau perempuan baik dari umur bayi hingga dewasa. Penyakit
malaria ini disebabkan oleh infeksi parasit plasmodium yang hidup dan berkembang
biak pada sel darah merah manusia.
Sesuai dengan Keputusan Menteri Kesehatan RI Nomor
293/Menkes/SK/IV/2009 tanggal 28 April 2009 tentang “Eliminasi Malaria di
Indonesia” dan Surat Edaran Menteri Dalam Negeri kepada seluruh gubernur dan
bupati/walikota Nomor 443.41/465/SJ tanggal 8 Februari 2010 tentang “Pedoman
2
Pelaksanaan Program Eliminasi Malaria di Indonesia yang harus dicapai secara
bertahap mulai dari tahun 2010 sampai seluruh wilayah Indonesia bebas malaria
selambat-lambatnya tahun 2030”, maka program malaria di Indonesia bertujuan
untuk mencapai eliminasi. Perkembangan dari program malaria tersebut terlihat
pada Gambar 1.1. Pada Gambar 1.1 dapat dilihat bahwa jumlah API (Annua
Paracite Independence) / angka kesakitan per 1.000 penduduk mengalami
penurunan sejak tahun 2010 hingga tahun 2015, namun pada tahun 2016 hingga
tahun 2017 API Malaria mengalami kenaikan. Data terakhir pada tahun 2018
mennjukkan penurunan yang signifikan, namun tidak menutup kemungkinan
bahwa pada tahun selanjutnya akan terus menurun. Sehingga pihak terkait harus
selalu waspada terhadap penyakit malaria.
Gambar 1. 1 Annual Parasite Insidence (API) Per 1.000 Penduduk Menurut
Provinsi Tahun 2009-2018 [1][2].
Di Indonesia penyakit malaria ditangani dengan pengobatan ACT (Artemisinin-
Based Combination Therapy) dengan dua cara mendiagnosis yaitu pemeriksaan
mikroskopik dan rapid diagnostic test kedua cara diagnosis tersebut masing-masing
memiliki kelemahan. Hasil dari pemeriksaan mikroskopik dipengaruhi oleh
keahlian dari pemeriksanya baik itu dari pengetahuan maupun pengalaman [3].
Cara kedua yaitu rapid diagnostic test namun setelah melakukan rapid diagnostic
test hasilnya disarankan melakukan pemeriksaan mikroskopik untuk
mengkonfirmasi hasilnya [4].
Proses otomatisasi klasifikasi malaria sudah dilakukan oleh beberapa
peneliti, yaitu dengan menganalisa gambar perangkat lunak computer-aided
0
0.5
1
1.5
2
2.5
2009 2010 2011 2012 2012 2014 2015 2016 2017 2018
Annual Parasite Insidence (API) Malaria Per-1000 Penduduk
Menurut Provinsi Tahun 2009-2018
3
detection (CADx ) menggunakan traditional Machine Learning (ML) seperti
Support Vector Machine (SVM). Pada tahun 2009, pengaplikasian SVM untuk
mendeteksi sel darah merah yang terinfeksi [5]. Namun untuk membuat keputusan
memerlukan feature extraction sebelum mengolahnya dengan metode ML[6]. Pada
proses feature extraction ini yaitu menganalisa variable-variabel dalam gambar
seperti ukuran, background, angel dan posisi dari region of interest dan semua itu
memerlukan keahlian baik itu pengetahuan atau pengalaman. Sedangkan deep
learning (DL) mampu melakukan proses feature extraction dengan keberhasilan
yang signifikan [7]. Tahun 2018 pengaplikasian DL yaitu melaluti pre-trained
model untuk mendeteksi sel darah yang terinfeksi [8].
Pada penelitian kali ini penulis akan menggunakan Randomly Wired Neural
Network (RWNN) sebagai arsitektur modelnya. Dimana RWNN ini berhasil
mengalahkan pre-trained model di permasalahan image recognition pada ImageNet
[9]. Penulis berharap arsitektur ini sesuai untuk permasalahan Klasifikasi Gambar
Sel Darah Merah Manusia Yang Terinfeksi Parasit Falciparum (P.Falciparum) dn
untuk lebih meykinkn bhw RWNN sesuai untuk permasalahan Klasifikasi Gambar
Sel Darah Merah Manusia Yang Terinfeksi P.Falciparum model tersebut akan
dibandinkan dengan pre-trained model yaitu ResNet50.
1. 2. Perumusan Masalah
Berdasarkan latar belakang di atas, maka didapatkan perumusan masalah
sebagai berikut:
1. Bagaimana hasil implementasi RWNN jika di bandingkan dengan
ResNet50 untuk klasifikasi gambar sel darah merah manusia yang terinfeksi
P.Falciparum?
2. Bagaimana hasil training model RWNN jika di bandingkan dengan
ResNet50 pada permasalahan klasifikasi gambar sel darah merah manusia
yang terinfeksi P.Falciparum?
3. Bagaimana hasil evaluasi testing (Akurasi, Precision dan Recall) dari
RWNN jika di bandingkan dengan ResNet50 pada permasalahan klasifikasi
gambar sel darah merah manusia yang terinfeksi P.Falciparum?
4
1. 3. Tujuan Penelitian
Tujuan yang ingin dicapai dalam penelitian ini adalah sebagai berikut:
1. Mengimplementasikan RWNN dan membandingkan dengan ResNet50
untuk klasifikasi gambar sel darah merah manusia yang terinfeksi
P.Falciparum
2. Mengetahui hasil training model RWNN dan membandingkan dengan
ResNet50 pada permasalahan klasifikasi gambar sel darah merah manusia
yang terinfeksi P.Falciparum
3. Mengetahui hasil evaluasi testing (Akurasi, Precision dan Recall) dari
RWNN dan membandingkan dengan ResNet50 pada permasalahan
klasifikasi gambar sel darah merah manusia yang terinfeksi P.Falciparum
1. 4. Batasan Masalah
Agar pembahasan tidak menyimpang dari apa yang telah ditetapkan, maka
dibuat pembatasan masalah sebagai berikut :
1. Parasit yang dideteksi hanyalah parasite P.falciparum yang diwarnai giemsa
2. Data yang digunakan merupakan data sel darah merah manusia dari
National Library of Medicine (NLM) yang didapat di rumah sakit Medical
College Chittagong, Bangladesh
3. Model DL yang digunakan adalah RWNN
4. Arsitektur model RWNN yang digunakan menggunakan 4 random graf
5. Hyperparameter yang digunakan yaitu learning rate sebesar 0,0001 dan
batch size sebesar 8.
1. 5. Manfaat Penelitian
Melalui penelitian ini diharapkan dapat menjadi acuan untuk penelitian atau
pengembangan dalam diagnosis penyakit malaria di seluruh dunia terutama di
Indonesia. Instansi terkait diharapkan dapat melakukan pencegahan penyakit
malaria jika menerapkan penelitian ini atau pengembangannya dalam bidang
bioteknologi.
5
BAB II
LANDASAN TEORI
Bab ini akan membahas penjelasan tentan metode yang berkaitan satu sama
lain serta pendekatan dengan penelitian yang akan dilakukan pada skripsi ini.
Adapun teori-teori dalam bab ini meliputi pengetahuan tentang penyakit malaria,
beberapa metode yang berkaitan dan beberapa istilah lainnya yang digunakan
dalam penelitian.
2. 1. Penyakit Malaria
Penyakit malaria merupakan penyakit yang dapat menyerang semua golongan
baik itu laki-laki atau perempuan baik dari umur bayi hingga dewasa. Dimana
penyakit malaria ini disebabkan oleh infeksi parasite plasmodium yang hidup dan
berkembangbiak pada sel darah merah manusia. Menurut Kamus Besar Bahasa
Indonesia (KBBI), malaria adalah penyakit infeksi yang banyak dijumpai di daerah
tropis yang disertai gejala demam fluktuasi suhu secara teratur dan ditularkan oleh
nyamuk anopheles. Menurut WHO (World Health Organization) malaria adalah
penyakit yang disebabkan oleh parasit pasodium, parasit menyebar ke manusia
melalui gigitan nyamuk anofeles betina. Terdapat 5 spesies parasit yang
menyebabkan malaria, dan 2 dari 5 itu merupakan ancaman terbesar yaitu
P.Falciparum dan P.Vivax.
Pada tahun 1996, penelitian terkait Klasifikasi penyakit malaira di dunia sudah
mulai terlihat[10], di Indonesia penelitian terkait klasifikasi penyakit malaria
dimulai tahun 1999 dengan mendeteksi P.Falciparum dan P.Vivax pada pasien yang
mendudukin daerah timur Indonesia[11]. Pada Indonesia penelitian-penelitian
tentang diagnosis penyakit malaria masih dilakukan salah satunya oleh lembaga
Eijkman yang merupakan lembaga pemerintah terpercaya dalam melakukan
penelitian terhadap penyakit malaria.
6
2. 2. Feed Forward Neural Network
Sebelum mengetahui RWNN dan convolutional neural network alangkah lebih
baik jika kita mengetahui terlebih dahulu mengenali feed forward neural network.
Feed forward neural network merupakan model DL klasik yang mempunyai tujuan
mengaproksimasi nilai fungsi f*. Contoh misalkan kita mempunyai fungsi
klasifikasi 𝑦 = 𝑓∗(𝑥) yang memetakan input 𝑥 pada kategori 𝑦, model ini
memetakan �̂� = 𝑓∗(𝑥; 𝜃) dan belajar melalui parameter 𝜃 untuk menghasilkan
aproksimasi fungsi yang terbaik [12]. Feed forward neural network ini terdiri dari
beberapa layer perceptron dimana masing-masing perceptronnya mempunyai
weight dan bias yang dapat di optimasi melalui training untuk menyesuaikan pada
suatu permasalahan. Ilustrasi untuk feed forward neural network dapat dilihat pada
Gambar 2.1.
Perceptron pada setiap layernya menggunakan persamaan dibawah untuk
mnghitung outputnya.
𝑦 = 𝑓 (∑ 𝑖𝑖𝑤𝑖 + 𝑏
𝑛
𝑖=1
) ( 1 )
Dimana :
𝑦 : output perceptron
𝑤𝑖 : weight input i
𝑏 : bias perceptron
𝑓 : activation function
Parameter yang optimal diperoleh dengan mengoptimasi fungsi kesalahan supaya
mencapai kesalahan yang terkecil, jadi untuk mendapatkan parameter yang optimal
feed forward neural network membutuhkan fungsi kesalahan, Teknik optimasi dan
memerlukan waktu untuk belajar dengan meminimalkan kesalahan.
7
Gambar 2. 1 Feed Forward Neural Network.
𝑙 = ∑ 𝑖𝑖𝑤𝑖 + 𝑏
𝑛
𝑖=1
𝑓(𝑙)
8
2. 3. Convolutional Neural Network
Convolutional Neural Network (CNN) merupakan salah satu variasi dari feed
forward neural network yang terinspirasi oleh pemahaman Hubel dan Weasel
melalui cara kerja korteks visual kucing. Korteks visual ini memiliki daerah kecil
yang terdiri dari beberapa sel yang peka terhadap daerah tertentu di bidang visual.
Sel-sel didalam korteks visual tersebut aktif hanya pada bentuk dan orientasi objek
tertentu pada bidang visual.
Sistem kerja ini menjadi dasar bagaimana salah satu jenis arsitektur feed
forward neural network yaitu CNN dibuat, pada CNN memiliki struktur dasar yang
nyaris serupa dengan feed forward neural network pada umumnya, seperti input
layer, hidden layer hingga output[13], jadi CNN adalah feed forward neural
network yang menggunakan perhitungan konvolusi terhadap setiap matriks pada
setidaknya 1 dari layer pada network-nya [12].
Misalkan input pada layer ke 𝑞 memiliki ukuran dimensi (𝐿𝑞 𝑥 𝐵𝑞𝑥 𝑑𝑞) dimana
secara berturut-turut merupakan panjang, lebar dan kedalaman input. Filter 𝑝 pada
layer 𝑞 adalah parameter yang di notasikan sebagai tensor 3 dimensi 𝑊(𝑝,𝑞) =
[𝑤𝑖𝑗𝑘(𝑝,𝑞)
]. Index 𝑖,𝑗 dan 𝑘 menyatakan posisi sepanjang tinggi, lebar dan kedalaman.
Ukuran dimensi pada filter tersebut adalah (𝐹𝑞 𝑥 𝐹𝑞 𝑥 𝑑𝑞). Feature maps pada layer
ke-𝑞 direpresentasikan dengan tensor 3 dimensi 𝐻(𝑞) = [ℎ𝑖𝑗𝑘(𝑞)
] ,saat 𝑞 = 1 maka
𝐻(1) merepresentasikan sebagai layer input [13]. Berikut adalah persamaan
matematis proses konvolusi pada layer ke-𝑞.
ℎ𝑖𝑗𝑝(𝑞+1)
= ∑ ∑ ∑ 𝑤𝑟𝑠𝑘(𝑝,𝑞)
ℎ𝑖+𝑟−1,𝑗+𝑠−1,𝑘(𝑞)
𝑑𝑞
𝑘=1
𝐹𝑞
𝑠=1
𝐹𝑞
𝑟=1
( 2 )
∀𝑖 ∈ {1 … ,𝐿𝑞 − 𝐹𝑞
𝑆+ 1}
∀𝑗 ∈ {1 … ,𝐵𝑞 − 𝐹𝑞
𝑆+ 1}
∀𝑝 ∈ {1 … , 𝑑𝑞+1}
9
Gambar 2. 2 Proses Konvolusi.
Proses konvolusi memiliki beberapa parameter yang dapat diubah yaitu stride
dan padding. Stride adalah pergeseran matriks kernel pada matriks input layernya,
sementara padding adalah menambahkan suatu nilai pada sisi luar matriks input
layernya. Contoh proses konvolusi dapat dilihat pada Gambar 2.2.
CNN tidak luput dari proses pooling yang biasanya dilakukan setelah proses
konvolusi dimana pooling bekerja dengan memilih 1 diantara beberapa nilai yang
ditentukan banyaknya dengan kriteria tertentu, secara ilustrasi pooling dapat dilihat
pada Gambar 2.4.
Gambar 2. 3 Pooling.
10
2. 4. Loss Function
Fungsi yang menunjukkan seberapa buruk model yang dibentuk merupakan
definisi dari Loss Function. Pemilihan loss function bergantung pada pemilihan
activation function dan output layer suatu network. Pada ouput yang berupa
bilangan asli biasanya menggunakan activation function softmax dan loss function
cross-entropy, sedangkan pada ouput berupa bilangan real biasanya menggunkan
activation function linear dan loss function squred error. Pada penelitian kali ini
output yang dihasilkan akan berupa bilangan asli sehingga akan mengunakan loss
function Cross Entropy Loss yang mempunyai rumus:
𝐿 = −1
𝑁(∑ 𝑦𝑖log (ŷ𝑖)
𝑁
𝑖=1
) ( 3 )
dimana:
N = banyaknya kelas yang diklasifikasikan
𝑦𝑖 = kelas yang sesungguhnya
ŷ𝑖 = hasil predisi dari model (berupa peluang).
2. 5. Activation Function
Fungsi yang digunakan untuk menghitung output pada sebuah layer sebuah
network merupakan definisi dari Activation function. Seperti yang dijelaskan pada
subab sebelumnya bahwa activation fuction dan loss function saling berhubungan.
Namun pada penlititan kali ini tidak mengunakan activation function sofmax pada
output nodenya, karena pada modul yang kita gunakan pada penelitian kali ini
sebelum masuk loss function cross-entropy modul akan menjalankan activation
fuction softmax. Jadi jika kita menerapkan activation function sotmax lagi makan
program akan melakukan 2 kali activation function sofmax. Berikut beberapa
output unit yang digunakan pada penelitian kali ini:
11
2.5.1. ReLU
ReLU adalah suatu fungsi linear namun memiliki batas bawah yang secara
umum batasnya adalah 0. ReLU akan digunakan pada penelitian kali ini pada setiap
simpul yang akan dibuat nantinya. secara matematis ReLU dapat di tulis menjadi:
𝑓(𝑥) = {𝑥, 𝑥 > 00 , 𝑥 ≤ 0
( 4 )
2.5.2. Sigmoid
Fungsi aktivasi sigmoid biasa disebut sebagai fungsi penghalus, karena hasil
dari fungsi ini terlihat halus. Karena fungsi ini akan selalu bernilai postif maka
sigmoid pada penelitian kali ini akan untuk menjumlahkan input pada suatu simpul
sebelum melakukan transformasi didalam simpul. Fungsi ini mempunyai rumus:
𝑓(𝑥) = 1
1 + 𝑒−𝑥 ( 5 )
2. 6. Optimization
Algoritma yang digunakan untuk mengoptimalkan parameter agar model yang
dilatih dapat mengaproksimasi dengan baik merupakan definisi dari optimisasi.
Pada penelitian kali ini optimisasi yang digunakan adalah SGD (stochastic gradien
descent) pemilihan optimisasi SGD adalah berdasarkan Nitish Shirish Keskar dkk
yang telah meneliti bahwa SGD lebih stabil dari ADAM [14]. Optimisasi SGD ini
mempunyai cara kerja sebagai berikut:
𝜃 = 𝜃 − 𝜇. ∇𝐿(𝜃) ( 6 )
dimana :
𝜃 = parameter yang ingin dioptimalkan (weight, bias)
𝜇 = Learning Rate
𝐿 = Loss function
∇ = operasi turunan fungsi.
Pengoptimalan ini dilakukan pada setiap epoch hingga mencapai nilai yang optimal
atau nilai dari Loss Function yang minimum.
12
2. 7. Regularization
Regularization adalah cara bagaimana agar model yang kita train mempuyai
performa yang baik selain pada data train [12], dengan kata lain mencegah model
kita untuk overfit. Banyak strategi yang digunakan untuk mengatasi hal ini namun
pada penelitian kali ini peneliti menggunakan cara BatchNorm (BN). Secara umum
BN dapat dijelaskan dengan melakukan standarisasi gaussian yang bertujuan agar
tidak ada output dari suatu node yang mempunyai jarak yang berbeda terlalu jauh.
Perbedaan jarak nilai dari suatu ouput node dapat berakibat pada saat melakukan
optimization, dimana BN mempunyai algoritma sebagai berikut:
𝜇𝛽 ←1
𝑚∑ 𝑥𝑖
𝑚
𝑖=1
( 7 )
𝜎𝛽2 ←
1
𝑚∑(𝑥𝑖 − 𝜇𝛽)
2𝑚
𝑖=1
( 8 )
�̂�𝑖 ←𝑥𝑖 − 𝜇𝛽
√𝜎𝛽2
( 9 )
2. 8. Backpropagation
Algoritma yang digunakan untuk meminimumkan fungsi loss adalah Algoritma
Backpropagation. Algoritma backpropagation terdiri dari beberapa algoritma,
dimana salah satunya adalah stochastic gradient descent (SGD). SGD merupakan
suatu metode optimasi yang berbasis gradient. Backpropagation terdiri dari 2 fase
yaitu forward phase dan backward phase [15].
a. Forward phase: Didalam forward phase, input digunakan untuk menghitung
nilai dari setiap hidden layer berdasarkan nilai weight (w) dan bias (b) yang ada.
Tujuan dari forward phase adalah untuk menghitung seluruh output dari hidden
layer hingga ouput layer berdasarkan dari input yang diberikan. Setelah
13
perhitungan selesai dihitunglah loss function (𝐿) berdasarkan nilai output layer
kemudian hitung gradient-nya berdasarkan nilai ouput layer [15].
b. Backward phase: Didalam backward phase perhitungan gradient dari L
berdasarkan berbagai w dan b dilakukan. Pada tahapan ini gradient dihitung
dengan turunan parsial secara mundur, yakni gradient dihitung dari 𝐿 hingga
input layer dengan memperhatikan 𝑤 dan 𝑏 pada layer tersebut. Setelah itu
gunakan nilai gradient dari fungsi loss terhadap w atau b dan dioptimasi
menggunakan SGD [15].
Proses stochastic gradient descent (SGD) digunakan untuk memperbarui nilai
parameter yang akan dioptimasi yaitu 𝜃 (weight dan bias), dimana learning rate
(𝛼) adalah ukuran langkah untuk mencapat titik minimum dibawah ini merupakan
persamaan untuk mengoptimasi parameter dengan SGD menggunakan persamaan
(6). Proses backpropagation yang terdiri dari forward phase dan backward phase
yang dilakukan 1 kali pada seluruh data merupakan siklus dari 1 epoch.
2.9. Random Graph
Kumpulan simpul bersama dengan sisi, dimana setiap sisi menghubungkan
dua buah simpul merupakan defisini dari Graph. Random graph adalah graf dimana
simpul dan sisinya diciptakan dengan suatu proses yang acak atau random. Random
graph dapat dideskripsikan oleh peluang distrbusi atau hanya oleh suatu proses
random. Pada penelitian kali ini penulis menggunakan model random graph Watts-
Strogatz.
2.9.1. Watts-Strogatz
Random Graph Watts-Strogatz didefinisikan dengan membuat small-word graph.
Small-world graph merupakan graf yang sebagian besar simpulnya dapat dicapai
ke simpul lain dengan sejumlah kecil langkah [16]. Parameter yang dapat di atur
yaitu banyaknya simpul, peluang simpul pada graf bertetangga dan maksimum
simpul pada graf bertetangga. Cara pembuatan Random Graph Watts-Strogatz yaitu
dengan algoritma sebagai berikut [17]:
14
a. Bentuk cincin kisi (lattice) regular dengan N buah simpul yang masing-masing
terhubung dengan 2𝑚 buah tetangga (m buah pada masing-masing sisi).
b. Setiap simpul 𝑛𝑖 = 𝑛1 ⋯ 𝑛𝑁 ambil busur (𝑛𝑖, 𝑛𝑗) dengan 𝑖 < 𝑗, dan hubungkan
kembali dengan peluang P. Proses menghubungkan kembali dilakukan dengan
menggantikan (𝑛𝑖, 𝑛𝑗) dengan (𝑛𝑝, 𝑛𝑞) dimana 𝑝, 𝑞 dipilih dengan peluang
yang sama untuk semua kemungkinan nilai untuk menghindari self-loops dan
koneksi yang terduplikasi (𝑝 = 𝑖 atau 𝑞 = 𝑗 diperbolehkan namun tidak boleh
keduanya bersamaan).
2.10. Evaluasi Model
Melakukan evaluasi dalam kinerja sistem klasifikasi merupakan hal yang
penting untuk menggambarkan seberapa baik sistem dalam mengkalsifikasikan
data. Terdapat banyak evaluasi yang dapat di gunakan pada suatu penelitian namun
pada penelitian kali ini penulis menggunakan salah satunya adalah Confusion
Matrix. Penulis menggunakan evaluasi confusion matrix karena pada penelitian kali
ini membutuhkan evaluasi recall yang didapat dari hasil confusion matrix. Cara
kerjanya yakni membandingkan hasil klasifikasi yang dilakukan oleh sistem
dengan hasil klasifikas yang seharusnya.
Terdapat 4 istilah dalam pengukuran kinerja menggunakan Confusion
Matrix, sebagai representasi hasil proses klasifikasi yakni, True Positive (TP), True
Negative (TN), False Positive (FP), False Negative (FN), pada klasifikasi binary
confusion matrix disajikan dalam Tabel 2.1 [18]:
Tabel 2. 1 Confusion Matrix Klasifikasi Binary
Kelas Terklasifikasi Positif Terklasifikasi Negatif
Positif TP (True Positive) FN (False Negative)
Negatif FP (False Positive) TN (True Negative)
Berdasarkan Tabel 2.1 diatas dapat diperoleh nilai akurasi, presisi, dan
recall. Tabel 2.2 menyajikan langkah-langkah yang digunakan untuk klasifikasi
binary berdasarkan berdasarkan confusion matrix.
15
Tabel 2. 2 Ukuran Untuk Klasifikasi Binary
Ukuran Formula Fokus Evaluasi
Akurasi 𝑡𝑝 + 𝑡𝑛
𝑡𝑝 + 𝑓𝑛 + 𝑓𝑝 + 𝑡𝑛
Efektifitas keseluruhan
dari sebuah classifier.
Presisi 𝑡𝑝
𝑡𝑝 + 𝑓𝑝
Efektifitas classifier
untuk memprediksi kelas
positif
Recall 𝑡𝑝
𝑡𝑝 + 𝑓𝑛
Efektifitas classifier
untuk mengidentifikasi
label positif.
2.11. Transformasi Gambar
Transformasi menurut KBBI adalah perubahan rupa (bentuk,sifat, fungsi
dan sebagainya), dengan kata lain transformasi gambar adalah perubahan rupa dari
gambar baik itu perubahan bentuk, sifat maupun fungsi.
Fill Image adalah proses transformasi gambar yang mengubah gambar
menjadi kotak atau mempunyai panjang dan lebar yang sama dengan menyiapkan
bidang polos yang berbentuk persegi lalu menempelkan objek kita diatas bidang
itu, dengan lebar dari bidang itu adalah Panjang dari objeknya
Normalisasi merupakan salah satu transformasi gambar yang mengubah
nilai dari setiap pixel yang terdapat pada gambar dengan tujuan minimumkan jarak
antara nilai maksimal dan nilai minimum dari pixel yang terdapat pada gambar
namun tidak menghilangkan informasi yang terdapat pada gambar. Proses
pengubahan nilai pixel gambar dengan normalisasi dihitung pada setiap channel-
nya dengan menggunakan Z-Score parameter [19] :
𝑁𝑜𝑟𝑚𝑎𝑙𝑖𝑧𝑒 = 𝑛𝑖𝑙𝑎𝑖 𝑎𝑤𝑎𝑙 − 𝑚𝑒𝑎𝑛
√𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒
( 10 )
16
Resize adalah proses transformasi gambar yang mengubah ukuran gambar
menjadi yang kita inginkan.
Selain fill image, normalize dan resize masih banyak lagi transformasi gambar
yang dapat dilakukan, namun pada penelitian kali ini hanya akan menggunakan
ketiga transformasi tersebut.
2.12. Cross-Validation
Cross-Validation adalah metode statistik untuk mengevaluasi dan
membandingkan algoritma pembelajaran dengan membagi data menjadi dua
segmen: satu digunakan untuk belajar atau melatih model dan yang lainnya
digunakan untuk memvalidasi model. Dalam Cross-Validation, pelatihan dan
validasi set harus menyeberang di putaran berturut-turut sehingga setiap titik data
memiliki kesempatan untuk menjadi data validasi. Bentuk dasar dari Cross-
Validation adalah k-fold Cross-Validation. Bentuk lain dari Cross-Validation
adalah kasus khusus dari k-fold Cross-Validation atau melibatkan pengulangan
Cross-Validation k-fold.
Gambar 2. 4 Ilustrasi Cross-Validation.
17
Pada k-fold Cross-Validation, data dipartisi menjadi k sama besar (atau hampir
sama) ukuran segmen atau fold contohnya dapat dilihat pada Gambar 2.4.
Selanjutnya k iterasi pelatihan dan validasi dilakukan sedemikian rupa sehingga
dalam setiap iterasi lipatan data yang berbeda ditahan-Out untuk validasi sementara
lipatan k − 1 yang tersisa digunakan untuk belajar.
18
BAB III
METODOLOGI PENELITIAN
Beberapa penelitian pengklasifikasian gambar dilakukan oleh para peneliti
dengan berbagai tahapan untuk mendapatkan hasil pengklasifikasian terbaik seperti
pada penelitian [6] dan [8]. Proses lebih jelasnya pada bab ini akan dipaparkan
mulai dari sumber data dan tahapan penelitian yang dipilih penulis atas berbagai
pertimbangan permasalahan yang dihadapi.
3. 1. Sumber Data
Data yang digunakan dalam penilitian kali ini adalah data sekunder yang di
ambil di dokumentasi NLM [8]. Data tersebut diambil dari aplikasi android yang
dikembangkan oleh peneliti di Lister Hill National Center for Biomedical
Communications (LHNCBC) yang merupakan bagian dari NLM [20], aplikasi ini
berguna untuk mengurangi beban bagi orang yang mendiagnostik di daerah terbatas
sumber daya dan meningkatkan akurasi diagnostik. Aplikasi ini mengambil sel
darah tipis yang di warnai Giemsa dari 150 pasien yang terinfeksi P.falciparum dan
50 pasien sehat di rumah sakit Medical College Chittagong, Bangladesh. Gambar
sel yang diperoleh diidentifikasi secara manual oleh pembaca sel darah yang ahli di
unit penelitian obat tropis Mahidol-Oxford di Bangkok. Gambar yang tidak bisa
diidentifikasikan kemudian diarsipkan di NLM (IRB#12972). Tahap terakhir
adalah menerapkan algoritma berbasis level-set untuk mendeteksi dan
mensegmentasi sel darah merah[21]. Contoh data yang akan di gunakan dalam
penelitian kali ini dapat dlihat pada Gambar 3.1 dan Gambar 3.2.
Gambar 3. 1 Sel Darah Merah Yang
Terinfeksi P.Falciparum
Gambar 3. 2 Sel Darah Merah Yang
Tidak Terinfeksi P.Falciparum
19
3.2. Tahapan Penelitian
Pada sub bab tahapan penelitian ini berisikan tentang tahapan-tahapan yang
dilakukan atau metode yang digunakan mulai dari mempersiapkan data, membuat
model sampai dengan evaluasi serta interpretasi hasil penelitian sehingga dapat
disimpulkan suatu hal yang bermanfaat. Pada skripsi ini penulis menggunakan
aplikasi python versi 3.6.1 dengan bantuan beberapa modul diantaranya seperti
numpy, matplotlib, torch. Numpy digunakan untuk membuat bilangan random saat
proses pembagian data menjadi data latih, data validasi, dan data tes. Numpy juga
digunakan untuk menghitung rata-rata dan variansi pada proses normalisasi
gambar. Matplotlib digunakan untuk menampilkan plot hasil training model. Torch
digunakan untuk memuat data yang terdapat pada folder agar di olah oleh python
dan untuk mentransforasi gambar agar gambar mudah untuk diolah, serta
digunakan untuk membuat model RWNN. Proses penelitian yang dilakukan dapat
dilihat pada Gambar 3.3.
20
Gambar 3. 3 Diagram Alur Penelitian
21
3.2.1. Preprocessing
Sebelum mengolah data gambar sebaiknya dilakukan beberapa proses persiapan
yang memudahkan pengolahan gambarnya, dimana proses itu dikenal dengan
preprocessing data. Preprocessing data terdiri dari berbagai macam perlakuan
sesuai dengan kebutuhan penelitian. Pada penelitian kali ini preprocessing yang
digunakan adalah transformasi gambar. Pada peneilitian kali ini transformasi yang
digunakan adalah Fill Image, Normalize, dan Resize.
Penelitian ini dilakukan fill image karena dalam melakukan diagnosis suatu
sel darah terinfeksi atau tidak salah satunya dengan memperhatikan rasio
p.falciparum yang telah diwarnai giemsa sebelumnya. Jadi jika kita melakukan fill
image pada data, data akan mempunyai rasio seperti data awal ketika kita lakukan
resize dengan rasio persegi. S. B. Kotsiantis dkk menyarankan melakukan data
normalization dengan menggunakan persamaan (7) pada permasalahan supervised
learning terutama ketika kita menggunakan model neural network atau k-Nearest
Neighbouthood [22]. Dan resize menjadi ukuran 64 × 64 dilakukan agar proses
training tidak memerlukan biaya yang terlalu besar.
3.2.2. Model
Setelah data siap diolah, selanjutnya pembentukan model RWNN meliputi
menentukan jumlah random graph yang digunakan, penentuan arsitektur dari model
yang akan digunakan penulis mengacu pada penelitian sebelumnya [9] hanya agak
sedikit dimodifikasi. Berikut beberapa hyperparameter yang perlu di tentukan
sebelum melatih model.
Loss function yang digunakan pada penelitian kali ini adalah Cross Entropy
menggunakan persamaan (3) dengan output unit masing-masing adalah Linear.
Pemilihan output unit sangat dipengaruhi oleh Loss Function yang digunakan,
karena beberapa literature menunjukkan bahwa Cross Entropy merupakan
gabungan dari Negative Likelihood dengan Log dari Softmax jadi output unit tidak
perlu menggunakan Softmax lagi.
22
Optimasi yang dilakukan pada penelitian kali ini penulis menggunakan SGD
seperti persamaan (6) dimana kelebihannya dibanding optimasi yang lain adalah
kestabilannya yang konsisten (tergantung learning rate yang digunakan) meskipun
kelemahanya model akan belajar lebih lama. Selanjutnya untuk mencegah model
yang kita latih itu overfit penulis melakukan batchnorm yang menggunakan
persamaan (7), (8) dan (9) pada setiap simpul pada graph yang ada pada model yang
menormalisasikan setiap output-nya.
Arsitektur model pada penelitian kali ini penulis menggunakan RWNN.
Dimana RWNN adalah suatu model yang menggunakan graf sebagai arsitektur
neural network-nya. Dimana pada setiap garis graphnya melakukan perpindahan
data dari simpul ke simpul lain dan pada setiap simpulnya melakukan operasi [9] :
Aggregation : data yang masuk (dari 1 garis atau lebih) ke simpul di
kombinasikan melalui weighted sum (menggunakan activation function
sigmoid seperti persamaan (5)) bobotnya dapat di optimalkan dan positif.
Transformation : setelah data melalui persetujuan (aggregated) data dilakukan
proses transformasi yang didefinisikan sebagai ReLU (persamaan (4)) -
convolution (persamaan(2)) – BatchNorm (persamaan (7), (8) dan (9)) triplet.
Operasi ini dilakukan di setiap simpul.
Distribution : data setelah di transformasi di duplikasi dan dikirim ke setiap
garis output-nya
Peneliti menggunakan arsitektur dari penelitian sebelumnya yang sudah
melakukan eksperimen pada beberapa jumlah graf yang digunakan dan
membendingkannya dengan pre-trained model [9]. Spesifikasi arsitektur yang di
gunakan pada penlitian kali ini yaitu terdiri dari 1 layer convolutional layer, 4
RWNN, dan 1 fully connected layer. Arsitekturnya dapat dilihat pada Tabel 3.1.
Tabel 3. 1 Arsitektur Model
Langkah Output Arsitektur
Conv1 32x32 3x3 Conv, C/2
Graf1 16x16 Graph N/2, C
Graf2 8x8 Graph N, 2C
23
Langkah Output Arsitektur
Graf3 4x4 Graph N, 4C
Graf4 2x2 Graph N, 8C
Pooling 1x1 Average Pool 1280C
Fully Connected 2 FC 2
Penjelasan dari Tabel 3.1 pada kolom arsitektur adalah sebagai berikut:
a. Proses Conv berarti operasi yang didalamnya terdapat ReLU-Convolution-BN.
b. C merupakan banyaknya output channel yang digunakan di setiap layernya.
c. Graph merupakan operasi RWNN pada graph yang sebelumnya sudah di
bangkitkan dimana N adalah jumlah simpul dari graph yang dibankitkan.
d. Average Pool adalah pool dengan ketentuan mengambil rata-rata nya.
e. FC adalah fully connected layer.
3.2.3. Training
Model yang telah terbentuk selanjutnya dilatih menggunakan komputer. Pada
penelitian kali ini peneliti melakukan training pada model menggunakan komputer
dengan spesifikasi menggunakan computer server dengan spesifikasi Intel ® Core
™ i9-9900k, RAM 31 GB, GeForce RTX 8GB / CUDA 10. Dengan
hyperparameter yaitu learning rate sebesar 0,0001 dan batch size sebesar 8.
Penggunaan learning rate sebesar 0,0001 merupakan pilihan pribadi dari penulis
dikarenakan fungsi loss merupakan fungsi yang konveks seperti terlihat pada
lampiran 1, maka berapapun nilai dari learning rate loss yang di optimalkan akan
menuju nilai yang sama, yang membedakan hanya berapa lama fungsi loss-nya
menuju nilai minimumnya dan pemilihan batch size sebesar 8 juga merupakan
pilihan pribadi penulis untuk mencegah terjadinya overfit pada model.
Melatih model dimulai setelah data dilakukan preprocessing dan split data. Data
train dijadikan input model setiap epoch untuk melakukan backpropagation yang
terdiri dari forward pass dan backward pass. Sedangkan data validasi dijaikan input
untuk model pada setiap epochnya namun hanya melakukan forward pass hingga
24
mendapat nilai dari loss. Penggunaan data validasi pada training model karena nilai
loss dari data validasi dibutuhkan sebagai penentuan model terbaik selama training.
3.2.4. Evaluasi
Model yang telah dilatih kemudian dievaluasi. Pada penelitian kali ini, evaluasi
yang digunakan yaitu menggunakan confusion matrix dan laporan klasifikasi yang
menampilkan precision dan recall pada masing-masing kelasnya. Kemudian dari
hasil evaluasi dapat kita lihat apakah RWNN cocok untuk permasalahan ini.
25
BAB IV
HASIL DAN PEMBAHASAN
Setelah meninjau banyak hal mulai dari teori sampai dengan metode-metode
yang dilakukan para peneliti sebelumnya, maka penulis mulai mencoba melakukan
penelitian sesuai dengan data yang diambil dan metodelogi yang dipilih. Adapun
pokok pembahasan dari bab ini yaitu hasil preprocessing data, pembentukan model
untuk Klasifikasi penyakit malaria melalui gambar sell darah merah, dan evaluasi
model yang telah dilatih.
4. 1. Preprocessing Data
Prepocessing dilakukan ketika proses penyimpanan data pada folder kelas yang
sesuai, dimana proses yang dilakukan adalah transformasi data meliputi Fill I mage,
Normalize dan Resize menjadi berukuran 64x64. Hasil transformasi Fill Image,
Resize dan Normalize terlihat seperti pada Gambar 4.1.
Gambar 4. 1 Beberapa contoh hasil transformasi Fill image Normalize dan
Resize.
26
Proses transformasi gambar fill image dilakukan oleh penulis dengan
menggunakan code yang dibuat sendiri, namun normalize dan resize dilakukan
melalui library torchvision. Selanjutnya akan dilakukan pembagian pada data
meliputi data latih yang kemudian akan dilatih untuk mendapatkan model terbaik,
data validasi yang digunakan untuk memvalidasi model dan data tes untuk menguji
model yang selesai dilatih. Pembagian data dilakukan secara acak, penelitian kali
ini rasio yang digunakan untuk data train, data validasi dan data test berturut-turut
yaitu 70%, 20% dan 10% dari data.
4.2. Membuat Model
Pembuatan model RWNN pada penelitian kali ini dibantu oleh beberapa library
yang ada pada python yaitu torchvision dan network. Torchvision membantu
peneliti dalam pembuatan arsitektur dasarnya seperti fully connected layer,
optimization, regularization, loss function dan lain-lain. Sedangkan network
membantu peneliti dalam membangkitkan random graf Watts-Strogatz.
Pembangkitan random graf Watts-Strogatz menggunakan library networkx
dengan parameter peluang simpul bertetangga (P) itu sebesar 0.5, maksimal sisi dari
setiap simpul adalah 4 dan banyaknya simpul dapat dilihat dari Hasil generate graf
pada Gambar 4.2.
Gambar 4. 2 Hasil Generate Random Graf Watts-Strogatsz.
27
Pembuatan model menggunakan library torchvision dan graf yang sudah di
generate sebelumnya menghasilkan arsitektur seperti terihat pada Gambar 4.3.
Gambar 4. 3 Arsitektur RWNN untuk Klasifikasi Gambar Sel Darah Merah
Manusia yang Terinfeksi P.Falciparum.
4.3. Training
Training yang dilakukan dengan metode cross-validation dengan membagi data
menjadi 5 sama rata/hampir sama. Proses training tersebut memerlukan waktu
63370 detik (17.7 jam) dengan spesifikasi komputer yang di gunakan.
Hasil training dengan menggunakan 100 epoch, batch size sebesar 8 dan
learning rate sebesar 0,0001 dalam grafik loss yang didapat pada setiap epoch-nya
pada masing-masing fold-nya dapat dilihat pada Gambar 4.4 dan grafik akurasi
yang didapat pada setiap epoch-nya pada masing-masing fold-nya dapat dilihat
pada Gambar 4.5.
28
Gambar 4. 4 Loss Setiap Epoch Model RWNN.
Gambar 4. 5 Akurasi Setiap Epoch Model RWNN.
Berdasarkan Gambar 4.4 dan Gambar 4.5 dapat kita lihat bahwa seiring dengan
menurunnya loss maka akurasinya juga akan meningkat jadi ini dapat membuktikan
bahwa tidak ada kesalahan baik pada data, model ataupun classifier. Pada Gambar
4.4 dan Gambar 4.5 dapat kita lihat juga bahwa model yang dilatih menggunakan
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
1 4 7
10
13
16
19
22
25
28
31
34
37
40
43
46
49
52
55
58
61
64
67
70
73
76
79
82
85
88
91
94
97
10
0
LOSS SETIAP EPOCH RWNN
fold1 fold2 fold3 fold4 fold5
50
55
60
65
70
75
80
85
90
95
100
1 4 7
10
13
16
19
22
25
28
31
34
37
40
43
46
49
52
55
58
61
64
67
70
73
76
79
82
85
88
91
94
97
10
0
AKURASI SETIAP EPOCH RWNN
fold1 fold2 fold3 fold4 fold5
29
hyperparameter yang tepat dibuktikan engan grafik loss dan akurasi yang
konvergen pada suatu nilai yang diharapkan.
Selain melakukan training pada model RWNN training terhadap pretrained
model ResNet50 juga dilakukan dengan tujuan untuk membandingkan performa
dari model RWNN dengan ResNet50. Menggunakan data yang samadan perlakuan
yang sama baik itu preprocessing, hyperparameter maupun loss function dan
optimizer. dalam grafik loss yang didapat pada setiap epoch-nya pada masing-
masing fold-nya dapat dilihat pada Gambar 4.4 dan grafik akurasi yang didapat
pada setiap epoch-nya pada masing-masing fold-nya dapat dilihat pada Gambar 4.5.
Gambar 4. 6 Loss Setiap Epoch Model Resnet50
Berdasarkan Gambar 4.6 dan Gambar 4.7 dapat kita lihat bahwa seiring dengan
menurunnya loss maka akurasinya juga akan meningkat jadi ini dapat membuktikan
bahwa tidak ada kesalahan baik pada data, model ataupun classifier. Pada Gambar
4.6 dan Gambar 4.7 dapat kita lihat juga bahwa model yang dilatih menggunakan
hyperparameter yang tepat dibuktikan engan grafik loss dan akurasi yang
konvergen pada suatu nilai yang diharapkan.
0.29
0.31
0.33
0.35
0.37
0.39
0.41
0.43
1 4 7
10
13
16
19
22
25
28
31
34
37
40
43
46
49
52
55
58
61
64
67
70
73
76
79
82
85
88
91
94
97
10
0
LOSS SETIAP EPOCH RESNET50
fold1 fold2 fold3 fold4 fold5
30
Gambar 4. 7 Akurasi Setiap Epoch Model Resnet50.
4.4. Testing
Testing yang dilakukan pada data tes di setiap fold-nya menghasilkan hasil yang
terlihat seperti Tabel 4.1 Menunjukkan bahwa model RWNN menunjukan performa
yang lebih baik di bandingkan dengan ResNet50.
Tabel 4. 1 Hasil Evaluasi Training Dengan Cross-Validation.
Pengukuran RWNN ResNet50
Akurasi 95.08% 89.63%
Presisi 93.62% 80.80%
Recall 96.44% 92.12%
F1-Score 95.05% 89.88%
Dengan melihat Tabel 4.1 dapat kita simpulkan bahwa model RWNN dengan 4
graph dapat melakukan klasifikasi penyakit malaria melalui sel darah merah
dengan kesalahan yang kecil.
81
82
83
84
85
86
87
88
89
1 4 7
10
13
16
19
22
25
28
31
34
37
40
43
46
49
52
55
58
61
64
67
70
73
76
79
82
85
88
91
94
97
10
0
AKURASI SETIAP EPOCH RESNET50
fold1 fold2 fold3 fold4 fold5
31
BAB V
PENUTUP
Pada bab terakhir pada penulisan skripsi ini, berisikan tentang kesimpulan yang
dapat diambil dari penelitian serta saran bagi para peneliti selanjutnya untuk dapat
mengembangkan ilmu pengetahuan dibidang yang terkait pada masa yang akan
datang.
5.1. Kesimpulan
Dari pemaparan hasil penelitian pada bab sebelumnya, dapat disimpulkan
beberapa hal yang mungkin bisa diperhatikan dan ditelaah lebih lanjut yaitu :
1. 4 random graph dan hyperparaeter lain yang digunakan seperti loss function,
activation function dll pada RWNN mampu melakukan klasifikasi gambar sel
darah merah manusia yang terinfeksi p.falciparum ibandingkan dengan pre-
trained model.
2. RWNN dengan hyperparameter yang digunakan penulis mengasilkan training
yang tidak terindikasi overfiting pada klasifikasi gambar sel darah merah
manusia yang terinfeksi p.falciparum, begitu juga untuk pre-trained model
ResNet50.
3. Hasil evaluasi model RWNN pada klasifikasi gambar sel darah merah manusia
yang terinfeksi p.falciparum menunjukkan rata-rata hasil sebesar 95.08% pada
accuracy, 93.62% pada precision, 96.44% pada recall dan 95.05% pada f1-
score. Performa dari Randomly Wired Neural Network dapat mengalahkan
pre-trained model ResNet50 yang arsitekturnya menunjukkan rata-rata hasil
sebesar 89.63% pada accuracy, 80.80% pada precision, 92.12% pada recall dan
89.88% pada f1-score.
32
5.2. Saran
Pada penelitian kali ini, terdapat beberapa hal yang mungkin dapat
dikembangkan dimasa yang akan datang. Oleh sebab itu, penulis ingin memberikan
saran kepada para peneliti selanjutnya yang tertarik untuk melakukan penelitian
dalam bidang yang terkait diantaranya yaitu:
1. Memperhatikan/mendeteksi p.falciparum yang telah diwarnai giemsa pada
sel darah merah yang terinfeksi.
2. Dapat menggunakan data yang berasal dari Indonesia
3. Dapat melakukan perubahan pada arsitektur CNN, loss function, output
unit, optimizer dan regulrization.
34
REFERENSI
[1] M. Kes et al., “Data dan Informasi Profil Kesehatan di Indonesia,” Jakarta.
[2] K. Kesehatan and R. Indonesia, “Laporan Kesehatan Kementrian Kesehatan
2017,” Jakarta.
[3] “The reliability of blood film examination for malaria at the peripheral health
unit.” .
[4] M. Hawkes, J. P. Katsuva, and C. K. Masumbuko, “Use and limitations of
malaria rapid diagnostic testing by Congo,” vol. 8, pp. 1–8, 2009.
[5] G. Díaz, F. A. González, and E. Romero, “A semi-automatic method for
quantification and classification of erythrocytes infected with malaria
parasites in microscopic images,” J. Biomed. Inform., vol. 42, no. 2, pp. 296–
307, 2009.
[6] M. Poostchi, K. Silamut, R. J. Maude, S. Jaeger, and G. Thoma, “Image
analysis and machine learning for detecting malaria,” Transl. Res., vol. 194,
pp. 36–55, 2018.
[7] Y. Lecun, Y. Bengio, and G. Hinton, “Deep learning,” 2015.
[8] S. Rajaraman et al., “Pre-trained convolutional neural networks as feature
extractors toward improved malaria parasite detection in thin blood smear
images,” pp. 1–17, 2018.
[9] S. Xie and F. Ai, “Exploring Randomly Wired Neural Networks for Image
Recognition.”
[10] D. C. Warhurst and J. E. Williams, “Laboratory diagnosis of malaria,” no.
148, pp. 533–538, 1996.
[11] E. Tjitra, S. R. I. Suprianto, M. Dyer, and B. J. Currie, “Field Evaluation of
the ICT Malaria P . f / P . v Immunochromatographic Test for Detection of
Plasmodium falciparum and Plasmodium vivax in Patients with a
Presumptive Clinical Diagnosis of Malaria in Eastern Indonesia,” vol. 37,
no. 8, pp. 2412–2417, 1999.
[12] I. Goodfellow, “Deep Learning.”
[13] A. Textbook, Neural Networks and Deep Learning. yorktown heigths: IBM
T. J. Watson Research Center.
[14] N. Shirish and K. Richard, “Improving Generalization Performance by
Switching from Adam to SGD,” no. 1, 2017.
[15] C. C. Aggarwal, Neural networks and deep learning : a textbook. IBM T. J.
34
Watson Research Center.
[16] D. J. Watts and S. H. Strogatz, “Collective dynamics of ‘small-world’
networks,” vol. 393, no. June, pp. 440–442, 1998.
[17] F. A. Ifdillah, “Representasi graf acak ( Watts and Strogatz model ) pada
Small World Phenomenon : Degrees of Separation,” vol. 1, no. 13514010,
2016.
[18] M. Sokolova, G. L.-I. P. and, and undefined 2009, “A systematic analysis
of performance measures for classification tasks,” www-
rali.iro.umontreal.ca.
[19] S. G. K. Patro and K. K. Sahu, “Normalization: A Preprocessing Stage,”
2015.
[20] T. PoostchiM, SilamutK, MaudeRJ, JaegerS, “Aplikasi androidnya.pdf,”
Transl. Res., vol. 194, pp. 36–55, 2018.
[21] I. Ersoy, F. Bunyak, J. M. Higgins, and K. Palaniappan, “COUPLED EDGE
PROFILE ACTIVE CONTOURS FOR RED BLOOD CELL FLOW
ANALYSIS University of Missouri Columbia Department of Computer
Science Columbia , MO 65201 Department of Systems Biology MGH
Center for Systems Biology , Boston , MA 02114,” pp. 748–751, 2012.
[22] S. B. Kotsiantis, D. Kanellopoulos, and P. E. Pintelas, “Data Preprocessing
for Supervised Leaning,” vol. 1, no. 1, pp. 111–117, 2006.