KLASIFIKASI PARASIT FALCIPARUM

KLASIFIKASI PARASIT FALCIPARUM

PADA SEL DARAH MERAH MANUSIA

MENGGUNAKAN RANDOMLY WIRED NEURAL NETWORK

SKRIPSI

KHARSMA MONARDO

11150940000015

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UIN SYARIF HIDAYATULLAH JAKARTA

2019 M / 1441

i

KLASIFIKASI GAMBAR SEL DARAH MERAH MANUSIA

YANG TERINFEKSI PARASIT FALCIPARUM

MENGGUNAKAN RANDOMLY WIRED NEURAL NETWORK

SKRIPSI

Diajukan kepada

Universitas Islam Negeri Syarif Hidayatullah Jakarta

Fakultas Sains dan Teknologi

Untuk Memenuhi Persyaratan dalam

Memperoleh Gelar Sarjana Matematika (S.Mat)

Oleh :

Kharisma Monardo

11150940000015

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UIN SYARIF HIDAYATULLAH JAKARTA

2019 M / 1441 H

iv

PERSEMBAHAN DAN MOTTO

Segala Puji dan Syukur ku persembahkan kepada Allah Subhanahu Wata’ala.

Seiring shalawat serta salam kepada sang pembangun peradaban manusia, Nabi

Muhammad Shallallahu ‘Alaihi Wassalam.

Persembahan kecil ini saya lantunkan untuk mereka yang senantiasa selalu

mendoakan keberhasilan saya terutama kepada mama dan papa.

Skripsi ini saya persembahkan juga untuk para sahabat dan mereka yang dengan

tulus memberikan doanya kepada saya.

“Hidup itu pilihan, apa yang membuat dirimu sedih tinggalkan dan apa yang buat

mu bahagia pertahankan”

“Ridha Allah tergantung pada ridha orang tua dan murka Allah tergantung pada

murka orang tua.” (Hasan. At-Tirmizi : 1899, HR. al-Hakim : 7249, ath-Thabrani

dalam al-Mu’jam al-Kabiir : 14368, Al-Bazzar : 2394)

“Keadaan tidak akan pernah salah, karena Allah pembuat skenarionya Yang Maha

Benar.”

“Setiap jalan yang tidak sesuai harapan, merupakan sebaik-baik jalan yang Allah

berikan”

v

KATA PENGANTAR

Alhamdulillah, puji syukur kehadirat Allah Subhanahu Wata’ala atas segala

limpahan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan

penyusunan skripsi dengan judul “Klasifikasi Gambar Sel Darah Merah

Manusia Yang Terinfeksi Parasit Falciparum Menggunakan Randomly Wired

Neural Network”. Shalawat serta salam senantiasa tercurah kepada Nabi

Muhammad Sallalahu Alaihi Wassalam, para sahabat, keluarga serta muslimin dan

muslimat. Semoga kita mendapatkan syafaat baginda Rasul kelak diakhirat. Penulis

dapat menyelesaikan skripsi ini karena adanya banyak bimbingan, saran, kerjasama

dan bantuan dari berbagai pihak. Untuk itu, pada kesempatan ini penulis ingin

menyampaikan terima kasih kepada :

1. Prof Dr. Lili Surraya Putri, M.Env.Stud, selaku Dekan Fakultas Sains dan

Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta.

2. Dr. Suma’inna, M. Si , selaku Ketua Program Studi Matematika Fakultas Sains

dan Teknologi UIN Syarif Hidayatullah Jakarta, dan Ibu Irma Fauziah, M.Sc,

selaku Sekretaris Program Studi Matematika Fakultas Sains dan Teknologi UIN

Syarif Hidayatullah Jakarta.

3. Muhaza Liebenlito, M.Si selaku Pembimbing I yang telah memberikan ilmu

pengetahuan, pengarahan, bimbingan dan membantu penulis dalam

menyelesaikan skripsi ini serta memberikan inspirasi dari mulai pemilihan topik

hingga metode penelitian yang digunakan.

vi

4. Dr. Nur Inayah, M.Si selaku Pembimbing II yang telah memberikan ilmu

pengetahuan, pengarahan, bimbingan dan membantu penulis dalam

menyelesaikan skripsi ini.

5. Sanjaya dan Eti Buanawati sebagai orang tua penulis yang telah memberikan

dukungan baik moril ataupun materil untuk penulis.

6. Alvin Refaldi, Arsy Arlina dan Abdul Hamid yang selalu memberikan motivasi

serta dukungan lainnya kepada penulis.

7. Sahabat X yaitu Aulia, Ayu, Ery, Fitria, Hamid, Intan, Khusnul, Shinta, Vika

dan Dino yang selalu memberikan semangat kepada penulis.

8. Seluruh mahasiswa matematika serta seluruh pihak yang telah membantu

penulis dalam penyelesaian skripsi ini.

9. Keluarga Himpunan Mahasiswa yang telah memberikan ilmu, kepercayaan dan

pengalaman yang luar biasa

10. Seluruh pihak yang telah membantu penulis dalam menyelesaikan skripsi yang

tidak dapat disebutkan satu persatu.

Penulis menyadari bahwa masih banyak kesalahan dalam penyusunan skripsi

ini. Oleh sebab itu, penulis sangat menerima kritik dan saran yang bersifat

membangun agar kesalahan yang telah terjadi tidak terulang di masa yang akan

datang. Penulis sangat berharap bahwa skripsi ini dapat bermanfaat bagi banyak

pihak.

ix

ABSTRAK

Kharisma Monardo, Klasifikasi Gambar Sel Darah Merah Manusia Yang

Terinfeksi Parasit Falciparum Menggunakan Randomly Wired Neural Network,

dibawah bimbingan Muhaza Liebenlito, M.Si dan Dr. Nur Inayah, M.Si .

Malaria merupakan salah satu penyakit yang ada di Indonesia yang disebabkan oleh

parasit plasmodium salah satunya adalah parasite falciparum. Parasit ini ditularkan

melalui nyamuk yang menginfeksi sel darah merah manusia. Cara standar dalam

mendianosis malaria adalah dengan menguji sel darah merah dibawah mikroskop

apakah terinfeksi penyakit atau tidak. Pengujian ini dilakukan oleh penguji yang

kompeten, cara tersebut kurang efisien karena hasil ujinya dipengaruhi oleh

pengalaman dan pengetahuan dari pengujinya. Penerapan machine learning untuk

otomatisasi klasifikasi malaria tetap membutuhkan ahli sebagai feature extractor.

Penerapan deep learning pada permasalahan diagnosis malaria dibagi menjadi 3

tahap yaitu segmentation, stagging dan classification. Penelitian kali ini akan

menerapkan salah satu model deep learning yaitu randomly wired neural network

untuk mengklasifkasikan gambar yang terdapat parasite falciparum pada sel darah

merah atau tidak.

Penelitian kali ini menggunakan data sebanyak 27.558 yang dibagi menjadi 5

bagian untuk memprosesnya dengan metode cross-validation. Klasifikasi

menggunakan randomly wired neural network dengan menggunakan 4 random graf

pada arsitekturnya menunjukkan rata-rata hasil sebesar 95.08% pada accuracy,

93.62% pada precision, 96.44% pada recall dan 95.05% pada f1-score. Performa

dari randomly wired neural network dapat mengalahkan pre-trained model

ResNet50 yang arsitekturnya menunjukkan rata-rata hasil sebesar 89.63% pada

accuracy, 80.80% pada precision, 92.12% pada recall dan 89.88% pada f1-score.

Kata Kunci: Deep Learning, Malaria, Parasite Falciparum, Randomly Wired

Neural Network

x

ABSTRACT

Kharisma Monardo, Image Classification of Human Red Blood Cells Infected by

Falciparum Parasites Using Randomly Wired Neural Networks, under the guidance

of Muhaza Liebenlito, M.Si dan Nur Inayah, M.Si.

Malaria is a disease in Indonesia caused by plasmodium parasites, one of which is

falciparum parasite. This parasite is transmitted through mosquitoes that infect

human red blood cells. The standard way to diagnose malaria is testing the red blood

cells under a microscope whether they are infected with the disease or not. This test

is carried out by competent examiner, this method is less efficient because the

results of the test are influenced by the experience and knowledge of the examiner.

The application of machine learning to automate malaria classification still requires

experts as a feature extractor. The application of deep learning in malaria diagnosis

problems is divided into 3 stages, namely segmentation, stagging and classification.

This study will apply one of the deep learning models, namely randomly wired

neural network to classify images that contain parasitic falciparum on red blood

cells or not.

This research uses 27,558 data which is divided into 5 parts to process it using

cross-validation method. Classification using randomly wired neural network using

4 random graphs in the architecture shows an average yield of 95.08% on accuracy,

93.62% on precision, 96.44% on recall and 95.05% on f1-score. The performance

of randomly wired neural networks can beat the pre-trained ResNet50 model whose

architecture shows an average yield of 89.63% in accuracy, 80.80% in precision,

92.12% in recall and 89.88% in f1-score.

Keywords: Deep Learning, Malaria, Parasite Falciparum, Randomly Wired Neural

Network

xi

DAFTAR ISI

PERNYATAAN ................................................................................................................ ii

LEMBAR PENGESAHAN ............................................................................................. iii

PERSEMBAHAN DAN MOTTO .................................................................................. iv

KATA PENGANTAR ....................................................................................................... v

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH

UNTUK KEPENTINGAN AKADEMIS ..................................................................... viii

ABSTRAK ........................................................................................................................ ix

ABSTRACT ....................................................................................................................... x

DAFTAR ISI .................................................................................................................... xi

DAFTAR GAMBAR ...................................................................................................... xiii

BAB I PENDAHULUAN .................................................................................................. 1

1. 1. Latar Belakang ............................................................................................. 1

1. 2. Perumusan Masalah ..................................................................................... 3

1. 3. Tujuan Penelitian ......................................................................................... 4

1. 4. Batasan Masalah ........................................................................................... 4

1. 5. Manfaat Penelitian ....................................................................................... 4

BAB II LANDASAN TEORI ........................................................................................... 5

2. 1. Penyakit Malaria .......................................................................................... 5

2. 2. Feed Forward Neural Network .................................................................... 6

2. 3. Convolutional Neural Network .................................................................... 8

2. 4. Loss Function ............................................................................................. 10

2. 5. Activation Function .................................................................................... 10

2. 6. Optimization ............................................................................................... 11

2. 7. Regularization ............................................................................................ 12

2. 8. Backpropagation ........................................................................................ 12

2.9. Random Graph ............................................................................................ 13

2.10. Evaluasi Model .......................................................................................... 14

2.11. Transformasi Gambar ................................................................................ 15

2.12. Cross-Validation ........................................................................................ 16

xii

BAB III METODELOGI PENELITIAN...................................................................... 18

3. 1. Sumber Data ............................................................................................... 18

3.2. Tahapan Penelitian ..................................................................................... 19

BAB IV HASIL DAN PEMBAHASAN ........................................................................ 25

4. 1. Preprocessing Data .................................................................................... 25

4.2. Membuat Model .......................................................................................... 26

4.3. Training ....................................................................................................... 27

4.4. Testing ......................................................................................................... 30

BAB V PENUTUP .......................................................................................................... 31

5.1. Kesimpulan ................................................................................................ 31

5.2. Saran ........................................................................................................... 32

REFERENSI ................................................................................................................... 33

xiii

DAFTAR GAMBAR

Gambar 1. 1 Annual Parasite Insidence (API) Per 1.000 Penduduk Menurut

Provinsi Tahun 2009-2018 [1][2] ........................................................................... 2

Gambar 2. 1 Feed Forward Neural Network. ........................................................ 7

Gambar 2. 2 Proses Konvolusi. ............................................................................. 9

Gambar 2. 3 Pooling ............................................................................................. 9

Gambar 2. 4 Ilustrasi Cross-Validation. .............................................................. 16

Gambar 3. 1 Sel Darah Merah Yang Terinfeksi P.Falciparum ........................... 18

Gambar 3. 2 Sel Darah Merah Yang Tidak Terinfeksi P.Falciparum ................. 18

Gambar 3. 3 Diagram Alur Penelitian ................................................................. 20

Gambar 4. 2 Hasil Generate Random Graf Watts-Strogatsz. .............................. 26

Gambar 4. 3 Arsitektur RWNN untuk Klasifikasi Gambar Sel Darah Merah

Manusia yang Terinfeksi P.Falciparum. ............................................................... 27

Gambar 4. 4 Loss Setiap Epoch Model RWNN. ................................................. 28

Gambar 4. 5 Akurasi Setiap Epoch Model RWNN. ........................................... 28

Gambar 4. 6 Loss Setiap Epoch Model Resnet50 ............................................... 29

Gambar 4. 7 Akurasi Setiap Epoch Model Resnet50 .......................................... 30

1

BAB I

PENDAHULUAN

1. 1. Latar Belakang

Pada ayat Al-Qur’an surah Al-Anbiya ayat 83-84 yang menurut kementrian

agama Republik Indonesia terkait ayat-ayat Al-Qur’an tersebut memiliki arti“Dan

(ingatlah kisah) Ayub, ketika dia berdoa kepada Tuhannya, ‘(Ya Tuhanku),

sungguh, aku telah ditimpa penyakit, padahal Engkau Tuhan Yang Maha

Penyayang dari semua yang penyayang’.” (QS. Al-Anbiya’ : 83), “Maka Kami

kabulkan (doa) nya, lalu Kami lenyapkan penyakit yang ada padanya dan Kami

kembalikan keluarganya kepadanya, dan (Kami lipat gandakan jumlah mereka)

sebagai suatu rahmat dari Kami, dan untuk menjadi peringatan bagi semua yang

menyembah Allah.” (QS. al-Anbiya’ : 84). Berdasarkan ayat diatas yang

menceritakan kisah kaum Nabi Ayub ‘alaihissalam dengan ujian berupa penyakit,

harapannya manusia dapat menjadikan kisah tersebut sebagai peringatan bahwa

siapapun dapat mengalami ujian berupa penyakit. Upaya dalam melalui ujian

tersebut, manusia dapat melakukan dua cara yaitu berdoa dan ikhtiar. Salah satu

bentuk ikhtiar manusia dalam melalui ujian berupa penyakit yaitu dengan melalui

dokter yang mengerti penyakit tersebut dan telah mempelajari cara penanganannya.

Begitupun upaya penyembuhan pada penyakit malaria, dimana dokter harus

melakukan diagnosa terlebih dahulu apakah pasien terinfeksi penyakit atau tidak

untuk memutuskan tindakan yang harus segera dilakukan.

Penyakit malaria merupakan penyakit yang dapat menyerang semua golongan

baik itu laki-laki atau perempuan baik dari umur bayi hingga dewasa. Penyakit

malaria ini disebabkan oleh infeksi parasit plasmodium yang hidup dan berkembang

biak pada sel darah merah manusia.

Sesuai dengan Keputusan Menteri Kesehatan RI Nomor

293/Menkes/SK/IV/2009 tanggal 28 April 2009 tentang “Eliminasi Malaria di

Indonesia” dan Surat Edaran Menteri Dalam Negeri kepada seluruh gubernur dan

bupati/walikota Nomor 443.41/465/SJ tanggal 8 Februari 2010 tentang “Pedoman

2

Pelaksanaan Program Eliminasi Malaria di Indonesia yang harus dicapai secara

bertahap mulai dari tahun 2010 sampai seluruh wilayah Indonesia bebas malaria

selambat-lambatnya tahun 2030”, maka program malaria di Indonesia bertujuan

untuk mencapai eliminasi. Perkembangan dari program malaria tersebut terlihat

pada Gambar 1.1. Pada Gambar 1.1 dapat dilihat bahwa jumlah API (Annua

Paracite Independence) / angka kesakitan per 1.000 penduduk mengalami

penurunan sejak tahun 2010 hingga tahun 2015, namun pada tahun 2016 hingga

tahun 2017 API Malaria mengalami kenaikan. Data terakhir pada tahun 2018

mennjukkan penurunan yang signifikan, namun tidak menutup kemungkinan

bahwa pada tahun selanjutnya akan terus menurun. Sehingga pihak terkait harus

selalu waspada terhadap penyakit malaria.

Gambar 1. 1 Annual Parasite Insidence (API) Per 1.000 Penduduk Menurut

Provinsi Tahun 2009-2018 [1][2].

Di Indonesia penyakit malaria ditangani dengan pengobatan ACT (Artemisinin-

Based Combination Therapy) dengan dua cara mendiagnosis yaitu pemeriksaan

mikroskopik dan rapid diagnostic test kedua cara diagnosis tersebut masing-masing

memiliki kelemahan. Hasil dari pemeriksaan mikroskopik dipengaruhi oleh

keahlian dari pemeriksanya baik itu dari pengetahuan maupun pengalaman [3].

Cara kedua yaitu rapid diagnostic test namun setelah melakukan rapid diagnostic

test hasilnya disarankan melakukan pemeriksaan mikroskopik untuk

mengkonfirmasi hasilnya [4].

Proses otomatisasi klasifikasi malaria sudah dilakukan oleh beberapa

peneliti, yaitu dengan menganalisa gambar perangkat lunak computer-aided

0

0.5

1

1.5

2

2.5

2009 2010 2011 2012 2012 2014 2015 2016 2017 2018

Annual Parasite Insidence (API) Malaria Per-1000 Penduduk

Menurut Provinsi Tahun 2009-2018

3

detection (CADx ) menggunakan traditional Machine Learning (ML) seperti

Support Vector Machine (SVM). Pada tahun 2009, pengaplikasian SVM untuk

mendeteksi sel darah merah yang terinfeksi [5]. Namun untuk membuat keputusan

memerlukan feature extraction sebelum mengolahnya dengan metode ML[6]. Pada

proses feature extraction ini yaitu menganalisa variable-variabel dalam gambar

seperti ukuran, background, angel dan posisi dari region of interest dan semua itu

memerlukan keahlian baik itu pengetahuan atau pengalaman. Sedangkan deep

learning (DL) mampu melakukan proses feature extraction dengan keberhasilan

yang signifikan [7]. Tahun 2018 pengaplikasian DL yaitu melaluti pre-trained

model untuk mendeteksi sel darah yang terinfeksi [8].

Pada penelitian kali ini penulis akan menggunakan Randomly Wired Neural

Network (RWNN) sebagai arsitektur modelnya. Dimana RWNN ini berhasil

mengalahkan pre-trained model di permasalahan image recognition pada ImageNet

[9]. Penulis berharap arsitektur ini sesuai untuk permasalahan Klasifikasi Gambar

Sel Darah Merah Manusia Yang Terinfeksi Parasit Falciparum (P.Falciparum) dn

untuk lebih meykinkn bhw RWNN sesuai untuk permasalahan Klasifikasi Gambar

Sel Darah Merah Manusia Yang Terinfeksi P.Falciparum model tersebut akan

dibandinkan dengan pre-trained model yaitu ResNet50.

1. 2. Perumusan Masalah

Berdasarkan latar belakang di atas, maka didapatkan perumusan masalah

sebagai berikut:

1. Bagaimana hasil implementasi RWNN jika di bandingkan dengan

ResNet50 untuk klasifikasi gambar sel darah merah manusia yang terinfeksi

P.Falciparum?

2. Bagaimana hasil training model RWNN jika di bandingkan dengan

ResNet50 pada permasalahan klasifikasi gambar sel darah merah manusia

yang terinfeksi P.Falciparum?

3. Bagaimana hasil evaluasi testing (Akurasi, Precision dan Recall) dari

RWNN jika di bandingkan dengan ResNet50 pada permasalahan klasifikasi

gambar sel darah merah manusia yang terinfeksi P.Falciparum?

4

1. 3. Tujuan Penelitian

Tujuan yang ingin dicapai dalam penelitian ini adalah sebagai berikut:

1. Mengimplementasikan RWNN dan membandingkan dengan ResNet50

untuk klasifikasi gambar sel darah merah manusia yang terinfeksi

P.Falciparum

2. Mengetahui hasil training model RWNN dan membandingkan dengan

ResNet50 pada permasalahan klasifikasi gambar sel darah merah manusia

yang terinfeksi P.Falciparum

3. Mengetahui hasil evaluasi testing (Akurasi, Precision dan Recall) dari

RWNN dan membandingkan dengan ResNet50 pada permasalahan

klasifikasi gambar sel darah merah manusia yang terinfeksi P.Falciparum

1. 4. Batasan Masalah

Agar pembahasan tidak menyimpang dari apa yang telah ditetapkan, maka

dibuat pembatasan masalah sebagai berikut :

1. Parasit yang dideteksi hanyalah parasite P.falciparum yang diwarnai giemsa

2. Data yang digunakan merupakan data sel darah merah manusia dari

National Library of Medicine (NLM) yang didapat di rumah sakit Medical

College Chittagong, Bangladesh

3. Model DL yang digunakan adalah RWNN

4. Arsitektur model RWNN yang digunakan menggunakan 4 random graf

5. Hyperparameter yang digunakan yaitu learning rate sebesar 0,0001 dan

batch size sebesar 8.

1. 5. Manfaat Penelitian

Melalui penelitian ini diharapkan dapat menjadi acuan untuk penelitian atau

pengembangan dalam diagnosis penyakit malaria di seluruh dunia terutama di

Indonesia. Instansi terkait diharapkan dapat melakukan pencegahan penyakit

malaria jika menerapkan penelitian ini atau pengembangannya dalam bidang

bioteknologi.

5

BAB II

LANDASAN TEORI

Bab ini akan membahas penjelasan tentan metode yang berkaitan satu sama

lain serta pendekatan dengan penelitian yang akan dilakukan pada skripsi ini.

Adapun teori-teori dalam bab ini meliputi pengetahuan tentang penyakit malaria,

beberapa metode yang berkaitan dan beberapa istilah lainnya yang digunakan

dalam penelitian.

2. 1. Penyakit Malaria

Penyakit malaria merupakan penyakit yang dapat menyerang semua golongan

baik itu laki-laki atau perempuan baik dari umur bayi hingga dewasa. Dimana

penyakit malaria ini disebabkan oleh infeksi parasite plasmodium yang hidup dan

berkembangbiak pada sel darah merah manusia. Menurut Kamus Besar Bahasa

Indonesia (KBBI), malaria adalah penyakit infeksi yang banyak dijumpai di daerah

tropis yang disertai gejala demam fluktuasi suhu secara teratur dan ditularkan oleh

nyamuk anopheles. Menurut WHO (World Health Organization) malaria adalah

penyakit yang disebabkan oleh parasit pasodium, parasit menyebar ke manusia

melalui gigitan nyamuk anofeles betina. Terdapat 5 spesies parasit yang

menyebabkan malaria, dan 2 dari 5 itu merupakan ancaman terbesar yaitu

P.Falciparum dan P.Vivax.

Pada tahun 1996, penelitian terkait Klasifikasi penyakit malaira di dunia sudah

mulai terlihat[10], di Indonesia penelitian terkait klasifikasi penyakit malaria

dimulai tahun 1999 dengan mendeteksi P.Falciparum dan P.Vivax pada pasien yang

mendudukin daerah timur Indonesia[11]. Pada Indonesia penelitian-penelitian

tentang diagnosis penyakit malaria masih dilakukan salah satunya oleh lembaga

Eijkman yang merupakan lembaga pemerintah terpercaya dalam melakukan

penelitian terhadap penyakit malaria.

6

2. 2. Feed Forward Neural Network

Sebelum mengetahui RWNN dan convolutional neural network alangkah lebih

baik jika kita mengetahui terlebih dahulu mengenali feed forward neural network.

Feed forward neural network merupakan model DL klasik yang mempunyai tujuan

mengaproksimasi nilai fungsi f*. Contoh misalkan kita mempunyai fungsi

klasifikasi 𝑦 = 𝑓∗(𝑥) yang memetakan input 𝑥 pada kategori 𝑦, model ini

memetakan �̂� = 𝑓∗(𝑥; 𝜃) dan belajar melalui parameter 𝜃 untuk menghasilkan

aproksimasi fungsi yang terbaik [12]. Feed forward neural network ini terdiri dari

beberapa layer perceptron dimana masing-masing perceptronnya mempunyai

weight dan bias yang dapat di optimasi melalui training untuk menyesuaikan pada

suatu permasalahan. Ilustrasi untuk feed forward neural network dapat dilihat pada

Gambar 2.1.

Perceptron pada setiap layernya menggunakan persamaan dibawah untuk

mnghitung outputnya.

𝑦 = 𝑓 (∑ 𝑖𝑖𝑤𝑖 + 𝑏

𝑛

𝑖=1

) ( 1 )

Dimana :

𝑦 : output perceptron

𝑤𝑖 : weight input i

𝑏 : bias perceptron

𝑓 : activation function

Parameter yang optimal diperoleh dengan mengoptimasi fungsi kesalahan supaya

mencapai kesalahan yang terkecil, jadi untuk mendapatkan parameter yang optimal

feed forward neural network membutuhkan fungsi kesalahan, Teknik optimasi dan

memerlukan waktu untuk belajar dengan meminimalkan kesalahan.

7

Gambar 2. 1 Feed Forward Neural Network.

𝑙 = ∑ 𝑖𝑖𝑤𝑖 + 𝑏

𝑛

𝑖=1

𝑓(𝑙)

8

2. 3. Convolutional Neural Network

Convolutional Neural Network (CNN) merupakan salah satu variasi dari feed

forward neural network yang terinspirasi oleh pemahaman Hubel dan Weasel

melalui cara kerja korteks visual kucing. Korteks visual ini memiliki daerah kecil

yang terdiri dari beberapa sel yang peka terhadap daerah tertentu di bidang visual.

Sel-sel didalam korteks visual tersebut aktif hanya pada bentuk dan orientasi objek

tertentu pada bidang visual.

Sistem kerja ini menjadi dasar bagaimana salah satu jenis arsitektur feed

forward neural network yaitu CNN dibuat, pada CNN memiliki struktur dasar yang

nyaris serupa dengan feed forward neural network pada umumnya, seperti input

layer, hidden layer hingga output[13], jadi CNN adalah feed forward neural

network yang menggunakan perhitungan konvolusi terhadap setiap matriks pada

setidaknya 1 dari layer pada network-nya [12].

Misalkan input pada layer ke 𝑞 memiliki ukuran dimensi (𝐿𝑞 𝑥 𝐵𝑞𝑥 𝑑𝑞) dimana

secara berturut-turut merupakan panjang, lebar dan kedalaman input. Filter 𝑝 pada

layer 𝑞 adalah parameter yang di notasikan sebagai tensor 3 dimensi 𝑊(𝑝,𝑞) =

[𝑤𝑖𝑗𝑘(𝑝,𝑞)

]. Index 𝑖,𝑗 dan 𝑘 menyatakan posisi sepanjang tinggi, lebar dan kedalaman.

Ukuran dimensi pada filter tersebut adalah (𝐹𝑞 𝑥 𝐹𝑞 𝑥 𝑑𝑞). Feature maps pada layer

ke-𝑞 direpresentasikan dengan tensor 3 dimensi 𝐻(𝑞) = [ℎ𝑖𝑗𝑘(𝑞)

] ,saat 𝑞 = 1 maka

𝐻(1) merepresentasikan sebagai layer input [13]. Berikut adalah persamaan

matematis proses konvolusi pada layer ke-𝑞.

ℎ𝑖𝑗𝑝(𝑞+1)

= ∑ ∑ ∑ 𝑤𝑟𝑠𝑘(𝑝,𝑞)

ℎ𝑖+𝑟−1,𝑗+𝑠−1,𝑘(𝑞)

𝑑𝑞

𝑘=1

𝐹𝑞

𝑠=1

𝐹𝑞

𝑟=1

( 2 )

∀𝑖 ∈ {1 … ,𝐿𝑞 − 𝐹𝑞

𝑆+ 1}

∀𝑗 ∈ {1 … ,𝐵𝑞 − 𝐹𝑞

𝑆+ 1}

∀𝑝 ∈ {1 … , 𝑑𝑞+1}

9

Gambar 2. 2 Proses Konvolusi.

Proses konvolusi memiliki beberapa parameter yang dapat diubah yaitu stride

dan padding. Stride adalah pergeseran matriks kernel pada matriks input layernya,

sementara padding adalah menambahkan suatu nilai pada sisi luar matriks input

layernya. Contoh proses konvolusi dapat dilihat pada Gambar 2.2.

CNN tidak luput dari proses pooling yang biasanya dilakukan setelah proses

konvolusi dimana pooling bekerja dengan memilih 1 diantara beberapa nilai yang

ditentukan banyaknya dengan kriteria tertentu, secara ilustrasi pooling dapat dilihat

pada Gambar 2.4.

Gambar 2. 3 Pooling.

10

2. 4. Loss Function

Fungsi yang menunjukkan seberapa buruk model yang dibentuk merupakan

definisi dari Loss Function. Pemilihan loss function bergantung pada pemilihan

activation function dan output layer suatu network. Pada ouput yang berupa

bilangan asli biasanya menggunakan activation function softmax dan loss function

cross-entropy, sedangkan pada ouput berupa bilangan real biasanya menggunkan

activation function linear dan loss function squred error. Pada penelitian kali ini

output yang dihasilkan akan berupa bilangan asli sehingga akan mengunakan loss

function Cross Entropy Loss yang mempunyai rumus:

𝐿 = −1

𝑁(∑ 𝑦𝑖log (ŷ𝑖)

𝑁

𝑖=1

) ( 3 )

dimana:

N = banyaknya kelas yang diklasifikasikan

𝑦𝑖 = kelas yang sesungguhnya

ŷ𝑖 = hasil predisi dari model (berupa peluang).

2. 5. Activation Function

Fungsi yang digunakan untuk menghitung output pada sebuah layer sebuah

network merupakan definisi dari Activation function. Seperti yang dijelaskan pada

subab sebelumnya bahwa activation fuction dan loss function saling berhubungan.

Namun pada penlititan kali ini tidak mengunakan activation function sofmax pada

output nodenya, karena pada modul yang kita gunakan pada penelitian kali ini

sebelum masuk loss function cross-entropy modul akan menjalankan activation

fuction softmax. Jadi jika kita menerapkan activation function sotmax lagi makan

program akan melakukan 2 kali activation function sofmax. Berikut beberapa

output unit yang digunakan pada penelitian kali ini:

11

2.5.1. ReLU

ReLU adalah suatu fungsi linear namun memiliki batas bawah yang secara

umum batasnya adalah 0. ReLU akan digunakan pada penelitian kali ini pada setiap

simpul yang akan dibuat nantinya. secara matematis ReLU dapat di tulis menjadi:

𝑓(𝑥) = {𝑥, 𝑥 > 00 , 𝑥 ≤ 0

( 4 )

2.5.2. Sigmoid

Fungsi aktivasi sigmoid biasa disebut sebagai fungsi penghalus, karena hasil

dari fungsi ini terlihat halus. Karena fungsi ini akan selalu bernilai postif maka

sigmoid pada penelitian kali ini akan untuk menjumlahkan input pada suatu simpul

sebelum melakukan transformasi didalam simpul. Fungsi ini mempunyai rumus:

𝑓(𝑥) = 1

1 + 𝑒−𝑥 ( 5 )

2. 6. Optimization

Algoritma yang digunakan untuk mengoptimalkan parameter agar model yang

dilatih dapat mengaproksimasi dengan baik merupakan definisi dari optimisasi.

Pada penelitian kali ini optimisasi yang digunakan adalah SGD (stochastic gradien

descent) pemilihan optimisasi SGD adalah berdasarkan Nitish Shirish Keskar dkk

yang telah meneliti bahwa SGD lebih stabil dari ADAM [14]. Optimisasi SGD ini

mempunyai cara kerja sebagai berikut:

𝜃 = 𝜃 − 𝜇. ∇𝐿(𝜃) ( 6 )

dimana :

𝜃 = parameter yang ingin dioptimalkan (weight, bias)

𝜇 = Learning Rate

𝐿 = Loss function

∇ = operasi turunan fungsi.

Pengoptimalan ini dilakukan pada setiap epoch hingga mencapai nilai yang optimal

atau nilai dari Loss Function yang minimum.

12

2. 7. Regularization

Regularization adalah cara bagaimana agar model yang kita train mempuyai

performa yang baik selain pada data train [12], dengan kata lain mencegah model

kita untuk overfit. Banyak strategi yang digunakan untuk mengatasi hal ini namun

pada penelitian kali ini peneliti menggunakan cara BatchNorm (BN). Secara umum

BN dapat dijelaskan dengan melakukan standarisasi gaussian yang bertujuan agar

tidak ada output dari suatu node yang mempunyai jarak yang berbeda terlalu jauh.

Perbedaan jarak nilai dari suatu ouput node dapat berakibat pada saat melakukan

optimization, dimana BN mempunyai algoritma sebagai berikut:

𝜇𝛽 ←1

𝑚∑ 𝑥𝑖

𝑚

𝑖=1

( 7 )

𝜎𝛽2 ←

1

𝑚∑(𝑥𝑖 − 𝜇𝛽)

2𝑚

𝑖=1

( 8 )

�̂�𝑖 ←𝑥𝑖 − 𝜇𝛽

√𝜎𝛽2

( 9 )

2. 8. Backpropagation

Algoritma yang digunakan untuk meminimumkan fungsi loss adalah Algoritma

Backpropagation. Algoritma backpropagation terdiri dari beberapa algoritma,

dimana salah satunya adalah stochastic gradient descent (SGD). SGD merupakan

suatu metode optimasi yang berbasis gradient. Backpropagation terdiri dari 2 fase

yaitu forward phase dan backward phase [15].

a. Forward phase: Didalam forward phase, input digunakan untuk menghitung

nilai dari setiap hidden layer berdasarkan nilai weight (w) dan bias (b) yang ada.

Tujuan dari forward phase adalah untuk menghitung seluruh output dari hidden

layer hingga ouput layer berdasarkan dari input yang diberikan. Setelah

13

perhitungan selesai dihitunglah loss function (𝐿) berdasarkan nilai output layer

kemudian hitung gradient-nya berdasarkan nilai ouput layer [15].

b. Backward phase: Didalam backward phase perhitungan gradient dari L

berdasarkan berbagai w dan b dilakukan. Pada tahapan ini gradient dihitung

dengan turunan parsial secara mundur, yakni gradient dihitung dari 𝐿 hingga

input layer dengan memperhatikan 𝑤 dan 𝑏 pada layer tersebut. Setelah itu

gunakan nilai gradient dari fungsi loss terhadap w atau b dan dioptimasi

menggunakan SGD [15].

Proses stochastic gradient descent (SGD) digunakan untuk memperbarui nilai

parameter yang akan dioptimasi yaitu 𝜃 (weight dan bias), dimana learning rate

(𝛼) adalah ukuran langkah untuk mencapat titik minimum dibawah ini merupakan

persamaan untuk mengoptimasi parameter dengan SGD menggunakan persamaan

(6). Proses backpropagation yang terdiri dari forward phase dan backward phase

yang dilakukan 1 kali pada seluruh data merupakan siklus dari 1 epoch.

2.9. Random Graph

Kumpulan simpul bersama dengan sisi, dimana setiap sisi menghubungkan

dua buah simpul merupakan defisini dari Graph. Random graph adalah graf dimana

simpul dan sisinya diciptakan dengan suatu proses yang acak atau random. Random

graph dapat dideskripsikan oleh peluang distrbusi atau hanya oleh suatu proses

random. Pada penelitian kali ini penulis menggunakan model random graph Watts-

Strogatz.

2.9.1. Watts-Strogatz

Random Graph Watts-Strogatz didefinisikan dengan membuat small-word graph.

Small-world graph merupakan graf yang sebagian besar simpulnya dapat dicapai

ke simpul lain dengan sejumlah kecil langkah [16]. Parameter yang dapat di atur

yaitu banyaknya simpul, peluang simpul pada graf bertetangga dan maksimum

simpul pada graf bertetangga. Cara pembuatan Random Graph Watts-Strogatz yaitu

dengan algoritma sebagai berikut [17]:

14

a. Bentuk cincin kisi (lattice) regular dengan N buah simpul yang masing-masing

terhubung dengan 2𝑚 buah tetangga (m buah pada masing-masing sisi).

b. Setiap simpul 𝑛𝑖 = 𝑛1 ⋯ 𝑛𝑁 ambil busur (𝑛𝑖, 𝑛𝑗) dengan 𝑖 < 𝑗, dan hubungkan

kembali dengan peluang P. Proses menghubungkan kembali dilakukan dengan

menggantikan (𝑛𝑖, 𝑛𝑗) dengan (𝑛𝑝, 𝑛𝑞) dimana 𝑝, 𝑞 dipilih dengan peluang

yang sama untuk semua kemungkinan nilai untuk menghindari self-loops dan

koneksi yang terduplikasi (𝑝 = 𝑖 atau 𝑞 = 𝑗 diperbolehkan namun tidak boleh

keduanya bersamaan).

2.10. Evaluasi Model

Melakukan evaluasi dalam kinerja sistem klasifikasi merupakan hal yang

penting untuk menggambarkan seberapa baik sistem dalam mengkalsifikasikan

data. Terdapat banyak evaluasi yang dapat di gunakan pada suatu penelitian namun

pada penelitian kali ini penulis menggunakan salah satunya adalah Confusion

Matrix. Penulis menggunakan evaluasi confusion matrix karena pada penelitian kali

ini membutuhkan evaluasi recall yang didapat dari hasil confusion matrix. Cara

kerjanya yakni membandingkan hasil klasifikasi yang dilakukan oleh sistem

dengan hasil klasifikas yang seharusnya.

Terdapat 4 istilah dalam pengukuran kinerja menggunakan Confusion

Matrix, sebagai representasi hasil proses klasifikasi yakni, True Positive (TP), True

Negative (TN), False Positive (FP), False Negative (FN), pada klasifikasi binary

confusion matrix disajikan dalam Tabel 2.1 [18]:

Tabel 2. 1 Confusion Matrix Klasifikasi Binary

Kelas Terklasifikasi Positif Terklasifikasi Negatif

Positif TP (True Positive) FN (False Negative)

Negatif FP (False Positive) TN (True Negative)

Berdasarkan Tabel 2.1 diatas dapat diperoleh nilai akurasi, presisi, dan

recall. Tabel 2.2 menyajikan langkah-langkah yang digunakan untuk klasifikasi

binary berdasarkan berdasarkan confusion matrix.

15

Tabel 2. 2 Ukuran Untuk Klasifikasi Binary

Ukuran Formula Fokus Evaluasi

Akurasi 𝑡𝑝 + 𝑡𝑛

𝑡𝑝 + 𝑓𝑛 + 𝑓𝑝 + 𝑡𝑛

Efektifitas keseluruhan

dari sebuah classifier.

Presisi 𝑡𝑝

𝑡𝑝 + 𝑓𝑝

Efektifitas classifier

untuk memprediksi kelas

positif

Recall 𝑡𝑝

𝑡𝑝 + 𝑓𝑛

Efektifitas classifier

untuk mengidentifikasi

label positif.

2.11. Transformasi Gambar

Transformasi menurut KBBI adalah perubahan rupa (bentuk,sifat, fungsi

dan sebagainya), dengan kata lain transformasi gambar adalah perubahan rupa dari

gambar baik itu perubahan bentuk, sifat maupun fungsi.

Fill Image adalah proses transformasi gambar yang mengubah gambar

menjadi kotak atau mempunyai panjang dan lebar yang sama dengan menyiapkan

bidang polos yang berbentuk persegi lalu menempelkan objek kita diatas bidang

itu, dengan lebar dari bidang itu adalah Panjang dari objeknya

Normalisasi merupakan salah satu transformasi gambar yang mengubah

nilai dari setiap pixel yang terdapat pada gambar dengan tujuan minimumkan jarak

antara nilai maksimal dan nilai minimum dari pixel yang terdapat pada gambar

namun tidak menghilangkan informasi yang terdapat pada gambar. Proses

pengubahan nilai pixel gambar dengan normalisasi dihitung pada setiap channel-

nya dengan menggunakan Z-Score parameter [19] :

𝑁𝑜𝑟𝑚𝑎𝑙𝑖𝑧𝑒 = 𝑛𝑖𝑙𝑎𝑖 𝑎𝑤𝑎𝑙 − 𝑚𝑒𝑎𝑛

√𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒

( 10 )

16

Resize adalah proses transformasi gambar yang mengubah ukuran gambar

menjadi yang kita inginkan.

Selain fill image, normalize dan resize masih banyak lagi transformasi gambar

yang dapat dilakukan, namun pada penelitian kali ini hanya akan menggunakan

ketiga transformasi tersebut.

2.12. Cross-Validation

Cross-Validation adalah metode statistik untuk mengevaluasi dan

membandingkan algoritma pembelajaran dengan membagi data menjadi dua

segmen: satu digunakan untuk belajar atau melatih model dan yang lainnya

digunakan untuk memvalidasi model. Dalam Cross-Validation, pelatihan dan

validasi set harus menyeberang di putaran berturut-turut sehingga setiap titik data

memiliki kesempatan untuk menjadi data validasi. Bentuk dasar dari Cross-

Validation adalah k-fold Cross-Validation. Bentuk lain dari Cross-Validation

adalah kasus khusus dari k-fold Cross-Validation atau melibatkan pengulangan

Cross-Validation k-fold.

Gambar 2. 4 Ilustrasi Cross-Validation.

17

Pada k-fold Cross-Validation, data dipartisi menjadi k sama besar (atau hampir

sama) ukuran segmen atau fold contohnya dapat dilihat pada Gambar 2.4.

Selanjutnya k iterasi pelatihan dan validasi dilakukan sedemikian rupa sehingga

dalam setiap iterasi lipatan data yang berbeda ditahan-Out untuk validasi sementara

lipatan k − 1 yang tersisa digunakan untuk belajar.

18

BAB III

METODOLOGI PENELITIAN

Beberapa penelitian pengklasifikasian gambar dilakukan oleh para peneliti

dengan berbagai tahapan untuk mendapatkan hasil pengklasifikasian terbaik seperti

pada penelitian [6] dan [8]. Proses lebih jelasnya pada bab ini akan dipaparkan

mulai dari sumber data dan tahapan penelitian yang dipilih penulis atas berbagai

pertimbangan permasalahan yang dihadapi.

3. 1. Sumber Data

Data yang digunakan dalam penilitian kali ini adalah data sekunder yang di

ambil di dokumentasi NLM [8]. Data tersebut diambil dari aplikasi android yang

dikembangkan oleh peneliti di Lister Hill National Center for Biomedical

Communications (LHNCBC) yang merupakan bagian dari NLM [20], aplikasi ini

berguna untuk mengurangi beban bagi orang yang mendiagnostik di daerah terbatas

sumber daya dan meningkatkan akurasi diagnostik. Aplikasi ini mengambil sel

darah tipis yang di warnai Giemsa dari 150 pasien yang terinfeksi P.falciparum dan

50 pasien sehat di rumah sakit Medical College Chittagong, Bangladesh. Gambar

sel yang diperoleh diidentifikasi secara manual oleh pembaca sel darah yang ahli di

unit penelitian obat tropis Mahidol-Oxford di Bangkok. Gambar yang tidak bisa

diidentifikasikan kemudian diarsipkan di NLM (IRB#12972). Tahap terakhir

adalah menerapkan algoritma berbasis level-set untuk mendeteksi dan

mensegmentasi sel darah merah[21]. Contoh data yang akan di gunakan dalam

penelitian kali ini dapat dlihat pada Gambar 3.1 dan Gambar 3.2.

Gambar 3. 1 Sel Darah Merah Yang

Terinfeksi P.Falciparum

Gambar 3. 2 Sel Darah Merah Yang

Tidak Terinfeksi P.Falciparum

19

3.2. Tahapan Penelitian

Pada sub bab tahapan penelitian ini berisikan tentang tahapan-tahapan yang

dilakukan atau metode yang digunakan mulai dari mempersiapkan data, membuat

model sampai dengan evaluasi serta interpretasi hasil penelitian sehingga dapat

disimpulkan suatu hal yang bermanfaat. Pada skripsi ini penulis menggunakan

aplikasi python versi 3.6.1 dengan bantuan beberapa modul diantaranya seperti

numpy, matplotlib, torch. Numpy digunakan untuk membuat bilangan random saat

proses pembagian data menjadi data latih, data validasi, dan data tes. Numpy juga

digunakan untuk menghitung rata-rata dan variansi pada proses normalisasi

gambar. Matplotlib digunakan untuk menampilkan plot hasil training model. Torch

digunakan untuk memuat data yang terdapat pada folder agar di olah oleh python

dan untuk mentransforasi gambar agar gambar mudah untuk diolah, serta

digunakan untuk membuat model RWNN. Proses penelitian yang dilakukan dapat

dilihat pada Gambar 3.3.

20

Gambar 3. 3 Diagram Alur Penelitian

21

3.2.1. Preprocessing

Sebelum mengolah data gambar sebaiknya dilakukan beberapa proses persiapan

yang memudahkan pengolahan gambarnya, dimana proses itu dikenal dengan

preprocessing data. Preprocessing data terdiri dari berbagai macam perlakuan

sesuai dengan kebutuhan penelitian. Pada penelitian kali ini preprocessing yang

digunakan adalah transformasi gambar. Pada peneilitian kali ini transformasi yang

digunakan adalah Fill Image, Normalize, dan Resize.

Penelitian ini dilakukan fill image karena dalam melakukan diagnosis suatu

sel darah terinfeksi atau tidak salah satunya dengan memperhatikan rasio

p.falciparum yang telah diwarnai giemsa sebelumnya. Jadi jika kita melakukan fill

image pada data, data akan mempunyai rasio seperti data awal ketika kita lakukan

resize dengan rasio persegi. S. B. Kotsiantis dkk menyarankan melakukan data

normalization dengan menggunakan persamaan (7) pada permasalahan supervised

learning terutama ketika kita menggunakan model neural network atau k-Nearest

Neighbouthood [22]. Dan resize menjadi ukuran 64 × 64 dilakukan agar proses

training tidak memerlukan biaya yang terlalu besar.

3.2.2. Model

Setelah data siap diolah, selanjutnya pembentukan model RWNN meliputi

menentukan jumlah random graph yang digunakan, penentuan arsitektur dari model

yang akan digunakan penulis mengacu pada penelitian sebelumnya [9] hanya agak

sedikit dimodifikasi. Berikut beberapa hyperparameter yang perlu di tentukan

sebelum melatih model.

Loss function yang digunakan pada penelitian kali ini adalah Cross Entropy

menggunakan persamaan (3) dengan output unit masing-masing adalah Linear.

Pemilihan output unit sangat dipengaruhi oleh Loss Function yang digunakan,

karena beberapa literature menunjukkan bahwa Cross Entropy merupakan

gabungan dari Negative Likelihood dengan Log dari Softmax jadi output unit tidak

perlu menggunakan Softmax lagi.

22

Optimasi yang dilakukan pada penelitian kali ini penulis menggunakan SGD

seperti persamaan (6) dimana kelebihannya dibanding optimasi yang lain adalah

kestabilannya yang konsisten (tergantung learning rate yang digunakan) meskipun

kelemahanya model akan belajar lebih lama. Selanjutnya untuk mencegah model

yang kita latih itu overfit penulis melakukan batchnorm yang menggunakan

persamaan (7), (8) dan (9) pada setiap simpul pada graph yang ada pada model yang

menormalisasikan setiap output-nya.

Arsitektur model pada penelitian kali ini penulis menggunakan RWNN.

Dimana RWNN adalah suatu model yang menggunakan graf sebagai arsitektur

neural network-nya. Dimana pada setiap garis graphnya melakukan perpindahan

data dari simpul ke simpul lain dan pada setiap simpulnya melakukan operasi [9] :

Aggregation : data yang masuk (dari 1 garis atau lebih) ke simpul di

kombinasikan melalui weighted sum (menggunakan activation function

sigmoid seperti persamaan (5)) bobotnya dapat di optimalkan dan positif.

Transformation : setelah data melalui persetujuan (aggregated) data dilakukan

proses transformasi yang didefinisikan sebagai ReLU (persamaan (4)) -

convolution (persamaan(2)) – BatchNorm (persamaan (7), (8) dan (9)) triplet.

Operasi ini dilakukan di setiap simpul.

Distribution : data setelah di transformasi di duplikasi dan dikirim ke setiap

garis output-nya

Peneliti menggunakan arsitektur dari penelitian sebelumnya yang sudah

melakukan eksperimen pada beberapa jumlah graf yang digunakan dan

membendingkannya dengan pre-trained model [9]. Spesifikasi arsitektur yang di

gunakan pada penlitian kali ini yaitu terdiri dari 1 layer convolutional layer, 4

RWNN, dan 1 fully connected layer. Arsitekturnya dapat dilihat pada Tabel 3.1.

Tabel 3. 1 Arsitektur Model

Langkah Output Arsitektur

Conv1 32x32 3x3 Conv, C/2

Graf1 16x16 Graph N/2, C

Graf2 8x8 Graph N, 2C

23

Langkah Output Arsitektur



Pooling 1x1 Average Pool 1280C

Fully Connected 2 FC 2

Penjelasan dari Tabel 3.1 pada kolom arsitektur adalah sebagai berikut:

a. Proses Conv berarti operasi yang didalamnya terdapat ReLU-Convolution-BN.

b. C merupakan banyaknya output channel yang digunakan di setiap layernya.

c. Graph merupakan operasi RWNN pada graph yang sebelumnya sudah di

bangkitkan dimana N adalah jumlah simpul dari graph yang dibankitkan.

d. Average Pool adalah pool dengan ketentuan mengambil rata-rata nya.

e. FC adalah fully connected layer.

3.2.3. Training

Model yang telah terbentuk selanjutnya dilatih menggunakan komputer. Pada

penelitian kali ini peneliti melakukan training pada model menggunakan komputer

dengan spesifikasi menggunakan computer server dengan spesifikasi Intel ® Core

™ i9-9900k, RAM 31 GB, GeForce RTX 8GB / CUDA 10. Dengan

hyperparameter yaitu learning rate sebesar 0,0001 dan batch size sebesar 8.

Penggunaan learning rate sebesar 0,0001 merupakan pilihan pribadi dari penulis

dikarenakan fungsi loss merupakan fungsi yang konveks seperti terlihat pada

lampiran 1, maka berapapun nilai dari learning rate loss yang di optimalkan akan

menuju nilai yang sama, yang membedakan hanya berapa lama fungsi loss-nya

menuju nilai minimumnya dan pemilihan batch size sebesar 8 juga merupakan

pilihan pribadi penulis untuk mencegah terjadinya overfit pada model.

Melatih model dimulai setelah data dilakukan preprocessing dan split data. Data

train dijadikan input model setiap epoch untuk melakukan backpropagation yang

terdiri dari forward pass dan backward pass. Sedangkan data validasi dijaikan input

untuk model pada setiap epochnya namun hanya melakukan forward pass hingga

24

mendapat nilai dari loss. Penggunaan data validasi pada training model karena nilai

loss dari data validasi dibutuhkan sebagai penentuan model terbaik selama training.

3.2.4. Evaluasi

Model yang telah dilatih kemudian dievaluasi. Pada penelitian kali ini, evaluasi

yang digunakan yaitu menggunakan confusion matrix dan laporan klasifikasi yang

menampilkan precision dan recall pada masing-masing kelasnya. Kemudian dari

hasil evaluasi dapat kita lihat apakah RWNN cocok untuk permasalahan ini.

25

BAB IV

HASIL DAN PEMBAHASAN

Setelah meninjau banyak hal mulai dari teori sampai dengan metode-metode

yang dilakukan para peneliti sebelumnya, maka penulis mulai mencoba melakukan

penelitian sesuai dengan data yang diambil dan metodelogi yang dipilih. Adapun

pokok pembahasan dari bab ini yaitu hasil preprocessing data, pembentukan model

untuk Klasifikasi penyakit malaria melalui gambar sell darah merah, dan evaluasi

model yang telah dilatih.

4. 1. Preprocessing Data

Prepocessing dilakukan ketika proses penyimpanan data pada folder kelas yang

sesuai, dimana proses yang dilakukan adalah transformasi data meliputi Fill I mage,

Normalize dan Resize menjadi berukuran 64x64. Hasil transformasi Fill Image,

Resize dan Normalize terlihat seperti pada Gambar 4.1.

Gambar 4. 1 Beberapa contoh hasil transformasi Fill image Normalize dan

Resize.

26

Proses transformasi gambar fill image dilakukan oleh penulis dengan

menggunakan code yang dibuat sendiri, namun normalize dan resize dilakukan

melalui library torchvision. Selanjutnya akan dilakukan pembagian pada data

meliputi data latih yang kemudian akan dilatih untuk mendapatkan model terbaik,

data validasi yang digunakan untuk memvalidasi model dan data tes untuk menguji

model yang selesai dilatih. Pembagian data dilakukan secara acak, penelitian kali

ini rasio yang digunakan untuk data train, data validasi dan data test berturut-turut

yaitu 70%, 20% dan 10% dari data.

4.2. Membuat Model

Pembuatan model RWNN pada penelitian kali ini dibantu oleh beberapa library

yang ada pada python yaitu torchvision dan network. Torchvision membantu

peneliti dalam pembuatan arsitektur dasarnya seperti fully connected layer,

optimization, regularization, loss function dan lain-lain. Sedangkan network

membantu peneliti dalam membangkitkan random graf Watts-Strogatz.

Pembangkitan random graf Watts-Strogatz menggunakan library networkx

dengan parameter peluang simpul bertetangga (P) itu sebesar 0.5, maksimal sisi dari

setiap simpul adalah 4 dan banyaknya simpul dapat dilihat dari Hasil generate graf

pada Gambar 4.2.

Gambar 4. 2 Hasil Generate Random Graf Watts-Strogatsz.

27

Pembuatan model menggunakan library torchvision dan graf yang sudah di

generate sebelumnya menghasilkan arsitektur seperti terihat pada Gambar 4.3.

Gambar 4. 3 Arsitektur RWNN untuk Klasifikasi Gambar Sel Darah Merah

Manusia yang Terinfeksi P.Falciparum.

4.3. Training

Training yang dilakukan dengan metode cross-validation dengan membagi data

menjadi 5 sama rata/hampir sama. Proses training tersebut memerlukan waktu

63370 detik (17.7 jam) dengan spesifikasi komputer yang di gunakan.

Hasil training dengan menggunakan 100 epoch, batch size sebesar 8 dan

learning rate sebesar 0,0001 dalam grafik loss yang didapat pada setiap epoch-nya

pada masing-masing fold-nya dapat dilihat pada Gambar 4.4 dan grafik akurasi

yang didapat pada setiap epoch-nya pada masing-masing fold-nya dapat dilihat

pada Gambar 4.5.

28

Gambar 4. 4 Loss Setiap Epoch Model RWNN.

Gambar 4. 5 Akurasi Setiap Epoch Model RWNN.

Berdasarkan Gambar 4.4 dan Gambar 4.5 dapat kita lihat bahwa seiring dengan

menurunnya loss maka akurasinya juga akan meningkat jadi ini dapat membuktikan

bahwa tidak ada kesalahan baik pada data, model ataupun classifier. Pada Gambar

4.4 dan Gambar 4.5 dapat kita lihat juga bahwa model yang dilatih menggunakan

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

1 4 7

10

13

16

19

22

25

28

31

34

37

40

43

46

49

52

55

58

61

64

67

70

73

76

79

82

85

88

91

94

97

10

0

LOSS SETIAP EPOCH RWNN

fold1 fold2 fold3 fold4 fold5

50

55

60

65

70

75

80

85

90

95

100

1 4 7

10

13

16

19

22

25

28

31

34

37

40

43

46

49

52

55

58

61

64

67

70

73

76

79

82

85

88

91

94

97

10

0

AKURASI SETIAP EPOCH RWNN


29

hyperparameter yang tepat dibuktikan engan grafik loss dan akurasi yang

konvergen pada suatu nilai yang diharapkan.

Selain melakukan training pada model RWNN training terhadap pretrained

model ResNet50 juga dilakukan dengan tujuan untuk membandingkan performa

dari model RWNN dengan ResNet50. Menggunakan data yang samadan perlakuan

yang sama baik itu preprocessing, hyperparameter maupun loss function dan

optimizer. dalam grafik loss yang didapat pada setiap epoch-nya pada masing-

masing fold-nya dapat dilihat pada Gambar 4.4 dan grafik akurasi yang didapat

pada setiap epoch-nya pada masing-masing fold-nya dapat dilihat pada Gambar 4.5.

Gambar 4. 6 Loss Setiap Epoch Model Resnet50

Berdasarkan Gambar 4.6 dan Gambar 4.7 dapat kita lihat bahwa seiring dengan

menurunnya loss maka akurasinya juga akan meningkat jadi ini dapat membuktikan

bahwa tidak ada kesalahan baik pada data, model ataupun classifier. Pada Gambar

4.6 dan Gambar 4.7 dapat kita lihat juga bahwa model yang dilatih menggunakan

hyperparameter yang tepat dibuktikan engan grafik loss dan akurasi yang

konvergen pada suatu nilai yang diharapkan.

0.29

0.31

0.33

0.35

0.37

0.39

0.41

0.43

1 4 7

10

13

16

19

22

25

28

31

34

37

40

43

46

49

52

55

58

61

64

67

70

73

76

79

82

85

88

91

94

97

10

0

LOSS SETIAP EPOCH RESNET50


30

Gambar 4. 7 Akurasi Setiap Epoch Model Resnet50.

4.4. Testing

Testing yang dilakukan pada data tes di setiap fold-nya menghasilkan hasil yang

terlihat seperti Tabel 4.1 Menunjukkan bahwa model RWNN menunjukan performa

yang lebih baik di bandingkan dengan ResNet50.

Tabel 4. 1 Hasil Evaluasi Training Dengan Cross-Validation.

Pengukuran RWNN ResNet50

Akurasi 95.08% 89.63%

Presisi 93.62% 80.80%

Recall 96.44% 92.12%

F1-Score 95.05% 89.88%

Dengan melihat Tabel 4.1 dapat kita simpulkan bahwa model RWNN dengan 4

graph dapat melakukan klasifikasi penyakit malaria melalui sel darah merah

dengan kesalahan yang kecil.

81

82

83

84

85

86

87

88

89

1 4 7

10

13

16

19

22

25

28

31

34

37

40

43

46

49

52

55

58

61

64

67

70

73

76

79

82

85

88

91

94

97

10

0

AKURASI SETIAP EPOCH RESNET50


31

BAB V

PENUTUP

Pada bab terakhir pada penulisan skripsi ini, berisikan tentang kesimpulan yang

dapat diambil dari penelitian serta saran bagi para peneliti selanjutnya untuk dapat

mengembangkan ilmu pengetahuan dibidang yang terkait pada masa yang akan

datang.

5.1. Kesimpulan

Dari pemaparan hasil penelitian pada bab sebelumnya, dapat disimpulkan

beberapa hal yang mungkin bisa diperhatikan dan ditelaah lebih lanjut yaitu :

1. 4 random graph dan hyperparaeter lain yang digunakan seperti loss function,

activation function dll pada RWNN mampu melakukan klasifikasi gambar sel

darah merah manusia yang terinfeksi p.falciparum ibandingkan dengan pre-

trained model.

2. RWNN dengan hyperparameter yang digunakan penulis mengasilkan training

yang tidak terindikasi overfiting pada klasifikasi gambar sel darah merah

manusia yang terinfeksi p.falciparum, begitu juga untuk pre-trained model

ResNet50.

3. Hasil evaluasi model RWNN pada klasifikasi gambar sel darah merah manusia

yang terinfeksi p.falciparum menunjukkan rata-rata hasil sebesar 95.08% pada

accuracy, 93.62% pada precision, 96.44% pada recall dan 95.05% pada f1-

score. Performa dari Randomly Wired Neural Network dapat mengalahkan

pre-trained model ResNet50 yang arsitekturnya menunjukkan rata-rata hasil

sebesar 89.63% pada accuracy, 80.80% pada precision, 92.12% pada recall dan

89.88% pada f1-score.

32

5.2. Saran

Pada penelitian kali ini, terdapat beberapa hal yang mungkin dapat

dikembangkan dimasa yang akan datang. Oleh sebab itu, penulis ingin memberikan

saran kepada para peneliti selanjutnya yang tertarik untuk melakukan penelitian

dalam bidang yang terkait diantaranya yaitu:

1. Memperhatikan/mendeteksi p.falciparum yang telah diwarnai giemsa pada

sel darah merah yang terinfeksi.

2. Dapat menggunakan data yang berasal dari Indonesia

3. Dapat melakukan perubahan pada arsitektur CNN, loss function, output

unit, optimizer dan regulrization.

34

REFERENSI

[1] M. Kes et al., “Data dan Informasi Profil Kesehatan di Indonesia,” Jakarta.

[2] K. Kesehatan and R. Indonesia, “Laporan Kesehatan Kementrian Kesehatan

2017,” Jakarta.

[3] “The reliability of blood film examination for malaria at the peripheral health

unit.” .

[4] M. Hawkes, J. P. Katsuva, and C. K. Masumbuko, “Use and limitations of

malaria rapid diagnostic testing by Congo,” vol. 8, pp. 1–8, 2009.

[5] G. Díaz, F. A. González, and E. Romero, “A semi-automatic method for

quantification and classification of erythrocytes infected with malaria

parasites in microscopic images,” J. Biomed. Inform., vol. 42, no. 2, pp. 296–

307, 2009.

[6] M. Poostchi, K. Silamut, R. J. Maude, S. Jaeger, and G. Thoma, “Image

analysis and machine learning for detecting malaria,” Transl. Res., vol. 194,

pp. 36–55, 2018.

[7] Y. Lecun, Y. Bengio, and G. Hinton, “Deep learning,” 2015.

[8] S. Rajaraman et al., “Pre-trained convolutional neural networks as feature

extractors toward improved malaria parasite detection in thin blood smear

images,” pp. 1–17, 2018.

[9] S. Xie and F. Ai, “Exploring Randomly Wired Neural Networks for Image

Recognition.”

[10] D. C. Warhurst and J. E. Williams, “Laboratory diagnosis of malaria,” no.

148, pp. 533–538, 1996.

[11] E. Tjitra, S. R. I. Suprianto, M. Dyer, and B. J. Currie, “Field Evaluation of

the ICT Malaria P . f / P . v Immunochromatographic Test for Detection of

Plasmodium falciparum and Plasmodium vivax in Patients with a

Presumptive Clinical Diagnosis of Malaria in Eastern Indonesia,” vol. 37,

no. 8, pp. 2412–2417, 1999.

[12] I. Goodfellow, “Deep Learning.”

[13] A. Textbook, Neural Networks and Deep Learning. yorktown heigths: IBM

T. J. Watson Research Center.

[14] N. Shirish and K. Richard, “Improving Generalization Performance by

Switching from Adam to SGD,” no. 1, 2017.

[15] C. C. Aggarwal, Neural networks and deep learning : a textbook. IBM T. J.

34

Watson Research Center.

[16] D. J. Watts and S. H. Strogatz, “Collective dynamics of ‘small-world’

networks,” vol. 393, no. June, pp. 440–442, 1998.

[17] F. A. Ifdillah, “Representasi graf acak ( Watts and Strogatz model ) pada

Small World Phenomenon : Degrees of Separation,” vol. 1, no. 13514010,

2016.

[18] M. Sokolova, G. L.-I. P. and, and undefined 2009, “A systematic analysis

of performance measures for classification tasks,” www-

rali.iro.umontreal.ca.

[19] S. G. K. Patro and K. K. Sahu, “Normalization: A Preprocessing Stage,”

2015.

[20] T. PoostchiM, SilamutK, MaudeRJ, JaegerS, “Aplikasi androidnya.pdf,”

Transl. Res., vol. 194, pp. 36–55, 2018.

[21] I. Ersoy, F. Bunyak, J. M. Higgins, and K. Palaniappan, “COUPLED EDGE

PROFILE ACTIVE CONTOURS FOR RED BLOOD CELL FLOW

ANALYSIS University of Missouri Columbia Department of Computer

Science Columbia , MO 65201 Department of Systems Biology MGH

Center for Systems Biology , Boston , MA 02114,” pp. 748–751, 2012.

[22] S. B. Kotsiantis, D. Kanellopoulos, and P. E. Pintelas, “Data Preprocessing

for Supervised Leaning,” vol. 1, no. 1, pp. 111–117, 2006.

KLASIFIKASI PARASIT FALCIPARUM

Documents

Transcript of KLASIFIKASI PARASIT FALCIPARUM