SEMINAR PERLOMBONGAN DATA EQUATORIAL 1 OKTOBER 2002

Post on 21-Jan-2016

62 views 1 download

description

SEMINAR PERLOMBONGAN DATA EQUATORIAL 1 OKTOBER 2002. PERLOMBONGAN PENGETAHUAN DATA PEMAKANAN TEKNIK RANGKAIAN NEURAL. NOOR LAILANI NAWAWI PELAJAR SARJANA KERJA KURSUS & TESIS. PERLOMBONGAN DATA. PENGENALAN. Data merupakan sesuatu yang sangat bernilai. - PowerPoint PPT Presentation

Transcript of SEMINAR PERLOMBONGAN DATA EQUATORIAL 1 OKTOBER 2002

PENGENALANPENGENALAN

•Data merupakan sesuatu yang sangat bernilai.

•Daripada data-data ini, penilaian boleh dibuat terhadap kerja-kerja yang dilakukan.

•Proses ramalan tentang keadaan pada masa akan datang boleh dilakukan agar lebih baik daripada sebelumnya.

•Data-data boleh dianalisa untuk mencari intisari.

•Kaedah yang sesuai perlu dicari untuk membantu pengekstrakkan maklumat dan pengetahuan berguna.

PERLOMBONGAN DATA

Definisi:

-penerokaan dan penganalisisan data yang besar menggunakan patterns dan rules.

-Menggambarkan pengetahuan dalam pangkalan data. Melibatkan pengekstrakkan data, pencarian data, penjelajahan data, pemprosesan bentuk data, penggalian data, penuaian maklumat (Turban-2001)

-Sering disamakan dengan istilah penemuan pengetahuan daripada pangkalan data (KDD). Usama Fayad (1996) menggunakan istilah KDD untuk menunjukkan keseluruhan proses mengekstrak pengetahuan peringkat tinggi dari data peringkat rendah.

PERLOMBONGAN DATA

PERLOMBONGAN DATA

PERNYATAAN MASALAH

• Pangkalan data perubatan adalah amat kompleks.

•Kesukaran dialami oleh para doktor untuk:

1. Membuat pengecaman atau perbandingan antara tabiat pemakanan seorang pesakit dgn penyakit yang dihadapi

2. Apakah menu hidangan yang paling sesuai untuk pesakit tersebut berdasarkan kepada penyakit yang dihidapi.

kesukaran diatasiMengolah data-data ke bentuk pengetahuan

Masalah Data Perubatan1. Data yang direkod oleh pusat kesihatan kurang

tersusun

- banyak rekod pesakit tidak tepat

- oleh itu, proses pembersihan data memakan masa yang lama dan memerlukan tenaga yang banyak.

2. Pakar kesihatan kebiasaannya terlalu sibuk merawat pesakit setiap hari.

- Oleh itu mereka tidak mampu untuk meluangkan masa atau tenaga dengan petua-petua yang dijana daripada pangkalan data.

MATLAMAT PENYELIDIKAN

GUNA TEKNIK PERLOMBONGAN DATA

Ekstrak maklumat dan pengetahuan yang tersimpan dalam data perubatan yang besar dan kompleks

Bantu pakar membuat keputusan

SUMBANGAN

• Pakej perlombongan yang dibina diharap berjaya mengklasifikasikan data-data daripada rekod perubatan pesakit beserta rekod berkaitan pemakanan pesakit bagi menghasilkan satu pengetahuan berkaitan menu pemakanan pesakit

•Pembinaan pakej ini dapat disumbangkan dalam membantu pencarian data-data yang boleh memberikan maklumat kepada pakar kesihatan yang berkecimpung dalam bidang ini.

Rangkaian Neural

•Penyelidikan pada masa kini tertumpu kepada pembangunan sistem yang berorientasikan kepada otak manusia

•Ramon Cajal telah memperkenalkan idea neuron sebagai struktur unsur utama dalam otak.

•Drpd idea neuron, terbentuk algoritma rangkaian neural yang dibuat dengan mempunyai konsep biologi neuron yang terdapat di dlm otak manusia.

•Teknologi ini menyerupai proses otak untuk menyelesaikan masalah.

Rangkaian neural mendapatkan pengetahuan daripada pengalaman lepas untuk menangani sesuatu masalah dan situasi.

Rangkaian neural mengambil penyelesaian terdahulu untuk membina sistem neuron dalam membuat keputusan.

Paolo Antogmettim(1980), rangkaian neural adalah permodelan sistem perkomputeran selari dinamik, mengandungi unit pemprosesan yang banyak di mana setiap satu unit mewakili ciri biologi neuron otak yang bersambungan antara satu sama lain dalam konfigurasi yang tertentu, yang boleh menjanakan maklumat yang berguna bergantung kepada nilai input yang diterima.

P. Booth(1994) – Rangkaian neural adalah arkitektur komputer yang terdiri dari mikroprosesor yang saling berhubung kait antara satu sama lain. Ia meniru binaan atau arkitektur struktur otak pada peringkat neuron dan keupayaan belajar melalui proses latihan.

Howard (1998)- Rangkaian neural digubah drpd elemen neuron-neuron dan dioperasikan secara selari. Elemen neuron ini adalah ilham drpd saraf biologi yang terdapat di dalam otak manusia. Fungsi rangkaian ditentukan dgn hubungan di antara neuron-neuron. Rangkaian neural boleh dilatih atau didik untuk melakukan fungsi-fungsi tertentu dengan melaraskan nilai-nilai pemberat di antara neuron-neuron.

Pemprosesan rangkaian neural dilakukan dengan melihat kepada data dalam set latihan, kemudian belajar corak tersebut dan seterusnya membina kemampuan untuk mengkelaskan corak baru dan membuat ramalan. Rangkaian neural diimplemenkan dengan menggunakan komponen-komponen elektronik atau perisian pada komputer digital. Fungsi utama rangkaian neural ialah mempersembahkan operasi-operasi melalui proses pembelajaran.

Rangkaian Neural

- terdiri daripada elemen-elemen pemprosesan yang ringkas dipanggil nod.

- Setiap nod dihubungkan antara satu sama lain dengan pemberat.

- Pemberat mewakili maklumat yang digunakan oleh rangkaian untuk menyelesaikan masalah.

- Setiap neuron mempunyai internal state yang dipanggil pengaktif (activation).

X1

X2

X3

Y

w1

w2

w3

-Y terima input drpd X1,X2,X3

-Pengaktif (isyarat output) terdiri drpd x1,x2,x3

-Pemberat terdiri drpd w1,w2,w3

-Input Rangkaian (y_in) kepada nod Y ialah:

y_in = w1x1 + w2x2 + w3x3

-Pengaktif y : y = f(y_in)

Pengkelasan Senibina Rangkaian Neural

Rangkaian satu-lapisan

Rangkaian Multi-Lapisan

Rangkaian Berulang

Rangkaian Neural Perambatan Balik

• Rangkaian Neural yang paling popular

•Terdiri drpd 3 lapisan neuron

•Nilai input terdapat pada lapisan pertama yang dijadikan pemberat dan kemudian dihantar kepada lapisan kedua (lapisan tersembunyi).

•Neuron-neuron pada lapisan tersembunyi menumpu atau mengeluarkan output yang berdasarkan kepada nilai pemberat yang telah diterima.

•Kemudian lapisan tersembunyi ini menghantar nilai kpd lapisan output akhirnya mengeluarkan keputusan yang dikehendaki.

Senibina Asas Rangkaian Neural

- Mengandungi lapisan input, lapisan tersembunyi dan satu unit output

Input

Input

Input

output

output

output

LapisanInput

LapisanTersembunyi

LapisanOutput

Proses Latihan Dan Pembelajaran

•Proses pembelajaran adalah sesuatu yang sukar ditakrifkan dengan tepat dari segi jangkamasa pemprosesannya.

•Mender dan McClaren –

“ Pembelajaran adalah proses penyesuaian parameter- parameter rangkaian neural melalui proses rangsangan drpd persekitaran di mana

rangkaian itu dihubungkan. Jenis pembelajaran pula ditentukan oleh cara bgmn parameter itu berubah”

•Rangkaian belajar melalui penyesuaian di antara pemberat dan lapisan yang dihubungkan.

•Jawapan drpd rangkaian ini kemudiannya dibandingkan dgn jawapan yang dikehendaki Secara berulang-ulang dan pada setiap masa perhubungan ini, pemberat sentiasa disesuaikan sedikit demi sedikit dgn jawapan seperti yang ditentukan.

•Sekiranya sesuatu permasalahn itu dapat dipelajari, set-set pemberat ini dapat disesuaikan dan mengeluarkan jawapan yang terbaik untuk semua sampel keputusan dan ramalan.

•Kuasa sebenar rangkaian neural terbukti apabila rangkaian yang telah dilatih dapat mengeluarkan output yang terbaik.

Rangkaian neural terdapat penghubung

(pemberat

di antara neuron)

Input PERBANDINGAN

output

Pemberat sudah dilaraskan

Rajah : Rangkaian Neural (Howard 1998)

Rangkaian terbaik… Tahu bila sesuatu pembelajaran

atau latihan itu perlu dihentikan

Tahu bila sesuatu pembelajaran

atau latihan itu perlu dihentikan

Jika latihan data terlalu sedikit

Rangkaian tidak dapat belajar

untuk mengenal corak sampel

Rangkaian tidak dapat belajar

untuk mengenal corak sampel

Jika sebaliknya…

Rangkaian akan mempelajari gangguan yang terdapat pada data

atau terlebih latihan sehingga tidak dapat membuat kesimpulan

yang terbaik

Rangkaian akan mempelajari gangguan yang terdapat pada data

atau terlebih latihan sehingga tidak dapat membuat kesimpulan

yang terbaik