kesimpulan datamining IDFN

3
5. CONCLUSIONS AND FUTURE DIRECTIONS Makalah ini telah melaporkan percobaan perbandingan terhadap pendekatan supervised data mining pada gen ekspresi data microarray untuk multiple myeloma. Percobaan komparatif ini memberikan bukti untuk pelajaran berikut yang mungkin berguna dalam aplikasi supervised data mining yang lain untuk microarray data yang digunakan untuk mempelajari penyakit. 1. Sebuah model yang dapat langsung dipahami, seperti Bayes nets, pohon keputusan, atau ensemble voting, memiliki keuntungan dari mengekspos "trivially-accurate genes”. Ini adalah gen yang tidak memberikan wawasan baru tapi sangat-akurat karena sifat dari penyakit atau dari koleksi sampel. Jika tujuan data mining adalah untuk mendapatkan wawasan, dan bukan hanya prediksi yang akurat. 2. Unweighted voting dan pembelajaran Bayes nets memberikan akurasi setidaknya sama dengan akurasi yang diperoleh dari pendekatan lainnya (Gambar 1) dan bisa dibilang memberikan lebih banyak wawasan secara langsung daripada pendekatan yang lain. 3. Unweighted voting dan pembelajaran Bayes nets memberikan akurasi setidaknya sama dengan akurasi yang diperoleh dari pendekatan lainnya (Gambar 1) dan bisa dibilang memberikan lebih banyak wawasan secara langsung daripada pendekatan yang lain. 4. Kemampuan SVMs untuk mempertimbangkan besarnya perbedaan dalam ekspresi selain konsistensi dari perbedaan yang muncul, menghasilkan sedikit atau tidak ada manfaat di

description

silahkan di lihatlihat :)

Transcript of kesimpulan datamining IDFN

Page 1: kesimpulan datamining IDFN

5. CONCLUSIONS AND FUTURE DIRECTIONS

Makalah ini telah melaporkan percobaan perbandingan terhadap pendekatan supervised data mining pada gen ekspresi data microarray untuk multiple myeloma. Percobaan komparatif ini memberikan bukti untuk pelajaran berikut yang mungkin berguna dalam aplikasi supervised data mining yang lain untuk microarray data yang digunakan untuk mempelajari penyakit.

1. Sebuah model yang dapat langsung dipahami, seperti Bayes nets, pohon keputusan, atau ensemble voting, memiliki keuntungan dari mengekspos "trivially-accurate genes”. Ini adalah gen yang tidak memberikan wawasan baru tapi sangat-akurat karena sifat dari penyakit atau dari koleksi sampel. Jika tujuan data mining adalah untuk mendapatkan wawasan, dan bukan hanya prediksi yang akurat.

2. Unweighted voting dan pembelajaran Bayes nets memberikan akurasi setidaknya sama dengan akurasi yang diperoleh dari pendekatan lainnya (Gambar 1) dan bisa dibilang memberikan lebih banyak wawasan secara langsung daripada pendekatan yang lain.

3. Unweighted voting dan pembelajaran Bayes nets memberikan akurasi setidaknya sama dengan akurasi yang diperoleh dari pendekatan lainnya (Gambar 1) dan bisa dibilang memberikan lebih banyak wawasan secara langsung daripada pendekatan yang lain.

4. Kemampuan SVMs untuk mempertimbangkan besarnya perbedaan dalam ekspresi selain konsistensi dari perbedaan yang muncul, menghasilkan sedikit atau tidak ada manfaat di luar metode yang hanya mempertimbangkan konsistensi dari perbedaan

5. Membuang data berdasarkan nilai-nilai perbedaan rata-rata yang rendah atau negatif atau absent calls adalah kesalahan, setidaknya dengan data yang dihasilkan menggunakan teknologi Affymetrix sebelum 2002.

Untuk penelitian masa depan adalah untuk menguji pelajaran ini pada tambahan, microarray yang lebih besar Data set ketika mereka menjadi tersedia. Seperti disebutkan, kumpulan data myeloma multiple adalah diharapkan tumbuh ke urutan 500 sampel di tahun depan. Untuk lebih memudahkan perbandingan percobaan, dengan harapan peneliti lain membuat set data mereka tersedia untuk umum, terutama orang-orang dengan nomor sampel dari seratus atau lebih. Terdapat tiga arah penelitian masa depan yang sekarang menjadi jelas juga. Yang pertama arah baru menganggap multiple myeloma pada khususnya. Sebuah sel plasma jinak diskrasia disebut MGUS (gammopathy monoklonal signifikansi belum ditentukan) tampaknya menyebabkan pola ekspresi yang sangat mirip dengan multiple myeloma, namun MGUS tidak berbahaya kecuali berlangsung untuk multiple myeloma.  Kedua, cukup mengejutkan bahwa voting tertimbang

Page 2: kesimpulan datamining IDFN

sederhana melakukan serta pembelajaran bersih Bayes, yang seperti disebutkan dalam Bagian 4 dapat dilihat sebagai skema voting tertimbang canggih. Ini perbandingan harus dilakukan pada set data yang lebih besar ketika mereka menjadi tersedia, dan juga pada kasus-kasus seperti MGUS vs myeloma di mana perbedaan cenderung lebih sulit. Ketiga, bagaimana pelajaran ini perubahan kertas sebagai perubahan teknologi yang mendasari? Affymetrix baru saja memperkenalkan metode baru untuk komputasi AC dan AD itu, antara perbedaan lain, hasil nilai perbedaan rata-rata negatif lebih sedikit. Kami berharap pelajaran yang luas dari penelitian kami yang kuat cukup untuk menampung seluruh perubahan teknologi seperti itu, tapi itu akan perlu diuji. Juga, seluruh yang bidang ekspresi gen microarray mungkin kehilangan beberapa tanah untuk teknik muncul di proteomik, dimana jumlah produk protein dari gen diukur secara langsung, daripada mengukur jumlah mRNA, yang berfungsi sebagai (noisy) pengganti untuk jumlah protein.