Analisis pengaruh Bagging pada algoritma klasifikasi data mining CART dan C.45

Ferancis Leonardo .S

Informasi Dasar

113070208
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Akurasi pada model algoritma data mining menentukan baik tidaknya model tersebut, model yang memiliki akurasi rendah bisa salah mengklasifikasikan sebuah data yang dapat berakibat fatal jika model tersebut dipakai dalam sistem pendukung pengambilan keputusan(SPPK), bagging adalah ensemble method yang memanipulasi data training menjadi beberapa bag kemudian membangun model dari bag-bag tersebut, lalu pada saat klasifikasi dilakukan voting terbanyak berdasarkan model-model yang dihasilkan. Bagging dapat meningkatkan akurasi karena mengurangi variance dan overfitting pada model. Bagging cocok untuk algoritma yang sifatnya unstable learning algorithms dimana model akan berubah jika data training-nya ikut dirubah, contohnya adalah algrotima CART dan C4.5.

Pada tugas akhir kali ini akan dibangun sistem yang dapat menganalisis pengaruh bagging terhadap algoritma CART dan C4.5 dengan menggunakan 12 buah dataset yang diambil dari UCI repository. Berdasarkan hasil pengujian akurasi CART dan C4.5 meningkat dengan metode bagging tetapi akurasi tidak selalu bertambah jika jumlah bag-nya semakin banyak, kecenderungan banyaknya bag yang cocok untuk CART adalah 25 dan C4.5 adalah 50. Metode bagging tidak cocok untuk dataset yang berukuran kecil dan atributnya sedikit.Kata Kunci : Akurasi, bagging, Classification and Regression tree (CART), C4.5.ABSTRACT: Accuracy from model of data mining algorithms is to determine good or not the model, a model that has a low accuracy could be fail to classify a data and this can be fatal if it used in decision support system(DSS), bagging is ensemble method that manipulates the data training into several bagthen build models from the bags, when the time to classify they do voting based on the Output from the models. Bagging can improve accuracy because it can reduce variance and overfitting of the model. Bagging suitable for unstable learning algortims which models could be changed if the data training was changed, the examples are CART and C4.5.

In this final task,will be build a system that can analyze bagging influence for CART and C4.5 algorithms using 12 dataset taken from UCI repository. Based on the result,CART’s and C4.5’s Accuracy improved by bagging method, but accuracy not always improve if the number of bag increase, the tendency of many bags are suitable for CART is 25 and C4.5 is 50. Bagging method is not suitable for small dataset and little attribute.Keyword: Accuracy, bagging, Classification and Regression Tree(CART), C4.5.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis pengaruh Bagging pada algoritma klasifikasi data mining CART dan C.45
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Ferancis Leonardo .S
Perorangan
Erwin Budi Setiawan, Imelda Ataina
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini