Analisis dan Implementasi Algoritma Rotation Forest sebagai Klasifier Metode Ensemble dalam Data Mining

Novelya Marta U. N

Informasi Dasar

181 kali
113040325
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Perkembangan teknologi dalam pengumpulan dan penyimpanan data, maka muncul sebuah kebutuhan akan informasi penting dari data yang. Klasifikasi merupakan sebuah teknik yang dapat dilakukan untuk mengekstrak informasi penting dari data yang ada. Rotation Forest merupakan teknik klasifikasi metode ensemble yang menggunakan prinsip feature extraction menggunakan Principal Component Analysis (PCA) dan decision tree dalam membangun base classifier-nya. Decision tree dipilih karena decision tree sangat sensitif terhadap rotasi yang dilakukan pada data dengan membangun tree yang lebih sedikit. Hasil pengujian menunjukkan bahwa hasil performansi secara keseluruhan dipengaruhi oleh nilai jumlah base classifier (L) dan jumlah subset (K). Nilai K yang lebih kecil memberikan performansi yang lebih baik karena jumlah atribut yang besar dengan pembagi K yang lebih kecil akan mengoptimalkan kinerja PCA untuk data berdimensi besar. Sementara, nilai L yang lebih kecil mampu meningkatkan performansi karena jumlah decision tree yang dibangun sebagai base classifier mampu memberikan nilai akurasi yang lebih baik jika tree yang dihasilkan lebih sedikit. Dari hasil pengujian dapat dilihat bahwa, algoritma Rotation Forest memberikan hasil performansi yang lebih baik dalam memprediksi mahasiswa IT Telkom berpotensi Drop Out (DO) untuk data berdimensi besar dibandingkan metode ensemble lainnya seperti LogitBoost dan Random Forest.Kata Kunci : Rotation Forest, base classifier, decision tree, metode ensemble,feature extraction, Principal Component Analysis (PCA)ABSTRACT: Along with the technology improvement in collecting and saving data, it leads to a necessity for gaining important information from the available data. Classification is one of technique to extract the important information from available data. Rotation Forest is a classification technique of ensemble method using feature extraction based on Principal Component Analysis (PCA) and decision tree to build its base classifier. Decision tree is chosen because they are sensitive to rotation of the feature data by building the fewer tree. The analyze results shows that the overall performance is influenced by value of the number of base classifier (L) and subset (K). The smallest value of K gave the better result because the huge number of field with the smallest divider K would optimize performance of PCA for data with high dimension. While, the smallest value of L could increase performance because the number of decision tree which is built as base classifier could give good accuracy with fewer tree is obtained. From the analyze result can be shown that Rotation Forest gave good performance to predict students collage who have the potential to be Drop Out (DO) in comparison with the other ensemble method like LogitBoost and Random Forest.Keyword: Rotation Forest, base classifier, decision tree, ensemble method, feature extraction, Principal Component Analysis (PCA)

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis dan Implementasi Algoritma Rotation Forest sebagai Klasifier Metode Ensemble dalam Data Mining
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Novelya Marta U. N
Perorangan
Dhinta Darmantoro, Toto Suharto
 

Penerbit

Universitas Telkom
Bandung
2008

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini