ABSTRAKSI: Imbalance class merupakan ketidakseimbangan dalam jumlah training data antara 2 class yang berbeda. Salah satu classnya merepresentasikan kasus yang bersifat jarang terjadi sehingga jumlah data latih anomali yang akan digunakan akan relatif sedikit dibandingkan dengan jumlah data latih pada kasus normal. Salah satu metode data mining yang digunakan untuk memprediksi data adalah klasifikasi. Beberapa metode klasifikasi yang ada sekarang ini lebih ditujukan untuk kasus yang jumlah trainingnya seimbang, dengan tujuan akhir memaksimalkan akurasi yang tentu saja kurang cocok bila digunakan pada kasus imbalance class dimana kecenderungan jumlah data lebih sedikit dibandingkan dengan kasus normal, sehingga metode tersebut tidak dapat memprediksi secara maksimal. Salah satu algoritma untuk menangani kasus imbalance class adalah algoritma CREDOS(Classification Using Ripple Down Rule).
Dalam tugas akhir ini telah dilakukan analisis karakteristik imbalance class, analisis performansi algoritma CREDOS sebelum dan sesudah pemangkasan, analisis performansi algoritma CREDOS untuk data anomali terkluster dan data anomali tidak terkluster(tersebar), analisis perbandingan dengan beberapa metode klasifikasi lain dan analisis kelebihan dan kekurangan algoritma Credos pada kasus imbalance class
Dari hasil pengujian diperoleh kesimpulan bahwa algoritma CREDOS cukup baik digunakan pada kasus imbalance class bila dibandingkan dengan beberapa metode klasifikasi seperti Decision Tree, Naïve Bayes, dan OneR. Untuk jenis data terkluster, algoritma CREDOS(Classification Using Ripple Down Rule) memiliki performansi yang baik. Algoritma CREDOS juga memiliki interpretabilitas yang baik. Namun, kelemahan algoritma CREDOS(Classification Using Ripple Down Rule) untuk jenis data tidak terkluster performansinya tidak sebaik performansi untuk data terkluster.Kata Kunci : Algoritma CREDOS , Imbalance Class, Klasifikasi.ABSTRACT: Imbalance class represents imbalance in number of training data between two different classes. One of the classes represents rare case. The number of the anomaly training data which is used will relatively small when it is compared to amount training of normal case. One of data mining methods which is used to predict data is Classification. Recently, some existing classification methods are more addressed for the well-balanced training data which purposed to maximize the overall accuracy. Those existing methods aren’t proper to imbalance class problem, so that those methods can’t give a good performance in classifying imbalance class problem. One of new algorithm which is used to solve imbalance class problem is CREDOS (Classification Using Ripple Down Rule) algorithm.
In this final project, had been analysed the imbalance class characteristic, the performance of CREDOS algorithm before and after pruning model, the performance of CREDOS algorithm in clustered data and unclustered data, the strengths and weaknesses of CREDOS algorithm, the performance of CREDOS algorithm compared to another classification methods such as Decision Tree, Naïve Bayes, OneR, and Balancing Tree.
The result shows that CREDOS algorithm compared to some existing method such as Decision Tree, Naïve Bayes, and OneR has good performance in classifying imbalance class problem. The weakness is the performance of CREDOS algorithm in classifying unclustered data was not as good as performance of CREDOS algorithm in classifying clustered data.Keyword: Classification, CREDOS algorithm, and Imbalance Class.