Abstrak
Pada dunia bisnis, pelanggan merupakan suatu hal yang amat berharga bagi perusahaan. Salah satu contohnya pada perusahaan yang bekerja di bidang telekomunikasi, pelanggan akan terus menggunakan jasa yang disediakan jika pelayanan memuaskan, Namun jika dirasa kurang memuaskan maka pelanggan tersebut dapat dikhawatirkan berhenti menggunakan jasa dari perusahaan yang bersangkutan. Hal ini sangat mempengaruhi keberhasilan perusahaan. Untuk mengetahui pelanggan yang memiliki potensi untuk berhenti menggunakan jasa (churn)maka diperlukan strategi untuk memprediksi pelanggan yang memiliki potensi untuk melakukan aksi churn. Namun terdapat suatu masalah sebelum aksi prediksi dapat dilakukan, masalah tersebut adalah ketidakseimbangan data. Pendekatan data mining dapat dilakukan untuk menyelesaikan hal tersebut. Kemudian data yang sudah diproses, masuk ke tahap klasifikasi. Teknik menangani ketidakseimbangan data pada paper ini menggunakan teknik RUSBoostdan untuk klasifikasinya menggunakan SVM. Hasil didapatkan dari tugas akhir ini adalah hasil prediksi pelanggan yang akan melakukan churn dari banyaknya data pelanggan pada layanan indihome. Kemudian hasilnya dibandingkan dengan hasil dari sistem yang baik menggunakan metode boosting maupun tidak. Dengan menggunakan boosting, sebagian besar hasil akurasi dan F1score mendapatkan nilai yang lebih baik. Namun, hasil yang didapatkan tidak stabil baik dari sisi akurasi atau F1scorenya, hal ini dikarenakan penggunaan metode random undersampling berulang kali yang menghasilkan data-data unik. Hasil terbaik didapatkan pada boosting dengan perulangan sebanyak2 kali menggunakan kernel svm linear, dengan rincian F1score sebesar 0,3195 dan akurasi sebesar 0,8852.
Kata kunci: ketidakseimbangan data, klasifikasi, RUSBoost, SVM