Abstrak
Mempertahankan pelanggan adalah hal yang penting bagi perusahaan telekomunikasi, karena pelanggan merupakan sumber pendapatan bagi perusahaan tersebut. Perusahaan telekomunikasi yang menerapkan model churn prediction dapat mendeteksi kemungkinan perpindahan pelanggan dari satu provider ke provider lainya. Namun karena pelanggan yang melakukan churn jauh lebih sedikit dibanding non-churn maka distribusi antara kelas mayoritas dan minoritas tidak seimbang, hal tersebut dinamakan imbalanced data. Dengan distribusi yang tidak seimbang, metode pendekatan pada data mining cenderung keliru mengklasifikasikan kelas minoritas. Oleh karena itu, diperlukan penanganan imbalanced data dengan teknik sampling.
Metode yang digunakan pada penelitian Tugas Akhir ini adalah metode Underbagging untuk menangani imbalanced data yang dikombinasikan dengan metode klasifikasi menggunakan Random Forest (RF). Uji coba sistem dilakukan dengan menggunakan salah satu dataset pelanggan WITEL PT. Telekomunikasi Regional 7 yang memiliki 53 atribut dengan jumlah data churn 7.513 record dan data non-churn 192.848 record. Penelitian ini menghasilkan nilai performansi f-measure tertinggi sebesar 92,58% dan meningkatkan nilai f-measure sebesar 22,32% terhadap hasil klasifikasi tanpa penanganan imbalanced data.
Kata Kunci: churn prediction, imbalanced data, Underbagging, Random Forest.