Perkembangan teknologi sekarang ini semakin pesat. Kebutuhan akan informasi dan komunikasi bertambah. Persaingan untuk mendapatkan pendapatan antar perusahaan telekomunikasi menimbulkan adanya Churn. Churn adalah pindahnya pelanggan dari satu provider ke provider lainnya. Perusahaan lebih memilih untuk mempertahankan customer, karena dibutuhkan biaya yang lebih sedikit daripada menambah customer yang baru. Namun dalam permasalahan ini churn memiliki data yang tidak seimbang dan ekstrim dibanding dengan non-churn, sehingga perlu adanya penanganan pada distribusi kelas mayoritas (non-churn) dan minoritas (churn). Pada metode pendekatan dengan data mining, data yang tidak seimbang akan mengakibatkan proses klasifikasi yang cenderung keliru pada kelas minoritas (churn). Oleh karena itu, diperlukan penanganan kelas tidak seimbang dengan teknik sampling.
Metode yang digunakan pada penelitian Tugas Akhir ini adalah metode Underbagging untuk menangani imbalance data yang dikombinasikan dengan metode klasifikasi menggunakan Logistic Regression (LR). Pengujian dilakukan dengan menggunakan dataset pelanggan WITEL PT. Telekomunikasi Regional 7 dengan 53 atribut. Jumlah data churn 7.513 record dan data non-churn 192.848 record. Penelitian ini menghasilkan nilai performansi f1-measure tertinggi sebesar 84,985% dan dapat meningkatkan nilai f1-measure lebih dari 20% terhadap hasil klasifikasi tanpa penanganan imbalance data.