Persaingan antara perusahaan telekomunikasi seluler pada masa ini adalah dengan mempertahankan pelanggan. Pelanggan menjadi salah satu faktor utama dalam kesuksesan yang dicapai dalam perusahaan telekomunikasi seluler. Pelanggan dapat memilih sesuai dengan keinginan dan kebutuhan, hal ini menjadi faktor utama pemicu terjadinya churn. Churn prediction adalah metode yang digunakan untuk memprediksi pelanggan yang kemungkinan churn dan pelanggan yang tetap bertahan pada suatu perusahaan tertentu. Churn prediction harus dilakukan untuk mengetahui kemungkinan pelanggan berpindah layanan. Dalam sebagian besar kasus data pelanggan churn memiliki jumlah lebih rendah dibanding dengan data non-churn, fakta ini memunculkan permasalahan pada saat klasifikasi yaitu imbalanced data. Dalam menangani permasalahan churn dan imbalanced data digunakan beberapa metode data mining. Permasalahan pada imbalanced data, penulis menerapkan teknik SMOTE untuk penanganan data. Kemudian untuk mengklasifikasikan kelas churn dan non-churn menggunakan metode logistic regression. Metode logistic regression merupakan model prediksi yang digunakan untuk mendapatkan kemungkinan diantara dua nilai churn. Data yang digunakan adalah data pelanggan dari WITEL PT.Telekomunikasi Regional 7. Penelitian yang dilakukan menggunakan metode logistic regression dan penanganan imbalance data dengan SMOTE memiliki hasil performansi dengan tingkat akurasi sebesar 92,4% dan f1-measure sebesar 31,27%.
Kata kunci: SMOTE, churn, churn prediction, imbalanced data, logistic regression, klasifikasi