Email merupakan teknologi komunikasi yang umum dalam kehidupan modern ini. Semakin banyak email yang kita terima semakin sulit dan membutuhkan waktu untuk memilah. salah satu solusi untuk mengatasi masalah ini dengan cara membuat model matematis menggunakan pembelajaran mesin untuk memilah email berdasarkan konteks tertentu. Setiap jenis pembelajaran mesin dan distribusi data menghasilkan performansi yang berbeda. Ensemble merupakan suatu metode untuk megabungkan beberapa model menjadi satu kesatuan untuk mendapatkan performansi yang lebih baik. maka pada penelitian kami kami mencoba mengkombinasikan model pembelajaran, sampling dan beberapa kelas data untuk mendapatkan pengaruh bagging dan voting terhadap performansi macro average f1 score suatu model ensemble dan membandingkan dengan model non-ensemble. Hasil penelitian ini menunjukan sensitifitas Naïve Bayes terhadap data tak imbang terbantu oleh bagging dan voting dengan delta performansi 0.0001 – 0.0018, logistic regresi memiliki kenaikan performansi relative rendah untuk bagging dan voting dengan delta performansi 0.0001-0.00015, dan voting decision tree memiliki performansi yang terbebankan oleh Naïve Bayes dengan delta performansi -0.01.