Penelitian ini memfokuskan pada masalah prediksi kelulusan mahasiswa berdasarkan data aktivitas dataset OULAD (Open University Learning Analytics Dataset). Tantangan utama adalah bagaimana memanfaatkan data aktivitas yang sangat besar dan beragam untuk secara efektif memprediksi kelulusan mahasiswa, sehingga institusi pendidikan dapat memberikan intervensi yang tepat waktu kepada mahasiswa yang berisiko gagal. Dengan memahami pola aktivitas yang berkaitan dengan kelulusan, pihak universitas dapat memberikan intervensi tepat waktu kepada mahasiswa yang berisiko tidak lulus. Penggunaan data tersebut untuk pengambilan keputusan dapat memberikan wawasan yang lebih mendalam mengenai kinerja mahasiswa. Tanpa pemanfaatan data ini, institusi kehilangan kesempatan untuk mendukung mahasiswa dengan cara yang lebih proaktif. Masalah ini penting diangkat karena prediksi kelulusan yang akurat dapat membantu institusi pendidikan dalam mengidentifikasi mahasiswa yang membutuhkan bantuan lebih dini, sehingga meningkatkan tingkat kelulusan secara keseluruhan. Dengan peningkatan popularitas pendidikan jarak jauh, kemampuan untuk memonitor dan mendukung mahasiswa secara efektif menjadi semakin kritis. Dengan memahami pola aktivitas yang terkait dengan kelulusan, institusi dapat merancang strategi yang lebih baik untuk mendukung kesuksesan akademis mahasiswa.
Untuk menyelesaikan masalah ini, digunakan metode Decision Tree C4.5 karena metode ini terkenal akan kemampuannya dalam menangani dataset dengan atribut yang kompleks dan beragam. Metode C4.5 dipilih karena dapat menghasilkan model yang mudah dipahami dan diinterpretasikan, sehingga memudahkan pihak universitas dalam mengambil keputusan. Algoritma ini juga memiliki kemampuan untuk menangani data yang hilang dan atribut kontinu, yang sering ditemukan dalam data aktivitas mahasiswa. Implementasi dari metode ini akan melibatkan pembersihan data, pembagian data menjadi data latih dan data uji, serta pembangunan model untuk memprediksi kelulusan. Dengan menggunakan Decision Tree C4.5, diharapkan dapat diperoleh model prediksi kelulusan yang akurat dan dapat diandalkan. Hasil dari penelitian ini adalah akurasi sebesar 56.81% dengan 15.382 mahasiswa lulus, 7.168 mahasiswa withdrawn dan 6.678 mahasiswa tidak lulus.