Al-Qur’an adalah bentuk keajaiban yang abadi karena mencirikan kesempurnaan linguistik, benar, dan memvalidasi penemuan ilmiah terkini. Umat Islam wajib memahami serta mengamalkan perintah dan menjauhi larangan yang disebutkan dalam Al-Qur’an. Setiap ayat Al-Qur’an memiliki kandungan makna yang berbeda, serta dapat memiliki lebih dari satu topik yang dapat dikaji. Untuk memudahkan dalam mempelajari serta memahami ayat Al-Qur’an perlu dilakukan klasifikasi terhadap ayat-ayat Al-Qur’an. Pada penelitian Tugas Akhir ini dibangun sebuah classification model yang mampu mengidentifikasi kelas pada masing-masing ayat Al-Qur’an secara multi-label.
Pada penelitian sebelumnya, pendekatan probabilistik menghasilkan performa yang paling baik dibandingkan dengan pendekatan lain. Pendekatan probabilistik dianggap sudah common dalam menyelesaikan klasifikasi teks. Sehingga, pada penelitian ini classification model dibangun dengan menggunakan metode Tree Augmented Naïve Bayes (TAN). Dalam peningkatan performa sistem, digunakan Mutual Information (MI) untuk menyeleksi variabel-variabel dependent yang digunakan. Perhitungan performa yang dianggap sesuai untuk klasifikasi multi-label yaitu hamming loss.
Hasil pengujian yang telah dilakukan menunjukkan bahwa classification model yang dibangun dengan MI menghasilkan performa terbaik dengan nilai hamming loss sebesar 0.1121, sedangkan classification model yang dibangun tanpa MI menghasilkan nilai hamming loss sebesar 0.1208.