ABSTRAKSI: E-mail spam merupakan pesan yang tidak diinginkan yang biasanya masuk ke dalam akun e-mail kita secara otomatis dan dikirim secara massal. Isi dari e-mail spam ini bisa berbagai macam, seperti iklan, pornografi, serta berita penipuan. Pengiriman e-mail spam ke akun e-mail kita dapat menyebabkan dampak negatif. Penyaringan e-mail spam secara manual dapat menghabiskan waktu penerimanya karena harus dibedakan mana yang e-mail biasa dan mana yang e-mail spam. Oleh karena itu dibuatlah sistem untuk mengklasifikasikan e-mail yang termasuk ke dalam e-mail spam dan e-mail biasa.
Pada tugas akhir ini diimplementasikan metode Support Vector Machine dan Naive Bayes sebagai classifier. Selanjutnya dilakukan penelitian terhadap hasil akurasi, laju error, nilai reproduction ratio, dan nilai relevance ratio. Kemudian akan dilakukan analisis terhadap hasil pengujian sistem dengan menggunakan Support Vector Machine dan Naive Bayes.
Penelitian dalam tugas akhir ini menghasilkan nilai akurasi pada SVM linier sebesar 92.67058% dan laju error sebesar 7.32942%, reproduction ratio sebesar 93.27662% dan relevance ratio sebesar 94.59148%. Sedangkan dengan Naïve Bayes menghasilkan nilai akurasi sebesar 81.89082%, laju error sebesar 18.10918%, reproduction ratio sebesar 72.83212% dan relevance ratio sebesar 96.57188%.
Kata Kunci : klasifikasi, e-mail spam, support vector machine (SVM), naïve bayesABSTRACT: E-mail spam is an unsolicited message which usually goes into our e-mail account automatically and sent in bulk. The contents of this e-mail spam can be of various kinds, such as advertising, pornography, as well as news of fraud. Sending an e-mail spam to our e-mail account can cause a negative impact. Filtering spam e-mails manually can spend time because the recipient must be distinguished which the e-mails are regular and e-mail spam. Therefore, made a system for classifying e-mails which are regular and e-mail spam
In this final project, Support Vector Machine and Naive Bayes are implemented as classifier. Further examination of the results of the accuracy, error rate, reproduction ratio value, and relevance ratio value. Then performed an analysis of the results of testing the system by using Support Vector Machine and Naive Bayes.
The research in this final project produces an accuracy value of 92.67058%, the error rate of 7.32942%, reproduction ratio of 93.27662%, and the relevance ratio of 94.59148% with Linear SVM. While with the Naïve Bayes yield value of 81.89082 % accuracy, error rate of 18.10918 %, reproduction ratio of 72.83212 %, and relevance ratio of 96.57188 %.
Keyword: classification, e-mail spam, support vector machine (SVM), naïve bayes