Analisa dan Implementasi Metode Ensemble Random Forest dan Algoritma C4.5 Untuk Klasifikasi Data Email Spam

Ridha Ramadhansyah

Informasi Dasar

113070196
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Berkembangnya kemajuan teknologi komunikasi saat ini memudahkan orang-orang untuk berkomunikasi. Salah satu teknologi komunikasi yang sering digunakan adalah email. Email sendiri adalah suatu metode pertukaran pesan pesan digital antara satu orang pembuat pesan ke satu atau banyak penerima. Email sendiri sekarang sering disalah gunakan untuk kepentingan pribadi, kelompok atau organisasi. Terkadang seseorang pemilik email menerima pesan yang tidak diinginkan dari orang yang tidak dikenal. Email ini disebut sebagai email spam. Salah satu cara untuk menangani ini adalah melakukan pemfilteran email spam berdasarkan konten. Metode learning pohon keputusan dengan algortima C4.5 dapat digunakan untuk menangani permasalahan tersebut.Untuk mendapatkan kinerja pohon keputusan yang baik dapat menggunakan metode ensemble Random Forest. Random Forestmengunakan kombinasi dari beberapa pohon keputusan dengan inputan jumlah feature yang akan digunakan pada pohon keputusan. Penggunaan jumlah feature yang tepat akan menghasilkan nilai akurasi yang baik dalam memfilter data spam atau ham.Kata Kunci : pemfilteran email, pohon keputusan, algoritma C4.5, metode ensemble, random forest, akurasi.ABSTRACT: The development of communication technology nowadays make people can communicate easily. One of the communication technology that is often used is email. Email is a method of digital messages exchange between person who make the message to one or many recipients. Email nowadays is often misused for personal interest, groups or organizations. Sometimes the owner of an email received unwanted messages from the strangers . This kind of email is called as spam email. One way to handle this problem is doing spam filtration based on the content. C4.5 algorithm decision tree learning method can be used to handle these problems. To get a good performance of decision tree, Random Forest ensemble method can be used. Random Forest is using a combination of several decision trees to input the number of features that will be used in the decision tree. The using of the appropriate amount of features will produce good accuracy in filtering spam data or ham.Keyword: email filtering,decision tree, C4.5 algorithm, ensemble method, random forest, accuracy.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisa dan Implementasi Metode Ensemble Random Forest dan Algoritma C4.5 Untuk Klasifikasi Data Email Spam
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Ridha Ramadhansyah
Perorangan
Arie Ardiyanti Suryani, Kemas Rahmat Saleh Wiharja
 

Penerbit

Universitas Telkom
Bandung
2011

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini