Metode Boosting untuk Kategorisasi Berita Berbahasa Indonesia yang Multi-Label

Intan Nurma Yulita

Informasi Dasar

113040292
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Saat ini penggunaan internet telah memicu pertumbuhan dan pertukaran informasi menjadi jauh lebih pesat dibandingkan sebelumnya. Begitu pula dengan volume berita elektronik berbahasa Indonesia. Banyaknya jumlah berita tersebut dapat menyebabkan user mengalami kesulitan dalam mencari berita yang mereka inginkan. Text Categorization merupakan salah satu solusi yang dapat dilakukan, yaitu dengan cara mengelompokan berita kedalam kategori tertentu. Salah satu permasalahan dalam bidang Text Categorization adalah karakteristik data yang mempunyai lebih dari satu label (multi-label).
Salah satu metode Text Categorization untuk kasus multi-label adalah BoosTexter. BoosTexter adalah metode Boosting yang didesain khusus untuk kategorisasi teks. Boosting merupakan salah satu Ensemble Method yang menghasilkan classifier dengan akurasi tinggi melalui kombinasi weak hypotheses.
Untuk mengevaluasi performansi BoosTexter yang diimplementasikan, digunakan Hamming Loss, One Error, dan Coverage. Hasil yang didapat menunjukkan bahwa BoosTexter dapat memprediksi semua label aktual dari tiap instance serta menempatkan label actual pada rangking teratas dengan baik. Namun kelemahannya adalah dalam melakukan perangkingan semua label instances. Selain itu, kenaikan iterasi pada BoosTexter tidak mampu memperbaiki error iterasi tapi dapat memperbaiki nilai rata-rata error secara keseluruhan.
Kata Kunci : Text Categorization, Multi-Label, Boosting, BoosTexterABSTRACT: Today, internet's using has made the growth and exchanging of informations become higher than before. And as same as with the volume of Indonesian electronic news. Large number of information can causes the users get into trouble in finding information that they want. Text Categorization, which is one of the solution for this problem, which is the task of assigning news to pre-specified categories of news. One of problem in Text Categorization is the characteristic data which have more than one label (multi-label).
One of Text Categorization method for multi-label case is BoosTexter. BoosTexter is method which developed from original Boosting and designed for text categorization. Boosting is one of Ensemble Method for creating a highly precise classifier by combining weak hypotheses.
For evaluating the performance of implemented BoosTexter, we used Hamming Loss, One Error, and Coverage. The result show that BoosTexter can predict all of instances labels and the top-ranked label was in the set of possible labels. But the weakness of BoosTexter is less rank to all of instances labels. Beside that, BoosTexter can not improve iteration error but it can improve overall error.
Keyword: Text Categorization, Multi-Label, Boosting, BoosTexter.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Metode Boosting untuk Kategorisasi Berita Berbahasa Indonesia yang Multi-Label
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Intan Nurma Yulita
Perorangan
Moch Arif Bijaksanaech, Yuliant Sibaroni
 

Penerbit

Universitas Telkom
Bandung
2008

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini