ABSTRAKSI: Semakin berkembangannya pengaksesan berita melalui internet membuat kemudahan pengaksesan tersebut menjadi sebuah hal yang sangat penting bagi masyarakat. Guna memudahkan proses pengaksesannya, maka perlu adanya suatu proses pengolahan berita agar menjadi lebih teratur dan efisien, sehingga pengaksesan untuk berita-berita lampau pun menjadi relatif lebih mudah. Salah satu proses pengolahan tersebut adalah klasifikasi. Sebelum melakukan klasifikasi, terlebih dahulu perlu adanya preprocessing data dimana salah satu tahap preprocessing adalah stemming.
Stemming adalah proses untuk memecah setiap varian-varian suatu kata menjadi kata dasar. Salah satu metode stemming yang ada adalah successor variety. Successor variety adalah metode stemming yang berdasarkan pada batasbatas morfem, yang menggunakan pengetahuan dari structural linguistic. Ada beberapa metode successor variety, beberapa diantaranya adalah cutoff dan entropy method. Kedua metode stemming tersebut diterapkan pada sebuah sistem yang kemudian dilihat bagaimana performansinya.
Hasil dari implementasi kedua metode tersebut adalah perbandingan performansi kedua metode yang diterapkan berdasarkan data uji yang digunakan, metode entropy lebih baik dari pada metode cutoff dari segi akurasi, sedangkan dari segi ICF, ternyata cutoff yang lebih baik dari entropy. Sedangkan dari sisi klasifikasi, kedua metode tersebut memiliki performansi yang setara.Kata Kunci : klasifikasi, successor variety stemming, cutoff, entropyABSTRACT: The increasing of accessing news over the internet makes the easiness of accessing it has become a very important thing for the community. In order to simplify this process, there should be a news processing to make it well organized and efficient that can make the accessing of old news become relatively easier. One of the news processing is classification. Before performing the classification, we need to do the preprocessing data which one of this is stemming.
Stemming is the process for breaking any variants of a word into its basic word. One of stemming method is successor variety. Successor variety is a stemming method which is based on morpheme boundaries and uses the knowledge of structural linguistic. There are several methods of successor variety stemming, some if them are cutoff and entropy method. Both the stemming methods was applied to a system and be observed how it is perform.
Result from implementation of both methods is the comparation of the methods performance which based on the data used, the entropy method is better than the cutoff method from the accuracy, but from the ICF, cutoff is better than entropy. But in term of classification, both methods have an equivalent performance.Keyword: classification, successor variety stemming, cutoff, entropy