Analisis Dan Implementasi Stemming Teks Berbahasa Indonesia Dengan Menggunakan Porter Stemmer

NI NYOMAN BUDIASIH

Informasi Dasar

113078069
004
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Stemming merupakan suatu proses untuk menemukan kata dasar dari sebuah kata dengan menghilangkan semua imbuhan. Berdasarkan asumsi bahwa term yang memiliki akar kata yang sama akan selalu memiliki makna yang sama, stemming digunakan pada information retrieval untuk meningkatkan keakuratan retrieval (perolehan informasi). Sehingga membuat penulis melakukan implementasi stemming teks berbahasa Indonesia pada information retrieval.
Porter stemmer merupakan salah satu algoritma stemming yang telah lama digunakan. Porter Stemmer pertama kali dipublikasikan pada tahun 1980. Selain itu, Porter stemmer merupakan stemmer ini tidak menggunakan kamus, karena berdasarkan kenyataannya resource seperti kamus digital yang besar sangatlah mahal
Pada tugas akhir ini penulis mengimplementasikan Porter stemmer dan melakukan modifikasi pada Porter stemmer bila ditemukan stem yang tidak terdapat pada kamus yang digunakan. Setelah modifikasi, dilakukan perbandingan nilai keakuratan dari stem yang dihasilkan oleh Porter stemmer dan gabungan porter stemmer(stemmer hasil modifikasi Porter stemmer). Hasil dari pengujian menunjukkan bahwa stemming yang menggunakan gabungan porter stemmer menghasilkan keakuratan stem yang lebih baik dibandingkan dengan menggunakan Porter stemmer. Sehinggga dapat disimpulkan bahwa modifikasi yang dilakukan dapat meningkatkan keakuratan stem.
Pada tugas akhir ini dilakukan pula analisis pengaruh proses stemming terhadap relevansi dokumen yang diretrieve pada Information Retrieval. Stemming dilakukan dengan Porter stemmer dan gabungan porter stemmer. Hasil penelitian menunjukkan bahwa peninggkatan keakuratan stem pada banyak kasus menurunkan nilai precision akan tetapi tidak akan berpengaruh terhadap nilai recall.

Kata Kunci : Stemming, Information Retrieval, Precision, RecallABSTRACT: Stemming is the process of reducing morphological variants of a word to a common stem form. Stemming is a basic text processing tool often used for efficient and effective text retrieval, machine translation, document summarisation, and text classification. Based on assupmtion that term which have a common stem will usually have similar meaning, the stemming process is widely used in information retrieval as a way to improve retrieval performance
Porter stemmer is well-known stemming algorithms that publicated in 1980. This stemming algorithm was developed without dictionary look-up. It based on the fact that resource such as a large digital dictionary are expensive. In this final paper, the modification will done if stem with Porter stemmer are not in dictionary. The accuracy of stem with Porter stemmer and Combination porter stemmer(modification of Porter stemmer) will be analyzed. The parameter that used are Stemming Weight and ratio between total of correct stem and total of stem. The result shows that accuracy with Combination porter stemmer better than porter stemmer.
Besides that, the influence of accuracy stem in information retrieval was analyzed. In this case, parameter precision and recall are used to measure that influence. The result shows that accuracy of stem is might decreace precision and increase .recall.
Keyword: Stemming, Information Retrieval, Precision, Recall

Subjek

Sistem Komputer dan Jaringan Komputer
 

Katalog

Analisis Dan Implementasi Stemming Teks Berbahasa Indonesia Dengan Menggunakan Porter Stemmer
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

NI NYOMAN BUDIASIH
Perorangan
Tjokorda Agung Budi Wirayuda, Retno Novi Dayawati
 

Penerbit

Universitas Telkom
Bandung
2009

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini