ABSTRAKSI: Stemming dalam sistem Information Retrieval digunakan untuk membatasi varian bentuk kata yang berbeda menjadi bentuk dasarnya, sehingga nantinya dapat meningkatkan kemampuan sistem dalam menemukan dokumen relevan sesuai query yang ada. Sistem Information retrieval dikatakan ideal apabila dapat menemukan informasi yang relevan saja. Term yang ada pada query ataupun kumpulan informasi memiliki banyak varian morfologi sehingga term-term yang memiliki bentuk beda tidak akan dianggap ekivalen oleh sistem. Dalam tugas akhir ini, dibuat sebuah sistem Information retrieval yang mengimplementasikan teknik stemming dengan menggunakan algoritma Nazief & Adriani dan algoritma Ahmad Yusoff Sembok.
Algoritma Nazief & Adriani dan algoritma Ahmad Yusoff Sembok merupakan algoritma stemming untuk teks berbahasa indonesia. Perbedaan kedua algoritma ini ada pada proses penghilangan imbuhannya (affixes). Untuk Algoritma Nazief & Adriani, proses penghilangan imbuhan dilakukan pada akhiran (suffixes) terlebih dahulu. Sedangkan pada algoritma Ahmad Yusoff Sembok penghilangan imbuhan terlebih dahulu dilakukan pada awalan (prefixes).
Pada tugas akhir ini dilakukan analisis pengaruh penerapan stemming menggunakan algoritma Nazief&Adriani dan algoritma Ahmad Yusoff Sembok. Hasil penelitian menunjukkan bahwa dengan stemming sistem mampu mereduksi term yang dihasilkan sehingga mampu mengurangi ukuran index. Dari sudut pandang performansi sistem, bisa dikatakan penerapan algoritma Nazief&Adriani lebih baik dibanding algoritma Ahmad Yusoff Sembok dimana nilai recall selalu lebih besar daripada nilai precision, dan nilai recall pada algoritma Nazief&Adriani lebih besar dari nilai recall pada algoritma Ahmad Yusoff Sembok.Kata Kunci : Information Retrieval, Stemming, Algoritma Nazief & Adriani, Algoritma Ahmad Yusoff SembokABSTRACT: Stemming in Information Retrieval system is used to limit the different variant forms of the word into its basic form, so that later may improve the ability of the system in finding relevant documents according to existing queries. Information retrieval system is said to be ideal if it can find relevant information only. Terms that exist in the query or the collection of information has many morphological variants so that terms which have a different form will not be deemed equivalent by the system. In this thesis, created an Information retrieval system that implements a stemming technique using the algorithm and the algorithm Nazief & Adriani Sembok Ahmad Yusoff.
Nazief&Adriani algorithm and the algorithm is an algorithm Ahmad Yusoff Sembok stemming for Indonesian language text. The second difference of this algorithm is in the process of removal imbuhannya (affixes). For Algorithm Nazief & Adriani, affixes removal process performed on the suffix (suffixes) in advance. While the algorithm is the removal of affixes Ahmad Yusoff Sembok first performed on the prefix (prefixes).
In this final analysis was performed using the influence of the application of stemming algorithms and algorithms Nazief & Adriani Sembok Ahmad Yusoff. The results showed that the system is able to reduce the term stemming generated so as to reduce the size of the index. From the standpoint of system performance, to say the application of the algorithm Nazief & Adriani more better than algorithm Ahmad Yusoff Sembok recall where the value is always greater than the value of precision and recall values in the algorithm Nazief & Adriani greater than the value of a recall on Ahmad Yusoff Sembok algorithm.Keyword: Information Retrieval, Stemming, Algoritma Nazief&Adriani algorithm, Ahmad Yusoff Sembok algorithm