ABSTRAKSI: Ilmu nahwu dan ilmu sharaf merupakan cabang dari ilmu Bahasa Arab. Ilmu nahwu mengkaji tiga hal yaitu huruf, kata, dan kalimat. Adapun jenis kata/kelas kata secara umum yaitu huruf, kata benda, dan kata kerja [16]. Ilmu nahwu memiliki keterkaitan dengan ilmu sharaf, yaitu ilmu yang mempelajari tentang bentuk kata dan perubahannya dengan penambahan maupun pengurangan huruf [3]. Dengan mempelajari bahasa Arab, maka akan sangat membantu orang dalam memahami makna yang terkandung dalam Al-Qur`an.
Stemming merupakan suatu proses untuk menemukan kata dasar dari sebuah kata dengan cara menghilangkan semua imbuhan. Stemming digunakan untuk mengganti bentuk suatu kata menjadi kata dasar sesuai dengan morfologi yang baik dan benar [11]. Pattern-based Stemmer merupakan penerapan algoritma pencarian stem dari suatu kata berbahasa Arab yang menerapkan morphological anlysis technique dan affix removal technique. Dengan mengacu pada pola yang disimpan dalam sistem, maka dapat ditentukan stem beserta kelas katanya.
Dilakukan pengujian untuk mengetahui pengaruh jumlah term, pola, dan rule yang disimpan dalam sistem terhadap performansi sistem. Berdasarkan hasil pengujian, performansi terbaik didapatkan dengan menyimpan lebih banyak pola bebas afiks, menyimpan lebih banyak rule penentu kelas kata, dan menambahkan proses pengecekkan penghapusan afiks pada sistem.Kata Kunci : teks arab, stemming, kata dasar, kelas kata.ABSTRACT: Nahwu and sharaf are branch of Arabic language. Nahwu is knowledge about letter/character, word, and sentence. Word class/word type that commonly known is letter, noun, and verb[16]. Nahwu has relevance with sharaf, knowledge about word shape and its changing by adding or substracting the letter[3]. By studying Arabic language, it will very helpful to understand the meaning of Alqur’an.
Stemming is a process to find stem from word by removing all suffixes and prefixes. Stemming is used to replace word shape to stem according to good and appropriate morphology[11]. Pattern-based Stemmer is algorithm implementation to find stem from Arabic word that implement morphological analysis technique dan affix removal technique. By referring to pattern in system, then stem and word class can be decided.
Testing is done to know the effect of the number of terms, patterns, and rules that saved in system to system’s performance. The result shows that the best performance happened by saving more free-affix pattern, saving more rule to decide word class, and adding proses to check the affix erasing in system.Keyword: Arabic text, stemming, stem, word class.