ANALISIS ALGORITMA STEMMING CONFIX-STRIPPING (CS) UNTUK TEKS BERBAHASA INDONESIA PADA INFORMATION RETRIEVAL

Wirda Puspita

Informasi Dasar

142 kali
113040314
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Stemming merupakan proses pemotongan imbuhan seperti awalan, akhiran, sisipan, dan kombinasi yang dilakukan dengan menggunakan algoritma tertentu untuk mengembalikan suatu kata ke bentuk dasarnya. Stemming merupakan bagian dari information retrieval dan digunakan pada mesin pencari. Dengan menerapkan stemming pada mesin pencari, maka dapat diperoleh informasi yang lebih spesifik dari banyaknya informasi yang ada. Stemming merupakan inti dari teknik pemrosesan natural language untuk mendapatkan information retrieval yang efektif dan efisien.

Pada Bahasa Indonesia, suatu kata dapat digabungkan dengan awalan, akhiran, sisipan, ataupun kombinasi. Hal tersebut dapat menyebabkan sulitnya pencocokan kata yang berhubungan. Beberapa penggabungan dapat menyebabkan perubahan pada akar kata. Dalam pengolahan teks berbahasa Indonesia, dapat digunakan teknik stemming. Stemming dalam information retrieval system digunakan untuk membatasi varian bentuk kata yang berbeda menjadi bentuk dasarnya, sehingga nantinya akan dapat meningkatkan kemampuan sistem dalam menemukan dokumen relevan sesuai query yang ada. Dalam tugas akhir ini, akan mengimplementasikan teknik stemming dengan menggunakan algoritma Confix-Stripping pada information retrieval system.

Algoritma Confix-Stripping (CS) berdasarkan pada aturan morfologi bahasa Indonesia yang dikelompokkan menjadi satu dan di-enkapsulasi pada imbuhan, termasuk awalan, akhiran, sisipan, dan kombinasi. Algoritma Confix-Stripping (CS) menggunakan tiga komponen: kumpulan imbuhan, rule-rule, dan kamus. Pada tugas akhir ini akan dilakukan analisis penerapan algoritma Confix-Stripping (CS) tersebut pada Information Retrieval system.Kata Kunci : sistem temu kembali informasi, stemming, Confix-StrippingABSTRACT: Stemming is the process of removal of affixes on like prefixes, suffixes, infixes, and confixes performed using a specific algorithm to restore a word into its basic form. Stemming is part of information retrieval and use on search engines. By applying the stemming on the search engine, then it can obtain more specific information than the amount of information available. Stemming is the core of natural language processing techniques to obtain information retrieval effective and efficient.

In Indonesian, a word can be combined with a prefix, suffix, infixess, or confixes. This causes the difficulty of matching related words. Some of the merger may cause changes in the root. In the Indonesian language text processing, can be used stemming technique. Stemming in information retrieval systems are used to limit the different variants of the word into its basic form, so that later can increase the system's ability to find relevant documents according to the existing query. In this final paper, would implement stemming technique using confix-stripping algorithm in information retrieval systems.

Confix-stripping algorithm (CS) based on morphology Indonesian rule, which are grouped together and encapsulated in affixes, including prefixes, suffixes, infixes, and confixes. Confix-stripping algorithm (CS) using three components: a collection of affixes, rules, and a dictionary. In this final paper analysis will be conducted confix-stripping algorithm (CS) is the Information Retrieval system.Keyword: information retrieval, stemming, confix-stripping

Subjek

Rekayasa Perangkat Lunak
 

Katalog

ANALISIS ALGORITMA STEMMING CONFIX-STRIPPING (CS) UNTUK TEKS BERBAHASA INDONESIA PADA INFORMATION RETRIEVAL
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Wirda Puspita
Perorangan
Arie Ardiyanti Suryani, Yanuar Firdaus A.W.
 

Penerbit

Universitas Telkom
Bandung
2011

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini