Informasi Umum

Kode

113030052

Klasifikasi

005.1 - Computer programming

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Informatika Teori Dan Pemrograman

Dilihat

453 kali

Informasi Lainnya

Abstraksi

ABSTRAKSI: Kebutuhan akan adanya pengolah kata yang bisa memberikan fasilitas pengoreksian ejaan kata dalam bahasa Indonesia dirasa sangat penting. Jika sebuah kamus elektronik tersedia dan mencakup semua kemungkinan kata, pemilihan representasi kamus (lexicon) dan teknik untuk mencari kandidat-kandidat kata yang bagus untuk kata yang salah tersebut sangat penting. Pada tugas akhir ini, digunakan sebuah acyclic deterministic finite automata (ADFA) sebagai representasi lexicon karena dapat mengecek keberadaan suatu kata dalam lexicon dengan cepat dan teknik Levenshtein-automata untuk mencari kandidat-kandidat koreksi yang bagus. Levenshtein-automata merepresentasikan sebuah acyclic DFA yang membentuk himpunan semua string dimana jarak editnya dengan string masukan tidak melebihi batasan yang sudah ditentukan (levenshtein-distance) [11]. Karena struktur morfologi kata dalam Bahasa Indonesia sangat kompleks maka jika sebuah kata tidak ada dalam lexicon diperlukan sebuah proses stemming. Stemming adalah proses pengambilan kata dasar dari kata kerja yang berimbuhan. Dari hasil pengujian didapatkan nilai akurasi fungsi stemming untuk pengecekan teks adalah 96,75768 % dan validitas koreksi kata yang diberikan adalah 82,37623 %.<br>Kata Kunci : pengoreksian ejaan kata, Levenshtein-automata, Levenshtein-distance, ADFA, stemming.ABSTRACT: The need of word processor that have spell correction fasility in Bahasa Indonesia is very important. If an electronic dictionary is available that covers the possible input words, the choice of dictionary representation and the technique how to find good corrections candidates for a garbled input word is very important. In this final project, we use an acyclic deterministic finite automata (ADFA) as an effective representation of the lexicon that allows fast checking for the existence of a word in the lexicon and the Levenshtein-automata technique to find good corrections candidates. A Levenshtein-automaton represents an acyclic DFA, which encodes the set of all string, whose edit distance from the input string does not exceed the given bound k (levenshtein-distance) [11]. Because of the morphological structure of Bahasa Indonesia words is complicated then if a word is absent from the lexicon, the stemming is needed. Stemming is a process to find base/common word from word that have preffix and suffix. The testing result shows that the accuration of stemming function for checking texts is 96,75768 % and the validity of candidate corrections is 82,37623 %.Keyword: Spell correction, Levenshtein-automata, Levenshtein-distance, ADFA,<br>

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama FIRDAH TIA YULIANA
Jenis Perorangan
Penyunting Ririn Dwi Agustin, Arie Ardiyanti Suryani
Penerjemah

Penerbit

Nama Universitas Telkom
Kota Bandung
Tahun 2007

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi