ABSTRAKSI: Mesin translasi berbasis statistik merupakan suatu teknik pemrosesan bahasa alami berdasarkan ilmu statistik dengan menggunakan model pembelajaran dari sekumpulan kalimat (corpus) sebagai data latihnya. Dua faktor yang sangat berpengaruh dalam proses pelatihan adalah penentuan teknik word alignment (penjajaran kata) dan reordering model (model pengurutan) dari kedua bahasa yang dilatihkan.
Dalam Tugas Akhir ini dilakukan pengujian untuk memahami dan mengetahui efektivitas berbagai metode word alignment dan reordering model pada translator berbasis statistik jika digunakan untuk menerjemahkan kalimat-kalimat dari bahasa Inggris ke bahasa Indonesia. Pengujian dilakukan dengan cara melatih corpus menggunakan teknik word alignment dan reordering model yang diinginkan. Hasil pembelajarannya digunakan untuk menerjemahkan sekumpulan kalimat uji yang belum dilatihkan. Kalimat terjemahan tersebut kemudian dinilai kualitasnya, dan selanjutnya akan dilakukan analisa perbandingan kinerja dari tiap teknik yang digunakan.
Hasil pengujian menunjukkan bahwa metode grow-diag dan final-and memberikan rata-rata kinerja terbaik. Sementara untuk reordering model, walaupun hasil pengujian tidak menunjukkan model tertentu dengan kinerja terbaik, namun diketahui bahwa penerapan reordering model dalam sistem memberikan kenaikan yang cukup signifikan terhadap kinerja sistem pada pasangan bahasa Inggris-Indonesia.
Kata Kunci : translator berbasis statistik, word alignment, reordering modelABSTRACT: Statistical based machine translation is a natural language processing technique based on statistics by using learning model from a group of sentences (corpus) as training data. Two factors which has major influence in training process are word alignment and reordering model.
This final project conducted some tests to know and understand evectiveness of some word alignment method and reordering model on statistical based translator if used to translate sentences from English to Indonesian. The tests was done by train corpus using certain word alignment and reordering model, and use the trained systems to translate a group of untrained test sentences.
The tests results shows that grow-diag and final-and method gives the best average score. While for reordering model, though the results doesn't point on certain model as the best, it was concluded that using reordering model would gives a significant increase in system's performance, especially for English-Indonesian pair.
Keyword: statistical based machine translation, word alignment, reordering model