ABSTRAKSI: Pada Tugas Akhir ini dibuat sistem yang dapat mengembalikan informasi dalam lintas bahasa. Sistem ini diharapkan dapat menerjemahkan query dalam bahasa lain, selain itu diharapkan dapat melakukan pengindeksan dan pencarian dokumen dalam bahasa yang berbeda.
Sistem ini mengimplementasikan model ruang vektor yaitu salah satu model pada information retrieval yang menentukan kemiripan (similarity) antara dokumen dengan query dengan cara merepresentasikan dokumen dan query dalam bentuk vektor. Sistem ini diharapkan dapat mengakomodasikan kebutuhan user untuk mendapatkan dokumen yang relevan dari bahasa yang berbeda dengan bahasa query. Koleksi dokumen yang digunakan yaitu dokumen berbahasa Indonesia dan dokumen berbahasa Inggris.
Pada penerjemahan query, penerjemahan dengan menggunakan teknik nilai kemiripan statistik lebih baik dibandingkan pengambilan terjemahan pertama dan pengambilan semua terjemahan. Sedangkan untuk sistem Monolingual Information Retrieval mempunyai performansi lebih baik dibandingkan dengan Cross-Language Information Retrieval.Kata Kunci : nilai kemiripan statistik, cross language information retrievalABSTRACT: The final project creates a system that can retrieval information in cross language. This system wished can translating query to the other language, and than wished can indexing and to find out the document in the different language.
This system implemented vector space model namely a type of model in information retrieval whose decide similarity betwen document with query that representating document and query into a vector. Cross-language information rertrieval system wished can accomodate the user need to get a relevant document from different language with the query language. The document collection that used in this work are indonesian language document and english language document.
In query translation, translation used a similarity value statistic technique better than first translation and all translation. Performance of Monolingual Information Retrieval system better than Cross-Language Information Retrieval.Keyword: similarity value statistic, cross-language information retrieval