Jumlah dokumen yang banyak menjadi masalah
utama untuk sistem pendeteksi plagiat. Sistem pendeteksi plagiat
yang sudah ada kebanyakan melakukan perbandingan dokumen
query ke semua dokumen satu per satu, lalu memberikan daftar
nilai similaritas yang digunakan untuk menentukan dokumendokumen
mana saja yang berplagiat dengan dokumen lain. Hal
ini memungkinkan terjadinya ledakan kombinasi antar
dokumennya, sehingga memerlukan waktu proses yang cukup
lama. Solusi yang ditawarkan adalah dengan pemanfaatan
indexing untuk memetakan dokumen dan pengeliminasian
dokumen berdasarkan pemetaan tersebut. Selain itu, proses
pencocokkan untuk deteksi plagiat yang akan digunakan teknik
graph, sehingga pencocokkan dapat dilakukan secara paralel.
Dengan kombinasi seperti ini, diharapkan waktu pemrosesan
dapat diminimalisir yang menghasilkan sistem dengan waktu
pemrosesan cepat. Dari hasil penelitian terlihat bahwa tren
waktu dengan implementasi indeks membuat waktu proses query
bergerak linier, tidak seperti sebelumnya yang bergerak
eksponensial.
sistem pendeteksi plagiat, scapegoat tree, indexing, document index graph