ABSTRAKSI: Pencarian informasi pada masa yang serba canggih ini sangatlah mudah didapatkan. Hal tersebut secara tidak langsung membawa dampak positif dan negatif. Salah satu dampak negatifnya adalah terjadinya tindakan plagiarisme baik disadari maupun tidak. Dalam lingkungan alademik, tindakan plagiarisme merupakan perbuatan yang sangat tercela.
Untuk mencegah plagiarisme banyak cara dilakukan salah satunya pengecekan manual terhadap judul-judul karya ilmiah yang diajukan oleh mahasiswa kepada tim skripsi dengan skripsi-skripsi sebelumnya. Adapun beberapa masalah yang timbul dari pengecekan manual seperti terlalu memakan banyak waktu.
Untuk membantu mendeteksi dokumen yang terindikasi plagiat, dibuatlah sebuah sistem yang dapat menghitung nilai similarity antar dokumen dengan menggunakan metode Latent Semantic Analysis. Metode Latent Semantic Analysis digunakan untuk mencari dokumen yang memiliki kesamaan teks dengan melalui beberapa tahap seperti tokenizing, stoplist, dan stemming. Untuk perhitungannya menggunakan algoritma model ruang vektor.
Pada Tugas Akhir ini dilakukan dua skenario pengujian yaitu intra class dan ekstra class untuk mengetahui nilai similarity. Hasil pengujian skenario intra class ini dapat dilihat bahwa terdapat 119 abstrak terindikasi plagiat yang menunjukkan bahwa missed detection pada system terdapat pada 1 dokumen. Sedangkan pada skenario extra class pada fakultas yang sama maupun fakultas yang berbeda, masih menunjukkan terjadinya false detection dan menghasilkan nilai similarity yang melebihi threshold indikasi plagiat.Kata Kunci : plagiat, Latent Semantic Analysis, Singular Value Decomposition, Metode Ruang VectorABSTRACT: Information retrieval during the all-powerful is very easy to get. It indirectly bring positive and negative effects. One of the negative impacts is the act of plagiarism either consciously or unconsciously. In alademik environment, acts of plagiarism is a very despicable act.
To prevent plagiarism is one of many ways done manually checking the titles of scientific papers submitted by students to the team with the thesis-thesis thesis before. As for some of the problems arising from manual checks as too time consuming.
To help detect plagiarism indicated documents, they invented a system that can calculate the value of similarity between documents by using the method of Latent Semantic Analysis. Latent Semantic Analysis method is used to find documents that have the same text in several stages such as tokenizing, stoplist and stemming. For calculations using the vector space model algorithm.
In this final project conducted two test scenarios, namely intra-class and extra class to determine the value of similarity. The results of intra-class testing scenarios can be seen that there were 119 abstracts indicated that suggests that missed plagiarism detection system contained in one document. While in the scenario of extra classes in the same school or a different school, it still shows the false detection and produce similarity values which exceed the threshold indicative of plagiarism.Keyword: Plagiarism, Latent Semantic Analysis, Singular Value Decomposition, Vector Space Model.