Peringkasan Multi Dokumen
adalah metode untuk menghasilkan suatu ringkasan
tunggal dari
beberapa dokumen yang memiliki kemiripan atau saling berhubungan. Metode
ini sangat membantu dalam menyelesaikan masalah
information overload
, karena
menghas
ilkan
document summary
/ ringkasan dokumen untuk dibaca daripada haru
s
membaca sekian banyak dokumen, tanpa menghilangkan inti ataupun kalimat
kalimat
penting dari dokumen tersebut
Pada Tugas Akhir ini,
sudah
diimplementasikan
metode
Agglomerative
Cluste
ring
dan
Ekstraksi Fitur Spesifik Kalimat
pada
Peringkasan Multi Dokumen
. Dari implementasi
tersebut, dilakukan skenario pengujian dengan menggunakan inputan sebanyak 5
dokumen, 15 dokumen dan 30 dokumen. Ditemukan bahwa
clustering
dengan
menggunakan agglo
merative
clustering
untuk inputan sebanyak 5 dokumen dan 15
dokumen dapat menghasilkan
cluster
dokumen yang memiliki nilai varian
cluster
sangat
baik pada kondisi terminasi lebih kurang 70 %. Sedangkan pada dokumen uji sebanyak 30
dokumen, kondisi termin
asi yang dapat menghasilkan
cluster
yang beranggotakan
dokumen yang memiliki topik hampir serupa adalah lebih kurang 40 %. Jika dilihat dari
seluruh percobaan,
clustering
dengan inputan 5 dan 15 dokumen menghasilkan
cluster
yang
jauh lebih
baik
dibandingka
n dengan
inputan 30 dokumen berdasarkan varian cluster
yang ditemukan
.
Selain itu dilakukan juga pengujian terhadap ringkasan yang dihasilkan
dengan
compression rate
10%, 20% dan 30%. Dengan menggunakan ROUGE
Evaluation
Toolkit
,
diperoleh ringkasan yang
terbaik pada
compression rate
30 % berdasarkan hasil F
Measure yang diperoleh.
clustering , peringkasan dokumen, compression rate, fitur spesifik kalimat