Peringkasan multi-dokumen dibutuhkan agar pencarian informasi dapat berjalan lebih efisien dan efektif. Sistem peringkasan ini menggunakan framework ekstraksi yang telah secara luas digunakan untuk meringkas dokumen. Banyak metode yang dapat digunakan untuk membangun sistem peringkasan dokumen, salah satunya adalah Support Vector Regression (SVR). Untuk membobotkan kalimat digunakan empat fitur yaitu Word-based Feature, Semantic-based Wordnet Feature, Centroid Feature, dan Sentence Position Feature.
Pada sistem ini, Support Vector Regression digunakan untuk mengkombinasikan fitur-fitur untuk mendapatkan model yang akan digunakan untuk menilai tingkat kepentingan setiap kalimat yang selanjutnya menjadi pedoman dalam mengekstrak kalimat-kalimat yang penting untuk kemudian membangun ringkasan. Selain Support Vector Regression, model lain yang umum digunakan untuk peringkasan dokumen adalah model klasifikasi dan model perankingan melalui pembelajaran (learning-to-rank). Pemilihan Support Vector Model ini diharapkan dapat memberikan hasil ringkasan yang mendekati ideal, yaitu ringkasan yang dibuat oleh manusia. Akurasi ringkasan sistem dinilai menggunankan ROUGE (Recall-Oriented Understudy for Gisting Evaluation) dan menghasilkan akurasi sebesar 72%.
Peringkasan multi-dokumen, Support Vector Regression, ROUGE