ABSTRAKSI: Banyaknya ketersediaan informasi digital dalam bentuk dokumen teks saat ini tidak berarti pencarian dan identifikasi dokumen yang dibutuhkan mudah dilakukan. Salah satu cara untuk mengidentifikasi dokumen adalah melalui kata kunci. Namun tidak semua dokumen teks dilengkapi kata kunci.
Pengekstraksi kata kunci merupakan sistem yang dapat mengekstrak kata kunci secara otomatis dari teks. Pengekstraksi kata kunci yang dibuat dalam Tugas Akhir ini mengimplementasikan algoritma TextRank yang berbasis graf. TextRank untuk ekstraksi kata kunci mempunyai 3 parameter inputan, yaitu jenis graf, filter kata, dan ukuran window.
Pengujian dilakukan dengan cara melakukan perubahan pengaturan parameter TextRank dan membandingkan kata kunci hasil keluaran sistem dengan kata kunci manual yang telah tersedia di setiap abstrak. Pengujian juga dilakukan terhadap penggunaan beberapa variasi nilai damping factor dan threshold. Parameter uji yang digunakan adalah recall. Dari hasil pengujian, graf undirected dan filter kata benda menghasilkan nilai uji yang lebih baik di hampir semua ukuran window daripada graf dan filter kata lain. Secara umum, nilai recall semakin baik jika nilai damping factor semakin besar meskipun tidak terlalu signifikan dan nilai recall tidak terlalu dipengaruhi nilai threshold.Kata Kunci : kata kunci, ekstraksi kata kunci, textrankABSTRACT: The abundant amount of digital information in the form of text does not mean the searching and the identification of the needed document can be done easily. One way to identify a document is by keywords. However, not all documents are provided with keywords.
Keyword extraction is a system to automatically extract a set of keywords from text. Keyword extraction built for this final work implements TextRank, a graph-based algorithm. TextRank for keyword extraction has 3 input parameters, which are graph type, word filter, and window size.
Testing was done by changing the setting of TextRank parameters and comparing system’s keywords with human’s keyword. The experiment was also done using various damping factor and threshold values. Testing parameter used in this final work are recall. From testing, the using of undirected graph and verb filter results in better testing parameters’ values in almost sizes of window than other using of graphs and word filters. In general, recall increases when damping value is bigger although it’s not significant and recall is not really influenced by threshold value.Keyword: keyword, keyword extraction, textrank