Implementasi dan Analisis TextRank pada Ekstraksi Kata Kunci

Hariyati Lubis

Informasi Dasar

111 kali
113050202
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Banyaknya ketersediaan informasi digital dalam bentuk dokumen teks saat ini tidak berarti pencarian dan identifikasi dokumen yang dibutuhkan mudah dilakukan. Salah satu cara untuk mengidentifikasi dokumen adalah melalui kata kunci. Namun tidak semua dokumen teks dilengkapi kata kunci.
Pengekstraksi kata kunci merupakan sistem yang dapat mengekstrak kata kunci secara otomatis dari teks. Pengekstraksi kata kunci yang dibuat dalam Tugas Akhir ini mengimplementasikan algoritma TextRank yang berbasis graf. TextRank untuk ekstraksi kata kunci mempunyai 3 parameter inputan, yaitu jenis graf, filter kata, dan ukuran window.
Pengujian dilakukan dengan cara melakukan perubahan pengaturan parameter TextRank dan membandingkan kata kunci hasil keluaran sistem dengan kata kunci manual yang telah tersedia di setiap abstrak. Pengujian juga dilakukan terhadap penggunaan beberapa variasi nilai damping factor dan threshold. Parameter uji yang digunakan adalah recall. Dari hasil pengujian, graf undirected dan filter kata benda menghasilkan nilai uji yang lebih baik di hampir semua ukuran window daripada graf dan filter kata lain. Secara umum, nilai recall semakin baik jika nilai damping factor semakin besar meskipun tidak terlalu signifikan dan nilai recall tidak terlalu dipengaruhi nilai threshold.Kata Kunci : kata kunci, ekstraksi kata kunci, textrankABSTRACT: The abundant amount of digital information in the form of text does not mean the searching and the identification of the needed document can be done easily. One way to identify a document is by keywords. However, not all documents are provided with keywords.
Keyword extraction is a system to automatically extract a set of keywords from text. Keyword extraction built for this final work implements TextRank, a graph-based algorithm. TextRank for keyword extraction has 3 input parameters, which are graph type, word filter, and window size.
Testing was done by changing the setting of TextRank parameters and comparing system’s keywords with human’s keyword. The experiment was also done using various damping factor and threshold values. Testing parameter used in this final work are recall. From testing, the using of undirected graph and verb filter results in better testing parameters’ values in almost sizes of window than other using of graphs and word filters. In general, recall increases when damping value is bigger although it’s not significant and recall is not really influenced by threshold value.Keyword: keyword, keyword extraction, textrank

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Implementasi dan Analisis TextRank pada Ekstraksi Kata Kunci
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Hariyati Lubis
Perorangan
Warih Maharani, Angelina Prima Kurniati
 

Penerbit

Universitas Telkom
Bandung
2010

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini