Analisis dan Implementasi Identifikasi Parafrasa Tweet Menggunakan Algoritma BLEU, Meteor dan Edit distance

DENNIS HIDAYAT

Informasi Dasar

17.04.2293
C
Karya Ilmiah - Skripsi (S1) - Reference

Identifikasi Parafrasa merupakan sebuah percabangan dari studi NLP yang menganalisa kemungkinan parafrasa pada dua data lingual atau lebih yang berbeda. Situs microblogging Twitter merupakan contoh nyata, sebuah berita yang memiliki informasi dapat ditulis ulang dengan informasi yang sama dan konsep berbeda, walaupun kedua berita tersebut memiliki elemen leksikal yang berbeda atau mungkin memiliki struktur sintaksis yang berbeda namun memiliki makna yang sama dapat disebut sebagai parafrasa. Dalam mengenali suatu bentuk parafrasa dapat dilakukan oleh evaluasi manusia, namun evaluasi parafrasa oleh manusia membutuhkan biaya yang besar dan waktu yang lebih lama, hal ini bisa menjadi masalah besar untuk developer.

Automatic metric adalah sebuah mesin evaluasi otomatis yang menggunakan fitur-fitur yang dapat digunakan sebagai ekstraksi lingual sehingga menghasilkan nilai (score) yang dapat digunakan sebagai ukuran parafrasa dua buah kalimat yang dibandingkan. Pada penelitian ini digunakan tiga algoritma automatic metric yaitu BLEU, METEOR, Damerau-Levensthein Edit Distance yang menguji nilai parafrasa dari data Twitter yang sama. Selain itu dilakukan analisis terhadap performa algoritma dengan membandingkan nilai korelasi human judgement antara BLEU, METEOR, Damerau-Levensthein Edit Distance.

Dari hasil simulasi yang dilakukan pada penelitian ini, diperoleh akurasi tertinggi dengan menggunakan metric METEOR dengan nilai akurasi 0,55 dan F1 sebesar 0,76. nilai tertinggi kedua didapatkan dengan metric BLEU dengan nilai akurasi 0,05 dan nilai F1 sebesar 0,70. Nilai akurasi terendah ditemukan pada metric Edit Distance dengan perolehan nilai akurasi 0,44 dan F1 sebesar 0,30.

Subjek

DATA MINING
 

Katalog

Analisis dan Implementasi Identifikasi Parafrasa Tweet Menggunakan Algoritma BLEU, Meteor dan Edit distance
 
 
 

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

DENNIS HIDAYAT
Perorangan
Moch. Arif Bijaksana
 

Penerbit

Universitas Telkom
Bandung
2017

Koleksi

Kompetensi

  • CDG4K3 - DATA MINING

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini