Informasi Umum

Kode

17.04.043

Klasifikasi

620.007 - Engineering research

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Text Mining

Dilihat

380 kali

Informasi Lainnya

Abstraksi

Semantic Textual Similarity merupakan salah satu task yang berada pada ranah Natural Language Procesing. Task yang dilakukan meliputi penghitungan skor similaritas makna dari pasangan teks yang diberikan. Dalam penelitian ini, teks berupa pasangan kata yang berasal dari tiga jenis dataset yang berbeda yaitu Simlex-999, WordSim-353 dan Rubenstein & Goodenough. Dari hasil penghitungan skor ini, didapatkan nilai similaritas yang merupakan tahapan awal dari implementasi pengembangan penelitian NLP selanjutnya.

Penghitungan skor dilakukan dengan dengan menggunakan bantuan library JWNL, lexical database WordNet, dengan menggunakan metode-metode yang terdapat pada IC seperti Resnik, Lin dan Jiang Conrath. Metode IC yang dipilih kemudian diterapkan pada lingkungan sistem yang berbeda, seperti melakukan pencarian nilai IC dengan menggunakan metode pengembangan penghitungan nilai hyponym dan dilakukan perbandingan terhadap penghitungan normal frekuensi, pengujian dengan dan tanpa penandaan sense, serta menganalisis perbedaan hasil pengujian berdasarkan karakteristik kata POS NOUN dan VERB. Dengan mengimpelementasikan pengembangan metode tersebut, dihasilkan bahwa metode Lin meraih nilai korelasi tertinggi diantara metode IC lainnya sebesar 85,5% pada dataset R&G, dan penghitungan nilai IC dengan frekuensi lebih baik dengan menggunakan penandaan sense, dan sebaliknya pada hyponym. Korelasi kata yang memiliki POS NOUN pun lebih tinggi dengan 59.8 % dibandingkan dengan VERB.

Kata kunci: Semantic Textual Similarity, Information Content, Lin, WordNet, SimLex-999, jumlah hyponym

  • IFG444 - TUGAS AKHIR II
  • CSH4H3 - PENAMBANGAN TEKS

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama FITRIZA MARSHA SAFIRA
Jenis Perorangan
Penyunting Moch. Arif Bijaksana, Mohamad Syahrul Mubarok
Penerjemah

Penerbit

Nama Universitas Telkom
Kota Bandung
Tahun 2017

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi