Analisis dan Implementasi Kesamaan Semantik Antar Kata Berbahasa Inggris Menggunakan Pointwise Mutual Information Max dengan Wikipedia Sebagai Corpus

SHERVANO NOADIAS S

Informasi Dasar

18.04.2601
C
Karya Ilmiah - Skripsi (S1) - Reference

Sejumlah besar data informasi dapat disimpan dalam basis data di internet. Salah satu jenis data informasi yang sering digunakan oleh manusia adalah data dalam bentuk teks. Selama menggunakan data teks untuk mencari sesuatu di internet biasanya memanfaatkan kata kunci, padahal satu kata bisa saja memiliki makna yang berbeda. Misalnya mencari kata “bat” di internet, bisa saja search engine akan menampilkan artikel tentang kelelawar atau alat pemukul baseball. Seiring adanya kasus tersebut memicu penelitian yang terkait data teks meningkat, penelitian ini sering disebut dengan text mining. Salah satu implementasi dari penelitian data teks adalah semantic similarity yaitu melihat kemiripan makna pasangan kata dengan memberikan nilai similarity. Untuk menganalisis kemiripan makna pada pasangan kata diperlukan adanya suatu sistem yang dapat menghitung nilai kemiripan antara sepasang kata dengan menggunakan metode PMImax dan menggunakan gold standard untuk mendapatkan nilai korelasi sistem sebagai evaluasi. Dari hasil penelitian menggunakan korelasi pearson, didapat nilai korelasi terbesar yaitu 0.71 (Miller-Charles) dan nilai korelasi terkecil adalah -0.03 (SimLex-999). Hal tersebut disebabkan karena banyak pasangan kata yang ada didalam gold standard (Miller-Charles) ada didalam korpus wikipedia sehingga memiliki ni- lai similarity. Sedangkan untuk gold standard (SimLex-999) banyak pasangan kata yang tidak ada didalam korpus wikipedia, sehingga nilai similarity menghasilkan nilai 0.

Subjek

Text mining
 

Katalog

Analisis dan Implementasi Kesamaan Semantik Antar Kata Berbahasa Inggris Menggunakan Pointwise Mutual Information Max dengan Wikipedia Sebagai Corpus
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

SHERVANO NOADIAS S
Perorangan
MOCH. ARIF BIJAKSANA
 

Penerbit

Universitas Telkom
Bandung
2018

Koleksi

Kompetensi

  • CSH4O3 - PEMROSESAN BAHASA ALAMI
  • CSH4G3 - PENAMBANGAN DATA
  • CSH4H3 - PENAMBANGAN TEKS
  • CCH4D4 - TUGAS AKHIR
  • CII4G3 - PEMROSESAN BAHASA ALAMI
  • CII4I3 - PENAMBANGAN DATA
  • CII4E4 - TUGAS AKHIR
  • CPI4I3 - PENAMBANGAN DATA
  • III4A4 - TUGAS AKHIR

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini