Informasi Umum

Kode

16.04.1138

Klasifikasi

006.312 - Data mining

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Text Mining

Dilihat

210 kali

Informasi Lainnya

Abstraksi

Natural Language Processing atau premrosesan bahasa alami merupakan sebuah disiplin ilmu yang khusus mengolah teks yang ditulis langsung oleh manusia yang bersifat tidak terstruktur. Pengukuran semantic similarity antar kata merupakan salah satu tugas penerapan dari Natural Language Proccessing yang intinya adalah mencari skor semantic similarity antar kata. Skor tersebut menunjukkan seberapa erat tingkat kesamaan antar dua kata. Salah satu metode untuk menghitung semantic similarity adalah PMImax (Pointwise Mutual Informationmax). PMImax mengestimasi korelasi maksimum antara dua kata dan korelasi antara makna terdekat kedua kata tersebut karena sebuah kata seringkali memiliki banyak makna atau bisa disebut dengan kata Polisemi. Pada tugas akhir ini, diimplementasikan penghitungan semantic similarity antar kata menggunakan PMImax dengan menggunakan estimasi dari kata polisemi. konteks kata bersumber dari dataset Brown Corpus dan dataset Gutenberg. Hasil dari keterkaitannya dibandingkan dengan dataset Gold Standard WordSim-353 semantic relatedness, semantic similarity, Miller Charles dan Simlex-999. Hasil penelitian yang didapat terlihat bahwa dengan menggunakan PMImax didapatkan korelasi terbaik yaitu 66,5% dengan dataset gold standard WordSim-353 semantic similarity menggunakan korelasi Pearson dan dengan menggunakan nilai sense hasil analisis variabel p dan q. Nilai semantic similarity setiap pasang kata sangat dipengaruhi oleh nilai Co-Occurence sepasang kata teresebut, semakin tinggi nilai Co-Occurence suatu pasangan maka akan menghasilkan skor semantic similarity yang tinggi.

Kata Kunci: Kesamaan semantik, Pointwise Mutual Information, kata polisemi.

  • IFG444 - TUGAS AKHIR II
  • CCH4A3 - PENULISAN PROPOSAL
  • CCH4D4 - TUGAS AKHIR
  • CSH4H3 - PENAMBANGAN TEKS
  • CSH4O3 - PEMROSESAN BAHASA ALAMI
  • CII4A2 - PENULISAN PROPOSAL
  • CII4G3 - PEMROSESAN BAHASA ALAMI
  • CII4E4 - TUGAS AKHIR
  • CPI4A2 - PENULISAN PROPOSAL
  • III4A4 - TUGAS AKHIR
  • CII9G6 - PROPOSAL PENELITIAN

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama I MADE DARMA YOGA
Jenis Perorangan
Penyunting M. Arif Bijaksana, Mohamad Syahrul Mubarok
Penerjemah

Penerbit

Nama Universitas Telkom
Kota Bandung
Tahun 2016

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi