Analisis Model Word2Vec untuk Kesamaan Semantik Antar Text Bahasa Indonesia

LOUISTEN NOVANDI TOMO MANALU

Informasi Dasar

19.04.3429
005.13
Karya Ilmiah - Skripsi (S1) - Reference

Makalah ini membahas perhitungan kesamaan antara kata-kata dalam bahasa Indonesia dengan menggunakan teknik representasi Word2Vec. Word2Vec adalah model yang digunakan untuk merepresentasikan kata ke dalam bentuk vektor. Model dalam percobaan ini dibentuk menggunakan corpus Wikipedia bahasa Indonesia 4GB dan kemudian menggunakan metode perhitungan kemiripan cosinus untuk menentukan nilai kemiripannya. Model ini kemudian diuji dengan set standar emas WordSim-353 dan SimLex-999 yang telah diberi label dengan nilai kesamaan menurut peringkat manusia. Untuk mengetahui akurasi korelasinya menggunakan korelasi Pearson. Hasil korelasi dari penelitian ini adalah 0,5663 untuk data tes WordSim-353 menggunakan ukuran jendela 14 dan dimensi vektor 150, dan 0,3472 untuk data uji SimLex-999 menggunakan ukuran jendela 2 dan dimensi 300. Hasil percobaan menunjukkan bahwa korelasi antara standar emas dan teknik sistem masih relatif lemah.

Subjek

INFORMATICS
 

Katalog

Analisis Model Word2Vec untuk Kesamaan Semantik Antar Text Bahasa Indonesia
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

LOUISTEN NOVANDI TOMO MANALU
Perorangan
Moch Arif Bijaksana, Arie Ardiyanti Suryani
 

Penerbit

Universitas Telkom, S1 Informatika
Bandung
2019

Koleksi

Kompetensi

  • MUH1G3 - MATRIKS DAN RUANG VEKTOR
  • CSH4O3 - PEMROSESAN BAHASA ALAMI
  • CSH4G3 - PENAMBANGAN DATA
  • CSH4H3 - PENAMBANGAN TEKS
  • CII4G3 - PEMROSESAN BAHASA ALAMI
  • CII4I3 - PENAMBANGAN DATA
  • CII2D3 - MATRIKS DAN RUANG VEKTOR
  • CPI2D3 - MATRIKS DAN RUANG VEKTOR
  • ILI2B3 - MATRIKS DAN RUANG VEKTOR

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini