Informasi Umum

Kode

19.04.2551

Klasifikasi

004 - Data Processing, Computer Science/Pemrosesan Data, Ilmu Komputer, Teknik Informatika, Hardware Komputer

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Informatics

Informasi Lainnya

Abstraksi

Abstrak

Kesamaan semantik adalah metrik kesamaan antar kata, kalimat atau dokumen yang berbagi dalam elemen makna. Perhitungan terkaitan semantik memiliki peranan penting dalam data mining, pengambilan informasi, dan bahkan natural language processing. Pada bahasa Indonesia, perhitungan kesamaan semantik mendapat peran penting karena banyak dimanfaatkan untuk aplikasi lain, seperti klasifikasi teks. Pengukuran kesamaan semantik dapat dilakukan dengan pendekatan berbasis korpus dan pendekatan berbasis kamus. Pada Tugas Akhir ini dilakukan pembangunan model kesamaan semantik berbasis korpus yang direpresentasikan dengan distributional semantic vector. Model kemudian diujikan pada beberapa pasang kata dengan derajat kesamaan semantik bervariasi. Model kesamaan semantik dibangun berdasar korpus Wikipedia Bahasa Indonesia, dengan metode word2vec. Hasil pengujian pada dataset uji yang juga digunakan pada penelitian sebelumnya berdasar pada referensi SimLex999 dan Rubenstein-goodenough menunjukkan nilai korelasi yang diperoleh 0.2753. Walaupun nilai korelasi tersebut lebih kecil dibanding nilai pada penelitian sebelumnya dengan pendekatan korpus, terdapat beberapa kasus di mana model semantik berbasis korpus mampu menangkap korelasi semantik lebih baik.

Kata kunci : kesamaan semantik, bahasa Indonesia, persamaan kosinus.

  • CSH4O3 - PEMROSESAN BAHASA ALAMI
  • CII4G3 - PEMROSESAN BAHASA ALAMI

Koleksi & Sirkulasi

Seluruh 1 koleksi sedang dipinjam

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama MUHAMMAD TAUFIK WAHDIAT
Jenis Perorangan
Penyunting ADE ROMADHONY, SAID AL FARABY
Penerjemah

Penerbit

Nama Universitas Telkom, S1 Informatika
Kota Bandung
Tahun 2019

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi