Pemanfaatan indormasi
dalam kalimat opini di surat kabar bukanlah
hal
yang mudah dilakukan karena banyak kasus anaphora kalimat dalam kalimat d
i
surat kabar. D
alam tugas akhir ini akan dilakukan identifikasi terhadap satu jenis
anafora disebut
definite noun phrase anaphora
dengan menggunakan
Support
Vector Machine
denga
n
feature
Based Radial Basis Function
(RBF)
. Sistem ini
menggunakan
feature set
yang digunakan untuk membentuk vektor fitur sebagai
masuka
n kepada Support Vector Machine
(SVM)
. Sistem ini
dibagi menjadi
beberapa proses, yaitu proses
preprocessing
, proses e
kstraksi
fitur
, proses
pelatihan dan proses pengujian.
Dalam proses pengujian
, a
kan dilakukan
4
jenis pengujian
, per
tama adalah
cross validation
untuk menenukam model
data yang paling
baik
[16]
. Pengujian
yang kedua adalah p
engujian parameter
. Pada
pengujia
n
parameter
di
gunakan
data hasil
cross validation
untuk menemukan yang kombinasi parameter
terbaik
un
tuk menemukan akurasi tertinggi
.
Dalam
pengujian nilai C
ditem
ukan bahwa
semakin besar nilai C
maka semakin tinggi nilai akurasi.
Sedangkan untuk
pengujian
parameter gamma
ditemukan
nilai gamma dapat menyebabkan akurasi
menjadi stabil atau konsistem pada nila
i tertentu sesuai dengan nilai C
.
Pada
pengujian selanjutnya
ditunjukkan pahwa persebaran data yang digunakan pada
tugas akhir ini tidak mempengaruhi ak
urasi
. sedangkan pada pengujian terakhir
menunjukkan
bahwa akurasi sistem mencapai 100% berdasarkan pengujian
white
box
.
definite noun phrase anaphora , RBF, SVM, feature set