Emosi manusia adalah suatu hal yang terkadang hanya dapat diperkirakan
melalui raut wajah dari seseorang saja, atau dari perubahan mimik wajahnya.
Namun ternyata emosi manusia juga dapat dideteksi melalui suara yang
diucapkannya. Emosi seseorang
dalam keadaan tenang, marah, sedih atau senang
dapat dideteksi melalui sinyal bicaranya.
Pengembangan sistem pengenalan suara
masih berjalan untuk sementara waktu ini. Secara umum platform pengenalan
suara dibagi menjadi tiga jenis yaitu Dynamic Time Warpi
ng(DTW) (Sakoe,
1978) yang merupakan permulaan dari platform pengenalan suara yang
menggunakan variasi dalam kerangka waktu untuk pengenalannya. Kemudian,
Jaringan Syaraf Tiruan(JST) menggantikan DTW. Dan pada akhirnya, Hidden
Markov Model(HMM) dikembangka
n untuk mengadopsi statistik untuk
meningkatkan kinerja dari pengenalan suara. Oleh karena itu HMM digunakan
dalam penelitian ini sebagai platform pengenalan suara.
Pada tugas akhir yang dikerjakan ini, dirancang simulasi d
eteksi emosi
manusia tersebut mel
alui sinyal bicara dengan melaksanakan ekstraksi ciri Mel
Frequency Cepstral Coefisien(MFCC) untuk mendapatkan karakteristik dasar dari
sinyal bicara
.
Kondisi emosi yang dideteksi tersebut nantinya akan menjadi state
yang menggunakan metode Hidden Markov M
odel dan variabel ekstraksi ciri
yang menjadi parameter penentu state.Pada penelitian sebelumnya akurasi
maksimalnya dicapai pada skema yang sama dengan skema pada tugas akhir ini
adalah 70%.
Dari skenario pengujian terhadap paramater Jenis dan Orde Filte
r didapat
parameter terbaik yaitu Jenis filter Butterworth dengan orde 5. Setelah dilakukan
pengujian terhadap klasifikasi 4 kelas emosi yaitu netral, marah, sedih, dan
senang, akurasi tertinggi adalah 90% untuk jumlah data latih 40, jumlah data uji
20, ko
efisien MFCC sebesar 24, jumlah filterbank MFCC sebanyak 30, dan iterasi
pelatihan HMM sebesar 40.
Deteksi Emosi, Suara percakapan, MFCC , Hidden Markov Model.