ABSTRAKSI: Pendekatan yang lazim digunakan pada segmentasi suara otomatis adalah
pendekatan menggunakan metode Hidden Markov Models (HMM). Meskipun
metode HMM adalah metode yang paling dipercaya saat ini, tetapi masih terdapat
beberapa keterbatasan seperti masih terdapat ketidakcocokan antara segmentasi
secara manual dan segmentasi dengan menggunakan HMM, sehingga hal ini akan
menimbulkan diskontinuitas pada suara sintetis atau membutuhkan bootstrap data
secara manual pada inisialisasi awal HMM. Untuk itu pada tugas akhir ini
diajukan sebuah metode baru yang merupakan kombinasi antara pendekatan
HMM dengan metode Spectral Boundary Correction. Secara garis besar metode
ini terbagi menjadi empat tahap, yaitu inisialisasi dengan Speaker Independence
(SI) bootstrap, reestimasi parameter HMM, segmentasi dengan viterbi alignment,
dan koreksi batas-batas segmen dengan Spectral Boundary Correction. Dengan
menggunakan pendekatan ini, tiap batas pinggir segmen yang dihasilkan dengan
metode HMM akan diperbaiki kembali bedasarkan distribusi spektralnya,
sehingga diharapkan hasil yang diperoleh akan lebih memuaskan. Dari hasil
penelitian disimpulkan bahwa tingkat akurasi segmentasi suara menggunakan
metode Hidden Markov Models dan Spectral Boundary Correction adalah 73%
dimana tingkat akurasi dipengaruhi oleh jenis pembicara dan kecepatan lafal
ucapan.Kata Kunci : segmentasi, HMM, bootstrap, Spectral Boundary Correction, viterbi.ABSTRACT: The prevalent approach for automatic segmentation in speech synthesis is Hidden
Markov Model (HMM) - based. Even though an HMM-based approach is the
most automatic and reliable, there are still several limitations, such as mismatches
between hand-labeled transcriptions and HMM alignment labels which can lead to
discontinuities in the synthetic speech, or the need for hand-labeled bootstrap data
in HMM initialization. This final task introduces a new method which is combine
an HMM-based approach and spectral boundary correction. This method
generally consist of four phases; initialization with Speaker Independence (SI)
HMM, reestimation of HMM parameters, segmentation with viterbi alignment,
and segment boundary correction with Spectral Boundary Correction. In this
proposed method, boundary of each segment from HMM-based approach will be
corrected based on their spectral distribution to get the better result. The
conclusion of this final task is an automatic speech segmentation combining an
HMM-based approach and spectral boundary correction gives 73 % af accuracy,
which is affected by the type of speaker and the speed of pronounciation.Keyword: segmentation, HMM, bootstrap, spectral boundary correction, viterbi.