ABSTRAKSI: Concatenation synthesizer merupakan synthesizer yang mampu memproduksi sinyal ucapan secara otomatis melalui transkripsi grafem-ke-fonem untuk kalimat yang diucapkan. Penelitian concatenation synthesizer dalam berbagai versi bahasa sedang dikembangkan, dan dalam bahasa tertentu telah mencapai hasil yang cukup memuaskan. Namun demikian beberapa permasalahan dalam concatenation synthesizer masih belum terpecahkan secara tuntas. Pendekatan dari setiap permasalahan ini akan selalu mengacu pada tercapainya concatenation synthesizer yang memenuhi kualitas intelligibility (terdengar jelas) dan naturalness (kealamian).
Dalam Tugas akhir ini telah direalisasikan model ekstraksi ciri yang baru sebagai pembanding dari penelitian sebelumnya dan juga telah direalisasikan metode sederhana sebagai pembanding dengan HNN dalam eksekusi data uji. Dengan ekstraksi ciri ini nilai rata-rata RMSE sinyal sintesis terhadap sinyal asli untuk 15 kalimat dalam pengujian meningkat dari 0.349273 menjadi 0.1919, namun untuk rata-rata koefisien korelasi -0.0060 yang artinya sinyal sintesi berkebalikan dengan sinyal asli. Sedangkan untuk metode sederhana lebih cepat 1.63086 dibandngkan menggunakan HNN sebesar 1.97588. Sedangakan pada penilain MOS, untuk integibillity meningkat dari 2.666667 menjadi 2,815385, yang artinya kejelasan suara lebih bisa dipahami. Namun untuk fludity dan naturalness justru menurun dibandingkan penelitian sebelumnya.
Perancangan dan simulasi modul ekstraksi ciri dan metode sederhana ini, bisa menjadi dasar dalam meningkatkan kualitas suara sintesis.Kata Kunci : Hopfield neural network, pembangkit prosodi, concatenation synthesizerABSTRACT: Concatenation synthesizer is a synthesizer that is capable of producing a signal through the transcription of speech automatically grapheme-to-phoneme to sentence spoken. Research concatenation synthesizer in various language versions are being developed, and in particular languages has achieved satisfactory results. However, some problems in concatenation synthesizer is still not completely solved. The approach of each of these issues will always refer to the concatenation synthesizer achievement that meets the quality intelligibility (sounds obvious) and naturalness (naturalness).
In this final project, has realized a new model of feature extraction for comparison of previous studies and also have realized a simple method for comparison with the test data HNN in execution. With this feature extraction of the average value of RMSE synthesis signal to the original signal to 15 sentences in the test increased from 0.349273 to 0.1919, but for the average correlation coefficient of -0.0060, which means the signal Sintesi contrary to the original signal. As for the simpler method is faster 1.63086 1.97588 dibandngkan use of HNN. While the MOS in the assessment, to integibillity increased from 2.666667 to 2.815385, which means more comprehensible voice clarity. But for fludity and naturalness is decreasing compared to previous studies
Design and simulation modules feature extraction and the simple method, could be the basis dala improve the quality of synthesized speech.Keyword: Hopfield neural network, generator prosodic, concatenation synthesizer