ABSTRAKSI: Perkembangan teknologi text to speech telah banyak berkembang pada masa ini, baik untuk bahasa Indonesia maupun untuk bahasa lainnya didunia dengan hasil yang cukup memuaskan. Tetapi, hasil tersebut belum mencapai akhir dimana kualitas hasil pengucapan telah mencapai tingkat kemiripan yang identik dengan pengucapan manusia secara alami. Banyak metode yang ditawarkan untuk mengolah suara sehingga mencapai hasil yang dimaksud diatas, salah satunya adalah metode concatenative synthetis.
Salah satu bahasa yang sekarang juga banyak dikembangkan adalah bahasa Arab. Dalam pelafalannya, bahasa Arab memiliki dua cabang, yaitu pelafalan untuk keseharian dengan pelafalan untuk membaca Al Qur’an. Perbedaan antara keduanya adalah adanya hukum yang mengatur secara khusus untuk pembacaan Al Qur’an atau yang dikenal dengan hukum tajwid.
Pada tugas akhir ini, dibuat sebuah sistem text to speech yang mampu untuk mensuarakan masukkan huruf Latin dari Al Qur’an dengan penerapan hukum tajwid. Metode yang digunakan adalah diphone concatenation, dimana diterapkan algoritma WSOLA modifikasi untuk mencapai hasil yang sesuai hukum tajwid.
Dari penerapan tersebut, diperoleh hasil sintesis algoritma WSOLA modifikasi yang cukup jelas, lancar dalam pengucapan serta tetap menjaga hukum pembacaan Al Qur’an secara cukup baik. Hasil uji MOS untuk algoritma WSOLA sebelum modifikasi telah menunjukkan hasil yang cukup mencapai nilai 3.20 dengan masih kurang konsistennya pembacaan huruf panjang. Tetapi hasil tersebut dapat diperbaiki pada modifikasi yang dilakukan pada algoritma WSOLA sehingga dapat menjaga kekonsistenan panjang pelafalan huruf.Kata Kunci : diphone concatenative, WSOLA, MOS, hukum tajwidABSTRACT: Technology development on text to speech has been conducted in this era, for Indonesian language and also other languages over the world, the result has been very satisfying. Contrary, the result has not meets the end where the quality of speech is equal to natural speech of human. Many methods has been proposed to approach the goal, concatenative synthesis is one of them.
One of the languages which are now also widely developed is Arabic. In pronunciation, the Arabic language has two branches, which is the pronunciation for the daily used and for the Qur'an recitation. The difference between both of them is the law that regulates specifically for reading the Qur'an, known as the law of recitation (the law of tajwid).
In this project, a text to speech system is made. It is able to process Latin letters from the Quran with the application of the tajwid. The method used is diphone concatenation, where the algorithm applied is WSOLA modifications, to achieve the results according to the law of recitation.
From the application, the results of WSOLA synthesis algorithm are fairly clear, fluent in spoken and maintain the tajwid on reading the Qur'an in quite good result. The result of MOS’s test for WSOLA algorithms before modification has shown results the value of 3.20 with still less consistent reading of long period letters. But the results can be improved on modifications that made to the algorithm. So, the pronounciation of long period letters is mantained with WSOLA modification.Keyword: diphone concatenative, WSOLA, MOS, the tajwid’s law