Perancangan Text To speech Bahasa Indonesia(Model Prosodi Dataset Pada Mbrola)

Fanny Agung Nugroho

Perancangan Text To speech Bahasa Indonesia(Model Prosodi Dataset Pada Mbrola)

Fanny Agung Nugroho

Informasi Dasar

Perancangan Text To speech Bahasa Indonesia(Model Prosodi Dataset Pada Mbrola)

Dilihat

534 kali

No. Katalog

111058031

Klasifikasi

621.382 2

Jenis katalog

Karya Ilmiah - Skripsi (S1) - Reference

Abstraksi

ABSTRAKSI: Text to Speech (TTS) adalah suatu sistem pengkonversi teks menjadi suara atau ucapan manusia. Akan tetapi pada teknologi Text to Speech, ada beberapa kendala teknis yang harus diatasi untuk bisa meningkatkan kualitas suara yang dihasilkan, salah satunya adalah dengan penambahan kosakata yang dapat dikenali oleh sistem serta kata atau kalimat yang diucapkan bisa memiliki prosodi atau intonasi. Untuk itu diperlukan cara bagaimana penambahan kosakata dan pengucapan kalimat yang memiliki prosodi pada sistem TTS dapat dilakukan.
Sistem Text to Speech secara garis besar terdiri dari dua sub sistem utama, yaitu: NLP (Natural Language Processing) atau Text to Phoneme dan DSP (Digital Signal Processing) atau Phoneme to Speech. Pada tugas akhir ini bagian Text to Phoneme dari sistem TTS ini yang telah dibuat, dimana pada bagian ini dibuat GUI (Grafik User Interface) dari sistem TTS dan algoritma pemrograman untuk : mengenali teks, membuat kamus untuk kata-kata khusus serta bagaimana cara agar prosodi suara dapat dihasilkan. Sedangkan pada bagian Phoneme to Speech, sub sistem TTS ditangani oleh aplikasi MBROLA yang digunakan sebagai speech synthesizer.
Pada tugas akhir ini telah direalisasikan Text to Speech bahasa Indonesia dengan model prosodi dataset pada MBROLA, yang dapat mengetahui cara meningkatkan kualitas suara yang dihasilkan untuk pengembangan aplikasi selanjutnya.
Kata Kunci : -ABSTRACT: Text to Speech (TTS) is a text conversion system to translate text-based material into voice or speech. However, Text to Speech technology present several technical difficulties to overcome in order to provide better voice quality. Among the alternatives are the addition of more computer-recognized words and intonation-imbued sentences. In the end, the question is the matter of how to actually applied those alternatives.
The Text to Speech system is basically divided into two main subsystems: The NLP (Natural Language Processing) or Text to Phoneme and DSP (Digital Signal Processing) or Phoneme to Speech. The aim of this final assignment is to build the Text to Phoneme subsystem which will be equipped with a GUI (Grafik User Interface) and a custom made programming algorithm to recognize text, build custom dictionaries for specific words, and to calculate the production of the actual voice translation. For the Phoneme to Speech subsystem, MBROLA application will be use as a speech synthesizer.
During the research of this final assignment, a working prototype of a Text to Speech system in Indonesian Language was successfully created with MBROLA model dataset, which can also be used to determine a method to enhance voice quality for future researches.
Keyword: -