Karya tulis ini membahas implementasi sistem pengenalan ucapan dalam bahasa Indonesia dimana suatu perangkat membaca file suara lalu ditranslasikan menjadi teks sesuai dengan kata yang diucapkan pada file suara tersebut didasarkan pada kata yang sudah dilatih ke dalam sistem. Metode MFCC digunakan untuk proses ekstraksi ciri dimana akustik vektor atau vektor ciri direduksi jumlah dimensinya menggunakan PCA, lalu hasil ektraksi ciri tersebut diklasterkan dengan algoritma Y. Linde, A. Buzo, dan R. Gray (LBG) dan diklasifikasikan menggunakan HMM. Pengurangan dimensi pada vektor akustik atau vektor ciri dilakukan karena jumlah dimensi data yang diekstrak dari sinyal suara menggunakan MFCC yang tinggi. Metode PCA dipilih karena PCA mampu memproyeksikan data ke space yang bervariansi tinggi sehingga data yang redundant atau kurang signifikan bisa direduksi. Selain itu pengurangan dimensi pada vektor ciri dapat meningkatkan performansi sistem dikarenakan jumlah dimensi yang berkurang akan mengurangi data yang harus dikalkulasi oleh sistem. Hasilnya sistem mampu mengenali kata dengan rata – rata akurasi sebesar 80,19%, namun performansi sistem tidak naik secara signifikan yaitu paling tinggi hanya sebesar 3,29% untuk proses pelatihan, dikarenakan hanya proses kuantisasi vektor yang jumlah data untuk dikalkukasinya berkurang, selain itu proses PCA menambah beban sistem yang sebelumnya tidak ada.