ABSTRAKSI: Penelitian ini adalah perbandingan metode ekstraksi ciri berbasis statistik dan frekuensi untuk keperluan pengenalan suara. Penelitian ini bermaksud untuk menyelidiki efektivitas dari metode-metode tersebut.
Penelitian sistem identifikasi suara dilakukan dengan menguji sampel untuk mengidentifikasi suara orang yang berbeda. Langkah pertama yang dilakukan adalah pengambilan sampel suara yang memiliki format wav lalu disimpan ke dalam database. Suara yang telah disiapkan selanjutnya di ekstraksi cirinya dengan menggunakan metode ekstraksi ciri statistik atau frekuensi. Metode statistik yang dilakukan meliputi metode SSC, Autokorelasi dan LPC, sedangkan metode frekuensi terdiri dari FFT, STFT dan RSD. Hasil dari ekstraksi tersebut kemudian disimpan dalam vektor ciri dan dibandingkan dengan menggunakan eulidean distance. Nilai distance yang menunjukan kesamaan ciri
Percobaan dilakukan pasa suara laki-laki dan wanita yang mengucapkan huruf dan angka. Untuk huruf dibagi lagi atas katagori vokal dan konsonan.
Hasil yang diperoleh menunjukan algoritma FFT untuk vokal wanita adalah yang paling baik untuk huruf dengan nilai distance tertinggi antar huruf adalah rata-rata 5,49 untuk konsonan dengan nilai distance tertinggi huruf adalah rata-rata 5,63 dengan algoritma FFT sedangkan untuk vokal laki-laki dengan nilai distance tertinggi adalah rata-rata 5,23 menunjukan algoritma FFT begitu juga dengan huruf konsonan dengan nilai distance tertinggi adalah rata-rata 5,36, sedangakan untuk angka yang terbaik adalah FFT dengan distance rata-rata tertinggi 5,92Kata Kunci : Pengenalan suara, statistik, frekuensi.ABSTRACT: This study is aimed at investigating the effectiveness of two methodsfor speech recognition, the statistics-based feature extraction and the frequency-based feature extraction. The study of voice identification system was carried out by testing the samples of different human sounds
The process of obtaining and analyzing the voice has several steps. First, the voice samples in thewav format were collectedand stored into the database. Second, the characteristics of those voiceswere extracted using statistical or frequencyfeature extraction methods. The statistical methods were conducted using the SSC method, autocorrelation and LPC, while the frequency method were carried out using FFT , STFT and RSD. Third, the results of the extraction werestored in a feature vector and then they were compared using euclidean distance, the distance value indicating the characteristics in common.
The experimentsused male and female voiceswhen they uttered letters, both vowels and consonants, and numbers. The results indicated that the best FFT algorithm was for the letters of female voices/vowels with the highest distance value among letters was 5.49 in average and the highest distance value for the consonant letters was 5.63 in average (with the FFT algorithm). The highest distance value of male voices/vowels was 5.23 in average (the FFT algorithm as well as) and the highest distance value for consonant was 5.36 in average. In addition, the best rate was the FFT with the highest average distance of 5.92.Keyword: Voice recognition , statistics , frequency.