ABSTRAKSI: Dengan semakin bertambahnya kapasitas media penyimpanan maka semakin banyak file yang dapat disimpan, salah satunya adalah file audio/lagu. Semakin banyak file audio yang disimpan menimbulkan kesulitan dalam pencariannya. Suara nyanyian yang merupakan kombinasi dari ucapan, intonasi, dan alunan melodi yang tepat dapat digunakan sebagai input pada suatu sistem perintah suara untuk mencari file audio . Oleh karena itu, diperlukan suatu sistem yang dapat mengenali suara nyanyian manusia dan hasilnya dapat digunakan untuk mencari file – file audio.
Dalam tugas akhir ini telah diteliti bagaimana mengenali suara nyanyian untuk digunakan dalam mencari file audio. Metode ektraksi ciri yang telah digunakan adalah Mel Frequency Cepstrum Coefficients (MFCC ) dan Spectral Feature, yang terdiri atas spectral centroid dan spectral flux. Metode MFCC adalah metode yang mengadopsi kemampuan persepsi sistem pendengaran manusia. Sedangkan metode Spectral Feature dapat mengekstraksi ciri suara nyanyian dalam domain frekuensi. Pada akhirnya Jaringan Syaraf Tiruan Self Organizing digunakan untuk mengenali pola dan menentukan kelas serta mengklasifikasikan suara nyanyian.
Hasil yang telah dicapai adalah suatu sistem yang dapat mengenali suara nyanyian dengan tingkat akurasi maksimal 99.6 % pada sistem non-real time dan 81.53% pada sistem real time. Sinyal suara nyanyian yang telah diolah adalah suara nyanyian dari 5 lagu berbeda dan input pada sistem pengenalan suara nyanyian adalah suara nyanyian pada awal lagu dengan maksimal durasi adalah 5 detikKata Kunci : Mel Frequency Cepstrum Coefficients, Spectral Feature, Spectral Centroid, Spectral Flux, Jaringan Syaraf Tiruan Self Organizing MapABSTRACT: With the increasing capacity of storage media, the more files can be stored, for example an audio files. The more files stored in storage media creates difficulties when searching the file. Voice commands can be used in a search system for audio files / songs. Singing voice which is a combination of intonation and rhythm of speech and the right melody can be used as an input for voice command sistem to find an audio files. Therefore, a system that can recognize human voices singing is needed, and the results can be used to find an audio files.
This final task has researched how to recognize the singing voice that can be used to search an audio files. Mel Frequency Cepstrum Coefficients (MFCC) and Spectral Feature, which consists of the spectral centroid and spectral flux, have been used as a Feature extraction methods. MFCC method is a method that adopts the ability of human auditory perception system. While the method of Spectral Feature extracting features of the singing voice in the frequency domain. The last, Artificial Neural Network Self-Organizing Map has been used to identify patterns, determine the class, and classify singing voices.
The results have been achieved is a system that can identify the singing voice as an input to the audio file search system with a maximum 99.6% accuracy rate for non-real time system and 81.53% accuracy rate for real time system. Singing voice signal which has been processed is the singing of five different songs and input on the speech recognition system is the voice singing at the beginning of the song with a maximum duration is 5 seconds.Keyword: Mel Frequency Cepstrum Coefficients, Spectral Feature, Spectral Centroid, Spectral Flux, Jaringan Syaraf Tiruan Self Organizing Map