Klasifikasi Jenis Vokal Manusia menggunakan MFCC dan Convolutional Neural Network

KRIESNA BAYU PRATAMA

Informasi Dasar

130 kali
21.04.3190
616.855
Karya Ilmiah - Skripsi (S1) - Reference

Jangkauan suara adalah aspek penting yang perlu diketahui oleh seorang penyanyi. Pengetahuan ini diperlukan agar penyanyi dapat memaksimalkan potensi bernyanyinya. Jenis vokal manusia dibagi ke dalam enam kelas yaitu alto, mezzo-soprano dan soprano untuk Wanita dan bass, baritone dan tenor untuk pria. Namun, pada penelitian ini rentang vokal manusia hanya diklasifikasikan ke dalam empat kelas yang biasa digunakan pada paduan suara yaitu, alto (suara rendah untuk wanita), soprano (suara tinggi untuk wanita), bass (suara rendah untuk pria) dan tenor (suara tinggi untuk pria). Penelitian ini menggunakan Mel-frequency Cepstral Coefficient (MFCC) untuk ekstraksi cirinya dan Convolutional Neural Network (CNN) untuk klasifikasinya. Penelitian ini menekankan bagaimana MFCC dan CNN mampu menyelesaikan masalah klasifikasi tipe vokal manusia. Hal ini dibantu oleh WavAugment untuk augmentasi untuk memaksimalkan proses pembelajaran. Dalam penelitian ini, data yang digunakan adalah data primer sehingga data dikumpulkan melalui survei dan eksperimen yang dilakukan langsung oleh peneliti. Data yang digunakan juga mempengaruhi hasil klasifikasi, di mana data harus cukup jarang untuk menghindari model yang overfitted. Hasil performansi paling tinggi didapatkan dari kombinasi fitur ektraksi MFCC dengan Adam Optimizer dengan akurasi pelatihan sebesar 91,83% dan akurasi pengujian sebesar 91,14% dengan durasi 11 menit. Model ini (untuk fitur ekstraktor) mampu mengungguli model yang menggunakan feature extractor Short-Time Fourier Transform (STFT), yang memiliki hasil kompetitif pada beberapa referensi, dengan selisih akurasi pelatihan 3,11% dan akurasi pengujian 1,15%. Selain itu, hasil precision dan recall yang tinggi pada MFCC dengan rata-rata 91% mengindikasikan bahwa model dengan MFCC mampu memberikan prediksi hasil yang akurat. Kajian ini merupakan ilmu multi disiplin yang memiliki pengaruh kuat terhadap musik, khususnya dalam paduan suara. Penelitian ini dilakukan untuk meningkatkan kesinambungan musik paduan suara dan teknologi komputer dengan menggabungkan musik dengan ilmu komputer.

Subjek

Audio, Speech and Language Processing
 

Katalog

Klasifikasi Jenis Vokal Manusia menggunakan MFCC dan Convolutional Neural Network
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

KRIESNA BAYU PRATAMA
Perorangan
Suyanto, Ema Rachmawati,
 

Penerbit

Universitas Telkom, S1 Informatika
Bandung
2021

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini