SIMULASI REKONSTRUKSI SINYAL BICARA PITA LEBAR MENGGUNAKAN METODE PERGESERAN SPEKTRAL

FITRIE RATNASARI

Informasi Dasar

111080134
621.382 2
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Pada kebanyakan sistem komunikasi, sinyal bicara dikirimkan pada rentang frekuensi pita sempit (narrowband) yang berkisar antara 300 Hz sampai dengan 3400 Hz. Dibandingkan dengan sinyal bicara normal yang pada umumnya memiliki energi perseptual dalam rentang frekuensi yang berkisar antara 50 Hz hingga 8000 Hz, sinyal bicara ini terdengar teredam dan mengurangi kejelasan bicara, khususnya dirasakan pada saat pelafalan huruf frikatif seperti /s/ dan /f/. Hal ini terjadi karena informasi frekuensi tinggi dalam proses pengirimannya dihilangkan. Tidak seperti kanal telephoni, pada pengkodean suara pita lebar (wideband speech coding) batasan frekuensi maksimum yang dikirimkan memungkinkan adanya frekuensi tinggi hingga 8000 Hz, namun kekurangannya dalam hal ini membutuhkan bandwidth yang lebih besar untuk ditransmisikan serta bitrate yang lebih tinggi dibandingkan dengan pengiriman sinyal bicara pita sempit (narrowband).

Rekonstruksi sinyal bicara pita lebar adalah sebuah solusi yang dapat mengatasi keterbatasan pengiriman rentang frekuensi pada sinyal bicara pita sempit. Sistem ini bekerja dengan menambahkan sintesa sinyal bicara frekuensi tinggi pada sinyal bicara pita sempit untuk dapat menghasilkan sinyal suara pita lebar (wideband speech). Dalam rekonstruksi sinyal bicara pita lebar ini tidak membutuhkan tambahan bandwidth dan bitrate dalam pengirimannya, karena frekuensi tinggi yang hilang dibentuk dari hubungan antara sinyal bicara pita sempit dan frekuensi tinggi. Rekostruksi wideband juga dapat dikatakan sebagai pasca prosesor pada sisi penerima sinyal bicara narrowband.

Tugas akhir ini bertujuan untuk mensimulasikan pelebaran bandwidth dengan menggunakan metode pergeseran spektral dan codebook untuk mengestimasi selubung dari sinyal bicara pada frekuensi tinggi. Algoritma untuk pelebaran badwidth ini dapat dibuktikan dapat berjalan dengan baik, meskipun adanya artefak yang terdengar pada rekonstruksi sinyal. Meski demikian, pengujian secara objektif dan subjektif menyatakan bahwa sistem pelebaran bandwidth dengan pergeseran spektral ini memiliki presentase kecenderungan 50% dari responden dengan mean SNR maksimum 5,13 dB. Parameter teroptimal dalam simulasi rekonstruksi sinyal bicara pita lebar adalah dengan parameter jarak Euclidean, bobot K=1 untuk klasifikasi KNN dan parameter jarak correlation dengan klaster sebanyak 256 untuk pengklasteran Kmean. Waktu komputasi untuk metode pergeseran spektral yaitu 0.144 detik, dengan penggandaan spektral 0.138 detik dan codebook 164,2 detik. Penilaian subjektif nilai DMOS rata-rata untuk rekonstruksi dengan menggunakan metode pergeseran spektral relatif memiliki nilai 3.65 dibanding dengan penggandaan spektral dengan nilai rata-rata DMOS 2. Penelitian dan peningkatan kualitas suara sinyal bicara lebih lanjut tetap dibutuhkan agar nantinya dapat diterapkan pada terminal penerima.Kata Kunci : rekonstruksi wideband, narrowband, codebook, pergeseran spektral.ABSTRACT: In most of the communication systems speech is transmittes in narrowband, containing frequencies from 300 Hz to 3400 Hz. Compared with normal speech which is generally contains a perceptually significant amount of energy up to 8 kHz, this speech has a muffled quality and reduced intelligibility, particularly noticeable in sounds such as /s/ and /f/ . Speech which has been bandlimited to 8 kHz is often coded for this reason, but this requires an increase in the bit rate.

Wideband reconstruction is a scheme that adds a synthesized highband signal to narrowband speech to produce a higher quality wideband speech signal. The synthesized highband signal is based entirely on information contained in the narrowband speech, and is thus achieved at zero increase in the bit rate from a coding perspective. Wideband reconstruction can function as a post-processor to any narrowband telephone receiver, or alternatively it can be combined with any narrowband speech coder to produce a very low bit rate wideband speech coder. Applications include higher quality mobile, teleconferencing, and internet telephony.

This final project aims to simulate the bandwidth extension system using spectral shifting method for highband excitation, which is used codebook and linear mapping to estimate the envelope of highband. The algorithm for wide band expansion proved to work, though certain unwanted artefacts were introduced in the reconstructed signal. Listening tests confirmed the presence of these unwanted artefacts. Objective and subjective tests demonstrate that wideband speech synthesized using these techniques have presentage in (numerical) 50 % of the respondences with SNR 5,13 dB. Optimum parameter used in this system goes to Euclidean distance with K=1 for KNN classification and correlation distance with 256 clusters for Kmean clustering. Computational time for spectral shifting 0.144 s, for spectral folding 0.138 s and codebook needs 164,2 s. Subjective measurement using DMOS for spectral shifting about 3.65 and for spectral folding 2. However further research and improvement to reach higher quality from this system for implementation are still needed.Keyword: wideband reconstruction, narrowband, highband, codebook, spectral shifting.

Subjek

Pengolahan Sinyal Informasi
 

Katalog

SIMULASI REKONSTRUKSI SINYAL BICARA PITA LEBAR MENGGUNAKAN METODE PERGESERAN SPEKTRAL
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

FITRIE RATNASARI
Perorangan
Bambang Hidayat, Inung Wijayanto
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini