March 2011 - Signal Processing

Sinyal Suara

Tujuan berbicara adalah komunikasi. Ada beberapa cara untuk mencirikan potensi komunikasi suara. Satu pendekatan yang sangat kuantitatif dalam hal ide teori informasi diperkenalkan oleh Shannon. Menurut teori informasi, suara dapat diwakili dalam hal isi pesan, atau informasi. Cara alternatif karakteristik suara dalam hal sinyal membawa pesan informasi, yaitu gelombang akustik.

Meskipun informasi ide-ide teoritis telah memainkan peran utama dalam sistem komunikasi, kita akan melihat dalam makalah ini bahwa suara representasi berdasarkan gelombang, atau beberapa model parametrik, yang berguna dalam aplikasi praktis, pesan yang akhirnya dikonversikan ke sinyal akustik. Informasi Pesan dapat dianggap sebagai yang direpresentasikan dalam sejumlah cara yang berbeda dalam proses produksi suara. Sebagai contoh, informasi pesan pertama diubah menjadi serangkaian sinyal saraf yang mengendalikan artikulatoris mekanisme (yaitu, gerak lidah, bibir, pita suara, dll). artikulator-artikulator bergerak dalam respon terhadap sinyal saraf untuk melakukan urutan gerak tubuh, hasil akhir yang merupakan bentuk gelombang akustik yang berisi informasi dalam pesan asli. Informasi yang dikomunikasikan melalui pidato secara intrinsik dari sifat diskrit, yaitu, dapat diwakili oleh suatu rangkaian dari unsure satu set hingga simbol-simbol.

Simbol dari mana setiap suara dapat diklasifikasikan yang disebut fonem. Setiap bahasa telah menetapkan tersendiri dari fonem, biasanya penomoran antara 30 dan 50. Sebagai contoh, bahasa Inggris dapat diwakili oleh satu set sekitar 42 fonem. Perhatian utama teori informasi adalah tingkat di mana informasi disampaikan. Untuk ucapan perkiraan kasar tingkat informasi dapat diperoleh dengan mencatat bahwa keterbatasan fisik pada laju gerak artikulator-artikulator mengharuskan manusia menghasilkan ucapan pada tingkat rata-rata sekitar 10 fonem per detik. Jika setiap fonem diwakili oleh bilangan biner, maka kode numerik enam-bit lebih dari cukup untuk mewakili semua fonem bahasa Inggris. Dengan asumsi tingkat rata-rata 10 fonem per detik dan mengabaikan korelasi antara pasangan fonem yang berdekatan didapatkan perkiraan 60 bits/sec untuk tingkat informasi rata-rata berbicara. Di lain kata-kata, secara tertulis suara berisi informasi setara dengan 60 bits/sec dengan tingkat berbicara normal.

Tentu saja batas bawah pada informasi yang "benar" isi bicara jauh lebih tinggi dari tingkat ini. Estimasi tersebut tidak memperhitungkan faktor-faktor seperti identitas dan keadaan emosi dari pembicara, laju berbicara, kenyaringan dari ucapan, dll.

Dalam sistem komunikasi suara, sinyal suara ditransmisikan, disimpan, dan diproses dalam banyak cara. masalah teknis menyebabkan berbagai representasi dari sinyal suara. Secara umum, ada dua masalah utama dalam sistem apapun:

1. Pelestarian isi pesan dalam sinyal suara.
2. Representasi dari sinyal suara dalam bentuk yang nyaman bagi transmisi atau

penyimpanan, atau dalam bentuk yang fleksibel sehingga modifikasi dapat dilakukan dengan sinyal suara tanpa mengabaikan isi pesan. Representasi dari sinyal suara harus sedemikian rupa sehingga kandungan informasi mudah dapat diekstraksi oleh pendengar manusia, atau secara otomatis oleh mesin.

1.2 Pengolahan Sinyal

Masalah umum manipulasi informasi dan pengolahan digambarkan dalam Gambar 1.1. Dalam kasus suara sinyal pembicara manusia adalah informasi sumber. Pengukuran atau pengamatan umumnya gelombang akustik.