Sinyal Suara
Tujuan berbicara adalah komunikasi. Ada beberapa cara untuk mencirikan potensi komunikasi suara. Satu pendekatan yang sangat kuantitatif dalam hal ide teori informasi diperkenalkan oleh Shannon. Menurut teori informasi, suara dapat diwakili dalam hal isi pesan, atau informasi. Cara alternatif karakteristik suara dalam hal sinyal membawa pesan informasi, yaitu gelombang akustik.
Meskipun informasi ide-ide teoritis telah memainkan peran utama dalam sistem komunikasi, kita akan melihat dalam makalah ini bahwa suara representasi berdasarkan gelombang, atau beberapa model parametrik, yang berguna dalam aplikasi praktis, pesan yang akhirnya dikonversikan ke sinyal akustik. Informasi Pesan dapat dianggap sebagai yang direpresentasikan dalam sejumlah cara yang berbeda dalam proses produksi suara. Sebagai contoh, informasi pesan pertama diubah menjadi serangkaian sinyal saraf yang mengendalikan artikulatoris mekanisme (yaitu, gerak lidah, bibir, pita suara, dll). artikulator-artikulator bergerak dalam respon terhadap sinyal saraf untuk melakukan urutan gerak tubuh, hasil akhir yang merupakan bentuk gelombang akustik yang berisi informasi dalam pesan asli. Informasi yang dikomunikasikan melalui pidato secara intrinsik dari sifat diskrit, yaitu, dapat diwakili oleh suatu rangkaian dari unsure satu set hingga simbol-simbol.
Simbol dari mana setiap suara dapat diklasifikasikan yang disebut fonem. Setiap bahasa telah menetapkan tersendiri dari fonem, biasanya penomoran antara 30 dan 50. Sebagai contoh, bahasa Inggris dapat diwakili oleh satu set sekitar 42 fonem. Perhatian utama teori informasi adalah tingkat di mana informasi disampaikan. Untuk ucapan perkiraan kasar tingkat informasi dapat diperoleh dengan mencatat bahwa keterbatasan fisik pada laju gerak artikulator-artikulator mengharuskan manusia menghasilkan ucapan pada tingkat rata-rata sekitar 10 fonem per detik. Jika setiap fonem diwakili oleh bilangan biner, maka kode numerik enam-bit lebih dari cukup untuk mewakili semua fonem bahasa Inggris. Dengan asumsi tingkat rata-rata 10 fonem per detik dan mengabaikan korelasi antara pasangan fonem yang berdekatan didapatkan perkiraan 60 bits/sec untuk tingkat informasi rata-rata berbicara. Di lain kata-kata, secara tertulis suara berisi informasi setara dengan 60 bits/sec dengan tingkat berbicara normal.
Tentu saja batas bawah pada informasi yang "benar" isi bicara jauh lebih tinggi dari tingkat ini. Estimasi tersebut tidak memperhitungkan faktor-faktor seperti identitas dan keadaan emosi dari pembicara, laju berbicara, kenyaringan dari ucapan, dll.
Dalam sistem komunikasi suara, sinyal suara ditransmisikan, disimpan, dan diproses dalam banyak cara. masalah teknis menyebabkan berbagai representasi dari sinyal suara. Secara umum, ada dua masalah utama dalam sistem apapun:
1. Pelestarian isi pesan dalam sinyal suara.
2. Representasi dari sinyal suara dalam bentuk yang nyaman bagi transmisi atau
penyimpanan, atau dalam bentuk yang fleksibel sehingga modifikasi dapat dilakukan dengan sinyal suara tanpa mengabaikan isi pesan. Representasi dari sinyal suara harus sedemikian rupa sehingga kandungan informasi mudah dapat diekstraksi oleh pendengar manusia, atau secara otomatis oleh mesin.
1.2 Pengolahan Sinyal
Masalah umum manipulasi informasi dan pengolahan digambarkan dalam Gambar 1.1. Dalam kasus suara sinyal pembicara manusia adalah informasi sumber. Pengukuran atau pengamatan umumnya gelombang akustik.
Diposkan oleh
EKO SUHARTONO
On
Monday, March 21, 2011
Subscribe to:
Post Comments (Atom)
Labels
- Mbrola (2)
- Metode Pengolahan Suara (5)
- Open Source (1)
- Out Of Topic (5)
- Progress Report (1)
- Regular Expression (3)
- Software (2)
- Tips Java (2)
Popular Posts
-
Linear predictive coding ( LPC ) adalah alat yang digunakan terutama dalam pemrosesan sinyal audio dan pengolahan pidato untuk mewa...
-
Pembuatan Aplikasi Pengingat Waktu Sholat Dengan Menggunakan Diphone Concatination Alvian Nashuki (08650118), Eko Suhartono (08650012) Mahas...
-
BASIC HANDLING OF STRINGS The Java language includes a primitive data type char, which holds a 16-bit unicode character. You can hold multi...
-
Konversi dari teks ke ucapan terdiri dari dua hal, yaitu : 1. mengubah dari teks ke fonem (text to fonem) 2. mengubah dari fonem ke ucapan (...
-
Dalam mempelajari Java, kadang hal-hal kecil bisa sangat merepotkan kita. Apalagi bagi kita yang baru memulai untuk mempelajarinya, bahkan e...
-
Warped prediksi linear coding ( LPC melengkung atau WLPC ) adalah varian dari linear predictive coding di mana representasi spektra...
-
Penggunaan TTS di java bisa menggunakan FreeTTS yang disediakan open source yang dapat diperoleh di http://freetts.sourceforge.net/. Library...
-
Terkadang dalam pembuatan film dibutuhkan pengolahan suara terlebih dahulu sebelum suara tersebut digabungkan dengan gambar dalam proses pen...
-
Saat ini handphone sudah bukan barang mewah lagi, tapi sudah menjadi kebutuhan pokok. Semua (tepatnya sebagian besar) orang mempunyai handph...
-
Introduction This is a tool to parse and analyze the structure of a regular expression. Currently it implements the Java, JavaScript and mos...
Recent Posts
Product Category
- Mbrola (2)
- Metode Pengolahan Suara (5)
- Open Source (1)
- Out Of Topic (5)
- Progress Report (1)
- Regular Expression (3)
- Software (2)
- Tips Java (2)

0 komentar:
Post a Comment
Please give your comments