Metode LPC (Hidden Markov Model)

Linear predictive coding ( LPC ) adalah alat yang digunakan terutama dalam pemrosesan sinyal audio dan pengolahan pidato untuk mewakili spectral envelope dari digital sinyal dari pidato dalamkompresi bentuk, menggunakan informasi dari prediksi linier model. Ini adalah salah satu pidato analisis teknik yang paling kuat, dan salah satu metode yang paling berguna untuk kebaikan pidato kualitas pengkodean pada bit rate yang rendah dan menyediakan akurat estimasi parameter yang sangat berbicara.

LPC dimulai dengan asumsi bahwa sinyal suara yang dihasilkan oleh bel pada akhir sebuah tabung (menyuarakan suara), dengan sesekali menambahkan mendesis dan muncul suara ( sibilants danplosif suara). Meskipun tampaknya kasar, model ini sebenarnya adalah perkiraan yang dekat dari realitas produksi ujaran. The glotis (ruang antara lipatan vokal) menghasilkan buzz, yang ditandai dengan intensitas (kerasnya suara) dan frekuensi (pitch). Saluran vokal (tenggorokan dan mulut) membentuk tabung, yang dicirikan oleh resonansi, yang menimbulkan forman , atau pita frekuensi ditingkatkan dalam suara yang dihasilkan. Mendesis dan muncul yang dihasilkan oleh aksi, bibir lidah dan tenggorokan selama sibilants dan plosif.

LPC menganalisa sinyal suara dengan memperkirakan forman, menghapus efek mereka dari sinyal wicara, dan memperkirakan intensitas dan frekuensi buzz tersisa. Proses mengeluarkan forman disebut invers penyaringan, dan sinyal yang tersisa setelah pengurangan dari sinyal dimodelkan disaring disebut residu.

Angka-angka yang menggambarkan intensitas dan frekuensi buzz, para forman, dan sinyal residu, dapat disimpan atau dikirimkan ke tempat lain. LPC mensintesis sinyal pidato dengan membalik proses: menggunakan parameter buzz dan residu untuk menciptakan sinyal sumber, gunakan forman untuk membuat penyaring (yang merupakan tabung), dan menjalankan sumber melalui saringan, sehingga dalam pidato.

Karena sinyal suara bervariasi dengan waktu, proses ini dilakukan pada potongan pendek dari sinyal suara, yang disebut frame, biasanya 30 sampai 50 frame per detik memberikan pidato dimengerti dengan kompresi yang baik.

Menurut Robert M. Gray dari Universitas Stanford , gagasan pertama yang mengarah ke LPC dimulai pada tahun 1966 ketika S. Saito dan F. Itakura dari NTT menggambarkan sebuah pendekatan untuk diskriminasi fonem otomatis yang melibatkan pertama maksimum likelihood pendekatan pidato coding. Pada tahun 1967, John Burg menjabarkan entropi maksimum pendekatan. Pada tahun 1969 Itakura dan Saito diperkenalkan korelasi parsial , Mei Glen Culler diusulkan pidato encoding realtime, dan BS Atal disajikan sebuah koder pidato LPC pada Pertemuan Tahunan Acoustical Society of America . Pada tahun 1971 realtime LPC menggunakan 16-bit hardware LPC ditunjukkan oleh Philco-Ford ; empat unit terjual.

Pada tahun 1972 Bob Kahn dari ARPA , dengan Jim Forgie ( Lincoln Laboratorium , LL) dan Dave Walden ( BBN Technologies ), mulai perkembangan pertama dalam pidato packetized, yang pada akhirnya akan mengarah pada Voice over IP teknologi. Pada tahun 1973, menurut sejarah informal Laboratorium Lincoln, bit pertama 2400 realtime / s LPC dilaksanakan oleh Ed Hofstetter. Pada tahun 1974 cara pertama realtime LPC dua paket komunikasi pidato dicapai selama ARPANET pada 3500 bit / s antara Culler-Harrison dan Lincoln Laboratories. Pada tahun 1976 konferensi LPC pertama terjadi melalui ARPANET menggunakan Network Voice Protocol , antara Culler-Harrison, ISI, SRI, dan LL pada 3500 bit / s. Dan akhirnya pada tahun 1978, Vishwanath et al. dari BBN mengembangkan pertama variabel-tingkat algoritma LPC.

LPC sering digunakan untuk transmisi informasi amplop spektral, dan karena itu harus toleran terhadap kesalahan transmisi. Transmisi koefisien filter langsung (lihat prediksi linier untuk definisi koefisien) tidak diinginkan, karena mereka sangat sensitif terhadap kesalahan. Dengan kata lain, kesalahan kecil yang sangat dapat merusak seluruh spektrum, atau lebih buruk, kesalahan kecil bisa membuat prediksi saringan tidak stabil.

Ada maju representasi lebih, seperti Log Area Rasio (LAR), garis pasang spektrum (LSP) dekomposisi dan koefisien refleksi . Dari jumlah tersebut, terutama dekomposisi LSP telah mendapatkan popularitas, karena menjamin stabilitas prediktor, dan kesalahan spektral adalah lokal untuk penyimpangan koefisien kecil.

LPC umumnya digunakan untuk analisis berbicara dan resynthesis. Hal ini digunakan sebagai bentuk kompresi suara dengan perusahaan telepon, misalnya di GSM standar. Hal ini juga digunakan untuk mengamankan nirkabel, di mana suara harus didigitalkan , dienkripsi dan dikirim melalui saluran suara sempit; sebuah contoh awal dari ini adalah pemerintah AS Navajo saya .

Sintesis LPC dapat digunakan untuk membangun vocoders mana alat musik yang digunakan sebagai sinyal eksitasi ke waktu bervariasi filter diperkirakan dari penyanyi pidato. Hal ini agak populer dimusik elektronik . Paulus Lansky membuat komputer dikenal dengan baik musik-sepotong notjustmoreidlechatter menggunakan linear predictive coding. [1] Perintah-10 LPC digunakan pada tahun 1980 populer Speak & Spell mainan pendidikan.

Bentuk gelombang ROM di beberapa digital sampel berbasis synthesizer musik dibuat oleh Yamaha Corporation dapat dikompresi menggunakan algoritma LPC. ^{[ rujukan? ]}

prediktor LPC digunakan dalam Mempersingkat , 4 MPEG-ALS , FLAC , dan lainnya codec audio lossless.

Sumber terkait :

http://en.wikipedia.org/wiki/Linear_predictive_coding

http://en.wikipedia.org/wiki/Warped_Linear_Predictive_Coding

Signal Processing

Metode LPC (Hidden Markov Model)

0 komentar:

Post a Comment

Labels

Blog Archive

Popular Posts

Recent Posts

Product Category

Download

Blogger Tricks

Blogger Themes