基于DSP的語音識別計算器設(shè)計
2)將離散譜X(k)通過M個Mel頻率濾波器組可得到Mel頻譜并通過對數(shù)能量的處理,得到對數(shù)頻譜S(n)。計算S(n)通過每一個濾波器的輸出,得到M個h(m)參數(shù)。
![](http://editerupload.eepw.com.cn/fetch/20130905/166656_3_0.jpg)
3)對所有濾波器輸出進(jìn)行對數(shù)運(yùn)算,再進(jìn)一步進(jìn)行離散余弦變換(DCT),即可得到MFCC參數(shù)。
![](http://editerupload.eepw.com.cn/fetch/20130905/166656_3_1.jpg)
一般在Mel濾波器的選擇中。Mel濾波器組都選擇三角形的濾波器,但也可以是其他形狀,如正弦形的濾波器組等。
2.4 模板匹配(HMM算法)
本文采用隱馬爾科夫模型(HMM算法)進(jìn)行模式匹配。它將特征矢量作為模板,在語音識別模式匹配時,對輸人的語音與模板庫中的模板進(jìn)行比較,最后將相似度最高的作為輸出結(jié)果。HMM算法解決由于說話人語速不同和連續(xù)說話的而帶來的失真問題,還能大大減少運(yùn)算時間,提高識別率。
隱馬爾可夫模型是一個雙重隨機(jī)過程的統(tǒng)計模型,其基本隨機(jī)過程是隱藏起來觀測不到的,另一個隨機(jī)過程則產(chǎn)生觀測序列。對于語音識別系統(tǒng),觀測序列0就是矢量量化后的結(jié)果序列,模型λ就是由訓(xùn)練語音得到的模板。語音的訓(xùn)練過程就是產(chǎn)生模板λ的過程,而語音的識別過程就是求出在模板λ下,待識別語音的結(jié)果序列0的條件概率P[O/λ]。
由α(i)和β(i)的定義可直接得到:P[O/λ]=αt(i)βt(i)。而語音的訓(xùn)練算法則較復(fù)雜,目前都采用迭代的方法得到a和b的近似解,其迭代公式如:
![](http://editerupload.eepw.com.cn/fetch/20130905/166656_3_2.jpg)
在實際應(yīng)用中,僅對詞條的少數(shù)次發(fā)音進(jìn)行訓(xùn)練的語音識別系統(tǒng)。不可能對各種復(fù)雜語境下的不同發(fā)音都有較高的識別率。某些較陳舊的識別算法如動態(tài)時間彎曲法,只能把單詞的多次訓(xùn)練發(fā)音形成多個模板,造成模板數(shù)量成倍增加,影響系統(tǒng)的實時性。而HMM能夠?qū)σ粋€詞的多個訓(xùn)練序列進(jìn)行有效的融合而形成一個模板。當(dāng)訓(xùn)練發(fā)音的數(shù)量增多時,只會造成訓(xùn)練過程的計算量增大。而不會使識別過程的計算量有絲毫增加,這對系統(tǒng)的實時性是相當(dāng)有利的。本文引用地址:http://www.biyoush.com/article/166656.htm
3 系統(tǒng)測試
針對計算器的使用特點(diǎn)和環(huán)境,分別在2個地點(diǎn)測試系統(tǒng)的性能。1)封閉的實驗室(地點(diǎn)1),噪聲較小,采集的信號較為良好,缺點(diǎn)是有回聲。2)課間休息的教室(地點(diǎn)2),噪聲及大,干擾很強(qiáng),信號的采集質(zhì)量很差。
因為整個系統(tǒng)的設(shè)計是實現(xiàn)計算器的計算功能,因此本次的實驗是在系統(tǒng)識別數(shù)字和運(yùn)算符號等語音后在顯示器上顯示數(shù)學(xué)運(yùn)算公式,并在識別出“等于”或“得出”2個詞組的語音后顯示出“=”和最后的計算結(jié)果。
在測試前預(yù)先采集5男5女共1 000個語音樣本(內(nèi)容為數(shù)字0到100,加、減、乘、除、等于和十、百、千、萬等基本計算所需要的數(shù)字和運(yùn)算符號讀音),并且對所有樣本進(jìn)行訓(xùn)練。另外找10人(4女,6男)在各實驗地點(diǎn)進(jìn)行實時測試,每人10個,共100個未經(jīng)訓(xùn)練的樣本。用這些樣本對系統(tǒng)進(jìn)行測試,其測試結(jié)果如表1所示。
由表l所示,在相同的實驗設(shè)備條件下,在噪聲較小的環(huán)境下的系統(tǒng)識別率要遠(yuǎn)高于在嘈雜的環(huán)境下。特別是非經(jīng)訓(xùn)練的樣本在嘈雜環(huán)境下的識別率比較低,主要是因為環(huán)境中的噪聲相當(dāng)復(fù)雜,查看頻譜圖發(fā)現(xiàn)噪聲幾乎與說話人語音混雜疊加,算法難以識別。
4 結(jié)論
本文設(shè)計的語音識別計算器系統(tǒng),除兼有語音識別的功能,還能對識別的語音信號做進(jìn)一步處理。由于采用HMM模型對語音信號進(jìn)行端點(diǎn)檢測,大大提高語音信號起止點(diǎn)判斷準(zhǔn)確性,提高了識別的準(zhǔn)確率。由于系統(tǒng)運(yùn)算復(fù)雜。計算量和存儲量都很大,同時也需要實時處理語音信號與算法,系統(tǒng)所采用的TMS320VC5509,由于其具有0.05 MW/MIPS的功耗,800 MIPS的運(yùn)算能力等優(yōu)越的性能,完全能夠滿足實時識別功能。實驗表明,該計算器系統(tǒng)處理速度快,運(yùn)行穩(wěn)定,達(dá)到了設(shè)計要求。
評論