基于DSP嵌入式說(shuō)話人識(shí)別系統(tǒng)的設(shè)計(jì)
1.6 說(shuō)話人身份識(shí)別的結(jié)果顯示
說(shuō)話人的身份顯示通過(guò)LED的組合顯示確定。在DSK上有4只LED燈,將每個(gè)LED燈看成是一位二進(jìn)制數(shù)。則4個(gè)LED燈最大可表示16個(gè)人的身份。該系統(tǒng)取前10個(gè)組合來(lái)表示所識(shí)別的說(shuō)話人的身份。
1.7 自舉的實(shí)現(xiàn)
以上程序都是通過(guò)PC機(jī)與DSP組合實(shí)現(xiàn),要想使系統(tǒng)在DSP上單獨(dú)完成,還必須實(shí)現(xiàn)自舉。該系統(tǒng)采用ROM方式自舉。在自舉實(shí)現(xiàn)過(guò)程中,程序的燒寫(xiě)可以通過(guò)CCS自帶的FLASHBorn工具實(shí)現(xiàn)。在燒寫(xiě)過(guò)程中應(yīng)正確的分配FLAH ROM的空間。FLASHROM空間總體分為程序存儲(chǔ)區(qū)和數(shù)據(jù)存儲(chǔ)區(qū),經(jīng)計(jì)算,程序代碼段大小為0x162C0,故在FLASH ROM中劃分127 KB的空間供程序代碼使用,空間中未使用的部分供程序擴(kuò)展使用。數(shù)據(jù)存儲(chǔ)區(qū)劃分的大小為64 KB的空間,每個(gè)說(shuō)話者模型參數(shù)占用空間為4.2 KB左右,最多可存放15個(gè)說(shuō)話人GMM模型參數(shù)。該系統(tǒng)訓(xùn)練者數(shù)目為10個(gè),占用空間為42 KB左右。剩余的空間可用來(lái)擴(kuò)展訓(xùn)練人數(shù),也可用于后期系統(tǒng)的改進(jìn)。如可以利用語(yǔ)音提示來(lái)顯示說(shuō)話人身份,而提示語(yǔ)音的數(shù)據(jù)可以存放于此區(qū)域。具體的存儲(chǔ)的安排如表1所示。
2 系統(tǒng)的算法與軟件設(shè)計(jì)
說(shuō)話人識(shí)別系統(tǒng)的實(shí)現(xiàn)方案如圖3所示。
輸入的模擬語(yǔ)音先通過(guò)預(yù)處理,包括預(yù)濾波、采樣、量化、加窗、端點(diǎn)檢測(cè)、預(yù)加重等。語(yǔ)音經(jīng)過(guò)預(yù)處理后進(jìn)行特征提取。在訓(xùn)練階段,對(duì)提取的特征進(jìn)行相應(yīng)的處理后就可以獲得參考模型。識(shí)別階段,語(yǔ)音通過(guò)同樣的通道獲得特征參數(shù),生成測(cè)試摸型,之后將測(cè)試摸型與參考摸型進(jìn)行匹配,從而根據(jù)判決邏輯獲得判決結(jié)果。
linux操作系統(tǒng)文章專(zhuān)題:linux操作系統(tǒng)詳解(linux不再難懂)
評(píng)論