在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<menu id="6qfwx"><li id="6qfwx"></li></menu>
    1. <menu id="6qfwx"><dl id="6qfwx"></dl></menu>

      <label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>
        1. <center id="6qfwx"><dl id="6qfwx"></dl></center>

            新聞中心

            EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 音樂識(shí)別鎖軟硬件完整方案

            音樂識(shí)別鎖軟硬件完整方案

            作者: 時(shí)間:2017-06-04 來源:網(wǎng)絡(luò) 收藏

            緒論

            本文引用地址:http://www.biyoush.com/article/201706/348701.htm

            隨著人們生活質(zhì)量的提高,對(duì)生活各面都提出了更高的要求。家居安全成了人們關(guān)注的問題。同時(shí),鑰匙的遺失或失竊成為了普通鑰匙的最大弊端。由此人們急需一種更方便,更安全的門鎖系統(tǒng)。無疑,聲紋識(shí)鎖是目前最好的考慮。但由于人聲易被拷貝,整個(gè)鎖價(jià)格昂貴,所以沒法在普通家庭進(jìn)行推廣。另外,一把語音鎖只能由一個(gè)人開啟,不適合家庭等需要多成員的場(chǎng)所使用。于是,作者另辟蹊徑,發(fā)明了鎖,用音樂來開鎖。它幾乎完全具有聲紋識(shí)別鎖的所有功能。同時(shí),它造價(jià)低廉,方便攜帶。只要記住音樂的片段,就可以用音樂播放設(shè)備進(jìn)行開啟。完全不怕丟失,如果想把鑰匙“配”給其它人,只需要告訴他音樂的片段的信息就可以了,使用起來非常方便。

            一,音樂識(shí)別實(shí)現(xiàn)過程介紹

            本文介紹的音樂電子門鎖是一種在上實(shí)現(xiàn)的與文本有關(guān)的身份確認(rèn)系統(tǒng)。該系統(tǒng)主要由語音識(shí)別模塊、電磁鐵以及門鎖等部分組成。在訓(xùn)練時(shí),音樂通過音頻接口進(jìn)入音樂信號(hào)采集前端電路,由音樂信號(hào)處理電路對(duì)采集的音樂信號(hào)進(jìn)行特征化和音樂處理,提取音樂音紋的個(gè)性特征參數(shù)并進(jìn)行存儲(chǔ),形成音紋參數(shù)數(shù)據(jù)庫(母版)。在識(shí)別時(shí),將待識(shí)別音樂與音紋參數(shù)數(shù)據(jù)庫進(jìn)行匹配,通過輸出電路控制電磁鐵的通斷,最終實(shí)現(xiàn)對(duì)門鎖的控制。

            圖1

            由框架圖1可以看出,此識(shí)別過程的安全性有4個(gè)保證點(diǎn)。第一個(gè)是在輸入密鑰的時(shí)候,直接輸入數(shù)字信號(hào),無法被竊聽。剩下的3個(gè)保證點(diǎn)分別是三次音樂識(shí)別過程。識(shí)別三段音樂,這三段音樂可以是一首歌中的音樂,也可以分別來自不同的音樂,不確定性加強(qiáng)了。同時(shí),此識(shí)別過程需要三段音樂同時(shí)識(shí)別成功最后才能成功,每次識(shí)別都需要按鍵,音樂的精準(zhǔn)度有了保障。采用不同的按鍵輸入,按鍵順序隨時(shí)改變,因此,從某種意義上來講又成為了一種密碼。因此,如果想拿出一個(gè)存滿音樂的mp3或者就只是一首歌來逐個(gè)的試出打開鎖的密碼音樂,那樣無異于大海撈針。

            (母版聲紋密碼)

            (聲紋鑰匙)

            此圖可直觀的看出,聲紋信息不一致,因此無法識(shí)別!

            二,與聲紋識(shí)別的比較

            生物識(shí)別技術(shù)是利用人體生物特征進(jìn)行身份認(rèn)證的一種技術(shù),是目前公認(rèn)的最為方便與安全的識(shí)別技術(shù)。在生物識(shí)別領(lǐng)域中,聲紋識(shí)別,也稱為說話人識(shí)別,以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢(shì)受到世人矚目,并且日益成為人們?nèi)粘I詈凸ぷ髦兄匾移毡榈陌踩J(rèn)證方式。聲紋識(shí)別技術(shù)是一種根據(jù)說話人語音波形中反映說話人生理和行為特征的語音參數(shù),自動(dòng)識(shí)別說明人身份的技術(shù)。隨著技術(shù)應(yīng)用范圍的擴(kuò)大,聲紋識(shí)別的應(yīng)用暴露出一些難以克服的缺點(diǎn),比如同一個(gè)人的聲音具有易變性,易受身體狀況、年齡、情緒等的影響;比如不同的麥克風(fēng)和信道對(duì)識(shí)別性能有影響;比如環(huán)境噪音對(duì)識(shí)別有干擾;比如多人混合說話的情形下人的聲紋特征不易提取,等等。最新實(shí)踐表明,聲紋識(shí)別出現(xiàn)了一個(gè)很大的漏洞:聲紋信息可被高保真錄音設(shè)備提取。這個(gè)缺點(diǎn)直接影響了聲紋識(shí)別技術(shù)的安全性。

            與身紋識(shí)別最大的區(qū)別就是前者用音樂做密碼,要求用戶按照自己的喜好,往音紋識(shí)別系統(tǒng)中輸入特定的音樂片段,音紋模型被精確地建立。以后的識(shí)別將會(huì)以此段音樂為母版,進(jìn)行音紋比對(duì)。如果被識(shí)別的音紋能與母版相匹配則識(shí)別成功。由于音樂片段是通過音頻接口直接在識(shí)別系統(tǒng)與音樂播放器中進(jìn)行傳輸,傳輸?shù)氖菙?shù)字信號(hào),因此不會(huì)有外界聲音的影響,與使用者的身體狀況沒有任何關(guān)系,可以達(dá)到較好的識(shí)別效果。同時(shí),由于音樂傳播的隱蔽性,音紋密碼不會(huì)被外部錄音設(shè)備獲取,保證了音紋識(shí)別系統(tǒng)安全性。

            因此,音紋識(shí)別技術(shù),它克服了以上所有聲紋識(shí)別具有的缺點(diǎn)。同時(shí),音紋識(shí)別的應(yīng)用有一些特殊的優(yōu)勢(shì):(1)蘊(yùn)含音紋特征的語音獲取方便、快捷,音紋提取可利用任何音樂載體完成,因此使用者的接受程度也高;(2)獲取音樂的識(shí)別成本低廉,使用簡(jiǎn)單,一個(gè)音頻接口即可,在使用通訊設(shè)備時(shí)更無需額外的錄音設(shè)備;(3)適合遠(yuǎn)程身份確認(rèn),只需要一個(gè)手機(jī)就可以通過網(wǎng)路(通訊網(wǎng)絡(luò)或互聯(lián)網(wǎng)絡(luò))實(shí)現(xiàn)遠(yuǎn)程登錄;(4)音紋辨認(rèn)和確認(rèn)的算法復(fù)雜度低;……等等。這些優(yōu)勢(shì)音預(yù)示著音紋識(shí)別,這種全新的識(shí)別模式必將成為身份識(shí)別技術(shù)中另一具有發(fā)展?jié)摿Φ募夹g(shù)。

            圖2

            三,算法原理

            音紋識(shí)別算法原理框圖如圖2所示。

            (一)預(yù)處理

            1,去噪

            對(duì)音頻接口輸入的數(shù)字信號(hào);將含噪的音樂信號(hào)通過去噪處理,得到干凈的音樂信號(hào)后并通過預(yù)加重技術(shù)濾除低頻干擾,尤其是50Hz或60Hz的工頻干擾,提升語音信號(hào)的高頻部分,而且它還可以起到消除直流漂移、抑制隨機(jī)噪聲和提升清音部分能量的作用。

            2,端點(diǎn)檢測(cè)

            本系統(tǒng)采用音樂信號(hào)的短時(shí)能量和短時(shí)過零率進(jìn)行端點(diǎn)檢測(cè)。音樂信號(hào)的采樣頻率為8kHz,每幀數(shù)據(jù)為20ms,共計(jì)160個(gè)采樣點(diǎn)。每隔20ms計(jì)算一次短時(shí)能量和短時(shí)過零率。通過對(duì)音樂信號(hào)的短時(shí)能量和短時(shí)過零率檢測(cè)可以剔除掉靜默幀、白噪聲幀和清音幀,最后保留對(duì)求取基音等特征參數(shù)非常有用的濁音信號(hào)。


            3,特征提取

            在音樂信號(hào)預(yù)處理后,接著是特征參數(shù)的提取。特征提取的任務(wù)就是提取音樂信號(hào)中表征音樂的基本特征。特征必須能夠有效地區(qū)分不同的音樂,同時(shí)要求特征參數(shù)計(jì)算簡(jiǎn)便,最好有高效快速算法,以保證識(shí)別的實(shí)時(shí)性。

            (1)音樂特殊性的保證

            此識(shí)別技術(shù)可以采用任何格式的音樂,這也是此系統(tǒng)最大的優(yōu)點(diǎn)之一。每一段音樂記錄了不同演唱者的聲紋信息,以及音樂的音色、調(diào)性、節(jié)拍、音高、音長(zhǎng)、音量、速度和持續(xù)時(shí)間等特定的信息。在此基礎(chǔ)上,又可以進(jìn)一步提取旋律、和聲、節(jié)奏等復(fù)雜特征。這些信息,就像人類的聲紋特征一樣,有著特殊性,于是謂之為音紋。此識(shí)別技術(shù)識(shí)別音樂基本特征和復(fù)雜特征在內(nèi)的音樂信息并且利用模糊分類器識(shí)別出每一個(gè)樂段所帶有的密碼。為了提高系統(tǒng)的識(shí)別率,在本系統(tǒng)中最好選擇調(diào)子起伏較大,音色比較特別的音樂。

            (2)參數(shù)提取的比較

            通過線性預(yù)測(cè)分析得到的參數(shù)。包括線性預(yù)測(cè)系數(shù)()以及由線性預(yù)測(cè)導(dǎo)出的各種參數(shù),如線性預(yù)測(cè)倒譜系數(shù)(C)、部分相關(guān)系數(shù)、反射系數(shù)、對(duì)數(shù)面積比、LSP線譜對(duì)、線性預(yù)測(cè)殘差等。根據(jù)前人的工作成果和實(shí)際測(cè)試比較,C參數(shù)不但能較好地反饋聲道的共振峰特性,具有較好地識(shí)別效果,而且可以用比較簡(jiǎn)單的運(yùn)算和較快的速度求得。此外,人們還通過對(duì)不同特征參數(shù)量的組合來提高實(shí)際系統(tǒng)的性能。當(dāng)各組合參量間相關(guān)性不大時(shí),會(huì)有較好的效果,因?yàn)樗鼈兎謩e反映了音樂信號(hào)的不同特征。在計(jì)算機(jī)平臺(tái)的仿真實(shí)驗(yàn)中,通過各種參數(shù)的實(shí)際比較,采用MFCC參數(shù)比采用LPCC參數(shù)有更好的識(shí)別效果。但在平臺(tái)上做實(shí)時(shí)處理時(shí),與LPCC系統(tǒng)相比,MFCC系數(shù)計(jì)算有兩個(gè)缺點(diǎn):一是計(jì)算時(shí)間長(zhǎng);二是精度難以保證。由于MFCC系統(tǒng)的計(jì)算需要FFT變換和對(duì)數(shù)操作,影響了計(jì)算的動(dòng)態(tài)范圍;要保證系統(tǒng)識(shí)別的實(shí)時(shí)性,就只有犧牲參數(shù)精度。而LPCC參數(shù)的計(jì)算有遞推公式,速度和精度都可以保證,識(shí)別效果也滿足實(shí)際需要。本系統(tǒng)采用了基音周期和線性預(yù)測(cè)倒譜系數(shù)(LPCC)共同作為音樂識(shí)別的特征參數(shù)。

            (3)LPCC參數(shù)的提取

            基于線性預(yù)測(cè)分析的倒譜參數(shù)LPCC可以通過簡(jiǎn)單的遞推公式由線性預(yù)測(cè)系數(shù)求得。遞推公式如下:

            其中p為L(zhǎng)PC模型的階數(shù),也是模型的極點(diǎn)個(gè)數(shù)。

            (4)LPC模型階數(shù)p的確定

            為使模型假定更好地符合語音產(chǎn)生模型,應(yīng)該使LPC模型的階數(shù)p與共振峰個(gè)數(shù)相吻合。通常一對(duì)極點(diǎn)對(duì)應(yīng)一個(gè)共振峰,10kHz采樣的音樂信號(hào)通常有5個(gè)共振峰,取p=10,對(duì)于8kHz采樣的音樂信號(hào)可取p=8。此外為了彌補(bǔ)音樂片段中存在的零點(diǎn)以及其他因素引起的偏差,通常在上述階數(shù)的基礎(chǔ)上再增加兩個(gè)極點(diǎn),即分別是p=12和p10。實(shí)驗(yàn)表明,選擇LPC分析階數(shù)p=12,對(duì)絕大多數(shù)音樂信號(hào)的聲道模型可以足夠近似地逼近。P值選得過大雖然可以略微改善逼近效果,但也帶來一些負(fù)作用,一方面是加大了計(jì)算量,另一方面有可能增添一些不必要的細(xì)節(jié)。

            (5)線性預(yù)測(cè)系數(shù)的求取

            自相關(guān)解法主要有杜賓(Durbin)算法、格型(Lattice)算法和舒爾(Schur)算法等幾種遞推算法。其中在杜賓算法是目前最常用的算法,而且在求取LPC系數(shù)時(shí)計(jì)算量也量小,本系統(tǒng)采用該遞推算法。

            4,基音參數(shù)的提取

            基音估計(jì)的方法很多,主要有基于短時(shí)自相關(guān)函數(shù)和基于短時(shí)平均幅度差函數(shù)(AMDF)等基音估計(jì)方法。

            (1)基于短時(shí)自相關(guān)函數(shù)的基音估計(jì)

            (2)短時(shí)自相關(guān)函數(shù)在基音周期的整數(shù)倍位置存在較大的峰值,只要找出第一最大峰值的位置就可以估計(jì)出基音周期。

            (3)基于短時(shí)平均幅度差函數(shù)(AMDF)的基音估計(jì)

            基于短時(shí)平均幅度差函數(shù)(AMDF)在基音周期的整數(shù)倍位置存在較大的谷值,找到第一最大谷值的位置就可以估計(jì)出基音周期。這種方法的缺點(diǎn)是當(dāng)語音信號(hào)的幅度快速變化時(shí),AMFD函數(shù)的谷值深度會(huì)減小,從而影響基音估計(jì)的精度。

            實(shí)際上第一最大峰(谷)值點(diǎn)的位置有時(shí)并不能與基音周期吻合,第一最大峰(谷)值點(diǎn)的位置與短時(shí)窗的長(zhǎng)度有關(guān)且會(huì)受到共振峰的干擾。一般窗長(zhǎng)至少應(yīng)大于兩個(gè)基音周期,才可能獲得較好的估計(jì)效果。音樂中最長(zhǎng)基音周期值約為20ms,本系統(tǒng)在估計(jì)基音周期時(shí)窗長(zhǎng)選擇40ms。為了減小共振峰的影響,首先對(duì)語音進(jìn)行頻率范圍為[60,900]Hz的帶通濾波。因?yàn)樽罡呋纛l率為450Hz,所以將上限頻率設(shè)為900Hz可以保留語音的一、二次諧波,下降頻率為60Hz是為了濾除50Hz的電源干擾。

            以上幾種方法都是對(duì)語音信號(hào)本身求相應(yīng)的函數(shù)。本系統(tǒng)采用的基音估計(jì)方法是:首先對(duì)帶通濾波后的短時(shí)語音信號(hào)進(jìn)行線性預(yù)測(cè),求取預(yù)測(cè)殘差;再對(duì)殘差信號(hào)求自相關(guān)函數(shù),找出第一最大峰值點(diǎn)的位置,即得到該段語音的基音估計(jì)值。實(shí)驗(yàn)表明,通過殘差求取的基音軌跡比直接通過語音求取的基音軌跡效果更好,如圖2所示。圖2中橫坐標(biāo)為語音幀數(shù),縱坐標(biāo)為8000/f,其中f為基音頻率。

            5,模式匹配

            目前針對(duì)各種特征參數(shù)提出的模式匹配方法的研究越來越深入。典型的方法有:矢量量化方法、高斯混合模型方法、隱馬爾可夫模型方法、動(dòng)態(tài)時(shí)間規(guī)整(DTW)方法和人工神經(jīng)網(wǎng)絡(luò)方法。

            這些方法都有各自的優(yōu)點(diǎn)和缺點(diǎn)。其中DTW算法對(duì)于較長(zhǎng)音樂的識(shí)別,模板匹配運(yùn)算量太大,但對(duì)短音樂(有效音樂長(zhǎng)度低于3s)的識(shí)別既簡(jiǎn)單又有效,而且并不比其他方法識(shí)別率低,特別適用于短語音、與文本有關(guān)的音樂識(shí)別系統(tǒng)。本系統(tǒng)采用端點(diǎn)松馳兩點(diǎn)的(DTW)算法,端點(diǎn)松馳引起的計(jì)算量增加并不大,還可以放松對(duì)端點(diǎn)檢測(cè)的精度要求。

            動(dòng)態(tài)時(shí)間規(guī)整(DTW)算法基于動(dòng)態(tài)規(guī)劃的思想,解決了音樂不同時(shí)期音質(zhì)長(zhǎng)短、音速不一樣的匹配問題。DTW算法用于計(jì)算兩個(gè)長(zhǎng)度不同的模板之間的相似程度,用失真距離表示。假設(shè)測(cè)試模板和參考模板分別用T和R表示,按時(shí)間順序含有N幀和M幀的語音參數(shù)(本系統(tǒng)為12維LPCC參數(shù)),失真距離越小,表示T、R越接近。把測(cè)試模板的各個(gè)幀號(hào)n=1~N在一個(gè)二維直角坐標(biāo)系中的橫軸上標(biāo)出,把參考模板的各幀號(hào)m=1~M在縱軸上標(biāo)出,如圖3所示。通過這些表示幀號(hào)的整數(shù)坐標(biāo)畫出縱橫線即形成網(wǎng)絡(luò),網(wǎng)格中的每一個(gè)交叉點(diǎn)(n,m)表示測(cè)試模板中某一幀與參考模式中某一幀的交會(huì)點(diǎn),對(duì)應(yīng)兩個(gè)向量的歐氏距離。DTW算法可以歸結(jié)為尋找一條通過此網(wǎng)格中若干交叉點(diǎn)的路徑,使得該路徑上節(jié)點(diǎn)的距離和(即失真距離)為最小。對(duì)于端點(diǎn)松弛的情況,路徑搜索原理相同,只是增加了搜索路徑。

            (二) 硬件系統(tǒng)

            音紋電子門鎖系統(tǒng)的核心是音樂識(shí)別模塊。包括按鍵輸入、音樂信號(hào)采集、音樂信號(hào)處理、FLASH存儲(chǔ)擴(kuò)展、揚(yáng)聲器輸出、控制輸出以及LCD模組等。音樂識(shí)別模型的原理框圖如圖4所示。其核心為音樂信號(hào)處理。


            音樂識(shí)別模塊各組成部分完成的功能如下:

            (1)按鍵輸入部分:共有數(shù)字鍵、訓(xùn)練鍵、刪除鍵、確認(rèn)鍵和取消鍵等按鍵,用于密碼輸入時(shí)的各項(xiàng)操作。其中訓(xùn)練鍵為隱藏部分,在外部無法直接看到。采用不同的按鍵輸入,按鍵順序隨時(shí)改變,因此,從某種意義上來講又成為了一種密碼。

            (2)語音信號(hào)采集部分:特定語音芯片

            (3)FLASH存儲(chǔ)擴(kuò)展部分:用于存儲(chǔ)音樂的個(gè)性特征參數(shù)參考模板。

            (4)揚(yáng)聲器輸出部分:揚(yáng)聲器

            (5)控制輸出部分:用I/O口控制門鎖控制電機(jī)。

            (6)LCD模組部分:用以顯示系統(tǒng)的工作狀態(tài),以及操作提示。

            (三)工作模式

            音樂識(shí)別模塊有三種工作模式:訓(xùn)練模式、認(rèn)證模式,這兩種模式都可通過工作模式按鍵選擇。

            (1)訓(xùn)練模式,音樂的聲音通過音頻線進(jìn)入語音信號(hào)采集前端電路。第一次語音輸入時(shí),由對(duì)采集的語音信號(hào)進(jìn)行處理,提取音樂的個(gè)性特征參數(shù),并存儲(chǔ)到外擴(kuò)的FLASH內(nèi),形成音樂特征參數(shù)模板。每個(gè)密碼可以進(jìn)行三次訓(xùn)練,第二語音輸入時(shí),提取的個(gè)數(shù)特征參數(shù)與由第一次語音輸入形成的特征參數(shù)模板進(jìn)行匹配,在匹配距離小于模板更新閾值時(shí),將音樂特征參數(shù)模板更新為兩次特征參數(shù)的平均值。第三次語音輸入時(shí),提取的個(gè)性特征參數(shù)與由第一、二次語音輸入形成的特征參數(shù)模板進(jìn)行匹配,在匹配距離小于模板更新閾值時(shí),將音樂特征參數(shù)模板更新為三次特征參數(shù)的平均值,形成最后的該音樂的特征參數(shù)模板。訓(xùn)練模式只有識(shí)別程序的擁有者可見。

            (2)認(rèn)證模式,同樣通過音頻線錄入音樂的聲音,再由單片機(jī)對(duì)采集的語音信號(hào)進(jìn)行處理,將提取的音樂特征參數(shù)與存儲(chǔ)在外擴(kuò)FLASH內(nèi)的特征參數(shù)模板進(jìn)行匹配,匹配距離小于認(rèn)證閾值時(shí),通過認(rèn)證;然后再判斷匹配距離是否小于認(rèn)證模式下的模板更新閾值,決定是否對(duì)模板進(jìn)行更新。

            另外,由于單片機(jī)的可重復(fù)編程功能,如果有必要,此音紋識(shí)別系統(tǒng)可以再加入密碼輸入等安全認(rèn)證措施。但考慮到本音紋識(shí)別本身具有較高的安全性,加入密碼輸入沒有太大的意義,在這里我們并沒有加入此功能。

            (四)總結(jié)

            音紋識(shí)別不僅使用方便,安全,而且還具有以下特性:用戶接受程度高,由于不涉及隱私問題,用戶無任何心理障礙;聲音輸入設(shè)備造價(jià)低廉,而其他生特識(shí)別技術(shù)的輸入設(shè)備通常造價(jià)昂貴。與聲紋識(shí)別,利用虹膜、指紋和人臉等技術(shù)的門鎖相比,基于單片機(jī)構(gòu)建的語音電子門鎖系統(tǒng)具有成本低、使用方便、保密性好等優(yōu)點(diǎn)。經(jīng)大量實(shí)驗(yàn)測(cè)試表明,該系統(tǒng)性能穩(wěn)定、識(shí)別效果好。下一步將進(jìn)行更多功能的,以及算法的完善。為此技術(shù)尋找除了鎖之外的其它更廣泛的用途。



            評(píng)論


            相關(guān)推薦

            技術(shù)專區(qū)

            關(guān)閉