語(yǔ)音識(shí)別芯片實(shí)現(xiàn)人機(jī)交互!
物聯(lián)網(wǎng)時(shí)代,語(yǔ)音識(shí)別被視作為人機(jī)交互的入口,人工智能和機(jī)器學(xué)習(xí)的迅猛發(fā)展,使語(yǔ)音控制變得更為實(shí)用。雖然語(yǔ)音識(shí)別與生物識(shí)別相比,發(fā)展相對(duì)緩慢,但是學(xué)術(shù)界和工業(yè)界對(duì)于語(yǔ)音市場(chǎng)都很看好,這意味著未來(lái)發(fā)展空間十分巨大。而人工智能芯片的應(yīng)用領(lǐng)域也不斷向多維度發(fā)展。
語(yǔ)音識(shí)別芯片最大的特點(diǎn)就是能夠語(yǔ)音識(shí)別,它能讓機(jī)器聽(tīng)懂人類的語(yǔ)音,并且可以根據(jù)命令執(zhí)行各種動(dòng)作,如眨眼睛、動(dòng)嘴巴(智能娃娃)。
除此之外,語(yǔ)音識(shí)別芯片還具有高品質(zhì)、高壓縮率錄音放音功能,可實(shí)現(xiàn)人機(jī)對(duì)話。
九芯電子 NRK220X語(yǔ)音識(shí)別芯片
按照使用者的限制而言,語(yǔ)音識(shí)別芯片可以分為特定人語(yǔ)音識(shí)別芯片和非特定人語(yǔ)音識(shí)別芯片。
特定人語(yǔ)音識(shí)別特定人語(yǔ)音識(shí)別芯片是針對(duì)指定人的語(yǔ)音識(shí)別,其他人的話不識(shí)別,須先把使用者的語(yǔ)音參考樣本存入當(dāng)成比對(duì)的資料庫(kù),即特定人語(yǔ)音識(shí)別在使用前必須要進(jìn)行語(yǔ)音訓(xùn)練,一般按照機(jī)器提示訓(xùn)練2遍語(yǔ)音詞條即可使用。
非特定人語(yǔ)音識(shí)別非特定人語(yǔ)音識(shí)別芯片是不用針對(duì)指定的人的識(shí)別技術(shù),不分年齡、性別,只要說(shuō)相同語(yǔ)言就可以,應(yīng)用模式是在產(chǎn)品定型前按照確定的十幾個(gè)語(yǔ)音交互詞條,采集200人左右的聲音樣本,經(jīng)過(guò)PC算法處理得到交互詞條的語(yǔ)音模型和特征數(shù)據(jù)庫(kù),然后燒錄到芯片上。應(yīng)用這種芯片的機(jī)器(智能娃娃、電子寵物、兒童電腦)就具有交互功能了。
一般我們選擇的AI智能產(chǎn)品都是非特定語(yǔ)音識(shí)別芯片,只需要說(shuō)出智能產(chǎn)品的喚醒詞就可以實(shí)現(xiàn)人機(jī)對(duì)話。
當(dāng)然語(yǔ)音識(shí)別的內(nèi)容條數(shù)也是有限制的,一般市面上的語(yǔ)音識(shí)別芯片只能識(shí)別20條左右,不能滿足一些產(chǎn)品語(yǔ)音交互的需求,而九芯電子的NRK220X語(yǔ)音識(shí)別芯片可以識(shí)別三百條;可以滿足語(yǔ)音識(shí)別內(nèi)容指令多的智能產(chǎn)品的需求。
九芯電子NRK2201語(yǔ)音識(shí)別芯片
NRK220X語(yǔ)音識(shí)別模塊為廣州九芯電子自主研發(fā)的一款模塊,無(wú)須外圍元件,直接對(duì)接外部,集成了一顆高性能、低成本的離線語(yǔ)音識(shí)別芯片,具有語(yǔ)音識(shí)別及播報(bào)功能,需要外掛 SPI-Flash,存儲(chǔ)詞條或者語(yǔ)音播內(nèi)容。
他具有識(shí)別率高,工業(yè)級(jí)性能、簡(jiǎn)單易用,更新詞條方便等優(yōu)勢(shì)。廣泛應(yīng)用在智能家居、AI人工智能、玩具等多種領(lǐng)域。
而且語(yǔ)音存放的長(zhǎng)度由音頻采樣率及芯片內(nèi)部(或外掛)ROM空間所決定,音頻采樣率的大小直接影響音頻輸出的音質(zhì),同一型號(hào)芯片的音頻采樣率越高,音質(zhì)越好,但是需要占用更多的ROM空間。芯片的成本也因存儲(chǔ)空間的增大而有不同幅度的上漲。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。