國內外語音識別行業(yè)現(xiàn)狀
本文就詳細盤點一番國內外的大型公司,并對他們掌握的技術進行分析,同時預測一下未來的語音識別趨勢,期望帶給行業(yè)內外的專業(yè)人士些許參考,借此更進一步推進整個行業(yè)的發(fā)展。
本文引用地址:http://www.biyoush.com/article/201608/295872.htm1、國外語音識別行業(yè)收購盤點和技術分析
傳統(tǒng)語音識別行業(yè)貴族Nuance逐漸沒落
任何時候提到語音識別,都不能避過Nuance這家公司,這家公司曾經(jīng)在語音領域一統(tǒng)江湖,世界上有超過80%的語音識別都用過Nuance識別引擎技術,其語音產(chǎn)品可以支持超過50種語言,在全球擁有超過20億用戶,幾乎壟斷了金融和電信行業(yè)。就算現(xiàn)在,仍舊是瘦死的駱駝比馬大,Nuance依舊是全球最大的語音技術公司,掌握著全球最多的語音技術專利。蘋果語音助手Siri、三星語音助手S-Voice、各大航空公司和頂級銀行的自動呼叫中心,剛開始都是采用他們的語音識別引擎技術。Nuance已經(jīng)登陸了納斯達克,三星、蘋果和百度都和它傳過緋聞,傳言多次收購,但是全都無疾而終。
事實上,Nuance有點過于自大了,語音技術即便冠絕全球,但是在具體應用上,差距就沒有那么大了。語音識別技術并非高不可攀,實際上一款用戶體驗較好的語音識別系統(tǒng),很大程度上依靠數(shù)據(jù)和經(jīng)驗,專利和算法什么的并沒有那么重要。聰明人自然很多,所以巨頭們只需考慮挖到專業(yè)人士或者收購初創(chuàng)公司,自主研發(fā)出不遜于Nuance的語音識別技術也不是太難的事情,又何必花費巨資看Nuance臉色呢。
蘋果收購Siri、Novauris Technologies、VocallQ和Emotient
蘋果的Siri已經(jīng)鼎鼎大名了,也算世界上語音識別的執(zhí)牛耳者。Siri并不是蘋果自己研發(fā)的技術,而是2010年蘋果收購SiriInc.公司的產(chǎn)品,2011年蘋果將該技術融入到iPhone4S中并發(fā)布了Siri語音助理。SiriInc.這家公司成立于2007年,原本核心技術是CALO人工智能項目。當然Siri剛開始發(fā)布的時候語音識別的體驗還很差,眾多果粉也是四處吐槽。因此2013年蘋果又收購了語音識別公司Novauris Technologies。Novauris是一種可識別整個短語的語音識別技術,這種技術并非簡單識別單個詞句,而是試圖利用超過2.45億個短語的識別輔助理解上下文,當然這是很有難度的一件事情。不管怎樣,這次收購也讓蘋果進一步完善了Siri的功能。
但是這還是不夠,因此2015年蘋果又收購了英國語音技術初創(chuàng)公司VocalIQ。VocalIQ開發(fā)的人工智能軟件,能夠幫助計算機與用戶進行更為自然的對話。VocalIQ使用機器學習(machine learning)開發(fā)虛擬助手,將語音處理和機器學習技術整合到可穿戴設備、家庭聯(lián)網(wǎng)設備當中的同時,這家公司還特別關注車載應用的開發(fā)。這次收購也證實了蘋果將來邁入汽車領域的決心。Siri應該是通用語音識別領域用戶體驗當前較好的產(chǎn)品,特別是在兒童語音識別領域,這也得益于蘋果極易上手的特性吸引了眾多小朋友,也包括筆者家里的小朋友。
當然,Siri還是距離我們的實際應用需求還差很遠,因此蘋果最近又收購了美國圣地牙哥AI技術公司Emotient,接收其臉部表情分析與情緒辨別技術。據(jù)悉,Emotient開發(fā)的情緒引擎可讀取人們的面部表情并且預測其情緒狀態(tài)。
評論