AI機(jī)器人喊出“中國臺灣省” 語音識別揭秘其愛國本源!
如果從機(jī)器人口中蹦出你從未聽過的句子,驚不驚喜?意不意外?
本文引用地址:http://www.biyoush.com/article/201804/378110.htm最近,中國臺灣的一款A(yù)I機(jī)器人在回答問話的過程中,就爆了金口,說出中國臺灣省,這是不是很愛國?
前不久,在臺南科學(xué)園區(qū)日前舉辦AI機(jī)器人展會,由華碩開發(fā)的家居智能機(jī)器人“Zenbo”在展會上問到“這里是不是臺灣?”“Zenbo”當(dāng)場回答“中國臺灣省臺南市。”會后,“獨(dú)派”基進(jìn)黨會后發(fā)布聲明表達(dá)“抗議”。
據(jù)了解,這款機(jī)器人Zenbo由華碩開發(fā),屬于家居智能機(jī)器人,擁有許多生活應(yīng)用與智慧功能連結(jié),號稱可以說故事以及與人智能互動。去年11月以中文名稱“小布”在大陸亮相,在軟件方面導(dǎo)入騰訊“云小微平臺”,提供包含QQ音樂、騰訊視頻、小微百科、企鵝FM、新聞、氣象等在地化的服務(wù)及應(yīng)用。“小布”的市場行銷規(guī)劃除了兩岸之外,今年也要進(jìn)軍美、日市場。
事實(shí)上,機(jī)器人在大陸這邊說出“中國臺灣省”,并不會讓人感到驚奇,因?yàn)樵谒袊说男闹?,臺灣是中國神圣領(lǐng)土不可分割的一部分,稱其為省也是理所當(dāng)然。然而,對于那些一心想獨(dú)立的臺獨(dú)分子來說,機(jī)器人說出“中國臺灣省”就有些掛不住面子了。
機(jī)器人語言詞匯來自哪里?
那么,機(jī)器人為何會出現(xiàn)這種不經(jīng)意間說出意想不到的詞匯的這種情況呢?
這還要從機(jī)器人的語音識別系統(tǒng)說起,每一臺機(jī)器人都有一個語音庫,語音庫中的詞匯會根據(jù)實(shí)際應(yīng)用中的情況不斷更新,實(shí)際中交流時的詞匯是怎樣的,呈現(xiàn)在機(jī)器人的語言里就是怎樣的。也就是說,現(xiàn)階段的機(jī)器人還遠(yuǎn)遠(yuǎn)達(dá)不到自我創(chuàng)造語言的程度,而更像是反映人類自身行為的鏡子。
正是因?yàn)樵诖蠖鄶?shù)人的認(rèn)知里,臺灣是中國領(lǐng)土不可分割的一部分,甚至很多人把臺灣當(dāng)做中國的一個省,這樣的語言交流成為絕大多數(shù)時,AI機(jī)器人的語音識別就會把這類語言現(xiàn)象當(dāng)做一個事實(shí)。因此,再從機(jī)器人的口中說出來也就再正常不過了。
由此看來,AI機(jī)器人“Zenbo”比臺獨(dú)分子更能了解社情民意,因?yàn)槠浯泶蠖鄶?shù)的語音識別數(shù)據(jù)庫已經(jīng)證實(shí)了臺灣是中國一個省的事實(shí)。
語義識別是聊天機(jī)器人的下一步
如果是臺灣的這款A(yù)I機(jī)器人說出“中國臺灣省”不過是基于語音庫作出的自然選擇,只能證明是聊天機(jī)器人在語音識別的階段的基本表現(xiàn)。那么,達(dá)到語義識別的聊天機(jī)器人又會有哪些表現(xiàn)呢?
在聊天機(jī)器人的背后,其實(shí)是一套復(fù)雜的系統(tǒng),主要包括5個功能模塊:語音識別模塊、自然語言理解模塊、對話管理模塊、自然語言生成模塊、語音合成模塊。
首先,語音識別模塊負(fù)責(zé)接收用戶輸入的語音并將其轉(zhuǎn)換成文字形式。
然后,自然語言理解模塊在理解了用戶輸入的語義之后將特定的語義表達(dá)式輸入到對話管理模塊中。
接著,對話管理模塊負(fù)責(zé)協(xié)調(diào)各個模塊的調(diào)用及維護(hù)當(dāng)前對話狀態(tài),選擇特定的回復(fù)方式并交由自然語言生成模塊進(jìn)行處理。
最后,自然語言生成模塊生成回復(fù)文本輸入給語音合成模塊將文字轉(zhuǎn)換成語音輸出給用戶。
通常來說,聊天機(jī)器人系統(tǒng)中的自然語言理解功能包括用戶意圖識別、用戶情感識別、指代消解、省略恢復(fù)、回復(fù)確認(rèn)及拒識判斷等技術(shù)。
對話管理功能主要協(xié)調(diào)聊天機(jī)器人的各個部分,并維護(hù)對話的結(jié)構(gòu)和狀態(tài)。對話管理功能中涉及到的關(guān)鍵技術(shù)主要有對話行為識別、對話狀態(tài)識別、對話策略學(xué)習(xí)及對話獎勵等。
自然語言生成通常根據(jù)對話管理部分產(chǎn)生的非語言信息,自動生成面向用戶的自然語言反饋。
目前來看,人類不過剛剛邁過了語音識別的門檻,甚至科大訊飛等公司中文的識別的準(zhǔn)確率提升到97%以上,但是機(jī)器人作出的反饋則是基于語音庫的自然連接,和被動輸出已經(jīng)形成的答案。聊天機(jī)器人在現(xiàn)階段還做不到自己對聊天內(nèi)容理解基礎(chǔ)上的回答。曾經(jīng)因接受采訪而聲名鵲起的索菲亞機(jī)器人,后來被證明不過是通過后臺控制只能背誦標(biāo)準(zhǔn)答案的騙子。
點(diǎn)評:聊天機(jī)器人不神秘也不神話,它不過是語音識別在智能機(jī)器人身上的一個應(yīng)用罷了。目前語音識別還難以突破語義理解的門檻,哪天人類在語義理解上突破了語義理解的瓶頸,讓機(jī)器人能真正聽懂人話,真正的AI機(jī)器人時代才會到來。
評論