AI大航海時代,對話機器人如何引領交互方式變革
自計算機出現以來,人機交互界面經歷了命令行到圖形化界面的更新迭代,而隨著人工智能(AI)在生活中的逐漸普及和應用,例如蘋果的Siri、亞馬遜的Alex,甚至是京東的JIMI已經紛紛闖入我們的生活,我們現在正在經歷從圖形化界面向對話式界面的技術變革時刻,而這其中,對話機器人的發(fā)展將會是一個關鍵點。
本文引用地址:http://www.biyoush.com/article/201801/374486.htm圖形化界面VS對話式界面
比較一下圖形化界面和對話式界面,主要有以下四點差異:
1)圖形化界面是二維的,更加重視廣度;對話式界面是一維的,更加注重深度,用戶可以更專注于一件事情上。
2)圖形化界面更加注重空間感,主次關系也要通過顏色和距離感來實現差異化,這是圖形化界面設計時的一個原則;對話式界面更加強調的是時間感,例如剛剛討論的話題,過一段時間討論同樣的話題就不太重要了。
3)圖形化界面更加強調共性,就用戶體驗來看,在圖形化界面,同一個系統(tǒng)中每個人看到的東西都差不太多;對話式界面則更強調個性,我們每個人的對話內容都是不一樣的,對話機器人和我說的話應該和另外一個人說的話不一樣,更加偏個性一些。
4)圖形化界要求比較穩(wěn)定,用戶希望不要天天改版;對話式界面則是進化的,用戶更希望說過的話不需要一遍一遍地再去重復。
由此可見,在更注重個性化和精準度的當下,對話式界面顯然更符合用戶需求。
對話機器人分類
對話機器人根據應用場景不同主要可以分為三類:個人信息助理、聊天機器人和客服導購機器人。
個人信息助理是用對話形態(tài)做人機交互比較好的應用場景,同時由于基本上都是由行業(yè)巨頭在做的,例如蘋果、谷歌、亞馬遜等,因而發(fā)展速度較快,應用也比較多。愛因互動CTO洪強寧先生介紹稱,其實,這一領域也確實應該由巨頭來做,因為入口是個人信息助理最核心部分,要想將其做好,就要能夠實現快速調動,而最好的入口資源大部分都是掌控在巨頭手中的。同時,隨著技術飛速發(fā)展,也有很多不同技術在個人信息助理中應用來提升其用戶體驗,預計一兩年后,大家會比較習慣用個人信息助理,例如智能手機、智能手表及家里的智能音箱。
聊天機器人相對于另外兩類對話機器人較為簡單,這類機器人并不能完成具體某項任務,主要用作心理陪伴和娛樂。針對這類對話機器人,對話輪次是一個比較重要的技術指標,能夠與用戶進行自然對話輪次越多,時間越長,可以說機器人的能力就越好。目前來看,業(yè)內最好的聊天機器人能夠與人類自然對話二十多輪,再往后聊,你就能夠發(fā)現它跟不上人類的思維了。目前應用在聊天機器人上比較好的技術是seq2seq算法,為了提高其在聊天中的應對能力,還需要使用諸多增強技術,例如為聊天機器人注入背景信息、個人信息、知識庫信息,并引入上下文等。
客服導購機器人是為了完成一件事情與機器人溝通,最后能夠達到某種目的。在這種應用場景中,尤其是在做售前應用時,主要有三種主要的對話形態(tài):人主導的形態(tài),即人問一個問題,機器回答一個問題;機器人主導形態(tài),即機器人問人問題,人來回答;交叉主導形態(tài),即人問一個問題,機器人發(fā)現不知道該怎么答,會反問一句,人回答了機器人的問題之后,機器人再給出答案。大體上可以分成這三種形態(tài),很多其他復雜的對話則是由這三種形態(tài)反復切換來實現。其中人主導的形態(tài)是最簡單的形態(tài),也是目前在商業(yè)應用中最為成熟的形態(tài)。
作為AI領域重要重要內容之一,對話機器人有怎樣的技術要求?需要怎樣的工程團隊?初創(chuàng)企業(yè)又該怎樣入局?近日,《電子產品世界》編輯在“AI時代的移動技術革新”大會上采訪了愛因互動CTO洪強寧先生。
語音市場發(fā)展趨于成熟,創(chuàng)業(yè)公司更應關注語義
電子產品世界:在對話機器人領域,創(chuàng)業(yè)公司應該怎樣選擇切入點?
洪強寧:語音轉文本和文本轉語音,現在都有比較專業(yè)的公司在做,而且很多企業(yè)做得已經很好了,對于創(chuàng)業(yè)公司而言,我們覺得現在再去做語音就是技術的浪費了,而更應該將資源用到像語義這樣發(fā)展還不是很完備的方向。
現在在做語義的大概有兩種形態(tài):一種形態(tài)是做基礎語義服務的,并不在乎具體的應用場景,例如情感探測、實體抽取等;另外一種是做應用場景的,像我們是在考慮機器人在具體應用場景下該怎樣去回答問題,和場景與行業(yè)聯系的非常緊密。
在真實的應用場景中,需要用到語音識別的時候,我們會調用第三方的服務來生成文本,例如科大訊飛等廠商的語音識別做得已經很好了,我們可以直接使用他們的技術完成前面語音識別部分,而從文本理解是什么含義的時候則是用到我們自己的技術,因為這項技術還沒有一家公司聲稱做出了一個任何場景都可以使用的平臺,針對售前對話機器人,我們的技術效果是更好的;同時,這也是我們的核心競爭力和技術壁壘,我們需要在這上面去深入研究。
機器人服務平臺要先做專用領域
電子產品世界:如何理解現在的通用機器人服務平臺和專用機器人服務平臺?
洪強寧:工程團隊的一個非常大的產出是在機器人服務平臺上,但是創(chuàng)建對外開發(fā)的機器人服務平臺目前從商業(yè)上看還不是一個好的時機,因為現在對話機器人仍然是和場景緊密結合的,現在還不太可能脫離場景去搭建一個通用的機器人服務平臺。
實際上,前兩年已有通用的機器人服務平臺出現,但是效果都不是很好。因而我們更加傾向于做行業(yè)專用的平臺,先使機器人服務平臺在售前應用中用起來效果非常好,之后再在這個基礎上做泛化,做到其他場景中去。
現在我們正在規(guī)劃一個大的機器人服務平臺,這個是一個工程化的事情,需要做云平臺、PAAS架構,需要在服務功能飛速增長的時候有一個非常好的、穩(wěn)定的服務,能夠包括像大數據處理等。這個機器人服務平臺是我們內部自己用的,是為了加快算法調優(yōu)的速度,使算法工程師不再需要去關心一些工程上的技術細節(jié),更專注到算法調優(yōu)本身。
對話設計師將會成為新崗位
電子產品世界:AI創(chuàng)業(yè)公司更需要怎樣的人才,對工程團隊有怎樣的要求?
洪強寧:對于AI創(chuàng)業(yè)公司來說,更需要的是項目落地人才,即能夠把AI的技術應用到具體場景中的人才。如果是純研究算法的人,對于高?;蛘呤茄芯吭簳?,而對于創(chuàng)業(yè)公司則會更關注落地的能力,我們追求的是效果,而不是炫酷的技術,有的時候會發(fā)現深度學習的效果還不如一些傳統(tǒng)方法的時候,我們也會選擇傳統(tǒng)的方法。
同時,工程團隊也需要懂AI算法。工程團隊如果完全不懂算法的話是無法和算法工程師進行配合的,工程團隊做的很大一部分是建立機器人服務平臺,算法工程師是平臺的用戶,因而工程團隊需要知道算法工程師需要的東西是什么,從而給他們提供好用的工具,也需要了解AI是怎么做的,至少需要知道數據是怎樣組織的、訓練是怎么一回事、模型是怎么加載的,在這些地方,哪些是性能的瓶頸,這都需要工程團隊的工程師完全了解的。
電子產品世界:做對話機器人的公司相對于其他AI行業(yè)會有怎樣的特別需要?
洪強寧:在對話機器人領域,產品經理有一個很重要的工作職責是做對話設計,這個也可能是未來可能產生的一個新崗位?,F在對話機器人的技術還做不到完全像人一樣溝通,這個崗位要考慮的是當機器和人對話的時候,如何設計機器人的語言,使整個對話變得更自然,這個技術在真實落地的應用中是一件很重要的事情。
AI人才緊缺現狀與高薪資現狀
電子產品世界:如何理解AI人才緊缺和高薪資這一現狀?
洪強寧:掌握新技術的人就是整個社會的推動力,社會也一定對這種人才的需求是非常旺盛的。其實我們現在身處第四次工業(yè)革命的開始階段,在變革的早期,這樣的人才很少,掌握這類技能的人才被市場爭搶在所難免。在任何技術早期,你掌握了這項技術,薪資都會相對較高,但是同時也會有這樣一個趨勢:AI技術越來越成為程序員一個基礎技術。例如谷歌在面試程序員的時候,不論你面試的是哪個崗位,都會考察你的AI能力。
這就類似云計算的發(fā)展,云計算發(fā)展這么多年,現在工程師如果不懂云計算的基礎知識就不是一個合格的程序員。未來,十年以后,如果不懂得AI的工程師就不是一個合格的程序員。隨著掌握AI技術的人群越來越多,薪資水平也將會逐漸回到一個相對合理的狀態(tài)。
AI創(chuàng)業(yè)公司與大公司競爭的優(yōu)勢
電子產品世界:與大公司相比,創(chuàng)業(yè)公司有哪些競爭優(yōu)勢?
洪強寧:相比巨頭公司,創(chuàng)業(yè)公司動作更快,關注點更超前。創(chuàng)業(yè)公司更多專注于場景,而對于單個場景的投入,大公司往往是不足的,只有可能觸及到平臺利益時,大公司才會投入大量資源與創(chuàng)業(yè)公司競爭,而只要創(chuàng)業(yè)公司在這之前建立起很好的競爭壁壘,是不害怕這樣的競爭。
AI行業(yè)其實一個很好的范例,AI行業(yè)需要的是數據的積累,而不論是大公司還是小公司都需要時間的積累收集數據和處理數據,例如收集數據、清洗數據、理解數據以及結合應用場景的過程,而這些都需要時間和經驗的積累,并不是說大公司會比小公司擁有有更多的競爭優(yōu)勢。
對話機器人的準確率評判指標
電子產品世界:如何評判對話機器人的準確率,現在對話機器人準確率是多少?
洪強寧:對話機器人大概可以分為兩類:閑聊機器人和任務導向機器人。對于閑聊機器人,對話輪次是一個評價指標,時間越長,機器人做的就越好;而對于任務導向機器人,主要有兩個評價指標:任務完成率和攔截率。
對于任務導向機器人,我們是希望他可以幫我辦事的,這個時候,對話輪次就不再是一個很好的指標,相對短的輪次反而會更好;針對此類機器人,單輪對話會有準確率的概念,具體指機器人對用戶提問響應是否正確就是準確率,此時任務完成率會作為核心指標。
而有些準確率的數據是不可信的,例如機器人自己對自己作出決策和評價,即攔截率。這是指你說的話,機器人覺得可以回答的比率;而準確率是指我答了,而且還答對的比率。因而準確率是要比攔截率要低一些的。
現在的準確率還是要人來判斷的,而為了降低工作量,機器人可以先做一個預判,然后人再做更正。針對對話機器人,具體準確率要分應用場景,越復雜、用戶說的話越發(fā)散,準確率會越低, 大體上應該會在百分之七十多到百分之九十多之間波動。 如果是單輪問答,主要還會取決于知識庫的建立情況,一般在百分之八十多到百分之九十多之間波動。
對話機器人要達要到人的平均水平,至少還要十年
電子產品世界:當下很多智能產品并不夠智能,對話機器人也還處在“低配智能”階段,還要多久我們才能到達“高配智能”階段?
洪強寧:現在對話機器人,甚至AI還處在早期大航海時代,大家都在嘗試在各種應用場景下使用這個技術,根據反饋去優(yōu)化和調整。我們會全力以赴地關注用戶的反饋,快速更新技術,并不斷完善我們的產品。
就智能的程度而言,現在確實是受限的,不光是對話機器人,整個AI行業(yè)都存在這個問題,不管是深度學習,還是傳統(tǒng)機器學習方法,都面臨著準確率不為100%的現狀。通過學習大量的現有知識,然后生成一個模型,用這個模型去匹配現有的知識,預測之后的輸入可以給出一個怎樣的輸出,這樣的一個模型永遠都會與真實模型有一定的誤差。雖然可以用深度學習的方法不斷增加學習信息,準確率會越來越高,但永遠都無法達到100%。
我們并不能期望對話機器人不出錯,要期望的是對話機器人出的錯要比人少。我覺得現在談像人一樣的對話機器人還尚早,至少還要兩三年,對話機器人在某些特定場景能夠達到人的平均水平;而要談通用對話機器人能夠達到人的平均水平,甚至在某些特定場景超越人類,至少還要十年之久。
評論