Google Now背后的科技有多黑?
不久前,Google 宣布進(jìn)行架構(gòu)重組,原安卓業(yè)務(wù)主管、Google 高級(jí)副總裁桑達(dá)爾·皮查伊成為了 Google 新任的CEO。這個(gè)變動(dòng)似乎引起了一些 Google Now 開(kāi)發(fā)團(tuán)隊(duì)的不滿(mǎn),引發(fā)全員離職(亦說(shuō)骨干成員離職),Google Now并入大 Search 組。Google Now 是安卓平臺(tái)用以對(duì)抗蘋(píng)果Siri、微軟Cortana的語(yǔ)音助手。那么,Google Now是什么?它包含了哪些 Google 的黑科技?
本文引用地址:http://www.biyoush.com/article/279637.htmGoogle Now 是什么
雖然本文談的廣義 Google Now 是集成了語(yǔ)音搜索的一整套 App,但更精確地定義狹義的 Google Now,就是手機(jī)上 Google Now 應(yīng)用打開(kāi)之后,出現(xiàn)在首屏的那些智能推薦卡片,在合適的時(shí)間推送給你合適的信息,比如天氣、新聞。相對(duì)于人們?cè)贕oogle搜索輸入框主動(dòng)輸入自己想找的東西,Google Now會(huì)“智能”地把你所需要的信息推送到你面前。
所以,大家經(jīng)常把 Google Now 稱(chēng)之為 Google 的智能推送技術(shù)。
比如筆者在國(guó)外的時(shí)候,能享受到 Google Now 的便利。比如通過(guò)Booking.com(類(lèi)似攜程)定了酒店,或者 kayak.com(類(lèi)似去哪兒)定了機(jī)票,確認(rèn)郵件都會(huì)發(fā)到筆者的Gmail郵箱。Google會(huì)很“智能”地分析(偷窺)這些行程郵件,并在航班即將起飛前幾小時(shí)提醒你航班的具體信息及航站樓甚至登機(jī)口信息。在你到達(dá)新的城市的時(shí)候,自動(dòng)彈出你即將下榻酒店的導(dǎo)航路線(xiàn)以及聯(lián)系電話(huà)等信息。出國(guó)旅行的時(shí)候,Google Now會(huì)自動(dòng)彈出當(dāng)?shù)氐呢泿艆R率,以及祖國(guó)的時(shí)間。它也會(huì)細(xì)心地記住你家和公司的位置,在下班時(shí)間準(zhǔn)時(shí)提醒你回家的交通狀況,雖然還并不能那么智能地了解到你今晚又要加班!
這里再說(shuō)說(shuō)Google Now 的誕生
Google Now,也是傳說(shuō)中的 Google 20% Project 的產(chǎn)物。Google工程師 Baris Gultekin 在2010年的時(shí)候,因?yàn)閭€(gè)人興趣想利用手機(jī)上豐富的傳感器來(lái)做一些有趣的事情,這個(gè)想法跟時(shí)任Google Map負(fù)責(zé)人的 Andrew Kirmse 不謀而合。兩人在業(yè)余時(shí)間里面搭建了一個(gè)原型,并展示給當(dāng)時(shí)還在 Google 的梅姐 Marissa mayer。
在梅姐的支持下,隊(duì)伍漸漸壯大,并且也加入了用戶(hù)通勤的時(shí)間預(yù)測(cè)和對(duì) Google Calendar 事件的整合。碰巧的是,在2012年初,Larry Page正好要求 Android 和 Search 團(tuán)隊(duì)搭建一個(gè)類(lèi)似的東西。于是在Android 老大 Andy Rubin 的支持下,兩人加入了 Android 團(tuán)隊(duì),得到了大量的設(shè)計(jì)方面的資源,并且在2012年 Google IO上第一次發(fā)布Google Now。
發(fā)展了這么多年,現(xiàn)在 Google Now 已經(jīng)被整合進(jìn) Google 搜索的 App 中。
最近某國(guó)外科技網(wǎng)站也傳出了Google Now團(tuán)隊(duì)解散的謠言,說(shuō)是成員全數(shù)離職,還聯(lián)系到最近Google架構(gòu)變動(dòng),頗有陰謀論的意思。部分骨干成員離職確有其事,但這早在幾個(gè)月前就發(fā)生了,非常正常的人事變動(dòng)。
Google Now本身作為一個(gè)出色的產(chǎn)品,從Android組移入Search組,從技術(shù)角度來(lái)講,能得到大Search組更多的技術(shù)資源,對(duì)早日完成智能Google這一偉大目標(biāo)是大有好處的,這明顯是個(gè)好消息!
別看這個(gè)App界面簡(jiǎn)單,就一個(gè)搜索框和一排卡片,里面的技術(shù)可不簡(jiǎn)單。
介紹完狹義的Google Now推薦卡片,我們一起來(lái)看看Google Now這個(gè)小app里面,蘊(yùn)含了很多Google的黑科技:智能推薦(Google Now card),熱詞喚醒(OK Google),語(yǔ)音識(shí)別和語(yǔ)義分析。
首先說(shuō)下智能推薦
推薦的原則是“Just right information at right time”,即合適的時(shí)間推薦合適的信息。那么如何知道哪些信息是用戶(hù)真正想要的,而不是機(jī)器自作主張,這個(gè)度需要拿捏。雖然現(xiàn)在統(tǒng)計(jì)機(jī)器學(xué)習(xí)方面這幾年已經(jīng)大規(guī)模地應(yīng)用在工業(yè)界,但是巧婦難為無(wú)米之炊,在無(wú)法得知用戶(hù)生活方方面面信息的前提之下,算機(jī)器學(xué)習(xí)算法再高級(jí),也無(wú)法做出太智能的推薦,所以一般公司都會(huì)采用規(guī)則+機(jī)器學(xué)習(xí)相結(jié)合的策略。
從現(xiàn)有產(chǎn)品看來(lái),Google Now推薦的東西也相當(dāng)保守。
Google 能夠通過(guò)你在某個(gè)地點(diǎn)待的頻率,猜測(cè)你家和工作單位的位置,并且在每天指定時(shí)間自動(dòng)提醒你回家的交通情況。
前面也提到過(guò),行程郵件卡片、酒店預(yù)訂卡片、出國(guó)旅游的匯率和祖國(guó)時(shí)間卡片等等。難點(diǎn)不在有多高深的推薦算法,而在于Google能盡量收集用戶(hù)的生活信息的點(diǎn)點(diǎn)滴滴,并且通過(guò)深思熟慮的規(guī)則,盡量不打擾地推薦給你。在國(guó)外,由于郵件普及率高,Google 坐擁 Gmail(順便說(shuō)一下,Gmail 當(dāng)年出生跟 Google Now很像,也是誕生于傳說(shuō)中的20% project),做出 Google now,Google占了天時(shí)地利人和。
熱詞喚醒
在 Google Now 軟件主界面,對(duì)著手機(jī)喊一聲“OK Google”,則自動(dòng)觸發(fā)語(yǔ)音識(shí)別接受用戶(hù)語(yǔ)音查詢(xún)。
熱詞喚醒作為啟動(dòng)語(yǔ)音識(shí)別的鑰匙,目的是以盡可能低的功耗來(lái)接受用戶(hù)的喚醒。
因?yàn)樾枰掷m(xù)開(kāi)著麥克風(fēng),對(duì)輸入的音頻進(jìn)行運(yùn)算,使得CPU一直無(wú)法得到休眠,會(huì)嚴(yán)重影響已經(jīng)很緊張的手機(jī)電池續(xù)航。
所以手機(jī)上熱詞喚醒要維持高水準(zhǔn),需要考慮的重點(diǎn),除了準(zhǔn)確率(用戶(hù)叫你的時(shí)候能馬上響應(yīng),用戶(hù)不在叫你的時(shí)候不要聽(tīng)錯(cuò)),還有能耗。熱詞喚醒不需要像通用語(yǔ)音識(shí)別一樣識(shí)別千變?nèi)f化的自然語(yǔ)言,它只要識(shí)別“OK Google”這個(gè)固定的詞,所以在算法方面也不必要采用復(fù)雜的傳統(tǒng)語(yǔ)音識(shí)別,拋棄高大上的各種 HMM、語(yǔ)言模型,用簡(jiǎn)單直接的分類(lèi)的方法在用戶(hù)輸入語(yǔ)音流中尋找“OK Google”這幾個(gè)字,簡(jiǎn)單但好用。
當(dāng)然,這也有個(gè)例外,幾年前 Moto X剛出來(lái),就是主打24小時(shí)全程語(yǔ)音喚醒待命,人家可是有2顆低功耗芯片,專(zhuān)門(mén)等待著用戶(hù)隨時(shí)輸入語(yǔ)音命令。
語(yǔ)音識(shí)別就不用說(shuō)了,Google的強(qiáng)項(xiàng)
幾年前微軟研究院的一篇基于深度學(xué)習(xí)應(yīng)用于語(yǔ)音識(shí)別的論文,定義的算法準(zhǔn)確率超越了傳統(tǒng)的基于 HMM-GMM 的語(yǔ)音識(shí)別。但 Google 領(lǐng)先將其工業(yè)化,并應(yīng)用到當(dāng)年的語(yǔ)音搜索產(chǎn)品中。DNN 直接在最原始的音頻數(shù)據(jù)上進(jìn)行語(yǔ)音識(shí)別,并且需要大量的訓(xùn)練數(shù)據(jù),來(lái)訓(xùn)練大量的神經(jīng)網(wǎng)絡(luò)參數(shù),因此對(duì)硬件要求也很高,這正好是 Google 的強(qiáng)項(xiàng)。
經(jīng)過(guò)幾年的積累,Google 的語(yǔ)音識(shí)別已經(jīng)初具規(guī)模。值得注意的是,作為 Google Now 的競(jìng)爭(zhēng)對(duì)手的Siri,Siri 的語(yǔ)音識(shí)別一直用的是 nuance 家的技術(shù)(nuance是世界最大的語(yǔ)音識(shí)別提供商,可以理解為訊飛在中國(guó)的地位),雖然前段時(shí)間也傳出過(guò)蘋(píng)果在組建自己的語(yǔ)音識(shí)別團(tuán)隊(duì)的消息。
語(yǔ)義識(shí)別
通過(guò) Google Now 上面的應(yīng)用搜索框,你可以問(wèn)一些看起來(lái)非常炫酷的問(wèn)題。
一些日常生活類(lèi)信息查詢(xún),比如紐約到舊金山的航班,比如未來(lái)3天北京的天氣,現(xiàn)在東京時(shí)間幾點(diǎn)。這種問(wèn)答系統(tǒng)涉及到自然語(yǔ)言處理的方方面面,難度極大。
雖然在學(xué)術(shù)上,NLP(自然語(yǔ)言處理)在各種領(lǐng)域,比如語(yǔ)法分析、實(shí)體識(shí)別,經(jīng)過(guò)幾十年的努力,都取得了90%以上的準(zhǔn)確率。但在實(shí)際產(chǎn)品情境下,用戶(hù)口語(yǔ)化表述更加多樣,會(huì)產(chǎn)生歧義,和學(xué)術(shù)界經(jīng)常用于評(píng)測(cè)系統(tǒng)的語(yǔ)言測(cè)試集差別很大。
并且,問(wèn)答系統(tǒng)是多個(gè)子NLP系統(tǒng)串聯(lián)成流水線(xiàn)的產(chǎn)物,比如詞性分析的輸出可能作為語(yǔ)法分析的輸入,語(yǔ)法分析的輸出可能作為實(shí)體識(shí)別的輸入。在這么一個(gè)流水線(xiàn)系統(tǒng)中,早期的錯(cuò)誤會(huì)被傳播到流水線(xiàn)之后的步驟,并被放大。
因此單個(gè)子系統(tǒng)上很小的錯(cuò)誤,在最終都會(huì)被放大,嚴(yán)重影響最終對(duì)用戶(hù)查詢(xún)的理解。
一般的問(wèn)答系統(tǒng),都會(huì)針對(duì)當(dāng)前領(lǐng)域進(jìn)行專(zhuān)門(mén)優(yōu)化,研究用戶(hù)問(wèn)得最多的是哪些問(wèn)題,并盡量倚重規(guī)則(甚至正則表達(dá)式),并加強(qiáng)用戶(hù)引導(dǎo),減少用戶(hù)自然語(yǔ)言的歧義。
Google Now 語(yǔ)音搜索還支持一些百科類(lèi)問(wèn)題,比如現(xiàn)在的美國(guó)總統(tǒng)是誰(shuí),喜馬拉雅山的高度是多少,或者中國(guó)的人口是多少。
Google 畢竟是搜索出身,坐擁整個(gè)互聯(lián)網(wǎng)的信息,千千萬(wàn)萬(wàn)的網(wǎng)頁(yè)中已經(jīng)包含了“奧巴馬是美國(guó)總統(tǒng)”,“中國(guó)的人口是13億”這樣的陳述,對(duì)于 Google 來(lái)說(shuō),問(wèn)題會(huì)簡(jiǎn)化成如何匹配用戶(hù)的問(wèn)題到千千萬(wàn)萬(wàn)網(wǎng)頁(yè)中的某一句話(huà),而不僅僅是給出 Top 幾十的匹配網(wǎng)頁(yè),這在屏幕小的手機(jī)上、甚至手表上對(duì)用戶(hù)體驗(yàn)的影響至關(guān)重要。
學(xué)術(shù)界的一般做法,是首先識(shí)別用戶(hù)是問(wèn)哪個(gè)類(lèi)型的問(wèn)題(What? When? Which? Where? etc。),然后利用信息檢索的策略先在千萬(wàn)網(wǎng)頁(yè)中篩選出一些和用戶(hù)問(wèn)題最相關(guān)的候選網(wǎng)頁(yè),之后根據(jù)問(wèn)題類(lèi)型,去這些候選網(wǎng)頁(yè)中摘出最能直接回答用戶(hù)提問(wèn)的語(yǔ)句。贏了Jeopardy!(可以理解為老美的開(kāi)心辭典這樣的知識(shí)問(wèn)答類(lèi)節(jié)目)人類(lèi)冠軍的 IBM Watson 系統(tǒng),也采用了類(lèi)似的設(shè)計(jì)思路。這樣的方法可以確保以自動(dòng)化而非人力的方法提高問(wèn)題的覆蓋率,而不用像某果需要招聘很多問(wèn)題編輯來(lái)應(yīng)對(duì)越來(lái)越多熱心群眾對(duì)Siri的無(wú)情調(diào)戲。
Google 近幾年來(lái),在語(yǔ)義分析、知識(shí)圖譜方面都投入了大力氣,大家也漸漸能在Google Now以及普通搜索中看到對(duì)這類(lèi)技術(shù)的整合。
所以,Google Now 并入大 Search 組,得到更多的技術(shù)支持,絕對(duì)是一件大大的好事呢!
三極管相關(guān)文章:三極管放大電路
評(píng)論