將門沈強:智能芯片是人工智能算力創(chuàng)新的基石
“今天是一個半導(dǎo)體行業(yè)的盛會,正好將人工智能的軟件要素、硬件要素交融在一起。”將門CTO、將門創(chuàng)投創(chuàng)始合伙人沈強在集微半導(dǎo)體峰會上從算法、算力和數(shù)據(jù)的角度談了人工智能的不同創(chuàng)新模式。
本文引用地址:http://www.biyoush.com/article/201709/364721.htm2017年9月15日,由集微網(wǎng)、手機中國聯(lián)盟主辦,廈門半導(dǎo)體投資集團公司承辦的“集微半導(dǎo)體峰會”在廈門海滄舉行。此次峰會以“‘芯’聯(lián)產(chǎn)業(yè),積微成著 ”為主題,同期舉辦的人工智能論壇專場,來自將門創(chuàng)投、碼隆科技、偉景智能、悅享趨勢科技和元鼎音訊的企業(yè)高層、人工智能產(chǎn)業(yè)界的優(yōu)秀人才等圍繞當(dāng)前熱點話題、核心技術(shù)以及大家共同關(guān)注的市場動向,重塑熱點話題,解析趨勢變化,洞悉行業(yè)變革。
沈強作為此次人工智能論壇的主持,開場介紹將門這家專注于發(fā)掘、加速及投資技術(shù)驅(qū)動型創(chuàng)業(yè)公司的創(chuàng)業(yè)服務(wù)和投資機構(gòu),其旗下還設(shè)有將門企業(yè)用戶對接、將門技術(shù)社群以及將門投資基金。
據(jù)悉,將門投資基金專注于投資通過技術(shù)創(chuàng)新激活商業(yè)場景,實現(xiàn)商業(yè)價值的初創(chuàng)企業(yè)。關(guān)注領(lǐng)域包括機器智能、物聯(lián)網(wǎng)、自然人機交互、企業(yè)計算。在一年時間里,將門投資基金已經(jīng)投資了包括量化派、碼隆科技、偉景智能、禾賽科技等超過10家具有高成長潛力的技術(shù)型創(chuàng)業(yè)公司。
據(jù)沈強介紹,將門聚焦在“MINE”四個主要領(lǐng)域,其中M是機器智能,I是物聯(lián)網(wǎng)相關(guān),從物聯(lián)網(wǎng)通訊、傳感器、數(shù)據(jù)處理、物聯(lián)網(wǎng)應(yīng)用。N是自然人機交互,E網(wǎng)是企業(yè)計算,包括云計算,企業(yè)應(yīng)用,信息安全等。
Gartner數(shù)據(jù)顯示,未來兩年到三年的時間內(nèi),人工智能將會進入一個泛應(yīng)用的時間點。沈強進一步指出,從人工智能的技術(shù)成熟度的曲線來看,現(xiàn)在這個時間點剛剛好。目前,人工智能主要是數(shù)據(jù)驅(qū)動型的方式,深度學(xué)習(xí)在里面起了很關(guān)鍵的作用。然而,從創(chuàng)新角度來講,可以從人工智能的三要素,算法、算力和數(shù)據(jù)三個角度出發(fā),尋找合適的應(yīng)用場景落地,再將其轉(zhuǎn)化成商業(yè)價值。場景的創(chuàng)新等于商業(yè)價值的創(chuàng)新,算力的創(chuàng)新可以理解為硬件創(chuàng)新,算法的創(chuàng)新理解為軟件創(chuàng)新,結(jié)合起來從是軟硬結(jié)合的方式共創(chuàng)人工智能的新精彩。
從創(chuàng)新場景來看,除了規(guī)模宏大的交通、運輸?shù)确矫妫斯ぶ悄艿纳虡I(yè)價值無處不在,需要我們?nèi)ド钔凇I驈娡ㄟ^一個消費實例來告訴現(xiàn)場的嘉賓,即使一個微小的應(yīng)用場景,當(dāng)結(jié)合上人工智能的時候,便能夠激活一個創(chuàng)新的場景,實現(xiàn)商業(yè)價值。他講道,有一段時間經(jīng)常在外面出差,家里的貓無人照料,便選用了一款自動喂貓的機器,每天定時喂養(yǎng)家里的貓,這是一個極其細(xì)分極其細(xì)小的市場。在使用過程中遇到一些問題,便聯(lián)系到做寵物喂養(yǎng)、自動喂食器公司的老總聊了一下,詢問未來在這一領(lǐng)域想做的創(chuàng)新,發(fā)現(xiàn)其實跟人工智能有很大的關(guān)系。在喂食器上面添加一個攝像頭,既可以給主人做遠程監(jiān)控使用,還能夠做貓臉識別,為不同年齡階段的貓、不同健康狀況的貓做個性化的喂養(yǎng)服務(wù)。“這對我來說是一個教育,如此微小的市場,通過與人工智能的結(jié)合便能夠激活一個創(chuàng)新的應(yīng)用場景。”
從算法來看,人工智能的發(fā)展離不開深度學(xué)習(xí)模型,而深度神經(jīng)網(wǎng)絡(luò)更是其中最重要的一部分。過去十幾年來,從2012年DiagonalLineNode開始,神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)一直在持續(xù)的發(fā)展中。2015年其實是一個關(guān)鍵節(jié)點,微軟研究院提出的深度高達152層的神經(jīng)網(wǎng)絡(luò),視覺計算組的系統(tǒng)錯誤率已經(jīng)低至3.57%,首次實現(xiàn)了對人類視覺能力的突破,這意味著在商業(yè)可行性上,它可以在某些特定場景下取代人發(fā)揮作用。神經(jīng)網(wǎng)絡(luò)的層數(shù)逐漸增多,由此帶來了巨大問題,軟件方面的改進對硬件也提出了需求。如此復(fù)雜的網(wǎng)絡(luò),無論在服務(wù)器端還是設(shè)備端,都對其計算能力提出了更高的要求,如此才能夠讓高精度的識別能力重現(xiàn)。
一直以來,深度學(xué)習(xí)的算法都用來處理圖像、識別聲音,集中在識別圖片中的一只貓或者一個只狗,再進一步分類+定位,標(biāo)注出其在圖中的區(qū)域和位置。隨著深度學(xué)習(xí)算法與自然語言的 結(jié)合處理,可以用于對象的檢測,把多只貓、多只狗、多個人分開,進一步做實際分割,逐步應(yīng)用在安防、機器人應(yīng)用。沈強表示,其實在固體識別的檢測方面,過去用R-CNN算法可以達到53.3%,而現(xiàn)在用FasterR-CNN可以達到83.8%。從圖像分割延伸至視頻處理,目前越來越多的深度學(xué)習(xí)算法可以很好的做視頻分割操作,以識別出視頻中哪一幀哪一個像素屬于哪一個對象,可以用于人臉識別、刷臉識別等應(yīng)用。
深度學(xué)習(xí)的發(fā)展方向就是算法的創(chuàng)新,沈強指出從監(jiān)督學(xué)習(xí)到半監(jiān)督學(xué)習(xí)/無監(jiān)督學(xué)習(xí)的演化過程,從依賴于大數(shù)據(jù)到只需要小數(shù)據(jù),One-Shot Learning。我們知道,監(jiān)督學(xué)習(xí)是依賴于標(biāo)簽過的數(shù)據(jù),今天我們講說那些人臉識別精度達到多少,以及我們在ImageNet里面,這個紅線上展示的都是標(biāo)簽過的數(shù)據(jù),它使我們了解到從數(shù)據(jù)挖掘智能、挖掘知識的年代。但站在我們的角度來看,這并不應(yīng)該成為固守的一個方向。為什么呢?大量的數(shù)據(jù)都未標(biāo)簽過,這都是成本,而成本將阻礙進一步創(chuàng)新,擁有數(shù)據(jù)的大型企業(yè)在人工智能的發(fā)展過程中會占據(jù)有利地勢,我們怎么樣讓那些創(chuàng)新的想法更快的涌現(xiàn)出來呢?
如果說人工智能的下一步是算法,能夠不依賴于大量數(shù)據(jù)或者不依賴于標(biāo)簽過的數(shù)據(jù),可以用廣泛的無標(biāo)簽的這些數(shù)據(jù),這將大大降低我們數(shù)據(jù)處理的成本,本質(zhì)上使人工智能變得更加民主,無論大企業(yè)或小企業(yè)都能自主的參與到這一競爭中。為什么ImageNet今年之后將成為絕唱?沈強表示,因為他們的組織者認(rèn)為在標(biāo)簽法數(shù)據(jù)的學(xué)習(xí)上面已經(jīng)獲得一定成績,如果再往下做探索的話,會比現(xiàn)階段更有意義的途徑。我們要相對成熟的看問題,往前跳一步去解決那些無標(biāo)簽的數(shù)據(jù),WebVISION競賽就應(yīng)運而生,它取代了ImageNet的競賽,其主要特點便是采用的數(shù)據(jù)都是無人工標(biāo)注的??上驳氖菬o論ImageNet或是WebVISION,中國參賽者都獲得了世界領(lǐng)先的成績,其中碼隆科技便在WebVISION獲得第一名的傲人成績。
當(dāng)深度無監(jiān)督的學(xué)習(xí)被應(yīng)用起來時,通過不同的算法計算出不同的內(nèi)容,根據(jù)條件生成的自動網(wǎng)絡(luò),或是對抗式的神經(jīng)網(wǎng)絡(luò)。我們不必在意兩種算法的區(qū)別,因為都會指出一條道路,人工智能不僅可以用于認(rèn)知事情,還可以創(chuàng)新更有意義的內(nèi)容。從波音公司利用對抗式神經(jīng)網(wǎng)絡(luò)設(shè)計機翼,利用算法以解決生活中的具體問題;從視頻預(yù)測利用對抗式神經(jīng)網(wǎng)絡(luò)觀察未來發(fā)展,預(yù)測危險的可能性,預(yù)防更多危險的情況發(fā)生;Deepmind通過算法的創(chuàng)新強化學(xué)習(xí)的創(chuàng)新,以尋找規(guī)律、建立模型,這種通用人工智能的創(chuàng)新對半導(dǎo)體產(chǎn)業(yè)的發(fā)展非常有意義。“算法的創(chuàng)新提供無限的可能性,這將為未來更多的應(yīng)用場景落地提供槍支彈藥。”沈強補充道。
在算力方面,智能芯片是人工智能的基石,機器學(xué)習(xí)很大程度上依賴于一個強大計算的基礎(chǔ)設(shè)施。沈強指出,深度學(xué)習(xí)的計算量太大,目前有兩種類型的計算,基于訓(xùn)練或基于推理的。訓(xùn)練可以讓系統(tǒng)學(xué)習(xí)數(shù)據(jù)、獲得模式,而推理是以訓(xùn)練好的模型或意境學(xué)到的知識,去應(yīng)用判斷未來的過程。這也是為什么Nvidia股票去年漲了四倍,巨大的計算量催生對更高速的計算架構(gòu)的需求。包括微軟、亞馬遜等公司都已開始構(gòu)建相應(yīng)的云服務(wù),華為與寒武紀(jì)在麒麟970在終端上的合作,提供深度計算加速的設(shè)施,英特爾耗費100多億美元去購買人工智能的企業(yè),實際上就是其背后所提供的計算架構(gòu)更適合人工智能對算力的需求。
從CPU、到GPU、FPGA深知專用電路應(yīng)用于不同的場景,我們可以看到演進還在持續(xù)不斷的發(fā)生,適合于不同的應(yīng)用場景下面,甚至于最夸張的,像Google Brain項目利用超并行的方法,在一個芯片上有16000多個核,16個芯片作為一個組,再裝載到機器里面,所以它一臺服務(wù)器里面有256萬個內(nèi)核。沈強表示,類似這樣的創(chuàng)新,包括GoogleTPU的創(chuàng)新,我們在行業(yè)里面也看到很多不停的涌現(xiàn)出來,包括專門做視覺的,也有一些不是通用的,而是做一些專用領(lǐng)域的。從蘋果iPhone X,這個每秒6500億次計算的小的超小型計算機,到華為Mate 10,這一高達1.92萬億次的計算能力的計算機,未來要處理的場景還需要無數(shù)的模型加載,需要更多深層設(shè)施,有不同的神經(jīng)網(wǎng)絡(luò)在里面,以滿足各種各樣的應(yīng)用場景對巨大計算量的需求。
最后沈強總結(jié)道,從場景創(chuàng)新、軟件創(chuàng)新和硬件創(chuàng)新,越來越多的創(chuàng)新技術(shù)出現(xiàn),人工智能逐步走入包括消費電子、健康、金融、零售等的各行各業(yè)。人工智能正滲透到行業(yè),成為重塑每一個行業(yè)的關(guān)鍵力量。如何將創(chuàng)新技術(shù)轉(zhuǎn)換成商業(yè)價值,人工智能的業(yè)務(wù)價值將從2B、2C的方面體現(xiàn)出現(xiàn),無論哪一層的實現(xiàn)都離不開軟硬的結(jié)合。無論是安防、無人機、甚至未來數(shù)萬億市場的自動駕駛,以及由亞馬遜Echo所引領(lǐng)的智能語音交互,都需要硬件上的感知執(zhí)行系統(tǒng),軟件上優(yōu)異的用戶服務(wù)體現(xiàn),背后更需要先進的人工智能技術(shù)、相應(yīng)的算法和基礎(chǔ)設(shè)置,正是需要技術(shù)的相互結(jié)合,為人工智能行業(yè)和半導(dǎo)體行業(yè)的結(jié)合提供很好的合作契機。
評論