NVIDIA要做一家“人工智能公司” 這個市場到底有多大?
黃仁勛在1993年創(chuàng)立了一家叫做NVIDIA的公司,于1999年發(fā)明了圖形處理器GPU,從此GPU就改變了世界。特別是在游戲領(lǐng)域,NVIDIAGPU幾乎已經(jīng)成為了游戲設(shè)備的標(biāo)配。如今,NVIDIA獲得超過7300個專利,其中包括很多對現(xiàn)代計算有深刻影響的技術(shù)。
本文引用地址:http://www.biyoush.com/article/201609/297101.htm6年前,黃仁勛開始意識到人工智能對于未來人類社會的巨大影響力,開始帶領(lǐng)公司整體往人工智能方向轉(zhuǎn)型。2016年,NVIDIA密集發(fā)布了全線人工智能GPU芯片、系統(tǒng)、軟件和服務(wù),而公司定位轉(zhuǎn)向成為“世界上偉大的人工智能公司之一”。
NVIDIA全球副總裁兼中國區(qū)總經(jīng)理張建中說:“NVIDIA現(xiàn)在是一家人工智能公司,我們不再單一生產(chǎn)GPU芯片,而是系統(tǒng)性提供人工智能解決方案,包括芯片、服務(wù)器、軟件和服務(wù)等。我們不再是一家GPU公司。”
從NVIDIA的AI產(chǎn)品布局說起
盡管NVIDIA從6年前開始布局人工智能AI產(chǎn)品,但到了2016年才推出了比較完整的產(chǎn)品線,特別是在2016年9月13日的GTC CHINA 2016(NVIDIAGPU技術(shù)大會)上發(fā)布的推理加速器Tesla P4/P40,形成了深度學(xué)習(xí)的核心產(chǎn)品。
可能有人會問,什么是“推理加速器”?
首先,NVIDIA選取的人工智能路線為基于神經(jīng)元網(wǎng)絡(luò)的深度學(xué)習(xí)算法,而這一算法有兩大核心組成部分,分別是“訓(xùn)練”用于獲得神經(jīng)元網(wǎng)絡(luò)模型,以及把訓(xùn)練好的神經(jīng)元模型用于“推理”。簡單理解,把基于神經(jīng)元網(wǎng)絡(luò)的深度學(xué)習(xí)用于圖像識別,比如用海量花卉類圖片“訓(xùn)練”出神經(jīng)元網(wǎng)絡(luò)模型,這個模型就能用于識別新圖片里的花卉(“推理”)。
其次,NVIDIA于兩年前宣布了新一代PASCAL GPU芯片架構(gòu),這是NVIDIA的第五代GPU架構(gòu),也是首個為深度學(xué)習(xí)而設(shè)計的GPU,它支持所有主流的深度學(xué)習(xí)計算框架。在今年上半年,NVIDIA針對“訓(xùn)練”推出了基于PASCAL架構(gòu)的Tesla P100芯片以及相應(yīng)的超級計算機(jī)DGX-1;而在9月的北京GTC大會上,NVIDIA針對“推理”推出了基于PASCAL的產(chǎn)品Tesla P4/P40,主要區(qū)別在于小尺寸的P4可用于任何服務(wù)器,而大尺寸的P40則需要定制服務(wù)器。
為什么要針對“推理”設(shè)計加速器呢?這是因?yàn)橛糜谏疃葘W(xué)習(xí)的神經(jīng)元網(wǎng)絡(luò)模型正在變成規(guī)模巨大。以百度用于語音識別的神經(jīng)元網(wǎng)絡(luò)為例,這個模型從2014年的2500萬個參數(shù)暴漲到2015年的1億個參數(shù),而浮點(diǎn)運(yùn)算則從2014年的2ExaFLOPS(每秒百億億次浮點(diǎn)計算)飆升到2015年的20ExaFLOPS,但錯誤率卻下降了40%。而2015年Image Net大賽的冠軍,即微軟的殘差網(wǎng)絡(luò)ResNet達(dá)到了152層,而2012年的冠軍Alex Net卻只有8層。這就是推理加速器的誕生緣由,即針對上百層和數(shù)以萬計參數(shù)的神經(jīng)元網(wǎng)絡(luò)的大規(guī)模并行計算。
所以,Tesla P100是用于“訓(xùn)練”的GPU,Tesla P4/P40是用于“推理”的GPU,這兩個產(chǎn)品都是針對企業(yè)和數(shù)據(jù)中心而設(shè)計。在更小型設(shè)備的物聯(lián)網(wǎng)層,NVIDIA則在今年3月推出了第二代嵌入式計算機(jī)Jetson TX1用于無人機(jī)、機(jī)器人、智能攝像頭等,以及9月推出的第二代自動汽車駕駛計算機(jī)Drive PX2。
評論