解讀“中國量子計(jì)算機(jī)”,比神威·太湖之光還厲害?
今天中科院微信發(fā)布了一個“重磅消息”:中國量子計(jì)算機(jī)誕生。
本文引用地址:http://www.biyoush.com/article/201705/358753.htm這么說多少有一點(diǎn)夸張。
這件事實(shí)際上是中科大潘建偉、陸朝陽、朱曉波和浙大王浩華教授等,自主研發(fā)了10比特超導(dǎo)量子線路樣品,通過發(fā)展全局糾纏操作,成功實(shí)現(xiàn)了目前世界上最大數(shù)目的超導(dǎo)量子比特的糾纏和完整的測量。
進(jìn)一步,研究團(tuán)隊(duì)利用超導(dǎo)量子線路演示了求解線性方程組的量子算法,證明了通過量子計(jì)算的并行性加速求解線性方程組的可行性。
潘建偉說:這是歷史上第一臺超越早期經(jīng)典計(jì)算機(jī)的基于單光子的量子模擬機(jī),為最終實(shí)現(xiàn)超越經(jīng)典計(jì)算能力的量子計(jì)算奠定了基礎(chǔ)。
官方公布的實(shí)驗(yàn)測試聲稱,該原型機(jī)的取樣速度比國際同行快至少24000倍,同時,通過和經(jīng)典算法比較,也比人類歷史上第一臺電子管計(jì)算機(jī)(ENIAC)和第一臺晶體管計(jì)算機(jī)(TRADIC)運(yùn)行速度快10-100倍。
相關(guān)報道中還引用了一個例子:“如果現(xiàn)在傳統(tǒng)計(jì)算機(jī)的速度是自行車,量子計(jì)算機(jī)的速度就好比飛機(jī)”。而且進(jìn)一步表示:量子計(jì)算機(jī)對特定問題的處理能力可超過目前最快的“神威·太湖之光”超級計(jì)算機(jī)。
潘建偉教授一直在光量子計(jì)算機(jī)領(lǐng)域進(jìn)行研究,至少在2007年,潘建偉研究組的“光量子計(jì)算機(jī)的物理實(shí)現(xiàn)和算法應(yīng)用”,就曾獲評中國高等學(xué)校十大科技進(jìn)展。
而關(guān)于光量子計(jì)算機(jī)的相關(guān)研究,也一直有一些爭論。
帶著種種疑問,量子位火線對話浪潮人工智能與高性能產(chǎn)品部總經(jīng)理劉軍。嘗試找到答案。
比超算還厲害?
對于今天發(fā)布的“中國量子計(jì)算機(jī)”,劉軍表示還沒有看過具體的產(chǎn)品和論文,但他指出報道中關(guān)于自行車和飛機(jī)的比喻,以及說量子計(jì)算機(jī)超越神威·太湖之光的說法,都是不對的。原因有三個:
1)相關(guān)產(chǎn)品還沒有正式的商業(yè)化應(yīng)用
2)幾年前美國在研究,但只是樣機(jī)給Google之類的測試,距實(shí)際應(yīng)用還有很遠(yuǎn)
3)目前只應(yīng)用在幾個少量領(lǐng)域,多數(shù)場景還不行
另外也有朋友對量子位表示,量子計(jì)算目前非常依賴算法,只有在解決特定問題時才能起效。而且量子態(tài)的長時間存儲比較困難,目前還難以支撐大規(guī)模計(jì)算,相關(guān)研究只停留在理論階段。
總而言之一句話:應(yīng)用問題是目前量子計(jì)算最核心的問題。大部專業(yè)場景還用不上量子計(jì)算機(jī),未來可能比較適用于安全性要求高、加密解密等方面的工作。因此劉軍說跟神威·太湖之光相比并不合適。
神威·太湖之光,是我國自主研發(fā)的超級計(jì)算機(jī),也是目前全球排名第一的超級計(jì)算機(jī),速度比第二名“天河二號”快出近兩倍。
2015年,美國宣布對中國禁售高性能處理器。一年之后,中國就自主研發(fā)出超級計(jì)算機(jī)神威·太湖之光。也是一件相當(dāng)提氣的事情。
量子位問劉軍其中的緣由。
這位業(yè)內(nèi)人士回答說:首先是國家布局早,國防科大和江南計(jì)算所都是軍方背景的研究隊(duì)伍,而且國家重視,列入了戰(zhàn)略級目標(biāo)中。
其次更直接的是被逼得沒辦法,像美國對中國禁運(yùn),最尖端的部件不給你了,于是刺激了中國必須要自主開發(fā)做這個事情——美國人實(shí)際上干了一件很愚蠢的事情。
超級計(jì)算機(jī)神威-太湖之光作為國之重器,目前對于人工智能的不少問題,幾乎就像屠龍刀斬蛇一般——實(shí)在太委屈了。劉軍笑稱,現(xiàn)在只有超大規(guī)模的科學(xué)工程計(jì)算仿真問題,才“配”動用這把國家屠龍刀。
順著這個話題,繼續(xù)聊聊超算和人工智能?! ≡缭贏lphaGo擊敗李世石、并讓深度神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)和人工智能“聞名”于千家萬戶之前,以服務(wù)器和計(jì)算力為主業(yè)的浪潮內(nèi)部,就已經(jīng)在早幾年里感知到了這種變化。
特別是對劉軍來說,這種AI大潮洶涌而至的感覺,沒有人比他更有話語權(quán)了。尤其是今年以來,他的頭銜從浪潮集團(tuán)高性能服務(wù)器產(chǎn)品部總經(jīng)理,新近變更為了浪潮人工智能與高性能產(chǎn)品部總經(jīng)理。
而更重要的是這種title變化背后展現(xiàn)出的AI產(chǎn)業(yè)趨勢。
如果我們把BAT、360、搜狗、今日頭條,F(xiàn)ace++等企業(yè)看作人工智能時代的掘金者,那從“浪潮”這個賣水者背后,也能窺見AI潮水涌動的方向。
意料之外:GPU本為超算而生
在接受量子位專訪中,劉軍被問到“人工智能”時的第一個反應(yīng)是:意料之外?! ∷貞浄Q,現(xiàn)在這個人工智能熱潮讓他最明顯感知到是3年前,當(dāng)時還沒有AlphaGo大戰(zhàn)李世石的史詩級事件,但因?yàn)锽AT在內(nèi)的客戶,已經(jīng)開始有了更大計(jì)算量和更多計(jì)算力方面的業(yè)務(wù)——“我們把它看作一種新的方法和工具,讓我們?nèi)ヌ幚碓瓉泶髷?shù)據(jù)的這些問題?!?/p>
之前,劉軍未想過超算和AI會帶來這樣結(jié)合性的歷史機(jī)遇,而從3年前開始,他們感知到一些業(yè)務(wù)正在變得不同。
讓這一切變得不同的最大變量是GPU的出現(xiàn)。
首先,GPU可能現(xiàn)在已經(jīng)廣為人知,是人工智能中最核心的芯片應(yīng)用,但GPU的誕生,當(dāng)時最主要的目的卻是希望解決超算和高性能計(jì)算中的問題。
“NVIDIA的創(chuàng)始人黃仁勛發(fā)明GPU,當(dāng)時最主要想做超算和高性能計(jì)算。但當(dāng)時他最主要的競爭對手是Intel,以及更現(xiàn)實(shí)的問題是所有的軟件都跑在Intel的CPU集群上,所以如何把軟件移植過來,是最頭疼的問題?!?/p>
然而意料之外的是,搞神經(jīng)網(wǎng)絡(luò)的人發(fā)現(xiàn)了GPU,并發(fā)現(xiàn)GPU對加速訓(xùn)練的性能提升幫助很大,于是開始帶動了整個用GPU來做深入神經(jīng)網(wǎng)絡(luò)的熱潮。
互聯(lián)網(wǎng)公司升級:框架是關(guān)鍵一步
毫無疑問,這股浪潮也影響到了中國互聯(lián)網(wǎng)公司。但在2015年以前,這些公司并不知道如何利用GPU實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。
劉軍表示,當(dāng)時包括科大訊飛、搜狗和奇虎360等公司,都在尋求解決方案,即如何做應(yīng)用的遷移優(yōu)化,而浪潮的角色,就是幫自己的這些超算業(yè)務(wù)里的客戶,把CPU的應(yīng)用轉(zhuǎn)到GPU上。
不過,這并不是一蹴而就的事情。劉軍認(rèn)為當(dāng)時雖然浪潮服務(wù)的客戶有了把應(yīng)用遷移到GPU上的需求,但其中面臨最現(xiàn)實(shí)的挑戰(zhàn)來自“人才”——懂GPU的人實(shí)在有限,人力資源也遭遇緊缺。
于是這其間第二個關(guān)鍵的變量是Caffe之類的框架。
劉軍將Caffe的出現(xiàn)比喻成“輪子”,是加快整個AI這輛汽車往前的關(guān)鍵性發(fā)明。自此之后,互聯(lián)網(wǎng)公司和研究人工智能的公司就有了較為便利的工具,能夠快速把原來的數(shù)據(jù)通過深度學(xué)習(xí)的方法轉(zhuǎn)化成比較強(qiáng)的推理識別的業(yè)務(wù)應(yīng)用。
“如果沒有Caffe這樣的框架,現(xiàn)在看到的絕大多數(shù)的人工智能可能還在探索怎么編寫程序、以及如何實(shí)現(xiàn)想要的東西,所以’輪子’出現(xiàn),整個進(jìn)度一下子就上升了很多?!?/p>
超算和AI因何交匯?
當(dāng)然,除了GPU和Caffe帶來的加速,劉軍還認(rèn)為超算的發(fā)展變革,正在和人工智能交織在一起,而這也是他的職務(wù)變成浪潮人工智能與高性能產(chǎn)品部總經(jīng)理的原因。
“人工智能”并非為加而加,“高性能”保留也并非沒有緣由。
劉軍介紹稱,目前服務(wù)的客戶來看,圖像分析的樣本量級大約為百億級,而語音分析也達(dá)到了十萬小時級。隨著AI的應(yīng)用范圍拓展,訓(xùn)練數(shù)據(jù)的樣本量越來越大,對并行存儲容量和帶寬提出了新挑戰(zhàn)。
他表示,從高性能計(jì)算能力支撐來講,深度學(xué)習(xí)需要高容量、高帶寬的并行存儲,高帶寬、低延時的互聯(lián)網(wǎng)絡(luò),需要更大規(guī)模的GPU集群,同時需要專用的神經(jīng)網(wǎng)絡(luò)芯片。
劉軍指出的具體解決方案分線上和線下。
線下平臺方面,主要有X86 CPU同行并行計(jì)算和GPU/MIC異構(gòu)并行計(jì)算。因?yàn)榫€下訓(xùn)練涉及的數(shù)據(jù)量非常大,往往能夠達(dá)到PB級,計(jì)算和通信十分密集,由于深度神經(jīng)網(wǎng)絡(luò)(DNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)等算法往往可擴(kuò)展性不高,需要在節(jié)點(diǎn)內(nèi)進(jìn)行高效計(jì)算。
線上平臺方面,則有X86 CPU同構(gòu)并行計(jì)算、GPU/MIC異構(gòu)并行計(jì)算,以及FPGA異構(gòu)并行計(jì)算。
這種方案主要基于用戶請求。由于線上產(chǎn)品往往伴隨著億萬級別的用戶和用戶請求,需要成千上萬個節(jié)點(diǎn)來實(shí)時響應(yīng),這就要求線上平臺低功耗且高性能。
作為浪潮方面解決方案的直接負(fù)責(zé)人,劉軍認(rèn)為FPGA正在成為潮流。
劉軍解釋稱,原來大家一直用的比較多的是CPU,因?yàn)镃PU大環(huán)境比較成熟,部署起來也比較方便。
現(xiàn)在在訓(xùn)練端大家越來越多的用GPU,所以在前端推斷端云端部署的時候,越來越多的人開始部署GPU。因?yàn)樗哪P椭苯舆^來放在上面就可以用。
第三個方向也是浪潮在做的FPGA,F(xiàn)PGA的方式天生的就比較適合于并發(fā)的低延遲的處理簡單的小任務(wù),現(xiàn)在用FPGA在云端處理推理端。
不過現(xiàn)在用戶除了廣泛接納CPU、GPU外,他們也正在嘗試新的趨勢,目前之所以FPGA的異構(gòu)計(jì)算模式成為深度學(xué)習(xí)選擇,核心關(guān)鍵是:低功耗、高性能、易編程。
值得注意的是,超算和人工智能的實(shí)際結(jié)合也正在越來越多地發(fā)生。
就在近期結(jié)束的ASC2017世界大學(xué)生超算競賽中,全球最快、中國最知名的超級計(jì)算機(jī)神威-太湖之光就成為了總決賽的計(jì)算平臺。其中具體領(lǐng)域涵蓋超算系統(tǒng)設(shè)計(jì)、人工智能、基因測序等。
而人工智能方面,則基于百度的深度學(xué)習(xí)開源平臺PaddlePaddle,要求參賽者在3000W額定功耗下搭建超算系統(tǒng)競賽平臺、建模計(jì)算并對瞬息萬變的交通情況做出預(yù)測,并且?guī)椭囕v選擇最合適的行駛路線。
競賽提供給各隊(duì)伍在上百條道路上約50個工作日的歷史交通數(shù)據(jù),要求他們預(yù)測每條道路在某工作日早高峰的道路交通狀況,最終,北京航空航天大學(xué)、清華大學(xué)、俄羅斯烏拉爾聯(lián)邦大學(xué)等參賽隊(duì)伍取得了較高精度的交通預(yù)測結(jié)果。
不過,劉軍對量子位表示這只是“牛刀小試”。主要目的是希望借助競賽,培養(yǎng)更多人的興趣,“讓更多人知道它、了解它、熟悉它,為下一步生態(tài)圈內(nèi)的軟件開發(fā)培養(yǎng)興趣和習(xí)慣?!?/p>
這也是這位站在超算和AI交叉路口的專家,對目前最大挑戰(zhàn)的看法——中國有了自主研發(fā)的超算,并且實(shí)現(xiàn)了全球最快,但現(xiàn)在還不到“滿血”應(yīng)用和服務(wù)于各種工程的爆發(fā)期,因?yàn)檎麄€軟件生態(tài)和開發(fā)生態(tài)還有待建設(shè)。(完)
此前,圖靈獎得主Raj Reddy接受量子位專訪時表示,計(jì)算能力的進(jìn)步,將推動人工智能和相關(guān)算法的繼續(xù)飛躍。
評論