國(guó)產(chǎn)GPU距離“平替”英偉達(dá)還有多遠(yuǎn)?

發(fā)布人：旺材芯片時(shí)間：2024-08-16 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

2024年7月的上海是沉悶的雨季，但對(duì)于國(guó)內(nèi)AI行業(yè)來(lái)說(shuō)，卻迎來(lái)了堪比搖滾集會(huì)的WAIC（世界人工智能大會(huì)）。

會(huì)上，阿里巴巴的通義千問(wèn)、智譜AI基座大模型、商湯科技的Vimi可控人物視頻生成模型等“鎮(zhèn)館之寶”充分發(fā)揮，展示了其強(qiáng)大的AGI能力。引人注目的效果。但除了在觀眾面前展示AI前端效果的大型模型外，國(guó)產(chǎn)AI的基地：國(guó)產(chǎn)算力也集中亮相。國(guó)內(nèi)一大批AI芯片企業(yè)密集展示產(chǎn)品線。這些產(chǎn)品線涵蓋訓(xùn)練到推理，包括設(shè)備端和云端，無(wú)論是通用GPU還是搭載各種場(chǎng)景的AI加速卡，可以說(shuō)給英偉達(dá)帶來(lái)了“小小的中國(guó)震撼”。

當(dāng)觀眾徜徉在國(guó)內(nèi)算力博物館，觀察完整的產(chǎn)品線和出色的單卡性能時(shí)，直觀的感受就是這個(gè)行業(yè)“百花齊放”、“生機(jī)勃勃”。與大洋彼岸相比，并不遜色多少。但當(dāng)我每天打開(kāi)新聞看到對(duì)方不斷收緊的制裁時(shí)，似乎很難支持“國(guó)產(chǎn)AI芯片”正處于行業(yè)爆發(fā)期的結(jié)論。那么我們今天必須面對(duì)的問(wèn)題是：眼前的“繁榮”可能嗎？基礎(chǔ)扎實(shí)嗎？

國(guó)產(chǎn)大模型的蓬勃發(fā)展遭遇國(guó)外芯片制裁。就像割下一塊純鈉扔進(jìn)水池里一樣，瞬間引爆了國(guó)內(nèi)GPU市場(chǎng)。

如果縱觀中國(guó)芯片自主化的緊迫歷史，從早期的龍芯、飛騰沖擊Wintel聯(lián)盟，到松山湖的麒麟芯片之戰(zhàn)，業(yè)界的注意力一直集中在設(shè)備的核心處理器上，所以CPU類型的核心從政府和投資者的角度來(lái)看是一個(gè)更核心的突破點(diǎn)。已獲得政府新創(chuàng)訂單及大量資金投入。2023年底麒麟的回歸，是對(duì)國(guó)產(chǎn)芯片外部封鎖的一個(gè)強(qiáng)力反擊。

但在處理器前端取得突破的同時(shí)，曾經(jīng)的側(cè)翼戰(zhàn)場(chǎng)GPU卻突然轉(zhuǎn)戰(zhàn)主戰(zhàn)場(chǎng)。隨著2023年大型AI模型的出現(xiàn)，作為大模型引擎的GPU的需求急劇增加。英偉達(dá)2023年?duì)I收增長(zhǎng)125%，2024年第一季度報(bào)告將增長(zhǎng)262%，速度無(wú)與倫比。將其他芯片巨頭拋在了后面。

相比之下，計(jì)算機(jī)時(shí)代的芯片王者英特爾和移動(dòng)互聯(lián)網(wǎng)時(shí)代的王者高通，合計(jì)市值剛剛超過(guò)3000億美元，不到英偉達(dá)的1/8。新國(guó)王們面臨著人工智能培訓(xùn)的旺盛需求。英偉達(dá)登上了王位。

但尷尬的是，美國(guó)人并不打算在這次人工智能熱潮中給中國(guó)留一張頭等艙機(jī)票。在美國(guó)政府的要求下，英偉達(dá)和AMD只能切斷A100、H100等高端GPU型號(hào)的供應(yīng)，轉(zhuǎn)而向中國(guó)提供H20等“中國(guó)特別版”產(chǎn)品?！疤貏e版”相對(duì)于“正版”來(lái)說(shuō)有點(diǎn)雞肋。在一些科技媒體的評(píng)測(cè)中，H20的綜合算力僅相當(dāng)于H100的20%，而且由于其他硬件配置的加入，算力成本大幅增加。

在這種半卡頓的局面下，國(guó)產(chǎn)大模型與國(guó)產(chǎn)AI芯片的協(xié)同自然就成了理所應(yīng)當(dāng)?shù)氖虑?。此外，中?guó)對(duì)算力中心的強(qiáng)勁需求也給國(guó)產(chǎn)GPU帶來(lái)了巨大的市場(chǎng)。要知道，截至2023年底，我國(guó)數(shù)據(jù)中心機(jī)架總規(guī)模已超過(guò)810萬(wàn)個(gè)，算力總規(guī)模達(dá)到驚人的230EFlops，成為僅次于美國(guó)的算力第一大國(guó)。

所以我們也可以看到國(guó)產(chǎn)芯片在數(shù)據(jù)中心落地的非常實(shí)際的案例：

壁仞科技成為中國(guó)電信算力合作伙伴，配備必利系列通用GPU算力。該產(chǎn)品的中國(guó)移動(dòng)智能計(jì)算中心（呼和浩特）已于近日成功上線。該智能計(jì)算中心屬于國(guó)家N節(jié)點(diǎn)萬(wàn)卡訓(xùn)練場(chǎng)，單機(jī)算力達(dá)到6.7EFLOPS（FP16）。也驗(yàn)證了壁仞聲稱的產(chǎn)品可以應(yīng)用于千卡集群建設(shè)方案，并可以擴(kuò)展到萬(wàn)卡規(guī)模。

摩爾線程還為其AI旗艦產(chǎn)品KUAE推出了一整套解決方案，包括KUAE集群管理平臺(tái)（KUAE Platform）和KUAE大模型服務(wù)平臺(tái)（KUAE ModelStudio）。這是針對(duì)萬(wàn)卡數(shù)據(jù)中心在這么多計(jì)算卡高速連接的情況下如何保持穩(wěn)定運(yùn)行和高效計(jì)算資源分配的問(wèn)題。同時(shí)還簽約了青海零碳產(chǎn)業(yè)園萬(wàn)卡集群項(xiàng)目、青海高原庫(kù)阿埃萬(wàn)卡集群項(xiàng)目、廣西東盟萬(wàn)卡集群項(xiàng)目。

除了云端之外，客戶端能夠匹配大型AI模型的需求也是很多AI芯片公司的切入點(diǎn)。另外不可忽視的一點(diǎn)是，國(guó)內(nèi)資本市場(chǎng)也為GPU行業(yè)的發(fā)展帶來(lái)了巨大的支持。

可以說(shuō)，國(guó)產(chǎn)計(jì)算中心、國(guó)產(chǎn)大機(jī)型正在從硬件配套和軟件生態(tài)兩個(gè)方向支撐國(guó)產(chǎn)。這是國(guó)內(nèi)GPU玩家敢于與國(guó)際巨頭周旋的底氣。但是，一切真的有那么合乎邏輯嗎？

喧囂的新聞稿背后，計(jì)算中心和大型模型公司都在想方設(shè)法搶奪Nvidia GPU的一席之地。僅2023年，英偉達(dá)中國(guó)營(yíng)收就高達(dá)806億元，而同期國(guó)產(chǎn)GPU的成績(jī)可謂是屈指可數(shù)。

A股GPU第一股：景嘉微2024年第一季度實(shí)現(xiàn)營(yíng)收1.08億元，盡管同比增長(zhǎng)66.27%。據(jù)新聞報(bào)道和券商研報(bào)顯示，算力頭部公司寒武紀(jì)一季度營(yíng)收為2500萬(wàn)。從人工智能應(yīng)用端轉(zhuǎn)型開(kāi)發(fā)人工智能芯片的云天勵(lì)飛，2023年芯片營(yíng)收將達(dá)到2400萬(wàn)元。

芯片企業(yè)在一級(jí)市場(chǎng)的收入不透明。有的公司估值達(dá)數(shù)十億甚至數(shù)百億。在每天發(fā)布的合作和訂單協(xié)議的背景下，實(shí)際交付的收入只有幾千萬(wàn)。。

可以說(shuō)，熱鬧之下，大多數(shù)“戰(zhàn)略合作”和“戰(zhàn)略簽約”更像是示范而不是實(shí)際執(zhí)行。

我不得不承認(rèn)一個(gè)現(xiàn)實(shí)。單純用紙面參數(shù)去PK NVIDIA 并沒(méi)有多大意義。千億參數(shù)的大模型及其背后的萬(wàn)卡數(shù)據(jù)中心穩(wěn)定、持續(xù)、高效的運(yùn)行從來(lái)都不是單點(diǎn)。維度問(wèn)題從來(lái)都不是一朝一夕就能完成的事情。

事實(shí)上，即使是最簡(jiǎn)單的大模型評(píng)估維度也至少包含5個(gè)方面：

對(duì)于每一款國(guó)產(chǎn)GPU來(lái)說(shuō)，可能都有一個(gè)亮點(diǎn)。比如，華為的單卡性能可能并不弱于NVIDIA，百度的昆侖芯片在支持自家文心一言等大型模型的訓(xùn)練效率上有著顯著的優(yōu)勢(shì)。不過(guò)，只有NVIDIA能做到五邊形勇士，其他人如果五邊形缺了一個(gè)角，就很難落地。。

例如，CUDA生態(tài)系統(tǒng)被認(rèn)為是Nvidia的護(hù)城河之一。可以說(shuō)，如果沒(méi)有CUDA，大多數(shù)程序員都不知道如何在GPU硬件平臺(tái)上進(jìn)行開(kāi)發(fā)。其軟件生態(tài)已滲透到人工智能、科研等領(lǐng)域的方方面面。百度前首席科學(xué)家吳恩達(dá)評(píng)論道：在CUDA出現(xiàn)之前，全球會(huì)用GPU編程的人可能不超過(guò)100人，但目前全球有數(shù)百萬(wàn)CUDA開(kāi)發(fā)者。

這一切都得益于NVIDIA早在2006年就大力支持CUDA系統(tǒng)在AI領(lǐng)域的研發(fā)和推廣。當(dāng)時(shí)，NVIDIA每年投入5億美元的研發(fā)資金來(lái)不斷更新和維護(hù)CUDA，而其同期營(yíng)收僅為30億美元。同時(shí)，NVIDIA還允許美國(guó)大學(xué)和科研機(jī)構(gòu)免費(fèi)使用CUDA系統(tǒng)，讓CUDA系統(tǒng)在AI和通用計(jì)算領(lǐng)域迅速開(kāi)花結(jié)果。

在支持大型機(jī)型領(lǐng)域，NVIDIA很早就走在了大家的前列。很少人知道的是，NVIDIA在2016年斥巨資打造了全球首臺(tái)AI超級(jí)計(jì)算機(jī)DGX-1后，首先將其捐贈(zèng)給了尚處于起步階段的Open AI，并且還與大模型生態(tài)系統(tǒng)形成了早期聯(lián)盟。它有著深厚的淵源。

在高功率芯片互連領(lǐng)域，NVlink也領(lǐng)先于競(jìng)爭(zhēng)對(duì)手，就連美國(guó)顯卡巨頭AMD也不得不落后。一個(gè)常識(shí)是，GPU的計(jì)算能力不會(huì)簡(jiǎn)單疊加。無(wú)論單筆數(shù)據(jù)交易有多高，如果沒(méi)有好的連接技術(shù)，1+1從一開(kāi)始就小于2。10+10能否達(dá)到15還有一個(gè)問(wèn)號(hào)。

當(dāng)其他廠商還僅限于傳統(tǒng)的 PCIe 時(shí)，NVIDIA 也已經(jīng)布局了 10 多年。早在2014年，NVIDIA就發(fā)布了NVLink 1.0，并在P100 GPU芯片之間實(shí)現(xiàn)，已經(jīng)是當(dāng)時(shí)PCle 3傳輸速度的5倍；2020年，NVIDIA完成了對(duì)Mellanox的收購(gòu)，獲得了InfiniBand、Ethernet、SmartNIC、DPU和LinkX的互聯(lián)能力，更加強(qiáng)大；現(xiàn)在，NVlink可以在每個(gè)GPU之間實(shí)現(xiàn)高達(dá)每秒600GB的帶寬，比PCIe 4.0高出十倍。

因此，在一些評(píng)論家眼中，英偉達(dá)是一條“三頭龍”。其強(qiáng)大的GPU算力、豐富的軟件生態(tài)、高速?gòu)V連接使其構(gòu)筑了攻守兼?zhèn)?、難以突破的產(chǎn)品防線。。一旦你試圖規(guī)避它的生態(tài)，你可能會(huì)面臨購(gòu)買(mǎi)萬(wàn)卡卻只能擺脫千卡算力數(shù)據(jù)封鎖的困境。你在編程開(kāi)發(fā)過(guò)程中也可能會(huì)遇到?jīng)]有合適的應(yīng)用程序開(kāi)發(fā)工具的問(wèn)題。這種損失對(duì)于投入巨資的AI算力中心來(lái)說(shuō)無(wú)疑是難以接受的，對(duì)于工程量極大、優(yōu)化工作繁重的大型模型開(kāi)發(fā)者來(lái)說(shuō)也是難以承受的。

更顯著的差距是，英偉達(dá)仍在急于為客戶降低成本。

黃仁勛對(duì)他的顧客有一句名言：“買(mǎi)得越多，省得越多。”被譽(yù)為黃氏數(shù)學(xué)。切換到現(xiàn)在的AI大模型視角就是如何在硬件層面降低大模型訓(xùn)練和token生成的成本。今年6月，基于Blackwell架構(gòu)的GB100芯片將成本和能耗較H100降低至1/25。在參數(shù)1750億的GPT-3 LLM基準(zhǔn)測(cè)試中，GB200的性能達(dá)到了H100的7倍。倍，訓(xùn)練速度達(dá)到H100的4倍，這使得這款售價(jià)7萬(wàn)美元的芯片性價(jià)比高了不少。
可以說(shuō)，在軟件生態(tài)和通信互聯(lián)未經(jīng)時(shí)間和案例驗(yàn)證的硬件上構(gòu)建千億參數(shù)的大模型和萬(wàn)卡數(shù)據(jù)中心，無(wú)異于沒(méi)有摸清地基底下的地形而自行其是。。的摩天大樓。直接全面使用國(guó)產(chǎn)GPU來(lái)支持國(guó)產(chǎn)大模型的代幣生成，也將把國(guó)內(nèi)大模型公司的成本推向難以承受的水平。
因此，雷聲多、執(zhí)行少，成為行業(yè)的無(wú)奈之舉。

“速勝論”不可取，我們也不會(huì)陷入“速敗論”。盡管Nvidia如此強(qiáng)大，但它也無(wú)法贏得每場(chǎng)戰(zhàn)斗。
剛剛過(guò)去的 7 月 30 日，蘋(píng)果發(fā)布研究論文顯示，蘋(píng)果在谷歌開(kāi)發(fā)的 TPU 芯片人工智能系統(tǒng)“Apple Intelligence”中使用了 AI 模型 Apple Foundation Model（AFM）。據(jù)報(bào)道，蘋(píng)果此次采購(gòu)了超過(guò) 10,000 顆谷歌 TPUv5p 和 TPUv4 芯片，以取代 Nvidia GPU。
為什么蘋(píng)果和谷歌有信心開(kāi)始部分取代英偉達(dá)？

一方面，谷歌產(chǎn)品無(wú)需太多參數(shù)訓(xùn)練就可以貼合蘋(píng)果本地模型，而谷歌的TPUv5e性價(jià)比優(yōu)勢(shì)顯著，特別適合訓(xùn)練中小型模型，從而讓谷歌在這一細(xì)分市場(chǎng)站穩(wěn)了腳跟?？梢灶A(yù)見(jiàn)的是，隨著蘋(píng)果的成功，谷歌將繼續(xù)尋找新的側(cè)翼戰(zhàn)場(chǎng)來(lái)挑戰(zhàn)英偉達(dá)，而不是直接對(duì)抗這個(gè)“六邊形”戰(zhàn)士。
另一方面，由于蘋(píng)果是全球領(lǐng)先的消費(fèi)電子公司，采購(gòu)數(shù)萬(wàn)塊TPU只是研發(fā)投入的九牛一毛。用它們來(lái)布置防卡脖子的情況并不罕見(jiàn)。
因此，只有耐心先行掌握終端市場(chǎng)，利用龐大的終端市場(chǎng)帶來(lái)的巨額現(xiàn)金流來(lái)維持研發(fā)投入，不斷培養(yǎng)和測(cè)試有特殊需求的市場(chǎng)，才能面對(duì)先發(fā)對(duì)手的絕佳戰(zhàn)術(shù)。優(yōu)勢(shì)太明顯。
在這方面，華為的麒麟芯片就是一個(gè)很好的實(shí)證案例。中國(guó)PC時(shí)代，出現(xiàn)了“貿(mào)工技”與“技工貿(mào)”的對(duì)立。最終，單攻芯片的企業(yè)缺乏資金，單攻市場(chǎng)的企業(yè)缺乏后勁。這也給柳傳志和倪光南留下了終生的遺憾。。
不過(guò)，華為并沒(méi)有反對(duì)這兩條道路。它首先使用高通。同時(shí)，利用中國(guó)的制造能力和軟件迭代優(yōu)勢(shì)，持續(xù)占領(lǐng)市場(chǎng)。同時(shí)，它堅(jiān)持自己的芯片。投資研發(fā)。當(dāng)一個(gè)價(jià)值千億的市場(chǎng)和數(shù)千家適配供應(yīng)商掌握在手中時(shí)，我們自己的芯片就開(kāi)始占據(jù)主導(dǎo)地位。這種兩條腿走路，最終實(shí)現(xiàn)雙向沖刺的策略取得了真正的成功。
我們需要認(rèn)識(shí)到一件事：一家成功的芯片公司也必須是一家成功的企業(yè)，而一家成功的企業(yè)必須擁有源源不斷的現(xiàn)金流。
我們還需要明白，芯片并不是那么小的一塊硅片，而是無(wú)數(shù)的軟件廠商、硬件適配器廠商和無(wú)數(shù)的供應(yīng)商。這需要資金作為集結(jié)點(diǎn)。
因此，在當(dāng)前情況下，我們的首要任務(wù)不是立即打擊Nvidia，而是利用市場(chǎng)環(huán)境和中國(guó)人的習(xí)慣，首先在Open AI、Anthropic和LLama上建立一個(gè)不能落后的大型模型市場(chǎng)。另一邊。差異，否則到了那個(gè)時(shí)候，大眾就很難支持國(guó)產(chǎn)大車型了。而當(dāng)國(guó)產(chǎn)大型機(jī)型穩(wěn)定了13億人口的市場(chǎng)，甚至可以憑借強(qiáng)大的國(guó)產(chǎn)消費(fèi)電子硬件出海時(shí)，國(guó)產(chǎn)芯片也能有航母支撐，無(wú)法單獨(dú)對(duì)抗海外巨頭。
此外，在生存的同時(shí)，國(guó)產(chǎn)芯片企業(yè)仍然可以在時(shí)間維度上繼續(xù)蠶食英偉達(dá)的護(hù)城河。軟件生態(tài)不夠，可以依靠國(guó)內(nèi)開(kāi)發(fā)商和各大廠商不斷彌補(bǔ)。如果連接能力不夠，它可以與您的數(shù)據(jù)中心一起優(yōu)化。事實(shí)上，這也正是國(guó)內(nèi)芯片企業(yè)正在做的事情。
在連接方面，由于NVlink是NVIDIA獨(dú)有的，因此不僅國(guó)產(chǎn)GPU，海外芯片廠商也開(kāi)始嘗試聯(lián)合攻克這條護(hù)城河。2024年3月，AMD、博通、思科、谷歌、惠普、英特爾、Meta、微軟等八家巨頭宣布將開(kāi)發(fā)用于人工智能數(shù)據(jù)中心網(wǎng)絡(luò)的全新互連技術(shù)UALink。行業(yè)共同解決鏈路問(wèn)題也是大勢(shì)所趨。
可以說(shuō)，填補(bǔ)英偉達(dá)的護(hù)城河并不是國(guó)內(nèi)芯片企業(yè)的強(qiáng)項(xiàng)。英特爾CEO基辛格曾公開(kāi)批評(píng)CUDA，稱護(hù)城河又淺又窄。整個(gè)行業(yè)都想消滅它。Nvidia 在過(guò)去的幾十年里打造了它。中國(guó)的生態(tài)確實(shí)很糟糕，但當(dāng)一家公司壟斷了整個(gè)行業(yè)的利潤(rùn)時(shí)，時(shí)間就站在了一邊。
毫無(wú)疑問(wèn)，雖然國(guó)產(chǎn)芯片的產(chǎn)品端已經(jīng)在WAIC上蓄勢(shì)待發(fā)，但從點(diǎn)亮芯片到客戶適配再到穩(wěn)定運(yùn)營(yíng)和生態(tài)建設(shè)還有很長(zhǎng)的路要走。如果我們僅僅看到令人眼花繚亂的介紹就認(rèn)為自己已經(jīng)具備了“優(yōu)勢(shì)”，那么“教訓(xùn)英偉達(dá)”甚至主動(dòng)脫鉤無(wú)疑是一種魯莽之舉。但遠(yuǎn)離國(guó)產(chǎn)芯片，不給試錯(cuò)和驗(yàn)證的機(jī)會(huì)，也是一個(gè)錯(cuò)誤的做法。
產(chǎn)業(yè)發(fā)展的難點(diǎn)恰恰在于如何平衡外力與內(nèi)力、成本與創(chuàng)新、獨(dú)立與全球化。這是一個(gè)需要不斷審視策略的策略，也是一個(gè)需要在獨(dú)木橋上不斷保持平衡的策略。到達(dá)彼岸的唯一可行的方法。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

博客專欄

國(guó)產(chǎn)GPU距離“平替”英偉達(dá)還有多遠(yuǎn)?

相關(guān)推薦

技術(shù)專區(qū)