AI戰(zhàn)場(chǎng)炮火紛飛
在 AI 芯片領(lǐng)域,英偉達(dá)是無可爭(zhēng)議的霸主。今年中旬,英偉達(dá)市值突破萬億美元大關(guān),僅次于蘋果、微軟、Alphabet 和亞馬遜,成為美國(guó)第五大市值公司。
本文引用地址:http://www.biyoush.com/article/202310/452050.htm英偉達(dá)預(yù)計(jì)今年 Q3 營(yíng)收為 160 億美元,同比增長(zhǎng)約 170%,這一數(shù)字幾乎是一年前水平的 3 倍。業(yè)績(jī)暴走是市場(chǎng)火熱的象征,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:「一個(gè)新的計(jì)算時(shí)代已經(jīng)開始。全球各地的公司正在從通用計(jì)算向加速計(jì)算和生成式 AI 轉(zhuǎn)型?!?/p>
與此同時(shí),AI 芯片成為各家企業(yè)逐鹿的一個(gè)戰(zhàn)略重地,這也意味著英偉達(dá)在業(yè)績(jī)高漲的同時(shí),還需要面對(duì)來自市場(chǎng)競(jìng)爭(zhēng)的壓力,這些壓力不僅來自于 AMD 和英特爾等勁敵,還有許多雄心勃勃的初創(chuàng)公司。
AMD 和 Intel「圍攻」英偉達(dá)
AMD:補(bǔ)軟件短板,鍛硬件長(zhǎng)板
AMD 呼聲比較高的兩款產(chǎn)品是 MI250 和 MI300。MI250 在 2021 年年底發(fā)布,從發(fā)布之時(shí) AMD 公布的基準(zhǔn)測(cè)試結(jié)果來看,AMD Instinct MI250X 對(duì)比 NVIDIA A100 占據(jù)了絕對(duì)的性能優(yōu)勢(shì),是對(duì)方的 1.4 倍到 3.05 倍之間,當(dāng)時(shí) AMD 宣稱 Instinct MI250X 是世界上性能最強(qiáng)的 HPC 計(jì)算卡。
雖然硬件規(guī)格高是 AMD 的一項(xiàng)優(yōu)勢(shì),軟件生態(tài)環(huán)境弱卻是 AMD 的劣勢(shì)。今年 6 月,AMD 推出大語(yǔ)言模型專用的最新加速卡 Instinct MI300X。據(jù) AMD 首席執(zhí)行官蘇姿豐介紹稱,MI300X 提供的高帶寬內(nèi)存(HBM)密度是英偉達(dá) H100 的 2.4 倍,HBM 帶寬是競(jìng)品的 1.6 倍。
與 MI250 相似的問題出現(xiàn)在 MI300X 中,盡管硬件規(guī)格參數(shù)強(qiáng)悍,但目前 MI300X 還未被廣泛應(yīng)用。不過,MI300X 在 AI 市場(chǎng)的呼聲還是比較高的,華爾街分析師普遍認(rèn)為,AMD 的這款芯片將對(duì)目前掌握 AI 芯片市場(chǎng)逾八成份額的英偉達(dá)構(gòu)成有力挑戰(zhàn),這款 MI300X 加速器,有望替代英偉達(dá)的同類產(chǎn)品。
天風(fēng)國(guó)際分析師郭明錤也在社交平臺(tái)上表示,AMD 的 AI 芯片出貨量預(yù)計(jì)在 2024 年、2025 年快速增長(zhǎng)。到 2024 年,AMD 的 AI 芯片出貨量(主要是 MI300A)預(yù)計(jì)將達(dá)到英偉達(dá)出貨量的約 10%,微軟有望成為 AMD AI 芯片的最大客戶,緊隨其后的是亞馬遜。如果微軟與 AMD 的合作進(jìn)展順利,AMD 獲得 Meta 和谷歌的訂單,預(yù)計(jì) 2025 年 AMD 的 AI 芯片出貨量將達(dá)到英偉達(dá)(基于 CoWoS 封裝技術(shù))的 30% 或更多。
為了補(bǔ)齊短板,AMD 不斷招兵買馬,擴(kuò)大 AI 技術(shù)實(shí)力。
10 月 10 日,AMD 在官網(wǎng)宣布,其已簽署收購(gòu)開源 AI 軟件公司 Nod.ai 的最終協(xié)議,此舉旨在增強(qiáng)公司的開源 AI 能力。Nod.ai 加入 AMD 將帶來一支經(jīng)驗(yàn)豐富的團(tuán)隊(duì),該團(tuán)隊(duì)開發(fā)了業(yè)界領(lǐng)先的軟件技術(shù),可加速針對(duì) AMD Instinct 數(shù)據(jù)中心加速器、RyzenAI 處理器、EPYC 處理器、Versal SoC 和 Radeon GPU 等優(yōu)化 AI 解決方案的部署。
AMD 人工智能集團(tuán)高級(jí)副總裁 Vamsi Boppana 表示:「收購(gòu) Nod.ai 預(yù)計(jì)將大大增強(qiáng)我們?yōu)?AI 客戶提供開發(fā)軟件的能力,使他們能夠輕松部署針對(duì) AMD 硬件調(diào)整的高性能 AI 模型?!?/p>
今年 8 月,AMD 宣布收購(gòu)法國(guó) AI 初創(chuàng)公司 Mipsology。Mipsology 成立于 2015 年,是 AMD 的長(zhǎng)期合作伙伴,此前一直為 AMD 開發(fā) AI 推理與優(yōu)化解決方案和工具。
可以看到,AMD 正大舉投資于 AI 芯片所需的關(guān)鍵軟件,以追趕頭號(hào)對(duì)手英偉達(dá)。
Intel:用性價(jià)比挑戰(zhàn)英偉達(dá)
在 GPU 領(lǐng)域,英特爾也將向英偉達(dá)發(fā)起挑戰(zhàn)。從英特爾的動(dòng)作看,今年最受關(guān)注的便是 Gaudi 系列。
2022 年,英特爾宣布,推出第二代深度學(xué)習(xí)芯片 Habana Gaudi 2 和 Habana Greco,分別用于 AI 訓(xùn)練和 AI 推理。隨后在今年 7 月,英特爾為中國(guó)市場(chǎng)推出定制版深度學(xué)習(xí)處理器 Habana Gaudi 2,可用于加速 AI 訓(xùn)練及推理,包括浪潮信息、新華三、超聚變等公司,預(yù)計(jì)將推出搭載 Gaudi 2 的服務(wù)器產(chǎn)品。
Gaudi 2 作為一款專用 AI 加速芯片,雖在性能上落后于目前英偉達(dá)最高端的 H100 芯片,但相比英偉達(dá)的通用 GPU A100 和 H100,其服務(wù)器成本更低,價(jià)格優(yōu)勢(shì)也更為明顯。
針對(duì)中國(guó)市場(chǎng)推出定制版的 Gaudi 2,英特爾爭(zhēng)奪市場(chǎng)的野心可見一斑。之后英特爾新路線圖的公布再次證明這一點(diǎn)。
今年 9 月,在美國(guó)圣何塞舉辦的英特爾 On 技術(shù)創(chuàng)新大會(huì)上,基辛格亮出了英特爾最新的三代 AI 芯片路線圖,其中采用 5nm 制程的 Gaudi 3 將于 2024 年推出,再下一代 AI 芯片代號(hào)為 Falcon Shores,計(jì)劃于 2025 年推出。其中 Gaudi 3 的算力將達(dá)到 Gaudi 2 的兩倍,網(wǎng)絡(luò)帶寬、HBM 容量將達(dá)到 Gaudi 2 的 1.5 倍。
Habana 原為以色列初創(chuàng)芯片公司,2016 年成立,旗下產(chǎn)品曾滲透進(jìn)入中國(guó)主要互聯(lián)網(wǎng)公司,2019 年 12 月,英特爾以 20 億美元收購(gòu) Habana。規(guī)劃中的 AI 新品 Falcon Shores 將在 Habana 的架構(gòu)基礎(chǔ)上,和英特爾原有的 GPU 等技術(shù)進(jìn)行融合,因此 Falcon Shores 也備受業(yè)內(nèi)關(guān)注。
與 AMD 一樣,英特爾亦極其看重 AI 芯片的軟件生態(tài)建設(shè),英特爾正在加快構(gòu)建一個(gè)開放的 AI 軟件生態(tài)系統(tǒng),以打破專有的封閉式生態(tài)系統(tǒng)格局。
英特爾公司執(zhí)行副總裁數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理 Sandra L. Rivera 稱,從英特爾看到,開發(fā)者通常從 Pytorch、Tensor Flow 等 AI 框架層從事 AI 創(chuàng)新工作,在底層方面,英特爾采用了 OneAPI(一種統(tǒng)一編程模型和應(yīng)用程序接口)對(duì)標(biāo)英偉達(dá)的 CUDA,利用 OneAPI 提供的優(yōu)化庫(kù),希望以打包的平臺(tái)方案整合自家龐雜的產(chǎn)品路線,降低客戶對(duì)底層硬件差異的敏感度。
英特爾正通過不斷優(yōu)化的軟硬件組合,實(shí)現(xiàn)最佳的性能和規(guī)模,從而邁向「讓 AI 無處不在」的目標(biāo)。
在 ChatGPT 引發(fā)的大模型熱潮中,大模型訓(xùn)練需求增多,使得英偉達(dá)用于訓(xùn)練大模型的 A100/H100 更加稀缺。除英特爾與 AMD 外,也不乏有一些云服務(wù)器等科技巨頭下場(chǎng)自研 AI 芯片。
微軟、OpenAI 等科技巨頭自研 AI 芯片
10 月 6 日,據(jù)外媒 The Information 報(bào)道,微軟即將于下個(gè)月公布自行研發(fā)的 AI 芯片,從而協(xié)助減少對(duì)英偉達(dá) GPU 的依賴,該 AI 芯片代號(hào)為 Athena,預(yù)計(jì)微軟將在 11 月 14-17 日的 Ignite 開發(fā)者大會(huì)上宣布這款自行研發(fā)的芯片。
同一天,媒體消息稱,ChatGPT 開發(fā)商 OpenAI 也正在探索 AI 芯片的可能性,并已評(píng)估潛在的收購(gòu)目標(biāo),以加速自研芯片的進(jìn)程。
據(jù)悉,自 2019 年以來,微軟就開始研發(fā)一款名為"雅典娜"(Athena)的定制 AI 芯片,用于為大型語(yǔ)言模型提供動(dòng)力,目前已在測(cè)試階段。同年,微軟向 ChatGPT 的所有者 OpenAI 投下 10 億美元,隨后在今年 1 月微軟再向 OpenAI 加注 100 億美元。
據(jù)悉,與 OpenAI 合作之后的微軟每個(gè)月可能需要數(shù)十萬顆英偉達(dá)芯片,也正因此 Athena 的首個(gè)目標(biāo)是為 OpenAI 提供算力引擎,以替代昂貴的英偉達(dá) A100/H100。如果明年大規(guī)模推出,Athena 將允許微軟內(nèi)部和 OpenAI 的團(tuán)隊(duì)同時(shí)訓(xùn)練和推理模型。
SemiAnalysis 的分析師迪倫·帕特爾(Dylan Patel)表示,開發(fā)類似于雅典娜的芯片可能每年需要花費(fèi) 1 億美元左右,ChatGPT 每天的運(yùn)營(yíng)成本約 70 萬美元,大部分成本來源于昂貴的服務(wù)器,如果雅典娜芯片與英偉達(dá)的產(chǎn)品擁有同等競(jìng)爭(zhēng)力,每個(gè)芯片的成本將可以降低三分之一。
不只是微軟和 OpenAI,為了降低成本、減少對(duì)英偉達(dá)的依賴、提高議價(jià)能力,谷歌、亞馬遜、Meta 等科技巨頭們都已下場(chǎng)自研 AI 芯片。
想要在 AI 熱潮中分得一口湯的還有不少野心勃勃的初創(chuàng)公司。
雄心勃勃的初創(chuàng)公司
2019 年創(chuàng)立的 d-Matrix
今年 9 月,位于美國(guó)硅谷的 AI 芯片初創(chuàng)公司 d-Matrix 獲得 1.1 億美元的 B 輪融資,由新加坡頂尖投資公司淡馬錫(Temasek)領(lǐng)投,加州風(fēng)投公司 Playground Global、微軟和三星等 14 家投資者跟投。
d-Matrix 由兩位 AI 硬件領(lǐng)域的資深人士 Sid Sheth 和 Sudeep Bhoja 于 2019 年 5 月創(chuàng)立。據(jù)領(lǐng)英顯示,d-Matrix 目前有大約 100 名員工,公司致力于構(gòu)建一種使用存內(nèi)計(jì)算(In-Memory Computing,IMC)技術(shù)和芯片級(jí)橫向擴(kuò)展互連進(jìn)行數(shù)據(jù)中心 AI 推理的新方法。據(jù)稱,該處理器將提供比 CPU 和 GPU 更快的 AI 推理性能,適用于大型 Transformer 模型。
d-Matrix 認(rèn)為,在 AI 領(lǐng)域雖然存在英偉達(dá)這樣難以撼動(dòng)的龍頭企業(yè),但自己與英偉達(dá)不同,部分原因在于其技術(shù)針對(duì)的是 AI 處理過程中的「推理」(Inference)環(huán)節(jié),而不是通過制造訓(xùn)練大型 AI 模型的技術(shù)來與英偉達(dá)競(jìng)爭(zhēng)?;?Transformer 的模型通常在高性能 GPU 上進(jìn)行訓(xùn)練,但執(zhí)行推理是一個(gè)能效問題,而不僅僅是性能問題。d-Matrix 提出了一種創(chuàng)新解決方案,聲稱可以將硬件的效率提高 10-30 倍。
據(jù)悉,微軟已承諾在明年公司研發(fā)的芯片推出時(shí)對(duì)其進(jìn)行評(píng)估。d-Matrix 公司預(yù)計(jì)今年將獲得 1000 萬美元左右的收入,主要來自購(gòu)買芯片進(jìn)行評(píng)估的客戶;預(yù)計(jì)兩年后年收入將達(dá)到 7000 萬至 7500 萬美元,實(shí)現(xiàn)收支平衡。
2018 年成立的 Rain Neuromorphics Atomic Semi Cerebras
Rain Neuromorphics Atomic Semi Cerebras 由臺(tái)積電前工程副總 Keith McKay 在 2018 年創(chuàng)立,總部位于美國(guó)加利福尼亞州,曾以推出超大芯片而引發(fā)關(guān)注。
其 AI 超算處理器 Cerebras WSE 比 iPad 還要大。二代擁有 2.6 萬億個(gè)晶體管和 85 萬個(gè) AI 優(yōu)化內(nèi)核。它們還發(fā)布過一種 brain-scale 技術(shù),可以運(yùn)行超過 120 萬億個(gè)連接的神經(jīng)網(wǎng)絡(luò)。今年 Cerebras 還一口氣開源了 7 個(gè) GPT 模型,參數(shù)量分別達(dá)到 1.11 億、2.56 億、5.9 億、13 億、27 億、67 億和 130 億,同時(shí) Cerebras 也提供大模型訓(xùn)練推理等云服務(wù)。
目前為止,該公司已融資 7.2 億美元。據(jù)悉,OpenAI 已參投了至少三家芯片公司,Rain Neuromorphics 就在列,其余兩家是 Cerebras 和 Atomic Semi。
2022 年創(chuàng)立的 Modular
Modular 是一家美國(guó)的初創(chuàng)企業(yè),成立于 2022 年。去年 6 月,Modular 完成了由 GV 領(lǐng)投、Greylock、SV Angel 和 The Factory 參與的 3000 萬美元種子輪融資。隨后在今年 8 月,Modular 又獲得了 1.3 億美元的 A 輪融資,本輪融資由 General Catalyst 領(lǐng)投,GV、SV Angel 等參與。
Modular 表示,英偉達(dá)的 CUDA 軟件用于編寫只能在其 GPU 上運(yùn)行的機(jī)器學(xué)習(xí)應(yīng)用程序,而它們通過其軟件為企業(yè)提供了另一種選擇,使開發(fā)者可以更簡(jiǎn)單地在其他公司設(shè)計(jì)的芯片上訓(xùn)練和運(yùn)行機(jī)器學(xué)習(xí)模型,例如英特爾、AMD 和 Google。它還提高了這些芯片的性能,意味著它們可以用來訓(xùn)練更強(qiáng)大的人工智能模型。
除了上述幾家公司之外,2017 年成立并致力于使用硅光芯片實(shí)現(xiàn)深度學(xué)習(xí)的美國(guó) AI 初創(chuàng)公司 Lightmatter、2022 年成立并致力于開發(fā)用于文本應(yīng)用的大語(yǔ)言模型(LLM)專用芯片的公司 MatX、成立于 2022 年并旨在使人工智能計(jì)算更具可訪問性和可負(fù)擔(dān)性的公司 Tiny Corp 都在努力成為具有分量的挑戰(zhàn)選手。
英偉達(dá)的戰(zhàn)略
英偉達(dá)面臨來自 AMD、英特爾以及一系列大型科技、初創(chuàng)公司的競(jìng)爭(zhēng),這是一個(gè)極為突出的話題。英偉達(dá)有它難以超越的優(yōu)勢(shì)也自然有不可避免的劣勢(shì)。
先看優(yōu)勢(shì)。英偉達(dá)占據(jù)全球數(shù)據(jù)中心 AI 加速市場(chǎng) 82% 的份額,以 95% 的市場(chǎng)占有率壟斷了全球 Al 訓(xùn)練領(lǐng)域的市場(chǎng),也就是說,即使當(dāng)下已經(jīng)有諸多公司進(jìn)入 AI 市場(chǎng),但是這些沒有市場(chǎng)優(yōu)勢(shì)的公司可能也難以產(chǎn)生足夠的利潤(rùn)。
此外,雖然 AMD 和英偉達(dá)都能提供不同價(jià)位和性能的 GPU 產(chǎn)品,但在性能方面,英偉達(dá)擁有明顯的整體領(lǐng)先優(yōu)勢(shì)。這一標(biāo)準(zhǔn)更是這些初創(chuàng)公司難以短期內(nèi)達(dá)到的,雖然如今的 AI 市場(chǎng)中已有部分主要參與者開始試驗(yàn)新的 AI 芯片和工具,但倘若想要以性價(jià)比取勝,仍需很長(zhǎng)時(shí)間。
再看劣勢(shì)。首當(dāng)其沖便是價(jià)格,昂貴的單價(jià)也是勸退多家科技巨頭依賴外購(gòu)芯片的主因。另外英偉達(dá)提供的全棧服務(wù)結(jié)合了硬件和軟件解決方案,但這種全棧服務(wù)也可能成為吸引新客戶的阻力。很少有大客戶愿意永久依賴于一個(gè)生態(tài)系統(tǒng),這會(huì)使他們?cè)谖磥硖幱趦r(jià)格劣勢(shì)。這也是亞馬遜拒絕英偉達(dá)的 DGX 云平臺(tái)的原因之一,相比之下 AMD 可以為客戶提供更大的靈活性。
如此看來,想必在未來幾年,英偉達(dá)將面臨激烈的競(jìng)爭(zhēng),能否守住龍頭地位,成為英偉達(dá)面臨的重要問題。
評(píng)論