AI戰(zhàn)場(chǎng)炮火紛飛

作者：時(shí)間：2023-10-25 來源：半導(dǎo)體產(chǎn)業(yè)縱橫

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

在 AI 芯片領(lǐng)域，英偉達(dá)是無可爭(zhēng)議的霸主。今年中旬，英偉達(dá)市值突破萬億美元大關(guān)，僅次于蘋果、微軟、Alphabet 和亞馬遜，成為美國(guó)第五大市值公司。

本文引用地址：http://www.biyoush.com/article/202310/452050.htm

英偉達(dá)預(yù)計(jì)今年 Q3 營(yíng)收為 160 億美元，同比增長(zhǎng)約 170%，這一數(shù)字幾乎是一年前水平的 3 倍。業(yè)績(jī)暴走是市場(chǎng)火熱的象征，英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：「一個(gè)新的計(jì)算時(shí)代已經(jīng)開始。全球各地的公司正在從通用計(jì)算向加速計(jì)算和生成式 AI 轉(zhuǎn)型?！?/p>

與此同時(shí)，AI 芯片成為各家企業(yè)逐鹿的一個(gè)戰(zhàn)略重地，這也意味著英偉達(dá)在業(yè)績(jī)高漲的同時(shí)，還需要面對(duì)來自市場(chǎng)競(jìng)爭(zhēng)的壓力，這些壓力不僅來自于 AMD 和英特爾等勁敵，還有許多雄心勃勃的初創(chuàng)公司。

AMD 和 Intel「圍攻」英偉達(dá)

AMD：補(bǔ)軟件短板，鍛硬件長(zhǎng)板

AMD 呼聲比較高的兩款產(chǎn)品是 MI250 和 MI300。MI250 在 2021 年年底發(fā)布，從發(fā)布之時(shí) AMD 公布的基準(zhǔn)測(cè)試結(jié)果來看，AMD Instinct MI250X 對(duì)比 NVIDIA A100 占據(jù)了絕對(duì)的性能優(yōu)勢(shì)，是對(duì)方的 1.4 倍到 3.05 倍之間，當(dāng)時(shí) AMD 宣稱 Instinct MI250X 是世界上性能最強(qiáng)的 HPC 計(jì)算卡。

雖然硬件規(guī)格高是 AMD 的一項(xiàng)優(yōu)勢(shì)，軟件生態(tài)環(huán)境弱卻是 AMD 的劣勢(shì)。今年 6 月，AMD 推出大語(yǔ)言模型專用的最新加速卡 Instinct MI300X。據(jù) AMD 首席執(zhí)行官蘇姿豐介紹稱，MI300X 提供的高帶寬內(nèi)存（HBM）密度是英偉達(dá) H100 的 2.4 倍，HBM 帶寬是競(jìng)品的 1.6 倍。

與 MI250 相似的問題出現(xiàn)在 MI300X 中，盡管硬件規(guī)格參數(shù)強(qiáng)悍，但目前 MI300X 還未被廣泛應(yīng)用。不過，MI300X 在 AI 市場(chǎng)的呼聲還是比較高的，華爾街分析師普遍認(rèn)為，AMD 的這款芯片將對(duì)目前掌握 AI 芯片市場(chǎng)逾八成份額的英偉達(dá)構(gòu)成有力挑戰(zhàn)，這款 MI300X 加速器，有望替代英偉達(dá)的同類產(chǎn)品。

天風(fēng)國(guó)際分析師郭明錤也在社交平臺(tái)上表示，AMD 的 AI 芯片出貨量預(yù)計(jì)在 2024 年、2025 年快速增長(zhǎng)。到 2024 年，AMD 的 AI 芯片出貨量（主要是 MI300A）預(yù)計(jì)將達(dá)到英偉達(dá)出貨量的約 10%，微軟有望成為 AMD AI 芯片的最大客戶，緊隨其后的是亞馬遜。如果微軟與 AMD 的合作進(jìn)展順利，AMD 獲得 Meta 和谷歌的訂單，預(yù)計(jì) 2025 年 AMD 的 AI 芯片出貨量將達(dá)到英偉達(dá)（基于 CoWoS 封裝技術(shù)）的 30% 或更多。

為了補(bǔ)齊短板，AMD 不斷招兵買馬，擴(kuò)大 AI 技術(shù)實(shí)力。

10 月 10 日，AMD 在官網(wǎng)宣布，其已簽署收購(gòu)開源 AI 軟件公司 Nod.ai 的最終協(xié)議，此舉旨在增強(qiáng)公司的開源 AI 能力。Nod.ai 加入 AMD 將帶來一支經(jīng)驗(yàn)豐富的團(tuán)隊(duì)，該團(tuán)隊(duì)開發(fā)了業(yè)界領(lǐng)先的軟件技術(shù)，可加速針對(duì) AMD Instinct 數(shù)據(jù)中心加速器、RyzenAI 處理器、EPYC 處理器、Versal SoC 和 Radeon GPU 等優(yōu)化 AI 解決方案的部署。

AMD 人工智能集團(tuán)高級(jí)副總裁 Vamsi Boppana 表示：「收購(gòu) Nod.ai 預(yù)計(jì)將大大增強(qiáng)我們?yōu)?AI 客戶提供開發(fā)軟件的能力，使他們能夠輕松部署針對(duì) AMD 硬件調(diào)整的高性能 AI 模型?！?/p>

今年 8 月，AMD 宣布收購(gòu)法國(guó) AI 初創(chuàng)公司 Mipsology。Mipsology 成立于 2015 年，是 AMD 的長(zhǎng)期合作伙伴，此前一直為 AMD 開發(fā) AI 推理與優(yōu)化解決方案和工具。

可以看到，AMD 正大舉投資于 AI 芯片所需的關(guān)鍵軟件，以追趕頭號(hào)對(duì)手英偉達(dá)。

Intel：用性價(jià)比挑戰(zhàn)英偉達(dá)

在 GPU 領(lǐng)域，英特爾也將向英偉達(dá)發(fā)起挑戰(zhàn)。從英特爾的動(dòng)作看，今年最受關(guān)注的便是 Gaudi 系列。

2022 年，英特爾宣布，推出第二代深度學(xué)習(xí)芯片 Habana Gaudi 2 和 Habana Greco，分別用于 AI 訓(xùn)練和 AI 推理。隨后在今年 7 月，英特爾為中國(guó)市場(chǎng)推出定制版深度學(xué)習(xí)處理器 Habana Gaudi 2，可用于加速 AI 訓(xùn)練及推理，包括浪潮信息、新華三、超聚變等公司，預(yù)計(jì)將推出搭載 Gaudi 2 的服務(wù)器產(chǎn)品。

Gaudi 2 作為一款專用 AI 加速芯片，雖在性能上落后于目前英偉達(dá)最高端的 H100 芯片，但相比英偉達(dá)的通用 GPU A100 和 H100，其服務(wù)器成本更低，價(jià)格優(yōu)勢(shì)也更為明顯。

針對(duì)中國(guó)市場(chǎng)推出定制版的 Gaudi 2，英特爾爭(zhēng)奪市場(chǎng)的野心可見一斑。之后英特爾新路線圖的公布再次證明這一點(diǎn)。

今年 9 月，在美國(guó)圣何塞舉辦的英特爾 On 技術(shù)創(chuàng)新大會(huì)上，基辛格亮出了英特爾最新的三代 AI 芯片路線圖，其中采用 5nm 制程的 Gaudi 3 將于 2024 年推出，再下一代 AI 芯片代號(hào)為 Falcon Shores，計(jì)劃于 2025 年推出。其中 Gaudi 3 的算力將達(dá)到 Gaudi 2 的兩倍，網(wǎng)絡(luò)帶寬、HBM 容量將達(dá)到 Gaudi 2 的 1.5 倍。

Habana 原為以色列初創(chuàng)芯片公司，2016 年成立，旗下產(chǎn)品曾滲透進(jìn)入中國(guó)主要互聯(lián)網(wǎng)公司，2019 年 12 月，英特爾以 20 億美元收購(gòu) Habana。規(guī)劃中的 AI 新品 Falcon Shores 將在 Habana 的架構(gòu)基礎(chǔ)上，和英特爾原有的 GPU 等技術(shù)進(jìn)行融合，因此 Falcon Shores 也備受業(yè)內(nèi)關(guān)注。

與 AMD 一樣，英特爾亦極其看重 AI 芯片的軟件生態(tài)建設(shè)，英特爾正在加快構(gòu)建一個(gè)開放的 AI 軟件生態(tài)系統(tǒng)，以打破專有的封閉式生態(tài)系統(tǒng)格局。

英特爾公司執(zhí)行副總裁數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理 Sandra L. Rivera 稱，從英特爾看到，開發(fā)者通常從 Pytorch、Tensor Flow 等 AI 框架層從事 AI 創(chuàng)新工作，在底層方面，英特爾采用了 OneAPI（一種統(tǒng)一編程模型和應(yīng)用程序接口）對(duì)標(biāo)英偉達(dá)的 CUDA，利用 OneAPI 提供的優(yōu)化庫(kù)，希望以打包的平臺(tái)方案整合自家龐雜的產(chǎn)品路線，降低客戶對(duì)底層硬件差異的敏感度。

英特爾正通過不斷優(yōu)化的軟硬件組合，實(shí)現(xiàn)最佳的性能和規(guī)模，從而邁向「讓 AI 無處不在」的目標(biāo)。

在 ChatGPT 引發(fā)的大模型熱潮中，大模型訓(xùn)練需求增多，使得英偉達(dá)用于訓(xùn)練大模型的 A100/H100 更加稀缺。除英特爾與 AMD 外，也不乏有一些云服務(wù)器等科技巨頭下場(chǎng)自研 AI 芯片。

微軟、OpenAI 等科技巨頭自研 AI 芯片

10 月 6 日，據(jù)外媒 The Information 報(bào)道，微軟即將于下個(gè)月公布自行研發(fā)的 AI 芯片，從而協(xié)助減少對(duì)英偉達(dá) GPU 的依賴，該 AI 芯片代號(hào)為 Athena，預(yù)計(jì)微軟將在 11 月 14-17 日的 Ignite 開發(fā)者大會(huì)上宣布這款自行研發(fā)的芯片。

同一天，媒體消息稱，ChatGPT 開發(fā)商 OpenAI 也正在探索 AI 芯片的可能性，并已評(píng)估潛在的收購(gòu)目標(biāo)，以加速自研芯片的進(jìn)程。

據(jù)悉，自 2019 年以來，微軟就開始研發(fā)一款名為"雅典娜"（Athena）的定制 AI 芯片，用于為大型語(yǔ)言模型提供動(dòng)力，目前已在測(cè)試階段。同年，微軟向 ChatGPT 的所有者 OpenAI 投下 10 億美元，隨后在今年 1 月微軟再向 OpenAI 加注 100 億美元。

據(jù)悉，與 OpenAI 合作之后的微軟每個(gè)月可能需要數(shù)十萬顆英偉達(dá)芯片，也正因此 Athena 的首個(gè)目標(biāo)是為 OpenAI 提供算力引擎，以替代昂貴的英偉達(dá) A100/H100。如果明年大規(guī)模推出，Athena 將允許微軟內(nèi)部和 OpenAI 的團(tuán)隊(duì)同時(shí)訓(xùn)練和推理模型。

SemiAnalysis 的分析師迪倫·帕特爾（Dylan Patel）表示，開發(fā)類似于雅典娜的芯片可能每年需要花費(fèi) 1 億美元左右，ChatGPT 每天的運(yùn)營(yíng)成本約 70 萬美元，大部分成本來源于昂貴的服務(wù)器，如果雅典娜芯片與英偉達(dá)的產(chǎn)品擁有同等競(jìng)爭(zhēng)力，每個(gè)芯片的成本將可以降低三分之一。

不只是微軟和 OpenAI，為了降低成本、減少對(duì)英偉達(dá)的依賴、提高議價(jià)能力，谷歌、亞馬遜、Meta 等科技巨頭們都已下場(chǎng)自研 AI 芯片。

想要在 AI 熱潮中分得一口湯的還有不少野心勃勃的初創(chuàng)公司。

雄心勃勃的初創(chuàng)公司

2019 年創(chuàng)立的 d-Matrix

今年 9 月，位于美國(guó)硅谷的 AI 芯片初創(chuàng)公司 d-Matrix 獲得 1.1 億美元的 B 輪融資，由新加坡頂尖投資公司淡馬錫（Temasek）領(lǐng)投，加州風(fēng)投公司 Playground Global、微軟和三星等 14 家投資者跟投。

d-Matrix 由兩位 AI 硬件領(lǐng)域的資深人士 Sid Sheth 和 Sudeep Bhoja 于 2019 年 5 月創(chuàng)立。據(jù)領(lǐng)英顯示，d-Matrix 目前有大約 100 名員工，公司致力于構(gòu)建一種使用存內(nèi)計(jì)算（In-Memory Computing，IMC）技術(shù)和芯片級(jí)橫向擴(kuò)展互連進(jìn)行數(shù)據(jù)中心 AI 推理的新方法。據(jù)稱，該處理器將提供比 CPU 和 GPU 更快的 AI 推理性能，適用于大型 Transformer 模型。

d-Matrix 認(rèn)為，在 AI 領(lǐng)域雖然存在英偉達(dá)這樣難以撼動(dòng)的龍頭企業(yè)，但自己與英偉達(dá)不同，部分原因在于其技術(shù)針對(duì)的是 AI 處理過程中的「推理」（Inference）環(huán)節(jié)，而不是通過制造訓(xùn)練大型 AI 模型的技術(shù)來與英偉達(dá)競(jìng)爭(zhēng)?；?Transformer 的模型通常在高性能 GPU 上進(jìn)行訓(xùn)練，但執(zhí)行推理是一個(gè)能效問題，而不僅僅是性能問題。d-Matrix 提出了一種創(chuàng)新解決方案，聲稱可以將硬件的效率提高 10-30 倍。

據(jù)悉，微軟已承諾在明年公司研發(fā)的芯片推出時(shí)對(duì)其進(jìn)行評(píng)估。d-Matrix 公司預(yù)計(jì)今年將獲得 1000 萬美元左右的收入，主要來自購(gòu)買芯片進(jìn)行評(píng)估的客戶；預(yù)計(jì)兩年后年收入將達(dá)到 7000 萬至 7500 萬美元，實(shí)現(xiàn)收支平衡。

2018 年成立的 Rain Neuromorphics Atomic Semi Cerebras

Rain Neuromorphics Atomic Semi Cerebras 由臺(tái)積電前工程副總 Keith McKay 在 2018 年創(chuàng)立，總部位于美國(guó)加利福尼亞州，曾以推出超大芯片而引發(fā)關(guān)注。

其 AI 超算處理器 Cerebras WSE 比 iPad 還要大。二代擁有 2.6 萬億個(gè)晶體管和 85 萬個(gè) AI 優(yōu)化內(nèi)核。它們還發(fā)布過一種 brain-scale 技術(shù)，可以運(yùn)行超過 120 萬億個(gè)連接的神經(jīng)網(wǎng)絡(luò)。今年 Cerebras 還一口氣開源了 7 個(gè) GPT 模型，參數(shù)量分別達(dá)到 1.11 億、2.56 億、5.9 億、13 億、27 億、67 億和 130 億，同時(shí) Cerebras 也提供大模型訓(xùn)練推理等云服務(wù)。

目前為止，該公司已融資 7.2 億美元。據(jù)悉，OpenAI 已參投了至少三家芯片公司，Rain Neuromorphics 就在列，其余兩家是 Cerebras 和 Atomic Semi。

2022 年創(chuàng)立的 Modular

Modular 是一家美國(guó)的初創(chuàng)企業(yè)，成立于 2022 年。去年 6 月，Modular 完成了由 GV 領(lǐng)投、Greylock、SV Angel 和 The Factory 參與的 3000 萬美元種子輪融資。隨后在今年 8 月，Modular 又獲得了 1.3 億美元的 A 輪融資，本輪融資由 General Catalyst 領(lǐng)投，GV、SV Angel 等參與。

Modular 表示，英偉達(dá)的 CUDA 軟件用于編寫只能在其 GPU 上運(yùn)行的機(jī)器學(xué)習(xí)應(yīng)用程序，而它們通過其軟件為企業(yè)提供了另一種選擇，使開發(fā)者可以更簡(jiǎn)單地在其他公司設(shè)計(jì)的芯片上訓(xùn)練和運(yùn)行機(jī)器學(xué)習(xí)模型，例如英特爾、AMD 和 Google。它還提高了這些芯片的性能，意味著它們可以用來訓(xùn)練更強(qiáng)大的人工智能模型。

除了上述幾家公司之外，2017 年成立并致力于使用硅光芯片實(shí)現(xiàn)深度學(xué)習(xí)的美國(guó) AI 初創(chuàng)公司 Lightmatter、2022 年成立并致力于開發(fā)用于文本應(yīng)用的大語(yǔ)言模型（LLM）專用芯片的公司 MatX、成立于 2022 年并旨在使人工智能計(jì)算更具可訪問性和可負(fù)擔(dān)性的公司 Tiny Corp 都在努力成為具有分量的挑戰(zhàn)選手。

英偉達(dá)的戰(zhàn)略

英偉達(dá)面臨來自 AMD、英特爾以及一系列大型科技、初創(chuàng)公司的競(jìng)爭(zhēng)，這是一個(gè)極為突出的話題。英偉達(dá)有它難以超越的優(yōu)勢(shì)也自然有不可避免的劣勢(shì)。

先看優(yōu)勢(shì)。英偉達(dá)占據(jù)全球數(shù)據(jù)中心 AI 加速市場(chǎng) 82% 的份額，以 95% 的市場(chǎng)占有率壟斷了全球 Al 訓(xùn)練領(lǐng)域的市場(chǎng)，也就是說，即使當(dāng)下已經(jīng)有諸多公司進(jìn)入 AI 市場(chǎng)，但是這些沒有市場(chǎng)優(yōu)勢(shì)的公司可能也難以產(chǎn)生足夠的利潤(rùn)。

此外，雖然 AMD 和英偉達(dá)都能提供不同價(jià)位和性能的 GPU 產(chǎn)品，但在性能方面，英偉達(dá)擁有明顯的整體領(lǐng)先優(yōu)勢(shì)。這一標(biāo)準(zhǔn)更是這些初創(chuàng)公司難以短期內(nèi)達(dá)到的，雖然如今的 AI 市場(chǎng)中已有部分主要參與者開始試驗(yàn)新的 AI 芯片和工具，但倘若想要以性價(jià)比取勝，仍需很長(zhǎng)時(shí)間。

再看劣勢(shì)。首當(dāng)其沖便是價(jià)格，昂貴的單價(jià)也是勸退多家科技巨頭依賴外購(gòu)芯片的主因。另外英偉達(dá)提供的全棧服務(wù)結(jié)合了硬件和軟件解決方案，但這種全棧服務(wù)也可能成為吸引新客戶的阻力。很少有大客戶愿意永久依賴于一個(gè)生態(tài)系統(tǒng)，這會(huì)使他們?cè)谖磥硖幱趦r(jià)格劣勢(shì)。這也是亞馬遜拒絕英偉達(dá)的 DGX 云平臺(tái)的原因之一，相比之下 AMD 可以為客戶提供更大的靈活性。

如此看來，想必在未來幾年，英偉達(dá)將面臨激烈的競(jìng)爭(zhēng)，能否守住龍頭地位，成為英偉達(dá)面臨的重要問題。