?GPU市場開始分化,中國迎來更多商機
最近,關于 GPU,或與 GPU 相關的消息不斷,例如,OpenAI 正探索自研 AI 芯片,微軟將在今年 11 月推出自研的 AI 芯片,三星推出 Exynos 2400 處理器,自研的 GPU 再次升級,等等。這些都是市場和廠商尋求更多變化的體現(xiàn)。
本文引用地址:http://www.biyoush.com/article/202310/451436.htm在全球半導體行業(yè)整體不景氣的 2023 年,只有 AI 服務器系統(tǒng)和相關芯片一枝獨秀,而 AI 服務器使用的處理器多數是 GPU,不幸的是(對于多數 GPU 廠商而言),在這一僅有的優(yōu)秀市場,多數廠商都只能喝湯,有的甚至連湯都喝不上,唯一大口吃肉的是英偉達。據 visualcapitalist 統(tǒng)計,在全球現(xiàn)有 1500 億美元的 AI 市場中,英偉達已經占有 80% 以上,AMD 和英特爾遠遠落后。更重要的是,這一市場規(guī)模每天都在增長,無論是 GPU 芯片廠商,還是系統(tǒng)和互聯(lián)網大廠,都不想看到英偉達繼續(xù)擴大市場占有率。
除了 AI 應用,GPU 在傳統(tǒng)的圖形處理應用方面依然發(fā)揮著關鍵作用,無論是 PC,還是手機,該市場空間依然巨大。在手機應用市場,IP 大廠 Arm 和 Imagination Technologies 占主導地位,高通雖然不是 IP 廠商,但憑借其手機 SoC 的市場霸主地位,使得諸多手機廠商不僅要購買 Arm 或 Imagination 的 GPU 核,還要被高通卡一刀,在這種情況下,也紛紛另謀 GPU 出路。
綜上,越來越多的 GPU 應用大廠(手機和互聯(lián)網廠商),以及新創(chuàng)芯片設計公司都開始自研 GPU,或推出與英偉達 GPU 分庭抗禮的新型 AI 處理器,希望在大規(guī)模應用市場獲得更多商業(yè)利益。
AI 服務器需求可能改變產業(yè)鏈
以 ChatGPT 為代表的 AIGC 火遍全球,使得英偉達 GPU 供不應求,與此同時,其它芯片供應商的類似產品在軟硬件生態(tài)方面無法在短期內滿足 AIGC 系統(tǒng)廠商需求,這使得英偉達處理器的單價水漲船高。然而,水滿則溢,過猶不及,各大系統(tǒng)和互聯(lián)網廠商不能長期接受這種狀況,紛紛開啟自研 AI 芯片之旅。
最近,就連 ChatGPT 的創(chuàng)造者 OpenAI 也加入了自研芯片的行列。有消息人士透露,OpenAI 正在探索自研 AI 芯片,并已開始評估一個潛在的收購目標,該公司首席執(zhí)行官 Sam Altman 表示,收購一家芯片公司可以加快 OpenAI 開發(fā)自己芯片的進程。一位熟悉 OpenAI 計劃的人士透露,該公司已經對潛在的收購目標進行了盡職調查,不過,目前還不知道究竟是哪家公司。
據悉,至少從 2022 年開始,OpenAI 就討論了各種新方案,以擺脫對英偉達 GPU 的過度依賴。運行 ChatGPT 系統(tǒng)是非常昂貴的,伯恩斯坦公司 (Bernstein) 分析師 Stacy Rasgon 的分析顯示,每次查詢大約花費 4 美分,如果 ChatGPT 的搜索量增長到谷歌(Google)搜索量的十分之一,它將需要大約價值 481 億美元的 GPU,每年需要 160 億美元的芯片來維持系統(tǒng)運行。
英偉達預計今年每美元收入可賺取 56.51 美分的利潤,使其成為全球最賺錢的科技公司之一。正如亞馬遜創(chuàng)始人杰夫·貝佐斯曾經說過的那樣,云提供商不必將這些利潤交給芯片廠商,而是可以通過花費時間和金錢來控制其成本結構中日益重要的部分而受益。自研芯片就是主要途徑。
與此同時,OpenAI 的大股東微軟也有望于 11 月推出自研的 AI 芯片 Athena,以減少對英偉達 GPU 的依賴,近期,有消息稱,微軟開始下修英偉達 H100 芯片訂單,并放緩拉貨。微軟自研的芯片與英偉達 GPU 類似,專為訓練和運行大型語言模型的數據中心服務器而設計。
據悉,微軟從 2019 年就開啟了自研 AI 芯片項目,代號就是 Athena。不過,微軟并非要完全取代英偉達芯片,而是要降低成本,并在多項服務中加入 AI 功能。
在微軟之前,亞馬遜和 Google 都已經推出了自研 AI 芯片。目前,在英偉達的大客戶當中,已經有 6 家開始自研芯片,大家都不想過度依賴一家供應商,那樣太被動了。
手機大廠自研 GPU
不止 AI 服務器應用廠商,手機大廠也想擺脫對 GPU 芯片和 IP 廠商的過度依賴,典型代表就是三星和蘋果。
最近,三星推出了 Exynos 2400 手機處理器,其中的 Xclipse 940 GPU 采用了 AMD 最新的 RDNA 3 架構,特色是提升了硬件光線追蹤能力,這種技術在當下的手機游戲當中發(fā)揮著越來越重要的作用,是高性能產品的標配。
為了自研 GPU,三星在 2019 年就與 AMD 展開合作,當時,雙方簽署了首個協(xié)議,AMD 將其基于 RDNA 架構的定制 GPU IP 授權給三星使用,用于智能手機和其它移動設備。從那時起,三星一直在其 Exynos 系列處理器中使用 AMD Radeon 圖形解決方案。
三星自研手機 GPU,是為了減少對 Arm Mali GPU IP 的依賴。在 Exynos 2100 發(fā)布之前的很多年,三星一直依賴 Mali GPU IP,2022 年初,三星宣布推出全新移動處理器 Exynos 2200,內置了基于 AMD RDNA 2 架構的 Xclipse 圖形處理單元。不過,這款處理器在推出后的表現(xiàn)并不好,僅搭載于部分 Galaxy S22 系列手機中,還在性能測試中輸給了高通驍龍 8 Gen1。 之所以如此,主要原因是 Xclipse 的設計存在缺陷,且優(yōu)化不足。
在 Exynos 2200 之后,三星還有 Exynos 2300,但因為依然存在設計缺陷,沒有進入量產階段。
今年 4 月,三星和 AMD 簽署了一項長期協(xié)議,以加強雙方的戰(zhàn)略合作關系,雖然前兩款處理器較為失敗,但并沒有打消三星自研手機 GPU 的決心。正是在這樣的背景下,三星于近期推出了 Exynos 2400 手機處理器。
不過,自研手機 GPU 并不容易,雖然三星沒有畏懼失敗,但前路可能比過去更艱難,特別是與 AMD 合作,難度不小,原因在于,AMD 的 RDNA 架構主要針對 PC 端,現(xiàn)在要用于移動端,功耗問題很難解決,對設計、架構、優(yōu)化等工作提出了更高要求,需要雙方深度合作,進行優(yōu)化。而這樣的工作似乎沒有成功的先例,當年英特爾做手機芯片,遇到的問題與此非常類似。
為了加快優(yōu)化進程,三星電子不斷加大投入力度。2022 年 4 月,三星電子副總裁金泰賢奔赴美國的三星奧斯汀研究中心高階運算實驗室,擔任 GPU 開發(fā)團隊負責人。2022 年底,三星電子系統(tǒng) LSI 部門與 MX 部門一起成立了 AP 解決方案開發(fā)團隊,以優(yōu)化 AP 并進行下一代 AP 研究。此外,三星還通過從 AMD 和 Arm 招募關鍵崗位開發(fā)人員,建立了一個內部 AP 優(yōu)化團隊,并不斷增加研發(fā)人員。進入 2023 年以來,三星美國子公司持續(xù)招募 GPU 開發(fā)人員,一定要與 AMD 合作,攻下手機 GPU 這道難關。
與三星相比,蘋果在自研手機 GPU 方面投入得更早,也是一波三折。
早些年,蘋果一直購買 Imagination 的 PowerVR GPU IP,后來,蘋果打算停止采購該公司的 IP,想自研 GPU,其目的是進一步控制產品核心技術,降低成本,以確保智能手機的高額利潤,同時,為未來創(chuàng)新做準備,特別是在 VR、AR 應用領域占據有利位置。
為了自研 GPU,蘋果從 Imagination 公司招募了很多工程師,不過,在經過兩年左右的研發(fā)努力后,宣告失敗,蘋果不得不繼續(xù)與 Imagination 合作,通過購買其 IP,來設計自家的 A 系列手機處理器 GPU 模塊。
本文所說的自研 GPU,有兩個層面的意思:一是完全自研,就像蘋果當年打算停止與 Imagination 合作,從最底層、最基礎的 IP 開始研發(fā),這是最徹底的,也是最難的;二是目前蘋果和三星采用的自研方式,也就是從合作伙伴那里購買 GPU IP,將其內置于自研的手機 SoC 當中,這種相對容易,效率也高,但自研的含金量與高通這樣的公司相比,就低了一頭。
以蘋果最新推出的手機處理器 A17 Pro 為例,GPU 是其一大特色,核心數量從 A16 的 5 個增加到 6 個,還進行了全新的架構設計,峰值性能提升了 20%,引入網格著色 (Mesh Shading),首次支持實時硬件級光線追蹤,這就追上了高通、聯(lián)發(fā)科的腳步。
通過 3DMarkWildlife 跑分來比較 A17 Pro 和高通的驍龍 8Gen2 的 GPU 性能,結果顯示,A17 Pro 的跑分為 11860,驍龍 8Gen2 為 13500,兩者的跑分差距約為 15% 左右,A17Pro 在 GPU 性能上稍遜一籌。原因在于,高通自研的 Adreno GPU 經過多年的技術積累和應用打磨,已經非常完善和成熟了,三星和蘋果要想在 GPU 方面與高通競爭,還需要時間和積累。
總體來看,自研 GPU 的手機廠商還不能擺脫對傳統(tǒng)供應鏈的依賴,完全自主還需要時間。
創(chuàng)業(yè)公司挑戰(zhàn) GPU
以上分別介紹了 AI 服務器 GPU 和手機 GPU 相關廠商的自研情況,所涉及的公司都是傳統(tǒng)大廠,具有很強的市場影響力,這為它們開創(chuàng) GPU 新路提供了基礎保障,即使不成功,也不會傷筋動骨。然而,對于近些年為搶奪 AI 服務器 GPU 市場蛋糕而開發(fā)新型處理器的創(chuàng)業(yè)公司來說,情況就不太樂觀了,很多公司已經難以為繼,主要原因就是研發(fā)的處理器產品難以滿足客戶的生態(tài)系統(tǒng)要求,很難賣出去。
最近,以英偉達為主要競爭對手的英國 IC 設計公司 Graphcore 給英國公司注冊處提交了一份聲明,內容顯示,該公司正在與潛在投資者談判,但尚未達成協(xié)議。聲明還表示,該公司去年稅前虧損同比增加 11%,達到 2.046 億美元。該公司還表示,2022 年已經關閉了其在挪威、日本、韓國的辦公室,員工數量從 2021 年的 631 人降至去年的 494 人,同時,該公司 2022 年營收減少了 46%。
Graphcore 成立于 2016 年,曾經是最被看好的英國初創(chuàng)公司之一。該公司的 IPU 產品(對標英偉達的 GPU)曾被用于微軟 Azure 平臺。
中國 GPU 有更多機會
近幾年,出于本土產業(yè)鏈安全,以及商業(yè)利益考慮,中國本土 GPU 廠商也在發(fā)力,且涌現(xiàn)出了幾家比較有特色的廠商。
由于以英偉達為代表的國際 GPU 龍頭企業(yè)已經牢牢掌控了市場,中國本土廠商在產品開發(fā)過程中,要應對各種困難和挑戰(zhàn),如專利和生態(tài)系統(tǒng)適配。不過,就像龍芯經過多年潛心研究,將 MIPS 吃透,進而開發(fā)出屬于自己的指令集和芯片一樣,只要具備坐十年冷板凳的決心和毅力,開發(fā)出自主可控的 GPU,是值得期待的。
不久前,龍芯中科在調研中表示,自研的 GPU IP 核在公司量產橋片以及新款芯片中已經進行驗證,集成龍芯自研 GPGPU 的第一款 SoC 預計 2024 上半年流片,支持圖形加速、科學計算和 AI 計算。在此基礎上,2024 下半年將完成兼顧顯卡和算力加速功能的專用芯片流片。
景嘉微是中國老牌 GPU 企業(yè),率先研制出了自主 GPU 并已實現(xiàn)大規(guī)模工程應用,以 JM5、JM7、JM9 系列等 GPU 為代表,正在從商用向民用市場拓展。除了景嘉微,海光的 DCU 系列以 GPGPU 架構為基礎,兼容 ROCm 和 CUDA 生態(tài)系統(tǒng),可應用于大數據處理和 AI 等領域。
新生力量方面,壁仞科技、天數智芯、芯動科技、摩爾線程、沐曦集成電路等受到越來越多的關注。
在云端 GPGPU 方面,天數智芯是在最近幾年異軍突起的本土企業(yè),2021 年,該公司推出了 7nm 制程全自研云端訓練 GPGPU「天垓 100」,并于 2022 年發(fā)布了 7nm 云端推理 GPGPU「智鎧 100」,能夠為云端 AI 訓練和 HPC 通用計算提供高算力和高能效比。
其它幾家企業(yè)也在近兩三年內推出了用于數據中心和 AI 的 GPU,如沐曦集成電路的 MXC 系列,壁仞科技的 BR100,摩爾線程的 MTT S2000。
與國際 AI 服務器芯片廠商相比,中國本土 GPU 廠商具有更好的成長和發(fā)展空間,首先,中國市場空間巨大,有廣闊的施展空間;其次,原本需要面對的來自英偉達、AMD 等國際大廠的競爭,被美國政府政策屏蔽掉了很大一部分;再有,中國本土系統(tǒng)和互聯(lián)網大廠沒有微軟、亞馬遜和谷歌那樣迫切的自研 GPU 需求。在經過資本熱潮消退,市場優(yōu)勝劣汰之后,能推出有「干貨」的產品、保持健康現(xiàn)金流的企業(yè),會有不錯的發(fā)展空間。
評論