AI 端側(cè)的芯片革命
2025 年,中國開了一個好年。
本文引用地址:http://www.biyoush.com/article/202502/467276.htm文化市場,哪吒 2 爆火,票房已經(jīng)突破了百億,闖入全球電影 TOP 榜,向世界展示了中國市場「恐怖的」消費能力。AI 市場,DeepSeek 的橫空出世,更低的算力達到 Chat GPT 的效果,直接刷屏全球熱搜榜。
如果說 Chat GPT 的出現(xiàn),讓生成式 AI 走向了云,那么 DeepSeek 則是讓生成式 AI 走向了端。
端側(cè) AI 芯片的「黃金拐點」
科技行業(yè)一直在探索 AI 硬件產(chǎn)品。
從今年「消費電子屆春晚」CES 上來看非常明確。今年 CES 上的各大公司推出的產(chǎn)品都與 AI 強相關(guān),無論是通用的 PC,還是手機終端,再到機器人、眼鏡、耳機、手表等等,幾乎每種產(chǎn)品只要存在人機交互的硬件終端,都有廠商嘗試將其與 AI 大模型結(jié)合。
但這些探索似乎都不太成功。大模型推出了成百上千種,硬件產(chǎn)品更是成千上萬種,但效果不甚了了。究其原因,還是本地 SoC 提供的算力和大模型需要的算力無法匹配。
ChatGPT 時代,大模型的蒸餾是很大的問題。如果采用云端調(diào)用算力完成 AI 推理,就存在三個問題:第一,成本。云端的任何操作都是有成本的,可能不多,幾分人民幣,但總之是要花錢的。
有手機廠商透露,調(diào)用一次云端大模型的平均成本在 1.2 分到 1.5 分人民幣,假設(shè)每個品牌都有上億的用戶量,每人每天調(diào)用 10 次,這其中的算力成本非常驚人。但是如果按次數(shù)或月租向用戶進行收費,在功能同質(zhì)化的情況下,用戶的使用意愿也會很難保證。
第二,速度。既然是云端完成,那么必然需要進行網(wǎng)絡(luò)傳輸,這就導(dǎo)致 AI 在終端的響應(yīng)速度慢。如果是自動駕駛中的汽車,對于當(dāng)前環(huán)境需要在 10 毫秒內(nèi)決策,靠著云端未免過于危險。在自動駕駛、工業(yè)質(zhì)檢等場景,端側(cè)推理延遲能夠降至毫秒級,較云端方案提升 5 倍。
第三,隱私。這是最重要的部分,涉及到醫(yī)療和金融等內(nèi)容,對于用戶來說,端側(cè)模型才是最優(yōu)解。
所有人內(nèi)心都有一個答案:端側(cè) AI 才是 AI 硬件落地的關(guān)鍵。
小尺寸模型落地端側(cè)已經(jīng)開始了。
自華為宣布「小藝智能體」接入 DeepSeek-R1 算起,在一周多的時間里,包括星紀(jì)魅族、榮耀、OPPO、努比亞、vivo 在內(nèi)的 6 家手機廠商宣布接入 DeepSeek。
需要解釋的是,滿血版 DeepSeek-R1 模型參數(shù)達到 671B,僅模型文件就需要 404GB 存儲空間,任何一種移動設(shè)備都無法滿足這樣的硬件配置需要。但 DeepSeek 蒸餾版本(1.5B、7B)適合手機等端側(cè)使用。
為了讓這些小尺寸模型在端側(cè)流暢運行并充分發(fā)揮其智能優(yōu)勢,就需要性能強勁的端側(cè) AI 芯片來提供算力支持。
市場對于能適配小尺寸模型運行的端側(cè) AI 芯片需求開始水漲船高。
賽道主力玩家
端側(cè)的應(yīng)用市場非常大,前文我們提到,只要存在人機交互的硬件終端,都有廠商嘗試將其與 AI 大模型結(jié)合。我們可以在這里具體看一下:
AI PC 領(lǐng)域,2027 年 AI PC 在中國 PC 市場占比能夠達到 85%;AI 手機領(lǐng)域,2026 年,AI 手機的出貨量預(yù)計將突破 4.7 億部,滲透率增至 38%;在 AI 可穿戴設(shè)備領(lǐng)域,市場規(guī)模預(yù)計將從 2024 年的 419 億美元增長至 2028 年的 1207 億美元,CAGR 達到 30.3%。
2023 年中國端側(cè) AI 市場規(guī)模為 1,939 億元,從 2018 至 2023 年,其年均復(fù)合增長率為 116.3%。
DeepSeek 首先帶動是 AI 端側(cè)的 SoC 芯片需求。
SOC 芯片是各類型硬件設(shè)備的主控單元,承載著運算控制等核心功能,是硬件的「大腦」。隨著 AI 在邊緣側(cè)的應(yīng)用越來越廣泛,SOC 將更加變成集成人工智能和邊緣計算能力的系統(tǒng)級芯片,成為 AI SOC,算力達到幾十甚至數(shù)百 TOPS。
在這次端側(cè) AI 熱潮中,瑞芯微頻頻漲停。
目前,瑞芯微能夠提供從 0.2TOPs 到 6TOPs 的不同算力水平的 AIoT 芯片,其中 RK3588、RK3576 帶有 6TOPs NPU 處理單元,能夠支持端側(cè)主流的 0.5B~3B 參數(shù)級別的模型部署??赏ㄟ^大語言模型實現(xiàn)翻譯、總結(jié)、問答等功能,并可實現(xiàn)多模態(tài)搜索、識別,有效解決不同 AIoT 場景的痛點,提升產(chǎn)品使用體驗。
其中,公司 SOC 芯片拳頭產(chǎn)品 RK3588M 是國內(nèi)少數(shù)能媲美國外一線產(chǎn)品的智能座艙 SoC 芯片。
據(jù)瑞芯微透露,該產(chǎn)品性能優(yōu)異,一芯帶多屏、端側(cè) AI 等能力突出,已落地應(yīng)用于眾多頭部車廠,量產(chǎn)車型 10 余款,超 20 款定點車型項目在同步開發(fā)中。此外,新產(chǎn)品 RK3576M 也正在進行客戶導(dǎo)入。
這還僅是瑞芯微端側(cè) AI 產(chǎn)品應(yīng)用的一個方面。
事實上,當(dāng)前已有多個領(lǐng)域的客戶基于瑞芯微主控芯片研發(fā)在端側(cè)支持 AI 大模型的新硬件,例如教育平板、AI 玩具、桌面機器人、算力終端、會議主機等產(chǎn)品。
全志科技也是一家備受關(guān)注的 SoC 企業(yè)。去年公司全年實現(xiàn)屬于上市公司股東的凈利潤為 1.53 億元–1.9 億元,同比增長 566.29%~727.42%。業(yè)績暴增的原因,則是以掃地機器人、智能投影等業(yè)務(wù)線為代表的產(chǎn)品出貨量顯著提升,致使?fàn)I業(yè)收入同比增長約 35%。
在記者問詢?nèi)究萍籍a(chǎn)品是否能適配 DeepSeek,是否針對 DeepSeek 進行布局時,全志科技表示:「公司產(chǎn)品可以為端側(cè)多種形態(tài)的智能終端產(chǎn)品提供算力支持。」
樂鑫科技 SoC 長期應(yīng)用于泛 IoT 領(lǐng)域。從應(yīng)用端看,樂鑫科技在智能家居、智能照明和消費電子等核心應(yīng)用市場合計達到了 30% 以上的增長。
樂鑫科技 ESP32-S3 和 ESP32-P4 產(chǎn)品線都有添加邊緣 AI 的功能,主要體現(xiàn)為設(shè)備端語音喚醒與控制,以及圖像處理的功能。這兩個系列的芯片在硬件設(shè)計上增加了 AI 加速指令;而在軟件層面,也提供圖像識別和語音喚醒、控制等方案。
樂鑫科技副總經(jīng)理王玨表示:「公司帶端側(cè) AI 功能的 AIoT 芯片 ESP32-S3 目前增長非常迅速,也是當(dāng)前主推的旗艦產(chǎn)品?!棺止?jié)跳動的 AI 玩具「顯眼包」中用的也是樂鑫的芯片 ESP32。
晶晨股份已有超 15 款商用芯片搭載其自研的端側(cè) AI 算力單元,2024 年攜帶自研端側(cè) AI 算力單元的芯片出貨量超過 800 萬顆。
2024 年年度實現(xiàn)營業(yè)收入 59.21 億元左右;歸母凈利潤約 8.2 億元左右,同比增長 64.65% 左右。該公司表示,其 6nm 芯片 S905X5 系列可利用端側(cè) AI 能力,實現(xiàn)本地同聲翻譯、同聲字幕等功能,商用半年以來取得多個國際 Top 級運營商的訂單,預(yù)計 6nm 芯片有望在 2025 年達成千萬顆以上的銷量。
端側(cè)的 AI 音頻處理器應(yīng)用場景多是在智能物聯(lián)網(wǎng)領(lǐng)域。比如,在智能音響中,端側(cè) AI 音頻處理器能夠支持語音喚醒、語音識別、語音合成等功能,實現(xiàn)用戶與音箱的自然語言交互。在智能家居系統(tǒng)中,它可用于聲音控制家電設(shè)備,如通過語音指令調(diào)節(jié)燈光、空調(diào)、電視等。
恒玄科技的端側(cè) SoC 已經(jīng)成功搭載在多家主流品牌產(chǎn)品里,包括百度、字節(jié)跳動、谷歌、哈曼、安克創(chuàng)新、漫步者、韶音等。今年,字節(jié)跳動推出的首款搭載豆包大模型的智能耳機 Ola Friend,搭載的就是恒玄科技 2700 芯片。恒玄科技的最新芯片 BES2800 還被應(yīng)用于三星 2024 年最新發(fā)布的 Galaxy Buds3 Pro 耳機中。多款耳機的應(yīng)用,能夠看出恒玄科技在智能終端 SoC 芯片領(lǐng)域處于領(lǐng)先地位。
對于端側(cè) AI 對于芯片要求的變化,恒玄科技認為:「云端大模型的興起除了對 AI 手機、PC 帶動外,可穿戴也是會受益于端側(cè) AI 的發(fā)展,它對芯片會提出新的需求,比如可穿戴的環(huán)境感知能力要變得更強,所以主控芯片的算力需要相應(yīng)提升,同時可穿戴產(chǎn)品長續(xù)航是剛需,所以芯片在算力提升的基礎(chǔ)上還要保持較低的功耗水平?!?/span>
值得一提的還有 AI 眼鏡芯片。行業(yè)普遍認為眼鏡是目前最火的 AI、大模型的落地載體,今年行業(yè)將會完成 0 到 1 的突破。
之前在 2017 年,Meta 就開始自研 AI 眼鏡,最開始是和三星合作,但是三年都沒出什么結(jié)果,然后告吹了。之后 Meta 放棄了自研芯片,Ray-Ban 眼鏡使用了高通的 AR1 Gen 1 芯片。
可以說,在 ARVR 芯片這個領(lǐng)域,高通還是處于絕對的控制地位。在市面上,AI 眼鏡能用上的芯片,除了高通芯片,那就是紫光展銳的 TW517。
紫光展銳TW517 采用 12nm 工藝,GPU 型號為 IMG8300,運行頻率 800MHz。主要客戶是閃極 AI 拍拍鏡、影目科技。
同時,恒玄科技此前透露,該公司芯片已在魅族等智能眼鏡產(chǎn)品中應(yīng)用發(fā)布,同時有一些客戶項目正在導(dǎo)入階段。
結(jié)語
哪吒 2 突破百億票房,向世界展示了中國市場「恐怖的」消費能力。這意味著:單憑中國市場的規(guī)模和消費能力就抵得上全球其他發(fā)達國家的總和。
這背后傳遞的信號非常積極。
如果只看電影市場,可能還不太理解。但如果放到科技和制造業(yè)中來看就會明白其中的巨大價值。
接下來不管歐美再怎么對我們進行貿(mào)易和科技壁壘,都不可能阻止我們產(chǎn)業(yè)升級。對于科技和制造的最大障礙,并不是「卡脖子」,而是前期沒有足夠大的消費市場買單,就無法形成相關(guān)產(chǎn)業(yè)鏈的建立。
舉個例子,某企業(yè)研發(fā)一款芯片,從設(shè)計到量產(chǎn)累計成本要 2 個億,如果只賣出十萬片那每個芯片的成本等于是 2000 塊,這個價格太高了,企業(yè)肯定無法盈利。只能陷入長期虧損,最終倒閉出局。但是如果能夠賣出 1 億片,那每片成本只需要 2 塊錢。這個成本的大幅度攤薄就會讓企業(yè)有利潤繼續(xù)投入研發(fā)。
因為市場體量足夠大,有足夠多的買家?guī)椭杀?,公司就能賺錢、行業(yè)就能發(fā)展,這就是中國市場的魔力。
國信證券研報觀點稱,2024 年電子行情由「周期復(fù)蘇」向「成長創(chuàng)新」切換,2025 年行業(yè)有望邁入估值擴張大年。應(yīng)用端 AI 革新人機交互,以語音交互為核心的 AI 端側(cè)應(yīng)用正處在大規(guī)模商業(yè)化的臨界點,創(chuàng)新催化頻繁。
相比 AI 云側(cè),國內(nèi)半導(dǎo)體企業(yè)將在 AI 端側(cè)創(chuàng)新中實現(xiàn)更高的市場參與度,同時國產(chǎn)半導(dǎo)體自給率仍偏低,兩者共振奠定了行業(yè)成長的確定性和空間。
評論