全球AI競(jìng)賽,美國(guó)的優(yōu)勢(shì)不止英偉達(dá)
人工智能的全球市場(chǎng)競(jìng)爭(zhēng)中,「主權(quán)人工智能」開始成為越來越重要的議題。
本文引用地址:http://www.biyoush.com/article/202407/460802.htm關(guān)于這個(gè)話題的大多數(shù)討論都集中在以下幾個(gè)核心問題:
世界各國(guó)都希望盡快成為萬(wàn)億美元人工智能市場(chǎng),并讓人工智能成為本國(guó)經(jīng)濟(jì)增長(zhǎng)的關(guān)鍵引擎
各個(gè)國(guó)家、地區(qū)都想要建立反映當(dāng)?shù)卣Z(yǔ)言、政治和文化的本土人工智能系統(tǒng)
各個(gè)國(guó)家、地區(qū)都認(rèn)為技術(shù)獨(dú)立是一種應(yīng)對(duì)當(dāng)前緊張的世界政治格局的正確選擇
這種「技術(shù)主權(quán)」的焦慮,主要來自人們已經(jīng)深刻認(rèn)識(shí)到技術(shù)落要面對(duì)的代價(jià)。
美國(guó)科技的領(lǐng)先帶來的福利越來越清晰。20 世紀(jì) 80 年代和 90 年代,微軟和英特爾等美國(guó)科技巨頭主宰了 PC 時(shí)代,遠(yuǎn)遠(yuǎn)超過了亞洲和歐洲的競(jìng)爭(zhēng)對(duì)手。在接下來的幾十年里,隨著硅谷涌現(xiàn)出一波又一波世界級(jí)公司,互聯(lián)網(wǎng)搜索、社交媒體、電子商務(wù)、移動(dòng)和云計(jì)算等領(lǐng)域也出現(xiàn)了同樣的循環(huán)。
2022 年 11 月 30 日,美國(guó)公司 OpenAI 發(fā)布了給予大型語(yǔ)言模型(LLM)的 ChatGPT。隨后,公眾對(duì) AI 技術(shù)的關(guān)注熱情被迅速點(diǎn)燃。彼時(shí),ChatGPT 成為歷史上增長(zhǎng)最快的消費(fèi)軟件應(yīng)用程序,也掀起了全球 AI 投資熱潮。英國(guó)半導(dǎo)體公司 Arm 和 Amadeus Capital Partners 的聯(lián)合創(chuàng)始人赫爾曼·豪澤 (Hermann Hauser) 表示:「我們非常擔(dān)心美國(guó)會(huì)再次遙遙領(lǐng)先」。豪澤曾撰寫大量關(guān)于歐洲建立技術(shù)主權(quán)必要性的文章。
如何掌握人工智能的主權(quán)?
面對(duì)美國(guó)再次領(lǐng)先,全世界都在準(zhǔn)備 AI 的「糧草」。IDC 數(shù)據(jù)顯示,2022 年全球人工智能 IT 總投資規(guī)模為 1,324.9 億美元,并有望在 2027 年增至 5,124.2 億美元,年復(fù)合增長(zhǎng)率為 31.1%。在生成式 AI 市場(chǎng)上,IDC 預(yù)測(cè),全球生成式 AI 市場(chǎng)年復(fù)合增長(zhǎng)率或達(dá) 85.7%。2027 年,45% 的企業(yè)將掌握并使用生成式 AI 來共同開發(fā)數(shù)字產(chǎn)品和服務(wù),全球生成式 AI 市場(chǎng)規(guī)模將接近 1500 億美元。
作為 AI 的載體,數(shù)據(jù)中心的建設(shè)如火如荼地進(jìn)行中。
日本政府投資 725 億日元,幫助 KDDI、軟銀和 Sakura 等多家日本公司為 AI 應(yīng)用建立本地云數(shù)據(jù)中心。印度政府宣布了一項(xiàng) 12.5 億美元的計(jì)劃,名為「IndiaAI Mission」。通過該計(jì)劃,印度將在全國(guó)范圍內(nèi)為創(chuàng)新者、初創(chuàng)企業(yè)、學(xué)生和教育機(jī)構(gòu)提供便捷的計(jì)算能力。
這樣的競(jìng)賽讓英偉達(dá)芯片供不應(yīng)求。當(dāng)?shù)貢r(shí)間 6 月 18 日,英偉達(dá)盤中股價(jià)上漲 3.2%,推升該公司市值達(dá)到 3.33 萬(wàn)億美元,市值超越微軟。Arm 創(chuàng)始人的擔(dān)心似乎正在成真。
英偉達(dá)產(chǎn)品在 AI 領(lǐng)域的廣泛使用成為美國(guó) AI 行業(yè)發(fā)展的重要優(yōu)勢(shì)。即使全球都在進(jìn)行 AI 投資,美國(guó) AI 投資規(guī)模依舊領(lǐng)先于非美國(guó)地區(qū)的投融資規(guī)模。
數(shù)據(jù)來源:PitchBook
當(dāng)然,英偉達(dá)只是美國(guó)人工智能,特別是大語(yǔ)言模型產(chǎn)業(yè)優(yōu)勢(shì)的一部分?;谟⒄Z(yǔ)數(shù)據(jù)庫(kù)的模型訓(xùn)練,讓其他語(yǔ)言的用戶在進(jìn)入 LLM 市場(chǎng)時(shí),面對(duì)天然的壁壘。
外國(guó)大型語(yǔ)言模型在處理當(dāng)?shù)卣Z(yǔ)言新詞時(shí)往往面臨理解上的困難。以中文為例,盡管 ChatGPT 等模型能夠識(shí)別包括中文在內(nèi)的多種語(yǔ)言,但由于其訓(xùn)練數(shù)據(jù)主要基于英文文本,因此在處理非英語(yǔ)語(yǔ)言時(shí),可能會(huì)遭遇語(yǔ)言結(jié)構(gòu)、語(yǔ)法等方面的挑戰(zhàn),從而影響其輸出效果。近日,一篇論文指出,相較于直接使用非英文語(yǔ)言作為提示詞,將非英文語(yǔ)言先翻譯成英文再進(jìn)行處理的輸出效果更佳。
此外,值得注意的是,中文與英文在訓(xùn)練與推理方面存在顯著的「不公平性」。由于中文語(yǔ)言的復(fù)雜性,AI 模型在運(yùn)用中文數(shù)據(jù)進(jìn)行準(zhǔn)確訓(xùn)練和推理時(shí)可能會(huì)遭遇挑戰(zhàn),并且增加了中文模型應(yīng)用和維護(hù)的難度。同時(shí),對(duì)于開發(fā)大模型的公司來說,構(gòu)建中文大模型由于需要額外的資源,或許就得承擔(dān)更大的成本。
具體而言,中文的 token 數(shù)通常比英文多出兩倍以上,這主要源于中文詞匯的豐富含義和靈活的語(yǔ)言組成。中文詞匯常常具有深厚的文化內(nèi)涵和豐富的語(yǔ)境意義,這極大地增加了語(yǔ)言的歧義性和處理難度。相比之下,英語(yǔ)的語(yǔ)法結(jié)構(gòu)相對(duì)簡(jiǎn)單,這在一定程度上使得英語(yǔ)在某些自然語(yǔ)言處理任務(wù)中相較于中文更易于被理解和處理。而 token 數(shù)量就是成本,畢竟使用 OpenAI 的 GPT-4 模型 API,每輸入 1 千 token 至少要花費(fèi) 0.03 美元。
針對(duì)上述觀點(diǎn),有工程師指出,中文與英文在模型訓(xùn)練的基本原理上并無(wú)本質(zhì)區(qū)別。兩者均是將語(yǔ)句拆解為獨(dú)立的單詞,隨后將這些單詞納入向量數(shù)據(jù)庫(kù),并通過神經(jīng)網(wǎng)絡(luò)進(jìn)行深度學(xué)習(xí)。實(shí)際上,OpenAI 在初創(chuàng)時(shí)期亦曾面臨效果不佳的困境,最終之所以能夠取得顯著成效,主要得益于數(shù)據(jù)量的不斷積累與擴(kuò)充。
因此,無(wú)論是哪種語(yǔ)言的大模型,其訓(xùn)練的核心原理均保持一致,并不會(huì)因語(yǔ)言差異而導(dǎo)致訓(xùn)練難度的顯著變化。美國(guó)在大語(yǔ)言模型領(lǐng)域并未展現(xiàn)出特別的優(yōu)勢(shì),其之所以表現(xiàn)更為出色,主要得益于龐大的數(shù)據(jù)量。相比之下,中國(guó)在語(yǔ)料豐富性方面具備一定優(yōu)勢(shì)。然而,由于中文處理過程中涉及的 token 數(shù)量相對(duì)較多,這也導(dǎo)致了模型在運(yùn)行過程中所需的內(nèi)存和計(jì)算資源相應(yīng)增加,進(jìn)而使得成本有所上升。目前,國(guó)內(nèi)通義千問在相關(guān)領(lǐng)域表現(xiàn)優(yōu)異,這同樣得益于其擁有大量的數(shù)據(jù)支持。
盡管數(shù)據(jù)量是最重要的因素,全球各地也都在圍繞本國(guó)語(yǔ)言去發(fā)展大語(yǔ)言模型。
非英語(yǔ)大模型的進(jìn)擊
HyperClova X 背后的另一個(gè)重要?jiǎng)訖C(jī)是追求更低的計(jì)算成本。使用 LLM 的費(fèi)用通常取決于它們被要求處理的數(shù)據(jù)量,它們將這些數(shù)據(jù)分解成為標(biāo)記的單詞或字符塊。標(biāo)記越多,成本就越高。
韓國(guó)互聯(lián)網(wǎng)巨頭 Naver 正積極研發(fā)其自有的大型語(yǔ)言模型——HyperClova X,并計(jì)劃將其廣泛應(yīng)用于旗下各類服務(wù)中。此模型的引入,預(yù)計(jì)將深刻影響這個(gè)高度數(shù)字化的國(guó)家內(nèi),Naver 眾多應(yīng)用程序的運(yùn)行與體驗(yàn)。Naver 的業(yè)務(wù)范疇廣泛,涵蓋了電子商務(wù)、搜索引擎、出行服務(wù)等多個(gè)領(lǐng)域。
為確保 HyperClova X 的輸出內(nèi)容能夠充分契合韓國(guó)國(guó)內(nèi)受眾的文化背景,Naver 特別組建了一支專業(yè)的安全專家團(tuán)隊(duì)。Naver 研究主管 Kang Min Yoo 指出,韓國(guó)社會(huì)擁有豐富的新詞文化,這些新詞往往令外國(guó)大型語(yǔ)言模型難以捉摸。同時(shí),韓國(guó)民眾在對(duì)待政府調(diào)控房?jī)r(jià)等社會(huì)問題上的態(tài)度,相較于美國(guó)民眾,顯得更為支持。因此,HyperClova X 在回應(yīng)相關(guān)問題時(shí),能夠比非韓國(guó)模型更準(zhǔn)確地反映這些社會(huì)價(jià)值觀。
Kang Min Yoo 表示,大型語(yǔ)言模型在處理問題時(shí),往往會(huì)根據(jù)上下文和地理位置的不同,得出不同的答案。這也是 HyperClova X 在研發(fā)過程中需要重點(diǎn)考慮的因素之一。
當(dāng)然,追求更低的計(jì)算成本也是推動(dòng) HyperClova X 研發(fā)的重要?jiǎng)恿χ弧T谑褂么笮驼Z(yǔ)言模型時(shí),費(fèi)用通常與所需處理的數(shù)據(jù)量成正比。而數(shù)據(jù)量的多少,又直接決定了模型需要處理的標(biāo)記數(shù)量。因此,減少標(biāo)記數(shù)量,降低計(jì)算成本,成為 HyperClova X 研發(fā)過程中的一項(xiàng)重要任務(wù)。
Naver 宣稱,其模型相較于 OpenAI 的 GPT-3 含有 6,500 倍之多的韓語(yǔ)數(shù)據(jù),從而能夠?qū)㈨n語(yǔ)查詢分解為更少的標(biāo)記,進(jìn)而實(shí)現(xiàn)成本的有效降低。據(jù)對(duì)西方大型語(yǔ)言模型 LLM 的獨(dú)立分析顯示,處理非英語(yǔ)語(yǔ)言的查詢通常需要比英語(yǔ)更多的標(biāo)記。
在印度,有著類似的故事上演。人工智能初創(chuàng)公司 Sarvam AI 的創(chuàng)始人維韋克·拉加萬(wàn)(Vivek Raghavan)正在致力于構(gòu)建印地語(yǔ)專用的模型 OpenHathi,以提升其在印地語(yǔ)環(huán)境中的運(yùn)行效率。盡管印地語(yǔ)是全球使用最為廣泛的語(yǔ)言之一,但拉加萬(wàn)指出,印地語(yǔ)在 Common Crawl 這一網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)庫(kù)中所占的數(shù)據(jù)比例僅為約 0.17%。而 Common Crawl 正是許多全球最大型的人工智能公司用于訓(xùn)練其模型的重要資源。
本地 AI 模型降低成本的有效性已引起了知名投資者的廣泛關(guān)注。硅谷著名風(fēng)險(xiǎn)投資家 Vinod Khosla 透露,他通常不會(huì)投資于與 OpenAI 及其他行業(yè)領(lǐng)先者直接競(jìng)爭(zhēng)的公司,因?yàn)樗J(rèn)為新創(chuàng)公司難以在競(jìng)爭(zhēng)中占得先機(jī)。然而,他卻為 Sarvam AI 和日本初創(chuàng)公司 Sakana AI 破例,對(duì)這兩家公司進(jìn)行了投資。談及印度語(yǔ)言,Khosla 表示,基于英語(yǔ)的人工智能系統(tǒng)在處理印度語(yǔ)言時(shí)的效率往往比專門針對(duì)這些語(yǔ)言構(gòu)建的模型低三到五倍。他強(qiáng)調(diào)在印度,降低成本至關(guān)重要,使用模型的每分鐘成本必須達(dá)到最低。
歐洲的 AI 布局
在激烈的競(jìng)爭(zhēng)中,歐洲企業(yè)值得注意。要知道,如果溯源到人工智能的歷史,歐洲才是這一技術(shù)的發(fā)源地。英裔加拿大人 Geoffrey Hinton 和法國(guó)出生的 Yann LeCun,兩人被稱為「人工智能教父」。
非美國(guó)地區(qū) AI 投資規(guī)模前十案例
根據(jù)上表所呈現(xiàn)的數(shù)據(jù),歐洲在人工智能領(lǐng)域的投資規(guī)模明顯領(lǐng)先于其他地區(qū)。此外,在過去的十年中,歐洲的監(jiān)管機(jī)構(gòu)著手制定更為嚴(yán)謹(jǐn)且嚴(yán)格的基礎(chǔ)規(guī)則,旨在讓科技巨頭公司遵從其指導(dǎo)原則。歐盟及其成員國(guó),包括德國(guó)和英國(guó)在內(nèi),已經(jīng)通過了多項(xiàng)隱私法規(guī),比如 2016 年實(shí)施的《通用數(shù)據(jù)保護(hù)條例》,旨在嚴(yán)懲濫用消費(fèi)者個(gè)人數(shù)據(jù)的互聯(lián)網(wǎng)公司。
最近,歐盟更是頒布了《數(shù)字市場(chǎng)法案》,以遏制科技領(lǐng)域的「守門人」通過不正當(dāng)手段打壓規(guī)模較小的競(jìng)爭(zhēng)對(duì)手。
歐洲人工智能的初創(chuàng)企業(yè)日益增多,并逐漸吸引了硅谷投資者的關(guān)注。法國(guó)版的 OpenAI——Mistral,迄今為止已籌集了超過 10 億美元的資金,其中包括本周早些時(shí)候宣布的一輪融資,其估值據(jù)報(bào)道已達(dá)到 62 億美元。此外,法國(guó)人工智能公司 H(原名 Holistic)也從前谷歌首席執(zhí)行官埃里克·施密特以及 LVMH 首席執(zhí)行官伯納德·阿諾等業(yè)界知名人士處籌集了 2.2 億美元的資金。
但又如近現(xiàn)代西方政治、經(jīng)濟(jì)的變化一樣,美國(guó)卻再次「反超」了歐洲。這或許與歐洲文化有關(guān)。歐洲的商業(yè)文化更加側(cè)重于謹(jǐn)慎而非單純的增長(zhǎng),這種傾向可能在一定程度上導(dǎo)致歐洲在突破性技術(shù)領(lǐng)域的成功案例相較于美國(guó)有所減少。歐洲歷來不乏杰出的大學(xué)與卓越的人才,然而,這些優(yōu)秀的人才和學(xué)術(shù)資源在商業(yè)化方面并未得到充分有效地利用。
國(guó)內(nèi)方面,不久前商湯科技發(fā)布了首個(gè)粵語(yǔ)大模型 Sensechat。可以發(fā)現(xiàn) LLM 的競(jìng)爭(zhēng)已經(jīng)從硬件到軟件全面鋪開。在這場(chǎng) AI 主權(quán)的競(jìng)爭(zhēng)中,美國(guó)正在承受來自全世界的追趕。
評(píng)論