6月13日,GTIC 2023全球汽車芯片創(chuàng)新峰會將在上海國際低碳智慧出行展覽會同期舉辦,首批演講嘉賓已揭曉,歡迎報名。
![圖片](http://editerupload.eepw.com.cn/fetch/202305/1deef49bc417792a1d7d271be628cc12.png)
![圖片](http://editerupload.eepw.com.cn/fetch/202305/b2626cab774afc7b0589791c41771539.png)
黃仁勛臺北激情演講2小時:連甩7項重磅發(fā)布,想讓全球企業(yè)都用上生成式AI。作者 | ZeR0
編輯 | 漠影
芯東西5月29日消息,繼上周遠(yuǎn)超預(yù)期的財報業(yè)績預(yù)測引得股價和市值史詩級暴漲后,今日,英偉達(NVIDIA)創(chuàng)始人兼CEO黃仁勛穿著標(biāo)志性的皮衣,意氣風(fēng)發(fā)地出現(xiàn)在臺北電腦展COMPUTEX 2023上,在主題演講期間先是現(xiàn)場給自家顯卡帶貨,然后一連公布涉及加速計算和人工智能(AI)的多項進展。
面向生成式AI歷史性浪潮,英偉達的一系列發(fā)布包括:推出大內(nèi)存生成式AI超級計算機DGX GH200,可加速生成式AI設(shè)計的Grace Hopper超級芯片GH200已全面投產(chǎn),推出全新加速以太網(wǎng)平臺Spectrum-X,為游戲提供定制化AI模型代工服務(wù),與全球最大的營銷服務(wù)機構(gòu)WPP合作打造生成式AI內(nèi)容引擎,多家世界頂級電子制造商采用英偉達生成式AI工具與Omniverse平臺構(gòu)建先進的數(shù)字工廠。![圖片](http://editerupload.eepw.com.cn/fetch/202305/04319b8599ff59535fb6e913de05422f.png)
英偉達還發(fā)布了MGX服務(wù)器規(guī)范,為系統(tǒng)制造商提供快速高效構(gòu)建100多種服務(wù)器配置的模塊化參考架構(gòu)。黃仁勛說,有超過1600家生成式AI公司采用了英偉達技術(shù)。![圖片](http://editerupload.eepw.com.cn/fetch/202305/8457fba58e4a4bbf0d1f81fd5e4b2dcf.png)
目前,英偉達最新市值為9632億美元,離“萬億市值俱樂部會員”只差臨門一腳。一旦突破萬億大關(guān),英偉達將成為美股市值第五大公司、第七家市值越過1萬億美元的美國上市公司,以及第一家由華人創(chuàng)立的萬億美元市值公司。![圖片](http://editerupload.eepw.com.cn/fetch/202305/bcc17866b5e8ea5a7aaab628f98a8633.png)
01.生成式AI超算堪比“巨型GPU”:E級算力,谷歌云、Meta、微軟首批試用
首先來看下英偉達今日推出的采用英偉達最新GPU和CPU的系統(tǒng)巔峰之作——新型大內(nèi)存AI超級計算機DGX GH200。
這臺超算預(yù)計今年年底問世,旨在為生成式AI語言應(yīng)用、推薦系統(tǒng)、數(shù)據(jù)分析工作負(fù)載開發(fā)大型下一代模型。黃仁勛認(rèn)為,生成式AI、大型語言模型和推薦系統(tǒng)是現(xiàn)代經(jīng)濟的數(shù)字引擎。據(jù)他介紹,DGX GH200 AI超級計算機集成了英偉達最先進的加速計算和網(wǎng)絡(luò)技術(shù)。![圖片](http://editerupload.eepw.com.cn/fetch/202305/8839793e95af4629b9f1446bc4b9cb84.png)
DGX GH200是首款將Grace Hopper超級芯片與英偉達NVLink Switch系統(tǒng)搭配的超級計算機,通過采用新互連方式,將256個Grace Hopper超級芯片連接在一起,使它們能像單個巨型GPU一樣協(xié)同運行,從而提供了1EFLOPS的性能和144TB的共享內(nèi)存,比2020年推出的上一代DGX A100 320GB系統(tǒng)的內(nèi)存多出近500倍。
谷歌云、Meta、微軟等是首批獲得DGX GH200訪問權(quán)限、用于生成式AI工作負(fù)載的公司。英偉達也打算將DGX GH200設(shè)計藍圖提供給云服務(wù)商及其他超大規(guī)模計算廠商,以便他們可以進一步為其基礎(chǔ)設(shè)施定制DGX GH200。
此外,英偉達正在打造自己的基于DGX GH200的大型AI超級計算機NVIDIA Helios,以支持其研究和開發(fā)團隊的工作。它采用4個DGX GH200系統(tǒng),每個都將與英偉達Quantum-2 InfiniBand網(wǎng)絡(luò)連接,帶寬高達400Gb/s,以提高訓(xùn)練大型AI模型的數(shù)據(jù)吞吐量。Helios將包括1024顆Grace Hopper超級芯片,將于今年年底上線。DGX GH200超級計算機包含英偉達軟件,可為AI和數(shù)據(jù)分析工作負(fù)載提供全套解決方案。英偉達Base Command軟件提供AI工作流管理、企業(yè)級集群管理、加速計算、存儲和網(wǎng)絡(luò)基礎(chǔ)設(shè)施的庫,以及為運行AI工作負(fù)載而優(yōu)化的系統(tǒng)軟件。英偉達AI平臺的軟件層AI Enterprise提供了100多個框架、預(yù)訓(xùn)練模型和開發(fā)工具,以簡化AI生產(chǎn)的開發(fā)和部署。
02.生成式AI的引擎:GH200 Grace Hopper超級芯片全面投產(chǎn)
英偉達宣布,GH200 Grace Hopper超級芯片已全面投產(chǎn),將為運行復(fù)雜的AI和高性能計算工作負(fù)載提供動力。
基于GH200的系統(tǒng)加入了全球系統(tǒng)制造商基于英偉達最新Grace、Hopper、Ada Lovelace架構(gòu)的400多個系統(tǒng)配置。GH200 Grace Hopper超級芯片采用NVIDIA NVLink-C2C互連技術(shù),將基于Arm的英偉達Grace CPU和Hopper GPU架構(gòu)組合在同一封裝中,提供了高達900GB/s的總帶寬——比傳統(tǒng)加速系統(tǒng)中的標(biāo)準(zhǔn)PCIe Gen5通道帶寬高7倍,互連功耗降低到原來的1/5,能夠滿足苛刻的生成式AI和高性能計算(HPC)應(yīng)用。
位于歐美的幾家全球超大規(guī)模計算企業(yè)和超算中心客戶將可使用GH200驅(qū)動的系統(tǒng)。采用GH200的系統(tǒng)預(yù)計將于今年晚些時候上市。
03.推出新型加速以太網(wǎng)平臺正打造數(shù)億美元生成式AI超算
黃仁勛還宣布推出NVIDIA Spectrum-X,這是一個旨在提高基于以太網(wǎng)的AI云的性能和效率的網(wǎng)絡(luò)平臺。![圖片](http://editerupload.eepw.com.cn/fetch/202305/1490312ac1529abfce4a8c34aa79934e.png)
它基于網(wǎng)絡(luò)創(chuàng)新,將英偉達Spectrum-4以太網(wǎng)交換機與英偉達BlueField-3 DPU緊密耦合,實現(xiàn)了相比傳統(tǒng)以太網(wǎng)結(jié)構(gòu)1.7倍的整體AI性能和能效提升,并通過性能隔離增強了多租戶功能,在多租戶環(huán)境中保持一致、可預(yù)測的性能。![圖片](http://editerupload.eepw.com.cn/fetch/202305/56492d860313c325e42a76e39ef45c7b.png)
Spectrum-X具有高度通用性,可用于各種AI應(yīng)用。它使用完全基于標(biāo)準(zhǔn)的以太網(wǎng),并可與基于以太網(wǎng)的堆?;ゲ僮?。該網(wǎng)絡(luò)平臺由英偉達加速軟件和軟件開發(fā)工具包(SDK)進行增強,支持開發(fā)者構(gòu)建軟件定義的云原生AI應(yīng)用程序。端到端功能的交付減少了大規(guī)?;赥ransformer的生成式AI模型的運行時間。該平臺支持256個200Gb/s端口,通過單個交換機連接,或在兩層leaf-spine拓?fù)渲刑峁?6000個端口,以支持AI云的增長和擴展,同時保持高水平的性能并最大限度地減少網(wǎng)絡(luò)延遲。
全球領(lǐng)先的云計算提供商正在采用Spectrum-X平臺擴展生成式AI服務(wù)。Spectrum-X、Spectrum-4交換機、BlueField-3 DPU等現(xiàn)已在戴爾、聯(lián)想、超微等系統(tǒng)制造商處提供。
作為Spectrum-X參考設(shè)計的藍圖和測試平臺,英偉達正在其以色列數(shù)據(jù)中心構(gòu)建一臺超大規(guī)模生成式AI超級計算機Israel-1。這臺AI超算價值數(shù)億美元,將采用戴爾PowerEdge XE9680服務(wù)器、英偉達HGX H100超級計算平臺、內(nèi)置BlueField-3 DPU和Spectrum-4交換機的Spectrum-X平臺。
04.發(fā)布MGX服務(wù)器規(guī)范提供模塊化參考架構(gòu)
為了滿足各種規(guī)模的數(shù)據(jù)中心的需求,黃仁勛發(fā)布了NVIDIA MGX服務(wù)器規(guī)范,為系統(tǒng)制造商提供了模塊化參考架構(gòu)。系統(tǒng)制造商可使用它快速且經(jīng)濟高效地構(gòu)建100多種服務(wù)器配置,以適應(yīng)廣泛的AI、HPC及NVIDIA Omniverse應(yīng)用。
MGX支持英偉達全系列GPU、CPU、DPU和網(wǎng)絡(luò)適配器,以及各種x86及Arm處理器。其模塊化設(shè)計使系統(tǒng)制造商能夠更有效地滿足每個客戶的獨特預(yù)算、電力輸送、熱設(shè)計和機械要求。
永擎(ASRock Rack)、華碩(ASUS)、技嘉(GIGABYTE)、和碩(Pegatron)、QCT、超微(Supermicro)等將采用MGX構(gòu)建下一代加速計算機,可將開發(fā)成本削減多達3/4,并將開發(fā)時間縮短2/3至僅需6個月。有了MGX,制造商可以從為其服務(wù)器機箱加速計算優(yōu)化的基本系統(tǒng)架構(gòu)開始,然后選擇GPU、DPU和CPU。AI訓(xùn)練和5G等多項任務(wù)可以在一臺機器上處理,升級到下一代硬件也很方便。MGX還能輕松集成到云和企業(yè)數(shù)據(jù)中心中。不同于英偉達HGX,MGX提供了與英偉達產(chǎn)品靈活的多代兼容性,以確保系統(tǒng)構(gòu)建者可以重用現(xiàn)有設(shè)計并輕松采用下一代產(chǎn)品。同樣MGX也提供英偉達完整軟件堆棧的支持。QCT和超微將率先進入市場,MGX的設(shè)計將于8月面世。超微今日公布的ARS-221GL-NR系統(tǒng)將采用Grace CPU,而QCT的S74G-2U系統(tǒng)將采用Grace Hopper。黃仁勛還宣布,英偉達與日本電信巨頭軟銀合作,在日本建立一個分布式數(shù)據(jù)中心網(wǎng)絡(luò)。它將在一個共同的云平臺上提供5G服務(wù)和生成式AI應(yīng)用。![圖片](http://editerupload.eepw.com.cn/fetch/202305/ff25828ee3eee0d938a074977f911f88.png)
數(shù)據(jù)中心將在模塊化MGX系統(tǒng)中使用Grace Hopper、BlueField-3 DPU以及Spectrum以太網(wǎng)交換機,以提供5G協(xié)議所需的高精度定時。該平臺將通過提高頻譜效率來降低成本,同時降低能耗。這些系統(tǒng)有助于探索自動駕駛、AI工廠、AR/VR、計算機視覺和數(shù)字孿生等領(lǐng)域的應(yīng)用。未來的用途可能包括3D視頻會議和全息通信。
05.ACE代工服務(wù):用生成式AI激活游戲角色生命,支持云端及PC低成本部署
生成式AI將改變玩家與游戲角色間的互動方式,并極大提高游戲的沉浸感。對此,黃仁勛宣布推出面向游戲的NVIDIA Avatar云引擎(ACE)。
這是一項定制AI模型代工服務(wù),中間件、工具和游戲開發(fā)者可以使用它來構(gòu)建和部署定制的語音、對話和動畫AI模型。它能賦予非玩家角色(NPC)更智能且不斷進化的對話技能,使其能夠以栩栩如生的個性來回答玩家的問題。基于英偉達Omniverse,ACE for Games為語音、對話和角色動畫提供了優(yōu)化的AI基礎(chǔ)模型,包括:英偉達NeMo,使用專有數(shù)據(jù),構(gòu)建、定制和部署語言模型;英偉達Riva,用于自動語音識別和文本轉(zhuǎn)語音,以實現(xiàn)實時語音對話;英偉達Omniverse Audio2Face,用于即時創(chuàng)建游戲角色的表情動畫,以匹配任何語音軌道。開發(fā)人員可以集成整個NVIDIA ACE for Games解決方案,也可以只使用他們需要的組件。英偉達與專注于為虛擬游戲世界開發(fā)先進對話AI的英偉達Inception初創(chuàng)公司Convai合作,展示了如何快速用英偉達ACE for Games來構(gòu)建游戲NPU。在一款名為Kairos的演示中,玩家與拉面店的供應(yīng)商Jin互動?;谏墒紸I,Jin雖是個NPC,卻能擬真地回答自然語言問題,且回答內(nèi)容與敘述的背景故事一致。它是在虛幻引擎5中使用最新光線追蹤功能和英偉達DLSS渲染的。
支持英偉達ACE for Games的神經(jīng)網(wǎng)絡(luò)針對不同的功能進行了優(yōu)化,有不同的大小、性能和質(zhì)量折中。ACE for Games代工服務(wù)將幫助開發(fā)者為其游戲重新調(diào)整模型,然后通過英偉達DGX Cloud、GeForce RTX PC或本地部署進行實時推理。這些模型針對延遲進行了優(yōu)化,有助于優(yōu)化游戲的沉浸式交互體驗。多家游戲開發(fā)商和初創(chuàng)公司已采用英偉達的生成式AI技術(shù)。黃仁勛還介紹了英偉達和微軟如何在生成式AI時代合作推動Windows PC的創(chuàng)新。新的和增強的工具、框架和驅(qū)動程序使PC開發(fā)者更容易開發(fā)和部署AI。例如,用于優(yōu)化和部署GPU加速AI模型和新圖形驅(qū)動程序的微軟Olive工具鏈將提高帶有英偉達GPU的Windows PC上的DirectML性能。此次合作將增強和擴展搭載RTX GPU的1億臺PC的安裝基礎(chǔ),可提升400多個AI加速的Windows應(yīng)用程序和游戲的性能。
06.英偉達與WPP合作為數(shù)字廣告打造生成式AI內(nèi)容引擎
生成式AI也正為價值7000億美元的數(shù)字廣告行業(yè)帶來了新機遇?;贜VIDIA AI和Omniverse的突破性引擎將來自領(lǐng)先軟件制造商的創(chuàng)意3D和AI工具連接在一起,以大規(guī)模革新品牌內(nèi)容和體驗。全球最大的營銷服務(wù)機構(gòu)英國WPP集團正與英偉達合作,在Omniverse Cloud上構(gòu)建首個生成式AI內(nèi)容引擎,使創(chuàng)意團隊能夠更快、更高效、更大規(guī)模地制作高質(zhì)量的商業(yè)內(nèi)容,同時與客戶的品牌保持完全一致。
新引擎連接了3D設(shè)計、制造和創(chuàng)意供應(yīng)鏈工具的生態(tài)系統(tǒng),包括來自Adobe和Getty Images的工具。在演講中,黃仁勛展示了創(chuàng)意團隊如何將他們的3D設(shè)計工具連接起來,在Omniverse中構(gòu)建客戶產(chǎn)品的數(shù)字孿生。生成式AI的內(nèi)容經(jīng)過負(fù)責(zé)任的數(shù)據(jù)來源訓(xùn)練,并與英偉達Picasso一起構(gòu)建,將使其能快速生成虛擬集。然后WPP客戶可使用完整的場景生成大量廣告、視頻和3D體驗,供全球市場和用戶在任何網(wǎng)絡(luò)設(shè)備上體驗。WPP首席執(zhí)行官馬克·里德(Mark Read)說,生成式AI正以驚人的速度改變營銷世界,WPP與英偉達合作所提供的獨特競爭優(yōu)勢是當(dāng)今市場上其他客戶無法獲得的,這項新技術(shù)將改變品牌為商業(yè)用途創(chuàng)建內(nèi)容的方式,并鞏固WPP在為世界頂級品牌創(chuàng)造性應(yīng)用AI方面的行業(yè)領(lǐng)導(dǎo)者地位。
07.電子制造商采用生成式AI實現(xiàn)數(shù)字化的智能工廠
全球電子制造商正在使用一種全新的綜合參考工作流程推進其工業(yè)數(shù)字化工作,在廣泛合作伙伴網(wǎng)絡(luò)的支持下,該工作流程結(jié)合了英偉達用于生成式AI、3D協(xié)作、仿真和自主機器的技術(shù),可幫助制造商規(guī)劃、構(gòu)建、運營和優(yōu)化其工廠。這些技術(shù)包括:英偉達Omniverse,它連接了頂級計算機輔助設(shè)計應(yīng)用以及生成式AI的API和前沿框架;用于模擬和測試機器人的英偉達Isaac Sim應(yīng)用程序;英偉達Metropolis視覺AI框架,用于自動光學(xué)檢測。“世界上最大的工業(yè)生產(chǎn)物理產(chǎn)品。先用數(shù)字化構(gòu)建它們可節(jié)省大量成本?!彼劦?,英偉達使電子制造商能輕松構(gòu)建和運營虛擬工廠,將其制造和檢驗工作流程數(shù)字化,并大大提高質(zhì)量和安全,減少代價高昂的最后一刻意外和延誤。黃仁勛現(xiàn)場展示了一個完全數(shù)字化的智能工廠的演示。
富士康工業(yè)互聯(lián)網(wǎng)、宜鼎國際、和碩、廣達和緯創(chuàng)正在使用新的參考工作流程,以優(yōu)化他們的工作單元和裝配線運營,同時降低生產(chǎn)成本,具體用例包括電路板質(zhì)保檢測點自動化、光學(xué)檢測自動化、建設(shè)虛擬工廠、模擬協(xié)作機器人、構(gòu)建及運營數(shù)字孿生等。英偉達正在與幾家領(lǐng)先的制造工具和服務(wù)提供商合作,構(gòu)建一個全棧、單一的架構(gòu),每個架構(gòu)都適用于每個工作流程級別。在系統(tǒng)層面,英偉達IGX Orin提供了一個一體化的邊緣AI平臺,將工業(yè)級硬件與企業(yè)級軟件和支持相結(jié)合。IGX滿足邊緣計算獨特的耐用性和低功耗要求,同時提供開發(fā)和運行AI應(yīng)用程序所需的高性能。其制造商合作伙伴們正在開發(fā)IGX驅(qū)動的系統(tǒng),以服務(wù)于工業(yè)和醫(yī)療市場。在平臺層面,Omniverse連接了世界領(lǐng)先的3D、模擬和生成式AI提供商。團隊可在他們最喜歡的應(yīng)用程序之間構(gòu)建互操作性,比如來自Adobe、Autodesk和Siemens的應(yīng)用程序。
08.結(jié)語:生成式AI正催生大量加速計算需求
生成式AI等變革性技術(shù)正滲透到消費者的生活方式中,并在醫(yī)療、金融、商業(yè)服務(wù)等許多行業(yè)催生新的商機,隨著越來越多企業(yè)加入AI競爭,數(shù)據(jù)中心性能正邁向下一個階段。訓(xùn)練AI大模型是一項資源和時間密集型任務(wù),需要強大、綠色、可擴展的基礎(chǔ)設(shè)施,以滿足不斷增長的加速計算能力、減少碳排放、控制成本等多方面的需求。
英偉達今日發(fā)布的一系列硬件基礎(chǔ)設(shè)施及軟件工具,目的性非常明確地圍繞企業(yè)開發(fā)和部署生成式AI應(yīng)用的核心痛點,通過先進互連技術(shù)和共享內(nèi)存設(shè)計突破大規(guī)模AI的算力瓶頸,提供更快的計算性能、更高的能效以及加速開發(fā)流程的工具。這將幫助企業(yè)及研究機構(gòu)節(jié)省大量時間和成本,將生成式AI用于解決科研挑戰(zhàn)、優(yōu)化工作流程和增強商業(yè)競爭力。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。