英偉達,用AI掀翻光追游戲天花板
編輯 | 漠影
本周三,游戲顯卡的“新天花板”——GeForce RTX 40系列GPU——就要正式上市了。自9月中旬正式發(fā)布后,英偉達RTX 40系列GPU帶來的性能提升一直備受關(guān)注。隨著近段時間相應(yīng)測評成績陸續(xù)出爐,相信這個被稱作“游戲玩家和創(chuàng)作者終極平臺”的全新顯卡系列,在性能提升上給很多玩家留下了深刻印象。刨去圍繞價格和功耗的爭議,如今RTX 4090已成當(dāng)之無愧的新晉“卡皇”,論空前的算力、論堆滿的前沿技術(shù),都做到了全面壓制同行競品:現(xiàn)代游戲性能相較上一代RTX 3090 Ti提升最高達2倍,光線追蹤游戲性能的提升最高達4倍。就連次旗艦RTX 4080,也實現(xiàn)了比上一代旗艦顯卡RTX 3090 Ti更高的性能。用英偉達創(chuàng)始人兼CEO黃仁勛的話說,以前要花2000美元買到的性能,現(xiàn)在只用900美元就能買到。有趣的是,這次RTX 40系列GPU實現(xiàn)性能、性價比飆漲的核心功臣,是英偉達近年來引以為傲的人工智能(AI)技術(shù)。以往,AI更多是英偉達數(shù)據(jù)中心產(chǎn)品線的主角,為何在主攻游戲的消費級領(lǐng)域也開始凸顯AI的作用?在這背后,英偉達的雄心宏圖,已經(jīng)透過游戲,布向更廣闊的潛在AI應(yīng)用未來。
01.幀率更高,AI補幀成“殺招”
如果幀率提不上去,那就相當(dāng)于裸眼看3D畫面PPT切換,視效再震撼,也會卡頓到令人失去耐心。英偉達新推出的DLSS 3技術(shù),便是為了“補幀”而生。DLSS 3直接做到“無中生有”,通過增加開創(chuàng)性的光學(xué)多幀生成技術(shù),讓AI實時“腦補”出全新的完整高質(zhì)量畫面,實現(xiàn)幀率翻倍。英偉達測試顯示,在《賽博朋克:2077》這款經(jīng)典的現(xiàn)代光線追蹤游戲的overdrive模式、4K分辨率下,開啟光線追蹤時,如果同時開啟DLSS 3可使幀率達到100FPS。
由于DLSS生成幀在GPU上作為后處理執(zhí)行,即便游戲受CPU性能限制,比如《微軟飛行模擬》等物理計算密集型或大型場景游戲,DLSS 3也能讓RTX 40系列GPU實現(xiàn)高達2倍于CPU可計算的性能來渲染游戲。
02.摩爾定律"續(xù)航"不夠,還得AI來接班
▲英偉達創(chuàng)始人兼CEO黃仁勛
以RTX GPU為例,從RTX 30系列到RTX 40系列,芯片制程工藝從三星8N工藝升級到更先進的臺積電4N工藝,但據(jù)黃仁勛透露,這一升級只帶給RTX 40系列約15%的性能提升,其余的性能提升來自像DLSS 3、Tensor Core、著色器執(zhí)行重排序(SER)這樣的研發(fā)創(chuàng)新。實現(xiàn)這些技術(shù)組合的關(guān)鍵杠桿,便是AI。DLSS 3包括3個組件:深度學(xué)習(xí)超級分辨率(也就是之前的DLSS 2)、深度學(xué)習(xí)幀生成(就是DLSS 3中新加入的插幀)和降低PC延遲的Reflex。其中,英偉達新一代Ada架構(gòu)內(nèi)置的光流加速器是支持實現(xiàn)DLSS 3的硬件核心之一,它能分析兩幀連續(xù)的游戲圖像,并為神經(jīng)網(wǎng)絡(luò)提供像素級幀到幀中物體和元素的運動方向和速度信息,知道在物體移動時應(yīng)該如何正確地渲染光照和陰影。另一個關(guān)鍵的架構(gòu)創(chuàng)新,是Ada架構(gòu)中擅長做矩陣運算的Tensor Core,它為加速AI計算提供了硬件基礎(chǔ)。英偉達稱RTX 40系顯卡中升級的第四代Tensor Core,新增了Hopper FP8 Transformer Engine,F(xiàn)P8處理性能高達1.4Petaflops,超過上一代顯卡的5倍。DLSS超級分辨率技術(shù)用AI構(gòu)建分辨率更高的圖像幀。綜合游戲中的一對超分圖像幀、運動矢量、光流場信息后,將所有信息輸入到英偉達已經(jīng)訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)AI幀生成器,經(jīng)計算分析,AI幀生成器便可準(zhǔn)確重建幾何圖形和效果,高效渲染生成出全新的高質(zhì)量游戲幀。將DLSS生成的全新幀與DLSS超級分辨率幀相結(jié)合,就能用AI計算重建連續(xù)兩幀中高達7/8的像素,生成全新的高分辨率幀,然后將其插入到正常的游戲畫面之間。與沒有DLSS相比,DLSS 3能將游戲性能提升4倍。考慮到插幀會帶來額外的延遲,英偉達還引入了Reflex低延遲技術(shù),通過讓GPU和CPU同步,消除GPU渲染隊列中的無用幀,來確保最佳響應(yīng)速度。雖說多幀生成技術(shù)靠“腦補”,并非傳統(tǒng)渲染那樣從建模貼圖到光照信息進行一系列的暴力計算,但因為有AI這一大殺器,插幀的效果足以亂真。最終,影響游戲體驗的三要素:流暢度、響應(yīng)速度、畫質(zhì),全部得到保證。《逆水寒》《黑神話:悟空》《賽博朋克2077》等超過35款游戲已經(jīng)宣布即將支持DLSS 3,可以由RTX 40系列顯卡上的特定硬件加速提供支持,實現(xiàn)更絲滑的補幀效果。回想最初DLSS推出時,游戲和應(yīng)用開發(fā)商的集成速度并不快。為了推進DLSS 3的迅速普及,英偉達還在4月推出了Streamline開源開發(fā)插件,使開發(fā)者可以很容易地以模塊化的方式在游戲中添加各種新技術(shù),顯著降低了新技術(shù)集成的難度。應(yīng)用的門檻降低了,就會有越來越多的游戲開發(fā)商選擇迅速擁抱新技術(shù)。可以看到,AI技術(shù)已經(jīng)跟英偉達的另一個“金字招牌”——硬件加速的實時光線追蹤——形成互補,進一步拉大英偉達旗艦級顯卡在領(lǐng)先性能上與其他顯卡之間的差距。03.AI超級采樣+實時光追,敲開渲染創(chuàng)新之門
英偉達也在著力降低開發(fā)光追游戲的門檻,同時對那些受人歡迎的老游戲,提供了RTX化的可能。比如它為游戲MOD打造了一款A(yù)I工具RTX Remix,以便將老游戲快速光追化。
開發(fā)者可以用其AI輔助工具來提升紋理、素材的分辨率,或者把材質(zhì)轉(zhuǎn)換為具有精確物理屬性的材質(zhì),同時呈現(xiàn)出逼真的光影效果,讓游戲質(zhì)感煥然一新。
隨著更多游戲可以快速通過RTX Remix被“RTX化”,英偉達所看好的光追游戲市場,有望得到加速開拓。04.結(jié)語:不要低估英偉達
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。
全息投影相關(guān)文章:全息投影原理