英特爾推進全新架構(gòu),面向數(shù)據(jù)中心、HPC-AI和客戶端計算
英特爾推出兩大x86 CPU內(nèi)核、兩大數(shù)據(jù)中心SoC、兩款獨立GPU,以及變革性的客戶端多核性能混合架構(gòu)
本文引用地址:http://www.biyoush.com/article/202108/427733.htm本文作者:Raja M.Koduri
英特爾公司高級副總裁兼加速計算系統(tǒng)和圖形事業(yè)部總經(jīng)理
架構(gòu)是硬件和軟件的“煉金術(shù)”。它融合特定計算引擎所需的先進晶體管,通過領(lǐng)先的封裝技術(shù)將它們連接,集成高帶寬和低功耗緩存,在封裝中為混合計算集群配備高容量、高帶寬內(nèi)存和低時延、可擴展互連,并確保所有軟件無縫地加速。披露面向新產(chǎn)品的架構(gòu)創(chuàng)新,是英特爾架構(gòu)師在每年架構(gòu)日上的期許,今年舉辦的第三屆英特爾架構(gòu)日令人十分興奮。
今天,我們公布了英特爾?架構(gòu)在近年來重大的改變和創(chuàng)新。這包括:第一次深入介紹了英特爾首個性能混合架構(gòu)Alder Lake,其搭載兩款新一代x86內(nèi)核以及智能英特爾?硬件線程調(diào)度器;英特爾全新引領(lǐng)行業(yè)標準的數(shù)據(jù)中心架構(gòu)Sapphire Rapids,其搭載全新的性能核以及多種加速器引擎;英特爾全新的獨立游戲圖形處理器(GPU)架構(gòu);英特爾全新的基礎設施處理器(IPU)以及超凡的數(shù)據(jù)中心GPU架構(gòu)Ponte Vecchio,其具備英特爾迄今為止最高的計算密度。
架構(gòu)突破為英特爾的下一波領(lǐng)先產(chǎn)品奠定基礎,率先推出的是Alder Lake。隨著從臺式機到數(shù)據(jù)中心的工作負載愈發(fā)龐大、愈發(fā)復雜、愈發(fā)多樣,我們在架構(gòu)日上展示的突破展現(xiàn)了架構(gòu)將如何滿足對更高計算性能的需求。
架構(gòu)師們奮力而行,結(jié)合英特爾獨特、豐富的標量、矢量、矩陣和空間計算引擎,打造混合計算架構(gòu),為客戶的高需求工作負載提供非線性處理能力。
我為大家概述如下:
能效核:一個高度可擴展的x86微架構(gòu),它能滿足客戶從低功耗移動應用到多核微服務的全方位計算需求。對比英特爾迄今為止最多產(chǎn)的CPU微架構(gòu)——Skylake,能效核可在相同功耗下提升40%的單線程性能,或者在提供同樣性能時,功耗僅為Skylake的40%不到。1就吞吐量性能而言,與運行四個線程的兩個Skylake內(nèi)核相比,四個能效核在性能提升80%的同時功耗更低,或者在提供相同吞吐量性能時,功耗降低80%。1
性能核:它不僅是英特爾迄今為止性能最高的CPU內(nèi)核,而且在CPU架構(gòu)性能方面實現(xiàn)階梯式提升,推動未來十年的計算發(fā)展。它是一個更寬、更深、更智能的架構(gòu),展現(xiàn)出更高的并行性,提高執(zhí)行并行性,降低時延,提升通用性能。它還幫助支持大數(shù)據(jù)集和大型代碼體積的應用程序。與第11代酷睿架構(gòu)(Cypress Cove內(nèi)核)相比,相同頻率下,性能核在一系列工作負載上平均提升了約19%。1
針對數(shù)據(jù)中心處理器和機器學習的發(fā)展趨勢,性能核提供了專用硬件,包括新的英特爾高級矩陣擴展(AMX)來執(zhí)行矩陣乘法運算,以獲得數(shù)量級的性能——AI加速提升約8倍。這是為軟件易用性而設計,利用了x86編程模型。
英特爾硬件線程調(diào)度器:這是英特爾開發(fā)的獨特調(diào)度方法,旨在確保將能效核和性能核無縫銜接在一起,從開始就動態(tài)、智能地分配工作負載,從而優(yōu)化系統(tǒng)以在真實場景中實現(xiàn)更高的性能和效率。智能直接置于內(nèi)核,英特爾硬件線程調(diào)度器與操作系統(tǒng)無縫配合,在合適的時間把合適的線程分配給合適的內(nèi)核。
Alder Lake:它重構(gòu)了多核架構(gòu),是英特爾首個搭載全新英特爾硬件線程調(diào)度器的性能混合架構(gòu)。它是英特爾最智能的客戶端SoC架構(gòu),結(jié)合了能效核和性能核,適用于從移動端到臺式機的產(chǎn)品,并通過多種業(yè)界領(lǐng)先的I/O和內(nèi)存而引領(lǐng)行業(yè)變革?;贏lder Lake的產(chǎn)品將在今年開始出貨。
Xe HPG和Alchemist SoC:一款全新的獨立顯卡微架構(gòu),專為游戲和創(chuàng)作工作負載提供發(fā)燒友級別的性能。Xe HPG微架構(gòu)采用新的Xe內(nèi)核,聚焦計算、可編程、可擴展,并全面支持DirectX 12 Ultimate。Xe內(nèi)核中的全新矩陣引擎(Xe Matrix eXtensions,XMX)能夠加速AI工作負載,比如XeSS,是一項全新升頻技術(shù)(upscaling technology),可以實現(xiàn)高性能、高保真游戲體驗。基于Xe HPG的Alchemist SoC(之前代號為DG2)將于2022年第一季度上市,并采用新的品牌名英特爾?銳炫?。
Sapphire Rapids:它結(jié)合了英特爾的性能核與全新加速器引擎,樹立了下一代數(shù)據(jù)中心處理器的標準。Sapphire Rapids的核心是一個模塊化的分區(qū)SoC架構(gòu),得益于英特爾的EMIB多晶片互連封裝技術(shù)和先進網(wǎng)格架構(gòu),它具有顯著的可擴展性,同時仍保持單晶片CPU接口的優(yōu)勢。
基礎設施處理器(IPU):Mount Evans是英特爾首款專用ASIC IPU,以及全新的基于FPGA的IPU參考平臺——Oak Springs Canyon。通過基于英特爾IPU的架構(gòu),云服務提供商(CSPs)可以通過把基礎設施任務從CPU轉(zhuǎn)移到IPU,從而讓數(shù)據(jù)中心收益更大化。把基礎設施任務轉(zhuǎn)移到IPU,能夠讓云服務提供商(CSPs)可以把所有的服務器CPU租給客戶。
Xe HPC,Ponte Vecchio:Ponte Vecchio是英特爾迄今為止最復雜的SoC,也是我們踐行IDM 2.0戰(zhàn)略的絕佳示例,它采用多種先進的半導體制程工藝、英特爾變革性的EMIB技術(shù)以及Foveros 3D封裝技術(shù)。這是我們實現(xiàn)堪比登月難度創(chuàng)新后的一款產(chǎn)品,它包含1000億個晶體管,提供業(yè)界領(lǐng)先的浮點運算和計算密度,以加速人工智能、高性能計算和高級分析工作負載。在架構(gòu)日上,英特爾展示了早期的Ponte Vecchio芯片就已經(jīng)顯示出領(lǐng)先的性能,在一個流行的AI基準測試上創(chuàng)造了推理和訓練吞吐量的行業(yè)紀錄。1我們的A0芯片已經(jīng)實現(xiàn)了超過每秒45萬億次浮點運算的FP32吞吐量,超過5 TBps的持續(xù)內(nèi)存結(jié)構(gòu)帶寬以及超過2 TBps的連接帶寬。如Xe架構(gòu)一樣,Ponte Vecchio將由oneAPI支持,后者是英特爾一個開放、基于標準、跨架構(gòu)、跨供應商的統(tǒng)一軟件堆棧。
回望過去一年,科技處于所有人如何溝通、工作、娛樂和應對新冠肺炎疫情的核心。事實證明,強大的計算能力至關(guān)重要。展望未來,我們面臨龐大的算力需求,預計到2025年將是1000x(千倍級)的提升,而四年內(nèi)增加1,000倍相當于摩爾定律的5次方。
英特爾CEO帕特·基辛格也是一位架構(gòu)師,他說:“我們面臨艱巨的計算挑戰(zhàn),一定要通過變革性的架構(gòu)和平臺來解決……正是英特爾才華橫溢的架構(gòu)師和工程師們,讓這些技術(shù)‘魔法’得以成真?!?/p>
世界正依賴架構(gòu)師和工程師來解決艱巨無比的計算問題,以造福人類。這就是為什么我們的戰(zhàn)略和執(zhí)行不斷加速以滿足所需。我們疾步前行。
更新信息請訪問:英特爾架構(gòu)日2021
1工作負載和配置見www.intel.com/ArchDay21claims.
本新聞稿中涉及與未來計劃和預期的相關(guān)聲明屬于前瞻性聲明。這些聲明是基于當前的預期,涉及許多可能導致實際結(jié)果存在重大差異的風險和不確定性。關(guān)于可能導致實際結(jié)果出現(xiàn)實質(zhì)性差異的因素的更多信息,請參見英特爾最新財報和美國證券交易委員會網(wǎng)站www.intc.com。
英特爾所使用的代號表示正在開發(fā)和沒有公開上市的產(chǎn)品、技術(shù)或服務。這些代號不是“商用”名稱,并不用作商標。
評論