在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<menu id="6qfwx"><li id="6qfwx"></li></menu>
    1. <menu id="6qfwx"><dl id="6qfwx"></dl></menu>

      <label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>
        1. <center id="6qfwx"><dl id="6qfwx"></dl></center>

            新聞中心

            EEPW首頁 > 網(wǎng)絡與存儲 > 新品快遞 > 美光 DDR5 內(nèi)存配合第四代 AMD EPYC 處理器,提升高性能計算工作負載

            美光 DDR5 內(nèi)存配合第四代 AMD EPYC 處理器,提升高性能計算工作負載

            作者:Krishna Yalamanchi、Sudharshan Vazhkudai (美光) 時間:2022-12-19 來源:電子產(chǎn)品世界 收藏

            AMD聯(lián)手為客戶及數(shù)據(jù)中心平臺提供一流的用戶體驗。雙方在奧斯汀建立聯(lián)合服務器實驗室,以減少服務器內(nèi)存驗證時間,在產(chǎn)品驗證和發(fā)布期間共同進行工作負載測試。目前適用于數(shù)據(jù)中心的 內(nèi)存和第四代 TMTM (霄龍)處理器均已出貨,我們對其進行了一些常見的高性能計算(HPC)工作負載基準測試。

            本文引用地址:http://www.biyoush.com/article/202212/441765.htm


            長期以來,超級計算機承擔著高性能計算工作負載。此類大規(guī)模的數(shù)據(jù)密集型工作負載需要運行TB 級的數(shù)據(jù)量以進行數(shù)百萬個并行操作,以解決人類世界的難題,如天氣和氣候預測;地震建模;化學、物理和生物分析等。

            隨著計算機架構的進步,此類工作負載往往托管在超大型“可橫向擴展”的高性能服務器集群中。這些服務器集群需要集合最強大的算力、架構、內(nèi)存和存儲基礎設施,以滿足關鍵工作負載對可擴展性、低延遲和高性能的需求。然而隨著服務器 CPU 的性能和吞吐量不斷增長,DDR4 無法提供足夠的內(nèi)存帶寬,來滿足不斷增長的高性能內(nèi)核。

             

            image.png

              

            為緩解這一瓶頸, 內(nèi)存與采用了Zen 4 服務器架構的第四代 處理器強強聯(lián)合,使服務器 CPU 能夠更好地匹配內(nèi)存產(chǎn)品,滿足數(shù)據(jù)密集型工作負載對性能和效率的需求。美光 內(nèi)存可幫助企業(yè)從本地和云端數(shù)據(jù)中更快獲取洞察。我們對最新的 AMD Zen 4 96 CPU和美光DDR5進行了行業(yè)內(nèi)高性能計算工作負載基準測試,所有結果均顯示性能提升了兩倍。


            美光 DDR5 搭配第四代 處理器,在STREAM 測試中實現(xiàn)內(nèi)存帶寬翻倍

            STREAM1
            是常見的基準測試工具,用于測量高性能計算機的內(nèi)存帶寬,可捕獲高性能計算系統(tǒng)的峰值內(nèi)存帶寬。

            該工作負載使用的軟件堆棧

             

            ·       Alma 9 Linux kernel 5.14

            ·       STREAM.f,2021 11 29 日發(fā)布版本

            image.png

            測試設置

            ·       DDR4 系統(tǒng)搭配第三代 64 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2 RDIMM 內(nèi)存槽插滿,共 64GB

            ·       DDR5 系統(tǒng)搭配第四代 96 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3 RDIMM 內(nèi)存槽插滿,共 64GB

            測試結果

            ·       DDR5 系統(tǒng)每插槽內(nèi)存帶寬翻倍,達到 378 GB/s

            ·       該結果意味著客戶能運行更大規(guī)模的人工智能/機器學習 AI/ML)項目,或利用 DDR5 增加的內(nèi)存帶寬進行更多高性能計算。

             

            image.png

             

            美光 DDR5 助力天氣研究和預報 WRF4 速度提升2

            此次測試使用的高性能計算工作負載代碼針對天氣和氣候。WRF模型在一些支持高性能浮點處理、高內(nèi)存帶寬、低延遲網(wǎng)絡等傳統(tǒng)高性能計算架構中表現(xiàn)良好,測試對象為橫向分辨率為 2.5 公里的美國大陸地區(qū) CONUS)。

            該工作負載使用的軟件堆棧

            ·       Alma 9 Linux kernel 5.14?

            ·       WRF 2.3.5 & 4.3.3?

            ·       Open MPI v4.1.1

            測試設置

            ·       DDR4 系統(tǒng)搭配第三代64 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2 RDIMM 內(nèi)存槽插滿,共 64GB

            ·       DDR5 系統(tǒng)搭配第四代 96 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3 RDIMM 內(nèi)存槽插滿,共 64GB

            測試結果

            ·       美光 DDR5 搭配第四代 AMD EPYC 處理器,可實現(xiàn) 1.3567 時間步/ VS DDR4 系統(tǒng)的2.8533 時間步/

            ·       速度更快意味著可使用更大的數(shù)據(jù)庫或運行更多模型以進行天氣預測,進而改善預測的準確度。

            美光 DDR5,助力OpenFOAM5 速度提升2

            OpenFOAM
            是一種計算流體動力學(CFD)的開源高性能計算工作負載,廣泛應用于多個行業(yè),有助于縮短開發(fā)時間并降低成本。從消費類產(chǎn)品設計到航空航天設計,OpenFOAM能夠模擬不同應用中的物理互動,包括摩托車風擋湍流。在該模擬中,OpenFOAM 能夠計算摩托車和騎手周圍的穩(wěn)定氣流。OpenFOAM 能夠根據(jù)用戶指定的進程數(shù)進行負載均衡計算,以此將網(wǎng)格分解成多個部分并分配給不同的進程求解。求解完成后,再將網(wǎng)格和解重新組合為單個域。


            該工作負載使用的軟件堆棧

            ·       OpenFOAM CFD 軟件(版本8),其中摩托車網(wǎng)格尺寸為:600 x 240 x 240

            ·       Alma 9 Linux kernel 5.14?

            ·       Open MPI v4.1.1

            測試設置

            ·       DDR4 系統(tǒng)搭配第三代64 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2 RDIMM 內(nèi)存槽插滿,共 64GB

            ·       DDR5 系統(tǒng)搭配第四代 96 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3 RDIMM 內(nèi)存槽插滿,共 64GB

            測試結果


            測試結果表明美光DDR5 產(chǎn)品組合將OpenFOAM 性能提高了 2.4 倍。OpenFOAM 為五大高性能計算軟件平臺之一,擁有大型開源社區(qū)。該軟件廣泛應用于大學和研發(fā)中心,可利用高帶寬內(nèi)存和擁有密集內(nèi)核的高性能CPU,實現(xiàn)高度的并行操作。

            美光 DDR5 ,助力分子動力學6 速度提升2

            CP2K
            是一款開源量子化學工具,適用于許多應用,包括固態(tài)生物系統(tǒng)模擬。CP2K 能夠為不同的建模方法提供通用的框架。此次測試對象為水(H2O)的密度泛函理論(DFT),模擬盒子中共包含 6,144 個原子(2,048 個水分子)。

            該工作負載使用的軟件堆棧

            ·       H2O-DFT-LS.NREP4 H2O-DFT-LS

            ·       Alma 9 Linux kernel 5.14

            測試設置

            ·       DDR4 系統(tǒng)搭配第三代64 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2 RDIMM 內(nèi)存槽插滿,共 64GB

            ·       DDR5 系統(tǒng)搭配第四代 96 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3 RDIMM 內(nèi)存槽插滿,共 64GB

            測試結果
            測試結果表明美光DDR5 產(chǎn)品組合將分子動力學性能提高了2.1 倍。隨著內(nèi)核數(shù)和內(nèi)存帶寬增加,此類工作負載的性能也顯著提升。

            總結

            目前我們只針對少量高性能計算工作負載進行了測試,因此以上只是我們的初步成果。將高性能高帶寬內(nèi)存與最新的服務器處理器(如第四代 AMD EPYC 處理器)相結合,可為高性能計算客戶創(chuàng)造新的可能。我們期待更多企業(yè)數(shù)據(jù)中心和云服務商,能夠在新平臺上應用美光 DDR5 產(chǎn)品,解鎖更高的性能與能效。 

            ________________________

            我們在 STREAM 基準測試中配置了 25 億個向量的STREAM Benchmark——運行在一臺單 AMD CPU 系統(tǒng)上
            2 AMD DDR4
            系統(tǒng)為一臺 64 AMD EPYC 7763 處理器, DDR4-3200 MHz RDIMM 內(nèi)存槽插滿,共 64GB
            3 AMD DDR5
            系統(tǒng)為一臺 96 AMD EPYC 9654 處理器, DDR5-4800 MHz RDIMM 內(nèi)存槽插滿,共 64GB
            橫向分辨率為 12.5 公里CONUS WRF DDR4 系統(tǒng)上的運行時間為 929 秒,在 DDR5 系統(tǒng)上的運行時間為 287 秒(均包括存儲器的輸入/輸出時間)。該測試中 WRF 配置為 2.5 公里 CONUS,測試結果為 1.3567 時間步/ 秒, 相比之下DDR4 的運行時間為2.8533時間步/秒。
            5 
            針對 OpenFOAM,我們運行了三種變體:
            5a
            1004040 runtimes,DDR4 系統(tǒng)運行時間為 1,144 秒,DDR5 系統(tǒng)運行時間為 478
            5b
            1084646 runtimes,DDR4 系統(tǒng)運行時間為 1,633 秒,DDR5 系統(tǒng)運行時間為 698
            5c
            1305252 runtimes,DDR4 系統(tǒng)運行時間為 2,522秒,DDR5 系統(tǒng)運行時間為 1,091
            6
            分子動力學工作負載在 DDR4 系統(tǒng)上的運行時間為 2,519 秒,在 DDR5 系統(tǒng)上的運行時間為 1,242


            作者

             image.pngKrishna Yalamanchi

            Krishna 擔任美光生態(tài)系統(tǒng)高級開發(fā)經(jīng)理,專注于研發(fā) DDR5 CXL 解決方案。他曾在英特爾 IT 部門任職,領導 SAP HANA 的遷移工作,通過與SI、OEM和云服務提供商共同搭建的合作伙伴生態(tài)系統(tǒng),推出了用于SAP工作負載的第三代與第四代 Intel Xeon 處理器。

             

            image.pngSudharshan Vazhkudai

            Sudharshan S. Vazhkudai 博士擔任美光系統(tǒng)架構和工作負載分析總監(jiān)。他領導一支位于奧斯汀和印度海得拉巴的團隊,致力于研究內(nèi)存和存儲(DDR、CXL、HBM NVME)產(chǎn)品中層次結構的可組合性,并優(yōu)化與數(shù)據(jù)中心工作負載相關的系統(tǒng)架構。



            關鍵詞: 美光 DDR5 AMD EPYC

            評論


            相關推薦

            技術專區(qū)

            關閉