是的,你可能擁有太多的CPU核心 - Ampere的192核芯片在ARM64 Linux內(nèi)核中引發(fā)問題,公司請(qǐng)求提高核心數(shù)量支持
Ampere公司推出的新型AmpereOne數(shù)據(jù)中心CPU擁有高達(dá)192個(gè)核心,但這么多核心引發(fā)了與Linux支持相關(guān)的一些困擾。據(jù)Phoronix報(bào)道,Ampere的新CPU核心數(shù)量太多,以至于當(dāng)在單個(gè)服務(wù)器中安裝了兩個(gè)Ampere的192核芯片(總共384個(gè)核心)時(shí),Linux不支持這些系統(tǒng)。目前,ARM64 Linux內(nèi)核僅支持256個(gè)核心或更少的系統(tǒng)。為了解決這個(gè)問題,Ampere提交了一個(gè)補(bǔ)丁,建議將Linux內(nèi)核核心限制提高到512,使用一種稱為“CPUMASK_OFFSTACK”的方法。
本文引用地址:http://www.biyoush.com/article/202312/453490.htm這種方法允許Linux通過從內(nèi)存中分配用于CPU掩碼的空位圖來覆蓋當(dāng)前Linux內(nèi)核的默認(rèn)256核心限制。這意味著可以提高Linux核心限制,而不會(huì)增加內(nèi)核鏡像的內(nèi)存占用,因?yàn)槊總€(gè)核心都會(huì)向內(nèi)核鏡像大小添加8KB。
Ampere的新CPU擁有迄今為止我們見過的最多的CPU核心數(shù)量。即使是AMD最新的Zen 4c EPYC CPU也無法達(dá)到這一點(diǎn),最高核心數(shù)的芯片也只有128個(gè) ——兩個(gè)芯片將達(dá)到限制,但不會(huì)超過限制。這解釋了為什么Ampere是第一家在ARM64 Linux的256核心限制方面遇到嚴(yán)重問題的CPU制造商。值得慶幸的是,這不會(huì)影響只配備單個(gè)192核AmpereOne芯片的系統(tǒng),但對(duì)于配備兩個(gè)這些芯片的雙插槽配置的數(shù)據(jù)中心服務(wù)器來說,這是一個(gè)嚴(yán)重的問題(然而,在各種系統(tǒng)上,SMT邏輯核心,即線程,也遠(yuǎn)遠(yuǎn)超過256)。
AmpereOne是Ampere推出的新CPU系列,擁有136、144、160、176和192核心型號(hào),核心數(shù)量之多令人瞠目。這些芯片采用ARMv8.6+指令集和TSMC的5納米制程,具有雙128位矢量單元、每核2MB的L2緩存、3 GHz時(shí)鐘速度、八通道DDR5內(nèi)存控制器、128條PCIe Gen 5通道,以及200-350W的熱設(shè)計(jì)功耗(TDP)。這些芯片專為能夠利用龐大核心數(shù)量的高性能數(shù)據(jù)中心工作負(fù)載而設(shè)計(jì)。
據(jù)Phoronix稱,在將核心數(shù)限制提高到512之前可能需要一段時(shí)間。早在2021年,曾提交了一個(gè)補(bǔ)丁,建議將ARM64 CPU核心限制增加到512,但當(dāng)時(shí)Linux維護(hù)人員拒絕了這個(gè)提議,因?yàn)楫?dāng)時(shí)還沒有可用于超過256個(gè)核心的CPU硬件。最樂觀的估計(jì)是,512核心支持將在2024年Linux內(nèi)核版本6.8發(fā)布時(shí)才可用。
然而,這個(gè)時(shí)間表只考慮了以正常方式添加512核心支持,而沒有利用CPU掩碼堆棧外方法。從技術(shù)上講,即將過時(shí)的Linux內(nèi)核已經(jīng)支持通過CPU掩碼堆棧外方法增加CPU核心計(jì)數(shù)限制,因此只是由Linux維護(hù)人員默認(rèn)啟用這個(gè)功能。
評(píng)論