AMD四核處理器巴塞羅那的深度分析
——
四年以后,塵埃終于落定,AMD在其為工作站和服務(wù)器設(shè)計的四核CPU中首次實現(xiàn)了K10微架構(gòu)。不出所料,首次發(fā)布的是2GHz和1.9GHz版產(chǎn)品,2.5G將在“11月推出”。
AMD想要戰(zhàn)勝Intel的地方其實概括起來只有三個詞:
1. Front
2. Side
3. Bus
每一個核都可以單獨鐘控(AMD的術(shù)語:獨立動態(tài)核技術(shù))。每一個核都可以選擇性的將無需工作的部分進行門控時鐘處理以節(jié)省功耗(Coolcore技術(shù))。核和內(nèi)存控制器有兩個獨立的電源層(雙動態(tài)電源管理)。
每個核專門配備128Kbytes的一級緩存,512Kbyte的二級緩存。四個核共享2Mbytes的三級緩存。
高效交叉開關(guān)使得四核都可存取兩個72位寬的DDR2-667內(nèi)存控制器,通過HyperTransport 2.0鏈路可以與其他CPU交互。
當(dāng)比較AMD與Intel雙核和四核結(jié)構(gòu)時,我的重心在前端總線(FSB)上
。Intel CPU(還)不是單管芯的四核設(shè)計,相反,它們將兩個雙核堆疊在一個封裝中;它的管芯內(nèi)不含有內(nèi)存控制器,相反,DRAM控制器由獨立的核邏輯芯片組-北橋芯片提供;而且它們沒有專用的CPU間互連通道(至少一年內(nèi)不會有)。 這一切意味著Intel用來連接管芯與管芯之間,CPU與CPU之間以及CPU與芯片組之間的FSB會承載很多對時序敏感的關(guān)鍵數(shù)據(jù)。表面上看,這些特性會讓Intel處于劣勢,但是,考慮以下幾點:
Xeon CPU的每一個雙核管芯都有兩個64Kbyte的一級緩存陣列(一對一),再加上4Mbyte的共享二級緩存,沒有三級緩存。與巴塞羅那比較一下緩存的大小和類型,特別是一級對一級,二級對二級(注意一級緩存性能通常優(yōu)于二級,二級快于三級)。
Xeon5300系列FSB有1066MHz和1333MHz兩種,而至今Xeon 7300系列只提供了1066MHz的FSB。AMD最新四核Opteron產(chǎn)品線和之前基于K8微結(jié)構(gòu)的雙核處理器還另有兩個特征:
芯片的虛擬化支持經(jīng)擴展后包含有硬件的虛擬-物理地址轉(zhuǎn)換加速器,而之前是速度較慢的軟件轉(zhuǎn)換;
AMD加強了每個核的浮點能力,從單指令64比特的FPU升級為雙指令128bit的FPU。
首先看虛擬化,注意AMD用先前的3GHz雙核CPU與2GHz的四核進行benchmark對比。雖然這并不反映芯片或制程的一個基本問題,但它還是反映出AMD期望四核的后續(xù)產(chǎn)品不僅能夠從芯片的管腳角度還可以從功耗和熱輻射方面做到直接替代。不考慮時鐘速度的不同,考慮到新的芯片具有增強的虛擬化硬件異常分支指令和兩倍的CPU核數(shù)量,在這樣的條件下79%的虛擬化性能提升并不算出人意料。
Intel有NetBurst-to-Core微架構(gòu),AMD也試圖改善功耗,但目前我還沒有ACP的對比數(shù)據(jù)。在比較AMD與Intel的功耗時,要記得Opteron內(nèi)含DRAM控制器,而Intel的Xeon沒有。AMD也繼續(xù)使用DDR2 SDRAM,而Intel采用Rambus-reminiscent串行接口方案FB-DIMM。有報告稱在系統(tǒng)空閑或低負荷時,F(xiàn)B-DIMM比DDR2 SDRAM功耗高,而在系統(tǒng)高負荷時,F(xiàn)B-DIMM在每瓦性能和總功耗方面比較有吸引力。
對比一下AMD先后送給我的兩個文檔可以有以下發(fā)現(xiàn):
AMD也玩Intel和其OEM伙伴Apple之間的“速度”游戲。"_rate"版的SPECint (整數(shù))和SPECfp (浮點)按照系統(tǒng)中的CPU數(shù)目并行跑多個Benchmark程序,在AMD與AMD的SPECint比較中,雖然四核CPU主頻有33%的降低,但四核是雙核核心的雙倍,所以50%的性能提升是再正常不過的。
AMD沒有就SPECint做與Intel的比較,重心相應(yīng)放在了SPECfp和其它浮點相關(guān)的測試。這反應(yīng)出AMD在K8向K10的演進中將重心部分放在了每核的FPU上。
不出所料AMD做了很多核到核、CPU到CPU以及CPU到內(nèi)存的Benchmark測試,以此來對比競爭對手Intel的共享FSB。
在其中一份文檔中AMD做了其高端2GHz CPU與Intel 2.33GHz處理器的Benchmark對比,注意這款I(lǐng)ntel產(chǎn)品并不是Xeon 53xx系列最高端的產(chǎn)品。
有些人已經(jīng)拿到了基于四核Opteron的系統(tǒng),雖然簡短的測試不能說明什么問題,我還是在一些測評中發(fā)現(xiàn)了些問題:
四核可相互利用對方二級緩存和共享三級緩存在目前的測試中并沒有比需要FSB交互的Intel Xeon系列在性能上有明顯優(yōu)勢。部分上這與AMD三級緩存太長導(dǎo)致的延時有關(guān)。Intel的總緩存帶寬好像也超過了AMD的三級緩存方案。
Intel在整型數(shù)性能上似乎還保有優(yōu)勢,同時,AMD加強的FPU在浮點數(shù)性能上也沒有達到我和其他人的預(yù)期;
AMD不再依賴共享的FSB,交叉開關(guān)模式和集成的DRAM控制器以及低延時(與FB-DIMM)的DDR2 SDRAM的使用都使得Opteron在“流”類型數(shù)據(jù)處理上很有優(yōu)勢,因為它們需要不斷讀取系統(tǒng)主內(nèi)存。
AMD值得懷疑的四核Opteron性能,加上其競爭性的定價,這都是我長久以來對AMD長期財務(wù)健康擔(dān)心的緣由。
在Intel的大幅降價下,我想AMD會占據(jù)中等的市場規(guī)模。理想情況下,新結(jié)構(gòu)的發(fā)布都會有一個較高的定價,代表著新芯片的附加值和其前期的低產(chǎn)量。但不幸的是,同Intel已經(jīng)推出9個月的CPU相比,AMD沒能提升價格,這樣的話四核可以盈利嗎?
現(xiàn)在我對AMD接下來幾個月的舉動比較感興趣:
AMD會以怎樣的速度開始2GHz產(chǎn)品的鋪貨;
AMD多久可以推出2. 5G以及更高速率的產(chǎn)品;
還會有哪些深層的測試;
AMD多久可以推出針對消費類市場的k10微架構(gòu)
評論