2016年CPU/GPU前景展望 誰會稱雄半導體業(yè)?
還有一點值得注意,不光Intel在推8核甚至10核處理器,AMD的Zen架構(gòu)多核并行能力也有提高,桌面版首發(fā)時至少是4核8線程起步,中高端會是8核16線程,而服務(wù)器/工作站出現(xiàn)16核32線程甚至32核64線程也不要驚訝。
本文引用地址:http://www.biyoush.com/article/201602/286997.htm不論是Intel的10核處理器還是AMD的16核處理器,桌面處理器在突破6核、8核之后會繼續(xù)進入10核+時代,Intel Broadwell-E在前兩代突破8核之后已經(jīng)確定有10核20線程產(chǎn)品,AMD的Zen架構(gòu)更加激進,8核16線程不是問題,是否會在桌面市場推出12核甚至16核的旗艦也令人期待。
3、PCI-E 4.0姍姍來遲,廠商自研新總線
伴隨著CPU、GPU計算性能的飛速增長,PCI-E總線也要有相應(yīng)的準備,不過最新一代PCI-E 4.0總線技術(shù)已經(jīng)推遲了,原定于2015年上半年發(fā)布最終規(guī)范,但現(xiàn)在來看PCI-E 4.0總線可能要拖到2016年甚至2017年了。
新一代總線具備更高的性能,具體來說, 目前在用的PCI-E 3.0總線速率是8GT/s,Link帶寬8Tb/s,每一通道帶寬約為1GB/s,x16通道雙向帶寬32GB/s,而PCI-E 4.0在PCI-E 3.0基礎(chǔ)上保持架構(gòu)不變,速率翻倍到16GT/s,通道帶寬提升到2GB/s,x16雙向帶寬高達64GB/s。
不過PCI-E 4.0面臨的問題也不少,除了銅介質(zhì)速率繼續(xù)提升的技術(shù)難題之外,PCI-E 4.0最大的尷尬之處在于——桌面顯卡用不到這么高的帶寬,高性能計算領(lǐng)域PCI-E 4.0帶寬又不給力。前者很好說,因為從PCI-E 2.0到PCI-E 3.0時代,顯卡性能也沒有因此受益,PCI-E 3.0 x16帶寬已經(jīng)達到了32GB/s,目前的高端顯卡并不需要這么高的帶寬,而升級到PCI-E 4.0,64GB/s的帶寬對桌面顯卡來說也是浪費。
NVIDIA聯(lián)合IBM開發(fā)了NVLink總線技術(shù)
如果用到HPC領(lǐng)域,PCI-E 4.0帶寬的64GB/s又有點捉襟見肘了,等不及的廠商早已經(jīng)在暗地里開發(fā)新的總線技術(shù),其中NVIDIA跟IBM聯(lián)合開發(fā)了NVLink總線,號稱帶寬是PCI-E總線的5-12倍,AMD也在開發(fā)自家的架構(gòu)互聯(lián)技術(shù),帶寬超過100GB/s。
無論AMD還是NVIDIA,他們開發(fā)的新總線技術(shù)帶寬可以輕松超過100GB/s,這對服務(wù)器產(chǎn)品很有用,但對桌面市場有什么意義呢?值得發(fā)燒友關(guān)注的就是多卡互聯(lián)技術(shù),目前AMD、NVIDIA最多能做到的也就是4卡SLI/CF交火,有了NVLink這樣的技術(shù),8卡SLI或者CF都是有可能的。
4、GPU架構(gòu)、工藝升級:不僅拼性能,效能更重要
說完了CPU處理器,我們也不能忽視GPU處理器。作為當前PC中功耗最高的一部分,顯卡對游戲性能影響至關(guān)重要,但在性能越高=功耗越高這條路上,顯卡也面臨一個選擇——NVIDIA的Maxwell架構(gòu)證明了顯卡性能增長的同時,能耗也可以很低。2016年的GPU不僅要性能,更重要的是效能,我們要看到還是每瓦性能比。
在Maxwell架構(gòu)之后,NVIDIA將推出新一代的Pascal架構(gòu)。根據(jù)官方在GTC 2015年大會上公布的資料,Pascal顯卡將支持3D Memory顯存,容量、帶寬可達普通顯存的2-4倍,而顯卡只有標準PCI-E顯卡的1/3大小。
Pascal顯卡會在2016年問世
至于AMD,由于目前的R200、R300系列顯卡大都還在使用GCN架構(gòu)改款,制程工藝還是28nm工藝,能效方面已經(jīng)落后NVIDIA的Maxwell架構(gòu)了,所以2016年AMD也會在GPU領(lǐng)域有大動作——推出了GCN 4.0架構(gòu)Polaris,制程工藝升級到14/16nm FinFET,同時會搭配HBM 2顯存,號稱每瓦性能比提升一倍。
2016年AMD的GCN 4.0架構(gòu)會大幅提升每瓦性能比
AMD還實際演示了Polaris顯卡的能效優(yōu)勢,之前使用用Polaris架構(gòu)的一款中端顯卡跟NVIDIA的GTX 950做了對比,同樣是在1920x1080 60fps的性能上,Polaris顯卡的整機功耗是86W,而GTX 950整機功耗是140W,可見功耗優(yōu)勢非常非常大。
5、新一代高帶寬內(nèi)存:HBM向左,HMC向右
2016年GPU要想提高性能、降低功耗,除了架構(gòu)改進之外,新一代內(nèi)存技術(shù)也功不可沒,其中AMD在去年的Fury顯卡上首次使用的HBM內(nèi)存就是代表,NVIDIA所說的3D顯存其實也是HBM技術(shù),不過是HBM 2代技術(shù)。與HBM競爭的則是美光主導的HMC內(nèi)存技術(shù)。
HBM技術(shù)帶寬更高,功耗更低
對于HBM技術(shù),我們之前做過詳細介紹:AMD詳解HBM顯存:性能遠超GDDR5,功耗降50%,面積小94%。簡單來說,HBM就是在GDDR5顯存無法繼續(xù)大幅提升頻率的情況下?lián)Q了一種思路,通過提高總線位寬來提高帶寬,第一代HBM顯存的頻率只有500MHz,等效1GHz,遠低于目前的GDDR5顯存,但帶寬高達128GB/s,4顆芯片總計可以帶來512GB/s的帶寬,遠高于主流GDDR5顯存。
2016年HBM 2代也來了,JEDEC已經(jīng)正式批準了HBM 2顯存規(guī)范,相比第一代HBM,HBM 2可堆棧的層數(shù)更多,單顆容量最高可達8GB,頻率也翻倍到2Gbps,帶寬從128GB/s提高到256GB/s,這樣一來布置4組HBM 2顯存就可以實現(xiàn)32GB容量、1TB/s的帶寬了,次之也有16GB容量,1TB/s帶寬,這正好與NVIDIA之前宣稱的數(shù)據(jù)相符。
HMC內(nèi)存技術(shù)
HBM內(nèi)存技術(shù)已經(jīng)得到了SK Hynix、三星等廠商的支持,另一個內(nèi)存技術(shù)大腕美光的選擇不同——顯存市場他們繼續(xù)推改良版的GDDR5X,3D堆棧內(nèi)存上則選擇了HMC(Hybrid Memory Cube),它跟HBM一樣都需要使用TSV工藝連接多層DRAM芯片。
性能方面,HMC閃存相比DDR內(nèi)存依然有足夠多的優(yōu)勢,普通DDR3-1600內(nèi)存雙通道帶寬不過12.8GB/s,美光之前宣稱HMC的性能是DDR3內(nèi)存的20倍,單通道帶寬就有128GB/s(跟HBM 1代相同),同時功耗比DDR3減少70%,占用面積比DDR3減少95%。
HMC陣營實際上也有Intel、三星等其他公司參與,但目前力推HMC的基本上只有美光公司,他們現(xiàn)在推出了2/4GB容量的HMC內(nèi)存,有兩種封裝,896-Ball BGA封裝的帶寬為160GB/s,666-Ball BGA封裝的帶寬是120GB/s。
Xeon Phi加速卡上的16GB板載緩存就是HMC技術(shù)的
具體應(yīng)用方面,HMC在Intel的新一代Xeon Phi加速卡上露過面了,代號Knights Landing的Xeon Phi加速卡配備了16GB板載緩存,號稱5倍帶寬、5倍能效于DDR4內(nèi)存,它就是美光提供的HMC內(nèi)存。
不過總體來看,HMC相對HBM來說還有點滯后,HBM在新一代顯卡上站穩(wěn)腳跟沒問題,未來也會進入服務(wù)器等市場,HMC受到的支持力度不如HBM,不過3D內(nèi)存技術(shù)現(xiàn)在還是新興事物,現(xiàn)在給HBM、HMC作出最終判決還有點為時過早。
總之,2016年半導體/處理器技術(shù)的進步首先要依賴工藝升級,雖然10nm及7nm工藝還有點遠,但2016年我們可以預(yù)期新一代處理器全面升級14/16nm FinFET工藝,這比去年的28nm、20nm工藝已經(jīng)有很大進步了。不論是AMD、Intel的CPU還是AMD、NVIDIA的GPU,F(xiàn)inFET工藝都會帶來20%以上的性能提升,30-40%的功耗降低,最終的CPU/GPU不僅性能更強,功耗也會大幅降低。
評論