下一代FPGA有望實(shí)現(xiàn)突破性優(yōu)勢(shì)
定制方法提供了突破性功能
本文引用地址:http://www.biyoush.com/article/283452.htm為滿足通信、國(guó)防、廣播和存儲(chǔ)對(duì)帶寬和性能越來(lái)越高的需求,為工廠自動(dòng)化、汽車和消費(fèi)類便攜式產(chǎn)品提供低成本和低功耗最優(yōu)解決方案——需要更廣泛專業(yè)的知識(shí)和工具。這包括,但是不限于:
■ 前沿的制造工藝技術(shù)
■ 在不同體系結(jié)構(gòu)和IP上的投入
■ 處理器和可編程架構(gòu)的高性能集成
前沿工藝
半導(dǎo)體供應(yīng)商投資于前沿工藝,他們的關(guān)鍵優(yōu)勢(shì)是擁有高級(jí)工藝技術(shù)。例如,新的3-D晶體管技術(shù),它也被稱為三柵極或者FinFET晶體管技術(shù),是工藝技術(shù)的新突破(參見(jiàn)圖3)。其晶體管泄漏降低了兩倍,能提高性能,或增強(qiáng)功率。
圖3.三柵極工藝技術(shù)
截至2014年第三季度Intel發(fā)售了5億多片基于FinFET技術(shù)的芯片,表明了其工藝已經(jīng)成熟,在基于FinFET的技術(shù)上有很好的經(jīng)驗(yàn)。如果可編程解決方案公司能夠迅速高效的采用這些產(chǎn)品,就能夠大幅度提高性能。而且,客戶需要提高產(chǎn)品性能不僅可以利用這一3-D晶體管技術(shù),而且會(huì)受益于今后越來(lái)越簡(jiǎn)單的工藝。最近發(fā)布的Intel 14 nm三柵極工藝提供了這一工藝技術(shù)。
事實(shí)是,沒(méi)有一種工藝技術(shù)能夠滿足目前終端設(shè)備的各種需求——即使是工藝尺寸最小或者最“先進(jìn)”的工藝。FPGA和其他可編程SoC產(chǎn)品供應(yīng)商如果只依靠某一種能夠滿足所有需求的方法,那將對(duì)客戶非常不利。
產(chǎn)品及時(shí)面市、成本、與其他組件的系統(tǒng)集成和產(chǎn)量等因素會(huì)促使采用其他工藝技術(shù)。例如,新的工藝節(jié)點(diǎn)很可能無(wú)法很好的支持高電壓I/O。其他類型的工藝節(jié)點(diǎn)在每I/O單位成本上會(huì)有較強(qiáng)的優(yōu)勢(shì)。因此,14 nm三柵極工藝是極低功耗實(shí)現(xiàn)最佳內(nèi)核性能的基礎(chǔ),但并不一定是所有系統(tǒng)應(yīng)用的最優(yōu)方案。其他工藝技術(shù)能夠完善Intel的14 nm三柵極工藝,例如,TSMC的20SoC和55 EmbFlash,以實(shí)現(xiàn)多種系統(tǒng)設(shè)計(jì)目標(biāo)。
例如,TSMC的20SoC工藝支持客戶在產(chǎn)品中采用下一代FPGA,在能夠使用14 nm器件之前,就可以投入到大批量寬帶基礎(chǔ)設(shè)施市場(chǎng)中??蛻舻膬?nèi)核性能得到了提高,與目前大批量應(yīng)用的功能相似的FPGA相比,系統(tǒng)可以運(yùn)行在500 MHz以上,其ARM?處理器高達(dá)1.5 GHz,而功耗降低了50%。這一20 nm工藝是客戶滿足關(guān)鍵目標(biāo)的基礎(chǔ),例如,電信、數(shù)據(jù)中心和其他應(yīng)用所要求的單位比特成本和每瓦性能。嵌入式閃存工藝等其他工藝支持系統(tǒng)設(shè)計(jì)人員獲得單位I/O引腳最低成本,支持低功耗解決方案,還可以采用模擬電路和非易失閃存,而這是其他工藝在經(jīng)濟(jì)上無(wú)法實(shí)現(xiàn)的。
體系結(jié)構(gòu)和IP
為滿足比當(dāng)今應(yīng)用高出四倍的帶寬性能需求,應(yīng)采用更先進(jìn)的工藝技術(shù)。這需要新的邏輯體系結(jié)構(gòu)、新IP,以及新的串行連接等。
下一代體系結(jié)構(gòu)與前沿工藝技術(shù)相結(jié)合,能夠顯著提高內(nèi)核性能。例如,Altera最近發(fā)布了新的高性能體系結(jié)構(gòu)。與Intel的14 nm三柵極工藝結(jié)合后,其內(nèi)核速率達(dá)到了令人吃驚的1 GHz。
這一體系結(jié)構(gòu)極大的提高了數(shù)字信號(hào)處理(DSP)能力。這些DSP模塊已經(jīng)應(yīng)用于FPGA中,而浮點(diǎn)運(yùn)算的效率會(huì)更高。FPGA支持其性能達(dá)到每秒10兆次浮點(diǎn)運(yùn)算(teraFLOPS)。將提供每瓦每秒100 giga浮點(diǎn)運(yùn)算(GFLOPS),是性能最好、功效最高的解決方案之一,這對(duì)于現(xiàn)有DSP或者圖形處理單元(GPU)是無(wú)法想象的。這將在金融、能源、云數(shù)據(jù)分析等高性能、大數(shù)據(jù)量計(jì)算應(yīng)用中實(shí)現(xiàn)突破性功能。
通過(guò)提高數(shù)據(jù)速率、通道數(shù)量,包括更多的硬核特性,也將大幅度提高串行帶寬。FPGA公司宣布其下一代收發(fā)器技術(shù)數(shù)據(jù)速率將達(dá)到56 Gbps。Altera等公司目前提供的單管芯FPGA的收發(fā)器數(shù)據(jù)速率是28 Gbps。單單下一代FPGA的28 Gbps通道數(shù)量就將增加四倍,實(shí)現(xiàn)下一代100G光接口的多個(gè)例化,例如CFP2、CFP4和QSFP28等。采用自適應(yīng)判決反饋均衡器(DFE)等增強(qiáng)信號(hào)調(diào)理技術(shù),即使是在電噪聲環(huán)境中,收發(fā)器也滿足了高損耗背板應(yīng)用需求。而且,使用增強(qiáng)前向糾錯(cuò)(FEC)等技術(shù),能夠克服30 dB通道損耗,延長(zhǎng)背板傳輸距離,支持使用低成本材料,而不會(huì)犧牲系統(tǒng)誤碼率(BER)。功能的增強(qiáng)提高了收發(fā)器的可用性。例如,硬核物理編碼子層(PCS)模塊可以處理8b/10b和64/66b等多種編碼方法,還為Interlaken和10 Gbps以太網(wǎng)(GbE)數(shù)據(jù)流提供關(guān)鍵的處理功能。而且,為PCI Express? (PCIe?) Gen1、Gen2和Gen3提供全面的協(xié)議棧。今后的FPGA將大規(guī)模采用串行存儲(chǔ)器。串行存儲(chǔ)器接口采用了10-15 Gbps高速串行收發(fā)器,克服并行存儲(chǔ)器接口的帶寬、延時(shí)和功耗局限。請(qǐng)參見(jiàn)圖4。
圖4.28 Gbps工作,采用了Altera的20 nm工藝技術(shù)
雖然某些應(yīng)用需要最新的體系結(jié)構(gòu)、IP和串行技術(shù),例如,400G解決方案,但是,這對(duì)于其他應(yīng)用不一定是最優(yōu)方案,反而有可能影響其功耗和成本目標(biāo)。有必要針對(duì)不同的FPGA和不同的應(yīng)用而有選擇的使用這些技術(shù)。
處理器集成
FPGA總是能夠提高電路板上組件的集成度,而影響最大的是最近集成了基于ARM的硬核處理器系統(tǒng)(HPS)。HPS集成了獨(dú)立但是高度集成的處理器以及硬核外設(shè)和可編程邏輯,開(kāi)發(fā)了芯片系統(tǒng)(SoC)解決方案。這種集成是從28 nm可編程邏輯技術(shù)和ARM Cortex?-A9處理器開(kāi)始的,F(xiàn)PGA中的這種體系結(jié)構(gòu)得到了廣泛應(yīng)用,這些SoC的發(fā)展將為ARM處理器供應(yīng)商的長(zhǎng)期產(chǎn)品發(fā)展路線產(chǎn)生積極影響。系統(tǒng)規(guī)劃人員現(xiàn)在有更多的選擇來(lái)提高集成度,增強(qiáng)系統(tǒng)性能、降低系統(tǒng)成本和功耗,減輕供應(yīng)鏈風(fēng)險(xiǎn)。沒(méi)有采用這些可編程SoC的系統(tǒng)規(guī)劃人員會(huì)吃驚的發(fā)現(xiàn):
■ 不同類型的器件系列有大量的SoC產(chǎn)品
■ 可編程邏輯和處理器之間的緊密集成提高了性能,降低了延時(shí)。
■ 工程師通過(guò)28 nm SoC、開(kāi)發(fā)套件和工具來(lái)使用這一新技術(shù)
■ 部分FPGA供應(yīng)商提供ARM輔助系統(tǒng)支持
圖5顯示采用了ARM Cortex-A9處理器的第二代HPS模塊。
圖5.采用了ARM Cortex-A9處理器的第二代HPS模塊
下一代FPGA和SoC即將出現(xiàn)
28 nm工藝節(jié)點(diǎn)之后發(fā)布下一代PLD的第一家公司是Altera,推出了10代系列產(chǎn)品。Altera使用了定制方法,所有PLD提供商在其各種低成本、中端和高端產(chǎn)品系列中廣泛使用了不同的工藝技術(shù)、不同的體系結(jié)構(gòu)和IP以及不同的集成方法。第10代系列產(chǎn)品包括Stratix? 10以及Arria? 10 FPGA和SoC,滿足了需要一些中等速率收發(fā)器的應(yīng)用需求,以及需要多個(gè)28和56 Gbps收發(fā)器的應(yīng)用需求。通過(guò)在這兩種器件系列中采用定制方法,F(xiàn)PGA大幅度增強(qiáng)的功能是硬件規(guī)劃人員和系統(tǒng)設(shè)計(jì)人員還未預(yù)見(jiàn)到的。
硬件工程師使用目前一代Altera? FPGA,采用相同的高效能工具、IP和設(shè)計(jì)移植功能,充分發(fā)揮了這些FPGA的優(yōu)勢(shì)。軟件開(kāi)發(fā)人員已經(jīng)能夠使用Altera的SoC開(kāi)發(fā)套件和其他工具,針對(duì)ARM HPS進(jìn)行設(shè)計(jì)。而且,設(shè)計(jì)工具流程的效能還會(huì)進(jìn)一步增強(qiáng)。采用其他的設(shè)計(jì)工具和方法,例如開(kāi)放計(jì)算語(yǔ)言(OpenCL?)等,支持采用C語(yǔ)言開(kāi)發(fā)HDL,從而進(jìn)一步縮短了設(shè)計(jì)開(kāi)發(fā)時(shí)間。此外,Altera還認(rèn)識(shí)到每年需要將編譯時(shí)間縮短兩倍才能跟上這些功能的快速發(fā)展。
結(jié)論
很多市場(chǎng)領(lǐng)域的系統(tǒng)規(guī)劃人員尋找ASIC和ASSP的替代方法,以及能夠滿足其帶寬、性能、集成度和功耗需求的解決方案。選擇好FPGA公司,其交付的產(chǎn)品在FPGA上具有前所未有的突破性優(yōu)勢(shì)。為能夠滿足客戶在很多最終應(yīng)用上的需求,還需要各種工具和選擇,例如,400G數(shù)據(jù)包處理、無(wú)線遠(yuǎn)程射頻單元、數(shù)據(jù)中心和高性能計(jì)算等應(yīng)用需求。使用了定制方法的產(chǎn)品策略針對(duì)不同的應(yīng)用而采用不同的工藝技術(shù)、體系結(jié)構(gòu)和集成選擇,為硬件規(guī)劃人員提供了最好的選擇和解決方案。Altera的10代系列產(chǎn)品定制了FPGA和SoC,在多種不同的應(yīng)用中突破了功能,突出了產(chǎn)品優(yōu)勢(shì)。
參考文獻(xiàn)
1. 思科視覺(jué)網(wǎng)絡(luò)指數(shù)(VNI):全球移動(dòng)數(shù)據(jù)流量預(yù)測(cè)更新,2012 – 2017:www.cisco.com/en/US/solutions/collateral/ns341/ns525/ns537/ns705/ns827/ white_paper_c11-520862.html
2. 白皮書(shū):采用28-nm FPGA設(shè)計(jì)多相DPD解決方案:www.altera.com/literature/wp/wp-01171-polyphase-dpd.pdf
3. Gartner報(bào)告,市場(chǎng)趨勢(shì):全球,初次采用ASIC和ASSP的設(shè)計(jì)呈繼續(xù)下滑趨勢(shì),2012
4. Altera網(wǎng)站:www.altera.com
5. Alter企業(yè)介紹
6. 福布斯網(wǎng)站:www.forbes.com/sites/greatspeculations/2013/01/22/intels-difficult-year-and- whats-ahead/
評(píng)論