28nm高端FPGA如何實(shí)現(xiàn)功耗和性能的平衡?
實(shí)現(xiàn)功耗監(jiān)控設(shè)計(jì)流程
從工具的角度看,必須同時(shí)考慮功耗和性能。以太高的功耗滿足性能要求,或者功耗較低但是沒有達(dá)到性能目標(biāo),這都是不可使用的設(shè)計(jì)。因此,Quartus II軟件還必須能夠在性能和功耗上很好地達(dá)到均衡。在沒有用戶干預(yù)的情況下,工具會(huì)自動(dòng)只在需要的地方使用高速塊,盡可能降低功耗泄漏以滿足性能要求,同時(shí)使得所有其他塊進(jìn)入低功耗狀態(tài)以減小泄漏。此外,還采取了以下降低功耗的措施:
Ÿ 邏輯、RAM 分析、重新規(guī)劃,以降低動(dòng)態(tài)功耗
Ÿ 群布局減小了走線長(zhǎng)度,降低了動(dòng)態(tài)布線功耗
Ÿ 優(yōu)化布局以減小時(shí)鐘功耗以及非關(guān)鍵通路信號(hào)布線功耗
建模是重要的步驟,因?yàn)樗WC了功耗模型的正確性,不是最差也不是最樂觀。公司可以選擇保守、激進(jìn)或者正確的方式。最終,最適合設(shè)計(jì)人員的唯一選項(xiàng)是正確地建模。保守選擇導(dǎo)致了估算的功耗在市場(chǎng)上看起來(lái)并不具有競(jìng)爭(zhēng)優(yōu)勢(shì)。激進(jìn)的選擇導(dǎo)致最終功耗與工具估算的功耗不具有可比性。做到正確的選擇盡可能接近硅片實(shí)際測(cè)量的功耗,同時(shí)滿足了供應(yīng)商和客戶的要求。
在制造過(guò)程中降低功耗,提高性能
提高制造能力,大批量交付器件是提高產(chǎn)量、嚴(yán)格工藝的關(guān)鍵。Altera早期以標(biāo)準(zhǔn)功耗指標(biāo)發(fā)售器件,以幫助前沿的客戶滿足早期原型開發(fā)和生產(chǎn)進(jìn)度要求,然后,嚴(yán)格曲線指標(biāo),盡快實(shí)現(xiàn)利益,以幫助這些用戶滿足其產(chǎn)品進(jìn)度和功效目標(biāo)。Altera采用這一嚴(yán)格的工藝來(lái)交付低靜態(tài)功耗的新L(低功耗)器件。
如圖3示,減小工藝變化使得靜態(tài)功耗降低了35%,從而降低了總功耗。由于結(jié)溫增大和漏電增加是一種指數(shù)函數(shù)關(guān)系,因此,這一方法在較高結(jié)溫時(shí)極大地降低了功耗,滿足了當(dāng)今很多系統(tǒng)設(shè)計(jì)的要求。
圖3 工藝降低了靜態(tài)功耗
在28HP制造工藝降低功耗的結(jié)果非常顯著,因此,Altera立即將其應(yīng)用于獨(dú)具優(yōu)勢(shì)的FPGA上,在產(chǎn)品代碼中標(biāo)以“L”。這種突出顯示的訂購(gòu)碼旨在將產(chǎn)品立即應(yīng)用于對(duì)功耗敏感的設(shè)計(jì)中,然后,在所有28 nm產(chǎn)品中繼續(xù)發(fā)揮同樣的工藝優(yōu)勢(shì)。
在FPGA 設(shè)計(jì)中使功耗和性能達(dá)到均衡
設(shè)計(jì)人員能夠使用高端器件,當(dāng)這些工具具備了各種低功耗功能以及支持功耗預(yù)知的情況下,設(shè)計(jì)人員自己會(huì)確定怎樣均衡其每一設(shè)計(jì)的性能和功耗。他們從選擇正確的FPGA系列開始。當(dāng)需要最佳性能或者最大容量時(shí),選用Stratix V FPGA。在Stratix V系列中,可用的型號(hào)包括沒有收發(fā)器的器件、有收發(fā)器的器件,以及重點(diǎn)是DSP應(yīng)用的器件。
選擇好器件后,在FPGA設(shè)計(jì)過(guò)程中,可以使用幾種設(shè)計(jì)方法來(lái)降低功耗,包括,邏輯和RAM時(shí)鐘通道以及部分重新配置等。
即使采用了最佳設(shè)計(jì)方法、模型和軟件,也只有提供了輸入后才能進(jìn)行功耗估算。大部分設(shè)計(jì)人員熟悉基本動(dòng)態(tài)功耗方程:CV2F X (觸發(fā)率)。設(shè)計(jì)工具計(jì)算電容(C),已知電壓(V)和頻率(F)是已知的,但是不知道設(shè)計(jì)的觸發(fā)率。確定觸發(fā)率的最佳方法是運(yùn)行代表實(shí)際系統(tǒng)使用情況的仿真,得到.vcd文件后,使用PowerPlay功耗分析器工具。次優(yōu)的方法是為I/O建立合適的觸發(fā)率,根據(jù)得到的估算,使用 PowerPlay功耗分析器來(lái)產(chǎn)生內(nèi)部觸發(fā)率。第三好的方法是使用早期功耗估算器 (EPE),使用以前相似設(shè)計(jì)的觸發(fā)率。最不精確的方法是以默認(rèn)觸發(fā)率使用EPE。功耗估算的精度與默認(rèn)觸發(fā)率和設(shè)計(jì)實(shí)際觸發(fā)率之間的差值相關(guān)。 Altera建議使用 PowerPlay功耗分析器,通過(guò)矢量獲得最佳功耗估算。
設(shè)計(jì)實(shí)例
設(shè)計(jì)過(guò)程中一個(gè)重要的早期步驟是,為Stratix V FPGA下載最新的EPE,選擇器件 (功耗指標(biāo)最低的L器件),為設(shè)計(jì)輸入信息。與競(jìng)爭(zhēng)產(chǎn)品相比,Altera的L器件既有動(dòng)態(tài)功耗優(yōu)勢(shì),又具有總功耗和性能優(yōu)勢(shì)。
下面的例子包括競(jìng)爭(zhēng)對(duì)手以前分析的兩個(gè)設(shè)計(jì),使用14.2 XPE和Quartus II 12.0SP2 EPE進(jìn)行了更新,以及一個(gè)使用VCC(內(nèi)核)電源的新例子,針對(duì)Altera的雙100G轉(zhuǎn)發(fā)器設(shè)計(jì)進(jìn)行了測(cè)量和預(yù)測(cè)。
100GbE OTU4轉(zhuǎn)發(fā)器實(shí)例
在這個(gè)例子中,運(yùn)行時(shí)用戶相關(guān)的結(jié)溫是100℃,使用了最大工藝指標(biāo)?;诟?jìng)爭(zhēng)對(duì)手白皮書中設(shè)定的資源使用情況,表3供了I/O和收發(fā)器數(shù)據(jù),表4提供了輸入到XPE (14.2)和 EPE (12.0 SP2)中的信息。
表3 100GbE OTU4 轉(zhuǎn)發(fā)器 I/O 和收發(fā)器信息
表4 100GbE OTU4轉(zhuǎn)發(fā)器資源使用情況
圖4對(duì)比了獲得的新L器件結(jié)果和以前報(bào)告的結(jié)果,表明,與Virtex-7 FPGA相比,Stratix V FPGA降低了功耗,同時(shí)提高了性能。
圖4 使用L器件,更新后的100GbE OTU4轉(zhuǎn)發(fā)器功耗對(duì)比
評(píng)論