賽靈思SSI技術(shù)為FPGA帶來全新密度、帶寬和功耗優(yōu)勢
可編程技術(shù)勢在必行——用更少的資源實現(xiàn)更多功能、隨時隨地降低風(fēng)險、使用可編程硬件設(shè)計平臺快速開發(fā)差異化產(chǎn)品——驅(qū)使人們不斷探索能夠提供更大容量、更低功耗和更高帶寬的 FPGA 解決方案,用來創(chuàng)建目前 ASIC 和 ASSP 所能提供的系統(tǒng)級功能。
本文引用地址:http://www.biyoush.com/article/127574.htm賽靈思已經(jīng)開發(fā)出一種創(chuàng)新型 FPGA 設(shè)計和制造方法,能夠滿足“可編程技術(shù)勢在必行”的兩大關(guān)鍵要求。堆疊硅片互聯(lián)技術(shù)是新一代 FPGA 的基礎(chǔ),不僅超越了摩爾定律,而且實現(xiàn)的功能能夠滿足最嚴(yán)格的設(shè)計要求。利用該技術(shù),賽靈思縮短了批量交付最大型 FPGA所需的時間,從而可以滿足最終客戶的批量生產(chǎn)需求。本白皮書將探討促使賽靈思開發(fā)堆疊硅片互聯(lián)技術(shù)的技術(shù)及經(jīng)濟(jì)原因,以及使之實現(xiàn)的創(chuàng)新方法。
介紹
隨著 FPGA 的作用在系統(tǒng)設(shè)計中日益凸顯,設(shè)計日趨龐大和復(fù)雜,需要更大的邏輯容量和更多的片上資源。到日前為止,F(xiàn)PGA 主要遵循摩爾定律的發(fā)展速度來應(yīng)對這種需求,每一代新工藝技術(shù)增加近兩倍的邏輯容量。然而,要跟上當(dāng)今高端市場的需求增長步伐,就需要必須超越摩爾定律。
每一代FPGA 新推出時, 那些FPGA 技術(shù)最積極的采用者,總是急切盼望著率先采用其中容量最大、帶寬最高的器件。但是,在產(chǎn)品生命周期的早期階段構(gòu)建大型 FPGA 器件存在的種種挑戰(zhàn),將會限制器件批量供貨的能力,無法滿足這些客戶的量產(chǎn)需求。這是因為實現(xiàn)可重編程技術(shù)的電路開銷會影響最大型 FPGA 器件的可制造性,進(jìn)而影響供貨。在新工藝節(jié)點的初期階段,缺陷密度較高,芯片良率會隨芯片尺寸的增加而迅速下降。隨著制造工藝的成熟,缺陷密度降低,大型芯片的可制造性會顯著提升。
因此,雖然最大型的 FPGA 器件在產(chǎn)品推出時供貨不足,但隨著時間的推移,最終可以成批供貨,滿足最終客戶的批量需求。為順應(yīng)“可編程技術(shù)勢在必行”這一發(fā)展趨勢,少數(shù)處于領(lǐng)先地位的客戶要求賽靈思在產(chǎn)品推出后盡快為他們提供批量生產(chǎn)所需的最大型 FPGA 器件。
例如,通信市場要求 FPGA 集成數(shù)十個串行收發(fā)器以及更多互聯(lián)邏輯和block RAM,以支持高級數(shù)據(jù)處理和流量管理,同時外形尺寸和功耗還應(yīng)不超過目前的水平。為獲得先發(fā)優(yōu)勢,設(shè)備制造商希望能夠盡快啟動新產(chǎn)品的生產(chǎn)。
為了滿足上述需求,賽靈思采用創(chuàng)新方法構(gòu)建FPGA, 使其與最大型 FPGA 芯片相比,帶寬和容量相當(dāng)甚至更高,同時還具備小型芯片加速批量生產(chǎn)的制造和快速上市優(yōu)勢。。這些優(yōu)勢的實現(xiàn)得力于堆疊硅片互聯(lián)技術(shù)。該技術(shù)使用帶微凸塊的硅中介層和硅通孔 (TSV),將多片容易制造的 FPGA 芯片Slice 集成在單個封裝內(nèi)。
多個 FPGA 互聯(lián)面臨的挑戰(zhàn)
堆疊硅片互聯(lián)技術(shù)解決了之前試圖通過將兩個或多個 FPGA 進(jìn)行邏輯互聯(lián),創(chuàng)建出更大型的“虛擬 FPGA”,最終實現(xiàn)復(fù)雜設(shè)計時遇到的種種挑戰(zhàn):
- 可用 I/O 數(shù)量有限,不足以連接用以供分區(qū)設(shè)計中不同 FPGA 間信號傳輸?shù)膹?fù)雜網(wǎng)絡(luò),同時也難以連接 FPGA 到系統(tǒng)其它器件;
- FPGA 間信號傳輸造成的時延會限制性能;
- 使用標(biāo)準(zhǔn)的器件 I/O 來創(chuàng)建多個 FPGA 之間的邏輯連接會增加功耗。
主要挑戰(zhàn):有限的連接功能與帶寬
SoC設(shè)計由數(shù)百萬個走線復(fù)雜的門電路連接構(gòu)成,走線網(wǎng)絡(luò)的形式包括多條總線、復(fù)雜的時鐘分配網(wǎng)絡(luò)和眾多控制信號。要成功地將 SoC 設(shè)計在多個FPGA 間進(jìn)行分區(qū),就需要大量的 I/O 來實現(xiàn)在 FPGA 之間延伸的網(wǎng)絡(luò)。采用總線寬達(dá) 1,024 位的 SoC 設(shè)計,即便使用可用引腳數(shù)最多的 FPGA 封裝,工程師都必須采用效率較低的數(shù)據(jù)緩存及其他設(shè)計優(yōu)化手段,來實現(xiàn)高性能總線和其他關(guān)鍵路徑所需的成千上萬條線路的一對一連接。
封裝技術(shù)是造成這種 I/O限制的主要因素。目前最先進(jìn)的封裝技術(shù)能夠提供約 1,200 個I/O 引腳,遠(yuǎn)遠(yuǎn)低于要求的 I/O 總數(shù)。
在芯片層,I/O 技術(shù)還存在另一項限制,因為每一代新工藝節(jié)點的 I/O 資源發(fā)展速度跟不上互聯(lián)邏輯資源的發(fā)展速度。與用于構(gòu)建 FPGA 核心的可編程邏輯資源的晶體管相比,構(gòu)成器件 I/O 結(jié)構(gòu)的晶體管必須更大,才能提供電流和承受芯片間 I/O 標(biāo)準(zhǔn)規(guī)定的電壓。因此,增加芯片上的標(biāo)準(zhǔn) I/O 數(shù)量不是實現(xiàn)多個 PFGA 芯片互連的可行解決方案。
主要挑戰(zhàn):時延過大
時延增大是多個FPGA 實現(xiàn)的另一個問題。標(biāo)準(zhǔn)器件 I/O 帶來的引腳間延遲會降低多個 FPGA 上的整體電路性能。另外,通過在標(biāo)準(zhǔn) I/O 上采用時域多路復(fù)用 (TDM) 和在每個 I/O 上運行多個信號,來增加虛擬引腳數(shù),這會帶來更大的時延,進(jìn)而將 I/O 速度降低4~32倍甚至更多。速度降低通常對 ASIC 原型設(shè)計和仿真來說是可以接受的,但對終端產(chǎn)品應(yīng)用來說往往速度過慢。
主要問題:功耗增大
時域多路復(fù)用方法也會帶來更大的功耗。標(biāo)準(zhǔn)器件 I/O 引腳用于驅(qū)動多個 FPGA 間通過 PCB 走線實現(xiàn)的數(shù)百個封裝互聯(lián),比用于連接單芯片上邏輯網(wǎng)絡(luò)時的功耗更大。
同樣,多芯片模塊 (MCM) 技術(shù)也能通過將多個 FPGA 芯片集成于單個封裝中來減少尺寸,并受困于有限的 I/O 數(shù)量、時延增大和功耗增加等同樣的限制。
賽靈思堆疊硅片互聯(lián)技術(shù)
為了克服這些限制和障礙,賽靈思已經(jīng)開發(fā)出一種新的方法來實現(xiàn)大容量 FPGA 的批量生產(chǎn)。該新型解決方案能夠大量增加連接的數(shù)量,實現(xiàn)多個芯片間的高帶寬連接。與多個FPGA方法相比,還能顯著降低時延和功耗,同時能在單個封裝中集成大量互聯(lián)邏輯和片上資源。
在 FPGA 系列的密度范圍內(nèi),中密度器件是“最佳選擇”。這是因為與前代器件相比,同一芯片尺寸上的容量和帶寬有顯著提升,而與同一系列中的最大型器件相比,它們能夠在 FPGA 產(chǎn)品生命周期的早期階段就可以交付。因此,通過將多個這種芯片集成到單個器件內(nèi),就可以達(dá)到并超過最大型單片器件所提供的容量和帶寬,但同時又具有小型芯片的生產(chǎn)優(yōu)勢和即時量產(chǎn)優(yōu)勢。
評論