在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<menu id="6qfwx"><li id="6qfwx"></li></menu>
    1. <menu id="6qfwx"><dl id="6qfwx"></dl></menu>

      <label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>
        1. <center id="6qfwx"><dl id="6qfwx"></dl></center>

            新聞中心

            EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 超高數(shù)據(jù)流通量FPGA新品類中的Block RAM級聯(lián)架構

            超高數(shù)據(jù)流通量FPGA新品類中的Block RAM級聯(lián)架構

            作者:黃侖,Achronix高級現(xiàn)場應用工程師 時間:2022-07-06 來源:電子產品世界 收藏

            概述

            本文引用地址:http://www.biyoush.com/article/202207/435949.htm

            隨著數(shù)據(jù)中心、人工智能、自動駕駛、5G、計算存儲和先進測試等應用的數(shù)據(jù)量和數(shù)據(jù)流量不斷增大,不僅需要引入高性能、高密度來發(fā)揮其并行計算和可編程硬件加速功能,而且還對大量數(shù)據(jù)在芯片內外流動提出了更高的要求。于是,在芯片中集成包括片上二維網(wǎng)絡(2D NoC)和各種最新高速接口的新品類FPGA芯片應運而生,成為FPGA產業(yè)和相關應用的新熱點。

            拉開這場FPGA芯片創(chuàng)新大幕的是全球最大的獨立FPGA技術和產品提供商半導體公司,其采用7nm工藝打造的 Speedster7t FPGA不僅擁有諸多高性能外圍Hard IP,而且是全球首次在FPGA的邏輯陣列上集成了2D NoC,一經(jīng)推出就在市場得到了積極的響應,并引來競爭對手的模仿和跟隨。

            Speedster7t這款專門針對人工智能/機器學習(AI / ML)和高帶寬應用進行優(yōu)化的高性能、高密度FPGA,包括了革命性的二維片上網(wǎng)絡(2D NoC)、新型機器學習處理器(MLP)、400G以太網(wǎng)和PCIe Gen5端口,以及高帶寬GDDR6DDR4/5存儲控制器。Speedster7t FPGA架構如圖1所示。

            image.png

            1  Speedster7t FPGA結構圖

            Speedster7t FPGA除了在外圍Hard IP上都采用目前業(yè)內領先的大帶寬高速率IP,在內部的可編程邏輯的架構中也做了大量的優(yōu)化去進一步提高內部可編程邏輯的性能,從而適配外圍IP超高帶寬需求。本文首先談談Speedster7t FPGA的片上SRAM,也就是針對傳統(tǒng)的結構所做出的一些優(yōu)化。

            Speedster7t FPGA中可編程邏輯的架構

            Speedster7t FPGA中內部的可編程資源是按列排布,包括LUT、FFALU、MUXMLP、Logic RAM。如圖2所示。

            image.png

            2  Speedster7t FPGA可編程邏輯結構

            其中MLP、、Logic RAM是集成在一起,他們之間的連接用的是專有的走線,不占用可編程邏輯走線資源,這樣做的目的主要是為了提高性能,同時也可以節(jié)省可編程邏輯走線資源,這個架構對于AI,還有需要用到MLP的一些復雜算法的性能優(yōu)化是非常明顯的,在我們的MLP系列文章中會詳細講到,這里我們只重點說一下Block RAM

            Speedster7t FPGABlock RAM特點

            Speedster7t FPGA內部的Block RAM是一個容量為72k bit的簡單雙端口RAM,有一個讀端口,一個寫端口。兩個端口的時鐘完全獨立,并且可以完全獨立的配置讀寫位寬。它可以靈活的配置成簡單雙端口RAM或者ROM

            Block RAM的主要特性如表1所示。

            1  Block RAM的關鍵特性

            image.png

            Block RAM框圖如圖3所示。

            image.png

            3  Block RAM內部結構

            Speedster7t FPGABlock RAM級聯(lián)結構

            Speedster7t FPGABlock RAM最大的特點是增加了Block RAM間的級聯(lián)走線,級聯(lián)走線是BRAM間專有的連線,不占用可編程邏輯的走線資源,可以極大的提升多個Block RAM級聯(lián)的性能。圖4顯示了Block RAM間級聯(lián)走線的架構。

            image.png

            4  Block RAM級聯(lián)結構

            由圖4可以看出,讀寫地址線和數(shù)據(jù)線都有專有的級聯(lián)線連接。這樣的架構在一些場景中都會有應用,比如:需要從外部端口接收數(shù)據(jù)或者從GDDR6讀數(shù)據(jù)去初始化大量Block RAM的場景,AI的神經(jīng)網(wǎng)絡就是一個典型的應用,在每一層的卷積算法中,系統(tǒng)都會從GDDR6讀出圖像數(shù)據(jù)和權重數(shù)據(jù)放入每個引擎的Block RAM中,引擎計算完畢以后再存入到GDDR6中供下一次運算使用。

            有了這樣的,我們在寫入數(shù)據(jù)去初始化大量Block RAM的時候不需要外部數(shù)據(jù)有很大的扇出,直接通過同一列Block RAM的級聯(lián)線就可以輕松完成,具體實現(xiàn)可以參考Achronix MLP_Conv2D參考設計。另外一個例子就是在需要多個Block RAM去構成更大容量的RAM的時候,如果利用級聯(lián)線可以大大提升系統(tǒng)的性能。我們針對這個專門做了一個工程比較一下,生成一個位寬64bit,深度16384的一個簡單雙端口RAM,需要用到16Block RAM。我們分別用專有級聯(lián)線和內部可編程邏輯去拼深度兩種方法來對比??梢钥吹接脤S械募壜?lián)線資源更省,而且性能有了很大的提高。

            使用專有的級聯(lián)線資源占用和性能:

            image.png image.png

            使用可編程邏輯資源占用和性能:

            image.png image.png

            后面我們會繼續(xù)深入了解Speedster7t FPGA可編程邏輯的各種特性,并且會用一些例子來說明如何更高效的利用這些特性,以將Speedster7t這款業(yè)界首創(chuàng)的高數(shù)據(jù)帶寬FPGA芯片與更多的創(chuàng)新智能化應用結合起來。

            此外,Achronix也提供Speedcore嵌入式FPGA硅知識產權(IP)產品,用來幫助用戶在應用規(guī)模進一步擴大后,去開發(fā)帶有eFPGA邏輯陣列的ASIC或者SoC產品,它們由AchronixACE FPGA開發(fā)工具提供支持,從而可以重用FPGA開發(fā)成果,這是Achronix在率先引入2D NoCMLP之外,另一個層面上的創(chuàng)新。


            參考文獻:

            Achronix website www.achronix.com

            2  Achronix Speedster7t IP component UG090





            評論


            相關推薦

            技術專區(qū)

            關閉