在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<abbr id="27omo"></abbr>

<menu id="27omo"><dl id="27omo"></dl></menu>
    • <label id="27omo"><tt id="27omo"></tt></label>

      新聞中心

      EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 用定制DSP設(shè)計(jì)MPEG-4無線視頻產(chǎn)品

      用定制DSP設(shè)計(jì)MPEG-4無線視頻產(chǎn)品

      作者: 時間:2009-10-14 來源:網(wǎng)絡(luò) 收藏

        用戶應(yīng)用引擎的一種專用解決方案

        下面來討論一個現(xiàn)實(shí)生活中的解決方案,該方案采用了三級不同的可定制性來構(gòu)造專門的用戶應(yīng)用引擎。

        第一級可定制性在處理器的標(biāo)準(zhǔn)資源處提供,這些標(biāo)準(zhǔn)資源包括算術(shù)邏輯單元(ALU)以及乘法器和累加器(MAC)等。對某些應(yīng)用而言MAC 用得較多,如基于快速傅立葉變換(FFT)的算法;還有一些則傾向于更多地采用ALU。這就提出了一個要求,對于不同的應(yīng)用,處理器應(yīng)有不同的資源組合,而不是將所有的應(yīng)用都分配到同樣的一組固定的資源中去。

        例如,可以將一個MAC密集的算法分配到一個包含4 MAC、2 ALU、1 SHIFT的處理器中去,而將一個ALU密集的應(yīng)用分配給一個包含3 ALU、1 MAC、1 SHIFT的引擎。這種處理器資源分配的可定制性對許多普通應(yīng)用而言已經(jīng)綽綽有余,但對大多數(shù)與視頻相關(guān)的應(yīng)用來說還遠(yuǎn)遠(yuǎn)不夠,它們的要求更高,并且需要更多的運(yùn)算單元來加快運(yùn)行速度。

        第二級可定制性允許向處理器添加。設(shè)計(jì)者先要對所需完成的應(yīng)用有一個大致的認(rèn)識,接著對該應(yīng)用進(jìn)行分析,將其中的一些專用函數(shù)分離出來,然后在硬件上專門針對這些函數(shù)進(jìn)行加速處理,即添加DDCU。此外,設(shè)計(jì)者還可以分析一下,采用工具組添加DDCU來加快運(yùn)行速度會對處理器的性能造成怎樣的潛在影響,以及在諸如此類的一些其他假設(shè)下會出現(xiàn)什么情況。

      DDCU是一種適用于專用算法的計(jì)算單元。一旦設(shè)計(jì)者確認(rèn)了哪個算法需要用DDCU進(jìn)行硬件加速之后,就可以寫出實(shí)現(xiàn)該DDCU的RTL 代碼,并將其加入用戶應(yīng)用引擎。例如,在通用DSP中加入濾波DDCU,那么若用該DSP實(shí)現(xiàn)一個需要濾波的應(yīng)用,其表現(xiàn)出來的性能就會有所增強(qiáng)。

        除此以外,設(shè)計(jì)者還要在增加并行性所帶來的性能優(yōu)化和該并行性對指令的影響之間尋找最佳平衡。為解決這一問題,可以在VLIW指令中定義分段的數(shù)目(從而定義最大并行度),并為每一段分別分配CU和DDCU(見圖1)。

        最后一級可定制性表現(xiàn)在處理器資源的選擇上。設(shè)計(jì)者可以自己決定需要多大的數(shù)據(jù)存儲器,以及需要多少個數(shù)據(jù)寄存器和地址寄存器。而且,根據(jù)具體應(yīng)用所提出的數(shù)據(jù)要求,設(shè)計(jì)者還可以增加存儲器接口,以便提供并行數(shù)據(jù)訪問。這些共享的存儲器接口又可以用來連接多個處理器引擎,這就為處理器資源提供了一定的可伸縮性。

        采用DSP引擎的一個關(guān)鍵的好處是可以加快產(chǎn)品投入市場的時間。但要達(dá)到這個目的,還要先定義一系列與DSP引擎協(xié)作的。在設(shè)計(jì)引擎的時候,首先要對其各個方面進(jìn)行全面分析,確定需要采用哪些DDCU。然后用這些DDCU構(gòu)建起一個大致引擎,分析其性能瓶頸,并針對性能瓶頸再定義一些DDCU加入引擎中,從而提高該引擎的性能,沖破其瓶頸。為了更方便地完成以上工作,人們開發(fā)出一個專門用于MPEG -4應(yīng)用的DDCU庫。以下討論了該庫中的某些專用DDCU。

        1. 比特流/可變長度解碼DDCU

        在視頻編碼中常常會遇到可變長度解碼。比特流/可變長度解碼DDCU 可以加快從輸入比特流中取出可變長度字段的速度,這是一種基本操作。如果用軟件來實(shí)現(xiàn)這種比特流管理,會消耗大量的時鐘周期來處理指針的移位、屏蔽和管理,而采用比特流/可變長度解碼DDCU則可以在一個簡單的硬件單元里快速完成同樣的功能。

        在比特流/可變長度解碼DDCU中,由用戶設(shè)計(jì)的指令組集中完成普通比特的提取和插入操作。這種DDCU不但能加快處理速度,提高整個視頻引擎的性能,還可以解放處理器中的其他資源,使之得以用于周圍的其他處理過程。因此,采用這種DDCU不但可以減小指令長度,同時還增強(qiáng)了系統(tǒng)性能。實(shí)際上,在DSP中加入這種計(jì)算單元會使可變長度解碼的速度增快23.2%。



      評論


      相關(guān)推薦

      技術(shù)專區(qū)

      關(guān)閉