在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

    
    
    <address id="vxupu"><td id="vxupu"></td></address>

      <pre id="vxupu"><small id="vxupu"></small></pre>
      <dfn id="vxupu"></dfn>
      <div id="vxupu"><small id="vxupu"></small></div>
    1. 新聞中心

      EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 采用硬件加速發(fā)揮MicroBlaze處理能力

      采用硬件加速發(fā)揮MicroBlaze處理能力

      作者:Karsten Trott博士 賽靈思(德國慕尼黑) 現(xiàn)場應(yīng)用工程師 時間:2010-03-09 來源:電子產(chǎn)品世界 收藏

        案例2:高速浮點性能

      本文引用地址:http://www.biyoush.com/article/106702.htm

        現(xiàn)在我們給出另一個 算法加速示例。一個客戶聲稱他的浮點處理在系統(tǒng)上運(yùn)行非常慢。他使用的算法可采用簡單的環(huán)路同時得出幾個結(jié)果。

      for (i=0;i<512;i++) {
         f_sum += farr[i];
         f_sum_prod += farr[i] * farr[i];
           f_sum_tprod += farr[i] *
      farr[i] * farr[i];
        f_sqrt + =
      sqrt(farr[i]);
        if (min_f > farr[i]) { min_f =
      farr[i]; }
        if (max_f < farr[i]) { max_f =
      farr[i]; }
      }

        所有數(shù)值均是單精度浮點值。我們首先想到的是最基礎(chǔ)的一個問題:浮點單元 () 激活了嗎?檢查項目設(shè)置后,我們發(fā)現(xiàn)仍然處于未啟用狀態(tài)。這就是為什么永遠(yuǎn)無法計算出這幾個數(shù)的原因。可在 屬性設(shè)置中加以激活。

        FPU支持共有兩種。我們也選擇擴(kuò)展FPU (Extended FPU)來支持求平方根運(yùn)算。現(xiàn)在,在50MHz 的MicroBlaze上需要 1,108,685個周期才能完成 512個值的全部循環(huán)。查看生成的匯編程序代碼后,可以了解到創(chuàng)建平方根是仍然在使用數(shù)學(xué)庫(Math-lib)功能。其在數(shù)學(xué)功能中的定義為:

        double sqrt(double);

        不過客戶使用平方根函數(shù)僅為處理浮點數(shù)值。因此,MicroBlaze FPU定義了一個新的函數(shù)來取代原來的函數(shù),解決這個問題:

        float sqrtf(float);

        把表達(dá)式f_sqrt += sqrt(farr[i])變?yōu)閒_sqrt += sqrtf(farr[i]),就會調(diào)用MicroBlaze內(nèi)部的FPU內(nèi)部平方根功能。現(xiàn)在執(zhí)行代碼只需要35,336個周期。特別是與第一個根本沒有使用FPU的方案相比,我們再次通過小小的調(diào)整就實現(xiàn)了31倍的提升。在相同的執(zhí)行時間內(nèi),可能需要大約1.5GHz的CPU才能給出上述這些結(jié)果。



      評論


      相關(guān)推薦

      技術(shù)專區(qū)

      關(guān)閉