在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<menu id="6qfwx"><li id="6qfwx"></li></menu>
    1. <menu id="6qfwx"><dl id="6qfwx"></dl></menu>

      <label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>
        1. <center id="6qfwx"><dl id="6qfwx"></dl></center>

            新聞中心

            EEPW首頁 > EDA/PCB > 設計應用 > 基于Altera浮點IP核實現(xiàn)浮點矩陣相乘運算的改進設

            基于Altera浮點IP核實現(xiàn)浮點矩陣相乘運算的改進設

            作者: 時間:2013-04-11 來源:網(wǎng)絡 收藏

            3.2 計算結果仿真

            對改進的設計進行仿真,采用A9×16數(shù)據(jù)與B16×8數(shù)據(jù)相乘,獲得計算結果仿真如圖4所示。

            基于Altera浮點IP核實現(xiàn)浮點矩陣相乘運算的改進設計

            從圖4可見,loadaa、loadbb、calcimatrix三者的時序滿足矩陣運算的時序要求,在前兩者數(shù)據(jù)加載后,加載calcimatrix上升沿,進行矩陣相乘。在outvalid為高電平時輸出數(shù)據(jù),同時完成信號done輸出低電平。在輸出結果上,共分為9個大組,各大組有8個數(shù)據(jù),共組成72個數(shù)據(jù)結果,其中顯示了第一部分輸出結果,獲得與Matlab仿真相近的計算結果,在精度上相差不到萬分之一。

            從表1中可以看出,改進后的在處理時間上縮短了807個周期,同時在最高運行時鐘上提升了15%,系統(tǒng)整體的持續(xù)性能增加了7.2 Gflops。

            依據(jù)改進前后的,使用Quartus9.1軟件進行綜合布局布線,映射到Stratix Ⅲ EP3SE110F780C2器件中,可獲得相應的資源對比圖如圖5所示。由于采用的都是并行乘加運算,所以在乘法器資源的消耗上不變;同時由于只是在存儲器的存儲方式上作出變動,所以二者的存儲資源相等。從而只需要對圖中顯示的矩陣階數(shù)、vectorsize大小進行比較即可,而計算性能與最高時鐘頻率變化方向相同,所以只對ALM數(shù)量及最高時鐘頻率進行對比。

            從圖5中資源消耗對比可見,當設定vectorsize為固定值8(圖5左半部)時,隨著矩陣階數(shù)的增加,改進后的在ALM資源消耗上較改進前數(shù)量上有一定的減少,在最高時鐘頻率上都有小幅度提升,這是因為矩陣輸入時消耗時間過長;當設定矩陣階數(shù)為192×192(圖5右半部)時,隨著vectorsize值的增加,改進后IP核在ALM數(shù)量上有所減小,在最高時鐘頻率上則有小幅度提升,且波動幅度在3.4%左右??梢?,改進后IP核比原的IP核綜合性能有所提升。

            塵埃粒子計數(shù)器相關文章:塵埃粒子計數(shù)器原理

            上一頁 1 2 下一頁

            評論


            相關推薦

            技術專區(qū)

            關閉