在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<menu id="6qfwx"><li id="6qfwx"></li></menu>
    1. <menu id="6qfwx"><dl id="6qfwx"></dl></menu>

      <label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>
        1. <center id="6qfwx"><dl id="6qfwx"></dl></center>

            新聞中心

            EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > ARMCC和GCC編譯ARM代碼的軟浮點和硬浮點問題

            ARMCC和GCC編譯ARM代碼的軟浮點和硬浮點問題

            作者: 時間:2016-11-10 來源:網(wǎng)絡 收藏
            本文介紹了ARM代碼編譯時的軟浮點(soft-float)和硬浮點(hard-float)的編譯以及鏈接實現(xiàn)時的不同。從VFP浮點單元的引入到軟浮點(soft-float)和硬浮點(hard-float)的概念,然后是在GCC和ARMCC RVCT工具鏈下的具體編譯參數(shù)。

            VFP (vector floating-point)

            從ARMv5開始,就有可選的Vector Floating Point (VFP)模塊,當然最新的如Cortex-A8,Cortex-A9和Cortex-A5可以配置成不帶VFP的模式供芯片廠商選擇。VFP經(jīng)過若干年的發(fā)展,有VFPv2 (一些ARM9/ARM11)、VFPv3-D16(只使用16個浮點寄存器,默認為32個)和VFPv3+NEON (如大多數(shù)的Cortex-A8芯片)。對于包含NEON的ARM芯片,NEON一般和VFP公用寄存器。

            本文引用地址:http://www.biyoush.com/article/201611/317415.htm

            硬浮點Hard-float

            編譯器將代碼直接編譯成發(fā)射給硬件浮點協(xié)處理器(浮點運算單元FPU)去執(zhí)行。FPU通常有一套額外的寄存器來完成浮點參數(shù)傳遞和運算。使用實際的硬件浮點運算單元FPU當然會帶來性能的提升。因為往往一個浮點的函數(shù)調(diào)用需要幾個或者幾十個時鐘周期。

            軟浮點 Soft-float

            編譯器把浮點運算轉(zhuǎn)換成浮點運算的函數(shù)調(diào)用和庫函數(shù)調(diào)用,沒有FPU的指令調(diào)用,也沒有浮點寄存器的參數(shù)傳遞。浮點參數(shù)的傳遞也是通過ARM寄存器或者堆棧完成?,F(xiàn)在的Linux系統(tǒng)默認編譯選擇使用hard-float,即使系統(tǒng)沒有任何浮點處理器單元,這就會產(chǎn)生非法指令和異常。因而一般的系統(tǒng)鏡像都采用軟浮點以兼容沒有VFP的處理器。

            armel和armhf ABI
            在armel中,關(guān)于浮點數(shù)計算的約定有三種。以gcc為例,對應的-mfloat-abi參數(shù)值有三個:soft,softfp,hard。soft是指所有浮點運算全部在軟件層實現(xiàn),效率當然不高,會存在不必要的浮點到整數(shù)、整數(shù)到浮點的轉(zhuǎn)換,只適合于早期沒有浮點計算單元的ARM處理器;softfp是目前armel的默認設置,它將浮點計算交給FPU處理,但函數(shù)參數(shù)的傳遞使用通用的整型寄存器而不是FPU寄存器;hard則使用FPU浮點寄存器將函數(shù)參數(shù)傳遞給FPU處理。需要注意的是,在兼容性上,soft與后兩者是兼容的,但softfp和hard兩種模式不兼容。默認情況下,armel使用softfp,因此將hard模式的armel單獨作為一個abi,稱之為armhf。而使用hard模式,在每次浮點相關(guān)函數(shù)調(diào)用時,平均能節(jié)省20個CPU周期。對ARM這樣每個周期都很重要的體系結(jié)構(gòu)來說,這樣的提升無疑是巨大的。在完全不改變源碼和配置的情況下,在一些應用程序上,使用armhf能得到20%——25%的性能提升。對一些嚴重依賴于浮點運算的程序,更是可以達到300%的性能提升。

            Soft-float和hard-float的編譯選項

            在CodeSourcery gcc的編譯參數(shù)上,使用-mfloat-abi=name來指定浮點運算處理方式。-mfpu=name來指定浮點協(xié)處理的類型。可選類型如fpa,fpe2,fpe3,maverick,vfp,vfpv3,vfpv3-fp16,vfpv3-d16,vfpv3-d16-fp16,vfpv3xd,vfpv3xd-fp16,neon,neon-fp16,vfpv4,vfpv4-d16,fpv4-sp-d16,neon-vfpv4等。使用-mfloat-abi=hard (等價于-mhard-float)-mfpu=vfp來選擇編譯成硬浮點。使用-mfloat-abi=softfp就能兼容帶VFP的硬件以及soft-float的軟件實現(xiàn),運行時的連接器ld.so會在執(zhí)行浮點運算時對于運算單元的選擇,是直接的硬件調(diào)用還是庫函數(shù)調(diào)用,是執(zhí)行/lib還是/lib/vfp下的libm。-mfloat-abi=soft (等價于-msoft-float)直接調(diào)用軟浮點實現(xiàn)庫。

            在ARM RVCT工具鏈下,定義fpu模式:

            ? --fpu softvfp
            ? --fpu softvfp+vfpv2
            ? --fpu softvfp+vfpv3
            ? --fpu softvfp+vfpv_fp16
            ? --fpu softvfp+vfpv_d16
            ? --fpu softvfp+vfpv_d16_fp16.

            定義浮點運算類型

            --fpmode ieee_full :所有單精度float和雙精度double的精度都要和IEEE標準一致,具體的模式可以在運行時動態(tài)指定;

            --fpmode ieee_fixed:舍入到最接近的實現(xiàn)的IEEE標準,不帶不精確的異常;

            --fpmode ieee_no_fenv:舍入到最接近的實現(xiàn)的IEEE標準,不帶異常;

            --fpmode std:非規(guī)格數(shù)flush到0、舍入到最接近的實現(xiàn)的IEEE標準,不帶異常;

            --fpmode fast:更積極的優(yōu)化,可能會有一點精度損失。

            一個浮點軟鏈接實現(xiàn)的匯編例子

            IMPORT __softfp_cos

            BL __softfp_cos

            ARMCC fplib浮點運算庫

            __aeabi_dadd 浮點double類型數(shù)據(jù)的加法,__aeabi_fdiv 單精度浮點除法。

            附錄:常見的芯片和VFP配置

            Partial reference of SoC and supported ISAs

            Manufacturerhttp://houh-1984.blog.163.com/

            SoC

            architecture

            VFP

            SIMD

            Notes

            Freescale

            iMX5x

            armv7

            VFPv3

            NEON

            Cortex-A8;NEONonly reliable in Tape-Out 3 or above

            Nvidia

            Tegra2

            armv7

            VFPv3 D16

            none

            Marvell

            Dove

            armv7

            VFPv3 D16

            iwMMXt

            Texas Instruments

            OMAP3xxx

            armv7

            VFPv3

            NEON

            Cortex-A8

            Texas Instruments

            OMAP4xxx

            armv7

            VFPv3

            NEON

            Cortex-A9

            Texas Instruments

            OMAP5xxx

            armv7

            VFPv4

            NEON

            Cortex-A15(ARMv7-A) +Cortex-M4(ARMv7-ME)

            Qualcomm

            Snapdragon

            armv7

            VFPv3

            NEON[1]

            Qualcomm "Scorpion" core

            Samsung

            S5PC100

            armv7

            VFPv3

            NEON

            Cortex-A8

            Allwinner

            A1x

            armv7

            VFPv3

            NEON

            Cortex-A8

            本文介紹了ARM代碼編譯時的軟浮點(soft-float)和硬浮點(hard-float)的編譯以及鏈接實現(xiàn)時的不同。從VFP浮點單元的引入到軟浮點(soft-float)和硬浮點(hard-float)的概念,然后是在GCC和ARMCC RVCT工具鏈下的具體編譯參數(shù)。



            評論


            技術(shù)專區(qū)

            關(guān)閉