STM32L476 FPU 執(zhí)行效率之比較淺析
本應用筆記基于STM32L4">STM32L476平臺,通過實際測量來評定使能FPU">FPU時浮點運算效率的情況。
2.測試工具
STM32L476 Nucleo,示波器
3.測試方法
MCU 運行頻率設置為16MHz,根據下面公式1 做N次浮點運算,分使能FPU和禁止FPU兩種情況,測試完成相同運算所需要的時間。在例程中通過翻轉IO PB13 來標定完成運算所需要的時間。
3.1 測試代碼
根據公式1,分別定義A、B、C 三個常量,如下:
/* Private constants---------------------------------------------------------*/
#define A_CONSTANT(0.285f)
#define B_CONSTANT(0.443f)
#define C_CONSTANT(0.698f)
根據公式做對應的運算并通過GPIOC Pin0 輸出,測定對應消耗時間:
HAL_GPIO_WritePin(GPIOB,GPIO_PIN_13, GPIO_PIN_SET);
temp = A_CONSTANT*x*x +B_CONSTANT*x + C_CONSTANT;
HAL_GPIO_WritePin(GPIOB,GPIO_PIN_13, GPIO_PIN_RESET);
3.2 代碼分析
根據測試用的一元二次方程,經過IAR 編譯后,匯編結果如下:
3.2.1 FPU 使能
從匯編代碼可以看出,使能FPU 的情況下,完成一元二次方程的運算只需要7 條單周期指令,總共耗時為7 個Clock 周期。通過IAR 的方針模式運行,需要的CPU cycles 為7.
3.2.2 FPU 禁止
從匯編代碼可以看出,未使能FPU 的情況下,完成該一元二次方程的運算需要執(zhí)行14 條指令,其中包括3 條兩周期指令,6 條單周期指令,5 條程序跳轉指令。通過IAR 的方針模式運行,需要的CPU cycles 為207.
4.測試數據及結論
IO完成兩次翻轉耗時6.48 uS;
使能FPU 時,除去IO 翻轉耗時,完成一次運算時間為6.52 uS(13 uS -6.48 uS),
如下圖示:
禁止FPU 時,除去IO 翻轉耗時,完成一次運算時間為87.4 uS(93.88 uS -6.48 uS),如下圖示:
小結下,根據上面相關測試數據大致可得出如下結論:
• 完成同樣的一元二次方程運算,禁止FPU時所消耗的時間約為使能FPU時消耗時間的13.4 倍左右。
評論