閃存出錯:軟件錯誤還是電源電壓故障(上)?
答案:兩個都是!閃存通常用于存儲嵌入式系統(tǒng)的固件。有時候,在某些系統(tǒng)的閃存中存儲的固件意外出錯,導(dǎo)致系統(tǒng)無法在上電后正常啟動。閃存出錯通常與軟件錯誤有關(guān)。然而,工程師們也普遍認同電源循環(huán)測試或者裕度測試增加了閃存出錯的可能性。當板上使用復(fù)雜的ASIC或SoC越多,閃存出錯的問題就會更嚴重。本文探討了除了軟件錯誤外,其他引起閃存出錯的情況和原因并提出解決方法,最大限度地減少損壞。
本文引用地址:http://www.biyoush.com/article/142408.htm為什么閃存內(nèi)容會出錯?
圖1是一個典型的電路板的CPU電路。當電源接通時,復(fù)位發(fā)生器首先激活CPU的復(fù)位信號。然后等待,直到CPU、閃存和DDR存儲器都達到其額定的工作電壓,再等待一個額外的時間周期(約150ms),然后關(guān)閉CPU復(fù)位信號。當復(fù)位信號關(guān)閉時,CPU開始執(zhí)行閃存中的初始化程序,將存儲在閃存中的固件內(nèi)容載入DDR存儲器,并執(zhí)行DDR存儲器中的程序。
固件載入閃存的步驟如下:
● 固件通過通信接口載入DDR存儲器;
● 跳轉(zhuǎn)到閃存更新程序,使用新的固件對閃存重新編程;
● 處理器重新上電,新的固件生效。
如果代碼執(zhí)行意外跳轉(zhuǎn)到閃存更新程序,閃存中的內(nèi)容可能會被損壞。當電路板重新上電,錯誤版本的代碼被加載到DDR,而電路板并不能如預(yù)期般工作。
代碼執(zhí)行意外跳轉(zhuǎn)到這個閃存更新程序,可能是由于軟件錯誤或者電源電壓故障(例如在電源關(guān)斷時)。使用正常的軟件調(diào)試方法,可以檢測到軟件錯誤。然而,故障電源電壓是很難檢測的,因為電源電壓故障隨時都可能發(fā)生。
為什么電源電壓故障會導(dǎo)致程序跳轉(zhuǎn)到閃存更新程序?
所有IC都有最低和最高工作電壓規(guī)范。如果供電電壓超過了最高電壓,該器件就會被損壞,如果供電電壓低于最低的電壓值,則該器件不能正常工作。例如,在圖1中CPU內(nèi)核的額定電壓是1.2V±5%。如果電壓下降到低于這個值,CPU內(nèi)部的指令執(zhí)行流水線就不能可靠地傳輸指令和數(shù)據(jù),并且(根據(jù)CPU的進程和工作溫度)指令可能無法正確執(zhí)行。例如,“Move”指令可能被解釋為“Pop”的指令,然后代碼執(zhí)行隨機跳轉(zhuǎn)到存儲器中的某個位置(由堆棧中的內(nèi)容的決定)。根據(jù)該存儲器位置的內(nèi)容和執(zhí)行中的錯誤,處理器可能掛起或跳轉(zhuǎn)到閃存更新程序,破壞閃存并覆蓋閃存中的內(nèi)容。
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)
評論