系統(tǒng)設(shè)計工程師不可不知的DRAM控制器核心結(jié)論(一)
DRAM控制器能否正常工作會使得系統(tǒng)有很大的不同,有的系統(tǒng)能夠滿足其設(shè)計要求,而有的系統(tǒng)則運行緩慢,過熱,甚至失敗。不論哪種情況,最終是由系統(tǒng)設(shè)計團隊承擔(dān)責(zé)任,他們一般很少掌握控制器的信息。
成功還是失敗都源自我們要求DRAM控制器所做的工作。模塊不僅僅是一個接口。在高級系統(tǒng)設(shè)計中,DRAM控制器必須很好的處理SoC體系結(jié)構(gòu)復(fù)雜而又難以預(yù)測的存儲器申請,以及一側(cè)的系統(tǒng)軟件申請,還有另一側(cè)DRAM芯片設(shè)計復(fù)雜的時序和約束要求。能否處理好這些關(guān)系會在多個方面影響DRAM吞吐量:這很容易在系統(tǒng)性能上體現(xiàn)出來。
為解釋這些問題,以及系統(tǒng)設(shè)計人員能夠?qū)Υ俗鍪裁矗覀冃枰卮鹑齻€主要問題。首先,我們應(yīng)檢查DRAM芯片提出的要求。然后,需要討論SoC體系結(jié)構(gòu)對存儲器訪問模式的影響,第三,研究一個高級DRAM控制器的結(jié)構(gòu)和功能。通過這三部分,我們得出系統(tǒng)設(shè)計的一些結(jié)論。
DRAM需要什么
系統(tǒng)規(guī)劃對外部存儲器的要求是確定性隨機訪問:任何時候來自任何位置的任意字,具有固定延時。但是,確定性隨機訪問恰恰是現(xiàn)代DDR3 DRAM所不能提供的。
相反,DRAM提供任何您需要的字,但是具有復(fù)雜的時序約束,因此,很難知道數(shù)據(jù)究竟什么時候出現(xiàn)。 圖1 中“簡化的”狀態(tài)轉(zhuǎn)換圖簡單解釋了為什么會這么復(fù)雜。這種復(fù)雜度也意味著,命令到達DRAM芯片的順序會對時序以及帶寬有很大的影響。要理解這一點,我們需要深入了解DDR3 DRAM。
圖1.DDR DRAM芯片“簡化的”狀態(tài)圖顯示了控制器設(shè)計人員所面臨的復(fù)雜問題
DRAM芯片將數(shù)據(jù)存儲在電容陣列中。當您讀寫數(shù)據(jù)時,您并不會直接訪問陣列。而是在讀寫之前,您激活陣列中的某一行。激活命令使得DRAM讀取該行中的所有列的所有比特,將其送入傳感放大器塊,它實際上用作該行的本地寄存器文件。然后,您可以對傳感放大器上的數(shù)據(jù)發(fā)出讀寫命令。通過這種方式,能夠非??斓淖x寫已經(jīng)激活的行:一般是三到五個時鐘來開始一次突發(fā)傳送,然后,在突發(fā)期間傳送每個字節(jié)需要一個時鐘。例如,這種時序安排使得DDR3 DRAM非常適合L2高速緩存數(shù)據(jù)交換。
但是,如果您不使用已經(jīng)激活的行,那么會非常復(fù)雜。改變行時,即使是一個字節(jié),您也必須對當前行去激活,然后激活一個新行。這一過程需要確定已經(jīng)在一段時間內(nèi)激活了當前行。由于讀取DRAM單元是破壞性的,因此需要最小延時:您激活了一行后,DRAM實際上是將最新到達傳感放大器上的數(shù)據(jù)復(fù)制回比特單元陣列中,然后刷新行。您可以在此期間讀寫當前行,但是,要確定在您改變行之前完成了這一過程。
即使?jié)M足了這一要求,也還有其他問題。您必須對陣列預(yù)充電。預(yù)充電命令使得傳感放大器中的數(shù)據(jù)無效,提升陣列和傳感放大器輸入之間導(dǎo)線上的電壓,使得電壓值位于邏輯0和邏輯1電平之間。這種準備是必要的,比特單元電容上很小的電荷都會傳送到導(dǎo)線上,以某種方式提示傳感放大器。
對導(dǎo)線進行預(yù)充電之后,您必須向新行發(fā)送一個激活命令,等待操作完成,然后,您最終可以發(fā)送一個讀操作新命令。加上所有涉及到的延時后,即,讀取字節(jié)序列的最差情況,每一字節(jié)都來自不同的行,這要比讀取來自一個新行連續(xù)位置相同數(shù)量字節(jié)的時間慢十倍。
這種不同還只是部分問題。如圖2 所示,DDR DRAM有多個塊:與比特單元無關(guān)的陣列。DDR3 DRAM中有八個塊,每一塊都有自己排列成行的傳感放大器。因此,原理上,您可以通過激活每一個塊中的一行,讀寫較長的突發(fā),然后,對每一激活后的行進行讀寫操作——實際上是對塊進行間插操作。唯一增加的延時是連接每一塊的傳感放大器和芯片內(nèi)部總線的緩沖的切換時間。這一延時要比對相同塊中一個新行進行預(yù)充電和激活的時間短得多。
圖2.一個典型的DDR DRAM結(jié)構(gòu)圖。一個DDR3器件會有8個塊,而不是4個
這就是原理。實際中,您可以對塊進行間插處理,但是有一個限制,不是基于DRAM邏輯,而是芯片能夠承受的熱量。這種限制可以通過著名的“滾動四塊訪問窗口”,即,tRAW來表達:您一次能夠有四個激活塊的最長時間。這一規(guī)則實際上有例外,只要您從一個塊轉(zhuǎn)向下一塊之前,在一個塊上保持一定的時間,那么,您可以有連續(xù)激活的8個塊。但是您應(yīng)該知道:這比較復(fù)雜。
評論