TMS320C54XDSP混合編程的方法研究
摘要:提出并分析了在考慮程序代碼效率、執(zhí)行效率和程序的可讀性及可移植性的情況下,對(duì)于TMS320C54X系列,采用C語(yǔ)言和匯編語(yǔ)言混合編程的優(yōu)點(diǎn);詳細(xì)闡述了混合編程方法的特點(diǎn)、應(yīng)遵循的規(guī)則和詳細(xì)接口規(guī)范;給出了程序設(shè)計(jì)實(shí)例。
本文引用地址:http://www.biyoush.com/article/242267.htm關(guān)鍵詞:數(shù)字信號(hào)處理(DSP) TMS320C54X 混合編程
數(shù)字信號(hào)處理技術(shù)是一門涉及許多學(xué)科的新技術(shù),廣泛應(yīng)用于軍事、工業(yè)、航空、航天等諸多領(lǐng)域。數(shù)字信號(hào)處理技術(shù)由于其運(yùn)行量大和實(shí)現(xiàn)算法復(fù)雜,通常采用專用的DSP芯片來實(shí)現(xiàn)。美國(guó)TI公司的TMS320C54X系列芯片是為實(shí)現(xiàn)低功耗和高性能而專門設(shè)計(jì)的定點(diǎn)DSP芯片。
TMS320C54X的主要特點(diǎn)包括:高運(yùn)算速度、優(yōu)化的CPU結(jié)構(gòu)、低功耗方式和智能外設(shè)等。
使用專用DSP芯片進(jìn)行設(shè)計(jì)與開發(fā)包括硬件和軟件兩個(gè)方面。通常有以下三種軟件設(shè)計(jì)方式:
(1)完全用C語(yǔ)言開發(fā)。TI公司提供了用于C語(yǔ)言開發(fā)的CCS(CODE COMPOSER STUDIO)平臺(tái)。該平臺(tái)包括了優(yōu)化ANSI C編譯器,從而可以在C源程序級(jí)進(jìn)行開發(fā)調(diào)方式。這種方式大大提高了軟件的開發(fā)速度和可讀性,方便了軟件的修改和移植。但是,在某些情況下,C代碼的效率還是無法與手工編寫的匯編代碼的效率相比,如FFT編程。這是因?yàn)榧词棺罴训腃編譯器,也無法在所有的飛速下都能夠最合理地利用DSP芯片所提供的各種資源。此外,用C語(yǔ)言實(shí)現(xiàn)DSP芯片的某些硬件控制也不如匯編程序方便,有些甚至無法用C語(yǔ)言實(shí)現(xiàn)。
(2)完全有匯編語(yǔ)言開發(fā),TI公司提供了用于匯編語(yǔ)言開發(fā)的針對(duì)TMS320C54X的匯編語(yǔ)言。用戶可以用它進(jìn)行軟件開發(fā)。此種方式可以更為合理地充分利用DSP芯片提供的硬件資源,其代碼效率高,程序執(zhí)行速度快。但是用DSP芯片的匯編語(yǔ)言編寫程序是比較繁雜的。一般來說,不同公司的芯片匯編語(yǔ)言是不同的,即使是同一公司的芯片,由于片類型的不同(如定點(diǎn)和浮點(diǎn)),芯片的升級(jí)換代,其匯編語(yǔ)言也不同。因此,用匯編語(yǔ)言開發(fā)基于某種DSP芯片的產(chǎn)品周期較長(zhǎng),并且軟件的修改和升級(jí)較困難,這些都是因?yàn)閰R編語(yǔ)言的可讀性和可移植性較差所致。
(3)用C語(yǔ)言和匯編語(yǔ)言混合編程開發(fā)。為了充分利用DSP芯片的資源,更好地發(fā)揮C語(yǔ)言和匯編語(yǔ)言進(jìn)行軟件開發(fā)的各自的優(yōu)點(diǎn),可以將兩者有機(jī)結(jié)合起來,兼顧兩者的優(yōu)點(diǎn),避免其弊端。因此,在很多情況下,采用混合編程方法能更好地達(dá)到設(shè)計(jì)要求,完成設(shè)計(jì)功能。但是,采用C語(yǔ)言和匯編語(yǔ)言混合編程必須遵循一些有關(guān)的規(guī)則,否則會(huì)遇到一些意想不到的問題,給開發(fā)設(shè)計(jì)帶來許多麻煩。
本文提出了基于DSP(TMS320C54X)的C語(yǔ)言和匯編語(yǔ)言混合編程的程序設(shè)計(jì)方法,并給出了混合編程應(yīng)遵循的規(guī)則和需要注意的一些問題。
1 TMS320C54X的C語(yǔ)言和匯編語(yǔ)言混合編程方法
C語(yǔ)言和匯編語(yǔ)言的混合編程有以下幾種方法:
(1)獨(dú)立編寫編編程序和C程序,分開編譯或匯編形成各自的目標(biāo)代碼模塊,用鏈接器將C模塊和匯編模塊鏈接起來,這是一種靈活性較大的方法。采用這種方法,C程序可以調(diào)用匯編程序,并且可以訪問匯編程序中定義的變量。同樣,匯編程序也可以調(diào)用C程序或訪問C程序中定義的變量。但用戶必須自己維護(hù)各匯編模塊的入口和出口代碼,自己計(jì)算傳遞的參數(shù)在堆棧中的偏移量,工作量稍大,但能做到對(duì)程序的絕對(duì)控制。
(2)在C程序中直接內(nèi)嵌匯編語(yǔ)句。此種方法可以在C程序中實(shí)現(xiàn)C語(yǔ)言無法實(shí)現(xiàn)的一些硬件控制功能,如修改中斷控制寄存器、中斷標(biāo)志寄存器等。嵌入?yún)R編語(yǔ)句的方法比較簡(jiǎn)單,只需在匯編語(yǔ)句的兩邊加上括號(hào)和雙引號(hào),并且在括號(hào)前加上asm標(biāo)識(shí)符即可,即asm(“匯編語(yǔ)句”)。
但是,采用此種方法必須注意以下幾點(diǎn):
①括號(hào)中的匯編語(yǔ)句必須以標(biāo)號(hào)、空格、tab、分號(hào)開頭,這和通常的匯編編程的語(yǔ)法一樣。
②不要破壞C環(huán)境,因?yàn)镃編譯器并不檢查和分析嵌入的匯編語(yǔ)句。
③插入跳轉(zhuǎn)語(yǔ)句和標(biāo)號(hào)會(huì)產(chǎn)生不可預(yù)測(cè)的結(jié)果。
④匯編語(yǔ)句不要改變C程序中變量的值。
⑤不要在匯編語(yǔ)句中加入?yún)R編器選項(xiàng)而改變匯編環(huán)境。
(3)將C程序編譯生成相應(yīng)的匯編程序,手工修改和優(yōu)化C編譯器生成的匯編代碼。采用此種方法可以控制C編程器從而產(chǎn)生個(gè)有交叉列表的匯編程序,而且程序員可能對(duì)其中的匯編語(yǔ)句進(jìn)行修改。之后,對(duì)匯編程序進(jìn)行匯編可產(chǎn)生目標(biāo)文件。注意,修改匯編語(yǔ)句時(shí)切勿破壞C環(huán)境。
2 混合編程應(yīng)遵循的規(guī)則和詳細(xì)的接口規(guī)范
2.1 寄存器規(guī)則
在C環(huán)境中,定義了嚴(yán)格的寄存器規(guī)則。寄存器規(guī)則明確了編譯器如何使用寄存器以及在函數(shù)調(diào)用過程中如何保護(hù)寄存器。調(diào)用函數(shù)時(shí),被調(diào)用函數(shù)負(fù)責(zé)保護(hù)某些寄存器,這些寄存器不必由調(diào)用者來保護(hù)。如果調(diào)用者需要使用沒有保護(hù)的寄存器,則調(diào)用者在調(diào)用函數(shù)前必須予以保護(hù)。下面具體說明寄存器規(guī)則:
(1)輔助寄存器AR1、AR6、AR7由被調(diào)用函數(shù)保護(hù),即可以在函數(shù)執(zhí)行過程中修改,但在函數(shù)返回時(shí)必須恢復(fù)。在TMS320C54X中,編譯器將AR1和AR6用作寄存器變量。其中,AR1被用作第一個(gè)寄存器變量,AR6被有作第二個(gè)寄存器變量,其順序不能改變。
AR0、AR2、AR3、AR4、AR5可以自由使用,即在函數(shù)執(zhí)行過程中可以修改,而且不必恢復(fù)。
(2)堆棧指針SP在函數(shù)調(diào)用時(shí)必須予以保護(hù),但其是自動(dòng)保護(hù)的,即在返回時(shí),壓入椎棧的內(nèi)容都將被全部彈出。
(3)ARP在函數(shù)進(jìn)入和返回時(shí),必須為0,即當(dāng)前輔助寄存器為AR0。函數(shù)執(zhí)行時(shí)可以是其它值。
(4)在缺省的情況下,編譯器總是認(rèn)為OVM為0。因此,若在匯編程序中將OVM置為1,則在返回C環(huán)境時(shí),必須將其恢復(fù)為0。
(5)其它狀態(tài)位和寄存器在子程序中可以任意使用,不必恢復(fù)。
2.2 標(biāo)識(shí)符合名規(guī)則
C編譯器將C程序定義的所有標(biāo)識(shí)符前都加一下劃線(-)。因此,必須將在C程序中要引用的匯編變量和匯編模塊子程序的名字前加上下劃線(-)。如果變量?jī)H在匯編模塊中使用,則不加下劃線(-)的變量名可以任意使用,而不會(huì)與C標(biāo)識(shí)符發(fā)生沖突。
2.3 函數(shù)調(diào)用規(guī)則
C編譯器規(guī)定了一組嚴(yán)格的函數(shù)調(diào)用規(guī)則。除了特殊的運(yùn)行支持函數(shù)外,任何調(diào)用C函數(shù)或被C函數(shù)所調(diào)用的函數(shù)都必須遵循這些規(guī)則,否則就會(huì)破壞C環(huán)境,造成不可預(yù)測(cè)的結(jié)果。
2.3.1 參數(shù)傳遞
函數(shù)調(diào)用前,將參數(shù)以逆序壓入運(yùn)行堆棧,即最右邊的參數(shù)最先入棧,然后自右向左將參數(shù)依次入棧。但是,對(duì)于TMS320C54X,在函數(shù)調(diào)用時(shí),第一個(gè)參數(shù)放入累加器A中進(jìn)行傳遞。若參數(shù)是長(zhǎng)整型和浮點(diǎn)數(shù)時(shí),則低位字先壓棧,高位字后壓棧。若參數(shù)中有結(jié)構(gòu)形式,則調(diào)用函數(shù)給結(jié)構(gòu)分配空間,其地址通過累加器A傳遞給被調(diào)用函數(shù)。
2.3.2 結(jié)果返回
函數(shù)調(diào)用結(jié)束后,將返回值置于累加器A中。整數(shù)和指針在累加器A的低16位中返回。浮點(diǎn)數(shù)和長(zhǎng)整型數(shù)在累加器A的32位中返回。
2.3.3 函數(shù)調(diào)用時(shí)需注意的一些問題
參數(shù)不是由被調(diào)用函數(shù)彈出椎棧,而是由調(diào)用函數(shù)彈出。因此調(diào)用函數(shù)可以傳遞任意數(shù)目的參數(shù)至函數(shù),而且函數(shù)不必知道有多少個(gè)參數(shù)傳遞。
在匯編程序中,除了自動(dòng)初始化全局變量外,不要將.cinit段用作其它用途。C程序在boot.asm中的啟動(dòng)程序認(rèn)為.cinit段中放置的全部是初始化表,因此將其它一些信息放入.cinit段將產(chǎn)生不可預(yù)料的結(jié)果。
如果要定義在C程序中訪問的匯編變量或調(diào)用的匯編子程序,則必須在匯編程序中用.global說明為外部;同樣,如果要定義在匯編程序中要調(diào)用的C函數(shù)或訪問變量,也必須在C程序中將其以exterm說明為外部。
下面給出具體例子。
C程序:
Extern int asmfunc ( ); /*聲明外部的匯編子程序*/
/*注意函數(shù)名前不要加下劃線*/
int gvar; /*定義全局變量*/
main( )
{
int I=3;
I=asmfunc(i); /*進(jìn)行函數(shù)調(diào)用*/
}
匯編程序:
_asmfunc: ;函數(shù)名膠一定要有下劃線
ADD *(-gvar),A ;I的值在累加器A中
STL A,*(-gvar) ;返回結(jié)果在累加器A中
RETD ;子程序返回
3 C語(yǔ)言和匯編語(yǔ)言混合編程軟件設(shè)計(jì)要點(diǎn)和具體設(shè)計(jì)實(shí)例
在智能測(cè)試儀表的軟件設(shè)計(jì)中,要完成對(duì)振動(dòng)信號(hào)進(jìn)行數(shù)據(jù)采集,從而進(jìn)行頻譜分析的主要功能。在這個(gè)具體實(shí)例中,主程序要完成系統(tǒng)的實(shí)始化,進(jìn)行用戶操作界面顯示,并且進(jìn)行鍵值查詢,根據(jù)按鍵值決定程序的流程,從而完成儀器設(shè)計(jì)要求的各項(xiàng)功能。主程序?qū)\(yùn)行速度和代碼效率要求不高,但要求可讀性強(qiáng)且修改維護(hù)容易,因此采和C語(yǔ)言實(shí)現(xiàn)。另外一些子程序如FFT算法,對(duì)運(yùn)行速度要求較高,可用匯編語(yǔ)言實(shí)現(xiàn)。而DSP與PC機(jī)的通訊與硬件串口有關(guān),采用匯編語(yǔ)言易于實(shí)現(xiàn)編程,因此也采用匯編語(yǔ)言鈄其做成子程序,而在C語(yǔ)言編寫的主程序中調(diào)用它。
在實(shí)際的系統(tǒng)軟件設(shè)計(jì)中,可以根據(jù)具體情況來選擇將某一模塊或某一子程序用C語(yǔ)言或匯編語(yǔ)言來實(shí)現(xiàn),從而更充分地發(fā)揮兩者的優(yōu)勢(shì),將DSP技術(shù)更加充分地利用于各種系統(tǒng)設(shè)計(jì)中。
在此,僅以A/D數(shù)據(jù)采集為例來具體說明C語(yǔ)言和匯編語(yǔ)言的相互調(diào)用問題。由于篇幅有限,僅列出與混合編程及相互調(diào)用相關(guān)的部分程序以供分析和參考。
C程序:
Extern void ad1247( ); /*定義外部的匯編函數(shù)*/
/*函數(shù)名前不必加下劃線*/
main( ) /*主程序*/
{
int adlength=2048; /*數(shù)據(jù)的采樣長(zhǎng)度*/
int adfreq=40; /*數(shù)據(jù)采樣頻率*/
.
.
}
匯編程序:
.mmregs
FP .set AR7
.sect.text
.global_ad1247 ;定義匯編子程序,以global說明要被外部的C程序調(diào)用,函數(shù)名前要有劃線
.bss len,1 ;定義局部變量len
.bss freq,1 ;定義局站變量freq,變量名前不必加下劃線
.
.
.
_ad1247 ;程序入口
PSHM AR6 ;保護(hù)AR6
PSHM AR7 ;保護(hù)AR6
PSHM AR1 ;保護(hù)AR1
FRAME #-16 ;為建立的局部幀分配空間函數(shù)體
STL A,*(len) ;將置于累加器A的第一個(gè)參數(shù)傳給變量len
SSBX CPL ;用SP的直接尋址方式
LD @17,A ;第二個(gè)參數(shù)的偏移地址
STL A,*(freq) ;將置于堆棧中的第二個(gè)參數(shù)傳給變量freq
.
.
.
FRAME #16 ;釋放局部幀的空間
POPM AR1 ;恢復(fù) AR1
POPM AR7 ;恢復(fù) AR7
POPM AR6 ;恢復(fù) AR6
RET ;返回
其中有關(guān)函數(shù)調(diào)用中堆棧的使用和分配,詳見圖1.
由以上的例子可以看出,采用C語(yǔ)言和匯編語(yǔ)言混合諧和的方法,可以大大提高編程的效率,使程序設(shè)計(jì)者可以把精力更多地集中到算法的實(shí)現(xiàn)上,而不必關(guān)心寄存器的使用和安排;在一些要求代碼執(zhí)行效率高的地方可以用匯編語(yǔ)言來實(shí)現(xiàn),從而可以編寫出高效的處理程序,將DSP技術(shù)更加充分地利用于各種系統(tǒng)設(shè)計(jì)中。
評(píng)論