基于TMS320DM3730的H.264編碼器移植與優(yōu)化方法研
摘要:提出了一種在TI公司高性能數(shù)字信號處理器TMS320DM3730上進行H.264編碼器(即x264編碼器)移植與優(yōu)化的方法,詳細描述了在CCS4.2開發(fā)平臺上進行x264編碼器移植工作的基本原理和需要注意的問題。為了提高編碼速度,針對DM3730處理器的結(jié)構(gòu)特點,對x264編碼器進行了優(yōu)化,主要方法包括編譯器優(yōu)化、內(nèi)存優(yōu)化、C語言代碼優(yōu)化及匯編代碼優(yōu)化。對x264編碼器進行的CIF格式編碼測試結(jié)果表明,在均值信噪比略微降低的前提下,編碼速度得到了顯著提高,因此獲得了更優(yōu)的編碼效率。
關鍵詞:TMS320DM3730;H.264標準;x264編碼器;移植與優(yōu)化
H.264/AVC是ISO/IEC和ITU-T聯(lián)合推出的新一代的視頻編碼標準。其具有高壓縮率、高圖像質(zhì)量、良好的網(wǎng)絡親和性等優(yōu)點,被廣泛的應用于各個視頻相關產(chǎn)業(yè)中。在相同的圖像質(zhì)量的前提下,和傳統(tǒng)的視頻標準MPEG-4相比,H.264的碼率只有MPEG-4的1/3。但是,H.2 64算法非常復雜,要實現(xiàn)實時編碼是比較困難的。因此,如何將H.264編碼器進行移植和優(yōu)化,使其用于實際產(chǎn)品中成為了研究的熱點。
DSP芯片技術(shù)的快速發(fā)展為實現(xiàn)嵌入式多媒體技術(shù)提供了可能。TMS320DM3730(簡稱DM3730)作為TI公司2010年推出的高性能芯片,以其ARM+DSP結(jié)構(gòu)體系、運算速度快、眾多多媒體接口等優(yōu)點成為進行嵌入式系統(tǒng)開發(fā)首選平臺之一。
常用的H.264編碼器有JM編碼器、x264編碼器,T264編碼器,x264編碼器作為其中應用最廣,效率最好的編碼器,是進行嵌入式開發(fā)的首選H.264編碼器。故本文在DM3730數(shù)字媒體處理器上進行x264編碼器的移植與優(yōu)化。本文首先介紹了DM3730的基本的結(jié)構(gòu)和特點;然后結(jié)合DM3730的DSP,介紹了x264編碼器的移植和優(yōu)化;最后進行編碼測試,結(jié)果表明編碼器移植的正確性,編碼速度得到了極大提高。
1 DM3730簡單介紹
DM3730數(shù)字媒體處理器是美國德州儀器(TI)推出的一款高性能達芬奇(DaVinci)芯片,由1 GHz的ARM Coretex—A8和800 MHz的TMS320 C64x+DSP Core兩部分組成,并集成了包括3D圖像處理器,圖像采集,USB2.0等模塊。其整體結(jié)構(gòu)如圖1所示。
DM3730中ARM核作為主控制部分,負責整個芯片部分的設備的配置和控制、內(nèi)存的分配、同外部接口的數(shù)據(jù)的交換;DSP核主要進行數(shù)據(jù)的處理和計算,其主頻高達800MHz,采用VLIW(超長指令字)體系結(jié)構(gòu),包含8個獨立的功能單元,每個功能單元在每個時鐘周期執(zhí)行一條指令,最高運算速度高達6 400 MMACS(百萬乘法累加周期每秒)。同時擁有A、B兩個通用寄存器組。每個都有32個32-bits寄存器組成,每個通用寄存器都可以存放數(shù)據(jù)、地址和指針。
2 x264的移植
CCS(Code Composer Stdio)是TI公司提供的用于C語言開發(fā)的開發(fā)平臺,該平臺可以使用C語言進行DSP程序的開發(fā)。本文基于CCS4.2平臺進行x264編碼器的移植,具體流程如圖2所示。
評論