便攜式移動電視接收系統(tǒng)淺析
⑥為提高抗數(shù)據(jù)丟失的能力,允許編碼器發(fā)送圖像區(qū)的冗余表示,當圖像區(qū)的主表示丟失時仍可以正確解碼。
⑦可以根據(jù)每個像條語法元素的范疇,將像條語法劃分為3部分,分開傳送。
下面就的幾個重要特性進行詳細介紹:
1、幀內(nèi)預測
對I幀的編碼是利用空間相關(guān)性而非時間相關(guān)性而實現(xiàn)的。以前的標準只利用了一個宏塊內(nèi)部的相關(guān)性,而忽視了宏塊之間的相關(guān)性,所以編碼后的數(shù)據(jù)量較大。為了進一步利用空間相關(guān)性,引入了幀內(nèi)預測以提高壓縮效率。簡單地說,幀內(nèi)預測編碼就是用周圍鄰近的象素值來預測當前的象素值,然后對預測誤差進行編碼。這種預測是基于塊的,對于亮度分量,塊的大小可以在16×16和4×4之間選擇,16×16塊有4種預測模式16×16 、 16×8 、 8×16 和 8×8,4×4塊有9種
預測模式;對于色度分量,預測是對整個8×8塊進行的,有4種預測模式。除了DC預測外,其他每種預測模式對應不同方向上的預測。
1)預測時所用塊的大小可變
假設(shè)基于塊的運動模型塊內(nèi)所有象素都做了相同的平移,在運動比較劇烈時或者在運動物體的邊緣處,這一假設(shè)會與實際出入較大,導致較大的預測誤差,這時減小塊的大小可以使假設(shè)在小的塊中依然成立。同時,小的塊所造成的塊效應相對也小,從而提高預測的效果。
一 共采用了7種方式對一個宏塊進行分割,每種方式下塊的大小和形狀都不相同,這就使編碼器可以根據(jù)圖像的內(nèi)容選擇最好的預測模式以提高預測效果。與僅使用16×16塊進行預測相比,使用不同大小和形狀的塊可以使碼率降低15%以上。
(2)更精細的預測精度
在中,亮度分量的運動矢量使用1/4象素精度。色度分量的運動矢量由亮度運動矢量導出,由于色度分量的分辨率是亮度分量的一半(對4∶2∶0),所以其運動矢量精度將為1/8。既一個單位的色度分量的運動矢量所代表的位移僅為色度分量取樣點間距離的1/8。如此精細的預測精度,比整數(shù)精度可使碼率降低20%以上。
(3)多參考幀
支持多參考幀預測,即可以有多于一個(最多5個)在當前幀之前的解碼幀作為參考幀,產(chǎn)生對當前幀的預測。這適用于視頻序列中含有周期性運動的情況。這種技術(shù),可以改善運動估計的性能,提高解碼器的錯誤恢復能力;但它也增加了緩存的容量,加大了編解碼器的復雜性。與只使用一個參考幀相比,使用5個參考幀可以使碼率降低5~10%。
(4)去塊效應濾波器
它的作用是消除經(jīng)反量化和反變換后重建圖像中由于預測誤差產(chǎn)生的塊效應,即消除塊邊緣處的象素值跳變,從而改善圖像的主觀質(zhì)量,并減小預測誤差。中的去塊效應濾波器還可以根據(jù)圖像內(nèi)容做出判斷,只對由于塊效應產(chǎn)生的象素值跳變進行平滑,而對圖像中物體邊緣處的象素值不連續(xù)給予保留,以免造成邊緣模糊。與以往的去塊效應濾波器同的是,經(jīng)過濾波后的圖像將根據(jù)需要放在緩存中用于幀間預測,而不是僅僅在輸出重建圖像時用來改善主觀質(zhì)量。對于幀內(nèi)預測,使用的是未經(jīng)過濾波的重建圖像。
3、整數(shù)變換
對幀內(nèi)或幀間預測的殘差進行DCT編碼。為了避免舍入誤差造成的編碼器和解碼器之間不匹配的問題,對DCT的定義做了修改,使得變換僅用整數(shù)加減法和移位操作即可實現(xiàn),這樣在不考慮量化影響的情況下,解碼端的輸出可以準確地恢復編碼端的輸入。當然,這樣做的代價是壓縮性能略微下降。此外,該變換是針對4×4塊進行的,這也有助于減小塊效應。
為了進一步利用圖像的空間相關(guān)性,在對色度分量的預測殘差和16×16幀內(nèi)預測的預測殘差進行上述整數(shù)DCT之后,標準還將每個4×4變換系數(shù)塊中的DC系數(shù)組成2×2或4×4大小的塊,進一步做哈達瑪(Hadamard)變換。
4、熵編碼
對于Slice層以上的數(shù)據(jù),采用Exp-Golomb碼,這是一種沒有自適應能力的VLC。而對于Slice層(含)以下的數(shù)據(jù),如果是殘差,有兩種熵編碼方式:基于上下文的自適應變長碼(CAVLC)和基于上下文的自適應二進制算術(shù)編碼(CABAC);如果不是殘差,采用Exp-Golomb碼或CABAC編碼,視編碼器的設(shè)置而定。
(1)CAVLC
VLC的基本思想就是對出現(xiàn)頻率高的符號使用較短的碼字,而對出現(xiàn)頻率低的符號采用較長的碼字。這樣可以使得平均碼長最小。
在CAVLC中,采用若干VLC碼表,不同的碼表對應不同的概率模型。編碼器能夠根據(jù)上下文,如周圍塊的非零系數(shù)或系數(shù)的絕對值大小,在這些碼表中自動地選擇,盡可能地與當前數(shù)據(jù)的概率模型匹配,從而實現(xiàn)上下文自適應的功能。
(2)CABAC
算術(shù)編碼是一種高效的熵編碼方案,其每個符號所對應的碼長被認為是分數(shù)。由于對每一個符號的編碼都與以前編碼的結(jié)果有關(guān), 所以它考慮的是信源符號序列整體的概率特性,而不是單個符號的概率特性,從而能夠更大程度地逼近信源的極限熵,降低碼率。
中的CABAC實現(xiàn)了繞開算術(shù)編碼中無限精度小數(shù)的表示問題和對信源符號概率進行估計的問題。在CABAC中,每編碼一個二進制符號,編碼器就會自動調(diào)整對信源概率模型(用一個“狀態(tài)”來表示)的估計,隨后的二進制符號就在這個新的概率模型基礎(chǔ)上進行編碼。這樣的編碼器不需要信源統(tǒng)計特性的先驗知識,而是在編碼過程中自適應地估計。這使得CABAC有更大的靈活性,可以獲得更好的編碼性能—碼率降低大約10%。
5、SP Slice
SP Slice的主要目的是用于不同碼流的切換,也可用于碼流的隨機訪問、快進/快退和錯誤恢復。這里指的不同碼流,是指在不同比特率限制下對同一信源進行編碼所產(chǎn)生的碼流。設(shè)切換前傳輸碼流中最后一幀為Al,切換后的目標碼流第一幀為B2(假設(shè)是P幀),由于B2的參考幀不存在,直接切換顯然會導致嚴重失真,而且這種失真會向后傳遞。簡單的解決方法就是傳輸幀內(nèi)編碼的B2,但是一般I幀的數(shù)據(jù)量很大,這種方法會造成傳輸碼率陡然增大。根據(jù)前面的假設(shè),由于是對同一信源進行編碼,盡管比特率不同,但切換前后的兩幀必然有相當大的相關(guān)性,所以編碼器可以將Al作為B2的參考幀,對B2進行幀間預測,預測誤差就是SP Slice,然后通過傳遞SP Slice完成碼流的切換。與常規(guī)P幀不同的是,生成SP Slice所進行的預測是在Al和B2的變換域中進行的。SP Slice要求切換后B2的圖像和直接傳送目標碼流時一樣。當然,如果切換的目標是毫不相關(guān)的另一碼流,SP Slice就不適用了。
評論