關(guān)于H.264視頻編碼傳輸?shù)腝oS特性分析
4. 冗余片方法
H.264中參考圖像的選擇與以前在H.263中的一樣,在基于反饋的系統(tǒng)中,解碼器接收到丟失或被破壞的圖像信息時,選擇參考圖像序列中正確的參考宏塊,來進行錯誤恢復;而對于無反饋的系統(tǒng),H.264提出了冗余分片編碼。
冗余分片允許編碼器把在同一個碼流中添加同一MB的一個或更多冗余表示。需要注意的是這些冗余片的編碼參數(shù)與非冗余片的編碼參數(shù)不同,例如主片可用低QP(高質(zhì)量)來編碼,而冗余信息中能用一個高QP(低質(zhì)量)的方式來編碼,這樣質(zhì)量粗糙一些但碼率更低。解碼器在重構(gòu)時,首先使用主片,如果它可用就拋棄冗余片;而如主片丟失(比如因為包的丟失)冗余片也能被用于重構(gòu)。冗余片主要用于支持高誤碼的移動環(huán)境。
5. 幀內(nèi)編碼
H.264中幀內(nèi)編碼大體上類似于以往的視頻編碼標準,但也進行了重要的改進,主要體現(xiàn)在:
?。?)H.264中幀內(nèi)預測宏塊的參考宏塊可以是幀間編碼宏塊,幀內(nèi)預測宏塊并不像H.263中的幀內(nèi)編碼一樣,而采用預測的幀內(nèi)編碼比非預測的幀內(nèi)編碼有更好的編碼效率,但降低了幀內(nèi)編碼的重同步性能,可以通過設置限制幀內(nèi)預測標記來恢復這一性能。
(2)只包含幀內(nèi)宏塊的片有兩種,一種是幀內(nèi)片(I Slice),一種是立即刷新片(IDR Slice)。立即刷新片需存在于立即刷新圖像(IDR Picture)中。與短期參考圖像相比,立即刷新圖像有更強壯的重同步性能。
為了更適用無線IP網(wǎng)絡環(huán)境中的應用,H.264通過采用率失真優(yōu)化編碼和設置幀內(nèi)預測標志,來提高幀內(nèi)圖像的重同步性能。
四、H.264的網(wǎng)絡提取層的錯誤恢復
NAL支持眾多基于包的有線/無線通信網(wǎng)絡,諸如H.320、MPEG-2和RTP/IP等。但目前,絕大部分的視頻應用所采用的網(wǎng)絡協(xié)議層次是RTP/UDP/IP,因此在下面的描述中主要基于這個傳輸框架。下面首先分析NAL層的基本處理單元NALU以及它的網(wǎng)絡封裝、分割和合并的方法。
1. NAL單元
每個NAL單元是一個一定語法元素的可變長字節(jié)字符串,包括包含一個字節(jié)的頭信息(用來表示數(shù)據(jù)類型),以及若干整數(shù)字節(jié)的負荷數(shù)據(jù)。一個NAL單元可以攜帶一個編碼片、A/B/C型數(shù)據(jù)分割或一個序列或圖像參數(shù)集。
NAL單元按RTP序列號按序傳送。其中,T為負荷數(shù)據(jù)類型,占5bit;R為重要性指示位,占2個bit;最后的F為禁止位,占1bit。具體如下:
?。?)NALU類型位
可以表示NALU的32種不同類型特征,類型1~12是H.264定義的,類型24~31是用于H.264以外的,RTP負荷規(guī)范使用這其中的一些值來定義包聚合和分裂,其他值為H.264保留。
?。?)重要性指示位
用于在重構(gòu)過程中標記一個NAL單元的重要性,值越大,越重要。值為0表示這個NAL單元沒有用于預測,因此可被解碼器拋棄而不會有錯誤擴散;值高于0表示此NAL單元要用于無漂移重構(gòu),且值越高,對此NAL單元丟失的影響越大。
(3)禁止位
編碼中默認值為0,當網(wǎng)絡識別此單元中存在比特錯誤時,可將其設為1,以便接收方丟掉該單元,主要用于適應不同種類的網(wǎng)絡環(huán)境(比如有線無線相結(jié)合的環(huán)境)。例如對于從無線到有線的網(wǎng)關(guān),一邊是無線的非IP環(huán)境,一邊是有線網(wǎng)絡的無比特錯誤的環(huán)境。假設一個NAL單元到達無線那邊時,校驗和檢測失敗,網(wǎng)關(guān)可以選擇從NAL流中去掉這個NAL單元,也可以把已知被破壞的NAL單元前傳給接收端。在這種情況下,智能的解碼器將嘗試重構(gòu)這個NAL單元(已知它可能包含比特錯誤)。而非智能的解碼器將簡單地拋棄這個NAL單元。NAL單元結(jié)構(gòu)規(guī)定了用于面向分組或用于流的傳輸子系統(tǒng)的通用格式。在H.320和MPEG-2系統(tǒng)中,NAL單元的流應該在NAL單元邊界內(nèi),每個NAL單元前加一個3字節(jié)的起始前綴碼。在分組傳輸系統(tǒng)中,NAL單元由系統(tǒng)的傳輸規(guī)程確定幀界,因此不需要上述的起始前綴碼。一組NAL單元被稱為一個接入單元,定界后加上定時信息(SEI),形成基本編碼圖像。該基本編碼圖像(PCP)由一組已編碼的NAL單元組成,其后是冗余編碼圖像(RCP),它是PCP同一視頻圖像的冗余表示,用于解碼中PCP丟失情況下恢復信息。如果該編碼視頻圖像是編碼視頻序列的最后一幅圖像,應出現(xiàn)序列NAL單元的end,表示該序列結(jié)束。一個圖像序列只有一個序列參數(shù)組,并被獨立解碼。如果該編碼圖像是整個NAL單元流的最后一幅圖像,則應出現(xiàn)流的end?!?
H.264采用上述嚴格的接入單元,不僅使H.264可自適應于多種網(wǎng)絡,而且進一步提高其抗誤碼能力。序列號的設置可發(fā)現(xiàn)丟的是哪一個VCL單元,冗余編碼圖像使得即使基本編碼圖像丟失,仍可得到較“粗糙”的圖像。
2. H.264中的RTP
上面闡述了NAL單元的結(jié)構(gòu)和實現(xiàn),這里要詳細討論RTP的載荷規(guī)范和抗誤碼性能。RTP可通過發(fā)送冗余信息來減少接收端的丟包率,會增加時延,與冗余片不同的是它增加的冗余信息是個別重點信息的備份,適合于非平等保護機制。相應的多媒體傳輸規(guī)范有:
?。?)分組復制多次重發(fā),發(fā)送端對最重要的比特信息分組進行復制重發(fā),使得保證接收端能至少正確接收到一次,同時接收端要丟棄已經(jīng)正確接收的分組的多余備份。
(2)基于分組的前向糾錯,對被保護的分組進行異或運算,將運算結(jié)果作為冗余信息發(fā)送到接收方。由于時延,不用于對話型應用,可用于流媒體。
?。?)音頻冗余編碼,可保護包括視頻在內(nèi)的任何數(shù)據(jù)流。每個分組由頭標、載荷以及前一分組的載荷組成,H.264中可與數(shù)據(jù)分割一起使用。
評論