視頻壓縮技術解析
1. 奈奎斯特取樣定理
理想取樣時, 只要取樣頻率大于或等于模擬信號中最高頻率的兩倍, 就可以不失真地恢復模擬信號, 稱為奈奎斯特取樣定理。 模擬信號中最高頻率的兩倍稱為折疊頻率。
2. 亞奈奎斯特取樣
按取樣定理, 若取樣頻率fs小于模擬信號最高頻率fmax的2倍會產(chǎn)生混疊失真, 但若巧妙地選擇取樣頻率, 令取樣后頻譜中的混疊分量落在色度分量和亮度分量之間, 就可用梳狀濾波器去掉混疊成分。 本文引用地址:http://www.biyoush.com/article/165860.htm
3. 均勻量化和非均勻量化
在輸入信號的動態(tài)范圍內(nèi), 量化間隔幅度都相等的量化稱為均勻量化或線性量化。 對于量化間距固定的均勻量化, 信噪比隨輸入信號幅度的增加而增加, 在強信號時固然可把噪波淹沒掉, 在弱信號時, 噪波的干擾就十分顯著。
為改善弱信號時的信噪比, 量化間距應隨輸入信號幅度而變化, 大信號時進行粗量化, 小信號時進行細量化, 也就是采用非均勻量化(或稱非線性量化)。
非均勻量化有兩種方法, 一是把非線性處理放在編碼器前和解碼器后的模擬部分, 編、 解碼仍采用均勻量化, 在均勻量化編碼器之前, 對輸入信號進行壓縮, 這樣等效于對大信號進行粗量化, 小信號進行細量化; 在均勻量化解碼器之后, 再進行擴張, 以恢復原信號。 另一種方法是直接采用非均勻量化器, 輸入信號大時進行粗量化(量化間距大) , 輸入信號小時細量化(量化間距小)。 也有采用若干個量化間距不等的均勻量化器, 當輸入信號超過某一電平時進入粗間距均勻量化器, 低于某一電平時進入細間距量化器, 稱為準瞬時壓擴方式。
通常用Q表示量化, 用Q-1表示反量化。 量化過程相當于由輸入值找到它所在的區(qū)間號, 反量化過程相當于由量化區(qū)間號得到對應的量化電平值。 量化區(qū)間總數(shù)遠遠少于輸入值的總數(shù), 所以量化能實現(xiàn)數(shù)據(jù)壓縮。 很明顯, 反量化后并不能保證得到原來的值, 因此量化過程是一個不可逆過程, 用量化的方法來進行壓縮編碼是一種非信息保持型編碼。 通常這兩個過程均可用查表方法實現(xiàn), 量化過程在編碼端完成, 而反量化過程則在解碼端完成。
對量化區(qū)間標號(量化值)的編碼一般采用等長編碼方法。 當量化分層總數(shù)為K時, 經(jīng)過量化壓縮后的二進制數(shù)碼率為lbK比特/量值。 在一些要求較高的場合, 可采用可變字長編碼如哈夫曼編碼或算術編碼來進一步提高編碼效率。
6.1.3 ITU-R BT.601分量數(shù)字系統(tǒng)
數(shù)字視頻信號是將模擬視頻信號經(jīng)過取樣、 量化和編碼后形成的。 模擬電視有PAL、 NTSC等制式, 必然會形成不同制式的數(shù)字視頻信號, 不便于國際數(shù)字視頻信號的互通。 1982年10月, 國際無線電咨詢委員會(CCIR, Consultative Committee for International Radio)通過了第一個關于演播室彩色電視信號數(shù)字編碼的建議, 1993年變更為ITU-R(國際電聯(lián)無線電通信部分, International Telecommunications Union-Radio communications Sector)BT.601分量數(shù)字系統(tǒng)建議。
BT.601建議采用了對亮度信號和兩個色差信號分別編碼的分量編碼方式, 對不同制式的信號采用相同的取樣頻率13.5 MHz, 與任何制式的彩色副載波頻率無關, 對亮度信號Y的取樣頻率為13.5 MHz。 由于色度信號的帶寬遠比亮度信號的帶寬窄, 對色度信號U和V的取樣頻率為6.75 MHz。 每個數(shù)字有效行分別有720個亮度取樣點和360×2個色差信號取樣點。 對每個分量的取樣點都是均勻量化, 對每個取樣進行8比特精度的PCM編碼。
這幾個參數(shù)對525行、 60場/秒和625行50場/秒的制式都是相同的。 有效取樣點是指只有行、 場掃描正程的樣點有效, 逆程的樣點不在PCM編碼的范圍內(nèi)。 因為在數(shù)字化的視頻信號中, 不再需要行、 場同步信號和消隱信號, 只要有行、 場(幀)的起始位置即可。 例如, 對于PAL制, 傳輸所有的樣點數(shù)據(jù), 大約需要200 Mb/s的傳輸速率, 傳輸有效樣點只需要160 Mb/s左右的速率。
色度信號的取樣率是亮度信號取樣率的一半, 常稱作4∶2∶2格式, 可以理解為每一行里的Y、 U、 V的樣點數(shù)之比為4∶2∶2。
6.1.4 熵編碼
熵編碼(Entropy Coding)是一類無損編碼, 因編碼后的平均碼長接近信源的熵而得名。 熵編碼多用可變字長編碼(VLC, Variable Length Coding)實現(xiàn)。 其基本原理是對信源中出現(xiàn)概率大的符號賦以短碼, 對出現(xiàn)概率小的符號賦以長碼, 從而在統(tǒng)計上獲得較短的平均碼長。 所編的碼應是即時可譯碼, 某一個碼不會是另一個碼的前綴, 各個碼之間無需附加信息便可自然分開。
1. 霍夫曼(Huffman)編碼
霍夫曼(Huffman)編碼是一種可變長編碼, 編碼方法如圖6-2所示。
(1) 將輸入信號符號以出現(xiàn)概率由大至小為序排成一列。
(2) 將兩處最小概率的符號相加合成為一個新概率, 再按出現(xiàn)概率的大小排序。
(3) 重復步驟(2), 直至最終只剩兩個概率。
(4) 編碼從最后一步出發(fā)逐步向前進行, 概率大的符號賦予“0”碼, 另一個概率賦予“1”碼, 直至到達最初的概率排列為止。
圖 6-2 霍夫曼(Huffman)編碼
評論