當前位置:首頁 » 操作系統 » 圖像編碼演算法

圖像編碼演算法

發布時間: 2022-08-31 10:34:44

⑴ 現今的圖像壓縮演算法有哪些急...

淺談圖像壓縮演算法

余科亮

本文僅討論靜止圖像的壓縮基本演算法,圖像壓縮的目的在於以較少的數據來
表示圖像以節約存儲費用,或者傳輸時間和費用。
JPEG壓縮演算法可以用失真的壓縮方式來處理圖像,但失真的程度卻是肉眼所
無法辯認的。這也就是為什麼JPEG會有如此滿意的壓縮比例的原因。
下面主要討論,JPEG基本壓縮法。
一.JPEG壓縮過程

JPEG壓縮分四個步驟實現:
1.顏色模式轉換及采樣;
2.DCT變換;
3.量化;
4.編碼。

二.1.顏色模式轉換及采樣

RGB色彩系統是我們最常用的表示顏色的方式。JPEG採用的是YCbCr色彩系統。
想要用JPEG基本壓縮法處理全彩色圖像,得先把RGB顏色模式圖像數據,轉換為
YCbCr顏色模式的數據。Y代表亮度,Cb和Cr則代表色度、飽和度。通過下列計算
公式可完成數據轉換。
Y=0.2990R+0.5870G+0.1140B
Cb=-0.1687R-0.3313G+0.5000B+128
Cr=0.5000R-0.4187G-0.0813B+128
人類的眼晴對低頻的數據比對高頻的數據具有更高的敏感度,事實上,人類
的眼睛對亮度的改變也比對色彩的改變要敏感得多,也就是說Y成份的數據是比較
重要的。既然Cb成份和Cr成份的數據比較相對不重要,就可以只取部分數據來處
理。以增加壓縮的比例。JPEG通常有兩種采樣方式:YUV411和YUV422,它們所代
表的意義是Y、Cb和Cr三個成份的數據取樣比例。

2.DCT變換

DCT變換的全稱是離散餘弦變換(Discrete Cosine Transform),是指將一組
光強數據轉換成頻率數據,以便得知強度變化的情形。若對高頻的數據做些修飾,
再轉回原來形式的數據時,顯然與原始數據有些差異,但是人類的眼睛卻是不容
易辨認出來。
壓縮時,將原始圖像數據分成8*8數據單元矩陣,例如亮度值的第一個矩陣內
容如下:

JPEG將整個亮度矩陣與色度Cb矩陣,飽和度Cr矩陣,視為一個基本單元稱作
MCU。每個MCU所包含的矩陣數量不得超過10個。例如,行和列采樣的比例皆為4:
2:2,則每個MCU將包含四個亮度矩陣,一個色度矩陣及一個飽和度矩陣。
當圖像數據分成一個8*8矩陣後,還必須將每個數值減去128,然後一一代入
DCT變換公式中,即可達到DCT變換的目的。圖像數據值必須減去128,是因為DCT
轉換公式所接受的數字范圍是在-128到+127之間。
DCT變換公式:

x,y代表圖像數據矩陣內某個數值的坐標位置
f(x,y)代表圖像數據矩陣內的數個數值
u,v代表DCT變換後矩陣內某個數值的坐標位置
F(u,v)代表DCT變換後矩陣內的某個數值
u=0 且 v=0 c(u)c(v)=1/1.414
u>0 或 v>0 c(u)c(v)=1
經過DCT變換後的矩陣數據自然數為頻率系數,這些系數以F(0,0)的值最
大,稱為DC,其餘的63個頻率系數則多半是一些接近於0的正負浮點數,一概稱
之為AC。
3、量化
圖像數據轉換為頻率系數後,還得接受一項量化程序,才能進入編碼階段。
量化階段需要兩個8*8矩陣數據,一個是專門處理亮度的頻率系數,另一個則是
針對色度的頻率系數,將頻率系數除以量化矩陣的值,取得與商數最近的整數,
即完成量化。
當頻率系數經過量化後,將頻率系數由浮點數轉變為整數,這才便於執行最
後的編碼。不過,經過量化階段後,所有數據只保留整數近似值,也就再度損失
了一些數據內容,JPEG提供的量化表如下:

4、編碼
Huffman編碼無專利權問題,成為JPEG最常用的編碼方式,Huffman編碼通常
是以完整的MCU來進行的。
編碼時,每個矩陣數據的DC值與63個AC值,將分別使用不同的Huffman編碼
表,而亮度與色度也需要不同的Huffman編碼表,所以一共需要四個編碼表,才
能順利地完成JPEG編碼工作。
DC編碼
DC是彩採用差值脈沖編碼調制的差值編碼法,也就是在同一個圖像分量中取
得每個DC值與前一個DC值的差值來編碼。DC採用差值脈沖編碼的主要原因是由於
在連續色調的圖像中,其差值多半比原值小,對差值進行編碼所需的位數,會比
對原值進行編碼所需的位數少許多。例如差值為5,它的二進製表示值為101,如
果差值為-5,則先改為正整數5,再將其二進制轉換成1的補數即可。所謂1的補
數,就是將每個Bit若值為0,便改成1;Bit為1,則變成0。差值5應保留的位數
為3,下表即列出差值所應保留的Bit數與差值內容的對照。

在差值前端另外加入一些差值的霍夫曼碼值,例如亮度差值為5(101)的位
數為3,則霍夫曼碼值應該是100,兩者連接在一起即為100101。下列兩份表格分
別是亮度和色度DC差值的編碼表。根據這兩份表格內容,即可為DC差值加上霍夫
曼碼值,完成DC的編碼工作。

AC編碼
AC編碼方式與DC略有不同,在AC編碼之前,首先得將63個AC值按Zig-zag排
序,即按照下圖箭頭所指示的順序串聯起來。

63個AC值排列好的,將AC系數轉換成中間符號,中間符號表示為RRRR/SSSS,
RRRR是指第非零的AC之前,其值為0的AC個數,SSSS是指AC值所需的位數,AC系
數的范圍與SSSS的對應關系與DC差值Bits數與差值內容對照表相似。
如果連續為0的AC個數大於15,則用15/0來表示連續的16個0,15/0稱為ZRL
(Zero Rum Length),而(0/0)稱為EOB(Enel of Block)用來表示其後所
剩餘的AC系數皆等於0,以中間符號值作為索引值,從相應的AC編碼表中找出適
當的霍夫曼碼值,再與AC值相連即可。
例如某一組亮度的中間符為5/3,AC值為4,首先以5/3為索引值,從亮度AC
的Huffman編碼表中找到1111111110011110霍夫曼碼值,於是加上原來100(4)
即是用來取[5,4]的Huffman編碼1111111110011110100,[5,4]表示AC值為4的
前面有5個零。
由於亮度AC,色度AC霍夫曼編碼表比較長,在此省略去,有興趣者可參閱相
關書籍。
實現上述四個步驟,即完成一幅圖像的JPEG壓縮。

參考資料
[1] 林福宗 《圖像文件格式(上)——Windows 編程》,清華大學出版社,
1996年
[2] 李振輝、李仁各編著,《探索圖像文件的奧秘》,清華大學出版社,1996年
[3] 黎洪松、成實譯《JPEG靜止數據壓縮標准》,學苑出版社,1996年

⑵ JPEG壓縮編碼演算法的主要計算步驟哪些對圖像的質量有損

JPEG壓縮編碼演算法的主要計算步驟如下:
(1)正向離散餘弦變換(FDCT)。 (2)量化(Quantization)。 (3)Z字形編碼(Zigzag Scan)。 (4)使用差分脈沖編碼調制(Differential Pulse Code Molation,DPCM)對直流系數(DC)進行編碼。 (5)使用行程長度編碼(Run-Length Encoding,RLE)對交流系數(AC)進行編碼。 6)熵編碼(Entropy Eoding)。
JPEG是有損編碼,是在量化過程中取整而產生的。

⑶ 離散餘弦變換和分形編碼圖像壓縮演算法的性能比較

目前,分形編碼還未完全實用化 ,其主要困難在於傳統空域的分形壓縮有很多瓶頸 ,例如,運算復雜度太大、收斂過程較難預測和控制、高壓縮倍率時的塊狀效應等 。盡管自動圖像壓縮演算法的改進工作 已持續 了十幾年 ,但編碼時間、壓縮 比以及壓縮效果仍不夠理想 ,遠沒有達到分形本身應該達到的效果,因而 ,在當前 圖像壓縮編碼 中還不 佔主 導地位。為了能真正發揮分形高壓縮 比的潛力,必須尋求 IFS碼演算法 的突破,找到編碼實現的快速演算法 ,或者對分形塊壓縮方法作出重大改進,否則分形圖像壓縮技術很難與成熟的JPEG和 MPEG競爭。

離散餘弦變換,尤其是它的第二種類型,經常被信號處理和圖像處理使用,用於對信號和圖像(包括靜止圖像和運動圖像)進行有損數據壓縮。這是由於離散餘弦變換具有很強的"能量集中"特性:大多數的自然信號(包括聲音和圖像)的能量都集中在離散餘弦變換後的低頻部分,而且當信號具有接近馬爾科夫過程(Markov processes)的統計特性時,離散餘弦變換的去相關性接近於K-L變換(Karhunen-Loève 變換--它具有最優的去相關性)的性能。
例如,在靜止圖像編碼標准JPEG中,在運動圖像編碼標准MJPEG和MPEG的各個標准中都使用了離散餘弦變換。在這些標准制中都使用了二維的第二種類型離散餘弦變換,並將結果進行量化之後進行熵編碼。這時對應第二種類型離散餘弦變換中的n通常是8,並用該公式對每個8x8塊的每行進行變換,然後每列進行變換。得到的是一個8x8的變換系數矩陣。其中(0,0)位置的元素就是直流分量,矩陣中的其他元素根據其位置表示不同頻率的交流分類。

⑷ HDV 和HVD分別是什麼,詳細一點,包括他們的公司都解釋一下,謝謝了!

[轉貼]解析DVD、HDV、EVD、HVD的編碼技術

一、國際音頻編碼技術現狀和發展趨勢

目前,國際運動圖像專家組(MPEG)已經推出了幾種音頻編碼技術。其中MPEG-1(ISO/IEC11172-3)按照編碼復雜度分三層編碼機制,支持采樣率為32、44.1和48KHz的單聲道(mono)及雙聲道(stereo或Dual mono)編碼。第3層(MP3)在對雙聲道立體聲編碼時,在128Kbit/s對絕大多數音樂編碼可達到接近CD的音質效果,成為網路音樂和便攜電子設備的首選標准。MPEG-2BC(ISO/IEC13818-3)則是對MPEG-1的向後兼容多聲道擴展方案,並增加了一個「低頻效果」聲道從而提升至5.1個聲道編碼,且支持16、22.5和24KHz采樣音頻信號編碼。標志MPEG的最高技術水平的MPEG-2 Advanced Audio Coding (ISO/IEC13818-7AAC)在采樣率為8~96KHz下提供了1~48個聲道可選范圍的高質量音頻編碼。它適用於從比特率在8kbit/s單聲道的電話音質到160kbit/s多聲道高質量音頻編碼。用AAC對單聲道音頻編碼,在64Kbit/s下對絕大多數音樂編碼可達到接近CD的音質效果。因此和MP3的單聲道96Kbit/s相比,編碼效率已經有了很大提高,被認為是下一代音頻編碼標准。

在多聲道環繞立體聲編碼方面,美國杜比實驗室的AC-3提供對32、44.1和48KHz采樣,從單聲道到5.1環繞立體聲的音頻信號的編碼,並支持碼率范圍從32kbit/s的單聲道碼流到640kbit/s的多聲道高質量音頻碼流。目前,DolbyAC-3已經憑借其良好的聲場和聲像重現能力,贏得了電影、家庭影院、DVD和數字電視伴音等領域的廣泛應用,成為事實上的國際標准。

其他優秀的音頻編碼技術,如索尼的ATARC、貝爾實驗室的PAC和微軟的WMA等,都獲得了相當廣泛的應用。

目前,從國際數字音頻應用的發展來看,數字音頻編碼技術已經在互聯網、廣播、個人消費電子產品和數字影視等領域獲得了廣泛的應用,隨著3G技術的興起,正在進入移動通信領域。因此,新一代的數字音頻編碼技術在傳輸的可靠性、對帶寬的要求和版權的安全性等方面的要求更高。

中國在數字音頻編碼領域起步較晚,目前已經開展數字音頻編碼技術研究的大學有清華大學、天津大學、西安電子科技大學、哈爾濱工業大學、華南理工大學、東南大學和北京郵電大學等,還沒獲得較成熟和完整的成果。

二、圖像視頻編碼的國際標准及技術特點

近10年來,圖像編碼技術得到了迅速發展和廣泛應用,關且日臻成熟,其標志就是幾個關於圖像編碼的國際標準的制定,即國際標准化組織ISO和國際電工委員會IEC關於靜止圖像的編碼標准JPEG、國際電信聯盟ITU-T關於電視電話/會議電視的視頻編碼標准H261,H.263和ISO/IEC關於活動圖像的編碼標准MPEG-1,MPEG-2和MPEG-4等。這些標准圖像編碼演算法融合了各種性能優良的圖像編碼方法,代表了目前圖像編碼的發展水平。

1、JPEG(Joint Photographic Expert Group)

JPEG是ISO/IEC聯合圖像專家組制定的靜止圖像壓縮標准,是適用於連續色調(包括灰度和彩色)靜止圖像壓縮演算法的國際標准。JPEC演算法共有4種運行模式,其中一種是基於空間預測(DPCM)的無損壓縮演算法,另外3種是基於DCT的有損壓縮演算法。

1)無損壓縮演算法,可以保證無失真地重建原始圖像。

2)基於DCT的順序模式,按從上到下,從左到右的順序對圖像進行編碼,稱為基本系統。

3)基於DCT的遞進模式,指對一幅圖像按由粗到細對圖像進行編碼。

4)分層模式。以各種解析度對圖像進行編碼,可以根據不同的要求,獲得不同解析度的圖像。

JEPG對圖像的壓縮有很大的伸縮性,圖像質量與比特率的關系如下:

a)1.5~2.0比特/像素:與原始圖像基本沒有區別(transparent quality)。

b)0.75~1.5比特/像素:極好(excellent quality),滿足大多數應用。

c)0.5~0.75比特/像素:好至很好(good to very good quality),滿足多數應用。

d)0.25~0.5比特/像素:中至好(moderate to very good quality),滿足某些應用。

2、JPEG-2000

與以往的JPEG標准相比,JPEG-2000壓縮率比JPEG高約30%,它有許多原先的標准所不可比擬的優點。JPEG-2000與傳統JPEG最大的不同,在於它放棄了JPEG所採用的以DCT變換為主的分塊編碼方式,而改為以小波變換為主的多解析度編碼方式。

首先,JPEG-2000能實現無損壓縮(lossless compression)。在實際應用中,有一些重要的圖像,如衛星遙感圖像、醫學圖像、文物照片等,通常需要進行無損壓縮。對圖像進行無損編碼的經典方法——預測法已經發展成熟,並作為一個標准寫入了JPEG-2000中。

JPEG-2000還有一個很好的優點就是誤碼魯棒性(robustness to bi terror)好。因此使用JPEG-2000的系統穩定性好,運行平穩,抗干擾性好,易於操作。

JPEG-2000能實現漸進運輸(progressive trans mission),這是JPEG-2000的一個極其重要的特徵。它可以先傳輸圖像的輪廓,然後逐步傳輸數據,不斷提高圖像質量,以滿足用戶的需要,這在網路傳輸中具有非常重大的意義。使用JPEG-2000下載一個圖片,用戶可先看到這個圖片的輪廓或縮影,然後再決定是否下載。而且,下載時可以根據用戶需要和帶寬來決定下載圖像質量的好壞,從而控制數據量的大小。

JPEG-2000另一個極其重要的優點就是感興趣區(ROI,Region Of Interest)特性。用戶在處理的圖像中可以指定感興趣區,對這些區域進行壓縮時可以指定特定的壓縮質量,或在恢復時指定特定的解壓縮要求,這給人們帶來了極大的方便。在有些情況下,圖像中只有一小塊區域對用戶是有用的,對這些區域採用高壓縮比。在保證不丟失重要信息的同時,又能有效地壓縮數據量,這就是感興趣區的編碼方案所採取的壓縮策略。基於感興趣區壓縮方法的優點,在於它結合了接收方對壓縮的主觀要求,實現了互動式壓縮。

3、MPEG-1

國際標准化組織ISO/IEC的運動圖像專家組MPEG(Moving Picture Expert Group)一直致力於運動圖像及其伴音編碼標准化工作,並制定了一系列關於一般活動圖像的國際標准。1993年制定的MPEG-1標準是針對1.5Mbit/s速率的數字存儲媒體運動圖像及其伴音編碼制定的國際標准,該標準的制定使得基於CD-ROM的數字視頻以及MP3等產品成為可能。MPEG-1的帶寬最多為1.5Mbit/s,其中11Mbit/s用於視頻,128Kbit/s用於音頻,其餘帶寬用於MPEG系統本身。

為了追求高的壓縮效率,去除圖像序列的時間冗餘度,同時滿足多媒體等應用所必須的隨機存取要求,MPEG-1視頻把圖像編碼分成I幀、P幀、B幀和D幀共4種類型。I幀為幀內編碼幀(intra coded frame),編碼時採用類似JPEG的幀內DCT編碼,I幀的壓縮率是幾種編碼類型中最低的。P幀為預測編碼幀(predictive coded frame),採用前向運動補償預測和誤差的DCT編碼,由其前面的I或P幀進行預測。B幀為雙向預測編碼幀(bi-directionally predictive coded frame),採用雙向運動補償預測和誤差的DCT編碼,由前面和後面的I或P幀進行預測,所以B幀的壓縮效率最高。D幀為直流編碼幀(Dc coded frame),只包含每個塊的直流分量。MPEG-1採用運動補償支除圖像序列時間軸上的冗餘度,可使對P幀和B幀圖像的壓縮倍數比I幀提高很多。

4、MPEG-2

MPEG組織1995年推出的MPEG-2標準是在MPEG-1標准基礎上的進一步擴展和改進,主要是針對數字視頻廣播、高清晰度電視和數字視盤等制定的4~9Mbit/s運動圖像及其伴音的編碼標准,MPEG-2是數字電視機頂盒與DVD等產品的基礎。MPEG-2系統要求必須與MPEG-l系統向下兼容,因此其語法的最大特點在於兼容性好並可擴展。MPEG-2的目標與MPEG-1相同,仍然是提高壓縮比,改善音頻、視頻質量,採用的核心技術還是分塊DCT和幀間運動補償預測技術。MPEG-2視頻允許數據速率高達100Mbit/s,支持隔行掃描視頻格式和許多高級性能。考慮到視頻信號隔行掃描的特點,MPEG-2專門設置了「按幀編碼」和「按場編碼」兩種模式,並相應地對運動補償和DCT方法進行了擴展,從而顯著提高了壓縮編碼的效率。考慮到標準的通用性,增大了重要的參數值,允許有更大的畫面格式、比特率和運動矢量長度。除此之外,MPEG-2視頻壓縮編碼還進行了以下擴展:

1)輸入/輸出圖像彩色分量之比可以是4∶2∶0,4∶2∶2,4∶4∶4。

2)輸入/輸出圖像格式不限定。

3)可以直接對隔行掃描視頻信號進行處理。

4)在空間解析度、時間解析度、信噪比方面的可分級性適合於不同用途的解碼圖像要求,並可給出傳輸上不同等級的優先順序。

5)碼流結構的可分級性,比如頭部信息、運動矢量等部分可以給予較高的優先順序,而對於DCT系數的高頻分量部分則給予較低的優先順序。

6)輸出碼率可以是恆定的也可以是變化的,以適應同步和非同步傳輸。

MPEG-2視頻是一系列的系統,每一個系統具有安排好的共性和兼容程度。它允許對四種源格式或者級別進行編碼,從簡單清晰度(CIF格式)到完全的高清晰度電視HDTV(High Definition Television)。除了源格式的這種靈活性外,MPEG-2還規定了解析度從低到高的4級5類共11種單獨的技術規范,同一種類不同級別間的圖像解析度和編碼速率相差甚遠。表2給出了MPEG-2允許的級別和類的組合。

5、MPEG-3

MPEG-3是ISO/IEC最初為HDTV開發的編碼和壓縮標准,它要求傳輸速率在20Mbits/sev-40Mbits/sec間,但這將使畫面有輕度扭曲。不過由於MPEG-2的出色性能表現,已能適用於HDTV,使得原打算為HDTV設計的MPEG-3,還沒出世就被扼殺在搖籃中了。

6、MPEG-4

1992年11月,MPEG專家組決定開發新的適應於極低碼率的音頻/視頻(AV,Audio-Visual)編碼的國際標准,即MPEG-4。對於學術界來說,極低碼率(即小於64Kbit/s)是視頻編碼標準的最後一個比特率范圍。

MPEG-4專家組深入分析了AV領域中電視(television)、計算機(computer)、通信(communication)以及其交叉融合的發展趨勢後,認為MPEG-4應該提供用於通信的新方式,其核心是基於內容content-based)的AV信息存儲、處理與操作,支持交互性、高壓縮比以及通用存儲性等功能。同時在其結構上應具有適應性與可擴展性,以適應硬、軟體技術的不斷發展,便於及時融合新的技術。

相對於MPEG的前兩個壓縮標准,MPEG-4已不再是一個單純的視頻音頻編解碼標准,它將內容與交互性作為核心,從而為多媒體提供了一個更為廣闊的平台。它更多定義的是一種格式和框架,而不是具體的演算法,這樣人們可以在系統中加入許多新的演算法。除了一些壓縮工具和演算法外,各種各樣的多媒體技術如圖像分析與合成、計算機視覺、語音合成等也可以充分應用於編碼中。

H.261是ITU-T針對可視電話和會議電視、窄帶ISDN等要求實時編解碼和低延時應用提出的一個編碼標准。該標准包含的比特率為p*64Kbit/s,其中p是一個整數,取值范圍為1~30,對應比特率為64Kbit/s~92Mbit/s。

7、H.261

H.261標准大體上分為兩種編碼模式:幀內模式和幀間模式。對於緩和運動的人頭肩像,幀間編碼模式將佔主導位置;而對畫面切換頻繁或運動劇烈的序列圖像,則幀間編碼模式要頻繁地向幀內編碼模式切換。

為了減少信道誤碼,採用一種叫做BCH(511,493)的糾錯編碼方式。這種糾錯碼可以在493比特中自動糾正2比特的錯誤。按H261規定,源編碼器必須具備糾錯編碼的功能,而糾錯編碼是選用的。

8、H.263

1995年,ITU-T總結當時國際上視頻圖像編碼的最新進展,針對低比特率視頻應用制定了H.263標准,該標准被公認為是以像素為基礎的採用第一代編碼技術的混合編碼方案所能達到的最佳結果。隨後幾年中,ITU-T又對其進行了多次補充,以提高編碼效率,增強編碼功能。補充修訂的版本有1998年的H.263+,2000年的H263++。H.263系列標准特別適合於PSTN網路、無線網路與網際網路等環境下的視頻傳輸。

H.263已被幾種可視電話採納為終端標准,如支持PSTN與無線網的H.324,支持N-ISDN的H.320,支持B-ISDN的H.310等。H.263信源編碼演算法的核心仍然是H.261標准中採用的DPCM/DCT混和編碼演算法,原理框圖也和H.261十分相似。

9、MPEG-7與MPEG-21

MPEG-7是為「多媒體內容描述介面」,是用於信息表示的,MPEG-7是「基於語義的表示」。MPEG-7定義了一個描述符標准集,用於描述各種類型的多媒體信息,與之相應的描述方案可以用於規范多媒體描述符的生成和不同描述符之間的有機聯系。

這些描述符與指定的多媒體對象的內容緊密聯系,採用提取對象特徵的方法為實現基於內容和語義的准確檢索提供介面。在此基礎上,MPEG-7定義了一種描述定義語言(DDL,Description Definition Language)用於指定和生成描述方案,即希望提出新的視頻、音頻信息表示方式,它既不同於基於波形和基於壓縮的表示方式(如MPEG-1和MPEG-2),又不同於基於對象的表示方式(MPEG-4)。這一表示方式允許對信息的含義進行一定程度的解釋,它可以被一個設備或計算機解碼器存取。MPEG-7的目的在於提供一個標准化的核心技,以便描述多媒環境下的視頻和音頻內容,最終使視頻和音頻搜集像文本搜集一樣簡單方便。

MPEG-7可以描述的多媒體對象范圍極其廣泛,其核心部分DDL語言將充分吸收現有的各種媒體描述語言的特點,以達到對多媒體數據的普遍適應性。MPEG-4中提出的基於對象編碼的思想將成為對多媒體資料庫中的視頻、音頻對象進行處理(包括特徵提取、壓縮編碼等)的基本手段。而MPEG-7的多媒體內容描述功能對MPEG-1,MPEG-2,MPEG-4起到性能提高和功能擴展的作用。

最後,MPEG-7將提供內容的描述而不是內容本身,它將不能替代已有的MPEG標准(MPEG-1,MPEG-2,MPEG-4),僅僅是已有3個標準的補充。

正在研製的新標准MPEG-21是一個支持通過異構網路和設備,使用戶透明方便地使用多媒體資源的標准,其目的是建立一個交互的多媒體對象,實現多種業務模型,包括對版權和交易的自動管理,對內容使用者隱私的尊重等。

三、國內現有碟機的使用的技術

1、DVD技術

據調查,不少DVD影碟機不能實現真正的AC-3解碼功能,而分別採用以下一些方式來代替:

1)、簡單的兩聲道。不管碟片上音頻數據是否按照AC-3進行編碼,均以兩路混合音頻輸出。由於省略了其餘四個聲道的音頻輸出,在硬體成本上大大降低,且向Dobly公司外納交專利費用比真杜比AC-3解碼大為減少,是DVD影碟機的低價位方案。在這種方式下,用戶僅僅只能聽到簡單的左右兩路聲道效果。如果要欣賞真正的杜比AC-35.1聲道環繞聲效果,還需外接一台帶同軸或光纖輸入端子且具有AC-3解碼功放,其市場價格約2000元,即另購一台DVD影碟機的價格。

2)、有六路輸出端子的兩聲道。這種方式又稱「假六聲道」,它實際上只有3組相同的兩聲道輸出,是雙聲道機的簡單復制,根本無法實現真正的杜比AC-35.1聲道的機器類似,往往容易成炒正當利益的來源。因此,消費者在選購時應仔細加以甄別。

3)、虛擬模擬AC-3聲道。該方式通過一顆聲場處理晶元將兩聲道音頻經過疊加、相消等軟體演算法模擬出一種類似於AC-35.1聲道解碼輸出呢?杜比AC-35.1聲道的效果,但由於其音源全部來自於兩路主聲道,聲場的表現力、層次感較真正AC-3解碼都要遜色得多,且極易混淆視聽,侵害消費者利益。

那麼,什麼是真正杜比AC-35.1聲道解碼輸出呢?杜比AC-3是一種專門為多聲道數字式音響設計的感性編碼技術,它將音質學和先進的數字信號處理技術結合在一起,具有前所未有的高效率、高質量和多面性。按多聲道的形式,杜比AC-3提供了五個全音頻聲道,其排列方法通常稱為3/2結構:三個前排聲道(左、中、右)加上兩個環繞聲道,還有一個低音頻效應的聲道。通俗地說,就是前置左、前置右、中置、環繞左、環繞右及重低音,也就是所謂「5.1」聲道。相對於模擬式的AC-2(杜比Prologic),杜比AC-3具有兩個完全獨立的環繞聲道,每一聲道都能提供於前排三個聲道完全相同的全頻帶保真音響。因而真實再現上述效應的解碼就是真正意義的杜比AC-35.1聲道解碼。

2、HDV技術

HD12壓縮編碼系統是北京凱誠高清技術有限公司開發的針對HDV高清數字電影格式激光多媒體碟片的壓縮編碼系統。該系統採用優化的MPEG2視頻編碼格式,在原來MPEG2的基礎上,採用重新定義宏塊大小、重新設定量化長度、優化熵編碼和優化運動補償的方式,利用目前在半導體領域中取得的最新進展,憑借半導體晶元的強大處理能力,實現了更高的壓縮比和更好的還原效果。

HD12壓縮編碼系統依託北京凱誠高清技術有限公司技術人員多年的技術積累,歷時2年多的時間才開發完成。該系統不僅具有高效的實時壓縮功能,而且還能夠完成圖像的清晰化處理和修補,字幕和配音的生成疊加等其他各種編輯功能。

利用凱誠高清技術有限公司開發的HD12壓縮編碼系統能夠實現對高清視頻流的高效壓縮,對於目前高清視頻節目匱乏的現狀提供了一個很好的技術平台,能夠充分滿足目前高清視頻節目的壓縮需求,從而可以讓廣大消費者能夠欣賞到更多更好的高清視頻節目。

HDV播放機可以兼容CD、VCD、DVD等光碟,但是HDV光碟在普通的VCD、DVD等影碟機上看不了。也就是說,HDV光碟只能與HDV高清數字電影播放機相匹配,如果沒有機器,買回的光碟只能等於是一張廢碟。

據凱誠高清技術有限公司開發人員說:「因為HDV碟片使用的是超強壓縮技術,可以在一張盤上存放3-5部高畫質的電影節目,這種技術目前在國內只有他們的生產廠商掌握,而且技術都設有加密,外人根本無法竊取。」

3、EVD技術

阜國的音頻壓縮技術始於公司成立之初(2000年3月),並作為「新一代高密度數字激光視盤系統EVD®」項目中的子課題,經過了起步、發展和成熟幾個階段,目前已經申請了近二十項核心專利技術。這些專利已經形成了一套高效的、自主知識產權的基於多解析度分析的音頻編碼技術方案EAC,在2001年7月江蘇省電子產品監督檢驗所組織的主觀音質評價實驗中獲得了與會專家的高度的評價。

目前,EAC編碼技術可以提供單聲道、雙聲道立體聲、5.1環繞立體聲、多采樣率和多碼率下的編解碼方案,編碼效率進一步提高,並已經成為EVD®規范的音頻編碼技術標准。

為了進一步提高編碼效率,特別是在極低碼率下的音頻質量,在自主研發的同時,我們也加強了和國外掌握最先進音頻編碼技術企業的技術合作。經過長期的技術合作,北京阜國數字技術有限公司將和擁有世界最先進水平帶寬擴展技術的瑞典-德國Coding Technologies公司成立合資企業,共同開發並推廣EAC Plus技術。EAC Plus技術將在EAC技術基礎上,進一步提高中國的音頻編碼技術水平,使中國音頻編碼技術達到國際領先水平。

我們知道,音頻編碼技術分可以從很多角度去分類:有損和無損、波形和參數、窄帶和寬頻,以及恆定碼率和變率等等。但是,音頻編碼所處理的信號類型可以簡單的分成兩類:緩變成分和瞬變成分。當然,從模型的角度可分成弦類成分、瞬變成分和雜訊成分,由於我們目前集中於波形編碼技術研究,故不做如此劃分。可以說,所有的波形編碼技術都在努力尋求在一種對緩變成分和瞬變成分都有盡可能高的效率的編碼技術,同時保證可以接受的編碼復雜度。問題的原因在於人耳對不同信號的聽覺特性。雖然從理論上講,人耳對信號的響應是非常復雜的生理和心理問題,但在編碼的過程中,突出的體現為兩個矛盾。對緩變成分,人耳響應的頻率解析度較高,而時間解析度較低;對瞬變成分則表現為較低的頻率解析度和較高的時域解析度;且這種特性隨信號的不同而不同。較高的頻率解析度對應著較高的編碼效率,但同時有較差的預回聲抑制能力;較高的時間解析度則有較好的預回聲抑制能力,但編碼效率較低。

EAC在設計和實現的過程中,一直在努力通過一種更自然的處理方式,來處理/編碼各種音頻信號,這是EAC設計的基本技術路線。並具體表現在EAC一直遵循了多解析度的分析機制,努力追求在一個統一的濾波框架中更高效的編碼各種類型的音頻信號。

4、HVD技術

4月28日,國內首個高清晰度視頻光碟產業聯盟(簡稱HVD聯盟)在上海隆重成立。作為國內新一代高清晰視盤機的重要生產開發商,基於其在高清DVD領域的巨大影響力,清華同方順利成為該聯盟的首批成員單位。

HVD聯盟是以具有自主知識產權的IC等核心關鍵件、自主開發的整機系統及技術為紐帶,由整機製造商、內容提供商、出版發行商、核心晶元等廠商以及相關的大學、研究所自願組成的產業聯合體。聯盟的奮斗目標是:通過產業鏈的有效整合,有序、高效、持續地推進HVD技術標准、市場和產業的發展,為我國影碟機行業從「製造大國」邁向「技術強國」做出貢獻。

聯盟的近期目標是發展、推進具有「高清」水平的利用紅光物理格式的HVD整機內容和碟片產業,讓HVD成為DVD的升級換代產品。「HVD聯盟」首批成員單位有18家,主要任務是:建立、保護「HVD」知識產權機制;聯盟內部實行知識產權共享;開展「HVD」標識授權和格式驗證工作,保證HVD整機和碟片的統一性;做好碟片的加密和防拷貝工作;組織召開各類技術介紹會、產品推廣會、格式標准發布會等

依託著自身強大的科研實力,經過三年多來的不斷探索,目前清華同方已經成為國內掌握高清影碟機技術的極少數的幾家生產商之一。作為清華同方影碟機產品的最新科技代表,不久前,清華同方已經推出了具有最高科技含量的DVP-i919高清DVD,可實現480P、720P逐行掃描,並可實現1920*1080i隔行掃描。同時作為目前DVD的替代產品,i919還支持MPEG4影片播放,同時設置USB1.1介面,可直接同諸多數碼產品進行數據交換和查看。從近期該公司的銷售數據看,清華同方高清產品市場反應不俗,目前已與市場上同期推出的EVD、HDV等換代產品並駕齊驅。

此次清華同方成功加入「HVD聯盟」,相信這將為其引領高清DVD時代贏得更多先機,並將對今後的高清DVD行業走向產生深遠影響。

HVD是英文High-definition Versatile Disc的縮寫。HVD集強大的功能、清晰的圖像、低廉的價格、優越的向下兼容能力、關鍵技術、自主知識產權於一身,HVD技術已向國家知識產權局申請6項發明專利。

HVD支持多種輸入格式的介面:1080i/720p/576p/576i/480i/VGA/SVGA,符合視頻、Y/C、YPbPr.HVD的水平清晰度和垂直清晰度均達到720線的高清標准。

一張DVD9一樣容量的大小光碟中,HVD可以存放150分鍾的高清晰度電影。

5、FVD技術

目前版本的FVD規格是使用650nm紅光雷射;NA0.6~0.65,其物理規格比DVD容量提升;單面單層的FVD碟片容量可達5.4GB~6GB;編碼方式第一代初期先用8/16編碼,未來第二代則採用效率較高的8/15編碼方式及提高糾錯(ECC)的能力。在邏輯規格部份,採用微軟WindowMediaVideo-9(WMV-9)視頻壓縮技術可容納135分鍾1280x720p的高畫質節目,其中新開發的高畫質影音技術如:Menu動態&動態含背景,Program playback, Menu playback, Sub-picture-playback, Master-Slave playback等。此外,為達到保護智能財產的目的,亦將提供Advanced Encryption Standard(AES)Content Protection system防拷機制。

⑸ 數字圖像壓縮編碼有什麼最新的演算法或改進的演算法

以下是幾種格式的專業解釋:

HDTV

一,HDTV的概念

要解釋HDTV,我們首先要了解DTV。DTV是一種數字電視技術,是目前傳統模擬電視技術的接班人。所謂的數字電視,是指從演播室到發射、傳輸、接收過程中的所有環節都是使用數字電視信號,或對該系統所有的信號傳播都是通過由二進制數字所構成的數字流來 完成的。數字信號的傳播速率為每秒19.39兆位元組,如此大的數據流傳輸速度保證了數字電視的高清晰度,克服了模擬電視的先天不足。同時,由於數字電視可以允許幾種制式信號的同時存在,因此每個數字頻道下又可分為若干個子頻道,能夠滿足以後頻道不斷增多的 需求。HDTV是DTV標准中最高的一種,即High Definision TV,故而稱為HDTV。

二,HDTV中要求音、視頻信號達到哪些標准?

HDTV規定了視頻必須至少具備720線非交錯式(720p,即常說的逐行)或1080線交錯式隔行(1080i,即常說的隔行)掃描(DVD標准為 480線),屏幕縱橫比為16:9。音頻輸出為5.1聲道(杜比數字格式),同時能兼容接收其它較低格式的 信號並進行數字化處理重放。

HDTV有三種顯示格式,分別是:720P(1280×720P,非交錯式),1080 i(1920×1080i,交錯式),1080P(1920×1080i,非交錯式),其中網路上流傳的以720P和1080 i最為常見,而在微軟WMV-HD站點上1080P的樣片相對較多。

三,如何收看HDTV節目?

目前有兩種方式可欣賞到HDTV節目。一種是在電視上實時收看HDTV,需要滿足兩個條件,首先是電視可接收到HDTV信號,這需要額外添加相關的硬體,其次是電視符合HDTV標准,主要是指電視的解析度和接收埠而言。
另一種是在電腦上通過軟體播放。目前我國只有極少部分地區可接收到HDTV數字信號,而且HDTV電視的價格仍高高在上,不是普通消費者所能承受的。因此,在網路中找尋HDTC源,下載後在個人電腦上播放,成了大多數HDTV迷們的一個嘗鮮方法。

四,哪些是可用於電腦播放的HDTV文件?

網路中流傳的HDTV主要以兩類文件的方式存在,一類是經過MPEG-2標准壓縮,以.tp和.ts為後綴的視頻流文件,一類是經過WMV-HD (Windows Media Video High Definition)標准壓縮過的.wmv文件,還有少數文件後綴為.avi或.mpg,其性質與.wmv是完全一樣的。

HDTV文件都比較大,即使是經過重新編碼過後的.wmv文件也非同小可。以一部普通電影的時間長度來計算,.wmv文件將會有4G以上,而同樣時間長度的.tp和.ts文件能達到8G以上,有的甚至達到20多G。因此,除了通過文件後綴名,還可以通過文 件大小來判斷是否為HDTV文件。

五,如何在個人電腦上播放HDTV節目?

對於.wmv文件,只要系統安裝了Windows Media Player 9 或更高版本,就可以正常播放,一些播放軟體的最新版本已經開始支持WMV-HD,如WINDVD6等,也可以直接使用這些軟體播放HDTV。有些HDTV文件在壓縮過程中採用了其它標準的編碼格式,就需要安裝對應的解碼器,遇到Windows Media Player 9不能正常播放時,可以再安裝ffdshow,它帶有各種最常用的解碼器。

播放以.tp和.ts為後綴的視頻流文件要稍微麻煩一點,因為文件中分別包含有AC3音頻信息和MPEG-2視頻信息。好在現下有已經不少專門播放.tp 和.ts文件的軟體問世了,Moonlight-Elecard MPEG Player 就是其中一款比較常見的支持HDTV播放的軟體,目前最新的版本為2.x。安裝完後,也可以運行其它播放軟體來調用Moonlight- Elecard MPEG Player的解碼器進行播放。

六,如何鑒別HDTV的顯示格式?

目前我們無法僅從文件名稱、大小上來判定一個HDTV文件的顯示格式是720P還是1080i,或是1080P,但是有不少軟體可以在播放時顯示影片的圖像信息,如WINDVD、zplay等,在軟體的控制面板中選擇對應的選項就可以看到詳細的信息。

七,為什麼我只能看到圖像,卻聽不到聲音?

這是因為未安裝AC3音頻解碼器,導致HDTV文件中的音頻信息不能被正確識別的原因。解決的方法是下載並安裝對應的音頻解碼器,常用的有 AC3Filter,這些音、視頻解碼器只需安裝一次即可,播放HDTV文件時系統會自動調用,而不必每次播 放的時候都打開其控制界面。

八,為什麼我播放HDTV時會出現丟幀現象?

在家用電腦上播放HDTV,對其硬體配置要求較高,主要是與CPU、顯存、內存緊緊相關,如果這三樣中有一樣性能過低,就會產生一些播放問題。播放 HDTV時會出現丟幀現象是顯存容量不夠造成的,尤其是在播放1080 i格式HDTV的時候,1920×1080的像素量,需要足夠大的顯存才能滿足其數據吞吐,因此顯存至少需要64M以上,建議128M。由於是2D顯示,所以對顯卡核心的運算能力要求反而不是很高。

九,為什麼我播放HDTV時會經常出現畫面和語音停頓的現象?

一些採用了WMV-HD重新編碼的HDTV文件,因為有著較高的壓縮率,在播放時就需要非常高的CPU運算能力來進行實時解碼,一般來說P4 2.0G/AMD 2000 以上及同級別的CPU可達到這個要求。同時,由於HDTV的數據流較大,需要足夠的內存來支持,推薦在256M以上。如果你的電腦滿足不了這樣的配置,就可能會在播放過程中產生畫面與語音不同步、畫面經常停頓、爆音等現象。嚴重的話甚至無法順利觀看。如果 這種現象不太嚴重,則可以通過優化系統和一些小技巧來改善。

十,如何優化系統以保證順利地播放HDTV?

除非你的電腦硬體配置的確很強,否則就很可能需要對系統進行一些優化,以便可以順利地播放HDTV。首先是在播放HDTV前關閉所有沒有用的後台程序或進程,盡量增加系統的空閑資源為播放HDTV服務;其次是選擇一款佔用系統資源較低的軟體來播放HDTV 。Windows Media Player、WINDVD等軟體佔用系統資源較多,在硬體配置本就不高的系統上會影響HDTV的播放效果,這時可以選擇使用BSPlayer。 BSPlayer是一款免費軟體,最大的特點就是佔用系統資源很小,尤其在播放HDTV文件時,與其它幾個資源佔用大戶相比效果更為明顯。另外,運行播放軟體後立即打開任務管理器(僅在Windows 2000/XP中有效),將播放軟體的進程級別設置為最高,這樣也可以為HDTV的播放調用更多的系統資源。除此之外,安裝更高版本的 DirectX,也能更好地支持HDTV的播放。

十一,還有什麼其它的技巧?

如果你的PC可以流利地播放HDTV,那麼你唯一會感到遺憾的,可能就是抱怨顯示器太小和音箱太不夠勁了。音箱的問題沒有好的方法可以解決,必竟PC音箱和家庭影院的音箱兩者是不可同比的,然而我們可以通過調高顯示器的解析度來提高畫面的清晰度和細節感。 現在主流的顯示器為17寸純平CRT(因為改變標准解析度只會給LCD帶來負面影響,因此這種方法只針對普通的CRT顯示器),中低檔的17寸顯示器很難達到1600×1200以上的解析度,即使達到了其水平掃描率也在60Hz以下,但是請不要忘了,電視 信號的水平掃描率也就是在這個水平上。720P的水平掃描率為60Hz,1080i則有50Hz和60Hz兩種,分別為我國和美國地區的標准。也就是說,即使你在顯示器水平掃描率為60Hz的狀態下全屏觀看HDTV或DVD等其它視頻,你是感覺不到晃眼的 ,這主要是由於人眼對於動態和靜態物體的感應不同造成的。因此你可以在觀看HDTV的時候,放心地將顯示器水平掃描率設為60Hz,進而將解析度調高,平時使用再調回標准解析度即可。

存放HDTV文件的硬碟分區必須轉換為NTFS格式,因為一部HDTV電影通常是幾個4.3GB的視頻文件組成(為了方便刻錄在DVD上面),而FAT32是無法管理2GB以上的文件的,因此務必轉換分區格式。

H.264

JVT(Joint Video Team,視頻聯合工作組)於2001年12月在泰國Pattaya成立。它由ITU-T和ISO兩個國際標准化組織的有關視頻編碼的專家聯合組成。JVT的工作目標是制定一個新的視頻編碼標准,以實現視頻的高壓縮比、高圖像質量、良好的網路適應性等目標。目前JVT的工作已被ITU-T接納,新的視頻壓縮編碼標准稱為H.264標准,該標准也被ISO接納,稱為AVC(Advanced Video Coding)標准,是MPEG-4的第10部分。
H.264標准可分為三檔:
基本檔次(其簡單版本,應用面廣);
主要檔次(採用了多項提高圖像質量和增加壓縮比的技術措施,可用於SDTV、HDTV和DVD等);
擴展檔次(可用於各種網路的視頻流傳輸)。
H.264不僅比H.263和MPEG-4節約了50%的碼率,而且對網路傳輸具有更好的支持功能。它引入了面向IP包的編碼機制,有利於網路中的分組傳輸,支持網路中視頻的流媒體傳輸。H.264具有較強的抗誤碼特性,可適應丟包率高、干擾嚴重的無線信道中的視頻傳輸。H.264支持不同網路資源下的分級編碼傳輸,從而獲得平穩的圖像質量。H.264能適應於不同網路中的視頻傳輸,網路親和性好。

H.261是最早出現的視頻編碼建議,目的是規范ISDN網上的會議電視和可視電話應用中的視頻編碼技術。它採用的演算法結合了可減少時間冗餘的幀間預測和可減少空間冗餘的DCT變換的混合編碼方法。和ISDN信道相匹配,其輸出碼率是p×64kbit/s。p取值較小時,只能傳清晰度不太高的圖像,適合於面對面的電視電話;p取值較大時(如 p>6),可以傳輸清晰度較好的會議電視圖像。H.263 建議的是低碼率圖像壓縮標准,在技術上是H.261的改進和擴充,支持碼率小於64kbit/s的應用。但實質上H.263以及後來的H.263 和H.263 已發展成支持全碼率應用的建議,從它支持眾多的圖像格式這一點就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。
MPEG-1標準的碼率為1.2Mbit/s左右,可提供30幀CIF(352×288)質量的圖像,是為CD-ROM光碟的視頻存儲和播放所制定的。MPEG-l標准視頻編碼部分的基本演算法與H.261/H.263相似,也採用運動補償的幀間預測、二維DCT、VLC遊程編碼等措施。此外還引入了幀內幀(I)、預測幀(P)、雙向預測幀(B)和直流幀(D)等概念,進一步提高了編碼效率。在MPEG-1的基礎上,MPEG-2標准在提高圖像解析度、兼容數字電視等方面做了一些改進,例如它的運動矢量的精度為半像素;在編碼運算中(如運動估計和DCT)區分「幀」和「場」;引入了編碼的可分級性技術,如空間可分級性、時間可分級性和信噪比可分級性等。近年推出的MPEG-4標准引入了基於視聽對象(AVO:Audio-Visual Object)的編碼,大大提高了視頻通信的交互能力和編碼效率。 MPEG-4中還採用了一些新的技術,如形狀編碼、自適應DCT、任意形狀視頻對象編碼等。但是MPEG-4的基本視頻編碼器還是屬於和H.263相似的一類混合編碼器。
總之,H.261建議是視頻編碼的經典之作,H.263是其發展,並將逐步在實際上取而代之,主要應用於通信方面,但H.263眾多的選項往往令使用者無所適從。MPEG系列標准從針對存儲媒體的應用發展到適應傳輸媒體的應用,其核心視頻編碼的基本框架是和H.261一致的,其中引人注目的MPEG-4的「基於對象的編碼」部分由於尚有技術障礙,目前還難以普遍應用。因此,在此基礎上發展起來的新的視頻編碼建議H.264克服了兩者的弱點,在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,面向實際應用。同時,它是兩大國際標准化組織的共同制定的,其應用前景應是不言而喻的。
JVT的H.264
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯合視頻組(JVT:joint video team)開發的一個新的數字視頻編碼標准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開始草案徵集,1999年9月,完成第一個草案,2001年5月制定了其測試模式TML-8,2002年6月的 JVT第5次會議通過了H.264的FCD板。2003年3月正式發布。
H.264和以前的標准一樣,也是DPCM加變換編碼的混合編碼模式。但它採用「回歸基本」的簡潔設計,不用眾多的選項,獲得比H.263 好得多的壓縮性能;加強了對各種信道的適應能力,採用「網路友好」的結構和語法,有利於對誤碼和丟包的處理;應用目標范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求;它的基本系統是開放的,使用無需版權。
在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4×4塊的整數變換、分層的編碼語法等。這些措施使得H.264演算法具有很的高編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。
H.264的技術亮點
(1) 分層設計
H.264的演算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內容表示,網路提取層(NAL:Network Abstraction Layer)負責以網路所要求的恰當的方式對數據進行打包和傳送。在VCL和NAL之間定義了一個基於分組方式的介面,打包和相應的信令屬於NAL的一部分。這樣,高編碼效率和網路友好性的任務分別由VCL和NAL來完成。
VCL層包括基於塊的運動補償混合編碼和一些新特性。與前面的視頻編碼標准一樣,H.264沒有把前處理和後處理等功能包括在草案中,這樣可以增加標準的靈活性。
NAL負責使用下層網路的分段格式來封裝數據,包括組幀、邏輯信道的信令、定時信息的利用或序列結束信號等。例如,NAL支持視頻在電路交換信道上的傳輸格式,支持視頻在Internet上利用RTP/UDP/IP傳輸的格式。NAL包括自己的頭部信息、段結構信息和實際載荷信息,即上層的VCL數據。(如果採用數據分割技術,數據可能由幾個部分組成)。
(2) 高精度、多模式運動估計
H.264支持1/4或1/8像素精度的運動矢量。在1/4像素精度時可使用6抽頭濾波器來減少高頻雜訊,對於1/8像素精度的運動矢量,可使用更為復雜的8抽頭的濾波器。在進行運動估計時,編碼器還可選擇「增強」內插濾波器來提高預測的效果。
在H.264的運動預測中,一個宏塊(MB)可以按圖2被分為不同的子塊,形成7種不同模式的塊尺寸。這種多模式的靈活和細致的劃分,更切合圖像中實際運動物體的形狀,大大提高了運動估計的精確程度。在這種方式下,在每個宏塊中可以包含有1、2、4、8或16個運動矢量。
在H.264中,允許編碼器使用多於一幀的先前幀用於運動估計,這就是所謂的多幀參考技術。例如2幀或3幀剛剛編碼好的參考幀,編碼器將選擇對每個目標宏塊能給出更好的預測幀,並為每一宏塊指示是哪一幀被用於預測。
(3) 4×4塊的整數變換
H.264與先前的標准相似,對殘差採用基於塊的變換編碼,但變換是整數操作而不是實數運算,其過程和DCT基本相似。這種方法的優點在於:在編碼器中和解碼器中允許精度相同的變換和反變換,便於使用簡單的定點運算方式。也就是說,這里沒有「反變換誤差」。變換的單位是4×4塊,而不是以往常用的8×8塊。由於用於變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對圖像中較大面積的平滑區域不產生塊之間的灰度差異,可對幀內宏塊亮度數據的16個4×4塊的DC系數(每個小塊一個,共16個)進行第二次4×4塊的變換,對色度數據的4個4×4塊的DC系數(每個小塊一個,共4個)進行2×2塊的變換。
H.264為了提高碼率控制的能力,量化步長的變化的幅度控制在12.5%左右,而不是以不變的增幅變化。變換系數幅度的歸一化被放在反量化過程中處理以減少計算的復雜性。為了強調彩色的逼真性,對色度系數採用了較小量化步長。
(4) 統一的VLC
H.264中熵編碼有兩種方法,一種是對所有的待編碼的符號採用統一的VLC(UVLC :Universal VLC),另一種是採用內容自適應的二進制算術編碼(CABAC:Context-Adaptive Binary Arithmetic Coding)。CABAC是可選項,其編碼性能比UVLC稍好,但計算復雜度也高。UVLC使用一個長度無限的碼字集,設計結構非常有規則,用相同的碼表可以對不同的對象進行編碼。這種方法很容易產生一個碼字,而解碼器也很容易地識別碼字的前綴,UVLC在發生比特錯誤時能快速獲得重同步。
圖3顯示了碼字的語法。這里,x0,x1,x2,…是INFO比特,並且為0或1。圖4列出了前9種碼字。如:第4號碼字包含INFO01,這一碼字的設計是為快速再同步而經過優化的,以防止誤碼。
(5) 幀內預測
在先前的H.26x系列和MPEG-x系列標准中,都是採用的幀間預測的方式。在H.264中,當編碼Intra圖像時可用幀內預測。對於每個4×4塊(除了邊緣塊特別處置以外),每個像素都可用17個最接近的先前已編碼的像素的不同加權和(有的權值可為0)來預測,即此像素所在塊的左上角的17個像素。顯然,這種幀內預測不是在時間上,而是在空間域上進行的預測編碼演算法,可以除去相鄰塊之間的空間冗餘度,取得更為有效的壓縮。
如圖4所示,4×4方塊中a、b、...、p為16 個待預測的像素點,而A、B、...、P是已編碼的像素。如m點的值可以由(J+2K+L+2)/ 4 式來預測,也可以由(A B C D I J K L)/ 8 式來預測,等等。按照所選取的預測參考的點不同,亮度共有9類不同的模式,但色度的幀內預測只有1類模式。
(6) 面向IP和無線環境
H.264 草案中包含了用於差錯消除的工具,便於壓縮視頻在誤碼、丟包多發環境中傳輸,如移動信道或IP信道中傳輸的健壯性。
為了抵禦傳輸差錯,H.264視頻流中的時間同步可以通過採用幀內圖像刷新來完成,空間同步由條結構編碼(slice structured coding)來支持。同時為了便於誤碼以後的再同步,在一幅圖像的視頻數據中還提供了一定的重同步點。另外,幀內宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時候不僅可以考慮編碼效率,還可以考慮傳輸信道的特性。
除了利用量化步長的改變來適應信道碼率外,在H.264中,還常利用數據分割的方法來應對信道碼率的變化。從總體上說,數據分割的概念就是在編碼器中生成具有不同優先順序的視頻數據以支持網路中的服務質量QoS。例如採用基於語法的數據分割(syntax-based data partitioning)方法,將每幀數據的按其重要性分為幾部分,這樣允許在緩沖區溢出時丟棄不太重要的信息。還可以採用類似的時間數據分割(temporal data partitioning)方法,通過在P幀和B幀中使用多個參考幀來完成。
在無線通信的應用中,我們可以通過改變每一幀的量化精度或空間/時間解析度來支持無線信道的大比特率變化。可是,在多播的情況下,要求編碼器對變化的各種比特率進行響應是不可能的。因此,不同於MPEG-4中採用的精細分級編碼FGS(Fine Granular Scalability)的方法(效率比較低),H.264採用流切換的SP幀來代替分級編碼。
H.264的性能測試
TML-8為H.264的測試模式,用它來對H.264的視頻編碼效率進行比較和測試。測試結果所提供的PSNR已清楚地表明,相對於MPEG-4(ASP:Advanced Simple Profile)和H.263 (HLP:High Latency Profile)的性能,H.264的結果具有明顯的優越性,如圖5所示。
H.264的PSNR比MPEG-4(ASP)和H.263 (HLP)明顯要好,在6種速率的對比測試中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6個測試速率及其相關的條件分別為:32 kbit/s速率、10f/s幀率和QCIF格式;64 kbit/s速率、15f/s幀率和QCIF格式;128kbit/s速率、15f/s幀率和CIF格式;256kbit/s速率、15f/s幀率和QCIF格式;512 kbit/s速率、30f/s幀率和CIF格式;1024 kbit/s速率、30f/s幀率和CIF格式。
實現難度
對每個考慮實際應用的工程師而言,在關注H.264的優越性能的同時必然會衡量其實現難度。從總體上說,H.264性能的改進是以增加復雜性為代價而獲得的。目前全球也只有中國杭州海康威視數字技術有限公司在安防領域實現了H.264的實際應用,這一次我們走到了世界的前端!

1080p

1080P是標准層面上的HDTV或者硬體層面上FULL HD的最高標准之一,而FULL HD就是能夠完全顯示1920*1080像素或者說物理解析度達到1920*1080的平板電視機。需要注意的是,FULL HD和先前很多廠家宣傳的1080P並不是同樣的概念。
但是我們走進賣場會發現大多數品牌商家都打著1080P的旗幟對外宣傳,多少對我們的選購產生了阻礙.其實目前市場中的大多數平板電視都不是FULL HD,所謂的1080P只是支持1080P信號的接收並通過計算演變在屏幕上顯示,大多數大屏幕平板電視都為1366*768,等離子中的部分產品更低,要達到FULL HD的概念,就必須屏幕達到1920*1080的物理解析度以及至少30Hz的刷新率.

WAF

We Are Family 的簡稱 [我們是一家人]
WAF是韓國的一個影視製作小組,他們製作的DVDRIP是目前網上除了HDTV之外質量最好的,清晰度和音質都是上乘之作。
WAF的作品有以下特點:
1:嚴格控制每CD的容量,每CD的容量大小一般不超過0.05M(大家見過不少CD1是702M,CD2卻是698M的現象吧)。
2:經過控制的容量,利於刻盤,(有些小組製作的容量經常可以超過702M,一CD盤的容量,這時候超刻技術就受重視了^_^)
3:分割片子時注意場景轉換,極少造成一段場景有分裂感(例如4CD的《特洛伊》和4CD的《黑鷹》)。
4:每個片子壓制的尺寸都以OAR為准,即導演原始版。
5:尺寸統一,幾乎都是800線。(例:WAF20CD DTS版BOB,800*448,見過15CD的HDTVRIP版,居然有兩種尺寸!)我不清楚,一部大片為什麼大家會忍受得了解析度為640甚至以下的版本?
6:有極強的負責任的製作態度,發現有瑕疵的一般都會推出修復版.
7:喜歡WAF的DTS和AC3音頻和高碼率壓縮的視頻.
8:WAF每部片分割成的CD數一般都比別的小組製作的要多,這是為了保證必要的畫質和音質的質量。試想想有個加長版《角鬥士》使用DTS音軌,卻只分割成2CD,每CD有70多分鍾長,不知這樣壓縮出來的片子畫質能好到什麼程度?
所以說,WAF小組出品的DVDRip一般都是網上最清晰的版本。

問題補充:

普通家用電視的解析度是多少?是不是屏幕越大解析度越高?

電視的NTSC標准為720x480 刷新率為60Hz , PAL為720x576,刷新率為50Hz。 我國電視廣播採用 PAL制。

逐行電視接收隔行信號經過差補後可以達到逐行輸出,同時75Hz刷新率 ,或者隔行輸出,同時100Hz刷新率。

雖然PAL制可達576線,但普通電視的實際可分辨水平線數只有300~500。高清電視理論上可達720P 和1080i,就是說最多逐行720線。所以按理論來說,搞清電視用1024x768的VGA輸入也勉強可以表現出來了,但實際因為聚焦不準,文字顯示比能顯示1024x768的顯示器差很多,畫面顯示則沒什麼問題。

HDTV是不是沒有經過壓縮,最原始的視頻?

網路中流傳的HDTV主要以兩類文件的方式存在,一類是經過MPEG-2標准壓縮,以.tp和.ts為後綴的視頻流文件,一類是經過WMV-HD (Windows Media Video High Definition)標准壓縮過的.wmv文件,還有少數文件後綴為.avi或.mpg,其性質與.wmv是完全一樣的。

H.264等壓縮格式是不是為了方便網上傳播?

在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4塊的整數變換、分層的編碼語法等。這些措施使得H.264得演算法具有很高的編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。

H.264能以較低的數據速率傳送基於聯網協議(IP)的視頻流,在視頻質量、壓縮效率和數據包恢復丟失等方面,超越了現有的MPEG-2、MPEG-4和H.26x視頻通訊標准,更適合窄帶傳輸。

網上流傳的Rip格式是什麼意思?DVDRip

DVDRip理解:其實就是一種DVD的備份技術。

DVD我們都知道,目前非常優秀的媒體格式,MPEG2編碼的視頻;AC3、DTS的音軌。但是我們也知道DVD載體是DVD光碟,D5一張就有4.7G。顯然,直接將DVD文件進行網路傳送毫無實際價值可言,將這樣的文件打包傳到伺服器上只會佔用伺服器的硬碟和大量的網路帶寬。還沒有多少人的網路帶寬可以讓他毫不動容地去下載一個7、8GB的文件只為了看兩個小時電影,更不要說將它們保存下來,DVD刻錄機這樣的產品目前也不是一般人能擁有的。
這就需要rip了,將DVD的視頻、音頻、字幕剝離出來,再經過壓縮或者其他處理,然後重新合成成多媒體文件。在更小的文件尺寸上達到DVD的是視聽享受。

⑹ 什麼是JPEG,MHEG,MPEG和MPC

JPEG
http://ke..com/view/7679.htm?fr=ala0_1
JPEG是Joint Photographic Experts Group(聯合圖像專家組)的縮寫,文件後輟名為".jpg"或".jpeg",這個名稱代表Joint Photographic Experts Group(聯合圖像專家小組)。JPEG本身只有描述如何將一個影像轉換為位元組的數據串流(streaming),但並沒有說明這些位元組如何在任何特定的儲存媒體上被封存起來。.jpeg/.jpg是最常用的圖像文件格式,由一個軟體開發聯合會組織制定,是一種有損壓縮格式,能夠將圖像壓縮在很小的儲存空間,圖像中重復或不重要的資料會被丟失,因此容易造成圖像數據的損傷。尤其是使用過高的壓縮比例,將使最終解壓縮後恢復的圖像質量明顯降低,如果追求高品質圖像,不宜採用過高壓縮比例。但是JPEG壓縮技術十分先進,它用有損壓縮方式去除冗餘的圖像數據,在獲得極高的壓縮率的同時能展現十分豐富生動的圖像,換句話說,就是可以用最少的磁碟空間得到較好的圖像品質。而且 JPEG是一種很靈活的格式,具有調節圖像質量的功能,允許用不同的壓縮比例對文件進行壓縮,支持多種壓縮級別,壓縮比率通常在10:1到40:1之間,壓縮比越大,品質就越低;相反地,壓縮比越小,品質就越好。比如可以把1.37Mb的BMP點陣圖文件壓縮至20.3KB。當然也可以在圖像質量和文件尺寸之間找到平衡點。JPEG格式壓縮的主要是高頻信息,對色彩的信息保留較好,適合應用於互聯網,可減少圖像的傳輸時間,可以支持24bit真彩色,也普遍應用於需要連續色調的圖像。
JPEG格式是目前網路上最流行的圖像格式,是可以把文件壓縮到最小的格式,在 Photoshop軟體中以JPEG格式儲存時,提供11級壓縮級別,以0—10級表示。其中0級壓縮比最高,圖像品質最差。即使採用細節幾乎無損的10 級質量保存時,壓縮比也可達 5:1。以BMP格式保存時得到4.28MB圖像文件,在採用JPG格式保存時,其文件僅為178KB,壓縮比達到24:1。經過多次比較,採用第8級壓縮為存儲空間與圖像質量兼得的最佳比例。
JPEG格式的應用非常廣泛,特別是在網路和光碟讀物上,都能找到它的身影。目前各類瀏覽器均支持JPEG這種圖像格式,因為JPEG格式的文件尺寸較小,下載速度快。
JPEG2000作為JPEG的升級版,其壓縮率比JPEG高約30%左右,同時支持有損和無損壓縮。JPEG2000格式有一個極其重要的特徵在於它能實現漸進傳輸,即先傳輸圖像的輪廓,然後逐步傳輸數據,不斷提高圖像質量,讓圖像由朦朧到清晰顯示。此外,JPEG2000還支持所謂的"感興趣區域" 特性,可以任意指定影像上感興趣區域的壓縮質量,還可以選擇指定的部分先解壓縮。在有些情況下,圖像中只有一小塊區域對用戶是有用的,對這些區域,採用低壓縮比,而感興趣區 域之外採用高壓縮比,在保證不丟失重要信息的同時,又能有效地壓縮數據量,這就是基於感興 趣區域的編碼方案所採取的壓縮策略。其優點在 於它結合了接收方對壓縮的主觀需求,實現了互動式壓縮。而接收方隨著觀察,常常會有新的要求,可能對新的區域感興趣,也可能希望某一區域更清晰些。
JPEG2000和JPEG相比優勢明顯,從無損壓縮到有損壓縮可以兼容,而JPEG不行,JPEG的有損壓縮和無損壓縮是完全不同的兩種方法。JPEG2000即可應用於傳統的JPEG市場,如掃描儀、數碼相機等,又可應用於新興領域,如網路傳輸、無線通訊等等。
JPEG(Joint Photographic Experts Group)是在國際標准化組織(ISO)領導之下制定靜態圖像壓縮標準的委員會,第一套國際靜態圖像壓縮標准ISO 10918-1(JPEG)就是該委員會制定的。由於JPEG優良的品質,使他在短短幾年內獲得了極大的成功,被廣泛應用於互聯網和數碼相機領域,網站上80%的圖像都採用了JPEG壓縮標准。然而,目前的JPEG靜止圖像壓縮標准,具有中端和高端比特速率上的良好的速率畸變特性,但在低比特率范圍內,將會出現很明顯的方塊效應,其質量變得不可接受。JPEG不能在單一碼流中提供有損和無損壓縮,並且不能支持大於64×64 K的圖像壓縮。同時,盡管當前的JPEG標准具有重新啟動間隔的規定,但當碰到比特差錯時圖像質量將受到嚴重的損壞。�
針對這些問題,自1997年3月起,JPEG圖像壓縮標准委員會開始著手制定新一代的圖像壓縮標准以解決上述問題。2000年3月的東京會議,確定了彩色靜態圖像的新一代編碼方式JPEG2000圖像壓縮標準的編碼演算法。
MHEG
http://www.sat-china.com/bbs/viewthread.php?tid=63571
MPEG
http://ke..com/view/7689.htm?fr=ala0_1
MPC
http://ke..com/view/63606.htm

⑺ 視頻圖像編碼標准MPEG2演算法流程是什麼 越詳細越好

這是大體框架 http://wenku..com/view/9706e8e39b89680203d825a6.html

⑻ 簡述JPEG壓縮演算法

首先你需要了解幾個概念,有損壓縮,量化,行程編碼。
對一副圖片來說,bitmap就是原始格式,沒經過任何壓縮的。
量化就是把所有0-255的像素值進行歸類,然後分成盡量少的積累,這要存儲量就小很多了,對於JEPG來說量化是有損壓縮的起源。
最後就是對所有的已經歸類過的點進行行程編碼,然後就壓縮完了

熱點內容
電腦怎麼選擇配置 發布:2025-05-14 10:46:12 瀏覽:325
電腦怎麼不顯示手機連接伺服器失敗 發布:2025-05-14 10:42:28 瀏覽:9
安卓如何下載lv手游 發布:2025-05-14 10:35:45 瀏覽:383
pythondict添加key 發布:2025-05-14 10:33:59 瀏覽:382
柱子箍筋加密區長度 發布:2025-05-14 10:18:29 瀏覽:352
雲伺服器和內網穿透哪個好 發布:2025-05-14 10:16:41 瀏覽:627
安徽新能源網路配置是什麼 發布:2025-05-14 10:06:24 瀏覽:631
pinode搭建伺服器 發布:2025-05-14 10:04:23 瀏覽:4
電腦伺服器ip名稱 發布:2025-05-14 10:01:09 瀏覽:749
connectorpython 發布:2025-05-14 09:48:50 瀏覽:763