图像编码算法
浅谈图像压缩算法
余科亮
本文仅讨论静止图像的压缩基本算法,图像压缩的目的在于以较少的数据来
表示图像以节约存储费用,或者传输时间和费用。
JPEG压缩算法可以用失真的压缩方式来处理图像,但失真的程度却是肉眼所
无法辩认的。这也就是为什么JPEG会有如此满意的压缩比例的原因。
下面主要讨论,JPEG基本压缩法。
一.JPEG压缩过程
JPEG压缩分四个步骤实现:
1.颜色模式转换及采样;
2.DCT变换;
3.量化;
4.编码。
二.1.颜色模式转换及采样
RGB色彩系统是我们最常用的表示颜色的方式。JPEG采用的是YCbCr色彩系统。
想要用JPEG基本压缩法处理全彩色图像,得先把RGB颜色模式图像数据,转换为
YCbCr颜色模式的数据。Y代表亮度,Cb和Cr则代表色度、饱和度。通过下列计算
公式可完成数据转换。
Y=0.2990R+0.5870G+0.1140B
Cb=-0.1687R-0.3313G+0.5000B+128
Cr=0.5000R-0.4187G-0.0813B+128
人类的眼晴对低频的数据比对高频的数据具有更高的敏感度,事实上,人类
的眼睛对亮度的改变也比对色彩的改变要敏感得多,也就是说Y成份的数据是比较
重要的。既然Cb成份和Cr成份的数据比较相对不重要,就可以只取部分数据来处
理。以增加压缩的比例。JPEG通常有两种采样方式:YUV411和YUV422,它们所代
表的意义是Y、Cb和Cr三个成份的数据取样比例。
2.DCT变换
DCT变换的全称是离散余弦变换(Discrete Cosine Transform),是指将一组
光强数据转换成频率数据,以便得知强度变化的情形。若对高频的数据做些修饰,
再转回原来形式的数据时,显然与原始数据有些差异,但是人类的眼睛却是不容
易辨认出来。
压缩时,将原始图像数据分成8*8数据单元矩阵,例如亮度值的第一个矩阵内
容如下:
JPEG将整个亮度矩阵与色度Cb矩阵,饱和度Cr矩阵,视为一个基本单元称作
MCU。每个MCU所包含的矩阵数量不得超过10个。例如,行和列采样的比例皆为4:
2:2,则每个MCU将包含四个亮度矩阵,一个色度矩阵及一个饱和度矩阵。
当图像数据分成一个8*8矩阵后,还必须将每个数值减去128,然后一一代入
DCT变换公式中,即可达到DCT变换的目的。图像数据值必须减去128,是因为DCT
转换公式所接受的数字范围是在-128到+127之间。
DCT变换公式:
x,y代表图像数据矩阵内某个数值的坐标位置
f(x,y)代表图像数据矩阵内的数个数值
u,v代表DCT变换后矩阵内某个数值的坐标位置
F(u,v)代表DCT变换后矩阵内的某个数值
u=0 且 v=0 c(u)c(v)=1/1.414
u>0 或 v>0 c(u)c(v)=1
经过DCT变换后的矩阵数据自然数为频率系数,这些系数以F(0,0)的值最
大,称为DC,其余的63个频率系数则多半是一些接近于0的正负浮点数,一概称
之为AC。
3、量化
图像数据转换为频率系数后,还得接受一项量化程序,才能进入编码阶段。
量化阶段需要两个8*8矩阵数据,一个是专门处理亮度的频率系数,另一个则是
针对色度的频率系数,将频率系数除以量化矩阵的值,取得与商数最近的整数,
即完成量化。
当频率系数经过量化后,将频率系数由浮点数转变为整数,这才便于执行最
后的编码。不过,经过量化阶段后,所有数据只保留整数近似值,也就再度损失
了一些数据内容,JPEG提供的量化表如下:
4、编码
Huffman编码无专利权问题,成为JPEG最常用的编码方式,Huffman编码通常
是以完整的MCU来进行的。
编码时,每个矩阵数据的DC值与63个AC值,将分别使用不同的Huffman编码
表,而亮度与色度也需要不同的Huffman编码表,所以一共需要四个编码表,才
能顺利地完成JPEG编码工作。
DC编码
DC是彩采用差值脉冲编码调制的差值编码法,也就是在同一个图像分量中取
得每个DC值与前一个DC值的差值来编码。DC采用差值脉冲编码的主要原因是由于
在连续色调的图像中,其差值多半比原值小,对差值进行编码所需的位数,会比
对原值进行编码所需的位数少许多。例如差值为5,它的二进制表示值为101,如
果差值为-5,则先改为正整数5,再将其二进制转换成1的补数即可。所谓1的补
数,就是将每个Bit若值为0,便改成1;Bit为1,则变成0。差值5应保留的位数
为3,下表即列出差值所应保留的Bit数与差值内容的对照。
在差值前端另外加入一些差值的霍夫曼码值,例如亮度差值为5(101)的位
数为3,则霍夫曼码值应该是100,两者连接在一起即为100101。下列两份表格分
别是亮度和色度DC差值的编码表。根据这两份表格内容,即可为DC差值加上霍夫
曼码值,完成DC的编码工作。
AC编码
AC编码方式与DC略有不同,在AC编码之前,首先得将63个AC值按Zig-zag排
序,即按照下图箭头所指示的顺序串联起来。
63个AC值排列好的,将AC系数转换成中间符号,中间符号表示为RRRR/SSSS,
RRRR是指第非零的AC之前,其值为0的AC个数,SSSS是指AC值所需的位数,AC系
数的范围与SSSS的对应关系与DC差值Bits数与差值内容对照表相似。
如果连续为0的AC个数大于15,则用15/0来表示连续的16个0,15/0称为ZRL
(Zero Rum Length),而(0/0)称为EOB(Enel of Block)用来表示其后所
剩余的AC系数皆等于0,以中间符号值作为索引值,从相应的AC编码表中找出适
当的霍夫曼码值,再与AC值相连即可。
例如某一组亮度的中间符为5/3,AC值为4,首先以5/3为索引值,从亮度AC
的Huffman编码表中找到1111111110011110霍夫曼码值,于是加上原来100(4)
即是用来取[5,4]的Huffman编码1111111110011110100,[5,4]表示AC值为4的
前面有5个零。
由于亮度AC,色度AC霍夫曼编码表比较长,在此省略去,有兴趣者可参阅相
关书籍。
实现上述四个步骤,即完成一幅图像的JPEG压缩。
参考资料
[1] 林福宗 《图像文件格式(上)——Windows 编程》,清华大学出版社,
1996年
[2] 李振辉、李仁各编着,《探索图像文件的奥秘》,清华大学出版社,1996年
[3] 黎洪松、成实译《JPEG静止数据压缩标准》,学苑出版社,1996年
⑵ JPEG压缩编码算法的主要计算步骤哪些对图像的质量有损
JPEG压缩编码算法的主要计算步骤如下:
(1)正向离散余弦变换(FDCT)。 (2)量化(Quantization)。 (3)Z字形编码(Zigzag Scan)。 (4)使用差分脉冲编码调制(Differential Pulse Code Molation,DPCM)对直流系数(DC)进行编码。 (5)使用行程长度编码(Run-Length Encoding,RLE)对交流系数(AC)进行编码。 6)熵编码(Entropy Eoding)。
JPEG是有损编码,是在量化过程中取整而产生的。
⑶ 离散余弦变换和分形编码图像压缩算法的性能比较
目前,分形编码还未完全实用化 ,其主要困难在于传统空域的分形压缩有很多瓶颈 ,例如,运算复杂度太大、收敛过程较难预测和控制、高压缩倍率时的块状效应等 。尽管自动图像压缩算法的改进工作 已持续 了十几年 ,但编码时间、压缩 比以及压缩效果仍不够理想 ,远没有达到分形本身应该达到的效果,因而 ,在当前 图像压缩编码 中还不 占主 导地位。为了能真正发挥分形高压缩 比的潜力,必须寻求 IFS码算法 的突破,找到编码实现的快速算法 ,或者对分形块压缩方法作出重大改进,否则分形图像压缩技术很难与成熟的JPEG和 MPEG竞争。
离散余弦变换,尤其是它的第二种类型,经常被信号处理和图像处理使用,用于对信号和图像(包括静止图像和运动图像)进行有损数据压缩。这是由于离散余弦变换具有很强的"能量集中"特性:大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔科夫过程(Markov processes)的统计特性时,离散余弦变换的去相关性接近于K-L变换(Karhunen-Loève 变换--它具有最优的去相关性)的性能。
例如,在静止图像编码标准JPEG中,在运动图像编码标准MJPEG和MPEG的各个标准中都使用了离散余弦变换。在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进行量化之后进行熵编码。这时对应第二种类型离散余弦变换中的n通常是8,并用该公式对每个8x8块的每行进行变换,然后每列进行变换。得到的是一个8x8的变换系数矩阵。其中(0,0)位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分类。
⑷ HDV 和HVD分别是什么,详细一点,包括他们的公司都解释一下,谢谢了!
[转贴]解析DVD、HDV、EVD、HVD的编码技术
一、国际音频编码技术现状和发展趋势
目前,国际运动图像专家组(MPEG)已经推出了几种音频编码技术。其中MPEG-1(ISO/IEC11172-3)按照编码复杂度分三层编码机制,支持采样率为32、44.1和48KHz的单声道(mono)及双声道(stereo或Dual mono)编码。第3层(MP3)在对双声道立体声编码时,在128Kbit/s对绝大多数音乐编码可达到接近CD的音质效果,成为网络音乐和便携电子设备的首选标准。MPEG-2BC(ISO/IEC13818-3)则是对MPEG-1的向后兼容多声道扩展方案,并增加了一个“低频效果”声道从而提升至5.1个声道编码,且支持16、22.5和24KHz采样音频信号编码。标志MPEG的最高技术水平的MPEG-2 Advanced Audio Coding (ISO/IEC13818-7AAC)在采样率为8~96KHz下提供了1~48个声道可选范围的高质量音频编码。它适用于从比特率在8kbit/s单声道的电话音质到160kbit/s多声道高质量音频编码。用AAC对单声道音频编码,在64Kbit/s下对绝大多数音乐编码可达到接近CD的音质效果。因此和MP3的单声道96Kbit/s相比,编码效率已经有了很大提高,被认为是下一代音频编码标准。
在多声道环绕立体声编码方面,美国杜比实验室的AC-3提供对32、44.1和48KHz采样,从单声道到5.1环绕立体声的音频信号的编码,并支持码率范围从32kbit/s的单声道码流到640kbit/s的多声道高质量音频码流。目前,DolbyAC-3已经凭借其良好的声场和声像重现能力,赢得了电影、家庭影院、DVD和数字电视伴音等领域的广泛应用,成为事实上的国际标准。
其他优秀的音频编码技术,如索尼的ATARC、贝尔实验室的PAC和微软的WMA等,都获得了相当广泛的应用。
目前,从国际数字音频应用的发展来看,数字音频编码技术已经在互联网、广播、个人消费电子产品和数字影视等领域获得了广泛的应用,随着3G技术的兴起,正在进入移动通信领域。因此,新一代的数字音频编码技术在传输的可靠性、对带宽的要求和版权的安全性等方面的要求更高。
中国在数字音频编码领域起步较晚,目前已经开展数字音频编码技术研究的大学有清华大学、天津大学、西安电子科技大学、哈尔滨工业大学、华南理工大学、东南大学和北京邮电大学等,还没获得较成熟和完整的成果。
二、图像视频编码的国际标准及技术特点
近10年来,图像编码技术得到了迅速发展和广泛应用,关且日臻成熟,其标志就是几个关于图像编码的国际标准的制定,即国际标准化组织ISO和国际电工委员会IEC关于静止图像的编码标准JPEG、国际电信联盟ITU-T关于电视电话/会议电视的视频编码标准H261,H.263和ISO/IEC关于活动图像的编码标准MPEG-1,MPEG-2和MPEG-4等。这些标准图像编码算法融合了各种性能优良的图像编码方法,代表了目前图像编码的发展水平。
1、JPEG(Joint Photographic Expert Group)
JPEG是ISO/IEC联合图像专家组制定的静止图像压缩标准,是适用于连续色调(包括灰度和彩色)静止图像压缩算法的国际标准。JPEC算法共有4种运行模式,其中一种是基于空间预测(DPCM)的无损压缩算法,另外3种是基于DCT的有损压缩算法。
1)无损压缩算法,可以保证无失真地重建原始图像。
2)基于DCT的顺序模式,按从上到下,从左到右的顺序对图像进行编码,称为基本系统。
3)基于DCT的递进模式,指对一幅图像按由粗到细对图像进行编码。
4)分层模式。以各种分辨率对图像进行编码,可以根据不同的要求,获得不同分辨率的图像。
JEPG对图像的压缩有很大的伸缩性,图像质量与比特率的关系如下:
a)1.5~2.0比特/像素:与原始图像基本没有区别(transparent quality)。
b)0.75~1.5比特/像素:极好(excellent quality),满足大多数应用。
c)0.5~0.75比特/像素:好至很好(good to very good quality),满足多数应用。
d)0.25~0.5比特/像素:中至好(moderate to very good quality),满足某些应用。
2、JPEG-2000
与以往的JPEG标准相比,JPEG-2000压缩率比JPEG高约30%,它有许多原先的标准所不可比拟的优点。JPEG-2000与传统JPEG最大的不同,在于它放弃了JPEG所采用的以DCT变换为主的分块编码方式,而改为以小波变换为主的多分辨率编码方式。
首先,JPEG-2000能实现无损压缩(lossless compression)。在实际应用中,有一些重要的图像,如卫星遥感图像、医学图像、文物照片等,通常需要进行无损压缩。对图像进行无损编码的经典方法——预测法已经发展成熟,并作为一个标准写入了JPEG-2000中。
JPEG-2000还有一个很好的优点就是误码鲁棒性(robustness to bi terror)好。因此使用JPEG-2000的系统稳定性好,运行平稳,抗干扰性好,易于操作。
JPEG-2000能实现渐进运输(progressive trans mission),这是JPEG-2000的一个极其重要的特征。它可以先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,以满足用户的需要,这在网络传输中具有非常重大的意义。使用JPEG-2000下载一个图片,用户可先看到这个图片的轮廓或缩影,然后再决定是否下载。而且,下载时可以根据用户需要和带宽来决定下载图像质量的好坏,从而控制数据量的大小。
JPEG-2000另一个极其重要的优点就是感兴趣区(ROI,Region Of Interest)特性。用户在处理的图像中可以指定感兴趣区,对这些区域进行压缩时可以指定特定的压缩质量,或在恢复时指定特定的解压缩要求,这给人们带来了极大的方便。在有些情况下,图像中只有一小块区域对用户是有用的,对这些区域采用高压缩比。在保证不丢失重要信息的同时,又能有效地压缩数据量,这就是感兴趣区的编码方案所采取的压缩策略。基于感兴趣区压缩方法的优点,在于它结合了接收方对压缩的主观要求,实现了交互式压缩。
3、MPEG-1
国际标准化组织ISO/IEC的运动图像专家组MPEG(Moving Picture Expert Group)一直致力于运动图像及其伴音编码标准化工作,并制定了一系列关于一般活动图像的国际标准。1993年制定的MPEG-1标准是针对1.5Mbit/s速率的数字存储媒体运动图像及其伴音编码制定的国际标准,该标准的制定使得基于CD-ROM的数字视频以及MP3等产品成为可能。MPEG-1的带宽最多为1.5Mbit/s,其中11Mbit/s用于视频,128Kbit/s用于音频,其余带宽用于MPEG系统本身。
为了追求高的压缩效率,去除图像序列的时间冗余度,同时满足多媒体等应用所必须的随机存取要求,MPEG-1视频把图像编码分成I帧、P帧、B帧和D帧共4种类型。I帧为帧内编码帧(intra coded frame),编码时采用类似JPEG的帧内DCT编码,I帧的压缩率是几种编码类型中最低的。P帧为预测编码帧(predictive coded frame),采用前向运动补偿预测和误差的DCT编码,由其前面的I或P帧进行预测。B帧为双向预测编码帧(bi-directionally predictive coded frame),采用双向运动补偿预测和误差的DCT编码,由前面和后面的I或P帧进行预测,所以B帧的压缩效率最高。D帧为直流编码帧(Dc coded frame),只包含每个块的直流分量。MPEG-1采用运动补偿支除图像序列时间轴上的冗余度,可使对P帧和B帧图像的压缩倍数比I帧提高很多。
4、MPEG-2
MPEG组织1995年推出的MPEG-2标准是在MPEG-1标准基础上的进一步扩展和改进,主要是针对数字视频广播、高清晰度电视和数字视盘等制定的4~9Mbit/s运动图像及其伴音的编码标准,MPEG-2是数字电视机顶盒与DVD等产品的基础。MPEG-2系统要求必须与MPEG-l系统向下兼容,因此其语法的最大特点在于兼容性好并可扩展。MPEG-2的目标与MPEG-1相同,仍然是提高压缩比,改善音频、视频质量,采用的核心技术还是分块DCT和帧间运动补偿预测技术。MPEG-2视频允许数据速率高达100Mbit/s,支持隔行扫描视频格式和许多高级性能。考虑到视频信号隔行扫描的特点,MPEG-2专门设置了“按帧编码”和“按场编码”两种模式,并相应地对运动补偿和DCT方法进行了扩展,从而显着提高了压缩编码的效率。考虑到标准的通用性,增大了重要的参数值,允许有更大的画面格式、比特率和运动矢量长度。除此之外,MPEG-2视频压缩编码还进行了以下扩展:
1)输入/输出图像彩色分量之比可以是4∶2∶0,4∶2∶2,4∶4∶4。
2)输入/输出图像格式不限定。
3)可以直接对隔行扫描视频信号进行处理。
4)在空间分辨率、时间分辨率、信噪比方面的可分级性适合于不同用途的解码图像要求,并可给出传输上不同等级的优先级。
5)码流结构的可分级性,比如头部信息、运动矢量等部分可以给予较高的优先级,而对于DCT系数的高频分量部分则给予较低的优先级。
6)输出码率可以是恒定的也可以是变化的,以适应同步和异步传输。
MPEG-2视频是一系列的系统,每一个系统具有安排好的共性和兼容程度。它允许对四种源格式或者级别进行编码,从简单清晰度(CIF格式)到完全的高清晰度电视HDTV(High Definition Television)。除了源格式的这种灵活性外,MPEG-2还规定了分辨率从低到高的4级5类共11种单独的技术规范,同一种类不同级别间的图像分辨率和编码速率相差甚远。表2给出了MPEG-2允许的级别和类的组合。
5、MPEG-3
MPEG-3是ISO/IEC最初为HDTV开发的编码和压缩标准,它要求传输速率在20Mbits/sev-40Mbits/sec间,但这将使画面有轻度扭曲。不过由于MPEG-2的出色性能表现,已能适用于HDTV,使得原打算为HDTV设计的MPEG-3,还没出世就被扼杀在摇篮中了。
6、MPEG-4
1992年11月,MPEG专家组决定开发新的适应于极低码率的音频/视频(AV,Audio-Visual)编码的国际标准,即MPEG-4。对于学术界来说,极低码率(即小于64Kbit/s)是视频编码标准的最后一个比特率范围。
MPEG-4专家组深入分析了AV领域中电视(television)、计算机(computer)、通信(communication)以及其交叉融合的发展趋势后,认为MPEG-4应该提供用于通信的新方式,其核心是基于内容content-based)的AV信息存储、处理与操作,支持交互性、高压缩比以及通用存储性等功能。同时在其结构上应具有适应性与可扩展性,以适应硬、软件技术的不断发展,便于及时融合新的技术。
相对于MPEG的前两个压缩标准,MPEG-4已不再是一个单纯的视频音频编解码标准,它将内容与交互性作为核心,从而为多媒体提供了一个更为广阔的平台。它更多定义的是一种格式和框架,而不是具体的算法,这样人们可以在系统中加入许多新的算法。除了一些压缩工具和算法外,各种各样的多媒体技术如图像分析与合成、计算机视觉、语音合成等也可以充分应用于编码中。
H.261是ITU-T针对可视电话和会议电视、窄带ISDN等要求实时编解码和低延时应用提出的一个编码标准。该标准包含的比特率为p*64Kbit/s,其中p是一个整数,取值范围为1~30,对应比特率为64Kbit/s~92Mbit/s。
7、H.261
H.261标准大体上分为两种编码模式:帧内模式和帧间模式。对于缓和运动的人头肩像,帧间编码模式将占主导位置;而对画面切换频繁或运动剧烈的序列图像,则帧间编码模式要频繁地向帧内编码模式切换。
为了减少信道误码,采用一种叫做BCH(511,493)的纠错编码方式。这种纠错码可以在493比特中自动纠正2比特的错误。按H261规定,源编码器必须具备纠错编码的功能,而纠错编码是选用的。
8、H.263
1995年,ITU-T总结当时国际上视频图像编码的最新进展,针对低比特率视频应用制定了H.263标准,该标准被公认为是以像素为基础的采用第一代编码技术的混合编码方案所能达到的最佳结果。随后几年中,ITU-T又对其进行了多次补充,以提高编码效率,增强编码功能。补充修订的版本有1998年的H.263+,2000年的H263++。H.263系列标准特别适合于PSTN网络、无线网络与因特网等环境下的视频传输。
H.263已被几种可视电话采纳为终端标准,如支持PSTN与无线网的H.324,支持N-ISDN的H.320,支持B-ISDN的H.310等。H.263信源编码算法的核心仍然是H.261标准中采用的DPCM/DCT混和编码算法,原理框图也和H.261十分相似。
9、MPEG-7与MPEG-21
MPEG-7是为“多媒体内容描述接口”,是用于信息表示的,MPEG-7是“基于语义的表示”。MPEG-7定义了一个描述符标准集,用于描述各种类型的多媒体信息,与之相应的描述方案可以用于规范多媒体描述符的生成和不同描述符之间的有机联系。
这些描述符与指定的多媒体对象的内容紧密联系,采用提取对象特征的方法为实现基于内容和语义的准确检索提供接口。在此基础上,MPEG-7定义了一种描述定义语言(DDL,Description Definition Language)用于指定和生成描述方案,即希望提出新的视频、音频信息表示方式,它既不同于基于波形和基于压缩的表示方式(如MPEG-1和MPEG-2),又不同于基于对象的表示方式(MPEG-4)。这一表示方式允许对信息的含义进行一定程度的解释,它可以被一个设备或计算机解码器存取。MPEG-7的目的在于提供一个标准化的核心技,以便描述多媒环境下的视频和音频内容,最终使视频和音频搜集像文本搜集一样简单方便。
MPEG-7可以描述的多媒体对象范围极其广泛,其核心部分DDL语言将充分吸收现有的各种媒体描述语言的特点,以达到对多媒体数据的普遍适应性。MPEG-4中提出的基于对象编码的思想将成为对多媒体数据库中的视频、音频对象进行处理(包括特征提取、压缩编码等)的基本手段。而MPEG-7的多媒体内容描述功能对MPEG-1,MPEG-2,MPEG-4起到性能提高和功能扩展的作用。
最后,MPEG-7将提供内容的描述而不是内容本身,它将不能替代已有的MPEG标准(MPEG-1,MPEG-2,MPEG-4),仅仅是已有3个标准的补充。
正在研制的新标准MPEG-21是一个支持通过异构网络和设备,使用户透明方便地使用多媒体资源的标准,其目的是建立一个交互的多媒体对象,实现多种业务模型,包括对版权和交易的自动管理,对内容使用者隐私的尊重等。
三、国内现有碟机的使用的技术
1、DVD技术
据调查,不少DVD影碟机不能实现真正的AC-3解码功能,而分别采用以下一些方式来代替:
1)、简单的两声道。不管盘片上音频数据是否按照AC-3进行编码,均以两路混合音频输出。由于省略了其余四个声道的音频输出,在硬件成本上大大降低,且向Dobly公司外纳交专利费用比真杜比AC-3解码大为减少,是DVD影碟机的低价位方案。在这种方式下,用户仅仅只能听到简单的左右两路声道效果。如果要欣赏真正的杜比AC-35.1声道环绕声效果,还需外接一台带同轴或光纤输入端子且具有AC-3解码功放,其市场价格约2000元,即另购一台DVD影碟机的价格。
2)、有六路输出端子的两声道。这种方式又称“假六声道”,它实际上只有3组相同的两声道输出,是双声道机的简单复制,根本无法实现真正的杜比AC-35.1声道的机器类似,往往容易成炒正当利益的来源。因此,消费者在选购时应仔细加以甄别。
3)、虚拟仿真AC-3声道。该方式通过一颗声场处理芯片将两声道音频经过叠加、相消等软件算法模拟出一种类似于AC-35.1声道解码输出呢?杜比AC-35.1声道的效果,但由于其音源全部来自于两路主声道,声场的表现力、层次感较真正AC-3解码都要逊色得多,且极易混淆视听,侵害消费者利益。
那么,什么是真正杜比AC-35.1声道解码输出呢?杜比AC-3是一种专门为多声道数字式音响设计的感性编码技术,它将音质学和先进的数字信号处理技术结合在一起,具有前所未有的高效率、高质量和多面性。按多声道的形式,杜比AC-3提供了五个全音频声道,其排列方法通常称为3/2结构:三个前排声道(左、中、右)加上两个环绕声道,还有一个低音频效应的声道。通俗地说,就是前置左、前置右、中置、环绕左、环绕右及重低音,也就是所谓“5.1”声道。相对于模拟式的AC-2(杜比Prologic),杜比AC-3具有两个完全独立的环绕声道,每一声道都能提供于前排三个声道完全相同的全频带保真音响。因而真实再现上述效应的解码就是真正意义的杜比AC-35.1声道解码。
2、HDV技术
HD12压缩编码系统是北京凯诚高清技术有限公司开发的针对HDV高清数字电影格式激光多媒体盘片的压缩编码系统。该系统采用优化的MPEG2视频编码格式,在原来MPEG2的基础上,采用重新定义宏块大小、重新设定量化长度、优化熵编码和优化运动补偿的方式,利用目前在半导体领域中取得的最新进展,凭借半导体芯片的强大处理能力,实现了更高的压缩比和更好的还原效果。
HD12压缩编码系统依托北京凯诚高清技术有限公司技术人员多年的技术积累,历时2年多的时间才开发完成。该系统不仅具有高效的实时压缩功能,而且还能够完成图像的清晰化处理和修补,字幕和配音的生成叠加等其他各种编辑功能。
利用凯诚高清技术有限公司开发的HD12压缩编码系统能够实现对高清视频流的高效压缩,对于目前高清视频节目匮乏的现状提供了一个很好的技术平台,能够充分满足目前高清视频节目的压缩需求,从而可以让广大消费者能够欣赏到更多更好的高清视频节目。
HDV播放机可以兼容CD、VCD、DVD等光盘,但是HDV光盘在普通的VCD、DVD等影碟机上看不了。也就是说,HDV光盘只能与HDV高清数字电影播放机相匹配,如果没有机器,买回的光盘只能等于是一张废碟。
据凯诚高清技术有限公司开发人员说:“因为HDV盘片使用的是超强压缩技术,可以在一张盘上存放3-5部高画质的电影节目,这种技术目前在国内只有他们的生产厂商掌握,而且技术都设有加密,外人根本无法窃取。”
3、EVD技术
阜国的音频压缩技术始于公司成立之初(2000年3月),并作为“新一代高密度数字激光视盘系统EVD®”项目中的子课题,经过了起步、发展和成熟几个阶段,目前已经申请了近二十项核心专利技术。这些专利已经形成了一套高效的、自主知识产权的基于多分辨率分析的音频编码技术方案EAC,在2001年7月江苏省电子产品监督检验所组织的主观音质评价实验中获得了与会专家的高度的评价。
目前,EAC编码技术可以提供单声道、双声道立体声、5.1环绕立体声、多采样率和多码率下的编解码方案,编码效率进一步提高,并已经成为EVD®规范的音频编码技术标准。
为了进一步提高编码效率,特别是在极低码率下的音频质量,在自主研发的同时,我们也加强了和国外掌握最先进音频编码技术企业的技术合作。经过长期的技术合作,北京阜国数字技术有限公司将和拥有世界最先进水平带宽扩展技术的瑞典-德国Coding Technologies公司成立合资企业,共同开发并推广EAC Plus技术。EAC Plus技术将在EAC技术基础上,进一步提高中国的音频编码技术水平,使中国音频编码技术达到国际领先水平。
我们知道,音频编码技术分可以从很多角度去分类:有损和无损、波形和参数、窄带和宽带,以及恒定码率和变率等等。但是,音频编码所处理的信号类型可以简单的分成两类:缓变成分和瞬变成分。当然,从模型的角度可分成弦类成分、瞬变成分和噪声成分,由于我们目前集中于波形编码技术研究,故不做如此划分。可以说,所有的波形编码技术都在努力寻求在一种对缓变成分和瞬变成分都有尽可能高的效率的编码技术,同时保证可以接受的编码复杂度。问题的原因在于人耳对不同信号的听觉特性。虽然从理论上讲,人耳对信号的响应是非常复杂的生理和心理问题,但在编码的过程中,突出的体现为两个矛盾。对缓变成分,人耳响应的频率分辨率较高,而时间分辨率较低;对瞬变成分则表现为较低的频率分辨率和较高的时域分辨率;且这种特性随信号的不同而不同。较高的频率分辨率对应着较高的编码效率,但同时有较差的预回声抑制能力;较高的时间分辨率则有较好的预回声抑制能力,但编码效率较低。
EAC在设计和实现的过程中,一直在努力通过一种更自然的处理方式,来处理/编码各种音频信号,这是EAC设计的基本技术路线。并具体表现在EAC一直遵循了多分辨率的分析机制,努力追求在一个统一的滤波框架中更高效的编码各种类型的音频信号。
4、HVD技术
4月28日,国内首个高清晰度视频光盘产业联盟(简称HVD联盟)在上海隆重成立。作为国内新一代高清晰视盘机的重要生产开发商,基于其在高清DVD领域的巨大影响力,清华同方顺利成为该联盟的首批成员单位。
HVD联盟是以具有自主知识产权的IC等核心关键件、自主开发的整机系统及技术为纽带,由整机制造商、内容提供商、出版发行商、核心芯片等厂商以及相关的大学、研究所自愿组成的产业联合体。联盟的奋斗目标是:通过产业链的有效整合,有序、高效、持续地推进HVD技术标准、市场和产业的发展,为我国影碟机行业从“制造大国”迈向“技术强国”做出贡献。
联盟的近期目标是发展、推进具有“高清”水平的利用红光物理格式的HVD整机内容和盘片产业,让HVD成为DVD的升级换代产品。“HVD联盟”首批成员单位有18家,主要任务是:建立、保护“HVD”知识产权机制;联盟内部实行知识产权共享;开展“HVD”标识授权和格式验证工作,保证HVD整机和盘片的统一性;做好盘片的加密和防拷贝工作;组织召开各类技术介绍会、产品推广会、格式标准发布会等
依托着自身强大的科研实力,经过三年多来的不断探索,目前清华同方已经成为国内掌握高清影碟机技术的极少数的几家生产商之一。作为清华同方影碟机产品的最新科技代表,不久前,清华同方已经推出了具有最高科技含量的DVP-i919高清DVD,可实现480P、720P逐行扫描,并可实现1920*1080i隔行扫描。同时作为目前DVD的替代产品,i919还支持MPEG4影片播放,同时设置USB1.1接口,可直接同诸多数码产品进行数据交换和查看。从近期该公司的销售数据看,清华同方高清产品市场反应不俗,目前已与市场上同期推出的EVD、HDV等换代产品并驾齐驱。
此次清华同方成功加入“HVD联盟”,相信这将为其引领高清DVD时代赢得更多先机,并将对今后的高清DVD行业走向产生深远影响。
HVD是英文High-definition Versatile Disc的缩写。HVD集强大的功能、清晰的图像、低廉的价格、优越的向下兼容能力、关键技术、自主知识产权于一身,HVD技术已向国家知识产权局申请6项发明专利。
HVD支持多种输入格式的接口:1080i/720p/576p/576i/480i/VGA/SVGA,符合视频、Y/C、YPbPr.HVD的水平清晰度和垂直清晰度均达到720线的高清标准。
一张DVD9一样容量的大小光盘中,HVD可以存放150分钟的高清晰度电影。
5、FVD技术
目前版本的FVD规格是使用650nm红光雷射;NA0.6~0.65,其物理规格比DVD容量提升;单面单层的FVD盘片容量可达5.4GB~6GB;编码方式第一代初期先用8/16编码,未来第二代则采用效率较高的8/15编码方式及提高纠错(ECC)的能力。在逻辑规格部份,采用微软WindowMediaVideo-9(WMV-9)视频压缩技术可容纳135分钟1280x720p的高画质节目,其中新开发的高画质影音技术如:Menu动态&动态含背景,Program playback, Menu playback, Sub-picture-playback, Master-Slave playback等。此外,为达到保护智能财产的目的,亦将提供Advanced Encryption Standard(AES)Content Protection system防拷机制。
⑸ 数字图像压缩编码有什么最新的算法或改进的算法
以下是几种格式的专业解释:
HDTV
一,HDTV的概念
要解释HDTV,我们首先要了解DTV。DTV是一种数字电视技术,是目前传统模拟电视技术的接班人。所谓的数字电视,是指从演播室到发射、传输、接收过程中的所有环节都是使用数字电视信号,或对该系统所有的信号传播都是通过由二进制数字所构成的数字流来 完成的。数字信号的传播速率为每秒19.39兆字节,如此大的数据流传输速度保证了数字电视的高清晰度,克服了模拟电视的先天不足。同时,由于数字电视可以允许几种制式信号的同时存在,因此每个数字频道下又可分为若干个子频道,能够满足以后频道不断增多的 需求。HDTV是DTV标准中最高的一种,即High Definision TV,故而称为HDTV。
二,HDTV中要求音、视频信号达到哪些标准?
HDTV规定了视频必须至少具备720线非交错式(720p,即常说的逐行)或1080线交错式隔行(1080i,即常说的隔行)扫描(DVD标准为 480线),屏幕纵横比为16:9。音频输出为5.1声道(杜比数字格式),同时能兼容接收其它较低格式的 信号并进行数字化处理重放。
HDTV有三种显示格式,分别是:720P(1280×720P,非交错式),1080 i(1920×1080i,交错式),1080P(1920×1080i,非交错式),其中网络上流传的以720P和1080 i最为常见,而在微软WMV-HD站点上1080P的样片相对较多。
三,如何收看HDTV节目?
目前有两种方式可欣赏到HDTV节目。一种是在电视上实时收看HDTV,需要满足两个条件,首先是电视可接收到HDTV信号,这需要额外添加相关的硬件,其次是电视符合HDTV标准,主要是指电视的分辨率和接收端口而言。
另一种是在电脑上通过软件播放。目前我国只有极少部分地区可接收到HDTV数字信号,而且HDTV电视的价格仍高高在上,不是普通消费者所能承受的。因此,在网络中找寻HDTC源,下载后在个人电脑上播放,成了大多数HDTV迷们的一个尝鲜方法。
四,哪些是可用于电脑播放的HDTV文件?
网络中流传的HDTV主要以两类文件的方式存在,一类是经过MPEG-2标准压缩,以.tp和.ts为后缀的视频流文件,一类是经过WMV-HD (Windows Media Video High Definition)标准压缩过的.wmv文件,还有少数文件后缀为.avi或.mpg,其性质与.wmv是完全一样的。
HDTV文件都比较大,即使是经过重新编码过后的.wmv文件也非同小可。以一部普通电影的时间长度来计算,.wmv文件将会有4G以上,而同样时间长度的.tp和.ts文件能达到8G以上,有的甚至达到20多G。因此,除了通过文件后缀名,还可以通过文 件大小来判断是否为HDTV文件。
五,如何在个人电脑上播放HDTV节目?
对于.wmv文件,只要系统安装了Windows Media Player 9 或更高版本,就可以正常播放,一些播放软件的最新版本已经开始支持WMV-HD,如WINDVD6等,也可以直接使用这些软件播放HDTV。有些HDTV文件在压缩过程中采用了其它标准的编码格式,就需要安装对应的解码器,遇到Windows Media Player 9不能正常播放时,可以再安装ffdshow,它带有各种最常用的解码器。
播放以.tp和.ts为后缀的视频流文件要稍微麻烦一点,因为文件中分别包含有AC3音频信息和MPEG-2视频信息。好在现下有已经不少专门播放.tp 和.ts文件的软件问世了,Moonlight-Elecard MPEG Player 就是其中一款比较常见的支持HDTV播放的软件,目前最新的版本为2.x。安装完后,也可以运行其它播放软件来调用Moonlight- Elecard MPEG Player的解码器进行播放。
六,如何鉴别HDTV的显示格式?
目前我们无法仅从文件名称、大小上来判定一个HDTV文件的显示格式是720P还是1080i,或是1080P,但是有不少软件可以在播放时显示影片的图像信息,如WINDVD、zplay等,在软件的控制面板中选择对应的选项就可以看到详细的信息。
七,为什么我只能看到图像,却听不到声音?
这是因为未安装AC3音频解码器,导致HDTV文件中的音频信息不能被正确识别的原因。解决的方法是下载并安装对应的音频解码器,常用的有 AC3Filter,这些音、视频解码器只需安装一次即可,播放HDTV文件时系统会自动调用,而不必每次播 放的时候都打开其控制界面。
八,为什么我播放HDTV时会出现丢帧现象?
在家用电脑上播放HDTV,对其硬件配置要求较高,主要是与CPU、显存、内存紧紧相关,如果这三样中有一样性能过低,就会产生一些播放问题。播放 HDTV时会出现丢帧现象是显存容量不够造成的,尤其是在播放1080 i格式HDTV的时候,1920×1080的像素量,需要足够大的显存才能满足其数据吞吐,因此显存至少需要64M以上,建议128M。由于是2D显示,所以对显卡核心的运算能力要求反而不是很高。
九,为什么我播放HDTV时会经常出现画面和语音停顿的现象?
一些采用了WMV-HD重新编码的HDTV文件,因为有着较高的压缩率,在播放时就需要非常高的CPU运算能力来进行实时解码,一般来说P4 2.0G/AMD 2000 以上及同级别的CPU可达到这个要求。同时,由于HDTV的数据流较大,需要足够的内存来支持,推荐在256M以上。如果你的电脑满足不了这样的配置,就可能会在播放过程中产生画面与语音不同步、画面经常停顿、爆音等现象。严重的话甚至无法顺利观看。如果 这种现象不太严重,则可以通过优化系统和一些小技巧来改善。
十,如何优化系统以保证顺利地播放HDTV?
除非你的电脑硬件配置的确很强,否则就很可能需要对系统进行一些优化,以便可以顺利地播放HDTV。首先是在播放HDTV前关闭所有没有用的后台程序或进程,尽量增加系统的空闲资源为播放HDTV服务;其次是选择一款占用系统资源较低的软件来播放HDTV 。Windows Media Player、WINDVD等软件占用系统资源较多,在硬件配置本就不高的系统上会影响HDTV的播放效果,这时可以选择使用BSPlayer。 BSPlayer是一款免费软件,最大的特点就是占用系统资源很小,尤其在播放HDTV文件时,与其它几个资源占用大户相比效果更为明显。另外,运行播放软件后立即打开任务管理器(仅在Windows 2000/XP中有效),将播放软件的进程级别设置为最高,这样也可以为HDTV的播放调用更多的系统资源。除此之外,安装更高版本的 DirectX,也能更好地支持HDTV的播放。
十一,还有什么其它的技巧?
如果你的PC可以流利地播放HDTV,那么你唯一会感到遗憾的,可能就是抱怨显示器太小和音箱太不够劲了。音箱的问题没有好的方法可以解决,必竟PC音箱和家庭影院的音箱两者是不可同比的,然而我们可以通过调高显示器的分辨率来提高画面的清晰度和细节感。 现在主流的显示器为17寸纯平CRT(因为改变标准分辨率只会给LCD带来负面影响,因此这种方法只针对普通的CRT显示器),中低档的17寸显示器很难达到1600×1200以上的分辨率,即使达到了其水平扫描率也在60Hz以下,但是请不要忘了,电视 信号的水平扫描率也就是在这个水平上。720P的水平扫描率为60Hz,1080i则有50Hz和60Hz两种,分别为我国和美国地区的标准。也就是说,即使你在显示器水平扫描率为60Hz的状态下全屏观看HDTV或DVD等其它视频,你是感觉不到晃眼的 ,这主要是由于人眼对于动态和静态物体的感应不同造成的。因此你可以在观看HDTV的时候,放心地将显示器水平扫描率设为60Hz,进而将分辨率调高,平时使用再调回标准分辨率即可。
存放HDTV文件的硬盘分区必须转换为NTFS格式,因为一部HDTV电影通常是几个4.3GB的视频文件组成(为了方便刻录在DVD上面),而FAT32是无法管理2GB以上的文件的,因此务必转换分区格式。
H.264
JVT(Joint Video Team,视频联合工作组)于2001年12月在泰国Pattaya成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。JVT的工作目标是制定一个新的视频编码标准,以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。目前JVT的工作已被ITU-T接纳,新的视频压缩编码标准称为H.264标准,该标准也被ISO接纳,称为AVC(Advanced Video Coding)标准,是MPEG-4的第10部分。
H.264标准可分为三档:
基本档次(其简单版本,应用面广);
主要档次(采用了多项提高图像质量和增加压缩比的技术措施,可用于SDTV、HDTV和DVD等);
扩展档次(可用于各种网络的视频流传输)。
H.264不仅比H.263和MPEG-4节约了50%的码率,而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输,网络亲和性好。
H.261是最早出现的视频编码建议,目的是规范ISDN网上的会议电视和可视电话应用中的视频编码技术。它采用的算法结合了可减少时间冗余的帧间预测和可减少空间冗余的DCT变换的混合编码方法。和ISDN信道相匹配,其输出码率是p×64kbit/s。p取值较小时,只能传清晰度不太高的图像,适合于面对面的电视电话;p取值较大时(如 p>6),可以传输清晰度较好的会议电视图像。H.263 建议的是低码率图像压缩标准,在技术上是H.261的改进和扩充,支持码率小于64kbit/s的应用。但实质上H.263以及后来的H.263 和H.263 已发展成支持全码率应用的建议,从它支持众多的图像格式这一点就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。
MPEG-1标准的码率为1.2Mbit/s左右,可提供30帧CIF(352×288)质量的图像,是为CD-ROM光盘的视频存储和播放所制定的。MPEG-l标准视频编码部分的基本算法与H.261/H.263相似,也采用运动补偿的帧间预测、二维DCT、VLC游程编码等措施。此外还引入了帧内帧(I)、预测帧(P)、双向预测帧(B)和直流帧(D)等概念,进一步提高了编码效率。在MPEG-1的基础上,MPEG-2标准在提高图像分辨率、兼容数字电视等方面做了一些改进,例如它的运动矢量的精度为半像素;在编码运算中(如运动估计和DCT)区分“帧”和“场”;引入了编码的可分级性技术,如空间可分级性、时间可分级性和信噪比可分级性等。近年推出的MPEG-4标准引入了基于视听对象(AVO:Audio-Visual Object)的编码,大大提高了视频通信的交互能力和编码效率。 MPEG-4中还采用了一些新的技术,如形状编码、自适应DCT、任意形状视频对象编码等。但是MPEG-4的基本视频编码器还是属于和H.263相似的一类混合编码器。
总之,H.261建议是视频编码的经典之作,H.263是其发展,并将逐步在实际上取而代之,主要应用于通信方面,但H.263众多的选项往往令使用者无所适从。MPEG系列标准从针对存储媒体的应用发展到适应传输媒体的应用,其核心视频编码的基本框架是和H.261一致的,其中引人注目的MPEG-4的“基于对象的编码”部分由于尚有技术障碍,目前还难以普遍应用。因此,在此基础上发展起来的新的视频编码建议H.264克服了两者的弱点,在混合编码的框架下引入了新的编码方式,提高了编码效率,面向实际应用。同时,它是两大国际标准化组织的共同制定的,其应用前景应是不言而喻的。
JVT的H.264
H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份开始草案征集,1999年9月,完成第一个草案,2001年5月制定了其测试模式TML-8,2002年6月的 JVT第5次会议通过了H.264的FCD板。2003年3月正式发布。
H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。但它采用“回归基本”的简洁设计,不用众多的选项,获得比H.263 好得多的压缩性能;加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同分辨率以及不同传输(存储)场合的需求;它的基本系统是开放的,使用无需版权。
在技术上,H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、多模式的位移估计,基于4×4块的整数变换、分层的编码语法等。这些措施使得H.264算法具有很的高编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。
H.264的技术亮点
(1) 分层设计
H.264的算法在概念上可以分为两层:视频编码层(VCL:Video Coding Layer)负责高效的视频内容表示,网络提取层(NAL:Network Abstraction Layer)负责以网络所要求的恰当的方式对数据进行打包和传送。在VCL和NAL之间定义了一个基于分组方式的接口,打包和相应的信令属于NAL的一部分。这样,高编码效率和网络友好性的任务分别由VCL和NAL来完成。
VCL层包括基于块的运动补偿混合编码和一些新特性。与前面的视频编码标准一样,H.264没有把前处理和后处理等功能包括在草案中,这样可以增加标准的灵活性。
NAL负责使用下层网络的分段格式来封装数据,包括组帧、逻辑信道的信令、定时信息的利用或序列结束信号等。例如,NAL支持视频在电路交换信道上的传输格式,支持视频在Internet上利用RTP/UDP/IP传输的格式。NAL包括自己的头部信息、段结构信息和实际载荷信息,即上层的VCL数据。(如果采用数据分割技术,数据可能由几个部分组成)。
(2) 高精度、多模式运动估计
H.264支持1/4或1/8像素精度的运动矢量。在1/4像素精度时可使用6抽头滤波器来减少高频噪声,对于1/8像素精度的运动矢量,可使用更为复杂的8抽头的滤波器。在进行运动估计时,编码器还可选择“增强”内插滤波器来提高预测的效果。
在H.264的运动预测中,一个宏块(MB)可以按图2被分为不同的子块,形成7种不同模式的块尺寸。这种多模式的灵活和细致的划分,更切合图像中实际运动物体的形状,大大提高了运动估计的精确程度。在这种方式下,在每个宏块中可以包含有1、2、4、8或16个运动矢量。
在H.264中,允许编码器使用多于一帧的先前帧用于运动估计,这就是所谓的多帧参考技术。例如2帧或3帧刚刚编码好的参考帧,编码器将选择对每个目标宏块能给出更好的预测帧,并为每一宏块指示是哪一帧被用于预测。
(3) 4×4块的整数变换
H.264与先前的标准相似,对残差采用基于块的变换编码,但变换是整数操作而不是实数运算,其过程和DCT基本相似。这种方法的优点在于:在编码器中和解码器中允许精度相同的变换和反变换,便于使用简单的定点运算方式。也就是说,这里没有“反变换误差”。变换的单位是4×4块,而不是以往常用的8×8块。由于用于变换块的尺寸缩小,运动物体的划分更精确,这样,不但变换计算量比较小,而且在运动物体边缘处的衔接误差也大为减小。为了使小尺寸块的变换方式对图像中较大面积的平滑区域不产生块之间的灰度差异,可对帧内宏块亮度数据的16个4×4块的DC系数(每个小块一个,共16个)进行第二次4×4块的变换,对色度数据的4个4×4块的DC系数(每个小块一个,共4个)进行2×2块的变换。
H.264为了提高码率控制的能力,量化步长的变化的幅度控制在12.5%左右,而不是以不变的增幅变化。变换系数幅度的归一化被放在反量化过程中处理以减少计算的复杂性。为了强调彩色的逼真性,对色度系数采用了较小量化步长。
(4) 统一的VLC
H.264中熵编码有两种方法,一种是对所有的待编码的符号采用统一的VLC(UVLC :Universal VLC),另一种是采用内容自适应的二进制算术编码(CABAC:Context-Adaptive Binary Arithmetic Coding)。CABAC是可选项,其编码性能比UVLC稍好,但计算复杂度也高。UVLC使用一个长度无限的码字集,设计结构非常有规则,用相同的码表可以对不同的对象进行编码。这种方法很容易产生一个码字,而解码器也很容易地识别码字的前缀,UVLC在发生比特错误时能快速获得重同步。
图3显示了码字的语法。这里,x0,x1,x2,…是INFO比特,并且为0或1。图4列出了前9种码字。如:第4号码字包含INFO01,这一码字的设计是为快速再同步而经过优化的,以防止误码。
(5) 帧内预测
在先前的H.26x系列和MPEG-x系列标准中,都是采用的帧间预测的方式。在H.264中,当编码Intra图像时可用帧内预测。对于每个4×4块(除了边缘块特别处置以外),每个像素都可用17个最接近的先前已编码的像素的不同加权和(有的权值可为0)来预测,即此像素所在块的左上角的17个像素。显然,这种帧内预测不是在时间上,而是在空间域上进行的预测编码算法,可以除去相邻块之间的空间冗余度,取得更为有效的压缩。
如图4所示,4×4方块中a、b、...、p为16 个待预测的像素点,而A、B、...、P是已编码的像素。如m点的值可以由(J+2K+L+2)/ 4 式来预测,也可以由(A B C D I J K L)/ 8 式来预测,等等。按照所选取的预测参考的点不同,亮度共有9类不同的模式,但色度的帧内预测只有1类模式。
(6) 面向IP和无线环境
H.264 草案中包含了用于差错消除的工具,便于压缩视频在误码、丢包多发环境中传输,如移动信道或IP信道中传输的健壮性。
为了抵御传输差错,H.264视频流中的时间同步可以通过采用帧内图像刷新来完成,空间同步由条结构编码(slice structured coding)来支持。同时为了便于误码以后的再同步,在一幅图像的视频数据中还提供了一定的重同步点。另外,帧内宏块刷新和多参考宏块允许编码器在决定宏块模式的时候不仅可以考虑编码效率,还可以考虑传输信道的特性。
除了利用量化步长的改变来适应信道码率外,在H.264中,还常利用数据分割的方法来应对信道码率的变化。从总体上说,数据分割的概念就是在编码器中生成具有不同优先级的视频数据以支持网络中的服务质量QoS。例如采用基于语法的数据分割(syntax-based data partitioning)方法,将每帧数据的按其重要性分为几部分,这样允许在缓冲区溢出时丢弃不太重要的信息。还可以采用类似的时间数据分割(temporal data partitioning)方法,通过在P帧和B帧中使用多个参考帧来完成。
在无线通信的应用中,我们可以通过改变每一帧的量化精度或空间/时间分辨率来支持无线信道的大比特率变化。可是,在多播的情况下,要求编码器对变化的各种比特率进行响应是不可能的。因此,不同于MPEG-4中采用的精细分级编码FGS(Fine Granular Scalability)的方法(效率比较低),H.264采用流切换的SP帧来代替分级编码。
H.264的性能测试
TML-8为H.264的测试模式,用它来对H.264的视频编码效率进行比较和测试。测试结果所提供的PSNR已清楚地表明,相对于MPEG-4(ASP:Advanced Simple Profile)和H.263 (HLP:High Latency Profile)的性能,H.264的结果具有明显的优越性,如图5所示。
H.264的PSNR比MPEG-4(ASP)和H.263 (HLP)明显要好,在6种速率的对比测试中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6个测试速率及其相关的条件分别为:32 kbit/s速率、10f/s帧率和QCIF格式;64 kbit/s速率、15f/s帧率和QCIF格式;128kbit/s速率、15f/s帧率和CIF格式;256kbit/s速率、15f/s帧率和QCIF格式;512 kbit/s速率、30f/s帧率和CIF格式;1024 kbit/s速率、30f/s帧率和CIF格式。
实现难度
对每个考虑实际应用的工程师而言,在关注H.264的优越性能的同时必然会衡量其实现难度。从总体上说,H.264性能的改进是以增加复杂性为代价而获得的。目前全球也只有中国杭州海康威视数字技术有限公司在安防领域实现了H.264的实际应用,这一次我们走到了世界的前端!
1080p
1080P是标准层面上的HDTV或者硬件层面上FULL HD的最高标准之一,而FULL HD就是能够完全显示1920*1080像素或者说物理分辨率达到1920*1080的平板电视机。需要注意的是,FULL HD和先前很多厂家宣传的1080P并不是同样的概念。
但是我们走进卖场会发现大多数品牌商家都打着1080P的旗帜对外宣传,多少对我们的选购产生了阻碍.其实目前市场中的大多数平板电视都不是FULL HD,所谓的1080P只是支持1080P信号的接收并通过计算演变在屏幕上显示,大多数大屏幕平板电视都为1366*768,等离子中的部分产品更低,要达到FULL HD的概念,就必须屏幕达到1920*1080的物理分辨率以及至少30Hz的刷新率.
WAF
We Are Family 的简称 [我们是一家人]
WAF是韩国的一个影视制作小组,他们制作的DVDRIP是目前网上除了HDTV之外质量最好的,清晰度和音质都是上乘之作。
WAF的作品有以下特点:
1:严格控制每CD的容量,每CD的容量大小一般不超过0.05M(大家见过不少CD1是702M,CD2却是698M的现象吧)。
2:经过控制的容量,利于刻盘,(有些小组制作的容量经常可以超过702M,一CD盘的容量,这时候超刻技术就受重视了^_^)
3:分割片子时注意场景转换,极少造成一段场景有分裂感(例如4CD的《特洛伊》和4CD的《黑鹰》)。
4:每个片子压制的尺寸都以OAR为准,即导演原始版。
5:尺寸统一,几乎都是800线。(例:WAF20CD DTS版BOB,800*448,见过15CD的HDTVRIP版,居然有两种尺寸!)我不清楚,一部大片为什么大家会忍受得了分辨率为640甚至以下的版本?
6:有极强的负责任的制作态度,发现有瑕疵的一般都会推出修复版.
7:喜欢WAF的DTS和AC3音频和高码率压缩的视频.
8:WAF每部片分割成的CD数一般都比别的小组制作的要多,这是为了保证必要的画质和音质的质量。试想想有个加长版《角斗士》使用DTS音轨,却只分割成2CD,每CD有70多分钟长,不知这样压缩出来的片子画质能好到什么程度?
所以说,WAF小组出品的DVDRip一般都是网上最清晰的版本。
问题补充:
普通家用电视的分辨率是多少?是不是屏幕越大分辨率越高?
电视的NTSC标准为720x480 刷新率为60Hz , PAL为720x576,刷新率为50Hz。 我国电视广播采用 PAL制。
逐行电视接收隔行信号经过差补后可以达到逐行输出,同时75Hz刷新率 ,或者隔行输出,同时100Hz刷新率。
虽然PAL制可达576线,但普通电视的实际可分辨水平线数只有300~500。高清电视理论上可达720P 和1080i,就是说最多逐行720线。所以按理论来说,搞清电视用1024x768的VGA输入也勉强可以表现出来了,但实际因为聚焦不准,文字显示比能显示1024x768的显示器差很多,画面显示则没什么问题。
HDTV是不是没有经过压缩,最原始的视频?
网络中流传的HDTV主要以两类文件的方式存在,一类是经过MPEG-2标准压缩,以.tp和.ts为后缀的视频流文件,一类是经过WMV-HD (Windows Media Video High Definition)标准压缩过的.wmv文件,还有少数文件后缀为.avi或.mpg,其性质与.wmv是完全一样的。
H.264等压缩格式是不是为了方便网上传播?
在技术上,H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、多模式的位移估计,基于4块的整数变换、分层的编码语法等。这些措施使得H.264得算法具有很高的编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。
H.264能以较低的数据速率传送基于联网协议(IP)的视频流,在视频质量、压缩效率和数据包恢复丢失等方面,超越了现有的MPEG-2、MPEG-4和H.26x视频通讯标准,更适合窄带传输。
网上流传的Rip格式是什么意思?DVDRip
DVDRip理解:其实就是一种DVD的备份技术。
DVD我们都知道,目前非常优秀的媒体格式,MPEG2编码的视频;AC3、DTS的音轨。但是我们也知道DVD载体是DVD光盘,D5一张就有4.7G。显然,直接将DVD文件进行网络传送毫无实际价值可言,将这样的文件打包传到服务器上只会占用服务器的硬盘和大量的网络带宽。还没有多少人的网络带宽可以让他毫不动容地去下载一个7、8GB的文件只为了看两个小时电影,更不要说将它们保存下来,DVD刻录机这样的产品目前也不是一般人能拥有的。
这就需要rip了,将DVD的视频、音频、字幕剥离出来,再经过压缩或者其他处理,然后重新合成成多媒体文件。在更小的文件尺寸上达到DVD的是视听享受。
⑹ 什么是JPEG,MHEG,MPEG和MPC
JPEG
http://ke..com/view/7679.htm?fr=ala0_1
JPEG是Joint Photographic Experts Group(联合图像专家组)的缩写,文件后辍名为".jpg"或".jpeg",这个名称代表Joint Photographic Experts Group(联合图像专家小组)。JPEG本身只有描述如何将一个影像转换为字节的数据串流(streaming),但并没有说明这些字节如何在任何特定的储存媒体上被封存起来。.jpeg/.jpg是最常用的图像文件格式,由一个软件开发联合会组织制定,是一种有损压缩格式,能够将图像压缩在很小的储存空间,图像中重复或不重要的资料会被丢失,因此容易造成图像数据的损伤。尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量明显降低,如果追求高品质图像,不宜采用过高压缩比例。但是JPEG压缩技术十分先进,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现十分丰富生动的图像,换句话说,就是可以用最少的磁盘空间得到较好的图像品质。而且 JPEG是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对文件进行压缩,支持多种压缩级别,压缩比率通常在10:1到40:1之间,压缩比越大,品质就越低;相反地,压缩比越小,品质就越好。比如可以把1.37Mb的BMP位图文件压缩至20.3KB。当然也可以在图像质量和文件尺寸之间找到平衡点。JPEG格式压缩的主要是高频信息,对色彩的信息保留较好,适合应用于互联网,可减少图像的传输时间,可以支持24bit真彩色,也普遍应用于需要连续色调的图像。
JPEG格式是目前网络上最流行的图像格式,是可以把文件压缩到最小的格式,在 Photoshop软件中以JPEG格式储存时,提供11级压缩级别,以0—10级表示。其中0级压缩比最高,图像品质最差。即使采用细节几乎无损的10 级质量保存时,压缩比也可达 5:1。以BMP格式保存时得到4.28MB图像文件,在采用JPG格式保存时,其文件仅为178KB,压缩比达到24:1。经过多次比较,采用第8级压缩为存储空间与图像质量兼得的最佳比例。
JPEG格式的应用非常广泛,特别是在网络和光盘读物上,都能找到它的身影。目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快。
JPEG2000作为JPEG的升级版,其压缩率比JPEG高约30%左右,同时支持有损和无损压缩。JPEG2000格式有一个极其重要的特征在于它能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示。此外,JPEG2000还支持所谓的"感兴趣区域" 特性,可以任意指定影像上感兴趣区域的压缩质量,还可以选择指定的部分先解压缩。在有些情况下,图像中只有一小块区域对用户是有用的,对这些区域,采用低压缩比,而感兴趣区 域之外采用高压缩比,在保证不丢失重要信息的同时,又能有效地压缩数据量,这就是基于感兴 趣区域的编码方案所采取的压缩策略。其优点在 于它结合了接收方对压缩的主观需求,实现了交互式压缩。而接收方随着观察,常常会有新的要求,可能对新的区域感兴趣,也可能希望某一区域更清晰些。
JPEG2000和JPEG相比优势明显,从无损压缩到有损压缩可以兼容,而JPEG不行,JPEG的有损压缩和无损压缩是完全不同的两种方法。JPEG2000即可应用于传统的JPEG市场,如扫描仪、数码相机等,又可应用于新兴领域,如网路传输、无线通讯等等。
JPEG(Joint Photographic Experts Group)是在国际标准化组织(ISO)领导之下制定静态图像压缩标准的委员会,第一套国际静态图像压缩标准ISO 10918-1(JPEG)就是该委员会制定的。由于JPEG优良的品质,使他在短短几年内获得了极大的成功,被广泛应用于互联网和数码相机领域,网站上80%的图像都采用了JPEG压缩标准。然而,目前的JPEG静止图像压缩标准,具有中端和高端比特速率上的良好的速率畸变特性,但在低比特率范围内,将会出现很明显的方块效应,其质量变得不可接受。JPEG不能在单一码流中提供有损和无损压缩,并且不能支持大于64×64 K的图像压缩。同时,尽管当前的JPEG标准具有重新启动间隔的规定,但当碰到比特差错时图像质量将受到严重的损坏。�
针对这些问题,自1997年3月起,JPEG图像压缩标准委员会开始着手制定新一代的图像压缩标准以解决上述问题。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式JPEG2000图像压缩标准的编码算法。
MHEG
http://www.sat-china.com/bbs/viewthread.php?tid=63571
MPEG
http://ke..com/view/7689.htm?fr=ala0_1
MPC
http://ke..com/view/63606.htm
⑺ 视频图像编码标准MPEG2算法流程是什么 越详细越好
这是大体框架 http://wenku..com/view/9706e8e39b89680203d825a6.html
⑻ 简述JPEG压缩算法
首先你需要了解几个概念,有损压缩,量化,行程编码。
对一副图片来说,bitmap就是原始格式,没经过任何压缩的。
量化就是把所有0-255的像素值进行归类,然后分成尽量少的积累,这要存储量就小很多了,对于JEPG来说量化是有损压缩的起源。
最后就是对所有的已经归类过的点进行行程编码,然后就压缩完了