算术编码:
算术编码在图像数据压缩标准(如JPEG,JBIG)中扮演了重要的角色在算术编码中,消息用0到1之间的实数进行编码,算术编码用到两个基本的参数:符号的概率和它的编码间隔决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间过程中的间隔决定了符号压缩后的输出。 算术编码示例
假设信源符号为{00, 01, 10, 11},这些符号的概率分别为{ 0.1, 0.4, 0.2, 0.3 },根据这些概率可把间隔[0, 1)分成4个子间隔:[0, 0.1), [0.1, 0.5), [0.5, 0.7), [0.7, 1),二进制消息序列的输入为:10 00 11 00 10 11 01
34. 为什么霍夫曼编码被称为最优编码(optimal prefix code)?
霍夫曼编码,是变长编码,它的核心思想:出现次数最多的符号用最短的编码,出现次数最少的符号用最长的编码。当信源符号概率是2的负幂次方时,编码效率达到100%。一般情况下,它的编码效率比其他编码方法的效率高
35. 统计编码有何特点?行程编码是如何编码的?(答①)
①统计编码包括行程编码,LZW编码和哈夫曼编码,算术编码,属于无失真编码。它是根据信息出现概率的分布而进行的压缩编码。编码时某种比特或字节模式的出现概率大,用较短的码字表示;出现概率小,用较长的码字表示。如果码流中所有模式出现的概率相等,则平均信息量最大,信源没有冗余。它宗旨在于,在消息和码字之间找到一种一一对应的关系,以便在恢复时能准确无误的再现出来,使平均码长或码率压低到最低限度。
行程编码:主要技术是检测重复的比特或者字符序列,并用它们的出现次数取而代之,它计算信源符号出现的行程长度,然后将行程长度转换成代码,它适合0,1成片出现的数据压缩。
②统计编码根据信息码字出现概率的分布特征而进行压缩编码,寻找概率与码字长度间 的最优匹配。常用的统计编码有行程编码、Huffman编码和算术编码三种。 行程编码是一种统计编码,该编码属于无损压缩编码。对于二值图有效。
行程编码的基本原理是:用一个符号值或串长代替具有相同值的连续符号(连续符号构成了一段连续的“行程”。行程编码因此而得名),使符号长度少于原始数据的长度。
例如:5555557777733322221111111 行程编码为:(5,6)(7,5)(3,3)(2,4)(l,7)。可见,行程编码的位数远远少于原始字符串的位数。
③特点:无损,存在压缩极限,有错误蔓延的情况 形成编码:
统计编码特点:根据Shannon信息熵理论编码,最佳的数据压缩方法的理论极限是信息熵。如果要求在编码过程中不丢失信息量,即要求保存信息熵,这种信息保持的编码又叫熵保存编码,或叫熵编码。熵编码是无失真压缩。 行程编码实现:
36. ΔM、DPCM、ADPCM 编码的基本原理是什么? (增加了其他几种编码)
1、PCM:即脉码编码,它是将原始的模拟信号经过时间采样,然后对每一样值进行量化,作为数字信号传输。
2、deltaM:增量调制是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成 “0”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”,则用“1”表示;相反则用“0”表示,或者相反。由于DM编码只须用1位对 话音信号进行编码,所以DM编码系统又称为“1位系统”。
3、APCM, 自适应脉码调制是一种根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变;也可以是音节自适应,即量化阶的大小在较长时间周期里发生变化。改变量化阶大小的方法有两种:前向自适应和后向自适应。
4、DPCM, 差分脉冲编码调制是对输入对相邻样本之差编码而不是对样本本身编码,由于相邻样本之差比实际样本幅度小,所以表示差信号需要较小的位数。
对于有些信号(例如图像信号)由于信号的瞬时斜率比较大,很容易引起过载,因此,不能用简单增量调制(△M编码)进行编码,对于这类瞬时斜率比较大的信号,通常采用一种综合了增量调制和PCM脉冲编码调制两者特点的调制方法进行编码,这种编码方式被简称为脉码增量调制,或称差值脉码调制,用DPCM表示。
37. G.711中使用的量化和JPEG压缩中的量化有何差异?
G.711,采用非线性量化技术,P47 JPEG,采用线性均匀量化器,P53
38. MPEG编码中减少时间冗余量的方法有哪些?
(书上p58,ppt)
为了减少时间冗余量,MPEG将1/3的时间间隔的帧序列电视图像,以3种类型的图像表示,即内码帧(I),预测帧(P),插补帧(B),另有第四种类型帧D帧,它是一种专用帧格式,仅仅用于现实快速查询中。移动补偿算法来去掉冗余信息 1/4象素精度的运动估计 7种大小不同的块进行匹配 前向与后向多个参考帧
39. MPEG-4与MPEG-1、MPEG-2有什么本质不同?MPEG-7的目标是什么?
①MPEG-1和MPEG-2是采用以仙农信息论为基础的预测编码、变换编码、熵编码及运动补偿等第一代数据压缩编码技术,它们着眼于图像信号的统计特性来设计编码器,属于波形编码的范畴;MPEG-4(ISO/IEC 14496)则是基于第二代压缩编码技术制定的国际标准,它以视听媒体对象为基本单元,采用基于内容的压缩编码,以实现数字视音频、图形合成应用及交互式多媒体的集成,基于Vop的编码,包括形状编码、运动估计和运动补偿、纹理编码、分级扩展编码。(P63)
MPEG-1、MPEG-2、H.261、H.263都是第一代压缩编码技术,MPEG-4代表了基于模型/对象的第二代压缩编码技术,充分利用了人眼视觉特性,抓住了图像信息传输的本质,从轮廓、纹理思路出发,支持基于视觉内容的交互功能,这适应了多媒体信息的应用由播放型转向基于内容的访问、检索及制作的发展趋势。
?AV对象(AVO,Audio Visual Object)是MPEG-4为支持基于内容编码而提出的重要概念。对象是指在一个场景中能够访问和操纵的实体,对象的划分可根据其独特的纹理、运动、形状、模型和高层语义为依据。在MPEG-4中所见的视音频已不再是过去MPEG-1、MPEG-2中图像帧的概念,而是一个个视听场景(AV场景),这些不同的AV场景由不同的AV对象组成。(ppt)
MPEG-7:MPEG-7并不是一个视频压缩标准,它是一个多媒体内容的描述标准。
MPEG-7:其目标就是产生一种描述多媒体内容数据的标准,满足实时、非实时以及推-拉应用的需求。MPEG-7的功能与其他MPEG标准互为补充。MPEG-1、 MPEG-2和MPEG-4是内容本身的表示,而MPEG-7是有关内容的信息,是比特的比特。 1.支持多种音频和视觉的描述
描述包括自由文本、n维时空结构、统计信息、客观属性、主观属性、生产属性和组合信息。对于视觉信息,描述可能包括颜色、视觉对象、纹理、草图、形状、体积、空间关系、运动及变形等。对于音频信息,描述可能包括音调、调式、音速、音速变化等。
2.根据信息的抽象层次,提供一种描述多媒体材料的方法以便表示不同层次的用户对信息的需求。
3.支持数据管理的灵活性、数据资源的全球化和互操作性。
40. MPEG 标准中I 帧、P 帧和B 帧的定义和作用是什么?说明双向预测误差的方法的优缺点。(答②,P58)
②I帧: 内码帧,是完整的独立编码的图像,是不能有其他帧构造的帧,必须存储或者传输,由于I帧与其他帧无关,它可以作为视频序列的起点和数据流中随机访问点。I帧是基准帧。 P帧:预测帧,通过对它之前的I帧进行预测,对预测误差作有条件的存储和传输。
B帧:双向帧或插补帧,是根据其前后的I帧或者P帧的信息进行差值编码而获得,该过程有时也称为双向插值。
优点:它既可以利用前面图的信息,又可以利用后面图的信息。由于视频信号时域帧间冗余度很高,需要传送的附加运动校正信息非常少,所以插补运动补偿可以大幅度的压缩数据。 缺点:如果插补图过多,尽管压缩比增加,但图像的质量会降低。对大多数图像而言,参考图之间以大约1/10s的时间间隔隔开还是合乎要求的。
③首先,MPEG-1压缩的基本思想:帧内压缩和帧间压缩。
其次,时间相关性的统计分析:统计的结果表明,在间隔1~2帧的图像中,各像素只有10%以下的点,其亮度差值变化超过2%,而色度差值的变化只有1%以下。
采用的压缩方法: 分组:把几帧图像分为一组(GOP),为防止运动变化,帧数不宜取多。 1.定义帧:将每组内各帧图像定义为三种类型,即I帧、B帧和P帧; 2.预测帧:以I帧做为基础帧,以I帧预测P帧,再由I帧和P帧预测B帧; 3.数据传输:最后将I帧数据与预测的差值信息进行存储和传输。
I帧:帧内编码帧 I帧特点:
1.它是一个全帧压缩编码帧。它将全帧图像信息进行JPEG压缩编码及传输; 2.解码时仅用I帧的数据就可重构完整图像; 3.I帧描述了图像背景和运动主体的详情; 4.I帧不需要参考其他画面而生成;
5.I帧是P帧和B帧的参考帧(其质量直接影响到同组中以后各帧的质量); 6.I帧是帧组GOP的基础帧(第一帧),在一组中只有一个I帧; 7.I帧不需要考虑运动矢量;
8.I帧所占数据的信息量比较大。
P帧:前向预测编码帧。
P帧的预测与重构:P帧是以I帧为参考帧,在I帧中找出P帧“某点”的预测值和运动矢量,取预测差值和运动矢量一起传送。在接收端根据运动矢量从I帧中找出P帧“某点”的预测值并与差值相加以得到P帧“某点”样值,从而可得到完整的P帧。 P帧特点:
1.P帧是I帧后面相隔1~2帧的编码帧;
2.P帧采用运动补偿的方法传送它与前面的I或P帧的差值及运动矢量(预测误差); 3.解码时必须将I帧中的预测值与预测误差求和后才能重构完整的P帧图像; 4.P帧属于前向预测的帧间编码。它只参考前面最靠近它的I帧或P帧; 5.P帧可以是其后面P帧的参考帧,也可以是其前后的B帧的参考帧; 6.由于P帧是参考帧,它可能造成解码错误的扩散; 7.由于是差值传送,P帧的压缩比较高。
B帧:双向预测内插编码帧。 B帧的预测与重构
B帧以前面的I或P帧和后面的P帧为参考帧,“找出”B帧“某点”的预测值和两个运动矢量,并取预测差值和运动矢量传送。接收端根据运动矢量在两个参考帧中“找出(算出)”预测值并与差值求和,得到B帧“某点”样值,从而可得到完整的B帧。 B帧特点
1.B帧是由前面的I或P帧和后面的P帧来进行预测的;
2.B帧传送的是它与前面的I或P帧和后面的P帧之间的预测误差及运动矢量; 3.B帧是双向预测编码帧;
4.B帧压缩比最高,因为它只反映丙参考帧间运动主体的变化情况,预测比较准确; 5.B帧不是参考帧,不会造成解码错误的扩散。
注:I、B、P各帧是根据压缩算法的需要,是人为定义的,它们都是实实在在的物理帧,至于图像中的哪一帧是I帧,是随机的,一但确定了I帧,以后的各帧就严格按规定顺序排列。 双向预测优点:
与JPEG相比,在相同质量前提下,其压缩比要大多了,有利于降低数据率,节省存储空间。 缺点是只有 I 帧才是关键帧,别的P, B 帧不能独立存在,所以MPEG不适合编辑。
41. 请对H.261、H.263作比较说明。H.261的图象格式是怎样的?
①H.263标准在低码率下能够提供比H.261更好的图像效果,两者的区别有:(1)H.263的运动补偿使用半象素精度,而H.261则用全象素精度和循环滤波;(2)数据流层次结构的某些部分在H.263中是可选的,使得编解码可以配置成更低的数据率或更好的纠错能力;(3)H.263包含四个可协商的选项以改善性能;(4)H.263采用无限制的运动向量以及基于语法的算术编码;(5)采用事先预测和与MPEG中的P-B帧一样的帧预测方法;(6)H.263支持5种分辨率,即除了支持H.261中所支持的QCIF和CIF外,还支持SQCIF、4CIF和16CIF,SQCIF相当于QCIF一半的分辨率,而4CIF和16CIF分别为CIF的4倍和16倍。
ISO/IEC/ITU-T
图像压缩格式
其它
JPEG · JPEG 2000 · lossless JPEG · JBIG · JBIG2 BMP · GIF · ILBM · PCX · PNG · TGA · TIFF · HD Photo
②1.H.261
H.261又称为P*64,其中P为64kb/s的取值范围,是1到30的可变参数,它最初是针对在ISDN上实现电信会议应用特别是面对面的可视电话和视频会议而设计的。实际的编码算法类似于MPEG算法,但不能与后者兼容。H.261在实时编码时比MPEG所占用的CPU运算量少得多,此算法为了优化带宽占用量,引进了在图像质量与运动幅度之间的平衡折中机制,也就是说,剧烈运动的图像比相对静止的图像质量要差。因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编码。 2.H.263
H.263是国际电联ITU-T的一个标准草案,是为低码流通信而设计的。但实际上这个标准可用在很宽的码流范围,而非只用于低码流应用,它在许多应用中可以认为被用于取代H.261。H.263的编码算法与H.261一样,但做了一些改善和改变,以提高性能和纠错能力。.263标准在低码率下能够提供比H.261更好的图像效果,两者的区别有:(1)H.263的运动补偿使用半象素精度,而H.261则用全象素精度和循环滤波;(2)数据流层次结构的某些部分在H.263中是可选的,使得编解码可以配置成更低的数据率或更好的纠错能力;(3)H.263包含四个可协商的选项以改善性能;(4)H.263采用无限制的运动向量以及基于语法的算术编码;(5)采用事先预测和与MPEG中的P-B帧一样的帧预测方法;(6)H.263支持5种分辨率,即除了支持H.261中所支持的QCIF和CIF外,还支持SQCIF、4CIF和16CIF,SQCIF相当于QCIF一半的分辨率,而4CIF和16CIF分别为CIF的4倍和16倍。
H.261支持QCIF和CIF图像格式。
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库中国科大“多媒体技术”课程复习题整理 - 图文(3)在线全文阅读。
相关推荐: