中国科大“多媒体技术”课程复习题整理 - 图文(4)

来源：网络收集时间：2020-06-21 下载这篇文档手机版

说明：文章内容仅供预览，部分内容可能不全，需要完整文档或者需要复制内容，请下载word后使用。下载word有问题请添加微信号:或QQ：处理（尽可能给您提供完整文档），感谢您的支持与谅解。

③H.261又称为P*64，其中P为64kb/s的取值范围，是1到30的可变参数，它最初是针对在ISDN上实现电信会议应用特别是面对面的可视电话和视频会议而设计的。实际的编码算法类似于MPEG算法，但不能与后者兼容。H.261在实时编码时比MPEG所占用的CPU运算量少得多，此算法为了优化带宽占用量，引进了在图像质量与运动幅度之间的平衡折中机制，也就是说，剧烈运动的图像比相对静止的图像质量要差。因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编码。

H.263是国际电联ITU-T的一个标准草案，是为低码流通信而设计的。但实际上这个标准可用在很宽的码流范围，而非只用于低码流应用，它在许多应用中可以认为被用于取代H.261。H.263的编码算法与H.261一样，但做了一些改善和改变，以提高性能和纠错能力。H.263标准在低码率下能够提供比H.261更好的图像效果，两者的区别有：(1)H.263的运动补偿使用半象素精度，而H.261则用全象素精度和循环滤波；(2)数据流层次结构的某些部分在H.263中是可选的，使得编解码可以配置成更低的数据率或更好的纠错能力；(3)H.263包含四个可协商的选项以改善性能；(4)H.263采用无限制的运动向量以及基于语法的算术编码；(5)采用事先预测和与MPEG中的P-B帧一样的帧预测方法；(6)H.263支持5种分辨率，即除了支持H.261中所支持的QCIF和CIF外，还支持SQCIF、4CIF和16CIF，SQCIF相当于QCIF一半的分辨率，而4CIF和16CIF分别为CIF的4倍和16倍。

H.261支持的图像格式包括QCIF,CIF。

H.261 是ITU-T 为在综合业务数字网(ISDN)上开展双向声像业务(可视电话、视频会议)而制定的，速率为64kb/s的整数倍。H.261 只对CIF 和QCIF 两种图像格式进行处理，每帧图像分成图像层、宏块组(GOB)层、宏块(MB)层、块(Block)层来处理。H.261 是最早的运动图像压缩标准，它详细制定了视频编码的各个部分，包括运动补偿的帧间预测、DCT 变换、量化、熵编码，以及与固定速率的信道相适配的速率控制等部分。

H.261 是最早的运动图像压缩标准，它详细制定了视频编码的各个部分，包括运动补偿的帧间预测、DCT 变换、量化、熵编码，以及与固定速率的信道相适配的速率控制等部分。

H.263 与H.261 相比，增加了若干选项，提供了更灵活的编码方式，压缩效率大大提高，更适应网络传输。码率可以更低，支持的原始图像格式更多。H263编码速度快，适用于需要双向编码并传输的场合和网络条件不是很好的场合。

H263的运动补偿使用半像素精度，而H261则用全像素精度和循环滤波；数据流层次结构的某些部分在h263中是可选的，使得编码可以配置成更低的数据率或更好的纠错能力；H263包含四个可协商的选项以改善性能；H263采用无限制的运动向量以及基于语法的算术编码；采用事先预测和雨MPEG中的P-B帧一样的帧预测方法；h263支持五种分辨率，及除了支持H261中所支持的QCIF和CIF外，还支持SQCIF、4CIF和16CIF，SQCIF相当于QCIF一半的分辨率，而4CIF和16CIF分别为CIF的4倍和16倍。

42. G.711标准定义的输出数据率是多少？T1的数据率是多少？E1的数据率是多少？

①G.711：64kbps； T1：1.544Mbps；E1：2.048Mbps

②G.711的输出数据率为64kbps，T1的数据率：1.544Mbps。E1的数据率：2.048Mbps。

③G.711数字化模拟语音信号，产生每秒64k位(Kbps)的输出。北美的24路脉码调制PCM简称T1，速率是1.544Mbit/s 欧洲的30路脉码调制PCM简称E1，速率是2.048Mbit/s

43. 简述G.711、G.721、G.722语音编码标准，并进行比较说明。(P47)

①G.711：对于采样频率为8 kHz，样本精度为13位、14位或者16位的输入信号，使用μ律压扩编码或者使用A律压扩编码，经过PCM编码器之后每个样本的精度为8位，输出的数据率为64 kb/s。这个数据就是CCITT推荐的G.711标准—话音频率脉冲编码调制。

G.721：ADPCM是利用样本与样本之间的高度相关性和量化阶自适应来压缩数据的一种波形编码技术，CCITT为此制定了G.721推荐标准，这个标准叫做32 kb/s ADPCM。G.721 的输入信号是G.711 PCM代码，它的数据率为64 kb/s。而G.721 ADPCM的输出是用4位表示的差分信号，它的采样率仍然是8 kHz，它的数据率为32 kb/s，这样就获得了2∶1的数据压缩。

G.722：G.722是CCITT推荐的音频信号编码译码标准。G.722标准的数据率为64 kb/s，采样频率由8 kHz提高到16 kHz，是G.711 PCM采样率的2倍，因而要被编码的信号频率由原来的3.4 kHz扩展到7 kHz。这就使音频信号的质量有很大改善，由数字电话的话音质量提高到调幅(AM)无线电广播的质量。 ②G.7xx

G.7xx 是一组 ITU-T 标准，用于音频压缩和解压缩。它主要用于电话方面。在电话技术中，有两个主要的算法标准，分别定义在 mu-law 算法（美国使用）和 a-law 算法（欧洲及世界其他国家使用）中。两者都是基于对数关系的，但对于计算机的处理来说，后者更为简单。

G.711 ―― 64 kbps 信道上的语音频率脉冲编码调制（PCM） G.721 ―― 32 kbit/s 自适应差分脉冲编码调制（ADPCM）

G.722 ―― 64 kbit/s 下的 7 kHz 音频编码

? ③G.711 ― 64 kbps 信道上的语音频率脉冲编码调制（PCM）

G.711是在1972年公布的用于音频压缩扩展的 ITU-T 标准，其主要用在电话中。G.711代表了用于语音信号频率的8比特压缩脉冲编码解调(PCM)信号瞬时值，取样率为每秒8000个样本。G.711编码器会产生 64 kbit/s 的比特流。该标准中定义的两个主要的算法为：mu-law（在北美和日本使用）和 a-law（在欧洲和其他国家使用）。

? G.721是一种 32 kbps 自适应差分脉冲编码调制语音压缩算法。取样频率为 8 KHz，它可以

产生高质量语音。由于传输误差率高于 10.4，所以一般认为其传输质量要好于 G.711。G.721是第一个 ADPCM 标准，后来有了传输速率为 40, 32, 24 和 16 kbps 的G.726 和 G.727 算法。

? G.722 是支持比特率为64, 56和48 kbps 多频率语音编码算法。在G.722中，语音信号的取

样率为每秒16000个样本。与3.6 kHz的的频率语音编码相比较，G.722可以处理频率达7 kHz 音频信号宽带。G.722 编码器是基于子带自适应差分脉冲编码（SB-ADPCM）原理的。信号被分为两个子带，并且采用 ADPCM 技术对两个子带的样本进行编码。 ? 比较：

? G.722标准的数据率为64 kb/s，采样频率由8 kHz提高到16 kHz，是G.711 PCM采样率的2

倍，因而要被编码的信号频率由原来的3.4 kHz扩展到7 kHz。这就使音频信号的质量有很大改善，由数字电话的话音质量提高到调幅(AM)无线电广播的质量

G.711 压缩算法 PCM 采样率 8KHZ 样本精度 8位数据率 64Kbps G.721 G.722 ADPCM SB-ADPCM 8KHZ 16KHZ 4位 4位 32Kbps 64Kbps

44. 话音编译码器通常可以分成哪三种类型，并举例简述其基本原理。(P46)

波形编译码器: 利用抽样和量化过程来表示音频信号的波形，不利用生成话音信号的知识产生而是产生一种重构信号，重构信号的波形和原始话音波形尽可能一致.它主要根据人耳的听觉特性进行量化，以达到压缩数据的目的。例如脉冲编码调制（PCM）音源编译码器:通过话音波形的信号中提取生成话音的参数，使用这些参数通过话音生成模型重构出话音。把音频信号表示成某种模型的输出，利用特征提取的方法抽取必要的模型参数和激励信号的信息并编码，最后输出端合成原始信号。目的是重建音频，保持原音频的特性。例如线性预测编码（LPC）

混合编译码器: 想法是企图填补波形编译码和音源编译码之间的间隔。介于上述两种编码方法之间，集中了这两种方法的优点，可以在较低码率上得到较高的音质，例如，时域合成-分析(analysis-by-synthesis，AbS)编译码器

45. 瞬时噪声定形（Temporal Noise Shaping，TNS）要解决的问题是什么？该技术采用什么方法解决问题的。

TNS模块是用来控制量化噪声的瞬时形状的一种方法，解决掩蔽阈值和量化噪声的错误匹配问题。这种技术的基本想法是，在时域中的音调声信号在频域中有一个瞬时尖峰，TNS使用这种双重性来扩展已知的预测编码技术，把量化噪声置于实际的信号之下以避免错误匹配。正常情况下，频域上的系数通过PCM进行编码；并随时对频率系数进行预测。当预测器发现频域系数变化超过一定阈值的时候，对频域系数采用DPCM编码。通过对频域系数编码的调整降低频域上量化给时域带来的噪声

46. 解释与声音有关的名词：听阈，痛阈，频域掩蔽，时域掩蔽。

听阈：当声音弱到人的耳朵刚刚可以听见时，我们称此时的声音强度为“听阈”。痛阈：声音强到使人耳感到疼痛时，这个阈值称为“痛阈”。

频域掩蔽：同时发出的频率接近的两个纯音，声强低的纯音会被声强高的纯音淹没

时域掩蔽：在时间上相邻的声音之间也有掩蔽现象，称为时域掩蔽。产生的主要原因是人的大脑处理信息需要花费一定的时间。

47. 简述MPEG-2 AAC的特性。

②利用掩蔽特性减少数据量，并把量化噪声分散到各个子带中，用全局信号把噪声掩蔽掉。采样频率可从8 kHz到96 kHz，可支持声道数目极多

1)提升的压缩率：可以以更小的文件大小获得更高的音质； 2)支持多声道：可提供最多48个全音域声道； 3)更高的解析度：最高支持96KHz的采样频率； 4)提升的解码效率：解码播放所占的资源更少；

48. MPEG-1的层1、层2、层3编码分别使用了听觉系统的什么特性？MPEG-1的层1、层2、层3编码器的声音输出速率范围分别是多少？

Layer 1: 384 kbit/s，压缩率 4:1 Layer 2: 192 - 256 kbit/s，压缩率 8:1-6:1 Layer 3: 112 - 128 kbit/s，压缩率 12:1-10:1

③MPEG-1音频分三层，分别为MPEG-1 Layer1，MPEG-Layer2以及MPEG-Layer3，并且高层兼容低层。其中第三层协议被称为MPEG-1 Layer 3，简称MP3。MP3目前已经成为广泛流传的的音频压缩技术。

MPEG-1 Layer1采用每声道192kbit/s，每帧384个样本，32个等宽子带，固定分割数据块。子带编码用DCT(离散余弦变换)和(快速傅立叶变换)计算子带信号量化bit数。采用基于频域掩蔽效应的心理声学模型，使量化噪声低于掩蔽值。量化采用带死区的线性量化器，主要用于数字盒式磁带(DCC)。

MPEG-1 Layer2采用每声道128kbit/s，每帧1152个样本，32个子带，属不同分帧方式。采用共同频域和时域掩蔽效应的心理声学模型，并对高、中，低频段的比特分配进行限制，并对比特分配、比例因子，取样进行附加编码。Layer2 广泛用于数字电视，CD-ROM，CD-I和VCD等。 MPEG-1 Layer3采用每声道64kbit/s，用混合滤波器组提高频率分辨率，按信号分辨率分成6X32或18X32个子带，克服平均32个子带的Layer1，Layer2在中低频段分辨率偏低的缺点。采用心理声学模型2，增设不均匀量化器，量化值进行熵编码。主要用于ISDN(综合业务数字网)音频编码。

49. 常见的图象压缩标准有哪些？它们分别采用哪些压缩方法？（P51）

1．JPEG:

1. 基于无损预测编码算法 2. 基于DCT有损编码算法 3. 基于DCT的增强系统 4. 基于DCT的分层操作方式

2．JPEG2000:以离散小波变换算法为主的多解析编码方式。

50. 基于DCT变换的JPEG 压缩编码算法的主要计算步骤有哪些？给出编码框图，并举例说明JPEG 编码的全过程。

①基于DCT的编码器和解码器方框图如图所示。

8x8方块正向DCT熵编码器量化器压缩图象数据源图象数据量化表(a) 编码器基于DCT的解码器熵码表压缩图象数据熵解码器去量化器反向DCT重建图象数据熵码表量化表(b) 解码器

JPEG编码实例如下：

从真实亮度图象中取一个子图象，它是 8×8 象素方块，各象素用 8位量化，得图3.17所示数据，或称原图象取样数据。由图可见各数据相差不大，说明低空间频率占优势。另外图中各数据值均较大，说明平均亮度较高，直流系数较大。为降低传输位率，现采用向下电平移位，即对各数据均减去均值128，得图3.18。

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读，免费范文网，提供经典小说教育文库中国科大“多媒体技术”课程复习题整理 - 图文(4)在线全文阅读。

中国科大“多媒体技术”课程复习题整理 - 图文(4).doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档

本文链接：https://www.77cn.com.cn/wenku/jiaoyu/1115299.html（转载请注明文章来源）

上一篇：管道及储罐强度设计
下一篇：2018届苏教版三角函数与解三角形测试题