当前位置:首页 > 经典书库 > 工程师手册

视频信号编码

书籍:工程师手册

出处:按学科分类—工业技术 企业管理出版社《工程师手册》第955页(4335字)

在电视、可视电话、图文传真等图象系统中,为了有效地使用通信干线信道,以较快的速度传输图象,已研制出不少图象编码系统,这些系统能够以较少的代码比特(bit)数,以令人满意的质量复原图象。电视图象编码技术有模拟图象编码和数字图象编码,本文只讨论数字图象编码技术。

1.彩色电视信号

根据三基色原理,用三幅红、绿、蓝基色图象可以合成一幅全彩色图象。所以用三基色R(红)、G(绿)、B(蓝)信号(又称三刺激值)构成彩色电视信号。对于黑白电视画面经过采样量化后,每象素被量化为8bit,可表示256级灰度(亮度)级。对于彩色图形每象素4比特或8比特足够了。彩色图象的标准有8比特、9比特、16比特或24比特,还有32比特,CD-I使用的R、G、B组成为5∶5∶5或8∶8∶8。然而人的视觉系统对彩色色度的感觉和亮度的敏感性是不同的,因此产生了不同的彩色空间表示,H、S、I彩色空间比R、G、B彩色空间更符合人的视觉特性,其中H(Hue)为色调,S(Saturation)为饱和度,I(Intensity)表示光的强度或亮度。不同的电视制式采用不同的彩色空间表示,PAL(西德)制采用了Y、U、V空间,CD-I和英特尔的DVI也采用了Y、U、V空间,NTST(美国)制采用Y、I、Q彩色空间。我国实行的彩色电视PAL-D制式,是把R、G、B三刺激值信号转换成Y、U、V信号(Y是亮度信号,U、V是色差信号),其转换关系如式(1)所示:

Y=0.3R+0.59G+0.11B

U=B+Y (1)

V=R-Y

接收端收到Y、U、V信号,经逆转换得到R、G、B三基色信号加到彩色显示器上,其逆转换公式如式(2)所示:

R=Y+V

G=Y-0.19U-0.51V (2)

B=Y+U

我们以下讨论的彩色视频信号的数据压缩可以基于R、G、B信号,或Y、U、V信号,也可以是H、S、I信号,根据CCIR的601号建议规定色度为子采样,提出了双倍亮度采样的4∶2∶2方案。DVI的9位压缩视频格式在每个分量上使用了4∶1的子采样,使得每产生8位的亮度值只产生1位的色度值。

2.彩色视频信号的编码与解码

彩色视频信号编码与解码原理框图如图6.2.2-1所示。

图6.2.2-1 彩色信号编码解码框图

原始彩色图象的R、G、B信号,经过坐标空间转换,生成Y、U、V信号。再经A/D变换(抽样量化)得到数字信号。对每一个象素的Y、U、V分别赋予一组比特数。为了防止假轮廓出现,象素的亮度信号Y的量化分层数在50级以上,一般取256级,相当于每象素8bit,若色信号U、V分别也以8bit表示,则每象素需要24bit。

直接对A/D变换后的数字信号进行编码是最基本的编码方法,称脉冲编码调制(PCM)。PCM编码方法可分固定和自适应两种情况,这种编码方法对每个采样点分配以固定长度的码字。假如我们对A/D变换后的数字信号再作一次映射变换,可以减少原始数据的相关性和数据的冗余度,便于进行压缩数据。例如,人造地球卫星向地面发送数据时常用的差分映射编码,就是先计算空域相邻象素的灰度差值信号“e”进行量化编码所需的比特(bit)数,必然小于直接对原图象逐点进行量化编码所需的比特数。由于采用不同的映射方法,可得到不同的编码方法,如预测编码,变换编码等。映射变换和编码器一般都是可逆的,无信息损失,而量化器是致使图象失真的根源,因为量化是以图象的失真度为代价换取比特数的下降,以达到数据压缩的目的,所以比特数下降的限度要与图象质量保真度折衷考虑。为了传输的需要还需做信道编码,在信道编码中为了增强抗干扰能力,要适当增加一些比特数。解码过程是编码的逆过程。

3.电视信号的帧内预测编码

采用差分脉冲码调制DPCM(Differential Pulse Code Modulation)编码方法,或者采用自适应差分脉冲码调制(ADPCM)编码方法,对电视的帧内信号进行编码,可有效地减少画面的空域冗余信息。同时由于DPCM具有算法简单且易于硬件实现的特点,这一特点正好符合电视图象编码处理速度快、便于硬件实现的要求,所以DPCM编码方法在电视图象的压缩编码方法中得到较多的研究和应用。

在DPCM编码方法中,量化、编码的信号不是图象抽样值本身(与PCM编码不同),也不是相邻象素的差值信号(与差分映射编码不同),而是对该象素的预测值与实际值之差值信号进行量化、编码。一个常用的三阶线性预测系统框图如图6.2.2-2所示。

图6.2.2-2 三阶DPCM系统框图

图中输入时Ymn表示电视画面上坐标为(m,n)象素点的亮度值,该点的预测值以符号Ymn表示,其计算表达式为

Ymn=a1Ymn-1+a2Ym1n1+a3Ym1n (3)

象素点(m,n)的预测邻域如图6.2.2-3所示。其中a1,a2和a3是满足误差emn=Ymn-Ymn最小的待定参数。当计算整幅图象空间各坐标的预测值,均使用相同的a1,a2和a3参数时,称线性预测。

图6.2.2-3 预测区域

发送端虚线框中是一个三阶线性预测器的框图,接收端的预测器模块与发送端完全相同。不加量化器的DPCM系统是一个无失真的信息保持编码系统。一般为了进一步压缩数据,对于误差信号总要进行量化处理。当引入量化器后就会有一定的信息损失,所以DPCM编码方法是属于有失真编码方法。量化误差致使接收端的输出信号与发送端的输入信号产生差别(即使忽略信息误差)。最佳量化器的设计,是DPCM编码方法的重要问题之一。例如合理选择量化器的量化步长,使量化误差不超过人眼的视觉可见阈值,能使接收端的图象质量满足主观保真度的要求。但是实际上DPCM编码系统中,当整幅图象采用同一个量化器时,不可避免地会出现斜率过载、颗粒噪声、边缘忙乱及假轮廓等导致图象质量下降的问题。针对这种情况,人们提出了自适应预测编码方法即ADPCM编码方法。在这种编码方法中,量化器的步长及预测器的参数均能够根据图象的局部特征,作自适应调整,所以ADPCM编码方法比DPCM编码方法有较高的压缩比和更加满意的图象质量。

4.电视信号的帧间编码

为了保证电视画面的视觉质量,没有跳动和闪烁现象,我国的电视制式每秒传送25帧画面(美国30帧/秒)。所以视频图象画面是由时间轴方向一系列帧序列画面组成,帧间的时间间隔为1/25秒(1/30秒)。相对于某一瞬时的某一帧内画面是静止图象(凝固图象)。例如我们作一个帧间画面对应位置象素的亮度信号或色信号的差值统计,如某活动图象第N帧,坐标位置为(m,n)象素的亮度信号值为(Ymn)N,在前一帧同一坐标位置(m,n)象素的亮度信号值为(Ymn)N-1,则该象素点帧间亮度差值d(m,n)=(Ymn)N-(Ymn)N-1。统计整个画面的计算结果发现,差值一般都很小。也就是说在1/25秒(或1/30秒)帧间间隔内,景物运动部分在画面上的位移量,或者整幅景物切换的概率极小。大多数象素点的亮度及色信号帧间变化不大。如彩色广播电视节目一帧时间间隔内,只有百分之十以下的象素有亮度差值超过百分之二的变化;而色度信号只有千分之十以下的象素有变化。根据电视图象帧间差值的统计特性,我们可以通过减少时域的冗余信息的方法,运用帧间压缩技术,可以得到进一步压缩电视视频信号数据的途径。随着大规模集成电路生产的蓬勃发展,为帧间预测所必需的帧存储器提供了硬件支持,从而使帧间编码得以更快地发展。

因为人的视觉特性,眼睛对静止图象的空间分辨率高,所以传送帧内画面时空间分辨率要求足够高,但是不必每帧都传送(降低时间轴的分辨率),比如采用隔帧传送的方法。靠帧存储把未传送的帧补充进来;对于画面中运动部分,根据人眼的视觉灵敏度在图象切换时降低的特点,可以降低运动部分的空间采样频率,即降低空间分辨率传送。这种方法称为空间分辨率与时间轴分辨率交换方法。但是要注意被运动物体遮蔽的背景部分,当运动部分移动后,露出的背景空间分辨率以对静止画面的分辨率一样处理。利用上述方法,可以减少传送象素的点数,从而达到数据压缩的目的。

另外,条件象素补充的方法也是减少帧间传送象素点数的一种有效方法。这种方法的思想是把帧间相对应的象素的亮度(或色度)差值超过阈值(事先规定)的象素存到缓冲器中,准备传送,而且只传送帧间差值,这样一帧电视图象只传送很少一部分象素。除此之外还有条件次抽样法,这种方法是条件象素补充法和内插法的结合。例如对水平扫描行的象素,用降低一倍的频率采样,对未采样的点,用其前后点的平均值作为估计值,如果该象素点的实际值与估计值之间的差值低于阈值,则不传送;如果这个差值超过阈值,则补充传送。

对于静止场面为主的可视电话图象,补充传送的象素只占总象素的百分之六,编码率可降到0.65bit/象素。对于电视视频画面,补充传送的数据要增多。

上一篇:主要窗口操作 下一篇:工程师手册目录
分享到: