概述
出处:按学科分类—工业技术 企业管理出版社《工程师手册》第953页(1702字)
多媒体计算机系统是90年代计算机发展的一个方向,应用多媒体技术是90年代计算机系统的时代特征,专家们预测,多媒体技术的蓬勃发展将会导致计算机系统的又一次革命。
多媒体计算机系统技术是面向三维图形、立体声和彩色全屏幕运动画面的处理技术。为了达到令人满意的视频画面质量和听觉效果,必须对视频信号和音频信号做到实时处理。实现实时处理技术的首要问题是如何解决计算机系统对庞大的视频和音频信号数据的吞吐、传输和存储的问题。
数字化了的视频和音频信号的数据量之大量非常惊人的。一幅具有中等分辨率(640×480)彩色(24bit/象素)数字视频图象的数据量约7.37Mbit/帧,一个100MB(Byte,字节)的硬盘只能存放约100帧静止图象画面。帧速率25帧/秒,则视频信号的传送速率大约为184M bit/s。对于音频信号,以用于音乐用激光光盘CD-DA声音数据为例,采用PCM采样,采样频率44.1kHZ,每个采样点量化为16bit(比特),二通道立体声,100MB的硬盘仅能存储10分钟的录音。由此可见,高效实时地压缩视频和音频等信号的数据量是多媒体系统不可回避的关键技术问题,否则难以推广应用。
从现在已有的六个集团,几十家公司所开发研制的多媒体系统产品来看,荷兰菲利浦公司等推出CD-I紧凑盘并互型(Compact Disc Interactive)系统采用一个5英寸640MB只读光盘(CDPOM),将声、文、图、动画、静止画面和全运动屏幕等大量信息以压缩形式存储在光盘上,其压缩比约10:1。由英特尔公司研制推出得到IBM公司支持的数字视频交互DVI(Digital Video Interactive)多媒体系统产品,是在CD-POM只读光盘基础上开发的一套全屏幕、全运动视频系统。它把立体声、运动图象和三维图形融为一体。DVI第一代产品的核心部件是由三块专用的DVI插件板构成。DVI的视频压缩技术是由Intel公司独家生产的i750专用芯片组完成的,这套芯片组的特点是利用微程序控制,通过载入微代码,可以执行多种图象压缩算法和图象象素处理及视频显示等特殊功能。目前该芯片组的压缩比可达100:1至160:1的水平,随着芯片版本不断地修改和刷新,可以提供改进的图象压缩算法,从而提高图象的画面质量。
数据压缩之所以可实现是因为原始信源数据(视频图象或音频信号)存在着很大的冗余度,比如电视图象帧内邻近象素之间空域相关性及前后帧之间的时域相关性都很大,信源有冗余。其次是因为在多媒体系统的应用领域中,人是主要接收者,眼睛是图象信息的接收端,耳朵是信息的接收端。这样就有可能利用人的视觉对于边缘急剧变化不敏感(视觉掩盖效应)和眼睛对图象的亮度信息敏感,对颜色分辨力弱的特点以及听觉的生理特性实现高压缩比,而使由压缩数据恢复的图象及声音信号仍有满意的主观质量。数据压缩技术或称编码技术,从1948年Oliver提出PCM编码理论开始,迄今已有40余年的历史。随着数字通信技术和计算机科学的发展和应用的要求,编码技术日臻成熟,应用范围愈加广泛。基于不同的应用场合产生了不同思路和技术途径的编码方法。图6.2.1-1示出图象编码算法的分类。
图6.2.1-1 图象编码算法分类
图6.2.1-2示出以有失真编码和无失真编码分类方法表示的多媒体系统中常选用的一些压缩编码算法。
图6.2.1-2 多媒体系统选择的压缩方法
本文将着重介绍图象压缩编码的基本理论、方法和近年来一些新的编码技术。至于语音编码技术,由于它与图象编码技术没有什么本质的区别,本文不再单独赘述。