在线工博会

图像信息压缩技术的发展和研究
河南科技大学 李秀敏 万里青
为节省流量,手机版未显示文章中的图片,请点击此处浏览网页版
摘 要:主要探讨了图像信息压缩技术的基本途径和研究动向,以及图像编码国际标准化动向,并对未来图像编码的前景进行了展望,提出了利用图像几何结构特点用于图像编码以及软件编码、多媒体融合编码的新观点。
关键词:图像压缩;信源编码;数字信号处理器;软件编码;多媒体融合
Development and Research of Image Information Compression Techn iques
LI Xiumin1, WAN Liqing2
(1.College of Electronic Information Engineering,Henan Univer sity of Science & Technology,Luoyang,471003,China;
2.Luoyang Institute of Electrooptical Equipment,China Aviation Industry Corporation,
Luoyang,471009,China)
Abstract:This paper mainly introduces the basic paths and th e research direction of image information compression techniques and discusses t he international trend of standardization of image coding. The prospect of imag e coding in the future also have been proposed here. The new ideas in this pape r is proposed, geometrical structure features are used for image coding,software coding and multimedia fusion coding
Keywords:image compression; speech source coding; digital si gnal processor; software coding; multimedia fusion
1图像信息压缩的基本途径
1.1图像的信息量与信息压缩
常言道“百闻不如一见”,即图像是人们最熟悉、最乐于接受的信息传输媒体。随着多媒体和互联网的发展,不仅要求大量存储和传输图像,而且往往要求在保证质量的前提下以较小的空间存储图像,以较少的比特率传输图像,未压缩数字化图像的信息量过于庞大,因此最好采用合适的方法对图像进行压缩,以便图像的存储和传输。
先简单说明用于实现信息压缩的图像编码器的构成。图1为图像压缩编码器的基本结构框图。摄像机等光电变换装置把信源图像变换成电信号之后,经A/D转换器变为数字信号,接着进入信源编码器进行信息压缩。信道编码器是以提高传输媒体或记录媒体的可靠性为目的的编码器。通常,信源编码与信息压缩的意思是相同的。

(图片)

信源编码器的任务是进行信息压缩。根据其原理,编码器由图2所示的3个单元构成。其中, “信息抽取”的任务是尽可能地去掉信号中的相关量,抽取出应予以量化的信息;“量化” 的任务是用有限个离散电平来近似表达已抽取出的信息;“代码分配”的任务是把各个离散电平(量化电平)变换成二值序列。

(图片)

1.2削减图像中的冗余成分
表1对图像信息压缩中将成为削减对象的各种图像冗余度进行了归纳分类。如表1所示,图像 中包含着各种各样的冗余度,如果把这些冗余度有效地去除,就能够减少编码信息量。

(图片)

1.3提高量化和代码分配的效率
为了用数字线路传输由上述方法压缩过冗余度的数据,就要把这些数据近似地表示成离散电平,这种处理就是量化(quantization)。进而,还要给各量化电平配上二进制代码,这种处理称为代码分配(code assignment)。量化是一种波形近似处理,伴随着这种近似处理必然产生误差,这种误差称为量化噪声(quantization noise)。量化噪声的大小直接关系到解码图像质量的好坏。代码分配所形成的二进制代码长度通常用平均码长来表征,他是一个按代码发生概率算出来的统计平均值,平均码长决定着传输速率的大小。一般来说,要减少量化噪声就要增多量化电平数,而量化电平数增多,传输速率也增高。量化和代码分配的任务是既要尽可能地减少量化噪声,又要降低传输速率。这种要求显然是矛盾的,不过,只要措施得当,是能获得良好效果的。其基本办法是:
(1)采用量化噪声小的量化方式。
(2)采用传输速率小的代码分配方式。
1.4利用视觉特性
人眼视觉有以下特性能被编码利用:
(1)失真知觉的频率特性不易觉察,随时间快速变化的失真和空间高频失真。
(2)与画面图案的关系在静止图像的情况下,易于发觉图像平坦部分的失真而不易发觉轮廓部分的失真。但在运动图像的情况下,轮廓部分的失真将成为一种边缘效应,反而更加显著。
(3)与图像动作的关系当图像动作达到一定速度,视线跟不上运动时,视觉对失真的敏感度变低。
(4)与场景切换的关系在画面切换的紧后边,即使分辨率下降较大,也不会感到有明显变化。
(5)与画面亮度的关系同等级的图像失真,画面越暗,失真感越明显。
(6)色度信号与亮度信号与亮度信号相比,色度信号的失真更不易被发觉。因而,间隔地抽掉一些色度信号样本点并不会影响重现图像的彩色质量。
2当前所能实现的图像信息压缩
2.1信息压缩方法分类
视频数据压缩方法根据不同的依据可产生不同的分类。按照压缩冗余信息的机理不同,目前 的图像压缩编码方法大致可以分成3类:
(1)着眼于图像信源的统计特征的压缩方式主要采用统计编码法、预测编码法、变换编码法、矢量量化编码法、神经网络编码法等。
(2)着眼于人眼视觉特性的压缩方式主要采用基于方向滤波的图像编码法和基于图像轮廓纹理的编码法。
(3)着眼于图像传递的景物(内容)特征的压缩方式主要采用基于模型的(分形)编码法[1]。
2.2图像信息压缩技术的标准化动向
2.2.1静止图像编码标准
1986年,CCITT设立了一个专门研讨静止图像编码方式的NIC(New Image Communication,新型图像通信)小组,与ISO共同成立了联合专家组JPEG(Joint Photographic Experts Grou p),进行静止图像编码方式标准化的研讨。他们定义了连续色调、多级灰度、静止图像的数字图像压缩编码方法,即JPEG算法。JPEG算法被确定为JPEG国际标准,他是国际上彩色、灰度、静止图像的第一个国际标准。有关JPEG算法的具体实现请参阅文献[2]。
2.2.2运动图像编码标准
MPEG是动态图像专家组(Moving Pictures Experts Group)的英文缩写,负责数字视频、音频和其他媒体的压缩、解压缩,处理和表示等国际技术标准的制定工作,成立于1988年。现今所泛指的MPEG-X版本,是指一组由国际电信联盟(ITU)和国际标准化组织(ISO)制定并发布的音、视频数据的压缩标准[3]。MPEG的具体标准系列请参阅文献[4]。
2.2.3其他相关技术的标准化问题
为了能使会议电视和可视电话作为系统来相互连接,语音编码就必须标准化。关于语音编码标准化问题,宽带语音的48/56/64 kb/s编码标准已完成,16 kb/s编码标准尚在研讨之中;为了实现语音、图像、数据、系统控制等信号的复用,其复用帧的结构就必须标准化;为了能使各种各样的终端设备能相互识别对方所具有的功能,以便按最大的共同功能来通信,通信步骤就必须标准化。此外,会议电视和可视电话的终端机器也要标准化等。
3新的图像编码方式及对未来图像信息压缩的展望
3.1图像类型与新的图像编码思路
一般情况下,图像编码方式都可看作输入信号先在信号变换部进行抽取信息的处理,然后再由代码分配部对已抽取出的信息配上代码并送往传输线路。以往的波形编码主要利用象素间的相关性,按照图像信号的统计模型来设计编码器。例如,预测编码是在象素空间域中利用象素间的相关性,变换编码是在变换域中利用象素间的相关性。与此不同的另一类编码方式的研究也开始活跃起来了。图像信号是利用摄像机把三维的实际景物拍摄下来而得到的二维信号,而人的视觉在长期观看实际三维景物过程中也形成了能够从二维图像中感受到景物几何结构特点的能力。因而可以利用图像几何结构特点对图像进行编码。表2给出了图像模型与编码方式。

(图片)

3.2标准化问题
从20世纪40年代末开始,图像编码技术已经走过了半个多世纪的发展历程。采用高效编码来减少其信息量是图像数字化时代的必然趋势。这几年来,图像编码的国际标准化步伐很快,今后,不但要制定各单独媒体的标准,而且要解决不同媒体间的相互联接问题[5]。标准化是图像编码普及的必经之路,最低限度的标准化应该具有可以相互交换信息的机制。思路之一就是“软件编码”(software coding)。将来,如果编码器和解码器都用通用数字信号处理器(DSP)来实现,那么所有的编码算法就都可以通过改变软件来实现。这样,只要在编码前从发送端把解码程序下载到接收端,即使不采用标准方式,也能够实现信息自由交换。在这样的系统中,只要规定一个关于DSP基本功能规格和下载所需的最低限度协议就可以了。发送端也可以根据需要,每次选择一个最适合于待传送图像的编码算法。当更高效的算法开发出来时,还可以直接组装进编码器并引入整个系统中去。软件编码的实用化需要由廉价的图像编解码—高速DSP提供必要环境,他的使用在目前可能还会受到限制,标准化的时候,要为这种可能性留有余地。
3.3对未来理想图像编码的眺望
对于未来理想图像编码,笔者提出多媒体融合编码的观点。将来,图像、语音、文件媒体都不单独存在,而是成为相互关联的多媒体[6]。那时,最理想的办法就是如图3所示的图像、语音、文字及文件等信息全都按照概念和含义的级别变换成统一代码来传输,从而使多媒体各接收者分别通过把统一代码变换成最适于自己需要的信息表达媒体(图像、声音、语音等)来按需要接收必要信息。这时,既可把统一代码变换成与原发送信号相同的媒体形式,也可根据需要变换成别的媒体形式。例如,通过语音给盲人提供听觉信息,用图像给聋哑人提供视觉信息,便有可能使二者相互自由通信。

(图片)

4结语
图像编码研究的发展与他不断吸取其他领域研究成果密不可分,特别是信息论方面的研究成果。数字信息技术和通信技术的发展非常显著,在此背景下,图像信息压缩技术取得了飞跃性的进步,相关国际标准化工作的进展也很快,而图像的高效编码,仍将是最尖端的技术[7]。
参考文献
[1]刘毓敏.数字视音频技术应用[M].北京:机械工业出版社,2003.
[2]丁贵广,计文平,郭宝龙.Visual C++6.0数字图像编码[M].北京:机械工业出版社,2004.
[3]张益贞,刘滔.Visual C++.实现MPEG/JPEG编解码技术[M].北京:人民邮电出版社,2002.
[4]雷国平,周琨,吉吟东.MPEG标准发展和研究综述[J].计算机工程,2003,2 9(12):12.
[5]Sethuraman (Panch) Panchanathan.Architectural Approaches for Mult imedia Processing[J].Computer Science,1999,1557:196.
[6]孙建红,徐定杰,文富忠.MPEG的发展动态及其未来预测[J].电子技术应用,2002,28(9):68.
[7]Boonlock Yeo.On Fast Microscopic Browsing of MPEGC ompressed Video[J].Multimedia Systems,1999,7(4):269-281. 8/18/2005


电脑版 客户端 关于我们
佳工机电网 - 机电行业首选网站