“小波分析是近年来发展起来的一门新兴的数学分析理论,其应用范围包括数学领域本身的许多学科,利用小波变换的理论实现图像的压缩编码已经从九十年代初起得到了广泛与深入地研究,并逐渐成为图像压缩编码领域的一个重要分支。
”作者:张俊昌,谢家祥
引言
信息是现代社会的主要特征,而人们传递信息的重要媒介是图像。随着社会经济的发展,科学技术的不断进步,信息视觉化技术越来越受到人们的重视。数据量大是数字图像的一个显著特点,一幅具有中等分辨率(640 × 480)的彩色(24bit/象素)数字图像的数据量约为737Mbit。这给数字图像的传输带来很人的困难。因此,图像处理及数据压缩对现代化社会的发展起着不可忽视的作用。利用图像压缩编码技术,在原有图像损失一定精度(即有损图像压缩编码)或不损失任何精度(即无损图像压缩编码)的情况下,将原有图像用比原始数据量少得多的数据将其表示出来,以提高图像的存储效率和传输效率,既是当代信息高速公路、高清晰度电视(HDTV)、可视电话、图文传真等技术的关键,又在航空侦察遥感、资源勘探及生物医学工程等领域起着非常重要的作用。
小波变换压缩编码的现状及当前的研究存在的问题
小波分析是近年来发展起来的一门新兴的数学分析理论,其应用范围包括数学领域本身的许多学科,利用小波变换的理论实现图像的压缩编码已经从九十年代初起得到了广泛与深入地研究,并逐渐成为图像压缩编码领域的一个重要分支。小波变换的优越之处在于它在时域和频域同时具有良好的局部化性质,从而可以更加有效地刻划信号的特征。对于图像而言,如果从能量的角度来看,其大部分能量一般集中在低频部分,并且其频带较窄,而其余少部分能量则集中在高频部分,其所占频带较宽。对于高频部分的能量,其中的大部分又则是由图像中的边缘或细节产生的。因此,一种有效的变换编码技术应该具有这样的特性,即图像通过变换后,其能量应主要集中在少部分的低频系数上,大部分高频系数只占有少量能量,而占高频中的能量应该减小,这是图像变换编码的一个基本的要求。小波变换恰好提供了这样的特性,从而可以较好地适应图像的固有特性,对图像进行有效地分解、表征与编码。
尽管小波变换图像压缩编码算法具有结构简单、无需仟何圳练、支持多码率、压缩比较大、图像复原质量较理想等特点,但任不同程度上存在压缩与解压缩速度慢、图像复原质量不理想等问题,为了进一步改善此算法的工作效率,需要解决以下两个主要问题。首先是正交小波基的选择问题。正交小波基的选取对图像压缩效果有很火的影响。在实际应用中,由于可供选择的正交小波基很多,如何做出恰当的选择是一个难题。理论和实践表明,理想的止交小波基应该具有下列性质:
1、线性相位特件—能减少或消除重构图像在边缘处的失真;
2、紧支集特性—支集越短,小波变换的计算复杂度越低,便于快速实现;
3、消失矩特性—即,一般米说,k越大,小波变换后能量越集中出现任低频,而在其他子带中,会出现更多的0,便于提高压缩比。
根据当前研究得知,有紧支集的正交小波基除Haar系以外,其他都不具备线性相位特性。为了保持该特性,可放弃正交性而采用具有紧支集的双正交小波。其次是数据向量量化编码算法的优化问题在整个图像压缩过程中,对小波系数进行向量量化编码会直接影响图像的压缩效果。同时,由于应用层面的需要,目前,常用的数据向量量化编码算法如零树编码算法等运算时间长,运算量大等特点。使它不易于实时系统的实现,严重限制应用的范围。而且也有不同程度地存在运算复杂、重构复原图像效果不理想等问题。因此,亟需寻找优秀的向量量化算法。此外,对活动图像和网络版的图像压缩编码的研究以及对人眼视觉特性的充分利用等研究也是小波变换图像压缩编码领域亟待解决的问题。图像在传输中往往含有的噪声,如果通过压缩编码后,有利于噪声的去处,或者在解压缩时,加入对图像的去噪环节,并且把这个环节融入解压编码的过程也是当前研究的热点之一。
嵌入式零树编码
嵌入式零树编码方法(Embedded Zerotree Wavelets Encoding)是1993年由美国学者Jerome M.Shapiro首先完整地提出的基于比特连续逼进的图像编码方法。它的思想来源于对自然图像的观察和理解。自然图像具有两个特征:
第一,自然图像通常具有相对重要的低频信号,当一幅图像进行小波分解后,图像的能量集中在相对低频的了带内,所以低频子带的小波系数往往要大十高频子带内相关位置的小波系数;
第二,绝对值人的小波系数对图像的影响要大于绝对值小的小波系数。
同时,在图像小波系数经过量化后,会出现大面积的零系数,因此,怎样用最少的符号来表示这些零系数的位置,则是图像编码提高压缩比的关键,Shapiro的嵌入式零树编码的优点是只要记住零树根的位置,就可记住零树结构中所有零系数的位置。所以它可以极人提高压缩比。正因为如此,现在的零树编码已经成为新的图像编码国际标准JPEG2000的一个组成部分。通过实践发现,如果按一定的顺序扣描,则零树根会更容易连续出现;同时,如果我们可以采用多种编码的方法来表示这些连续出现的零树根,就可以进一步地提高图像编码的压缩比和信噪比。
图像数据经过小波分解以后,得到塔式的数据结构,由图像的了带分解可知,按水平方向和垂直方向频率的高低(低频为L,高频为H),对第n层分解,每层可以划分为4个子带,分别表示第n分解层的低频子带、垂直子带、水平子带和高频子带,各分辨率下的子带图像系数域对图像信号而言有着不同的重要性。由于正交小波变换能有效去除图像系数的相关性,使得无论是在同一分解层或是在不同的分解层小波系数的线性相关性均非常的小,但不同的分解层内系数幅值之间仍然存在明显的相关性,相关性主要表现在小尺度上(低分解层)的小波系数往往不大于在较大尺度的相同空间位置的小波系数,零树就是基于此种系数幅值的相关性而提出的一种新型的数据结构,通过零树结构,可以充分利用小波域各子图像的特点有效地表示数据。
零树结构的定义为:对于给定的阈值T,如果小波系数X<T,则称X是小系数;如果一个处于低分辨率(低频尺度)上的小波系数对于给定的阂值T是小系数,而处于同样空间位置的高分辨率(高频尺度)上的小波系数都小于给定的阈值T,则该结构就称为零树。对于给定的低频子图像中的系数而言,与其对应的具有相同空间定位的高频子图像(如果存在的话)中的系数称为是它的子孙;同样,对于定位在高频子图像中的系数而言,跟它对应的处于相同空间的低频子图像中的系数称为是它的祖先。这样就构成了父子关系。由此可见,对于一个分解层数为M的小波分解图像来说,子图像的每一个系数有3个子代系数;其分解过程示意如图1所示。
新的压缩编码结构流程
不论什么样的压缩编码方法,其目的都是要在一定保真度的情况下,达到大的压缩比。小波变换后系数的特点使人们提出各种方案来提高其压缩比。零树编码量化就是利用小波变换后的树结构提出的一种行之有效的编码方法。当然,这种的在小波变换后的处理方法还有很多。但都达不到零树编码量化的效果。但这也并不是蜕,简单的零树编码,就能达到理想的效果。小波变换在表示图像方面有很大的灵活性、适应人类视觉特性(HVS)以及图像压缩等方面有显著的优势。在图像压缩方面的优势主要表现在如下几方面:小波变换后的低频子图集中了图像的大部分能量;高频子图集中了图像的边缘、轮廓对应位置的大部分能量;同一方向上各级高频子图系数幅度大体一致。小波变换能除去系数的相关性,使得同一尺度内和不同尺度间的小波系数相关性均非常小。但是,不同尺度的小波系数在幅度上仍然存任着一定的相关性。前面提到的基于零树的嵌入式小波压缩算法就是利用这种相关性来有效的编码小波系数。它们是对高频子图和低频子图统一量化编码,只利用了系数尺度之间、空间位置之间的相关性,而没有利用人类视觉生理和心理的特性。通过大量的文献我们可以了解到,人眼的特性是对高频失真不敏感,特别是对角线方向的高频失真最不敏感,而对低频失真较为敏感。为了充分利用人的视觉的特性,我们对小波变换后的压缩方案进行了选择,如图2所示。
首先对图像进行四级小波变换,然后根据人眼对低频失真较敏感,而且低频分量集中了图像绝大部分能量的特点,对最低频子图子带单独进行DPCM压缩编码,为了进一步提高压缩比,我们采用自适应算术编码对随后的码流进行编码。根据人眼对45°方向的高频失真不很敏感以及子带小波系数为零的概率很大的特点,对其舍去不作编码(解码时恢复为零),对其余子带采用零树量化编码。在零树法量化编码时,对高频子带与较低频子带采取不同的量化策略,较低频部分分配较高的比特率,高频部分分配较低的比特率,最后进行游程编码。
在本算法的实现中,由于我们要对不同的于带进行不同的量化,对于高级数的小波系数采用细致的量化方法,因为它包含图像中对人眼重要的信息。对低级数的小波系数采用相对粗一些的量化方法。它们都是标量量化方法。同时,在算法实践中,如果采用SPIHT算法,不容易定位不同子带的子系数。因此,在算法实现上,我们采用了EZW算法,即不采用集合分裂的方法来提高算法速度。同时,如前面提到的通过创建数组来提高检索零树的效率的方法还是行之有效的方法。而且,这样作有助于定位象素点在不同子带区的位置,有利于我们的量化实现。我们在算法上加以采用,得到良好的效果。
仿真结果和性能比较
信噪比的定义为:
通过仿真的比较结果(图3),我们可以看出算法在较低的编码率的情况下,可以获得了较高的压缩比。通过对两幅图像的比较,我们发现,在大致相同信噪比的情况下,Lena图像有更高的编码率,这和Lena图像的统计特性有很大的关系。但二者都获得了较高的编码率。通过下面的图像,我们可以从主观效果上看出,本编码方案的视觉效果较好,因此它是可行的。
分享到:
猜你喜欢