全相位沃尔什双正交变换及其对jpeg的改进方法

文档序号:7953256阅读:204来源:国知局
专利名称:全相位沃尔什双正交变换及其对jpeg的改进方法
技术领域
本发明属于计算机图像处理技术领域。
背景技术
目前,多媒体和互联网的发展要求采用合适的方法对图像进行压缩编码,以便于图像的存储和传输。JPEG是静止图像压缩的国际标准(见文献ISO/IEC10918-1|ITU-T Rec.T.81,Digital compression and coding of continuous-tone stillimages)。JPEG图像压缩编码算法的主要步骤为图像的8×8方块化、二维离散余弦变换(Discrete Cosine Transform,DCT)、根据量化表量化、“之”字形(Zig-Zag)扫描游程编码、哈夫曼(Huffman)熵编码等。接收端解压缩是编码的逆过程,经过反量化和反DCT变换,得到重建图像。8×8像块[f]的二维DCT变换公式为[F]=[C][f][CT],其中,[C]为8×8的DCT变换矩阵,[CT]为[C]的转置。DCT变换是正交变换,[C]的转置即为[C]的逆,即[CT]=[C-1]。因此,由[f]=[CT][F][C]重建图像。[C]的行向量是分解基矢量,[CT]的列向量是合成基矢量,DCT变换和反变换中的分解基矢量和合成基矢量是相同的。
JPEG中采用DCT变换是因为DCT的基矢量接近理想正交变换(K-L变换)的基矢量。然而我们发现,对于图像压缩编码来说,正交变换并不是最优的选择。其缺点之一是量化表比较复杂,对不同的DCT系数采用不同的量化间隔,量化特别是改变压缩率时的量化需要较复杂的计算,量化表也需要占一定的内存空间。

发明内容本发明的目的是解决现有技术中需要量化表,且量化表复杂,需要进行大量计算的问题,提供一种全相位沃尔什双正交变换法,及采用该变换对JPEG存储和传输的改进方法。
该方法最大的优点是无需量化表,对变换系数进行均一量化,从而可大大缩短运算时间,硬件实现也比较简单,并且能达到与DCT变换基本相同的图像压缩效果。
本发明提供的全相位沃尔什双正交变换法,是将二维全相位沃尔什双正交变换定义为[F]=[V][f][VT],反变换定义为[f]=[V-1][F][(V-1)T],其中[V]是全相位沃尔什双正交变换矩阵。
本发明定义的全相位沃尔什双正交变换矩阵[V]是由沃尔什正交变换矩阵用如下的迭代公式得到的Vm(j,l)=Σi=07-jVm-1-1(i+j,l)Vm-1(l,i)---(1)]]>[V]=[Vm](2)其中,m为自然数,[V0]为沃尔什正交变换矩阵[V0]=18111111111111-1-1-1-111-1-1-1-11111-1-111-1-11-1-111-1-111-1-11-11-111-11-1-11-111-11-11-11-1.]]>本发明用公式(1)迭代5次后得到的[V5]作为全相位沃尔什双正交变换矩阵[V],即m取5,则[V]=[V5]=188.00008.00008.00008.00008.00008.00008.00008.00007.00005.18333.62202.01860.7104-4.8184-4.5786-9.13726.00002.4593-0.9738-4.5986-6.2573-3.1366-2.04558.55255.0000-1.0781-4.1499-3.4166-0.95944.81136.1078-6.31524.0000-1.8218-3.9411-0.38624.20720.2307-5.31963.03093.0000-3.3642-1.19662.23020.4331-3.51403.5731-1.16162.0000-3.19330.98331.7602-2.60112.1770-1.33420.20801.0000-2.22801.8363-1.35421.0357-0.3971-0.07580.1831.]]>一种采用上述全相位沃尔什双正交变换法对JPEG存储和传输的改进方法是,用全相位沃尔什双正交变换代替二维离散余弦变换,对所有变换系数采用均一量化,具体过程如下——输入原始图像及比特率;——分成8×8像素块,分别进行全相位沃尔什双正交变换;——根据比特率确定量化间隔,对变换系数进行均一量化;
——直流系数(DC)的预测编码和交流系数(AC)的“之”字形(Zig-Zag)扫描、可变长编码;——哈夫曼(Huffman)熵编码;——输出压缩图像的比特序列。
对JPEG存储和传输的改进方法,其接收端解压缩过程如下——接收输入的经变换后的压缩图像比特序列;——哈夫曼(Huffman)熵解码;——对直流系数(DC)和交流系数(AC)可变长解码;——反量化;——反全相位沃尔什双正交变换;——得到重建图像。
本发明的优点和积极效果1、本发明基于全相位数字滤波理论和传统的沃尔什正交变换提出了一种新型变换即全相位沃尔什双正交变换,并将其成功应用于图像压缩领域。2、全相位沃尔什双正交变换矩阵[V]与DCT正交变换矩阵[C]的相似之处是基矢量的列率随行序号的增加而增加,不同之处是[C]的各个基矢量是等模的,而[V]的基矢量的模随列率的增高而衰减。这就使得全相位沃尔什双正交变换系数具有高频衰减的性质。当对各变换系数采用均一的量化间隔量化时,就相当于DCT变换低频系数细量化、高频系数粗量化的效果。因此可以去掉基于DCT变换的JPEG算法中的复杂的量化表。3、本发明对JPEG的改进之处是,用全相位沃尔什双正交变换代替DCT变换,对所有变换系数采用均一量化。图像压缩编码的其他部分与JPEG相同。在接收端,经过哈夫曼(Huffman)熵解码、直流系数(DC)和交流系数(AC)可变长解码、反量化后,再进行反全相位沃尔什双正交变换得到重建图像。本发明提出的改进JPEG方法与标准JPEG方法相比的最大优点是,对变换系数进行均一量化,去掉了量化表,节省了内存,简化了计算,提高了编解码速度,从而可大大缩短运算时间,硬件实现也比较简单,并且能达到与DCT变换基本相同的图像压缩效果。比如,在Celeron(R)CPU 2.80GHz、256M内存计算机环境下,在编码时间上,对九幅512×512大小的图像,在标准压缩率下,全相位沃尔什双正交变换方案比DCT方案平均少用2.3924秒;对一幅512×512大小的图像,在不同的压缩率下,全相位沃尔什双正交变换方案比DCT方案平均少用2.8072秒。在内存使用上,因为DCT方案需要存储复杂的量化表,存储量化表所用内存为全相位沃尔什双正交变换方案的64倍。当调整编码比特率时,因DCT方案需要计算量化矩阵而要做大量的乘法运算,这一计算量大约为全相位沃尔什双正交变换方案的64倍。

图1是两种变换和量化方案下图像“announcer”的率失真曲线;图2是用本发明方法对图像进行压缩与重建的方框图。
具体实施方式实施例1本发明定义的全相位沃尔什双正交变换矩阵[V]是由沃尔什正交变换矩阵用如下的迭代公式得到的Vm(j,l)=Σi=07-jVm-1-1(i+j,l)Vm-1(l,i)---(1)]]>[V]=[Vm] (2)其中,m为自然数,[V0]为沃尔什正交变换矩阵[V0]=18111111111111-1-1-1-111-1-1-1-11111-1-111-1-11-1-111-1-111-1-11-111-11-11-1-11-111-11-11-11-1]]>本发明用公式(1)迭代5次后得到的[V5]作为全相位沃尔什双正交变换矩阵[V],即m取5,则=[V5]=188.00008.00008.00008.00008.00008.00008.00008.00007.00005.18333.62202.01860.7104-4.8184-4.5786-9.13726.00002.4593-0.9738-4.5986-6.2573-3.1366-2.04558.55255.0000-1.0781-4.1499-3.4166-0.95944.81136.1078-6.31524.0000-1.8218-3.9411-0.38624.20720.2307-5.31963.03093.0000-3.3642-1.19662.23020.4331-3.51403.5731-1016162.0000-3.19330.98331.7602-2.60112.1770-1.33420.20801.0000-2.22801.8363-1.35421.0357-0.3971-0.07580.1831.]]>全相位沃尔什双正交变换矩阵[V]与DCT正交变换矩阵[C]的相似之处是基矢量的列率随行序号的增加而增加,不同之处是[C]的各个基矢量是等模的,而[V]的基矢量的模随列率的增高而衰减。这就使得全相位沃尔什双正交变换系数具有高频衰减的性质。当对各变换系数采用均一的量化间隔量化时,就相当于DCT变换低频系数细量化、高频系数粗量化的效果。因此可以去掉基于DCT变换的JPEG算法中的复杂的量化表。
实施例2在本发明中,区别现有技术的必要技术特征是首先提出了一种新型变换即全相位沃尔什双正交变换,并且用全相位沃尔什双正交变换代替JPEG压缩算法中的DCT变换,应用于图像压缩。本发明基于软件实现。
如图2所示,首先,输入原始图像和比特率,把图像分成8×8的像素块,分块进行全相位沃尔什双正交变换,根据输入比特率选定量化间隔,将变换系数进行均一量化,再对直流系数(DC)进行预测编码,对交流系数(AC)进行“之”字形(Zig-Zag)扫描和可变长编码,然后根据标准的哈夫曼(Huffman)码表进行熵编码,输出压缩图像的比特序列,实现了图像压缩。在接收端,经过哈夫曼(Huffman)熵解码、直流系数(DC)和交流系数(AC)可变长解码、反量化后,再进行反全相位沃尔什双正交变换得到重建图像。
需要注意的是,在图2的程序流程图中,进行哈夫曼(Huffman)编码时,对于直流系数(DC),因为是对相邻图像块之间的差值进行编码的,所以在量化后扫描之前要先对直流系数(DC)进行预处理。将量化后直流系数(DC)的原始值替换成相邻图像块之间的差值。在对交流系数(AC)进行编码时,又要考虑63个系数全是零和连续出现16个连零这两种特殊情况等等。
本发明对JPEG的改进之处是,用全相位沃尔什双正交变换代替DCT变换,对所有变换系数采用均一量化。图像压缩编码的其他部分与JPEG相同。
在Matlab 6.5环境下对本发明提出的技术方案进行了计算机仿真实验。实验得到以下结论1.当采用均一量化时,用[V5]作为全相位沃尔什双正交变换矩阵可以达到比其他[Vm]更好的图像压缩效果。
2.采用全相位沃尔什双正交变换、均一量化间隔取为60时的图像压缩率和重建图像信噪比指标,与采用DCT变换、用JPEG标准中的量化表进行量化时的指标近似。但全相位沃尔什双正交变换方案所用编码时间比DCT方案少。
3.在其他编码比特率下,本发明提出的技术方案与标准JPEG方案在重建图像的主观效果和峰值信噪比方面也大致相同。但全相位沃尔什双正交变换方案所用编码时间比DCT方案少。
表1给出了对512×512的九幅图像采用DCT变换、用JPEG标准中的量化表进行量化和采用全相位沃尔什双正交变换、均一量化间隔取为60进行图像编码和重建的实验结果。表1标准压缩率下两种方案性能比较
表2给出了对图像“announcer”,这两种变换和量化方案在不同的压缩比、编码比特率和重建图像峰值信噪比下的实验结果。
表2 不同压缩率下两种方案性能比较
由表1和表2可以看出,二者的压缩效果基本相同。但全相位沃尔什双正交变换方案与DCT方案相比,对九幅512×512大小的图像,在标准压缩率下,全相位沃尔什双正交变换方案的编码时间平均少用2.3924秒;对一幅512×512大小的图像,在不同的压缩率下,全相位沃尔什双正交变换方案的编码时间平均少用2.8072秒。由表2数据绘制的两种变换和量化方案下图像“announcer”的率失真曲线如图1所示。
由图1可以看出,在编码比特率比较小时,本发明提出的改进JPEG方法优于标准JPEG方法。而在编码比特率比较大时,改进的JPEG方法效果略差一些,但二者基本接近。
本发明提出的改进JPEG方法与标准JPEG方法相比的最大优点是,去掉了量化表,节省了内存,简化了计算,提高了编解码速度。
权利要求
1.一种全相位沃尔什双正交变换法,其特征是本发明将二维全相位沃尔什双正交变换定义为[F]=[V][f][VT],反变换定义为[f]=[V-1][F][(V-1)T],其中[V]是全相位沃尔什双正交变换矩阵。
2.根据权利要求1所述的全相位沃尔什双正交变换法,其特征是本发明定义的全相位沃尔什双正交变换矩阵[V]是由沃尔什正交变换矩阵用如下的迭代公式得到的Vm(j,l)=Σi=07-jVm-1-1(i+j,l)Vm-1(l,i)---(1)]]>[V]=[Vm] (2)其中,m为自然数,[V0]为沃尔什正交变换矩阵[V0]=18111111111111-1-1-1-111-1-1-1-11111-1-111-1-11-1-111-1-111-1-11-111-11-11-1-11-111-11-11-11-1.]]>
3.根据权利要求2所述的全相位沃尔什双正交变换法,其特征是本发明用上述公式(1)迭代5次后得到的[V5]作为全相位沃尔什双正交变换矩阵[V],即m取5,则[V]=[V5]=188.00008.00008.00008.00008.00008.00008.00008.00007.00005.18333.62202.01860.7104-4.8184-4.5786-9.13726.00002.4593-0.9738-4.5986-6.2573-3.1366-2.04558.55255.0000-1.0781-4.1499-3.4166-0.95944.81136.1078-6.31524.0000-1.8218-3.9411-0.38624.20720.2307-5.31963.03093.0000-3.3642-1.19662.23020.4331-3.51403.5731-1.16162.0000-3.193300.98331.7602-2.60112.1770-1.33420.20801.0000-2.22801.8363-1.35421.0357-0.3971-0.07580.1831.]]>
4.一种采用权利要求1所述的全相位沃尔什双正交变换法对JPEG的改进方法,其特征是本发明对JPEG的改进之处是,用全相位沃尔什双正交变换代替二维离散余弦变换,对所有变换系数采用均一量化,具体过程如下——输入原始图像及比特率;——分成8×8像素块,分别进行全相位沃尔什双正交变换;——根据比特率确定量化间隔,对变换系数进行均一量化;——直流系数(DC)的预测编码和交流系数(AC)的“之”字形(Zig-Zag)扫描、可变长编码;——哈夫曼(Huffman)熵编码;——输出压缩图像的比特序列。
5.根据权利要求4所述的对JPEG的改进方法,其特征是接收端解压缩过程如下——接收输入的经变换后的压缩图像比特序列;——哈夫曼(Huffman)熵解码;——对直流系数(DC)和交流系数(AC)可变长解码;——反量化;——反全相位沃尔什双正交变换;——得到重建图像。
全文摘要
全相位沃尔什双正交变换及其对JPEG的改进方法。本发明将二维全相位沃尔什双正交变换定义为[F]=[V][f][V
文档编号H04N7/32GK1829327SQ20061001334
公开日2006年9月6日 申请日期2006年3月22日 优先权日2006年3月22日
发明者侯正信, 王成优 申请人:天津大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1