全相位反余弦双正交变换及其对jpeg的改进方法

文档序号:6554884阅读:349来源:国知局
专利名称:全相位反余弦双正交变换及其对jpeg的改进方法
技术领域
本发明属于计算机图像处理技术领域。
背景技术
JPEG压缩标准(ISO/IEC 10918-1|ITU-T Rec.T.81 Digitalcompression and coding of continuoustone still images)广泛应用于静止图像编码,在JPEG中,基于离散余弦变换(DCT)的图像压缩编码的过程称为基本顺序过程。编码过程主要步骤为图像的8×8方块化、二维离散余弦变换(Discrete CosineTransform,DCT)、根据量化表量化、“之”(Zig-Zag)字形扫描、游程编码、哈夫曼(Huffman)熵编码。接收端解压缩是编码的逆过程,经过反量化和反DCT变换,得到重建图像。8×8像块[f]的二维DCT变换公式为[F]=[C][f][CT],其中,[C]为8×8的DCT变换矩阵,[CT]为[C]的转置。DCT变换是正交变换,[C]的转置即为[C]的逆,即[CT]=[C-1]。因此,由[f]=[CT][F][C]重建图像。[C]的行向量是分解基矢量,[CT]的列向量是合成基矢量,DCT变换和反变换中的分解基矢量和合成基矢量是相同的。
JPEG压缩编码算法中DCT变换是一种常用的变换编码方法,在数字图像压缩领域得到了广泛的应用。然而我们发现,对于图像压缩编码来说正交变换并不是最优的选择,其缺点之一是对不同的DCT系数采用不同的量化间隔,量化特别是改变压缩率时的量化需要较复杂的计算,量化表也需要占一定的内存空间。

发明内容本发明的目的是解决现有技术对不同的DCT系数采用不同的量化间隔,且量化表复杂,需要进行大量计算的问题,提供一种全相位反余弦双正交变换及其对JPEG的改进方法。
本发明提供的全相位反余弦双正交变换法,是将二维全相位反余弦双正交变换定义为[F]=[V][f][VT],反变换定义为[f]=[V-1][F][(VT)-1],其中[V]是全相位反余弦双正交变换矩阵,一般形式为
V(m,n)=1m=00≤n≤N-1N-m+2-1Ncosm(2n+1)π2N1≤m≤N-10≤n≤N-1,]]>m,n代表矩阵V的行和列。
当N=8时,全相位反余弦双正交变换矩阵为V=1.00001.00001.00001.00001.00001.00001.00001.00000.90880.77040.51520.1808-0.1808-0.5152-0.7704-0.90880.74080.3072-0.3072-0.7408-0.7408-0.30720.30720.74080.5624-0.1320-0.6640-0.37600.37600.66400.1320-0.56240.3904-0.3904-0.39040.39040.3904-0.3904-0.39040.39040.2368-0.41840.08320.3552-0.3552-0.08320.4184-0.23680.1152-0.27920.2792-0.1152-0.11520.2792-0.27920.11520.0344-0.09840.1472-0.17360.1736-0.14720.0984-0.0344.]]>一种采用上述全相位反余弦双正交变换法对JPEG的改进方法,本发明对JPEG的改进之处是,用全相位反余弦双正交变换代替二维离散余弦变换,对所有变换系数采用均一的量化间隔量化,具体过程如下——输入原始图像及比特率;——分成8×8像素块,分别进行全相位反余弦双正交变换;——根据比特率确定量化间隔,对变换系数进行均一量化;——直流系数的预测编码和交流系数的“之”字形扫描、可变长编码;——哈夫曼熵编码;——输出压缩图像的比特序列。
接收端解压缩过程如下——接收输入的经变换后的压缩图像比特序列;——哈夫曼熵解码;——对直流系数和交流系数可变长解码;
——反量化;——反全相位反余弦双正交变换;——得到重建图像。
本发明的优点和积极效果1、本发明基于全相位数字滤波理论和传统的反余弦正交变换提出了一种新型变换即全相位反余弦双正交变换,并将其成功应用于图像压缩领域。2、全相位反余弦双正交变换矩阵[V]与DCT正交变换矩阵[C]的相似之处是基矢量的列率随行序号的增加而增加,不同之处是[C]的各个基矢量是等模的,而[V]的基矢量的模随列率的增高而衰减。这就使得全相位反余弦双正交变换系数具有高频衰减的性质。当对各变换系数采用均一的量化间隔量化时,相当于DCT变换低频系数细量化、高频系数粗量化的效果。因此可以去掉基于DCT变换的JPEG算法中的复杂的量化表。3、本发明提出的改进JPEG方法与标准JPEG方法相比的最大优点是,去掉了量化表,由于DCT变换的量化表有47种量化步长,而采用全相位反余弦双正交变换仅需要一种量化步长,节省了内存占用量。简化了计算,提高了编解码速度,大大缩短了运算时间,采用全相位反余弦双正交变换和均一量化比采用DCT变换和相应量化的运算时间平均快9.6713s。硬件实现也比较简单,并且能达到与DCT变换基本相同的图像压缩效果。

图1是用本发明方法对图像进行压缩与重建的方框图;图2是两种方案下图像“lena”的率失真曲线。
具体实施方式实施例1本发明将二维全相位反余弦双正交变换定义为[F]=[V][f][VT],反变换定义为[f]=[V-1][F][(VT)-1],其中[V]是全相位反余弦双正交变换矩阵。与正交变换矩阵不同,这里[V-1]≠[VT],即分解基矢量([V]的行向量)与合成基矢量([V-1]的列向量)是不同的,然而二者之间是双正交的,构成对偶基向量。本发明定义的全相位反余弦双正交变换矩阵[V]的一般形式为V(m,n)=1m=00≤n≤N-1N-m+2-1Ncosm(2n+1)π2N1≤m≤N-10≤n≤N-1,]]>m,n代表矩阵V的行和列。
当N=8时V=1.00001.00001.00001.00001.00001.00001.00001.00000.90880.77040.51520.1808-0.1808-0.5152-0.7704-0.90880.74080.3072-0.3072-0.7408-0.7408-0.30720.30720.74080.5624-0.1320-0.6640-0.37600.37600.66400.1320-0.56240.3904-0.3904-0.39040.39040.3904-0.3904-0.39040.39040.2368-0.41840.08320.3552-0.3552-0.08320.4184-0.23680.1152-0.27920.2792-0.1152-0.11520.2792-0.27920.11520.0344-0.09840.1472-0.17360.1736-0.14720.0984-0.0344]]>实施例2本发明首先提出了一种新型变换,即全相位反余弦双正交变换,并且用全相位反余弦双正交变换代替JPEG压缩算法中的DCT变换,应用于图像压缩。本发明对所有变换系数采用均一量化,图像压缩编码的其他部分与JPEG相同。本发明基于软件实现。
如图1所示,首先,输入原始图像和所要求的比特率,把图像分成8×8的块,分块进行全相位反余弦双正交变换,根据设定的比特率选定量化间隔,把变换系数进行均一量化,再对DC系数进行差分预测编码,对AC系数进行Zig-Zag扫描和可变长编码,然后根据标准的Huffman码表进行熵编码,输出压缩图像的码流,实现了图像压缩。在接收端,经过Huffman熵解码,DC系数和AC系数可变长解码、反量化后,再进行反全相位反余弦双正交变换即可得到重建图像。
需要注意的是,在图1的程序流程图中,进行Huffman编码时,对于DC系数,因为是对相邻图像块之间的差值进行编码的,所以在量化后扫描之前要先对DC系数进行预处理。将量化后DC的原始值替换成相邻图像块之间的差值。在对AC系数进行编码时,又要考虑63个系数全是零和连续出现16个连零这两种特殊情况等等。
在Matlab 6.5环境下对本发明提出的技术方案进行了计算机仿真实验。实验得到以下结论1.采用全相位反余弦双正交变换、均一量化间隔取为58时的图像压缩率和重建图像信噪比指标,与采用DCT变换、用JPEG标准中的量化表进行量化的指标近似。
2.在其他编码比特率下,本发明提出的技术方案与标准JPEG方案在重建图像的主观效果和峰值信噪比方面也大致相同。
如表1和表2所示表1 标准压缩率下两种方案性能比较
表1给出了对512×512的七幅图像采用DCT变换、用JPEG标准中的量化表进行量化和采用全相位反余弦双正交变换(APIDCBT)、均一量化间隔取为58进行图像编码和重建的实验结果。
表2不同压缩率下两种方案性能比较
表2给出了对图像“lena”,这两种变换和量化方案在不同的编码比特率和重建图像峰值信噪比下的实验结果。由表1可以看出,二者压缩效果基本相同。
由表2数据绘制的两种变换和量化方案下图像“lena”的率失真曲线如图2所示。由图2可以看出,在相近编码比特率时,本发明提出的改进JPEG方法略优于标准JPEG方法。
权利要求
1.一种全相位反余弦双正交变换法,其特征是本发明将二维全相位反余弦双正交变换定义为[F]=[V][f][VT],反变换定义为[f]=[V-1][F][(VT)-1],其中[V]是全相位反余弦双正交变换矩阵,一般形式为V(m,n)=1m=00≤n≤N-1N-m+2-1Ncosm(2n+1)π2N1≤m≤N-10≤n≤N-1,]]>m,n代表矩阵V的行和列。
2.根据权利要求1所述的全相位反余弦双正交变换法,其特征是当取N=8时,全相位反余弦双正交变换矩阵为V=1.00001.00001.00001.00001.00001.00001.00001.00000.90880.77040.51520.1808-0.1808-0.5152-0.7704-0.90880.74080.3072-0.3072-0.7408-0.7408-0.30720.30720.74080.5624-0.1320-0.6640-0.37600.37600.66400.1320-0.56240.3904-0.3904-0.39040.39040.3904-0.3904-0.39040.39040.2368-0.41480.08320.3552-0.3552-0.08320.4148-0.23680.1152-0.27920.2792-0.1152-0.11520.2792-0.27920.11520.0344-0.09840.1472-0.17360.1736-0.14720.0984-0.0344.]]>
3.一种采用权利要求1所述的全相位反余弦双正交变换法对JPEG的改进方法,其特征是本发明对JPEG的改进之处是,用全相位反余弦双正交变换代替二维离散余弦变换,对所有变换系数采用均一的量化间隔量化,具体过程如下——输入原始图像及比特率;——分成8×8像素块,分别进行全相位反余弦双正交变换;——根据比特率确定量化间隔,对变换系数进行均一量化;——直流系数的预测编码和交流系数的“之”字形扫描、可变长编码;——哈夫曼熵编码;——输出压缩图像的比特序列。
4.根据权利要求3所述的对JPEG的改进方法,其特征是接收端解压缩过程如下——接收输入的经变换后的压缩图像比特序列;——哈夫曼熵解码;——对直流系数和交流系数可变长解码;——反量化;——反全相位反余弦双正交变换;——得到重建图像。
全文摘要
全相位反余弦双正交变换法,将变换定义为[F]=[V][f][V
文档编号G06T9/00GK1822050SQ200610013348
公开日2006年8月23日 申请日期2006年3月22日 优先权日2006年3月22日
发明者侯正信, 潘霞 申请人:天津大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1