全相位余弦双正交变换及其对jpeg的改进方法

文档序号:7953257阅读:384来源:国知局
专利名称:全相位余弦双正交变换及其对jpeg的改进方法
技术领域
本发明属于计算机图像处理技术领域。
背景技术
目前,基本JPEG算法中采用的图像变换方法是离散余弦变换(Discrete Cosine Transform,DCT)(见文献ISO/IEC 10918-1|ITU-TRec.T.81,Digital compression and coding of continuous-tone stillimages)。在基于DCT的压缩编码系统里,图像数据被分成8×8的块并且每个块进行相同的处理首先,使用正向离散余弦变换(Forward DiscreteCosine Transform,FDCT)把空间域表示的图像变换成频率域表示的图像,去除数据冗余,即F=[D][f][DT]([f]表示图像矩阵,[F]表示变换系数矩阵,[D]表示DCT变换矩阵);然后,使用量化表对DCT系数进行量化;最后,对差分直流系数(DC)进行差分脉冲编码调制(DPCM)编码并对经“之”(Zig-Zag)字形扫描的交流系数(AC)进行哈夫曼(Huffman)编码。由[f]=[DT][F][D]重建图像。[D]的行向量是分解基矢量,[DT]的列向量是合成基矢量,DCT变换和反变换中的分解基矢量和合成基矢量是相同的。
JPEG中采用DCT变换是因为DCT的基矢量接近理想正交变换(K-L变换)的基矢量。然而由于基于DCT的图像压缩编码方法中量化表是根据人类视觉系统和压缩图像类型的特点进行优化的量化系数矩阵,也就是对不同的DCT系数采用不同的量化间隔,量化特别是改变压缩率时的量化需要较复杂的计算,量化表也需要占一定的内存空间。因此,对于图像压缩编码来说,DCT变换并不是最优的选择。

发明内容本发明的目的是解决现有技术中需要量化表,且量化表复杂,需要进行大量计算的问题,提供一种全相位余弦双正交变换法,及采用该变换对JPEG存储和传输的改进方法。
本发明提供的全相位余弦双正交变换法,是将二维全相位余弦双正交变换定义为[F]=[A][f][AT],反变换定义为[f]=[A-1][F][(A-1)T],其中,A=V/N2=0.12500.12500.12500.12500.12500.12500.12500.12500.10940.08540.06170.0262-0.0156-0.0575-0.0930-0.11670.09380.0374-0.0221-0.0783-0.0938-0.05430.02210.09520.0781-0.0078-0.0709-0.06570.01560.07870.0396-0.06760.0625-0.0408-0.06250.01690.0625-0.0169-0.06250.04080.0469-0.0557-0.01750.0498-0.0156-0.03680.0488-0.01980.0313-0.05100.02210.0101-0.03130.0341-0.02210.00680.0156-0.03010.0267-0.02160.0156-0.00960.0046-0.0012]]>式中V是离散余弦列率滤波(DCSF)中的列率响应向量到时域滤波器的过渡矩阵,V(m,n)=N-m0≤m≤N-1,n=0(N-m)cosmnπN-cscnπNsinmnπN0≤m≤N-1,1≤n≤N-1,]]>N为矩阵V的行数或列数。
一种采用上述全相位余弦双正交变换法对JPEG的改进方法,本发明对JPEG的改进之处是,用全相位余弦双正交变换代替二维离散余弦变换,对所有变换系数采用无量化或仅需一个参数的一致量化,具体过程如下——输入原始图像及比特率;——分成8×8像素块,分别进行全相位余弦双正交变换;——根据比特率确定量化间隔,对变换系数进行均一量化;——直流系数的预测编码和交流系数的“之”字形扫描、可变长编码;——哈夫曼熵编码;——输出压缩图像的比特序列。
接收端解压缩过程如下——接收输入的经变换后的压缩图像比特序列;——哈夫曼熵解码;
——对直流系数和交流系数可变长解码;——反量化;——反全相位余弦双正交变换;——得到重建图像。
本发明的优点和积极效果1、本发明基于全相位数字滤波理论和DCT提出了全相位余弦双正交变换(APCBOT),并根据这种变换方法的特性将其应用到图像压缩领域。2、离散余弦列率滤波(DCSF)中的列率响应向量到时域滤波器的过渡矩阵过滤矩阵V的行向量具有列率的性质,列率随行号m的增大而增大,而变化幅度则随列率增大而减小。3、全相位余弦双正交变换矩阵[A]的行向量是分解基矢量,而[A-1]的列向量是合成基矢量,二者都具有列率的性质而且是对偶双正交的,即也可以把上述合成基矢量用作分解,而把分解基矢量用作合成。二者共同组成了全相位余弦双正交变换。[A]的基矢量的列率跟DCT正交变换矩阵[D]一样随行序号的增加而增加,然而[D]的各个基矢量是等模的,而[A]的基矢量的模随列率的增高而衰减,因此全相位余弦双正交变换系数具有高频衰减的性质。当对各变换系数采用均一的量化间隔量化时,相当于DCT变换低频系数细量化、高频系数粗量化的效果。因此可以去掉基于DCT变换的JPEG算法中的复杂的量化表。4、基于该变换方法的JPEG算法可以实现简化量化表,使量化表的调整简单易行,从而节省计算时间,采用DCT变换和相应量化的运算相比时间平均快数秒,并使硬件实现简便易行;提高重建图像的质量和编码压缩比以适应不同的使用需求。

图1是用本发明方法对图像进行压缩与重建的方框图;图2是两种变换和量化方案下lena图像的率失真曲线。
具体实施方式实施例1本发明提供的全相位余弦双正交变换法,是将二维全相位余弦双正交变换定义为[F]=[A][f][AT],反变换定义为[f]=[A-1][F][(A-1)T],其中,A=V/N2=0.12500.12500.12500.12500.12500.12500.12500.12500.10940.08540.06170.0262-0.0156-0.0575-0.0930-0.11670.09380.0374-0.0221-0.0783-0.0938-0.05430.02210.09520.0781-0.0078-0.0709-0.06570.01560.07870.0396-0.06760.0625-0.0408-0.06250.01690.0625-0.0169-0.06250.04080.0469-0.0557-0.01750.0498-0.0156-0.03680.0488-0.01980.0313-0.05100.02210.0101-0.03130.0341-0.02210.00680.0156-0.03010.0267-0.02160.0156-0.00960.0046-0.0012]]>式中V是离散余弦列率滤波(DCSF)中的列率响应向量到时域滤波器的过渡矩阵,V(m,n)=N-m0≤m≤N-1,n=0(N-m)cosmnπN-cscnπNsinmnπN0≤m≤N-1,1≤n≤N-1,]]>N为矩阵的行数或列数。
实施例2在本发明中,首先提出了一种新型变换即全相位余弦双正交变换,并且用全相位余弦双正交变换代替JPEG压缩算法中的DCT变换,应用于图像压缩。本发明基于软件实现。
如图1所示,首先,输入原始图像和所要求的比特率,把图像分成8×8的块,分块进行全相位余弦双正交变换,根据设定的比特率选定量化间隔,把变换系数进行均一量化,再对DC系数进行差分预测编码,对AC系数进行Zig-Zag扫描和可变长编码,然后根据标准的Huffman码表进行熵编码,输出压缩图像的码流,实现了图像压缩。在接收端,经过Huffman熵解码,DC系数和AC系数可变长解码、反量化后,再进行反全相位余弦双正交变换即可得到重建图像。
本发明对JPEG的改进之处是,用全相位余弦双正交变换代替DCT变换,对所有变换系数采用无量化或仅需一个参数的一致量化。图像压缩编码的其他部分与JPEG相同。
在Matlab 6.5环境下对本发明提出的技术方案进行了计算机仿真实验。
实验得到以下结论1.用V/N2作为全相位余弦双正交变换矩阵并取消量化环节时,编码压缩率约是基于DCT的标准JPEG算法的一倍,同时重建图像质量只比基于DCT时略差。
2.采用全相位余弦双正交变换、均一量化间隔取为60时的图像压缩率和重建图像信噪比指标,与采用DCT变换、用JPEG标准中的量化表进行量化的指标近似。
3.在其他编码比特率下,本发明提出的技术方案重建图像的主观效果和峰值信噪比均优于标准JPEG方案的结果。
实验结果见表1和表2表1对512×512的八幅图像进行基于DCT标准量化的JPEG算法的实验结果,
表2对512×512的八幅图像进行基于APCBOT无量化的JPEG算法的实验结果,
如表1和表2,分别是采用基于DCT量化表和基于无量化APCBOT的JPEG算法的实验数据。任选的8幅图像用基于APCBOT无量化的算法与基于标准量化的DCT相比压缩比提高了将近一倍,同时PSNR只有不大的差距,并且重建图像质量主观感觉无明显差别。由于省略了量化环节并且压缩比高,这种无量化的压缩编码方法不但可以加快图像处理的速度而且节约传输带宽。非常适用于图像传输带宽有限而对图像质量要求不是甚高的场合。
无量化的APCBOT相当于量化间隔为1的一致量化,为了得到比无量化更高质量的重建图像,理论上来说一致量化的间隔应为小于1的分数,为了避免这种情况可以对变换矩阵A进行修正。例如取A=V/N,这相当于用求和代替平均的全相位滤波的过滤矩阵。表3所示为8幅图像在A=V/N一致量化间隔Q=52时的实验数据。
表3对512×512的八幅图像进行基于APCBOT均一量化的JPEG算法的实验结果,
与基于标准量化DCT的压缩编码重建图像相比,前者在质量上略优于后者或与后者基本相当。可见采用修正的APCBOT时平均压缩比和平均信噪比都优于DCT。
本发明提出的改进JPEG方法与标准JPEG方法相比的最大优点是,去掉了量化表,节省了内存,简化了计算,提高了编解码速度。
权利要求
1.一种全相位余弦双正交变换法,其特征是本发明将二维全相位余弦双正交变换定义为[F]=[A][f][AT],反变换定义为[f]=[A-1][F][(A-1)T],其中,A=V/N2=0.12500.12500.12500.12500.12500.12500.12500.12500.10940.08540.06710.0262-0.0156-0.0575-0.0930-0.11670.09380.0374-0.0221-0.0783-0.0938-0.05430.02210.09520.0781-0.0078-0.0709-0.06570.01560.07870.0396-0.06760.0625-0.0408-0.06250.01690.0625-0.0169-0.06250.04080.0469-0.0557-0.01750.0498-0.0156-0.03680.0488-0.01980.0313-0.05100.02210.0101-0.03130.0341-0.02210.00680.0156-0.03010.0267-0.02160.0156-0.00960.0046-0.0012]]>式中V是离散余弦列率滤波(DCSF)中的列率响应向量到时域滤波器的过渡矩阵,V(m,n)=N-m0≤m≤N-1,n=0(N-m)cosmnπN-cscnπNsinmnπN0≤m≤N-1,1≤n≤N-1′]]>N为矩阵的行数或列数。
2.一种采用权利要求1所述的全相位余弦双正交变换法对JPEG的改进方法,其特征是本发明对JPEG的改进之处是,用全相位余弦双正交变换代替二维离散余弦变换,对所有变换系数采用无量化或仅需一个参数的一致量化,具体过程如下——输入原始图像及比特率;——分成8×8像素块,分别进行全相位余弦双正交变换;——根据比特率确定量化间隔,对变换系数进行均一量化;——直流系数的预测编码和交流系数的“之”字形扫描、可变长编码;——哈夫曼熵编码;——输出压缩图像的比特序列。
3.根据权利要求2所述的对JPEG的改进方法,其特征是接收端解压缩过程如下——接收输入的经变换后的压缩图像比特序列;——哈夫曼熵解码;——对直流系数和交流系数可变长解码;——反量化;——反全相位余弦双正交变换;——得到重建图像。
全文摘要
全相位余弦双正交变换法。将二维全相位余弦双正交变换定义为[F]=[A][f][A
文档编号H04N7/50GK1825894SQ20061001334
公开日2006年8月30日 申请日期2006年3月22日 优先权日2006年3月22日
发明者侯正信, 高志云 申请人:天津大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1