运用w-正交变换的视频图像压缩方法

文档序号:7919026阅读:336来源:国知局
专利名称:运用w-正交变换的视频图像压缩方法
技术领域
本发明涉及一种视频图像压缩或解压方法,更确切地说,涉及一种视频(运动)图像帧间编码方法,并涉及到用于帧间去冗变换的W-正交变换。
在数字化时代,无论是数据保存还是数据传输,对它们的有效压缩是必须的,尤其视频信息更是如此。所以,数据压缩技术一直是IT技术里的关键技术之一。
视频压缩技术的研究应用已超过了二十年。二十年来,视频压缩技术的应用是成功的。在通信领域,产生了H.261、H.263等国际标准;对于单帧图像,也有JPEG标准。MPEG-1标准为VCD的普及打下了良好的基础,MPEG-2是DVD的压缩标准,它也是一些国家和地区未来的HDTV的压缩标准。然而,技术是在不断进步的。就在MPEG-2标准建立不久,基于小波的图像压缩技术显示了强大的生命力。在最近定稿的MPEG-4里,已产生了基于小波技术的静止图像压缩算法,它对JPEG形成了严重的挑战。JPEG2000标准正在制定之中。基于小波技术的视频压缩技术也是研究的热点。
MPEG-x(x=1或2)的算法由两部份构成,一是帧内压缩算法,一是帧间压缩算法。帧内压缩算法就是JPEG的算法,帧间预测编码采用一种基于块匹配的运动估计及补偿算法。它的基本模式是,先帧内压缩,再帧间压缩,即先空间后时间。运动补偿算法的搜索时间开销很大,在理论上也不严密,在恢复图像中,常有错位的感觉,因而不适合象远程医疗这类的精细压缩,况且它的压缩率也不是很理想,象一部DVD电影,普通光盘需要6至8张。该算法的特点是编码和解码算法不对称,编码复杂,解码相对要简单。从而编码必须用ASIC来实现。现在最快的微机也无法实时编码。
视频图像每秒25或30帧,因而前后几帧的图像内容存在很多相同或基本相同的部分,这种冗余是大家都认识到的。关键是利用的方法不一样,MPEG根据前一帧预测后面的帧,或者根据前一帧和后一帧预测中间的帧。它寻找“相同的部分”的算法是非常复杂的,这是MPEG压缩编码不能用软件实现,而必须购买几千上万元的压缩卡的原因。
另一方面,在军事应用领域,如军队图像、视频的通信等,用于对边境突发情况、热点地区的监控,也非常需要对于视频图像的压缩或解压方法。但是这种可能用于军事领域的通信编码体制显然不适宜公开,这样有利于通讯保密,即使敌对势力破解了我方的信道编码,也无法解压我们的图像、视频。这也是建立我军自己的编码体系的重大意义。
本发明的目的在于为基于小波的帧内压缩的视频压缩提供一种帧间压缩处理算法,消除运动图像临近的若干帧之间的冗余信息,该算法可适用于军用和民用。
本发明的技术方案如下本发明之视频图像压缩编码法包括以下步骤(a)对运动图像按一定步长M分组,M为帧数;(b)对每组中的M帧图像进行正交变换,得到M帧新图像;(c)根据压缩比的要求和M帧新图像的不同重要性,进行目标比特分配;(d)对M帧新图像分别进行编码。
在以上所述的本发明之视频图像压缩编码法中,所述步骤(a)的M可取2、3、4、5、6、7、8。
在以上所述的本发明之视频图像压缩编码法中,所述步骤(b)之正交变换为(M=4)Y1=12(X1+X2+X3+X4)]]>Y2=15(3X1+X2-X3-3X4)]]>Y3=12(X1-X2-X3+X4)]]>Y4=15(X1-3X2+3X3-X4)]]>其中的X1,X2,X3,X4为相邻的四幅图像,经变换后所得到的图像Y1,Y2,Y3,Y4称为伪图像组。
在以上所述的本发明之视频图像压缩编码法中,所述步骤(b)之正交变换,M=5时为Y1=15(X1+X2+X3+X4+X5)]]>Y2=110(2X1+X2-X4-2X5)]]>Y3=114(2X1-X2-2X3-X4+2X5)]]>Y4=110(X1-2X2+2X4-X5)]]>其中的X1,X2,X3,X4,X5,为相邻的四幅图像,经变换后得到的图像Y1,Y2,Y3,Y4,Y5称为伪图像组。
上述步骤(b)中所采用的M=4或M=5,其对应的正交变换即W-正交变换的两种实施例。由于图像的时间轴上的采样不能有太久的延迟,帧间变换不宜采用正交小波变换。一种可能的选择是用离散余弦变换(DCT),但它的计算会有一些问题。本发明采用一种更有效的、类似DCT的变换(暂时称之为W-正交变换,因为这类变换是本发明之发明人最先发现),它既有高的效率,也有快速算法。W矩阵是多项式基下压缩变换性能最好的矩阵,DCT是三角函数基下压缩变换性能最好的矩阵,两者没有哪个好哪个差一说。当信源更合适用多项式来描述时,W变换更好;当信源更合适用三角函数来描述时,DCT就好一些。W-正交变换只需要整数加法。DCT是不可能通过如此的变化来加速解码算法的。只要算法设计得好,在运动图像中加入这样的变换后,不会增加太多的时间开销,肯定比运动补偿算法简单。
M=4的W变换对应一个4阶正交矩阵A=1/21/21/21/23/251/25-1/25-3/251/2-1/2-1/21/21/25-3/253/25-1/25.---(1)]]>在此给出消失矩的定义,定义设给定了n个数a1,a2,..,an。如果 ,就称a1,a2,...,an有r+1阶消失矩。消失矩大,压缩效果好。
在矩阵(1)中,第一行是直流分量,第二行有1阶消失矩,第三行有2阶消失矩,第四行有3阶消失矩。它的计算量小于DCT的。四阶DCT矩阵是1211112+222-22-2-22-2+221-1-112-22-2+222+22-2-22,---(2)]]>它无法整数化,也没有消失矩性质。如果四阶矩阵的相关性还不够,可以考虑5阶矩阵,即M=515151515152101100-110-210214-114-214-114214110-2100210-110170-470670-470170,---(3)]]>它同样有消失矩性质,能够类似上述的4阶矩阵那样整数化。Y1=15(X1+X2+X3+X4+X5)]]>Y2=110(2X1+X2-X4-2X5)]]>Y3=114(2X1-X2-2X3-X4+2X5)]]>Y4=110(X1-2X2+2X4-X5)]]>Y5=170(X1-4X2+6X3-4X4+X5)]]>这有利于算法的计算机软件和ASIC实现。
完成图像组的伪图像变换后,对伪图像分别采用小波变换,把它们当作静止图像来处理。但是这几副图对解压图像不是同等重要的。第一幅最重要,最后的最不重要。在以上所述的本发明之视频图像压缩编码法中,所述步骤(c)比特分配采用根据压缩比查经验表的方法确定。对M=4,可取第一幅50%,第二幅25%,第三、第四幅各12.5%。
然后进行步骤(d),即对M帧新图像根据分配到的码率大小,分别进行量化编码。这里量化编码可以采用常规的零树编码或者子带编码,也可以用本发明人的另一项正在申请专利的帧内量化编码方法。
本发明应用于视频图像帧间压缩或解压处理,利用W-正交变换对图像序列中连续的若干帧在时间轴上进行处理,能够消除运动图像临近的若干帧之间的冗余信息。本发明的帧间处理方法的处理运算非常简单,可以软件实现实时压缩,甚至在微机上同时压缩多路视频信号。当然本发明的算法也可以用硬件实现,那样实现成本更低、运算速度更快。
本发明可以应用于军事领域,用于军队图像、视频的通信等,对边境突发情况、热点地区的监控等。本发明有利于建立我军自己的视频图像编码体系。
以下结合附图进一步说明本发明。


图1是本发明对运动图像之压缩模型示意图;图2是MPEG算法中的帧之示意图。
本发明提出运动图像新的压缩模型,即从运动图像的起始帧开始,以n幅为一组,先在时间轴上对图像作一个W-正交变换,形成一个新的n幅“图像”组(称为伪图像组),如图1所示。在伪图像组里面,“图像”的重要程度有一个自然排序,第一幅最重要,第二幅次之,…,最后一幅最次。由伪图像组的第一幅就能得到图像组的一个近似恢复,由伪图像组的头两幅就能得到图像组的一个更精确的近似恢复,当然,由全体伪图像就得到了原图像组的精确恢复。
运动图像的测试比较复杂,比较的指标也很多,完全公正的测试方法是很难找的。除了同样有压缩比和信噪比外,另一个重要指标是算法的采样延迟。在MPEG算法里,采样延迟实际上是9帧。在这9帧里,实际上只有两帧是原始帧(I帧),P帧是由两端的I帧内插而成,B帧是由I帧和P帧内插而成,如图2所示。
由于帧间的相关性很强,冗余度大,当处理的图像组里的图像多时,压缩比自然会提高,但采样延迟加大,实现算法时的缓存增加,加大了硬件成本。
在本发明的算法中,M=4时,是以4帧为一组分组的。这样,算法没有充分挖掘压缩比,但采样延迟减少了一半以上,硬件实现时缓存减少了一半以上,降低了硬件成本。即使如此,本发明的图像质量和压缩比不仅没有降低,反而双高,即在压缩比高于MPEG的同时,信噪比还远远高于MPEG的。以本发明人的采集的这一段视频为例。当压缩比为27倍时,本发明算法的平均峰值信噪比为41.40(Y),39.5(UV),而MPEG的只有31.3(Y),34.5(UV)。本发明的算法压缩到60倍时,峰值信噪比均下降2dB左右。
实际视觉质量相差没有这样大。这反映了MPEG算法的另一个特点,它不能对图像作高保真压缩。所以,在远程医疗诊断这类系统中,MPEG算法是不能用的,因为它里面的大部分图像有“人造成份”。而本发明提出帧间压缩处理算法能对图像作高保真压缩,有实用性。
权利要求
1.一种视频图像压缩编码法,该方法包括步骤(a)对运动图像按一定步长M分组,M为帧数;(b)对每组中的M帧图像进行正交变换,得到M帧新图像;(c)根据压缩比的要求和M帧新图像的不同重要性,进行目标比特分配;(d)对M帧新图像分别进行编码。
2.根据权利要求1所述的视频图像压缩编码法,其特征在于其中所述步骤(a)的M可取2、3、4、5、6、7、8中之任一数。
3.根据权利要求1所述的视频图像压缩编码法,其特征在于其中所述步骤(b)之正交变换,M=4时为Y1=12(X1+X2+X3+X4)]]>Y2=15(3X1+X2-X3-3X4)]]>Y3=12(X1-X2-X3+X4)]]>Y4=15(X1-3X2+3X3-X4)]]>其中的X1,X2,X3,X4为相邻的四幅图像,经变换后得到的图像Y1,Y2,Y3,Y4称为伪图像组。
4.根据权利要求1所述的视频图像压缩编码法,其特征在于其中所述步骤(b)之正交变换,M=5时为Y1=15(X1+X2+X3+X4+X5)]]>Y2=110(2X1+X2-X4-2X5)]]>Y3=114(2X1-X2-2X3-X4+2X5)]]>Y4=110(X1-2X2+2X4-X5)]]>Y5=170(X1-4X2+6X3-4X4+X5)]]>其中的X1,X2,X3,X4,X5,为相邻的四幅图像,经变换后得到的图像Y1,Y2,Y3,Y4,Y5称为伪图像组。
5.根据权利要求1所述的视频图像压缩编码法,其特征在于所述步骤(c)中之比特分配采用根据压缩比查经验表的方法确定。
全文摘要
一种用于运动图像(数字视频)数据压缩或解压缩的方法,利用W-正交变换对图像序列中连续的若干帧在时间轴上进行处理,消除帧间信息冗余。本发明包括以下步骤:对运动图像按一定步长M分组;对每组中的M帧图像进行W-正交变换,得到M帧新图像;根据压缩比的要求和M帧新图像的不同重要性,进行目标比特分配;对M帧新图像分别进行编码。本发明的帧间处理方法运算非常简单,可以软件实现实时压缩,用硬件实现则实现成本更低、运算速度更快。
文档编号H04N7/30GK1358030SQ0012672
公开日2002年7月10日 申请日期2000年12月5日 优先权日2000年12月5日
发明者王国秋 申请人:湖南中芯数字技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1