一种图像编码方法

文档序号:6436337阅读:271来源:国知局
专利名称:一种图像编码方法
技术领域
本发明属于计算机图像处理领域,提出了一种图像编码方法。
背景技术
数字图像处理过程中经常要产生包含图像数据的大型文件,而这些文件经常需要在用户和系统之间相互交换,这就要有一种有效的方法来存储和传递这些数字图像文件。因此,图像编解码的主要目的是在保证图像质量的同时,尽可能的减少图像占用的空间,从而方便存储或网络传输。具体来说,图像压缩(编码)可以分为无损压缩和有损压缩。无损压缩一般采用基于统计的方法,如哈夫曼编码等,它可以完整的重构原始图像,但是压缩率较低,往往不能达到人们的要求。有损压缩不能完整的重构原始图像,但它可以提供很高的压缩比率,而且能很好的保证图像的主观质量。它主要是利用了人的心理视觉冗余特性。研究表明,人眼感觉到的区域亮度不仅仅取决于该区域的反射光,还取决于其他一些因素。例如,在亮度不变的区域中同样可以感觉到亮度的变化(马赫带)。产生这种现象的原因是出于眼睛所有视觉信息感受到的灵敏度不同。在正常的视觉处理过程中各种信息的相对重要程度不同。那些不十分重要的信息称作心理视觉冗余。这些心理视觉冗余在不会削弱图像感知质量的情况下可以消除。变换编码是一种比较常见的有损编码方式,其中最重要也应用最广的是小波变换。所述的小波变换不直接在图像的空间域对图像进行处理,而是首先将该图像变换到频率域,利用高频系数和原始图像细节信息的对应关系,可以对不太重要的系数进行量化,这也是实现高压缩比的基本原理。有损压缩方法都会导致一定数量的视觉信息的丢失,可能会因此失去重要的信息,所以迫切需要一种可重复或可再生的对于丢失信息的性质和范围定量的方法。作为这种评估基础的两类准则分别是客观准则和主观准则,客观准则用恢复图像与原始图像的均方根误差来表示,而主观准则则是靠人主观判定恢复图像与原始图像的差别大小。传统的有损压缩方法没有考虑图像内容,如JPEG2000是一种通用的压缩方法,对图像的内容不进行分析,在实现高压缩比的情况下可能会丢失重要的视觉信息。在压缩率较高的情况下,图像的内容失真会很严重,这样用户就无法分辨图像的内容究竟是什么,这也是传统通用压缩方法都有的一个缺点。但如果把一部分相对不重要的背景系数所占的空间用来更好的记录感兴趣区域的系数,用户在整体压缩率很高的情况下依然能分辨出图像中最重要的区域,这也是本发明的出发点。

发明内容
本发明针对传统SPIHT方法没有考虑图像内容的局限性,对其进行了改进,提出了一种支持感兴趣区域编码的图像编码方法。本发明的图像编码方法,具体包括以下步骤步骤I :标定图片中的感兴趣区域,可以人工标记,也可以通过一些自动检测方法,如人脸识别Adaboost算法。步骤2 :对原图像进行小波变换,得到小波系数矩阵。步骤3 :计算感兴趣区域掩码,即找到感兴趣区域像素在变换后对应的小波系数。步骤4:对背景区域和感兴趣区域采用不同的量化标准进行量化,具体是通过对背景区域的系数进行右移位操作实现,使的感兴趣区域的系数处于更高的位平面上。步骤5 :采用阈值法对小波系数矩阵进行量化。步骤6 :对量化后的小波系数矩阵用改进的SPIHT方法进行编码。本发明的优点和积极效果在于(I)在本发明方法中加入了图像内容分析的步骤,具体是计算感兴趣区域掩码、设置不同的量化机制,使得对用户感兴趣的区域和背景区域达到不一样的压缩效果,既保证了高压缩率,又可以保证用户感兴趣区域的显示质量。(2)本发明方法中最终产生的编码位流自动按重要性进行排列,从区域性的角度看,感兴趣区域的码流在前面,背景区域的码流相对靠后。从整体位流来看,由于本发明方法是按照位平面进行编码,前面的码流代表较高的系数平面,后面的代表相对较低的系数平面,这样,码流按照系数的重要程度进行排序。此外,由于本发明方法从SPIHT继承来的渐进传输型,用户可以在任意点截断编码位流,在速率比较低的无线网传输或浏览图片时,这种方法会有很大的优势,因为最先解码的是图像中最重要的信息,这样用户可以很快得知整幅图像的内容,以决定是否需要继续图片的传输过程。(3)可以灵活控制感兴趣区域和背景区域的质量比,使显示质量和压缩比都能达到一种比较好的平衡,满足各种用户的需求。


图I为本发明的图像编码方法的整体步骤流程图;图2为本发明步骤六的流程图; 图3为SPIHT方法中的空间树结构;图4为示例图片一及其采用Adaboost方法进行自动人脸识别检测的结果;图5为示例图片二及其采用Adaboost方法进行自动人脸识别检测的结果;图6为示例图片三及其采用Adaboost方法进行自动人脸识别检测的结果;图7为示例图片四及其采用Adaboost方法进行自动人脸识别检测的结果;图8为示例图片一在压缩率分别为0. 4bpp和0. 6bpp下的SPIHT和MSP重构结果;图9为示例图片二在压缩率分别为0. 4bpp和0. 6bpp下的SPIHT和MSP重构结果;图10为示例图片三在压缩率分别为0. 4bpp和0. 6bpp下的SPIHT和MSP重构结果;图11为示例图片四在压缩率分别为0. 4bpp和0. 6bpp下的SPIHT和MSP重构结果;图12为示例图片一在不同压缩比下本发明方法与传统SPIHT的PSNR值对比图;图13为示例图片二在不同压缩比下本发明方法与传统SPIHT的PSNR值对比图14为示例图片三在不同压缩比下本发明方法与传统SPIHT的PSNR值对比图;图15为示例图片四在不同压缩比下本发明方法与传统SPIHT的PSNR值对比图; 图16为像素坐标(r,c)存在的9种状态的示意图。
具体实施例方式下面将结合附图和实例对本发明作进一步的详细说明。本发明提出的图像编码方法考虑了图像内容,并具有高压缩比,较好地显示质量以及渐进传输特性,这使得本发明方法能够适用于多种场合,尤其是随着智能手机的普及和移动互联网的不断发展,越来越多的家庭照片在不同的人之间分享和传递,而由于无线网络速度的限制,又必须要求图像具有高压缩比,但这样可能会影响图片的显示质量,给用户造成不好影响。如果采用本发明的方法,在保证高压缩比的同时,也能兼顾用户感兴趣区域的显示质量,可以比较好地解决这个问题。本发明中的图像编码方法基于小波变换,对变换后的系数进行编码,并在其中加入了人脸识别的技术手段,达到用户感兴趣区域和背景区域区别对待的效果,如图I所示,本发明图像编码方法具体实现步骤如下步骤I :标定图片中的感兴趣区域,可以人工标记,也可以通过一些自动检测方法,如以人脸区域作为感兴趣区域的图片可以用成熟的人脸识别方法进行自动检测,省去了人工标记的低效率操作。本发明实施例中采用现有技术中的Adaboost方法进行自动人脸识别,输入一张包含人脸的图片,输出人脸区域坐标,如图4-图7所示,为采用Adaboost方法进行自动人脸识别检测的结果,实验表明,采用的Adaboost方法识别率非常高,并且识别速度很快。步骤2:对原图像进行小波变换,得到小波系数矩阵。小波变换是继傅立叶(Fourier)变换后又一有效的视频分析方法,与Fourier变换相比,小波变换是一个时间和频域的局域变换,因而能有效地从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析(Multiscale Analysis),解决了 Fourier变换不能解决的许多困难问题(参考文献Ingrid Daubechies, Ten Lectures on Wavelets, Society forindustrial and Applied Mathematics, 1992, ISBN 0-89871-274-2)。对图像进行小波变换,可以将图像的高频系数信息和低频系数信息分离开来,由于低频系数代表图像中的大部分内容信息,相对比较重要,而高频系数代表的是一些细节信息,相对不太重要,这样就可以用很少的码流来记录高频系数信息,从而实现图像的压缩。步骤3 :确定感兴趣区域掩码,即找到感兴趣区域像素在变换后对应的小波系数。原则上,感兴趣区域可以是任意形状,根据原图像中的感兴趣区域轮廓,每一层小波变换后都能对应计算出原始感兴趣区域轮廓在经过小波变换得到的子图中对应的区域轮廓。但对于不规则的区域,需要记录感兴趣区域的完整轮廓信息,影响整体的压缩效率。所以,本发明采用规则的矩形区域作为感兴趣区域,如果感兴趣区域形状不是标准矩形,则将该区域扩大,选取包含该区域的一个外接矩形作为感兴趣区域。如图4-图7所示,实验部分以人脸作为感兴趣区域,虽然人脸的形状是不规则的,但可以选取一个矩形区域,使人脸区域包含在其中。
小波变换将图像分为四个频带的子图,分别包括低频信息、水平细节信息、垂直细节信息和对角线细节信息,虽然每一个子图都包含原图不同频域的信息,但从空间域看来,每一个子图都是原图的一个缩略图,这也为感兴趣区域掩码的计算提供了可能性。如图3所示,一幅图像经过n级小波分解后形成了 3n+l个子带,小波系数的分布特点是越往低频子带系数值越大,包含的图像信息越多,而越往高频子带系数值越小,包含的信息也越少。用LL (n)代表n层小波分解的低频子图,HL (I),HL (2),... HL (n)代表水平方向子图,LH(I),LH (2), LH (n)代表垂直方向子图,HH(I),HH (2), HH (n)代表对角方向子图。为了计算感兴趣区域掩码,需要找到感兴趣区域在各层子图中对应的区域,本发明实施例以矩形区域为例说明感兴趣区域掩码的确定,也可以将其扩展为圆形,椭圆,多边形等规则形状,根据图形结构对应计算其对应坐标即可。为记录矩形感兴趣区域,需要首先确定其在原图中的左上角点坐标(x,y)以及宽width和高height,只需记录4个值,相对于图像的大小可以忽略不计,因此不会影响到图 像的压缩率。图像经过小波分解后,被分成很多不同分辨率的子图像,利用矩形的性质可以计算出感兴趣区域对应的小波系数区域,下面分别讨论在各级子图中确立感兴趣区域的计算公式。在n层小波分解的低频子图LL (n)中,子图相当于原始图像n次抽样后的结果,其对应感兴趣区域的左上角点坐标及宽和高分别记为nLLx,nLLy,nLLWidth,nLLHeight,其他区域类似,由小波变换次数n可得
权利要求
1.一种图像编码方法,其特征在于,具体包括如下步骤 步骤一、标定图片中的感兴趣区域; 步骤二、对原图像进行小波变换,得到小波系数矩阵; 步骤三、找到感兴趣区域像素在变换后对应的小波系数; 步骤四、对背景区域的系数进行右移位操作,并对背景区域和感兴趣区域采用不同的量化标准进行量化,使感兴趣区域的系数处于更高的位平面上; 步骤五、采样阈值法对小波系数矩阵进行量化; 步骤六、对量化后的小波系数矩阵进行基于SPIHT方法的编码。
2.根据权利要求I所述的一种图像编解码方法,其特征在于,所述的步骤一具体通过人工标定图片中感兴趣区域,或者采用Adaboost算法进行自动人脸识别标定图片中感兴趣区域。
3.根据权利要求2所述的一种图像编码方法,其特征在于,所述感兴趣区域为规则的图形区域,如果标定的感兴趣区域的形状不是规则的图形区域,则将该标定的区域扩大,选取包含该标定的区域的一个外接规则图形区域作为感兴趣区域。
4.根据权利要求2所述的一种图像编码方法,其特征在于,所述感兴趣区域为矩形区域。
5.根据权利要求I所述的一种图像编码方法,其特征在于,所述的步骤三具体是 (1)首先确定感兴趣区域在原图中的左上角点坐标(X,y)以及宽width和高height ;所述感兴趣区域为矩形区域; (2)然后确定在n层小波分解的低频子图LL(n)中对应感兴趣区域的左上角点坐标(nLLx, nLLy)、宽 nLLWidth 和高 nLLHeight T T _ xy T T TTT. ,, width T T TT . , height nLLx— — ,nLLy— — ; nLLWidth= ~ ,nLLHeight= ~~ ; n层小波分解的水平方向子图HL(n)相对于LL(n)向右平移了 nLLWidth个像素,则在HL (n)中对应感兴趣区域的左上角点坐标(nHLx, nHLy)、宽nHLWidth和高nHLHeight为 nHLx= — +nLLWidth nHLy= — ; nHLWidth= “她 nHLHeight=匕邮扮 2n 2n 2n 2n n层小波分解的垂直方向子图LH(n)相对于LL (n)向下平移了 nLLHeight个像素,则在LH(n)中对应感兴趣区域的左上角点坐标(nLHx, nLHy)、宽nLHWidth和高nLHHeight为 nLHx=爹,nLHy= +nLLHeight ; nLHWidth= w^1 ^nLHHeight= n层小波分解的对角方向子图HH(n)相对于LL(n)向右平移了 nLLWidth个像素,向下平移了 nLLHeight个像素,则得到HH(n)子图中对应感兴趣区域的左上角点坐标(nHHx,nHHy)、宽 nHHWidth 和高 nHHHeight 为 nHHx=爹 +nLLWidth,nHHy= +nLLHeight ; nHHWidth= ,nHHHeight= 在得到感兴趣区域在变换后的小波系数子区域中对应的系数区域后,进一步可求得图像整体的感兴趣区域掩码。
6.根据权利要求I所述的一种图像编码方法,其特征在于,所述的步骤四中,对背景区域的系数进行右移两位处理。
7.根据权利要求I所述的一种图像编码方法,其特征在于,步骤五中所述的阈值法中,阈值设置为20。
8.根据权利要求I所述的一种图像编码方法,其特征在于,所述的步骤六具体包括如下步骤 步骤6. I :初始化首先初始化重要系数表LSP为空,将集合H中的所有元素添加到不重要系数表LIP中,并将属于H集合且有后代的元素添加到不重要子集表LIS中、且所添加的元素均为D类型,然后确定初始阈值2n,n根据下式确定n=[log2(maxrc{|crc|})_ 其中,r,c分别表示小波系数矩阵中的行号和列号,(^。代表小波系数矩阵中坐标位置为(r,c)的小波系数值,cr, J代表对(^。求绝对值;所述H集合是n层小波分解的低频子图LL(n)、水平方向子图HL(n)、垂直方向子图LH(n)和对角方向子图HH(n)中所有系数的坐标构成的集合,表LSP、表LIP和表LIS的每个表项都使用坐标(r,c)来表示,所述的D类型是指表项(r,c)的所有子孙的集合D (r,c); 步骤6. 2:排序扫描,具体是 步骤6. 2. I :扫描表LIP,对表LIP中的每个表项(r,0),得到一个511(1',c)的输出SnOut (r, c),如果SnOut (r, c) = I,则向排序位流Sn输出I和小波系数矩阵中位置坐标为Cr, c)的系数的符号位,0表示正,I表示负;如果Sn0ut(r, c) = 0,则向排序位流Sn输出·0 ;所述的Sn (r,c)根据函数Sn (X)的定义确定输出值,X代表节点元素的集合,函数Sn (X)定义如下若Max{|Cr,c|} >= 2n,则函数Sn⑴的输出SnOut(X) = I,否则,SnOut (X)=·0 ; 步骤6. 2. 2 :扫描表LIS,判断表LIS中的每个表项(r,c)是D型表项还是L型表项,所述的L型表项是指表项(r,c)的所有非直系子孙的集合L (r,c),设表项(r,c)的直接后代集合为 0 (r, c),则 0 (r, c) = {(2*r_l, 2*c_l), (2*r, 2*c_l), (2*r_l, 2*c), (2*r, 2*c)},L(r, c) = D(r, c)-0(r, c),; A、若表项(r,c)是D型表项,输出SnOut(D (r, c)),根据SnOut (D (r, c))的值进行如下操作 a、如果SnOut(D(r, c)) = I,则向排序位流Sn输出1,并对(r,c)的每个孩子(r0, c0),根据SnOut (r0, c0)的值来进行如下操作如果SnOut (r0, c0) = I,则向排序位流Sn输出I和小波系数矩阵坐标为(r0,c0)的系数的符号位,并将(r0,c0)添加到表LSP的队尾,如果SnOutCrO, c0) = 0,则向排序位流Sn输出0,将(r0, c0)添加到表LIP的队尾; 然后判断L (r,c)是否为空集,如L (r,c)为非空集,则将(r,c)作为L型表项添加到表LIS的尾部,如果L (r,c)为空集,则将D型表项(r,c)从表LIS中删除; b、如果SnOut(D (r, c)) = 0,则向排序位流Sn输出0 ; B、若表项(r,c)是L型表项,输出SnOut (L(r, c)):如果SnOut (L(r, c)) = I,则向排序位流Sn输出1,然后将(r,c)的4个孩子(r0,c0)作为D型表项依次添加到表LIS的队尾,并将L型表项(r,c)从表LIS中删除;如果SnOut (L(r,c)) = 0,则向排序位流Sn输出·0 ; 步骤6. 3 :精细扫描,具体是将上一级扫描后的表LSP记为LSP_01d,对于LSP_01d中的每一个元素(r,c),将系数Cr,c的绝对值转换为二进制表示Br,C,输出Br,c中对应于2n权位处的符号I或O到精细位流Rn ; 步骤6. 4更新阈值系数将阈值指数n减去1,判断得到的阈值指数n是否等于要求的精度值,若是,结束本方法,若否,返回步骤6. 2继续下一级编码扫描。
9.根据权利要求8所述的一种图像编码方法,其特征在于,步骤6. I中所述的表LSP、表LIP和表LIS采用顺序二维表结构进行存储,表的大小与存储原图像的数据大小相同。
全文摘要
本发明提出一种图像编码方法,应用于计算机图像处理领域。该方法首先通过标定图片中的感兴趣区域,对原图像进行小波变换,在小波系数矩阵中找到感兴趣区域像素在变换后对应的小波系数,然后对背景区域和感兴趣区域采用不同的量化标准进行量化,使感兴趣区域的系数处于更高的位平面上,最近对小波系数矩阵进行阈值量化,采用基于SPIHT方法进行编码。本发明方法既保证了高压缩率,又可以保证用户感兴趣区域的显示质量,在速率比较低的无线网传输或浏览图片时,能够是用户很快得知图像中最重要的信息。
文档编号G06T9/00GK102637302SQ20111032634
公开日2012年8月15日 申请日期2011年10月24日 优先权日2011年10月24日
发明者周成玉, 牛建伟, 童超 申请人:北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1