一种对屏幕内容的编码方法

文档序号：7978860阅读：498来源：国知局

专利名称：一种对屏幕内容的编码方法
技术领域：
本发明属于视频编码的技术领域,具体地涉及一种对屏幕内容(screen content) 的编码方法。
背景技术：
在已有的技术中，混合图像的编码(对screen content的编码方法)大致可以分为以下三类。I.基于图像编码的方法这种方法还是采用传统的编码框架来对混合图像进行编码，但是针对不同的区域采用不同的量化步长，对于包含文字和图表内容的块，编码后重建效果会非常模糊，所以量化这些块时减少量化步长，为其多分配比特，让其重建的质量尽可能好。但是对于固定的比特数，如果为文字和图表块多分配了比特，那么自然图像块所分配的比特数就会相应地减少，所以总体来说，这种方法仍不能达到很好的效果。2.基于分层编码的方法这种方法采用混合光栅模型来进行压缩。它将一幅图像或者一个图像块分为前景层、背景层和一个二进制算子的平面层。这个二进制算子的平面层表明图像或图像块的每个像素属于前景层还是背景层，并且这个二进制算子平面可以用JBIGCJoint Bi-Ievel Image Experts Group,联合二值图像专家组)标准或 JBIG2 (Joint Bi-level Image Experts Group2,联合二值图像专家组二代)标准进行压缩。而经过数据填充算法模糊后的前景层和背景层可以用传统的图像编码框架来进行压缩。论文“Compressing compound documents，，(The Document and Image Compression Handbook, M. Barni, Ed. New York Marcel-Dekker, 2005.)提出了这种方法,并通过实验证明这种方法与传统的编解码框架相比，可以取得很大的增益。但是这种方法有一些缺点首先增益在很大程度上取决于分割的算法，即如何将图像分为前景和背景。第二，分割出来的洞如果不经过任何处理会损害编码的效果。第三，分别编码背景层的文本颜色和二进制算子的文本形状也会降低编码的效率。所以这种方法仍不能满足应用的需要。3.基于块的编码方法这种方法可以分为两类一种是利用空域的性质，如直方图统计，梯度，颜色的数目等，可以将当前编码块分为几类中的一种，如文本，图表，自然图像等。然后不同的类别用不同的编码框架来进行压缩以适用于它们的统计特性。另一种是考虑到屏幕内容中的文字和图表的直方图较稀疏，将其在时域分解为基础颜色和索引表的形式，即Base color and Index map (BCIM)模式,如图I所示,其中“ I”、 “0，，、“253，，、“255，，表不四种颜色。论文“Enable efficient compound image compression in H. 264/AVC intra coding” (Proc. Int. Conf. Image Processing, Oct.2007, vol.2, PP. 337-340)首先将这种方法应用到了 H. 264标准中，并取得了不错的增益，但是编码效率
4还有待提闻。

发明内容
本发明的技术解决问题是克服现有技术的不足，提供一种编码效率更高的对 screen content的编码方法。本发明的技术解决方案是这种对屏幕内容screen content的编码方法，在时间域用若干个基础颜色和一个索引表来表示screen content的图像或图像块；其中索引表被拆解为一个匹配表和一个非匹配的索引表，匹配表中的每个元素表示索引表的元素是否与其预测索引相等，若不等，则将更新该索引的值并存储在非匹配的索引表中；预测索引通过两种方法产生一种是利用时间域的强相关性，将帧间运动估计后搜索到的图像块的索引表当作预测索引表；另一种是利用空间域的相关性，根据当前像素的周围像素的纹理方向，以像素级的预测索引作为预测索引。编码效率更高的原因由于屏幕内容screen content具有直方图分布稀疏的性质，所以用若干个基础颜色和一个索引表来表示具有屏幕内容的图像块是非常有效的。我们进而将索引表分解为匹配表和非匹配索引表。由于匹配表的布尔性，即每个元素只有 O和I两种值，来表示是否索引表中的索引与预测索引相等。当预测非常精确的时候，那么用于编码匹配表的码流的分布会很不均与，O和I的比例悬殊很大，这样的码流如果用 CABAC(Context-based Adaptive Binary Arithmetic Coding,基于上下文的二进制算术编码)进行编码，那么码率的减少幅度会很大。而编码非匹配索引表是一个小概率时间，它只发生在索引表的索引与预测索引不相等的时候，这时候由于排除了一种可能，为了保证连续性，会将一部分的值前移，这样的话，O出现的概率相对高一些。同样对CABAC适用，会减少码率。而且上述两种产生预测索引的方法利用了空间和时间的相关性，产生预测索引的精确性得到了保证，所以我们提出的方法可以大幅度改进屏幕内容的编码效率。

图I示出了现有的BCM模式；图2示出了根据本发明的screen content编码方法的流程图；图3是分解索引表的说明图；图4示出了如何根据时间域的相关性产生预测索引；图5示出了如何根据空间域的相关性产生预测索引；
图6示出了当前像素及其左，左上，上，右上位置的像素。
具体实施例方式这种对屏幕内容screen content的编码方法,在时间域用若干个基础颜色和一个索引表来表示screen content的图像或图像块；其中索引表被拆解为一个匹配表和一个非匹配的索引表，匹配表中的每个元素表示索引表的元素是否与其预测索引相等，若不等，则将更新该索引的值并存储在非匹配的索引表中(如图3所示)；预测索引通过两种方法产生一种是利用时间域的强相关性，将帧间运动估计后搜索到的图像块的索引表当作预测索引表；另一种是利用空间域的相关性，根据当前像素的周围像素的纹理方向，以像素级的预测索引作为预测索引。优选地，如图2所示，这种方法包括以下步骤(I)将每个编码单元CU按照四叉树形式分割为预测单元；(2)将每个预测单元按照四叉树形式分割为变换单元TU ；(3)对于当前TU有YUV3个分量，对于YUV的每个分量的每个进行步骤(4)-(12) 的处理(4)将TU内的像素进行动态规划聚类，获得具有代表性的N个值，N为大于O的整数，这N个值即是N个基础颜色，并按递增顺序排序；然后将当前TU中的每个像素根据欧式距离最近的原则映射到N个基础颜色中的一个，并获得一个索引来表明它映射至哪个基础颜色，并且计算每个TU的失真；(5)产生预测索引；(6)按照每个索引是否与其对应的预测索引相等的原则来产生匹配表；(7)对于那些与预测索引不相等的索引，更新索引，并存储在非匹配的索引表中；(8)计算编码基础颜色、匹配表和非匹配的索引表所产生的码率；(9)根据步骤(4)中产生的失真和步骤(8)产生的码率来计算率失真代价；(10)从I至4遍历N的值，固定N后重复步骤(2)-(9)，使步骤(9)中计算的率失真代价最小；(11)将选出的率失真代价最小的基础颜色的信息和匹配表及非匹配的索引表的信息传送至解码端；(12)解码端在获得相应的信息后，根据基础颜色和索引表来重建当前TU ；(13)重建 PU 和 CU。优选地，获得基础颜色的方法包括以下步骤(a)将当前图像中的像素排成序，统计并记录每个块中的像素值及其出现频率，并且将所有的具有不同值的像素排成一个按照值递增顺序排成区间X，且每个像素值的出现频率也形成一个区间Y，X和Y这两个区间的元素是一一对应的；(b)设定将块内的像素值分为N类，即要得到N个基础颜色，N为大于O的整数β (lowBound, UpBound, N)代表 LowBound 至 UpBound 区间内的兀素分配到 N 个类中所产生的失真，β (lowBound, UpBound, N) = a (LowBound, p-l) + β (p, UpBound, N_l) N ^ 2a (LowBound, UpBound)N=I如果N彡2，P点通过下式求得P = arS min (a(LowBound, ρ-\) + β{ρ, UpBound, N -V)
lowBound <Ρ〈UpBound-N +\
p-ia(Low Bound，p-l) = ^ (X - avg(LowBound，p -1))2 x Yi
i=LowBound
权利要求
1.一种对屏幕内容screen content的编码方法,其特征在于在时间域用若干个基础颜色和一个索引表来表示screen content的图像或图像块；其中索引表被拆解为一个匹配表和一个非匹配的索引表，匹配表中的每个元素表示索引表的元素是否与其预测索引相等，若不等，则将更新该索引的值并存储在非匹配的索引表中；预测索引通过两种方法产生一种是利用时间域的强相关性，将帧间运动估计后搜索到的图像块的索引表当作预测索引表；另一种是利用空间域的相关性，根据当前像素的周围像素的纹理方向，以像素级的预测索引作为预测索引。
2.根据权利要求I所述的方法，其特征在于包括以下步骤(1)将每个编码单元CU按照四叉树形式分割为预测单元；(2)将每个预测单元按照四叉树形式分割为变换单元TU；(3)对于当前TU有YUV3个分量，对于YUV分量的每个分量进行步骤(4)-(12)的处理(4)将TU内的像素进行动态规划聚类，获得具有代表性的N个值，N为大于O的整数，这N个值即是N个基础颜色，并按递增顺序排序；然后将当前TU中的每个像素根据欧式距离最近的原则映射到N个基础颜色中的一个，并获得一个索引来表明它映射至哪个基础颜色，并且计算每个TU的失真；(5)产生预测索引；(6)按照每个索引是否与其对应的预测索引相等的原则来产生匹配表；(7)对于那些与预测索引不相等的索引，更新索引，并存储在非匹配的索引表中；(8)计算编码基础颜色、匹配表和非匹配的索引表所产生的码率；(9)根据步骤(4)中产生的失真和步骤(8)产生的码率来计算率失真代价；(10)从I至4遍历N的值，固定N后重复步骤(2)-(9)，使步骤(9)中计算的率失真代价最小；(11)将选出的率失真代价最小的基础颜色的信息和匹配表及非匹配的索引表的信息传送至解码端；(12)解码端在获得相应的信息后，根据基础颜色和索引表来重建当前TU；(13)重建PU和CU。
3.根据权利要求I所述的方法，其特征在于获得基础颜色的方法包括以下步骤(a)将当前图像中的像素排成序，统计并记录每个块中的像素值及其出现频率，并且将所有的具有不同值的像素排成一个按照值递增顺序排成区间X，且每个像素值的出现频率也形成一个区间Y，X和Y这两个区间的元素是一一对应的；(b)设定将块内的像素值分为N类，即所求得N个基础颜色，N为大于O的整数β (lowBound, UpBound, N)代表LowBound至UpBound区间内的兀素分配到N个类中所产生的失真，β (lowBound, UpBound, N) = a (LowBound, p-1) + β (p, UpBound, N_l) N ^ 2a (LowBound, UpBound)N=I如果N彡2，P点通过下式求得P = arg min (a(Low Bound, ρ-\) + β(ρ, UpBound，N-X)lowBound<P<UpBound-N+\
全文摘要
公开了一种编码效率更高的对屏幕内容screen content的编码方法，在时间域用若干个基础颜色和一个索引表来表示screen content(屏幕内容)的图像或图像块；其中索引表被拆解为一个匹配表和一个非匹配的索引表，匹配表中的每个元素表示索引表的元素是否与其预测索引相等，若不等，则将更新该索引的值并存储在非匹配的索引表中；预测索引通过两种方法产生一种是利用时间域的强相关性，将帧间运动估计后搜索到的图像块的索引表当作预测索引表；另一种是利用空间域的相关性，根据当前像素的周围像素的纹理方向，以像素级的预测索引作为预测索引。
文档编号H04N7/26GK102611888SQ201110369669
公开日2012年7月25日申请日期2011年11月18日优先权日2011年11月18日
发明者丁文鹏, 尹宝才, 施云慧, 朱维佳申请人:北京工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：丁文鹏;尹宝才;朱维佳;施云慧
技术所有人：北京工业大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。