视频编码中基于非均匀像素截断的运动估计方法

文档序号：7555764阅读：310来源：国知局

专利名称：视频编码中基于非均匀像素截断的运动估计方法
技术领域：
本发明属于视频编码领域，具体涉及一种基于非均匀像素截断的运动估计方法。
背景技术：
视频是指由一系列时间上相关的图片组成的。其中每一幅图像称为一巾贞，每一中贞又分为若干个像素组，通常像素组的大小为正方形或长方形，像素组的大小也可以是其他任意形状，组成像素组的基本单位是像素，其中，整像素是指构成图像的点，是构成图像的
最小单元。亚像素是通过插值得到的,亚像素可以进一步分为1/2像素和1/4像素等，如

图1所示，正方形表示的1/2像素是由它周围圆形的整像素进行插值得到的，菱形表示的1/4像素是由它周围的圆形整像素和正方形1/2像素进行插值得到的。视频编码是指在保证一定的视频图像质量的前提下，有效的减少表达视频信息所需数据量的技术，它是以视频信号之间的冗余和人的心理视觉冗余为出发点，通过恰当的编码方式，来消除这些冗余。传统的视频编码技术如ITU制定的H.263，H.264/AVC标准以及ISO的MPEG组织制定的MPEG-1，MPEG-2，MPEG-4标准，中国制定的AVS标准等都是建立在混合编码框架之上的。上述视频编码方法如图2所示，包括运动估计和运动补偿，变换/量化，反量化/反变换，帧内预测，环路滤波，其中帧间预测中的运动估计和运动补偿是消除时间上的冗余，帧内预测是消除空间上的冗余，变换和量化是消除人眼视觉的冗余，环路滤波是用于提高视频质量，熵编码是消除统计冗余。帧间预测是指利用时间域的相关性，来达到图像压缩的目的，帧间预测是由运动估计和运动补偿组成的。运动补偿是指根据由运动估计输出的运动信息，在参考图像中提取与当前编码像素组对应的信息，其中当前编码像素组是指由待编码图像中的像素组组成的。运动估计根据像素在时间域的相关性，由已编码的相邻图像作为参考图像，对于当前编码像素组，根据一定的匹配度准则在参考图像中搜索最佳匹配像素组，搜索是对搜索窗内的候选点进行的，该搜索窗定义在参考图像中，范围从相对于当前编码像素组的位置，左移Hx，右移Hx，上移Vy，下移Vy所覆盖的所有候选点，Hx, Vy构成矩形搜索窗(2HX+1) X(2Vy+l)，如果Hx=Vy=W,也叫搜索窗土W，搜索窗也称为运动估计区域，搜索窗可以是矩形区域或非矩形区域；每一个候选的匹配像素组，即搜索像素组，有一个用来标注该像素组在搜索窗中位置的像素点，这个像素点叫做搜索窗中的候选点。上述的匹配度准则可以有多种定义，公式(I)定义的当前编码像素组与候选点对应的搜索像素组的绝对残差和是衡量匹配度准则的重要组成部分，某些情况，绝对残差和会直接作为匹配度，绝对残差和的值越小表明匹配度越高，选取匹配度最高的候选点作为最优点，最优点也可以是多个最优匹配点，即根据匹配运算结果，选出多个最优点。候选点到相对于当前编码像素组位置的偏移为运动矢量。
权利要求
1.一种视频编码中基于非均匀像素截断的运动估计方法，其特征在于，该方法包括以下步骤: 1)在视频编码参考图像中对当前编码像素组对应的运动估计区域进行划分，将运动估计区域划分为多个运动估计子区域；利用所述的多个运动估计子区域，确定多个子区域中的候选点对应的搜索像素组中的像素截断位数，并且至少有两个不同运动估计子区域中的候选点对应的搜索像素组中的像素截断位数是不同的； 2)对各个运动估计子区域的候选点对应的搜索像素组中的像素进行像素截断，同时对当前编码像素组中的像素进行像素截断，再对各个运动估计子区域的候选点进行运动估计，计算各个子区域中的候选点对应搜索像素组的匹配度，得到多个运动估计子区域最优点以及最优点对应的运动矢量； 3)按照预定的判断准则从步骤2)中得到的多个运动估计子区域最优点中选出一个或多个作为全域最优点，根据当前编码像素组位置和全域最优点的对应关系，计算得到全域最优运动矢量，把全域运动矢量传递给后续的编码计算单元。
2.如权利要求1所述方法，其特征在于，所述步骤I)对当前编码像素组对应的运动估计区域进行划分，将运动估计区域划分为多个运动估计子区域是: 将运动估计区域划分为多个重叠或不重叠的运动估计子区域，子区域的个数大于等于二，划分的运动估计子区域是运动估计区域的子集，所有子区域的并集覆盖整个运动估计区域。
3.如权利要求1所述方法，其特征在于，所述步骤I)的运动估计子区域是由单个或者多个候选点组成的，子区域是连通的或是不连通的。
4.如权利要求1所述方法，其特征在于，所述步骤2)的计算各个子区域中的候选点对应搜索像素组的匹配度的确定采用主流视频编码标准中对运动估计过程的匹配度的计算方法，该方法用代价函数cost来衡量，代价函数cost表示为:cost = SAD+λ Bitsmv 上式中的λ是调节因子，Bitsmv是编码运动矢量所需的比特数，SAD为绝对残差和，绝对残差和SAD的计算如式(3)所示:
5.如权利要求1所述方法，其特征在于，所述步骤2)的得到多个运动估计子区域最优点是指:选取运动估计子区域中匹配度最高的一个作为该运动估计子区域最优点，或者按照匹配度从高到低的顺序，选取前多个候选点作为该运动估计子区域最优点。
6.如权利要求1所述方法，其特征在于，所述步骤3)的预定的判断准则采用非像素截断判断准则，具体为: 由常规的匹配度准则确定选取全域最优点，选取匹配度最高的一个作为全域最优点，或者按照匹配度从高到低的顺序，选取前多个候选点作为全域最优点。
7.如权利要求1所述方法，其特征在于，所述步骤3)的预定的判断准则为阈值判断准贝1J，具体为: 根据多个运动估计子区域的候选点进行运动估计过程中得到的多个运动估计子区域最优点对应的匹配度，与设定的阈值进行判断，选择一个或多个全域最优点，像素截断的位数越大选择的阈值就越大。
全文摘要
本发明公开了一种视频编码中基于非均匀像素截断的运动估计方法，属于视频编码领域。该方法包括把运动估计区域划分为多个运动估计子区域；确定多个子区域中的候选点对应的搜索像素组中的像素截断位数，并且至少有两个不同运动估计子区域中的候选点对应的搜索像素组中的像素截断位数是不同的；分别对多个子区域中的候选点进行运动估计，选出多个子区域中的最优点；从各个子区域的最优点集合中选出全域最优点。本发明有效的减少了运动估计的计算量，降低了运动估计的功耗，有利于降低视频编码的整体功耗，适用于移动设备的视频通信领域。
文档编号H04N7/26GK103237220SQ20131015686
公开日2013年8月7日申请日期2013年4月29日优先权日2013年4月29日
发明者余全合, 荣耀程, 安达, 佟欣, 何芸申请人:清华大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：余全合;荣耀程;安达;佟欣;何芸
技术所有人：清华大学
我是此专利的发明人

上一篇：一种文件下载的方法、装置及系统的制作方法
上一篇：一种实现用户上网认证鉴权和报文标签的系统及其方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。