使用自适应几何划分进行视频编码和解码的方法及装置的制作方法

文档序号:7669158阅读:157来源:国知局
专利名称:使用自适应几何划分进行视频编码和解码的方法及装置的制作方法
技术领域
本原理一般地涉及视频编码和解码,并且更具体地涉及使用自适应几何划分 (geometric partition)进行视频编码和解码的方法及装置。
背景技术
帧划分是有效的视频编码中至关重要的处理。大多数当前的视频压缩技术使用基于树的帧划分。一种示例的当前视频压缩技术涉及国际标准化组织/国际电工委员会 (IS0/IEC)运动画面专家组-4(MPEG-4)第10部分高级视频编码(AVC)标准/国际电信联盟电信分部(ITU-T)H. 264推荐(下文中“MPEG-4AVC标准”)。MPEG-4AVC标准中的帧划分比简单的均勻(uniform)块划分更有效,所述均勻块划分典型地被用于诸如MPEG-2的更老的视频编码标准中。然而,基于树的帧划分仍没有足够有效地编码视频信息,这是因为其不能捕捉二维(2D)数据的几何结构。尽管已经提出几何自适应的块划分来改进编码效率,但是其以复杂度为代价来改进编码效率。为了获得改进的性能,第一种现有技术方案支持基于每个距离和角度的所有划分模式。在该第一种现有技术方案中,使用用于对块进行划分的简单的自适应模型。更具体地,使用直线模型来适应角度和位置,以便捕捉可预测区域的局部几何统计依赖性。通过发送两个索引来执行线编码。这两个索引中的每一个对应于到该块的中心的角度和距离的值。距离Δ ρ和角度Δ θ的量化步骤可以被固定在高级语法上,以便在被耗费用于编码该划分的比特方面具有最佳的率失真(R-D)折衷(同样,如果需要,对最大允许的计算复杂度的控制)。第二种现有技术方案试图通过将角度Δ θ限制为垂直、水平或斜线(diagonal) (+45度或-45度)定向来降低划分模式复杂度。然而,与第一种现有技术方案相比,这降级了性能。为了解决这样的局限性,第一种现有技术方案提出了一种通过考虑2D视频数据的2D几何来更好地表现并编码该2D视频数据的方法。也就是说,第一种现有技术方案对于帧间预测(INTER 16X16GE0, INTER 8X8GE0)和帧内预测(INTRA 16X16GE0, INTRA 8X8GE0)两者的一组新模式使用楔形划分(即,由任意线或曲线分离的两个区域中的块的划分)。通过线的隐式来建模块内的几何划分。这里,划分被如下地定义f (x, y) = χ cos θ +ysin θ -ρ其中,ρ和θ分别表示沿着到f (x,y)的正交方向从原点到边界线f(x,y)的距离;以及到f (X,y)的正交方向与水平坐标轴X的角度。
将每个块像素(X,y)分类,使得
权利要求
1.一种装置,包括编码器(100),用于使用自适应几何划分对画面中区域的画面数据进行编码,其中,响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分的子集,所述距离是从该区域内的点到划分边界测量的,所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。
2.一种视频编码器中的方法,包括使用自适应几何划分对画面中区域的画面数据进行编码(430,615,620,625),其中,响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分的子集,所述距离是从该区域内的点到划分边界测量的,所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。
3.如权利要求2所述的方法,其中,所述区域内的所述点是所述区域的中心,以及响应于从所述区域的中心到划分边界的距离来确定所述几何划分的子集(810)。
4.如权利要求3所述的方法,其中,使用距离步长和角度步长来对自适应几何划分的距离空间和角度空间进行采样以便构造几何划分字典,所述距离步长和角度步长是从所述点到所述划分边界的距离的函数,所述几何划分的子集具有比所述几何划分字典少的几何划分(810)。
5.如权利要求3所述的方法,其中,所述几何划分的子集包括从所述点到所述划分边界的距离等于或小于阈值距离的几何划分。
6.如权利要求2所述的方法,其中,所述几何划分的子集基于所述区域和所述画面中先前编码的其它区域中的至少一个的先前编码信息(910)。
7.如权利要求6所述的方法,其中,所述几何划分的子集基于为所述先前编码的其它区域选择的划分(910)。
8.如权利要求7所述的方法,其中,为所述区域选择的划分被外插以便预测用于随后区域的划分,并且用于编码所述随后区域的几何划分的子集基于所预测的用于所述随后区域的划分(910)。
9.如权利要求6所述的方法,其中,所述几何划分的子集是基于为所述先前编码的其它区域选择的划分的统计而导出的(910)。
10.如权利要求9所述的方法,其中,所述画面被包含在视频序列中,使用与强力划分计算方案相对应的默认的几何划分字典来编码所述视频序列中每一个不具有所述区域的一组画面,为该组画面选择的划分的统计被用来构造用于所述区域的几何划分的子集,所述子集具有比默认字典少的几何划分。
11.如权利要求2所述的方法,其中,对于所述自适应几何划分可用的所述几何划分的子集是用户定义的并且在作为结果的比特流中被显式地发信号通知(1010,1115)。
12.如权利要求2所述的方法,其中,所述子集是多个子集之一,其中,所述子集以及所述多个子集一起表示小于所有可能划分,所述多个子集是预先存储的,并且其中所述方法还包括使用一个或多个高级语法元素向解码器发送索引,所述索引指示要用于解码的多个子集中的特定一个或多个子集(1010,1115)。
13.如权利要求2所述的方法,还包括,在至解码器的比特流中传送要供解码器在解码至少所述区域的画面数据时使用的所述几何划分的子集(1010,1110,1115)。
14.如权利要求2所述的方法,其中,所述编码步骤包括基于率失真准则,从默认几何划分字典中选择用于所述区域的划分;以及执行几何运动补偿以便获得所述区域的残差,以及重构所述残差,使得在解码器处仅仅能够从所述残差的随后重构中推断出从默认几何划分字典中的多个可用划分中选择的划分(1215)。
15.一种装置,包括解码器(200),用于使用自适应几何划分对画面中区域的画面数据进行解码,其中,响应于距离和角度中的至少一个来确定被用来解码该区域的画面数据的几何划分的子集,所述距离是从该区域内的点到划分边界测量的,所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。
16.一种视频解码器中的方法,包括使用自适应几何划分对画面中区域的画面数据进行解码(720),其中,响应于距离和角度中的至少一个来确定被用来解码该区域的画面数据的几何划分的子集,所述距离是从该区域内的点到划分边界测量的,所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。
17.如权利要求16所述的方法,其中,所述区域内的所述点是所述区域的中心,以及响应于从所述区域的中心到所述划分边界的距离来确定所述几何划分的子集(1310)。
18.如权利要求17所述的方法,其中,使用距离步长和角度步长来对自适应几何划分的距离空间和角度空间进行采样以便构造几何划分字典,所述距离步长和角度步长是从所述点到所述划分边界的距离的函数,所述几何划分的子集具有比所述几何划分字典少的几何划分(1310)。
19.如权利要求17所述的方法,其中,所述几何划分的子集包括从所述点到所述划分边界的距离等于或小于阈值距离的几何划分。
20.如权利要求16所述的方法,其中,所述几何划分的子集基于所述区域和所述画面中先前解码的其它区域中的至少一个的先前解码信息(1410)。
21.如权利要求16所述的方法,其中,所述子集是多个子集之一,其中,所述子集以及所述多个子集一起表示小于所有可能划分,所述多个子集是预先存储的,并且其中所述方法还包括在一个或多个高级语法元素中接收索引,所述索引指示要用于解码的多个子集中的特定一个或多个子集(1610)。
22.如权利要求16所述的方法,在来自编码器的比特流中接收所述几何划分的子集以用于解码至少所述区域的画面数据(1510)。
23.如权利要求16所述的方法,其中,所述解码步骤包括在比特流中接收残差,所述残差是通过以下操作先前形成的基于率失真准则从默认几何划分字典中选择用于所述区域的划分,执行几何运动补偿以便获得所述区域的残差, 以及重构所述残差,使得在解码器处从所述残差的随后重构中仅仅能够推断出从默认几何划分字典中的多个可用划分中选择的划分(1715)。
24.一种在其上编码有视频信号数据的非暂时存储介质,包括使用自适应几何划分编码的画面中区域的画面数据,其中,响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分的子集,所述距离是从该区域内的点到划分边界测量的,所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。
全文摘要
提供了使用自适应几何划分进行视频编码和解码的方法和装置。装置包括编码器(100),使用自适应几何划分对画面中区域的画面数据进行编码,其中,响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分子集,所述距离是从该区域内的所定义的点到划分边界测量的。所述角度是相对于从该区域内的所定义的点到所述划分边界延伸的至少一条线而测量的。
文档编号H04N7/26GK102484706SQ201080037885
公开日2012年5月30日 申请日期2010年6月25日 优先权日2009年6月26日
发明者J.索尔, 吕小安, 尹鹏, 许茜, 郑云飞, 郭力伟 申请人:汤姆森特许公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1