数据编码和解码的制作方法

文档序号:11852807阅读:300来源:国知局
数据编码和解码的制作方法与工艺

本申请要求于2014年3月28日在英国知识产权局提交的GB1405649.3的在先提交日的权益,通过引证将其全部内容结合于本文中。

技术领域

本公开涉及数据编码及解码。



背景技术:

本文中提供的“背景”描述用于整体呈现本公开的上下文的目的。就其描述程度而言,描述在背景技术部分的、目前署名的发明人的工作以及申请时未另限定为现有技术资格的说明方面,既没有明确地也没有隐含地承认作为与本发明的相对的现有技术。

存在若干种视频数据压缩和解压缩系统,其涉及将视频数据变换成频域表示,量化频域系数,并且将熵编码的一些形式应用到量化系数。

已知的是,所谓的“屏幕内容”序列(涉及未通过照相机捕获的图像材料,例如,计算机生成的图像材料)的特征在于锐缘特征,该锐缘特征通常散布有完全平坦的样本值(即,整个这样的区域具有相同样本值的样本值)的区域。这就是为什么当编码这些序列时,诸如块内复制的工具是有效的。

然而,这些特征不仅空间上存在于图像内,而且也在时间上跨越多个图像而存在。另外,屏幕内容序列特征在于大量单帧过渡,该单帧过渡散布有同一帧的长周期。

由于该原因,间预测编码已被示出为对于屏幕内容序列时限极高压缩比(在一些示例性情况中,几百比一)。然而,在用于编码解码器(编码器-解码器)实现过程的计算复杂性上,间预测表现出大量成本。



技术实现要素:

本公开提供根据权利要求1所述的数据编码方法。

在所附权利要求中限定进一步相应方面及特征。

应理解,之前的一般性描述及之后的详细描述为示例性的,而非限制本公开。

附图说明

当结合附图考虑时,通过参照以下实施方式的详细描述,对本公开的更全面的理解及其很多伴随优点将容易获得并将会变得更好理解,其中:

图1示意性示出使用视频数据压缩及解压缩的音频/视频(A/V)数据传输及接收系统;

图2示意性示出使用视频数据解压缩的视频显示系统;

图3示意性示出使用视频数据压缩及解压缩的音频/视频存储系统;

图4示意性示出使用视频数据压缩的摄像机;

图5提供视频数据压缩及解压缩设备的示意图;

图6示意性示出预测图像的生成;如果

图7示意性示出块内复制处理;

图8示意性示出图像间预测处理;

图9是示出在编码器侧处的标记的使用的示意性流程图;

图10是示出在解码器侧处的标记的使用的示意性流程图;

图11示意性示出约束间标记;以及

图12至图15是示出涉及约束图像间编码处理的示例性技术的示意性流程图。

具体实施方式

现在参考附图,图1至图4被提供以给出利用将在下文中结合实施方式描述的压缩和/或解压缩设备的设备或系统的示意性图示。

下面将要描述的所有数据压缩和/或解压缩设备可以以硬件、运行在诸如通用计算机、如专用集成电路(ASIC)或现场可编程门阵列(FPGA)或者其组合的可编程硬件的通用数据处理设备上的软件实现。在由软件和/或固件实现实施方式的情况下,将理解,这样的软件和/或固件以及通过其存储或者以另外方式提供的这样的软件和/或固件的非易失性机器可读数据存储介质被视为实施方式。

图1示意性示出使用视频数据压缩及解压缩的音频/视频数据传输及接收系统。

输入音频/视频信号10被提供至视频数据压缩设备20,该视频数据压缩设备至少压缩音频/视频信号10的视频分量以用于沿着诸如缆线、光纤、无线链路等的传输路线30进行传输。已压缩信号由解压缩设备40处理以提供输出音频/视频信号50。针对返回路径,压缩设备60压缩音频/视频信号以用于沿着传输路线30传输至解压缩设备70。

压缩设备20和解压缩设备70可因此形成传输链路的一个节点。解压缩设备40和压缩设备60可形成传输链路的另一节点。当然,在传输链路为单向的情况下,仅一个节点需要压缩设备,并且另一节点仅需要解压缩设备。

图2示意性示出使用视频数据解压缩的视频显示系统。特别地,已压缩音频/视频信号100由解压缩设备110处理以提供可显示在显示器120上的解压缩信号。解压缩设备110可实施为显示器120的不可缺少的部分,例如与显示装置设置在相同的外壳内。可选地,解压缩设备110可设置为(例如)所谓的机顶盒(STB),注意,表述“机顶”并非暗示机盒需位于相对于显示器120的任何特定方位或位置中;其仅是在本技术中所使用的表示作为外围设备的可连接至显示器的装置的术语。

图3示意性示出使用视频数据压缩及解压缩的音频/视频存储系统。输入音频/视频信号130被提供至压缩设备140,该压缩设备产生用于由存储装置150(诸如磁盘装置、光盘装置、磁带装置、固态存储装置(诸如半导体存储器或其他存储装置))存储的压缩信号。为了播放,压缩数据从存储装置150读取并被传送至解压缩设备160用于解压缩以提供输出音频/视频信号170。

将理解的是,压缩的或编码的信号以及存储该信号的存储介质或数据载体被视为实施方式。具体地,本公开的实施方式包括编码数据(其被划分为数据部分)的分布的情况,该编码数据包括表示约束图像间预测模式的标记,相比较于图像间预测模式,在约束图像间预测模式中,候选块位置的数量以及候选基准图像的数量中的一者或者两者减少。

图4示意性示出使用视频数据压缩的摄像机。在图4中,诸如电荷耦合装置(CCD)图像传感器及相关的控制和读出电子设备等的图像捕获装置180生成被传送至压缩设备190的视频信号。麦克风(或多个麦克风)200生成被传送压缩设备190的音频信号。压缩设备190生成将被存储和/或传输(通常示出为示意性阶段220)的压缩音频/视频信号210。

下面描述的技术主要涉及视频数据压缩。将理解,许多现有技术可结合将被描述的视频数据压缩技术而被用于音频数据压缩,以生成已压缩音频/视频信号。因此,将不提供音频数据压缩的单独讨论。也将理解,与视频数据(特别是广播质量视频数据)相关的数据率通常极高于与音频数据(无论是已压缩还是未压缩)相关的数据率。因此,将理解,未压缩音频数据可伴随压缩视频数据以形成压缩音频/视频信号。将进一步理解,虽然目前实例(图1至图4中所示出的)涉及音频/视频数据,但以下将描述的技术可发现在仅处理(亦即,压缩、解压缩、存储、显示和/或传输)视频数据的系统中的应用。换言之,实施方式可应用于视频数据压缩而不一定具有任何相关的音频数据处置。

图5提供视频数据压缩及解压缩设备的示意图。设备在控制器345的控制下操作。

输入视频信号300的连续图像被提供至相加器310及图像预测器320。以下将参考图6更详细地描述图像预测器320。相加器310事实上执行相减(负相加)操作,因为它在“+”输入上接收输入视频信号300并且在“-”输入上接收图像预测器320的输出,使得从输入图像减去预测图像。结果是生成表示实际图像与投影图像之间的差异的所谓残差图像信号(residual image signal)330。

为何生成残差图像信号的一个原因如下。将要描述的数据编码技术(就是说,将要应用于残差图像信号的技术)在待编码的图像中存在较少“能量”时,趋向于更有效地工作。此处,术语“有效地”指少量编码数据的生成;对于特定的图像质量水平,期望(并被视为“有效地”)实际上生成尽可能少的数据。对残差图像中的“能量”的引用涉及包含在残差图像中的信息量。如果预测图像将与真正图像完全相同,则两者之间的差异(亦即,残差图像)将含有零信息(零能量)且将极易于编码为少量编码数据。通常,如果可使预测处理合理良好地工作,则预期残差图像数据将含有较输入图像更少的信息(较少能量)而因此将较易于编码为少量编码数据。

残差图像信号330被提供至变换单元340,该变换单元生成残差图像数据的离散余弦变换(DCT)表示。DCT技术本身是众所周知的,并且此处将不进行详细描述。然而,存在将在下文中被更详细描述的用在本设备中的技术的方面,特别是涉及应用DCT操作的数据的不同块的选择。

应注意,在一些实施方式中,使用离散正弦变换(DST)代替DCT。在其他实施方式中,可不使用变换。这可选择性地进行,使得实际上,例如在“变换跳过”命令或模式的控制下,转换阶段被绕开。

变换单元340的输出(亦即,用于图像数据的每个变换块的一组变换系数)被供应至量化器350。各种量化技术在视频数据压缩的领域中是已知的,在量化参数的控制下,各种量化技术的范围涵盖从藉由量化标度因子的简单相乘直至复杂查找表的应用。一般目标是两个。首先,量化处理序减少变换数据的可能值的数目。其次,量化处理可增加变换数据的值为零的可能性。这两者可使得熵编码处理在生成少量的压缩视频数据中工作地更有效。

由扫描单元360施加数据扫描处理。扫描处理的目的是重新排列量化的变换数据以收集尽可能多的非零量化的变换系数,并且当然因而收集尽可能多的零值系数。这些特征可容许有效率地应用所谓的运行长度编码或类似技术。因此,扫描处理涉及从量化的变换数据中(并且特别地,从与根据“扫描顺序”而被变换并量化的图像数据的块对应的系数的块中)选择系数,使得(a)所有系数作为扫描的部分而被选择一次;以及(b)扫描趋向于提供所期望的重新排列。能够趋向于给出有用结果的一个示例性扫描顺序是所谓的Z字形扫描顺序。

扫描系数然后被传送至熵编码器(EE)370。再次地,可使用各种类型的熵编码。两个实例是所谓的CABAC(背景适应二进制算术编码)系统的变形及所谓的CAVLC(背景适应可变长度编码)系统的变形。一般而言,CABAC被认为提供较好效率,且在某些研究中相比较于CAVLC已经示出为提供用于相当图像质量的编码输出数据的量的10-20%的减少。然而,CAVLC被认为相较于CABAC表现出更低级别的复杂度(就其实现方式)。

注意,扫描处理及熵编码处理被示出为分离的处理,但事实上它们可被结合或一起处理。即,数据读入熵编码器中可以以扫描顺序发生。对应的考虑应用至相应的逆处理。

熵编码器370的输出,连同(以上提及/或以下讨论的)额外数据(例如,限定预测器320生成预测图像的方式)提供压缩的输出视频信号380。

然而,也提供返回路径,因为预测器320本身的操作取决于压缩输出数据的解压缩版本。

该特征的原因如下。在解压缩处理的适当阶段中,生成残差数据的解压缩版本。该解压缩的残差数据需被加至预测图像以生成输出图像(因为原始残差数据是输入图像与预测图像之间的差)。为了使该程序如在压缩侧与解压缩侧之间是可比较的,由预测器320生成的预测图像应在压缩处理期间及解压缩处理期间应该是相同的。当然,在解压缩时,设备对于原始输入图像不具有访问权,而仅对于解压缩的图像有。因此,在压缩时,预测器320以压缩图像的解压缩版本为其预测(至少,针对图像间编码)的基础。

由熵编码器370执行的熵编码处理被认为是“无损的”,也就是说其可被反转以精确地得到与其被首先供应至熵编码器370的相同的数据。因此,返回路径在熵编码阶段之前被实施。的确,由扫描单元360执行的扫描处理也被认为是无损的,但在本实施方式中,返回路径390从量化器350的输出至互补反向量化器420的输入。

一般而言,熵解码器410、反向扫描单元400、反向量化器420及反向变换单元430提供熵编码器370、扫描单元360、量化器350及变换单元340的相应的反向功能。现在,将继续压缩处理的讨论;以下将单独讨论对输入的压缩视频信号进行解压缩的处理。

在压缩处理中,扫描系数由返回路径390从量化器350传送至反向量化器420,该反向量化器执行扫描单元360的反向操作。反向量化及反向变换处理由单元420、430执行以生成压缩-解压缩的残差图像信号440。

图像信号440在相加器450处被加至预测器320的输出以生成重建的输出图像460。如以下将描述的,这形成图像预测器320的一个输入。

现在转向应用于接收的压缩视频信号470的处理,信号被供应至熵编码器410并且在由相加器450将其加到图像预测器320的输出之前由此处被供应至反向扫描单元400、反向量化器420以及反向变换单元430的链。明确地,相加器450的输出460形成输出的解压缩视频信号480。实际上,可在信号被输出之前应用进一步的过滤。因此,应用至接收的压缩视频信号470的处理对应于解码器的操作。

图6示意性示出预测图像的生成,并且具体地,图像预测器320的操作。

存在三种预测的基本模式:这些中的两种是所谓的图像内预测及所谓的图像间或运动补偿(MC)预测。在一些方面上,第三种是这两种的混合:块内复制模式使用其他块作为当前块的预测,但是那些其他块源自为与当前块相同的图像。

在作为图像的子块的整个预测单元(PU)上使用相同的图像预测技术。可在不同PU中使用不同预测技术。可由控制器345例如基于图像中的一些或所有的试验或测试预测,来选择用于PU的预测技术以及实际上图像被分离为PU的方式,以便看出哪一种技术提供针对所需参数组内的性能(例如,压缩图像与解压缩图像的信噪比)与“成本”(在生成的数据量方面)的适当(或例如最优)平衡。

图像内预测以来自相同图像内的附近数据上的图像的块的内容的预测为基础。这对应于其他视频压缩技术中的所谓的I帧编码。与I帧编码(其中,整个图像均被内编码)相对,在本实施方式中,可以逐块地进行内编码与间编码之间的选择,虽然在其他实施方式中仍逐图像地进行选择。

运动补偿预测利用尝试在另一邻近或附近的图像中定义在当前图像中编码的图像细节的来源的运动信息。因此,在理想实例中,预测图像中的图像数据的块的内容可极简单地被编码为基准(运动矢量),该基准指向相邻图像中位于相同或稍微不同位置处的对应块。

回到图6,示出了两个图像预测配置(对应于图像内及图像间预测),其结果在模式信号510的控制下由多路器500选择以提供预测图像的块以供应至相加器310及450。选择的进行是根据哪个选择给予最低“能量”(如上讨论的,其可被认为需要编码的信息内容),且该选择被发送给编码输出数据流内的编码器。在该上下文中,可例如通过从输入图像执行预测图像的两个版本的区域的试验相减、将差分图像的各像素值平方、将平方值相加及识别两个版本中的哪一个给出相关于该图像区域的差分图像的较低均方根值来检测图像能量。

在一些实例中,可使用提供块内复制预测的第三预测配置。然而,在本实施方式中,通过仅仅基于在相同(而不是另一个)图像上的运动矢量的预测和生成,通过与图像间预测相同的配置来实现块内复制预测。

在内编码系统中,基于作为信号460的部分接收的图像块来进行实际预测,换言之,预测基于编码-解码图像块,使得可在解压缩设备上进行完全相同的预测。然而,数据可由内模式选择器520获取自输入视频信号300,以控制图像内预测器530的操作。

针对图像间预测和块内复制预测,运动补偿(MC)预测器540使用运动信息,诸如由运动估计器550从输入视频信号300所得到的运动矢量。那些运动矢量通过运动补偿预测器540而被施加至重建图像460的处理版本,以产生图像间预测或块内复制预测的块。

现在将描述应用至信号460的处理。首先,由过滤器单元560过滤信号。这涉及应用“除块(deblocking)”过滤器以移除或至少倾向于减少由变换单元340执行的块基处理及后续操作的效果。另外,使用通过处理重建信号460及输入视频信号300所取得的系数来应用自适应回路过滤器。自适应回路过滤器是这样一种过滤器,该自适应回路过滤器使用已知技术,将自适应过滤器系数应用于待过滤的数据。就是说,过滤器系数可根据各种因素而改变。定义应使用哪些过滤器系数的数据被包括为编码输出数据流的部分。

事实上,来自过滤器单元560的过滤输出形成输出视频信号480。其还缓存在一个或多个图像存储器570中;连续图像的存储是运动补偿预测处理的要求,并具体为运动矢量的生成。为了节省存储需求,图像存储器570中的存储图像可以以压缩形式保持并接着解压缩以用于产生运动矢量。为了此特定目的,可使用任何已知的压缩/解压缩系统。存储的图像被传送至内插过滤器580,其产生存储图像的较高分辨率版本;在本实例中,产生中间样本(子样本),从而使得由内插过滤器580输出的内插图像的分辨率(在每个维度上)是存储在图像存储器570中的图像的分辨率的8倍。内插图像作为输入被传送至运动估计器550以及运动补偿预测器540。

在实施方式中,提供进一步可选阶段,其使用乘法器600而将输入视频信号的数据值乘以四的因子(效果上仅将数据值向左移两位);以及使用除法器或右移器610而在设备的输出处施加一对应的除法操作(右移两位)。因此,左移及右移纯粹针对设备的内部操作而改变数据。当任何数据舍入误差的效果降低时,该措施可提供设备内的较高的计算准确度。

图像间编码已示出为实现用于屏幕内容序列的极高压缩比(在一些示例性情况中,几百比一)。然而,间预测在用于编码解码器(编码器-解码器)实现过程的计算复杂性上表现出大量成本。

应注意,术语“屏幕内容序列”涉及包含屏幕内容(未通过照相机捕获的图像材料)的连续图像的序列。该术语不暗示整个每个图像由屏幕内容形成,尽管当然这可以是这样的(作为术语的更通用意义的具体实例)。在图像的情况下,间预测的更简单“约束”版本能够实现相似压缩性能而没有超过所有内编码解码器的增加的较大复杂性。

以下将讨论示例性布置。然而,一般而言,这样的约束可包括运动矢量长度的限制(限制为较小区域内)或者甚至将长度限制为单个0的值,或者预测精确度的降低(只是代替四分之一亮度样本的半亮度样本或整体样本),或者可使用的基准帧的数量的限制,或者这些和/或其他约束的组合。

考虑到屏幕内容中的许多帧(或帧的区域)将与它们的先前帧完全相同,假定如果不是所有的益处通过间预测编码可用,大部分可以使用约束间预测模式获得,其中,对于所有的间编码PU,运动矢量和基准指数被固定在值0。

与完全间预测相比,这样的模式将会显著地易于实现,因为不需要大于一个帧的内插或缓冲。此外,在编码器中不需要运动矢量搜索。

实现该模式所需的语法和工具已存在于HEVC范围扩展中。在实施方式中,将需要在序列参数组扩展中(构成序列参数组扩展的部分)的单个标记。该工具可在只有内分布或新的“内扩展”分布中能够进行(因为不存在已支持完全间预测的解码器的实现益处)。

现在将描述具体示例性布置。

图7示意性示出块内复制处理,如上所述的,该块内复制处理提供了适于编码屏幕内容序列的一种技术。

在具体图像700内,关于将对其执行块内复制预测的块710,通过检测相关性(例如,块710与搜索区域720内的每个候选块位置之间的绝对差值的总和)来识别搜索区域720内的最相似的对应尺寸的块。当已识别到最相似的块730时,块710与最相似块730之间的位移740形成与块710相关的运动矢量。应注意,块710可以是例如,n×m个样本的矩形阵列,其中n和m是大于等于1的整数。

图8示意性示出图像间预测处理。如上所述,该布置特别适于包括多个连续图像的屏幕内容序列。然而,现在将更一般地进行描述。

关于当前图像800,由控制器345选择一个或多个基准图像810、820……。为了描述清晰,将描述关于基准图像中的一个以及图像810的处理,但是将理解,该处理可关于大于一个的基准图像进行,其中,在处理结束时选择最佳结果。

对于图像800中的n×m个样本的当前测试块830,例如使用以上结合图7讨论的技术来检测基准图像810中的搜索区域840内的最相似块850。最相似块850的位置与图像810中的与图像800中的块830的位置对应的位置860之间的位移870表示与块830有关的运动矢量。应注意,在一些情形中,可使用块(诸如,基准图像810、820的多个块中的块850)的加权组合来预测当前块830。通常,块830的预测所需的信息包括一个或多个运动矢量,并且除非该信息是隐含的或预定的,否则还包括一个或多个基准图像的识别。在一些实例中,使用所谓的基准指数使得零的基准指数指定时间上紧邻的先前图像(图8的实例中的图像810)。在实施方式中,零的基准指数指定基准列表的头部处的图像。在实施方式中,在基准列表中仅存在一个图像。

关于图8示出的处理表示“正常”或“不受约束”的间预测操作。以下将讨论例如为了降低与处理有关的处理开销,而使得处理被约束的技术。

图9是示出在编码器侧的标记的使用的示意性流程图。在一些情形中,标记可用于指示已采用约束图像间预测模式。应注意,在其他情形中,可不需要这样的标记。以下将讨论实例。

在步骤900中,控制器345在编码器位流中设定标记以指示将使用约束图像间预测模式。例如,标记可实现为所谓的序列参数组的部分,例如作为序列参数组扩展数据。在步骤910中,编码器使用约束图像间模式来编码在标记设定之后的图像。

图9的处理提供具有图像间预测模式(其中,从位于基准图像中的大量候选块位置中的一个处的样本的基准块预测当前图像的一个或多个样本的块)的图像数据编码设备的操作的方法的实例,该方法包括:选择性应用约束图像间预测模式,相比较图像间预测模式,在约束图像间预测模式中,候选块位置的数量和候选基准图像的数量中的一者或两者减少。在实施方式中,通过当前图像的块与一个或多个候选基准图像的搜索区域中的多个候选块位置的比较来检测基准块。

图10是示出在解码器侧的标记的使用的示意性流程图。应注意,根据约束的本质和解码器的处理能力,标记对于解码器可能是不必要的。然而,在标记与解码器相关的情形中,随后在步骤920中,解码器的控制器(对应于控制器345)检测到标记被设为指示约束图像间预测模式,并且在步骤930中,解码器使用约束图像间预测模式来解码位流。

图10的处理提供具有图像间预测模式(其中,从位于基准图像中的大量候选块位置中的一个处的样本的基准块预测当前图像的一个或多个样本的块)的图像数据解码设备的操作的方法的实例,该方法包括:选择性应用约束图像间预测模式,相比较图像间预测模式,在该约束图像间预测模式中,候选块位置的数量和候选基准图像的数量中的一者或两者减少。在实施方式中,通过当前图像的块与一个或多个候选基准图像的搜索区域中的多个候选块位置的比较来检测基准块。

图11示意性示出形成例如编码数据流960的序列参数组950的部分的约束间标记940。图11的时间感使得由绘至标记940的示意图的右侧的位流960的部分来表示继标记940的设定之后编码的图像。如上所述,使用对应于设定标记940的约束图像间预测模式来编码这样的图像。

因此,这提供在编码图像数据的数据流中设定标记的实例,以指示应用约束图像间预测模式。该标记可形成序列参数组数据的部分。

图12至图15是示出涉及约束图像间编码处理的示例性技术的示意性流程图。

在图12中,在步骤1000中,控制器345将运动矢量搜索区域840限制为较小区域845(图8),其至少在一些实施方式中仍然包括与考虑之中的块830的位置对应的位置860。通过限制运动矢量搜索区域,降低了用于执行搜索的处理需求。在步骤1010中,运动估计器550根据降低的搜索区域检测运动矢量。因此,在约束图像间预测模式中,基准图像的包括基准块的候选位置的搜索区域小于图像间预测模式中的搜索区域。

在图13中,在步骤1020中,控制器345例如通过中止内插过滤器580的使用来降低预测精确度,使得代替例如四分之一样本精确度,而是在图像间预测处理中使用半样本或整体样本精确度。再次,这降低用于执行该过程的处理需求。在步骤1030中,运动估计器550根据降低的精确度检测运动矢量。因此,在约束图像间预测模式中,基准块的基准图像中的位置的精确度被检测为比图像间预测模式中的精确度更低。

在图14中,相比较于正常图像间预测操作,基准图像810、820……的选择被限制。因为在生产处理中使用较少图像,所以作为预测块的最终生成的部分或为了检测候选基准图像中的哪一个提供最佳结果,降低用于执行处理的处理需求。在步骤1050中,运动估计器550根据限制的基准图像组检测运动矢量。因此,在约束图像间预测模式中,供当前图像使用的候选基准图像的数量小于图像间预测模式中的候选基准图像的数量。

应注意,可结合参考图12至图15讨论的技术中的任一种。

图15表示图12和图14的配置的特殊情况,因为运动矢量被约束为零的位移,使得使用基准图像中的对应位置860处的块执行图像间预测。另外,基准指数被约束为零的值,指示时间上紧邻的先前图像被定义为基准图像。在该实例中,根本不需要搜索。如果在这些约束下选择图像间预测模式,则随后不需要对运动矢量的任意搜索,并且基准指数是直接已知的。应注意,图15的两部分(将运动矢量设为零以及将基准指数设定为零)可一起或分开执行。在实施方式中,在约束图像间预测模式中,基准图像中的基准块的位置与当前图像中的块的位置相同。在实施方式中,在约束图像间预测模式中,用于当前图像的候选基准图像的数量等于一。候选基准图像可以是时间上紧邻的先前图像。

已经在能够进行或不能够进行块内复制的情况下,对关于所谓的AHG8无损测试条件执行实证测试。分别在表1和表2中呈现了结果。

表1——AHG8无损内和低延迟测试条件下(块内复制能够进行)的用于约束间预测的比特率改变和编码次数。

表2——AHG8无损内和低延迟测试条件下(块内复制中止)的用于约束间预测的比特率改变和编码次数。

在文献P1006“用于HEVC范围扩展的常用测试条件及软件基准配置(Common Test Conditions and Software Reference Configurations for HEVC Range Extensions)”,2014年1月24日的版本1和2014年2月5日的版本2中限定了AGHS8无损测试条件。

如结果所示的,用于该方案的比特率只是用于完全间编码的比特率的两倍,然而只不过是所有内编码的比特率的20%。观察到,对于屏幕内容序列,该方案几乎以复杂性的大量降低传递间编码的所有益处。

总之,内编码的扩展已呈现为允许在具有非常高的时间相关性的序列中使用间预测的简化形式。相比较所有内编码,该方案已示出给予用于屏幕内容的比特率的大量降低(超过80%)。

本公开的实施方式的相应方面和特征利用以下编号项来限定:

1.一种具有图像间预测模式的图像数据编码设备的操作的方法,在图像间预测模式中,从位于基准图像中的大量候选块位置中的一个处的样本的基准块预测当前图像的一个或多个样本的块,该方法包括:

选择性地应用约束图像间预测模式,相比较于图像间预测模式,在约束图像间预测模式中,候选块位置的数量和候选基准图像的数量中的一者或两者减少。

2.根据项1所述的方法,包括:在编码图像数据的数据流中设定标记以指示应用约束图像间预测模式的步骤。

3.根据项2所述的方法,其中,标记形成序列参数组数据的部分。

4.根据前述项中任一项所述的方法,其中,在约束图像间预测模式中,基准块的基准图像中的位置的精确度被检测为比图像间预测模式的精确度更低。

5.根据前述项中任一项所述的方法,其中,在约束图像间预测模式中,基准图像的包括基准块的候选位置的搜索区域小于图像间预测模式中的搜索区域。

6.根据前述项中任一项所述的方法,其中,在约束图像间预测模式中,供当前图像使用的候选基准图像的数量小于图像间预测模式中的候选基准图像的数量。

7.根据前述项中任一项所述的方法,其中,在约束图像间预测模式中,基准图像中的基准块的位置与当前图像中的块的位置相同。

8.根据前述项中任一项所述的方法,其中,在约束图像间预测模式中,用于当前图像的候选基准图像的数量等于一。

9.根据项8所述的方法,其中,候选基准图像是时间上紧邻的先前图像。

10.一种具有图像间预测模式的图像数据解码设备的操作的方法,在图像间预测模式中,从位于基准图像中的大量候选块位置中的一个处的样本的基准块预测当前图像的一个或多个样本的块,该方法包括:

选择性地应用约束图像间预测模式,相比较于图像间预测模式,在约束图像间预测模式中,候选块位置的数量和候选基准图像的数量中的一者或两者减少。

11.根据前述项中任一项所述的方法,包括:

通过将当前图像的块与一个或多个候选基准图像的搜索区域中的多个候选块位置进行比较来检测基准块。

12.一种计算机软件,当由计算机执行该计算机软件时,使计算机执行根据前述项中任一项所述的方法。

13.一种非易失性机器可读存储介质,该非易失性机器可读存储介质存储根据项12所述的计算机软件。

14.一种具有图像间预测模式的数据编码设备,在图像间预测模式中,从位于基准图像中的大量候选块位置中的一个处的样本的基准块预测当前图像的一个或多个样本的块,该设备包括:

控制器,该控制器被配置为选择性地应用约束图像间预测模式,相比较于图像间预测模式,在约束图像间预测模式中,候选块位置的数量和候选基准图像的数量中的一者或两者减少。

15.一种具有图像间预测模式的数据解码设备,在图像间预测模式中,从位于基准图像中的大量候选块位置中的一个处的样本的基准块预测当前图像的一个或多个样本的块,该方法包括:

控制器,控制器被配置为选择性地应用约束图像间预测模式,相比较于图像间预测模式,在约束图像间预测模式中,候选块位置的数量和候选基准图像的数量中的一者或两者减少。

16.一种视频数据捕获、传输、显示和/或存储设备,包括:根据项14或项15所述的设备。

17.一种划分为数据部分的编码数据的分布的情况,编码数据包括指示约束图像间预测模式的标记,相比较于图像间预测模式,在约束图像间预测模式中,候选块位置的数量和候选基准图像的数量中的一者或两者减少。

如较早讨论的,将理解,以上项的设备特征可通过较早讨论的编码器或解码器的相应特征来实现。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1