后向视图合成预测的制作方法_2

文档序号:9423267阅读:来源:国知局
可读媒体。
[0049] 目的地装置14的输入接口 28从计算机可读媒体16接收信息。计算机可读媒体16 的信息可包含由视频编码器20定义的语法信息,所述语法信息也被视频解码器30使用,其 包含描述块及其它经译码单元(例如GO巧的特性及/或处理的语法元素。显示装置32将 经解码视频数据显示给用户,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、 液晶显示器化CD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
[0050] 视频编码器20和视频解码器30可根据一种视频译码标准(例如,目前正在开发 的高效视频译码(肥VC)标准)来操作,且可符合肥VC测试模型(HM)。或者,视频编码器 20和视频解码器30可W根据其它专有或业界标准来操作,所述标准例如是口U-TH. 264标 准,也被称为MPEG-4第10部分高级视频译码(AVC),或此类标准的扩展。然而,本发明的技 术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2和口U-TH. 263。尽管 图1中未展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解 码器集成,且可包含适当的多路复用器-多路分用器(MUX-DEMU讶单元或其它硬件和软件, W处置对共同数据流或单独数据流中的音频和视频两者的编码。如果适用的话,多路复用 器-多路分用器单元可符合口UH. 223多路复用器协议,或例如用户数据报协议OJD巧等 其它协议。
[0051] ITU-T比 264/MPEG-4(AVC)标准是由mJ-T视频译码专家组(VCEG)连同IS0/IEC 移动图片专家组(MPEG)制定W作为被称为联合视频小组(JVT)的集体伙伴关系的产品。在 一些方面中,本发明中描述的技术可应用到一般符合H. 264标准的装置。比264标准描述于ITU-T研究组的日期为2005年3月的"ITU-T推荐H. 264,用于通用视听服务的高级视频译 石马"(ITU-TRecommendation比 264,AdvancedVideoCodingforgenericaudiovisual services)中,所述标准在本文中可被称作H. 264标准或H. 264规范或H. 264/AVC标准或规 范。联合视频小组(JVT)持续致力于扩展H. 264/MPEG-4AVC。
[0052] 视频编码器20和视频解码器30各自可经实施为例如一或多个微处理器、数字信 号处理器值SP)、专用集成电路(ASIC)、现场可编程口阵列(FPGA)、离散逻辑、软件、硬件、 固件或其任何组合的多种合适编码器电路中的任一者。当部分W软件实施所述技术时,装 置可将用于所述软件的指令存储于合适非暂时性计算机可读媒体中并使用一或多个处理 器用硬件执行所述指令W执行本发明的技术。视频编码器20及视频解码器30中的每一者 可W包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可W集成为相应 装置中的组合编码器/解码器(编解码器)的部分。
[0053] JCT-VC正在努力开发肥VC标准。肥VC标准化努力是基于被称作肥VC测试模型 (HM)的视频译码装置的进化模型。歷根据(例如HTU-TH.264/AVC假设视频译码装置相 对于现存装置的若干额外能力。举例来说,虽然H. 264提供了九种顿内预测编码模式,但HM 可提供多达H十H种顿内预测编码模式。
[0054] -般来说,HM的工作模型描述视频顿或图片可被划分为包含明度和色度样本两者 的树块或最大译码单元化CU)的序列。位流内的语法数据可界定LCU(其是就像素数目来 说的最大译码单元)的大小。切片包含按译码次序的数个连续树块。视频顿或图片可被分 割成一或多个切片。每一树块可W根据四叉树分裂成译码单元(CU)。总的来说,四叉树数 据结构包含每个CU-个节点,其中一个根节点对应于所述树块。如果一个CU分裂成四个 子CU,郝么对应于CU的节点包含四个叶节点,其中的每一者对应于所述子CU中的一者。
[0055] 四叉树数据结构的每一节点可提供用于对应的CU的语法数据。举例来说,四叉树 中的节点可包含分裂旗标,从而指示对应于所述节点的所述CU是否分裂成子CU。用于CU 的语法元素可W递归式定义,且可W取决于CU是否分裂成子CU。如果CU未经进一步分裂, 郝么将其称作叶CU。在本发明中,叶CU的四个子CU也将被称作叶CU,即使不存在原始叶 CU的明确分裂时也是如此。举例来说,如果16x16大小的CU不进一步分裂,郝么送四个8x8 子CU将也被称作叶CU,虽然16x1601从未分裂。
[0056] CU具有与H. 264标准的宏块类似的用途,只是CU不具有大小区别。举例来说,树 块可W分裂成四个子节点(还被称作子CU),并且每一子节点又可W是父节点并且可W分 裂成另外四个子节点。最终的未分裂子节点(被称作四叉树的叶节点)包括译码节点,还 称为叶CU。与经译码位流相关联的语法数据可界定树块可分裂的最大次数,被称作最大CU 深度,且还可界定译码节点的最小大小。所W,位流还可定义最小译码单元(SCU)。本发明 使用术语"块"指代肥VC的上下文中的CU、PU或TU中的任一者,或者其它标准的上下文中 的类似数据结构(例如,其在H. 264/AVC中的宏块和子块)。
[0057] CU包含译码节点及与所述译码节点相关联的预测单元(PU)及变换单元(TU)。CU 的大小对应于译码节点的大小并且形状必须是正方形。CU的大小可W在从8x8像素直到具 有最大64x64像素或更大的树块的大小的范围内。每一CU可W含有一或多个PU和一或多 个TU。举例来说,与CU相关联的语法数据可描述将CU分割成一或多个PU。分割模式可W 在CU被跳过或经直接模式编码、经顿内预测模式编码或经顿间预测模式编码之间有区别。PU可W分割成非正方形形状。举例来说,与CU相关联的语法数据还可描述CU根据四叉树 分割成一或多个TU。TU可W是正方形或非正方形(例如,矩形)形状。
[005引肥VC标准允许根据TU变换,TU可W针对不同CU而有所不同。TU的大小通常是 基于针对经分割LCU定义的给定CU内的PU的大小而设置,但是情况可能并不总是如此。 TU通常与PU大小相同或小于PU。在一些实例中,对应于CU残余样本可W使用一种被称为 "残余四叉树"(RQT)的四叉树结构细分成较小单元。RQT的叶节点可被称为变换单元(TU)。 可W变换与TU相关联的像素差值W产生变换系数,可W将所述变换系数量化。
[0059] 叶CU可包含一或多个预测单元(PU)。总的来说,PU表示对应于对应CU的全部 或一部分的空间区域,并且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有 关的数据。举例来说,当PU经顿内模式编码时,用于PU的数据可包含在残余四叉树(RQT) 中,残余四叉树可包含描述用于对应于PU的TU的顿内预测模式的数据。作为另一实例,当 PU经顿间模式编码时,PU可包含界定PU的一或多个运动向量的数据。界定PU的运动向量 的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例 女口,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片,及/或运动向 量的参考图片列表(例如,列表0、列表1或列表C)。
[0060] 具有一或多个PU的叶CU还可包含一或多个变换单元灯U)。变换单元可W使用 RQT(还称为TU四叉树结构)来指定,如上文所论述。举例来说,分裂旗标可W指示叶CU是 否分裂成四个变换单元。接着,每一变换单元可W进一步分裂成其它的子TU。当TU不进 一步分裂时,其可被称为叶TU。总体上,对于顿内译码,所有属于一叶CU的叶TU共享相同 的顿内预测模式。也就是说,总体上应用相同顿内预测模式来计算叶CU的所有TU的预测 值。对于顿内译码,视频编码器可使用顿内预测模式将每一叶TU的残余值计算为CU的对 应于TU的部分与原始块之间的差。TU不必限于PU的大小。因而,TU比PU大或小。对于 顿内译码,PU可与相同CU的对应叶TU位于同一地点。在一些实例中,叶TU的最大大小可 W对应于对应叶CU的大小。
[0061] 此外,叶CU的TU还可与相应的四叉树数据结构(被称作残余四叉树(RQT))相关 联。目P,叶CU可包含指示叶CU如何分割成TU的四叉树。TU四叉树的根节点总体上对应 于叶CU,而CU四叉树的根节点总体上对应于树块(或LCU)。未分裂的RQT的TU被称作叶 TU。一般来说,除非另有陈述,否则本发明分别使用术语CU及TU来指叶CU及叶TU。
[0062] 视频序列通常包含一系列视频顿或图片。图片群组(GO巧总体上包括一系列视频 图片中的一或多者。GOP可包含在GOP的标头、图片中的一或多者的标头或其它地方中的语 法数据,所述语法数据描述GOP中所包含的图片的数目。图片的每一切片可包含切片语法 数据,其描述用于相应切片的编码模式。视频编码器20通常对个别视频切片内的视频块进 行操作W便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化 的大小,且根据指定译码标准可具有不同大小。
[006引作为一实例,歷支持各种PU大小的预测。假定特定CU的大小为2化2N,郝么歷 支持2化2N或化N的PU大小的顿内预测,和2化2N、2化N、化2N或化N的对称PU大小的顿 间预测。HM还支持用于2化nU、2化nD、nLx2N和nRx2N的PU大小的顿间预测的不对称分割。 在不对称分割中,不分割CU的一个方向,但是另一方向分割成25 %及75%。CU的对应于 25%分区的部分通过"n"、后面接续"上方"、"下方"、"左侧"或"右侧"指示来指示。因此, 例如,"2化nU"是指经水平地分割的2化2NCU,其中顶部为2化0. 5NPU,而底部为2化1. 5N PU。
[0064] 在本发明中,"化N"和"N乘N"可W互换使用来指代在垂直和水平尺寸方面的视 频块的像素尺寸,例如,16x16像素或16乘16像素。总的来说,16x16块将在垂直方向上具 有16个像素(y= 16),并且在水平方向上具有16个像素(X= 16)。同样,化N块一般在 垂直方向上具有N个像素,并且在水平方向上具有N个像素,其中N表示非负整数值。一块 中的像素可布置成若干行和若干列。此外,块未必需要在水平方向与垂直方向上具有相同 数目个像素。举例来说,块可包括NxM像素,其中M未必等于N。
[0065] 在使用CU的PU的顿内预测性或顿间预测性译码之后,视频编码器20可W计算CU 的TU的残余数据。PU可包括描述在空间域(还被称作像素域)中产生预测性像素数据的 方法或模式的语法数据,并且TU可包括在对残余视频数据应用变换(例如,离散余弦变换 值CT)、整数变换、小波变换或概念上类似的变换)之后在变换域中的系数。所述残余数据 可W对应于未编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可W形 成包含用于CU的残余数据的TU,并且接着变换TUW产生用于CU的变换系数。
[0066] 在用于产生变换系数的任何变换之后,视频编码器20可执行变换系数的量化。量 化大体上是指量化变换系数W可能减少用于表示系数的数据量从而提供进一步压缩的过 程。量化过程可减少与系数中的一些系数或全部相关联的位深度。举例来说,n位值可在 量化期间被下舍入到m位值,其中n大于m。
[0067] 在量化之后,视频编码器可W扫描变换系数,从包含经量化的变换系数的二维矩 阵产生一维向量。扫描可经设计W将较高能量(W及因此较低频率)系数放置在阵列的前 面,且将较低能量(W及因此较高频率)系数放置在阵列的后面。在一些实例中,视频编码 器20可利用预定义扫描次序来扫描经量化的变换系数W产生可经赌编码的串行化向量。 在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数W形成一维向量 之后,视频编码器20可例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进 制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割赌 (PIP巧译码或另一赌编码方法对一维向量进行赌编码。视频编码器20还可赌编码与经编 码视频数据相关联的语法元素W供视频解码器30在解码视频数据时使用。
[0068] 为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待发射的符 号。上下文可涉及(例如)符号的相邻值是否为非零。为了执行CAVLC,视频编码器20可 W选择用于待发射的符号的可变长度码。VLC中的码字可经构造而使得相对短的码对应于 更有可能的符号,而较长的码对应于不太可能的符号。W此方式,使用VLC可比例如对待发 射的每一符号使用相等长度码字实现位节省。概率确定可基于指派给符号的上下文。
[0069] 本发明大体上描述涉及后向视图合成预测的技术,且确切地说,可用W克服上文 所论述问题的技术。本发明提出通过在构造合并候选者列表之后由视图间参考图片索引替 换参考索引而移除BVSP模式的所有额外检查。因此,不需要改变3D-HEVC的模块,例如解 块滤波器、时间合并候选者、Do-NBDV和AMVP模块,且视频译码器(例如,视频编码器20和 /或视频解码器30)可将BVSP模式旗标存储在经解码图片缓冲器值PB)中W减少硬件实施 方案的复杂性。
[0070] 如下文更详细地论述的,在3D-HEVC中,当后向视图合成预测度VS巧用W对块进 行译码时,块的运动信息包含等于-1的参考索引。然而根据本发明,视频译码器(例如视 频编码器20或视频解码器30)可使用BVSP对块进行译码,其中块的参考索引参考将从其 执行视图合成预测的图片。换句话说,本发明提出将使用BVSP模式译码的块设定成具有等 于参考图片列表中的视图间参考图片的参考索引的参考索引,其中所述视图间参考图片是 从其执行视图合成的图片。
[0071] W此方式,经BVSP译码块可在许多情况下明显视为正常的经顿间预测块。举例来 说,在AMVP中,当存取相邻块(包含空间相邻块)W产生运动向量预测符候选者而不是具 有用于经BVSP译码块和正常顿间预测块两者的不同逻辑功能时,如在肥VC中,一个功能可 用于经BVSP译码块和顿间预测块两者。同样,在时间运动向量预测(TMV巧中,经BVSP译 码块和正常经顿间译码块可联合地在一个功能中处置。另外,BVSP变量不需要存储到经解 码图片缓冲器中。此外,在解块中,在3D-HEVC中添加W处置BVSP的额外逻辑可移除。此 夕F,在NBDV中,作为经BVSP译码块且作为视差运动补偿块的相邻块视为相同的,因此,针对 每一相邻块不需要BVSP变量的额外检查。W此方式,实施送些技术可减少符合例如通过送 些技术修改的3D-HEVC的编解码器的复杂性。
[0072] 本发明描述涉及设定用于使用BVSP译码的块的参考索引的额外技术。确切地说, 本发明描述其中使用BVSP译码的块的参考索引的设定恰好发生在合并候选者列表经产生 且BVSP候选者已插入和/或Wmerge_idx选择之后的技术。替代地,当选择BVSP合并候 选者时,视频译码器(例如视频编码器20或视频解码器30)可将BVSP合并候选者立即转 换到其参考索引被设定成执行视图合成的视图间参考图片的参考索引的候选者。
[0073] 在一些实例中,BVSP块可仍通过BVSP变量来识别。然而,虽然可针对整个切片为 此变量分配存储器存储,但与用于BVSP的3D-HEVC的技术相反,不需要在经解码图片缓冲 器DPB中分配存储器。
[0074] 另外,或在替代方案中,无论位于同一地点的块是否WBVSP模式译码,都可启用 运动参数继承(MPI)。因此,一旦切片经译码便不需要BVSP变量的存储。因此,替代于在存 储器中载运BVSP变量直到深度视图分量的译码,视频编码器20和视频解码器30可在一旦 包含经BVSP译码块的切片经译码后便丢弃BVSP变量。
[00巧]此外,无论空间相邻块是否WBVSP译码,BVSP合并候选者都可始终添加在相对固 定位置。因此,不需要BVSP变量的存储(甚至在切片或线缓冲器中)。目P,视频编码器20 和视频解码器30不需要存储BVSP变量。在一些实例中,视频编码器20和视频解码器30 可经配置W始终将BVSP候选者插入到合并候选者列表中的序数第一位置中。在一些实例 中,视频编码器20和视频解码器30可经配置W将BVSP候选者插入在合并候选者列表中处 于所有空间合并候选者之后。在一些实例中,视频编码器20和视频解码器30可经配置W 将BVSP候选者插入在合并候选者列表的任何(预定)位置中。
[0076] W此方式,视频编码器20和视频解码器30表示经配置W进行W下操作的视频译 码器的实例;例如根据3D-HEVC对多视图视频数据的块的运动信息进行译码(例如,由视频 编码器20编码或由视频解码器30解码),其中所述运动信息包含识别包括用于后向扭曲视 图合成预测度VS巧的源的参考图片的参考索引;对于所述参考图片的一部分执行BVSPW 产生BVSP参考块;W及使用所述BVSP参考块预测所述块。
[0077] 确切地说,如上文所论述,视频编码器20和视频解码器30可经配置W对多视图视 频数据的块的运动信息进行译码。运动信息可包含参考索引,W及其它运动参数(例如参 考图片列表识别符)。与如描述于3D-HEVC中用于经BVSP译码块的值-1相反,所述参考 索引可具有识别参考图片列表中的参考图片的值。然而,并非从由参考索引识别的参考图 片预测块,视频编码器20和视频解码器30可经配置W对参考图片的一部分执行BVSPW产 生BVSP参考块。目P,视频编码器20和视频解码器30可使用BVSP从由参考图片列表中的 参考索引识别的参考图片合成所述块的经预测块。经预测块也可被称作BVSP参考块。
[0078] 视频编码器20和视频解码器30可使用BVSP参考块(充当经预测块)对块进行 译码。举例来说,视频编码器20可计算所述块与经预测块之间的逐像素差W形成残余块。 视频解码器30可通过赌解码位流数据而重构残余块,随后逆量化且逆变换此数据,且随后 将经预测块逐像素添加到残余块W再生所述块。
[0079] 应理解,当执行BVSPW合成BVSP参考块时,BVSP参考块被视为处于与包含正译 码块的当前视图W及包含从其合成BVSP参考块的参考图片的视图不同的视图中。举例来 说,假定当前块在视图2中,参考图片可在视图0中且BVSP参考块可在视图1中合成。
[0080] 此外,在已使用BVSP译码块之后,块的运动信息可用作运动向量预测符。举例来 说,视频编码器20和视频解码器30可经配置W存取使用BVSP译码的相邻块作为第一运动 向量预测符候选者(例如,用于高级运动向量预测(AMVP))。视频编码器20和视频解码器 30可经配置有用于存取AMVP候选者的特定逻辑功能。并非包含一个用于BVSP候选者且一 个用于非BVSP候选者的两个不同逻辑功能,视频编码器20和视频解码器30可使用同一逻 辑功能存取BVSP和非BVSP候选者两者。因此,视频编码器20和视频解码器30可使用与 用W存取非经BVSP译码块作为不同AMVP候选者的逻辑功能相同的逻辑功能存取经BVSP 译码块作为AMVP候选者。
[0081] 类似地,可存取经BVSP译码块的运动信息作为用于时间运动向量预测灯M
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1