视频译码中的参数集的制作方法

文档序号：7794142阅读：161来源：国知局

视频译码中的参数集的制作方法
【专利摘要】视频参数集VPS与一或多个经译码视频序列CVS相关联。所述VPS包含针对视频译码扩展的VPS扩展。所述VPS扩展包含指示是否针对位流的一组可应用层启用与所述视频译码扩展相关联的视频译码工具的语法元素。当所述语法元素指示针对所述可应用层启用所述译码工具时，使用所述译码工具来译码与所述CVS相关联且与所述可应用层相关联的视频数据的至少一部分。当所述语法元素指示不针对所述可应用层启用所述译码工具时，不使用所述译码工具来译码与所述CVS相关联且与所述可应用层相关联的所述视频数据。
【专利说明】视频译码中的参数集
[0001] 本申请案主张2012年7月20日申请的第61/673, 918号美国临时专利申请案及 2012年8月7日申请的第61/680, 556号美国临时专利申请案的权利，所述申请案中的每一者的全部内容以引用的方式并入本文中。

【技术领域】
[0002] 本发明涉及视频译码（即，视频数据的编码及/或解码）。

【背景技术】
[0003] 可将数字视频能力并入到广泛范围的装置内，包含数字电视、数字直播系统、无线广播系统、个人数字助理（PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的"智能手机"、视频电话会议装置、视频流装置及其类似者。数字视频装置实施视频压缩技术，例如，在由 MPEG-2、MPEG-4、ITU-T H. 263、ITU-T H. 264/MPEG-4 第 10 部分高级视频译码（AVC)定义的标准、目前在开发中的高效率视频译码（HEVC)标准及这些标准的扩展中描述的技术。视频装置可通过实施此类视频压缩技术而更有效率地发射、接收、编码、解码及/或存储数字视频信息。
[0004] 视频压缩技术执行空间（图片内）预测及/或时间（图片间）预测以减少或去除视频序列中所固有的冗余。对于基于块的视频译码，可将视频切片（即，视频帧或视频帧的一部分）分割成视频块。图片的经帧内译码（I)切片中的视频块是使用关于同一图片中的相邻块中的参考样本的空间预测而编码。图片的经帧间译码（P或B)切片中的视频块可使用关于同一图片中的相邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧，且参考图片可被称作参考帧。
[0005] 空间或时间预测产生用于待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量来编码经帧间译码的块，且残余数据指示经译码块与预测性块之间的差。根据帧内译码模式及残余数据编码经帧内译码块。为了进一步压缩，可将残余数据从像素域变换到变换域，从而产生残余系数，其接着可被量化。可扫描最初按二维阵列布置的经量化的系数以便产生系数的一维向量，且可应用熵译码以实现甚至更多的压缩。
[0006] 可通过编码（例如）来自多个透视角度的视图来产生多视图译码位流。已开发出使用多视图译码方面的一些三维（3D)视频标准。举例来说，不同视图可传输左眼视图及右眼视图以支持3D视频。或者，一些3D视频译码过程可应用所谓的多视图加深度译码。在多视图加深度译码中，3D视频位流可能不仅含有纹理视图分量，而且可含有深度视图分量。举例来说，每一视图可包括一个纹理视图分量及一个深度视图分量。

【发明内容】

[0007] 一般来说，本发明描述与视频编码解码器（例如，高效率视频译码（HEVC))的扩展中的视频参数集（VPS)及序列参数集（SPS)有关的技术。视频参数集（VPS)与一或多个经译码视频序列（CVS)相关联。VPS包含针对视频译码扩展的VPS扩展，所述视频译码扩展例如对HEVC的多视图视频译码扩展、可缩放视频译码（SVC)扩展或3D视频译码（3DV)扩展。 VPS扩展包含用于视频数据位流的每一相应层的相应语法元素。对于视频数据位流的每一相应层，当针对相应层的语法元素指示针对所述相应层启用译码工具时，使用所述译码工具解码与一或多个CVS相关联且与相应层相关联的视频数据的至少一部分。当针对相应层的语法元素指示不针对相应层启用译码工具时，不使用所述译码工具解码与CVS相关联且与相应层相关联的视频数据。
[0008] 在一个实例中，本发明描述一种解码视频数据的方法，所述方法包括：从视频数据位流获得针对视频译码扩展的VPS扩展，所述VPS扩展为VPS内的语法结构，所述VPS为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；当所述语法元素指示针对所述一或可应用层启用所述译码工具时，通过使用所述译码工具解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
[0009] 在另一实例中，本发明描述一种视频解码装置，其包括一或多个处理器，所述一或多个处理器经配置以：从视频数据位流获得针对视频译码扩展的VPS扩展，所述VPS扩展为 VPS内的语法结构，所述VPS为可应用于一或多个完整的经译码视频序列的语法结构，所述 VPS扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；当所述语法元素指示针对所述组可应用层启用所述译码工具时，通过使用所述译码工具解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
[0010] 在另一实例中，本发明描述一种视频解码装置，其包括：用于从视频数据位流获得针对视频译码扩展的VPS扩展的装置，所述VPS扩展为VPS内的语法结构，所述VPS为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；用于在所述语法元素指示针对所述组可应用层启用所述译码工具时通过使用所述译码工具解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分的装置；及用于在所述语法元素指示不针对所述组可应用层启用所述译码工具时不使用所述译码工具来解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据的装置。
[0011] 在另一实例中，本发明描述一种计算机可读数据存储媒体，其具有存储于其上的指令，所述指令在被执行时配置视频解码装置以：从视频数据位流获得针对视频译码扩展的VPS扩展，所述VPS扩展为VPS内的语法结构，所述VPS为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；当所述语法元素指示针对所述组可应用层启用所述译码工具时，通过使用所述译码工具解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
[0012] 在另一实例中，本发明描述一种编码视频数据的方法，所述方法包括：在视频数据位流中包含针对视频译码扩展的VPS扩展，所述VPS扩展为VPS内的语法结构，所述VPS为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；及当所述语法元素指示针对所述组可应用层启用所述译码工具时，通过使用所述译码工具编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
[0013] 在另一实例中，本发明描述一种视频编码装置，其包括一或多个处理器，所述一或多个处理器经配置以：在视频数据位流中包含针对视频译码扩展的VPS扩展，所述VPS扩展为VPS内的语法结构，所述VPS为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；当所述语法元素指示针对所述组可应用层启用所述译码工具时，通过使用所述译码工具编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
[0014] 在另一实例中，本发明描述一种视频编码装置，其包括：在视频数据位流中包含针对视频译码扩展的VPS扩展的装置，所述VPS扩展为VPS内的语法结构，所述VPS为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；用于在所述语法元素指示针对所述组可应用层启用所述译码工具时通过使用所述译码工具编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分的装置；及用于在所述语法元素指示不针对所述组可应用层启用所述译码工具时不使用所述译码工具来编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据的装置。
[0015] 在另一实例中，本发明描述一种计算机可读数据存储媒体，其具有存储于其上的指令，所述指令在被执行时配置视频编码装置以：在视频数据位流中包含针对视频译码扩展的VPS扩展，所述VPS扩展为VPS内的语法结构，所述VPS为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；当所述语法元素指示针对所述组可应用层启用所述译码工具时，通过使用所述译码工具编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
[0016] 在随附图式及以下描述中阐明本发明的一或多个实例的细节。根据描述、图式及权利要求书，其它特征、目标及优势将显而易见。

【专利附图】

【附图说明】
[0017] 图1为说明可利用本发明中描述的技术的实例视频译码系统的框图。
[0018] 图2为说明相对于当前预测单元的实例空间运动向量相邻者的概念图。
[0019] 图3为说明实例多视图解码次序的概念图。
[0020] 图4为说明用于多视图译码的实例预测结构的概念图。
[0021] 图5为说明可实施本发明中描述的技术的实例视频编码器的框图。
[0022] 图6为说明可实施本发明中描述的技术的实例视频解码器的框图。
[0023] 图7为说明根据本发明的一或多个实例技术的视频编码器的实例操作的流程图。
[0024] 图8为说明根据本发明的一或多个实例技术的视频解码器的实例操作的流程图。
[0025] 图9为说明根据本发明的一或多个实例技术的视频编码器的实例操作的流程图。
[0026] 图10为说明根据本发明的一或多个实例技术的视频解码器的实例操作的流程图。

【具体实施方式】
[0027] 高效率视频译码（HEVC)为目前在开发中的视频译码规范。正努力产生HEVC的多视图译码扩展（被称作MV-HEVC)及HEVC的三维视频（3DV)扩展（被称作3D-HEVC)。此夕卜，正努力产生HEVC的可缩放视频译码（SVC)扩展（被称作SHEVC)。
[0028] 在MV-HEVC、3D-HEVC及SHEVC中，视频编码器可产生包括一系列网络抽象层（NAL) 单元的位流。位流的不同NAL单元可与位流的不同层相关联。可将层定义为具有相同层识别符的视频译码层（VCL)NAL单元及相关联的非VCL NAL单元的集合。层可等效于多视图视频译码中的视图。在多视图视频译码中，层可含有同一层的具有不同时间实例的所有视图分量。每一视图分量可为在特定时间实例属于特定视图的视频场景的经译码图片。在 3D视频译码中，层可含有特定视图的所有经译码深度图片或特定视图的经译码纹理图片。类似地，在可缩放视频译码的上下文中，层通常对应于具有不同于其它层中的经译码图片的视频特性的经译码图片。此类视频特性通常包含空间分辨率及质量等级（信噪比）。在 HEVC及其扩展中，可通过将具有特定时间等级的一群图片定义为子层来实现时间可调性。
[0029] 对于位流的每一相应层，可在不参考任一较高层中的数据的情况下解码较低层中的数据。举例来说，在可缩放视频译码中，可在不参考增强层中的数据的情况下解码基础层中的数据。NAL单元仅囊封单个层的数据。因此，可从位流中去除囊封位流的最高剩余层的数据的NAL单元，而不影响位流的剩余层中的数据的可解码性。在多视图译码及3D-HEVC 中，较高层可包含额外视图分量。在SHEVC中，较高层可包含信噪比（SNR)增强数据、空间增强数据及/或时间增强数据。在3D-HEVC及SHEVC中，如果视频解码器可在不参考任何其它层的数据的情况下解码视图中的图片，那么可将所述视图称作"基础层"。基础层可符合HEVC基础规范。
[0030] 在3D-HEVC及SHEVC中，各种译码工具可用以提供进一步数据压缩。然而，存在此类译码工具的使用不合需要的若干原因。举例来说，此类译码工具的使用可增加解码视频数据所需的时间量。在另一实例中，能够使用此类译码工具的视频解码器可能比不能够使用此类译码工具的视频解码器显著地更复杂。因此，3D-HEVC及SHEVC提供了用于选择性地指示启用或停用此类译码工具的机制。
[0031] 在HEVC及其扩展中，视频编码器可产生包含一或多个视频参数集（VPS)的位流。 VPS为包含语法元素的语法结构，所述语法元素的值可应用于零或零个以上完整的经译码视频序列。经译码视频序列可包含存取单元序列，其按解码次序由以下各者组成：为位流中的第一存取单元的清洁随机存取（CRA)存取单元、瞬时解码刷新（IDR)存取单元或断链存取（BLA)存取单元、后接续零或零个以上非IDR及非BLA存取单元（包含直到但不包含任何后续IDR或BLA存取单元的所有后续存取单元）。存取单元可为按解码次序连续且含有在一个时间实例出现的经译码图片的一组NAL单元。
[0032] 此外，在HEVC及其扩展中，视频编码器可包含一或多个序列参数集（SPS)。SPS为包含语法元素的语法结构，所述语法元素的值可应用于零或零个以上完整的经译码视频序列。SPS可包含识别可应用于SPS的VPS的语法元素（例如，video_parameter_set_id)。单个VPS可与多个SPS相关联。与单个VPS相关联的SPS可包含具有不同值的语法元素。因此，VPS可应用于一或多个经译码视频序列的第一集合，且包含识别VPS的语法元素的 SPS可为可应用于零或零个以上经译码视频序列的第二集合的语法结构。因此，视频编码器可产生比SPS少的VPS。每一 SPS可包含将所述SPS识别为与特定VPS相关联的语法元素。此外，位流可包含图片参数集（PPS)。每一 PPS为包含语法元素的语法结构，所述语法元素的值可应用于零或零个以上完整的经译码图片。每一 PPS可包含将所述PPS识别为与特定SPS相关联的语法元素。
[0033] 不同HEVC扩展（例如，3D-HEVC、SHEVC等）与包含所述HEVC扩展所特定的语法元素的不同SPS扩展相关联。举例来说，当使用3D-HEVC产生位流时，SPS可包含SPS扩展，所述SPS扩展包含3D-HEVC所特定的一或多个语法元素。在此实例中，SPS扩展可包含： interview_refs_present_flag，其指不是否可使用视图间参考；enable_dmm_flag，其指示是否启用深度图模型化模式；u Se_mvi_flag，其指示是否启用从纹理到深度的运动向量继承；multi_view_mv_pred_flag，其指示是否启用视图间运动向量预测；及multi_view_ residual_pred_flag，其指示是否启用视图间残余预测。
[0034] 以上描述的方案存在若干问题。如上文所提到，位流的基础层符合基础HEVC规范。因此，可应用于基础层的SPS不包含用于HEVC扩展（例如，3D-HEVC、SHEVC等）的SPS 扩展。当位流符合HEVC扩展且除基础层外还包含一或多个层时，可针对不同层启用HEVC 扩展的不同译码工具。因此，视频编码器可能需要产生多个SPS，其中的每一者可应用于同一经译码视频序列的不同层。然而，所述SPS中的每一者可包含与基础HEVC规范相关联且不与HEVC扩展相关联的语法元素。因此，与基础HEVC规范相关联的语法元素可在可应用于同一经译码视频序列的所述层的SPS中的每一者中重复。此情形可能不必要地增大位流的大小。此外，因为每一 PPS仅与单个SPS相关联，所以位流对于每一层可能需要包含一或多个PPS。因为PPS不包含HEVC扩展所特定的语法元素，所以除指示相关联的SPS的语法元素外，所述PPS可为彼此的复制。因此,额外SPS可实际上为位浪费。
[0035] 根据本发明的一或多个技术，视频编码器可在视频数据位流中包含针对视频译码扩展的VPS扩展。VPS扩展可为VPS内的语法结构。VPS自身可为可应用于一或多个完整的经译码视频序列的语法结构。VPS扩展可包含指示是否针对一组可应用层启用与视频译码扩展相关联的译码工具的语法元素。当语法元素指示针对所述组可应用层启用所述译码工具时，视频编码器可通过使用译码工具编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分。当语法元素指示不针对所述组可应用层启用所述译码工具时，视频编码器可能不使用所述译码工具来编码与所述一或多个经译码的视频序列相关联且与所述组可应用层相关联的视频数据。译码工具可包含以下各者中的一或多者：视图间参考的使用、深度图模型化模式的使用、从纹理到深度的运动向量继承的使用、视图间运动向量预测的使用及视图间残余预测的使用。
[0036] 在一个实例中，视频编码器可产生包含表示VPS的数据的位流，所述VPS包含针对 HEVC扩展的VPS扩展。对于位流的每一层，VPS扩展可包含指示是否启用与HEVC扩展相关联的特定译码工具，以用于解码与所述层相关联且与可应用于VPS的经译码视频序列相关联的视频数据。不在用于所述层的SPS扩展中发信这些语法元素。
[0037] 类似地，视频解码器可从视频数据位流获得针对视频译码扩展的VPS扩展。VPS扩展可包含指示是否针对一组可应用层启用与视频译码扩展相关联的译码工具的语法元素。当语法元素指示针对所述一或可应用层启用所述译码工具时，视频解码器可通过使用译码工具解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分。当语法元素指示不针对所述组可应用层启用所述译码工具时，视频解码器可能不使用译码工具来解码与所述一或多个经译码视频序列相关联且与所述组可应用层相关联的视频数据。
[0038] 在一个实例中，VPS扩展可包含针对视频数据位流的每一相应层的相应语法元素。此外，对于视频数据位流的每一相应层，当针对相应层的语法元素指示针对所述相应层启用译码工具时，视频解码器可通过使用所述译码工具解码与经译码视频序列相关联且与相应层相关联的视频数据的至少一部分。当针对相应层的语法元素指示不针对所述相应层启用所述译码工具时，视频解码器可能不使用译码工具来解码与所述经译码视频序列相关联且与所述相应层相关联的视频数据。
[0039] 因为在VPS扩展而不是在SPS的扩展中发信指示是否针对特定层启用译码工具的语法元素，所以位流可能不必包含所述层中的每一者的SPS。因此，所述位流可至少少了表示SPS的基础HEVC规范语法元素所需的位数目。此外，因为在VPS扩展而不是在SPS的扩展中发信语法元素，所以可能不必产生同样多的PPS，从而进一步节省位。
[0040] 图1为说明可利用本发明的技术的实例视频译码系统10的框图。如本文中所使用，术语"视频译码器"一般指视频编码器及视频解码器两者。在本发明中，术语"视频译码"或"译码"一般可指视频编码或视频解码。
[0041] 如图1中所示,视频译码系统10包含源装置12及目的地装置14。源装置12产生经编码视频数据。一般来说，编码视频数据是指产生视频数据的经编码表示。因此，源装置12可被称作视频编码装置或视频编码设备。目的地装置14可解码由源装置12产生的经编码视频数据。一般来说，解码经编码视频数据是指基于经编码视频数据确定像素样本值。因此，目的地装置14可被称作视频解码装置或视频解码设备。源装置12及目的地装置14可为视频译码装置或视频译码设备的实例。
[0042] 源装置12及目的地装置14可包括广泛范围的装置，包含桌上型计算机、移动计算装置、笔记型（例如，膝上型）计算机、平板计算机、机顶盒、电话手持机（例如，所谓的"智能"电话）、电视、摄影机、显示装置、数字媒体播放器、视频游戏控制台、车内计算机或其类似者。
[0043] 目的地装置14可经由信道16从源装置12接收经编码视频数据。信道16可包括能够将经编码视频数据从源装置12移动到目的地装置14的一或多个媒体或装置。在一个实例中，信道16可包括使源装置12能够实时将经编码视频数据直接发射到目的地装置14 的一或多个通信媒体。在此实例中，源装置12可根据例如无线通信协议等通信标准调制经编码视频数据，且可将经调制的视频数据发射到目的地装置14。所述一或多个通信媒体可包含无线及/或有线通信媒体，例如，射频（RF)频谱或一或多个物理传输线。所述一或多个通信媒体可形成例如局域网、广域网或全球网络（例如，因特网）等基于分组网络的部分。所述一或多个通信媒体可包含路由器、交换器、基站或促进从源装置12到目的地装置14的通信的其它装备。
[0044] 在另一实例中，信道16可包含存储由源装置12产生的经编码视频数据的存储媒体。在此实例中，目的地装置14可（例如）经由磁盘存取或卡存取来存取存储媒体。存储媒体可包含多种本地存取的数据存储媒体，例如，蓝光（Blu-ray)光盘、DVD、⑶-ROM、快闪存储器或用于存储经编码视频数据的其它合适的数字存储媒体。
[0045] 在再一实例中，信道16可包含文件服务器或存储由源装置12产生的经编码视频数据的另一中间存储装置。在此实例中，目的地装置14可经由流式传输或下载来存取存储在文件服务器或其它中间存储装置处的经编码视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据发射到目的地装置14的类型的服务器。实例文件服务器包含网络服务器（例如，用于网站）、文件传送协议（FTP)服务器、网络附接存储（NAS)装置及本地磁盘驱动器。
[0046] 目的地装置14可经由标准数据连接（例如，因特网连接）存取经编码视频数据。数据连接的实例类型可包含无线信道（例如，Wi-Fi连接）、有线连接（例如，DSL、电缆调制解调器等）或两者的适合于存取存储在文件服务器上的经编码视频数据的组合。经编码视频数据从文件服务器的传输可为流式传输、下载传输或两者的组合。
[0047] 本发明的技术不限于无线应用或设置。所述技术可应用于支持多种多媒体应用 (例如，空中电视广播、有线电视发射、卫星电视发射、流式视频传输（例如，经由因特网）、用于存储在数据存储媒体上的视频数据的编码、存储在数据存储媒体上的视频数据的解码或其它应用）的视频译码。在一些实例中，视频译码系统10可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频回放、视频广播及/或视频电话等应用。
[0048] 图1仅为实例，且本发明的技术可应用于未必包含编码装置与解码装置之间的任何数据通信的视频译码设置（例如，视频编码或视频解码）。在其它实例中，数据是从本地存储器检索、在网络上流式传输或其类似者。视频编码装置可编码数据且将数据存储到存储器，及/或视频解码装置可从存储器检索数据及解码数据。在许多实例中，编码及解码是由并不彼此通信而仅将数据编码到存储器及/或从存储器检索数据及解码数据的装置来执行。
[0049] 在图1的实例中，源装置12包含视频源18、视频编码器20及输出接口 22。在一些实例中，输出接口 22可包含调制器/解调器（调制解调器）及/或发射器。视频源18 可包含视频捕获装置（例如，视频摄影机）、含有先前捕获的视频数据的视频存档、用以接收来自视频内容提供者的视频数据的视频馈入接口及/或用于产生视频数据的计算机图形系统，或此类视频数据源的组合。
[0050] 视频编码器20可编码来自视频源18的视频数据。在一些实例中，源装置12直接经由输出接口 22将经编码视频数据发射到目的地装置14。在其它实例中，经编码视频数据还可存储到存储媒体或文件服务器上供目的地装置14稍后存取以用于解码及/或回放。
[0051] 在图1的实例中，目的地装置14包含输入接口 28、视频解码器30及显示装置32。在一些实例中，输入接口 28包含接收器及/或调制解调器。输入接口 28可在信道16上接收经编码视频数据。显示装置32可与目的地装置14集成或可在目的地装置14外部。一般来说，显示装置32显示经解码视频数据。显示装置32可包括多种显示装置，例如，液晶显示器（LCD)、等离子显示器、有机发光二极管（OLED)显示器或另一类型的显示装置。
[0052] 视频编码器20及视频解码器30各自可实施为多种合适电路中的任一者，例如，一或多个微处理器、数字信号处理器（DSP)、专用集成电路（ASIC)、现场可编程门阵列 (FPGA)、离散逻辑、硬件或其任何组合。如果所述技术部分地以软件实施，那么装置可将用于软件的指令存储在合适的非暂时性计算机可读存储媒体中，且可使用一或多个处理器执行硬件中的指令以执行本发明的技术。前述（包含硬件、软件、硬件与软件的组合等）中的任一者可被视为一或多个处理器。视频编码器20及视频解码器30中的每一者可包含在一或多个编码器或解码器中，其中的任一者可集成为相应装置中的组合式编码器/解码器 (CODEC)的部分。
[0053] 本发明一般可涉及视频编码器20将某些信息"发信"到另一装置（例如，视频解码器30)。术语"发信"一般可指语法元素及/或用以解码经压缩视频数据的其它数据的传达。此类通信可实时或接近实时地发生。或者，此类通信可在一时间跨度上发生，例如，可能在于编码时以经编码位流将语法元素存储到计算机可读存储媒体时发生，所述语法元素接着可由解码装置在存储到此媒体后的任何时间检索。
[0054] 在一些实例中，视频编码器20及视频解码器30根据例如IS0/IEC MPEG-4 Visual 及ITU-T H. 264(还被称为IS0/IEC MPEG-4 AVC)(包含其可缩放视频译码（SVC)扩展、多视图视频译码（MVC)扩展及基于MVC的3DV扩展）等视频压缩标准操作。在一些情况下，符合基于MVC的3DV的任何合法位流始终含有符合MVC配置文件（例如，立体高配置文件）的子位流。H. 264/AVC标准的附录H描述H. 264/AVC的MVC扩展。此外，正努力产生H. 264/AVC 的三维视频（3DV)译码扩展（即，基于AVC的3DV)。在其它实例中，视频编码器20及视频解码器 30 可根据 ITU-T H. 261、IS0/IEC MPEG-I Visual、ITU-T H. 262 或 IS0/IEC MPEG-2 Visual、ITU-T H. 263、IS0/IEC MPEG-4 Visual 及 ITU-T H. 264、IS0/IEC Visual 操作。
[0055] 在图1的实例中，视频编码器20及视频解码器30可根据目前由ITU-T视频译码专家组（VCEG)与IS0/IEC动画专家组（MPEG)的关于视频译码的联合合作小组开发的高效率视频译码（HEVC)标准操作。被称作"HEVC工作草案7"的即将到来的HEVC标准的草案描述于布洛斯（Bross)等人的"高效率视频译码（HEVC)文本规范草案7 (High Efficiency Video Coding (HEVC) text specification draft 7)"（ITU-T SG16 WP3 与 IS0/IEC JTCl/ SC29/WG11的关于视频译码的联合合作小组（JCT-VC)，2012年5月瑞士日内瓦第9次会议）中。被称作"HEVC工作草案8"的即将到来的HEVC标准的另一草案描述于布洛斯（Bross) 等人的"高效率视频译码（HEVC)文本规范草案8(High Efficiency Video Coding(HEVC) text specification draft 8)"（ITU-T SG16 WP3 与 ISO/IEC JTC1/SC29/WG11 的关于视频译码的联合合作小组（JCT-VC)，2012年7月瑞典斯德哥尔摩第10次会议）中。
[0056] 此外，正努力产生HEVC的SVC、多视图译码及3DV扩展。HEVC的SVC扩展可被称作 HEVC-SVC或SHEVC。HEVC的多视图译码扩展可被称作MV-HEVC。HEVC的3DV扩展可被称作基于HEVC的3DV或3D-HEVC。3D-HEVC至少部分基于以下各文档中提议的解决方案：施瓦尔茨（Schwarz)等人的"Fraunhofer HHI的3D视频译码技术提议的描述（Description of 3D Video Coding Technology Proposal by Fraunhofer HHI)(HEVC 兼容配置 A)，'（IS0/ IEC JTC1/SC29/WG11，文档 MPEG11/M22570,瑞士日内瓦，2011 年 11 月 /12 月，下文称为 "m22570"）及施瓦尔茨（Schwarz)等人的"Fraunhofer HHI的3D视频译码技术提议的描述 (Description of 3D Video Coding Technology Proposal by Fraunhofer HHI)(HEVC 兼容配置 B) "(IS0/IEC JTC1/SC29/WG11，文档 MPEG11/M22571，瑞士日内瓦，2011 年 11 月 /12 月，下文称为"m22571"）。对于3D-HEVC的参考软件描述可在施瓦尔茨（Schwarz)等人的 "基于HEVC的3D视频译码考虑的测试模型（Test Model under Consideration for HEVC based 3D video coding) "（IS0/IEC JTC1/SC29/WG11 MPEG2011/N12559,美国圣何塞，2012 年2月）处获得。从2013年7月18日时起，参考软件（S卩，HTM版本3.0)可从https :// hevc. hhi. fraunhofer. de/svn/svn_3DVCSoftware/tags/HTM_3· 0/ 获得。
[0057] 在HEVC及其它视频译码标准中，视频序列通常包含一系列图片。图片还可被称作"巾贞"。一图片可包含三个样本阵列，表不为Sp Seb& S&。Sli为亮度样本的二维阵列 (即，块）。SaS Cb色度样本的二维阵列。Se^jCr色度样本的二维阵列。在本文中色度 (chrominance)样本还可被称作"色度（chroma)"样本。在其它情况下，图片可为单色的，且可仅包含亮度样本阵列。
[0058] 为了产生图片的经编码表示，视频编码器20可产生一组译码树型单元（CTU)。CTU 中的每一者可包括亮度样本的译码树型块、色度样本的两个对应的译码树型块及用以译码所述译码树型块的样本的语法结构。在单色图片或包括三个分开的颜色平面的图片中，CTU 可包括单个译码树型块及用以译码所述译码树型块的样本的语法结构。译码树型块可为 N X N样本块。CTU还可被称作"树型块"或"最大译码单元"（LCU)。HEVC的CTU可广泛地类似于例如H. 264/AVC等其它视频译码标准的宏块。然而，CTU未必限于特定大小，且可包含一或多个译码单元（CU)。切片可包含按光栅扫描连续排序的整数数目个CTU。
[0059] 本发明可使用术语"视频单元"或"视频块"来指一或多个样本块及用以译码所述一或多个样本块中的样本的语法结构。视频单元的实例类型可包含CTU、CU、PU、变换单元 (TU)、宏块、宏块分割区等等。
[0060] 为了产生经译码CTU，视频编码器20可对CTU的译码树型块递归地执行四叉树分害I]，以将所述译码树型块分成译码块，因此，名为"译码树型单元"。译码块为NXN样本块。 CU可包括具有亮度样本阵列、Cb样本阵列及Cr样本阵列的图片的亮度样本的译码块及色度样本的两个对应的译码块，及用以译码所述译码块的样本的语法结构。在单色图片或包括三个分开的颜色平面的图片中，CU可包括单个译码块及用以译码所述译码块的样本的语法结构。视频编码器20可将CU的译码块分割成一或多个预测块。预测块可为对其应用同一预测的样本的矩形（即，正方形或非正方形）块。CU的预测单元（PU)可包括图片的亮度样本的预测块、色度样本的两个对应的预测块，及用以预测所述预测块样本的语法结构。视频编码器20可产生针对⑶的每一 PU的亮度、Cb及Cr预测块的预测性亮度、Cb及Cr块。在单色图片或包括三个分开的颜色平面的图片中，PU可包括单个预测块及用以译码所述预测块的样本的语法结构。
[0061] 视频编码器20可使用帧内预测或帧间预测来产生用于PU的预测性块。如果视频编码器20使用帧内预测产生PU的预测性块，那么视频编码器20可基于与PU相关联的图片的经解码样本产生PU的预测性块。
[0062] 如果视频编码器20使用帧间预测产生PU的预测性块，那么视频编码器20可基于不同于与PU相关联的图片的一或多个图片的经解码样本产生的预测性块。帧间预测可为单向帧间预测（即，单向预测）或双向帧间预测（即，双向）。为了执行单向或双向，视频编码器20可产生用于当前切片的第一参考图片列表（RefPicListO)及第二参考图片列表 (RefPicListl)。参考图片列表中的每一者可包含一或多个参考图片。当使用单向预测时，视频编码器20可搜索RefPicListO及RefPicListl中的任一者或两者中的参考图片，以确定在参考图片内的参考位置。此外，当使用单向预测时，视频编码器20可至少部分基于对应于参考位置的样本产生用于PU的预测性块。此外，当使用单向预测时，视频编码器20可产生指示PU的预测性块与参考位置之间的空间位移的单个运动向量。为了指示PU的预测性块与参考位置之间的空间位移，运动向量可包含指定PU的预测性块与参考位置之间的水平位移的水平分量，且可包含指定PU的预测性块与参考位置之间的垂直位移的垂直分量。
[0063] 当使用双向预测编码I3U时，视频编码器20可确定RefPicListO中的参考图片中的第一参考位置及RefPicListl中的参考图片中的第二参考位置。视频编码器20可接着至少部分基于对应于第一及第二参考位置的样本产生用于PU的预测性块。此外，当使用双向预测编码PU时，视频编码器20可产生指示PU的样本块与第一参考位置之间的空间位移的第一运动向量，及指示PU的预测块与第二参考位置之间的空间位移的第二运动向量。
[0064] 在视频编码器20产生用于⑶的一或多个PU的预测性亮度、Cb及Cr块后，视频编码器20可产生用于所述CU的亮度残余块。CU的亮度残余块中的每一样本指示CU的预测性亮度块中的一者中的亮度样本与CU的原始亮度译码块中的对应样本之间的差。此外，视频编码器20可产生用于所述⑶的Cb残余块。⑶的Cb残余块中的每一样本可指示⑶ 的预测性Cb块中的一者中的Cb样本与CU的原始Cb译码块中的对应样本之间的差。视频编码器20还可产生用于所述⑶的Cr残余块。⑶的Cr残余块中的每一样本可指示⑶的预测性Cr块中的一者中的Cr样本与CU的原始Cr译码块中的对应样本之间的差。
[0065] 此外，视频编码器20可使用四叉树分割将⑶的亮度、Cb及Cr残余块分解成一或多个亮度、Cb及Cr变换块。变换块可为对其应用相同变换的样本的矩形块。CU的变换单元（TU)可包括亮度样本的变换块、色度样本的两个对应的变换块，及用以变换所述变换块样本的语法结构。因此，CU的每一 TU可与亮度变换块、Cb变换块及Cr变换块相关联。与 TU相关联的亮度变换块可为CU的亮度残余块的子块。Cb变换块可为CU的Cb残余块的子块。Cr变换块可为CU的Cr残余块的子块。在单色图片或包括三个分开的颜色平面的图片中，TU可包括单个变换块及用以译码所述变换块的样本的语法结构。
[0066] 视频编码器20可将一或多个变换应用于TU的亮度变换块以产生用于TU的亮度系数块。系数块可为变换系数的二维阵列。变换系数可为纯量。视频编码器20可将一或多个变换应用于TU的Cb变换块以产生用于TU的Cb系数块。视频编码器20可将一或多个变换应用于TU的Cr变换块以产生用于TU的Cr系数块。
[0067] 在产生了系数块（例如，亮度系数块、Cb系数块或Cr系数块）后，视频编码器20 可将系数块量化。量化通常指变换系数经量化以可能地减少用以表示变换系数的数据量从而提供进一步压缩的过程。此外，视频编码器20可将变换系数反量化，且将反变换应用于变换系数以便重新构造图片的⑶的TU的变换块。视频编码器20可使用⑶的TU的经重新构造的变换块及CU的PU的预测性块以重新构造 CU的译码块。通过重新构造图片的每一 CU的译码块，视频编码器20可重新构造图片。视频编码器20可将经重新构造的图片存储在经解码图片缓冲器（DPB)中。视频编码器20可将DPB中的经重新构造的图片用于帧间预测及帧内预测。
[0068] 在视频编码器20将系数块量化后，视频编码器20可熵编码指示经量化的变换系数的语法元素。举例来说，视频编码器20可对指示经量化的变换系数的语法元素执行上下文自适应性二进制算术译码（CABAC)。视频编码器20可在位流中输出经熵编码的语法元素。
[0069] 视频编码器20可输出包含一序列位的位流，所述序列位形成经译码图片及相关联的数据的表示。位流可包括一序列网络抽象层（NAL)单元。NAL单元中的每一者包含NAL 单元标头且囊封原始字节序列负荷（RBSP)。NAL单元标头可包含指示NAL单元类型码的语法元素。由NAL单元的NAL单元标头指定的NAL单元类型码指示NAL单元的类型。RBSP可为囊封于NAL单元内的含有整数数目个字节的语法结构。在一些情况下，RBSP包含零个位。
[0070] 不同类型的NAL单元可囊封不同类型的RBSP。举例来说，第一种类型的NAL单元可囊封用于图片参数集（PPS)的RBSP，第二种类型的NAL单元可囊封用于经译码切片的 RBSP，第三种类型的NAL单元可囊封用于补充增强信息（SEI)的RBSP，等等。PPS为可含有应用于零或零个以上完整的经译码图片的语法元素的语法结构。囊封用于视频译码数据的 RBSP (与用于参数集及SEI消息的RBSP形成对比）的NAL单元可被称作视频译码层（VCL) NAL单元。囊封经译码切片的NAL单元可在本文中被称作经译码切片NAL单元。经译码切片的RBSP可包含切片标头及切片数据。
[0071] 视频解码器30可接收位流。此外，视频解码器30可剖析位流以从位流获得语法元素。视频解码器30可至少部分基于从位流获得的语法元素重新构造视频数据的图片。用以重新构造视频数据的过程一般可与由视频编码器20执行的过程互逆。举例来说，视频解码器30可使用PU的运动向量来确定用于当前CU的PU的预测性块。视频解码器30可使用PU的一或多个运动向量来产生用于PU的预测性块。
[0072] 此外，视频解码器30可将与当前⑶的TU相关联的系数块反量化。视频解码器30 可对系数块执行反变换，以重新构造与当前CU的TU相关联的变换块。视频解码器30可通过将用于当前CU的PU的预测性样本块的样本加到当前CU的TU的变换块的对应样本来重新构造当前CU的译码块。通过重新构造用于图片的每一 CU的译码块，视频解码器30可重新构造图片。视频解码器30可将经解码图片存储在经解码图片缓冲器中，用于输出及/或用于在解码其它图片时使用。
[0073] 位流中的NAL单元的标头可包含nuh_reserved_zero_6bits语法元素。如果 NAL单元涉及多视图译码、3DV译码或可缩放视频译码中的基础层，那么NAL单元的nuh_ reserved_zero_6bits语法元素等于0。可不参考位流的任何其它层中的数据来解码位流的基础层中的数据。如果NAL单元并不涉及多视图译码、3DV译码或可缩放视频译码中的基础层，那么nuh_reserved_zero_6bits语法元素可具有其它非零值。具体来说，如果NAL 单元并不涉及多视图译码、3DV译码或可缩放视频译码中的基础层，那么NAL单元的nuh_ reserved_zero_6bits语法元素可指定层识别符。
[0074] 此外，层内的一些图片可不参考同一层内的其它图片来解码。因此，可从位流中去除囊封层的某些图片的数据的NAL单元，而不影响所述层中的其它图片的可解码性。举例来说，可不参考具有奇数图片次序计数（POC)值的图片解码具有偶数POC值的图片。POC为与经译码图片相关联的变量，且具有随相对于按解码次序的先前IDR图片（如果存在的话）的按输出次序的图片位置增大而增大的值。去除囊封此类图片的数据的NAL单元可减小位流的帧速率。可不参考层内的其它图片而解码的所述层内的一图片子集可在本文中被称作子层。
[0075] NAL 单兀可包含 nuh_temporal_id_plusl 语法兀素。NAL 单兀的 nuh_temporal_ id_plusl语法元素可指定NAL单元的时间识别符（即，temporal_id)。如果第一 NAL单元的时间识别符小于第二NAL单元的时间识别符，那么可不参考由第二NAL单元囊封的数据解码由第一 NAL单元囊封的数据。
[0076] 位流的操作点各自与一组层识别符（即，一组nuh_reserved_zero_6bits值）及一时间识别符相关联。可将所述组层识别符表示为OpLayerIdSet,且可将时间识别符表示为TemporalID。如果NAL单元的层识别符在操作点的一组层识别符中且NAL单元的时间识别符小于或等于操作点的时间识别符，那么NAL单元与操作点相关联。操作点表示为与操作点相关联的位流子集（即，子位流）。操作点的操作点表示可包含与操作点相关联的每一 NAL单元。操作点表示不包含不与操作点相关联的VCLNAL单元。
[0077] 外部源或装置可指定用于操作点的一组目标层识别符。举例来说，例如媒体感知网络元件（MNE)或内容传递网络（CDN)装置等中间网络装置可指定所述组目标层识别符。在此实例中，中间网络装置可使用所述组目标层识别符来识别操作点。中间网络装置可接着提取操作点的操作点表示，且将操作点表示（而不是原始位流）转发到客户端装置。提取操作点表示且将其转发到客户端装置可减小位流的位速率。
[0078] 视频译码标准指定视频缓冲模型。在H. 264/AVC及HEVC中，缓冲模型被称作"假想参考解码器"或"HRD"。在HEVC工作草案8中，HRD描述于附录C中。
[0079] HRD描述缓冲数据以供解码的方式及缓冲经解码数据以供输出的方式。举例来说， HRD描述经译码图片缓冲器（CPB)、经解码图片缓冲器（"DPB"）及视频解码过程的操作。 CPB为由HRD指定的先进先出缓冲器，其含有呈解码次序的存取单元。DPB为由HRD指定的保持经解码图片以用于参考、输出重新排序或输出延迟的缓冲器。CPB及DPB的行为可用数学方法指定。HRD可直接对时序、缓冲器大小及位速率强加约束。此外，HRD可间接对各种位流特性及统计数据强加约束。
[0080] 在H. 264/AVC及HEVC中，将位流一致性及解码器一致性指定为HRD规范的部分。换句话说，HRD模型指定用以确定位流是否符合标准的测试且指定用以确定解码器是否符合标准的测试。虽然将HRD命名为某一种类的解码器，但视频编码器通常使用HRD来保证位流一致性，而视频解码器通常不需要HRD。
[0081] H. 264/AVC及HEVC皆指定两种类型的位流或HRD -致性，S卩，类型I及类型II。类型I位流为仅含有位流中的所有存取单元的VCL NAL单元及填充数据NAL单元的NAL单元流。类型II位流为除位流中的所有存取单元的VCL NAL单元及填充数据NAL单元外还含有以下各项中的至少一者的NAL单元流：不同于填充数据NAL单元的额外非VCL NAL单元；及来自NAL单元流的形成字节流的所有leading_zero_8bits、zero_byte、start_coded_ prefix_one_3bytes 及 trailing_zero_8bits i吾法兀素。
[0082] 当装置执行确定位流是否符合视频译码标准的位流一致性测试时，装置可选择位流的操作点。装置可接着确定可应用于选定操作点的一组HRD参数。装置可使用可应用于选定操作点的所述组HRD参数来配置HRD的行为。更明确地说，装置可使用所述组可应用的HRD参数来配置HRD的特定组件（例如，假想流调度程序（HSS)、CPB、解码过程、DPB等等）的行为。随后，HSS可根据特定调度将位流的经译码视频数据注入到HRD的CPB内。此夕卜，装置可调用解码CPB中的经译码视频数据的解码过程。解码过程可将经解码图片输出到DPB。当装置移动数据经过HRD时，装置可确定是否仍满足一组特定约束。举例来说，所述装置可在HRD正解码选定操作点的操作点表示时确定在CPB或DPB中是否出现溢出或下溢条件。装置可按此方式选择且处理位流的每一操作点。如果无位流的操作点引起违反约束，那么装置可确定位流符合视频译码标准。
[0083] H. 264/AVC及HEVC皆指定两种类型的解码器一致性，S卩，输出时序解码器一致性及输出次序解码器一致性。声称符合特定配置文件、层及层级的解码器能够成功解码符合例如HEVC等视频译码标准的位流一致性要求的所有位流。在本发明中，"配置文件"可指位流语法的子集。可在每一配置文件内指定"层"及"层级"。层的层级可为强加于位流中的语法元素的值的一组指定约束。这些约束可为对值的简单限制。或者，所述约束可呈对值的算术组合（例如，图片宽度乘以图片高度乘以每秒解码的图片的数目）的约束的形式。通常，针对较低层指定的层级比针对较高层指定的层级更受约束。
[0084] 当装置执行解码器一致性测试以确定被测解码器（DUT)是否符合视频译码标准时，装置可将符合视频译码标准的位流提供到HRD及DUT两者。HRD可按以上关于位流一致性测试描述的方式处理位流。如果由DUT输出的经解码图片的次序匹配由HRD输出的经解码图片的次序，那么装置可确定DUT符合视频译码标准。此外，如果DUT输出经解码图片的时序匹配HRD输出经解码图片的时序，那么装置可确定DUT符合视频译码标准。
[0085] 在H. 264/AVC及HEVC HRD模型中，解码或CPB去除可基于存取单元。即，假设HRD 一次性解码完全的存取单元，且从CPB去除完全的存取单元。此外，在H. 264/AVC及HEVC HRD模型中，假设图片解码为瞬时的。视频编码器20可在图片时序SEI消息中发信解码时间以开始存取单元的解码。在实际应用中，如果符合的视频解码器严格遵照经发信以开始存取单元的解码的解码时间，那么输出特定经解码图片的最早可能时间等于所述特定图片的解码时间加上解码所述特定图片所需的时间。然而，在真实世界中，解码图片所需的时间无法等于零。
[0086] HRD参数可控制HRD的各种方面。换句话说，HRD可依赖于HRD参数。HRD参数可包含初始CPB去除延迟、CPB大小、位速率、初始DPB输出延迟及DPB大小。视频编码器20 可在于视频参数集（VPS)及/或序列参数集（SPS)中指定的hrd_parameters()语法结构中发信这些HRD参数。个别VPS及/或SPS可包含用于不同组的HRD参数的多个hrd_ parameters()语法结构。在一些实例中，视频编码器20可在缓冲周期SEI消息或图片时序SEI消息中发信HRD参数。
[0087] 当视频译码器（例如，视频编码器20或视频解码器30)开始译码图片的当前切片时，视频译码器可初始化第一参考图片列表（即，列表0)。此外，如果当前切片为B切片，那么视频译码器可初始化第二参考图片列表（即，列表1)。本发明可将列表〇称作 "RefPicListO"，且可将列表1称作"RefPicListl"。在视频译码器已初始化了参考图片列表（例如，列表0或列表1)后，视频译码器可修改参考图片列表中的参考图片的次序。换句话说，视频译码器可执行参考图片列表修改（RPLM)过程。视频译码器可按任何次序修改参考图片的次序，包含一个特定参考图片可出现于参考图片列表中的一个以上位置中的情况。
[0088] 在一些情况下，视频译码器20可使用合并模式或高级运动向量预测（AMVP)模式发信PU的运动信息。换句话说，在HEVC中，存在用于运动参数的预测的两个模式，一个为合并模式，且另一个为AMVP。PU的运动信息可包含PU的运动向量及PU的参考索引。当视频编码器20使用合并模式发信当前PU的运动信息时，视频编码器20产生合并候选者列表 (即，运动向量预测值（MVP)候选者列表）。换句话说，视频编码器20可执行运动向量预测值列表构造过程。合并候选者列表包含一组合并候选者（即，MVP候选者）。合并候选者列表可包含指示空间上或时间上相邻于当前PU的的运动信息的合并候选者。即，在合并模式中，在候选者可来自空间及时间相邻块的情况下，构造运动参数（例如，参考索引、运动向量等）的候选者列表。
[0089] 此外，在合并模式中，视频编码器20可从合并候选者列表中选择合并候选者，且可使用由选定合并候选者指示的运动信息作为当前PU的运动信息。视频编码器20可发信选定合并候选者在合并候选者列表中的位置。举例来说，视频编码器20可通过发射在候选者列表内的索引来发信选定运动向量参数。视频解码器30可从位流获得在候选者列表内的索引（即，候选者列表索引）。此外，视频解码器30可产生同一合并候选者列表，且可基于选定合并候选者的位置的指示确定选定合并候选者。视频解码器30可接着使用选定合并候选者的运动信息产生用于当前PU的预测性块。即，视频解码器30可至少部分基于候选者列表索引确定候选者列表中的选定候选者，其中所述选定候选者指定用于当前PU的运动向量。以此方式，在解码器侧，一旦索引经解码，索引指向的对应块的所有运动参数就将由当前I 3U继承。
[0090] 跳过模式类似于合并模式。在跳过模式中，视频编码器20及视频解码器30按与视频编码器20及视频解码器30在合并模式中使用合并候选者列表相同的方式产生及使用合并候选者列表。然而，当视频编码器20使用跳过模式发信当前PU的运动信息时，视频编码器20不发信用于当前PU的任何残余数据。因此，视频解码器30可使用由合并候选者列表中的选定候选者的运动信息指示的参考块作为PU的预测性块。
[0091] AMVP模式在以下方面类似于合并模式：视频编码器20产生候选者列表且从候选者的列表选择候选者。然而，当视频编码器20使用AMVP模式发信当前PU的运动信息时，除发信选定候选者在候选者列表中的位置外，视频编码器20还可发信用于当前PU的运动向量差（MVD)及参考索引。用于当前PU的MVD可指示当前PU的运动向量与来自AMVP候选者列表的选定候选者的运动向量之间的差。在单向预测中，视频编码器20可发信用于当前的一个MVD及一个参考索引。在双向预测中，视频编码器20可发信用于当前PU的两个MVD及两个参考索引。以此方式，视频编码器20可通过发射在候选者列表内的索引来发信选定运动向量，且可发信参考索引值及MVD。换句话说，位流中的表示当前PU的运动向量的数据可包含表示参考索引、候选者列表的索引及MVD的数据。
[0092] 此外，当使用AMVP模式发信当前PU的运动信息时，视频解码器30可从位流获得用于当前PU的MVD及候选者列表索弓丨。视频解码器30可产生同一 AMVP候选者列表，且可基于选定候选者在AMVP候选者列表中的位置的指示确定选定候选者。视频解码器30可通过将MVD加到由选定候选者指示的运动向量来恢复当前PU的运动向量。即，视频解码器30 可至少部分基于由选定候选者指示的运动向量及MVD确定当前PU的运动向量。视频解码器30可接着使用当前PU的所述一或多个经恢复的运动向量来产生用于当前PU的预测性块。
[0093] 如上文所指示，用于合并模式或AMVP的候选者列表可包含基于空间上相邻于当前的PU的候选者。本发明可将此类PU称作空间上相邻PU或空间运动向量相邻者。图 2为说明相对于当前I 3U 40的实例空间运动向量相邻者的概念图。即，PU 40与PU 40的空间上相邻PU之间的实例关系描绘于图2中。在图2的实例中，空间上相邻PU可为覆盖指示为Ap A1 Jtl J1及B 2的位置的PU。当PU的预测性块包含位置时，PU可覆盖所述位置。
[0094] 关于图2的实例，亮度位置（xP，yP)可指定相对于当前图片的左上部亮度样本的 PU 40的左上部亮度样本。此外，变量nPSW及nPSH可分别表示PU 40的按亮度样本计的宽度及高度。相对于当前图片的左上部样本的I3U N的左上部亮度样本为（xN，yN)，其中N表示覆盖位置A。、B。、B 2的PU。对于覆盖位置A。、B。、B 2的PU，可将（xN，yN) 分别定义为（xP-1，yP+nPSH)、（xP-1，yP+nPSH-1)、（xP+nPSW，yP-Ι)、（xP+nPSW-1，yP-Ι)或 (xP-1, yP-1)〇
[0095] 合并候选者列表或AMVP候选者列表中的基于时间上相邻于当前PU的PU(即，在与当前PU不同的时间实例中的TO)的运动信息的候选者可被称作时间运动向量预测值 (TMVP)。为了确定TMVP，视频译码器可首先识别包含与当前PU共同定位的PU的参考图片。换句话说，视频译码器可识别共同定位的图片。如果当前图片的当前切片为B切片（即，被允许包含经双向帧间预测的PU的切片），那么视频编码器20可在切片标头中发信指示共同定位的图片是来自RefPicListO还是RefPicListl的语法元素（例如，collocated_ from_10_flag)。在视频解码器30识别包含共同定位的图片的参考图片列表后，视频解码器30可使用可在切片标头中发信的另一语法元素（例如， C〇ll〇Cated_ref_idX)来识别所识别的参考图片列表中的图片（S卩，共同定位的图片）。
[0096] 视频译码器可通过检查共同定位的图片来识别共同定位的TO。TMVP可指示含有共同定位的PU的CU的右下部PU的运动信息，或在含有此PU的CU的中心PU内的右下部 PU的运动信息。含有共同定位的的CU的右下部PU可为覆盖紧接在所述PU的预测块的右下部样本下方及右边的位置的PU。换句话说，TMVP可指示在参考图片中且覆盖与当前 I3U的右下角共同定位的位置的PU的运动信息，或TMVP可指示在参考图片中且覆盖与当前 PU的中心共同定位的位置的PU的运动信息。
[0097] 当将通过上述过程识别的运动向量用以产生用于合并模式或AMVP模式的运动候选者时，可基于参考图片的时间位置（通过POC值反映）按比例调整运动向量。举例来说，当当前图片的POC值与参考图片之间的差较大时，视频译码器可将运动向量的量值增大比当当前图片的POC值与参考图片之间的差较小时大的量。
[0098] 在多视图译码中，存在同一场景的来自不同视点的多个视图。术语"存取单元"用以指对应于同一时间实例的图片的集合。因此，视频数据可概念化为随时间而出现的一系列存取单元。"视图分量"可为单个存取单元中的视图的经译码表示。在本发明中，"视图" 可指与同一视图识别符相关联的一序列视图分量。
[0099] 图3为说明实例多视图解码次序的概念图。多视图解码次序可为位流次序。在图 3的实例中，每一正方形对应于一视图分量。正方形的列对应于存取单元。可定义每一存取单元以含有一时间实例的所有视图的经译码图片。正方形的行对应于视图。在图3的实例中，将存取单元标记为TO. .. T8,且将视图标记为SO. .. S7。因为在解码存取单元的每一视图分量之后才解码下一个存取单元的任一视图分量，所以图3的解码次序可被称作时间优先译码。存取单元的解码次序可不与视图的输出或显示次序相同。
[0100] 多视图译码支持视图间预测。视图间预测类似于在H. 264/AVC、HEVC或其它视频译码标准中使用的帧间预测，且可使用相同的语法元素。然而，当视频译码器对当前视频单元（例如，宏块或PU)执行视图间预测时，视频译码器可使用与当前视频单元在相同存取单元中但在不同视图中的图片作为参考图片。与此对比，常规帧间预测仅使用在不同存取单元中的图片作为参考图片。
[0101] 在多视图译码中，如果视频解码器（例如，视频解码器30)可不参考任何其它视图中的图片来解码视图中的图片，那么可将所述视图称作"基础视图"。当译码在非基础视图中的一者中的图片时，如果图片在不同视图中但在与视频译码器当前正译码的图片相同的时间实例（即，存取单元）内，那么视频译码器（例如，视频编码器20或视频解码器30)可将所述图片添加到参考图片列表（例如，RefPicListO或RefPicListl)内。如同其它帧间预测参考图片，视频译码器可在参考图片列表中的任一位置处插入视图间预测参考图片。
[0102] 图4为说明用于多视图译码的实例预测结构的概念图。图4的多视图预测结构包含时间预测及视图间预测。在图4的实例中，每一正方形对应于一视图分量。标记为"I" 的正方形为经帧内预测的视图分量。标记为"P"的正方形为经单向帧间预测的视图分量。标记为"B"及"b"的正方形为经双向帧间预测的视图分量。标记为"b"的正方形可使用标记为"B"的正方形作为参考图片。从第一正方形指向第二正方形的箭头指示第一正方形可在帧间预测中用作第二正方形的参考图片。如由图4中的垂直箭头指示，在同一存取单元的不同视图中的视图分量可用作参考图片。将存取单元的一个视图分量用作同一存取单元的另一视图分量的参考图片可被称作视图间预测。
[0103] 在H. 264/AVC的MVC扩展中，视图间预测由差异运动补偿（其使用H. 264/AVC运动补偿的语法）支持，但允许将不同视图中的图片用作参考图片。两个视图的译码还可由 H. 264/AVC的MVC扩展支持。H. 264/AVC的MVC扩展的优势中的一者为：MVC编码器可将两个以上视图当作3D视频输入，且MVC解码器可解码此多视图表示。因此，具有MVC解码器的任何显现器可预期具有两个以上视图的3D视频内容。
[0104] 在H. 264/AVC的MVC扩展中，允许在相同存取单元（S卩，具有相同时间实例）中的图片间的视图间预测。当译码非基础视图中的一者的图片时，如果图片在不同视图中但具有相同时间实例，那么可将所述图片添加到参考图片列表中。可将视图间预测参考图片置于参考图片列表中的任一位置中，正如任一巾贞间预测参考图片一样。
[0105] 3D-HEVC提供同一场景的来自不同视点的多个视图。对于3D-HEVC的标准化努力的部分包含基于HEVC的多视图视频编码解码器的标准化。类似地，在基于HEVC的3DV中，启用基于来自不同视图的经重新构造的视图分量的视图间预测。如H. 264/AVC中的MVC - 样，3D-HEVC支持视图间运动预测。在3D-HEVC中，视图间预测类似于在标准HEVC中使用的运动补偿，且可利用相同或类似的语法元素。然而，当视频译码器对一 PU执行视图间运动预测时，视频译码器可使用与所述PU在相同的存取单元内但在不同视图中的图片作为参考图片。与此对比，常规运动补偿仅使用在不同存取单元中的图片作为参考图片。因此，在3D-HEVC中，基于在同一存取单元的其它视图中的已译码的运动参数来预测或推断在相依视图中的块的运动参数。
[0106] 当使用合并模式或AMVP模式发信当前PU的运动信息时，视频译码器可产生一候选者列表（例如，合并候选者列表或AMVP候选者列表）。在3D-HEVC中，候选者列表可包含可按与候选者列表中的其它候选者相同的方式使用的视图间预测候选者。视图间预测候选者指定参考图片的S卩，参考PU)的运动信息。参考图片可与当前PU在相同的存取单元中，但与当前PU在不同的视图中。为了确定参考PU，视频译码器可执行差异向量构造过程以确定当前PU的差异向量。当前的差异向量可指示当前PU与参考纹理图片内的位置之间的水平空间位移。参考PU可为参考纹理图片的覆盖由差异向量指示的位置的PU。
[0107] 此外，视频编码器20可产生VPS、SPS及PPS。VPS为包含语法元素的语法结构，所述语法元素的值可应用于零或零个以上完整的经译码视频序列。SPS为包含语法元素的语法结构，所述语法元素的值可应用于零或零个以上完整的经译码视频序列。单个VPS可与多个SPS相关联。与单个VPS相关联的SPS可包含具有不同值的语法元素。因此，视频编码器20可产生比SPS少的VPS。每一 SPS可包含将所述SPS识别为与一特定VPS相关联的语法元素。每一 PPS为包含语法元素的语法结构，所述语法元素的值可应用于零或零个以上完整的经译码图片。每一 PPS可包含将所述PPS识别为与一特定SPS相关联的语法元素。
[0108] 在HEVC中，VPS、SPS、PPS机制将不频繁改变的信息的发射与经译码的块数据的发射去耦。在一些应用中，可在带外传送VPS、SPS及PPS。即，在一些情况下，不将VPS、SPS 及PPS与含有经译码视频数据的单元一起输送。带外传输通常可为可靠的。
[0109] 每一 VPS、SPS、PPS及调适参数集（APS)可包含一识别符。在HEVC工作草案7中，使用"ue (V) "译码VPS、SPS、PPS或APS的识别符。换句话说，使用可变长度不带正负号的整数（其使用〇阶指数葛洛姆（Εχρ-Golomb)译码来编码，其中左边的位先开始）译码VPS、 SPS、PPS或APS的识别符。每一 SPS包含一 SPS识别符及一 VPS识别符，每一 PPS包含一 PPS识别符及一 SPS识别符。每一切片标头包含一 PPS识别符（且在HEVC的一些版本中，可能包含一 APS识别符）。
[0110] VPS可主要含有用于2维视频的配置文件/层级及HRD信息。此外，VPS可包含一或多个扩展（即，VPS扩展），其含有与HEVC的扩展（例如，3D-HEVC、SHEVC等）相关联的语法元素。3D-HEVC VPS扩展及SHEVC VPS扩展可包含与一或多个操作点有关的信息。此夕卜，VPS可包含针对会话协商所请求的信息，例如，位速率。
[0111] 通常，序列层级信息参数存在在SPS中。举例来说，SPS包含启用或停用在HEVC基础规范中定义的译码工具的语法元素（例如，旗标）。译码工具可为用于译码视频数据的过程或技术。如VPS -样，SPS可包含一或多个扩展（即，SPS扩展），其含有与HEVC的扩展 (例如，3D-HEVC、SHEVC等）相关联的语法元素。SPS扩展可包含指示在HEVC扩展中定义的译码工具被启用或停用的语法元素。在3D-HEVC中，若干个此类语法元素包含在SPS扩展中。
[0112] 指示特定译码工具是否经启用的语法元素可包含interview_refs_present_ flag、enable_dmm_flag、use_mvi_flag、multi_view_mv_pred_flag 及 multi_view_ residual_pred_flag。interview_refs_present_flag 语法兀素指不是否可使用视图间参考。当使用视图间参考时，视频译码器可至少部分基于与当前图片在不同视图中的参考图片产生用于当前图片的PU的预测性块。enable_dmm_flag语法元素指示深度图模型化 (DMM)模式是否经启用。DMM模式属于基于分割区的深度帧内译码，且经设计以较好地表示深度信息。此类基于分割区的深度帧内译码模式包含深度模型化模式（DMM)。在DMM模式中，通过两个非矩形分割区来译码深度块。使用相邻参考样本预测每一分割区的DC值，且可进一步译码残余值以补偿预测误差。分割区的DC值可为分割区的左上部值。
[0113] use_mvi_flag语法元素指示从纹理到深度的运动向量继承（MVI)是否经启用。当启用从纹理到深度的运动向量继承时，视频译码器可至少部分基于纹理视图分量中的PU 的运动向量确定对应的深度视图分量中的对应I3U的运动向量。
[0114] multi_view_mv_pred_flag语法元素指示视图间运动向量预测是否经启用。当启用视图间运动向量预测时，视频译码器可至少部分基于与当前图片在不同视图中的图片的 I3U的运动向量确定当前图片的PU的运动向量。
[0115] multi_view_residual_pred_flag指示视图间残余预测是否经启用。当启用视图间残余预测时，视频译码器可至少部分基于与当前图片在不同视图中的参考图片的CU的残余数据确定当前图片的CU的残余数据。
[0116] 如在图4的实例中所示，视图向量可将其它视图的视图分量用于参考。此可被称作视图间预测。在多视图译码中，可实现视图间预测，就如同另一视图中的视图分量为帧间预测参考图片一样。然而，如以下在表1中所示，可在SPS MVC扩展中发信可能的视图间参考图片。此外，可通过参考图片列表构造过程来修改可能的视图间参考图片，此允许实现帧间预测或视图间预测参考的灵活排序。下表1为基于AVC的3DV中的SPS MVC扩展的实例语法。
[0117] 表 I --SPS MVC 扩展
[0118]

【权利要求】
1. 一种解码视频数据的方法，所述方法包括：从视频数据位流获得针对视频译码扩展的视频参数集VI^扩展，所述VI^扩展为VPS 内的语法结构，所述为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS 扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法兀素；当所述语法元素指示针对所述一或可应用层启用所述译码工具时，通过使用所述译码工具解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；W及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
2. 根据权利要求1所述的方法，其中所述组可应用层包含所述视频数据位流的不包含基础层的所有层。
3. 根据权利要求1所述的方法，其中所述组可应用层包含所述视频数据位流的所有深度层。
4. 根据权利要求1所述的方法，其中：所述组可应用层仅包含所述视频数据位流的单个层，所述语法元素在所述扩展中的多个语法元素间，所述多个语法元素中的每一语法元素指示是否针对多个层中的单个不同层启用所述译码工具，且所述方法包括，对于所述多个语法元素中的每一语法元素：当所述相应语法元素指示针对所述多个层中的相应层启用所述译码工具时，通过使用所述译码工具解码与所述一或多个完整的经译码视频序列相关联且与所述相应层相关联的视频数据的至少一相应部分；W及当所述相应语法元素指示不针对所述多个层中的所述相应层启用所述译码工具时，不使用所述译码工具来解码与所述一或多个完整的经译码视频序列相关联且与所述相应层相关联的所述视频数据。
5. 根据权利要求4所述的方法，其中所述多个层包含所述视频数据位流的每一层，但所述视频数据位流的基础视图除外。
6. 根据权利要求4所述的方法，其中所述多个层包含所述视频数据位流的每一深度层。
7. 根据权利要求3所述的方法，其进一步包括至少部分基于所述相应层为纹理层还是深度层来确定所述扩展是否包含指示是否针对所述相应层启用所述译码工具的所述语法元素。
8. 根据权利要求1所述的方法，其中：所述一或多个完整的经译码视频序列为一或多个完整的经译码视频序列的第一集合，且所述方法进一步包括从所述视频数据位流获得包含识别所述的语法元素的序列参数集SPS，其中所述SPS为可应用于零或零个W上经译码视频序列的第二集合的语法结构。
9. 根据权利要求1所述的方法，其中所述译码工具包含W下各者中的一者：视图间参考的使用、深度图模型化模式的使用、从纹理到深度的运动向量继承的使用、视图间运动向量预测的使用及视图间残余预测的使用。
10. 根据权利要求1所述的方法，其中所述视频译码扩展包括高效率视频译码肥VC的多视图视频译码扩展、可缩放视频译码SVC扩展或3D视频译码3DV扩展中的一者。
11. 一种视频解码装置，其包括一或多个处理器，所述一或多个处理器经配置W : 从包括多个层的视频数据位流获得针对视频译码扩展的视频参数集扩展，所述扩展为内的语法结构，所述为可应用于一或多个完整的经译码视频序列的语法结构，所述扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；当所述语法元素指示针对所述组可应用层启用所述译码工具时，通过使用所述译码工具解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；W及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
12. 根据权利要求11所述的视频解码装置，其中所述组可应用层包含所述视频数据位流的不包含基础层的所有层。
13. 根据权利要求11所述的视频解码装置，其中所述组可应用层包含所述视频数据位流的所有深度层。
14. 根据权利要求11所述的视频解码装置，其中：所述组可应用层仅包含所述视频数据位流的单个层，所述语法元素在所述扩展中的多个语法元素间，所述多个语法元素中的每一语法元素指示是否针对多个层中的单个不同层启用所述译码工具，且所述一或多个处理器经配置W使得对于所述多个语法元素中的每一语法元素：当所述相应语法元素指示针对所述多个层中的相应层启用所述译码工具时，所述一或多个处理器通过使用所述译码工具解码与所述一或多个完整的经译码视频序列相关联且与所述相应层相关联的视频数据的至少一相应部分；W及当所述相应语法元素指示不针对所述相应层启用所述译码工具时，所述一或多个处理器不使用所述译码工具来解码与所述一或多个完整的经译码视频序列相关联且与所述相应层相关联的所述视频数据。
15. 根据权利要求14所述的视频解码装置，其中所述多个层包含所述视频数据位流的每一层，但所述视频数据位流的基础视图除外。
16. 根据权利要求14所述的视频解码装置，其中所述多个层包含所述视频数据位流的每一深度层。
17. 根据权利要求14所述的视频解码装置，其中所述一或多个处理器经配置W至少部分基于所述相应层为纹理层还是深度层来确定所述扩展是否包含指示是否针对所述相应层启用所述译码工具的所述语法元素。
18. 根据权利要求14所述的视频解码装置，其中：所述一或多个完整的经译码视频序列为一或多个完整的经译码视频序列的第一集合，且所述一或多个处理器经进一步配置W从所述视频数据位流获得包含识别所述VPS的语法元素的序列参数集SPS，其中所述SPS为可应用于零或零个W上经译码视频序列的第二集合的语法结构。
19. 根据权利要求14所述的视频解码装置，其中所述译码工具包含W下各者中的一者：视图间参考的使用、深度图模型化模式的使用、从纹理到深度的运动向量继承的使用、视图间运动向量预测的使用及视图间残余预测的使用。
20. 根据权利要求14所述的视频解码装置，其中所述视频译码扩展包括高效率视频译码肥VC的多视图视频译码扩展、可缩放视频译码SVC扩展或3D视频译码3DV扩展中的一者。
21. -种视频解码装置，其包括：用于从视频数据位流获得针对视频译码扩展的视频参数集扩展的装置，所述VPS 扩展为VPS内的语法结构，所述为可应用于一或多个完整的经译码视频序列的语法结构，所述扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；用于在所述语法元素指示针对所述组可应用层启用所述译码工具时通过使用所述译码工具解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分的装置；W及用于在所述语法元素指示不针对所述组可应用层启用所述译码工具时不使用所述译码工具来解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据的装置。
22. -种计算机可读数据存储媒体，其具有存储于其上的指令，所述指令在被执行时配置视频解码装置W: 从视频数据位流获得针对视频译码扩展的视频参数集扩展，所述扩展为VPS 内的语法结构，所述为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS 扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法兀素；当所述语法元素指示针对所述组可应用层启用所述译码工具时，通过使用所述译码工具解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；W及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来解码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
23. -种编码视频数据的方法，所述方法包括：在视频数据位流中包含针对视频译码扩展的视频参数集扩展，所述扩展为VPS 内的语法结构，所述为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS 扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；W及当所述语法元素指示针对所述组可应用层启用所述译码工具时，通过使用所述译码工具编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；W及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
24. 根据权利要求23所述的方法，其中所述组可应用层包含所述视频数据位流的不包含基础层的所有层。
25. 根据权利要求23所述的方法，其中所述组可应用层包含所述视频数据位流的所有深度层。
26. 根据权利要求23所述的方法，其中：所述组可应用层仅包含所述视频数据位流的单个层，所述语法元素在所述扩展中的多个语法元素间，所述多个语法元素中的每一语法元素指示是否针对多个层中的单个不同层启用所述译码工具，且所述方法包括，对于所述多个语法元素中的每一相应语法元素：当所述相应语法元素指示针对所述多个层中的相应层启用所述译码工具时，通过使用所述译码工具编码与所述一或多个完整的经译码视频序列相关联且与所述相应层相关联的视频数据的至少一相应部分；W及当所述相应语法元素指示不针对所述相应层启用所述译码工具时，不使用所述译码工具来编码与所述一或多个完整的经译码视频序列相关联且与所述相应层相关联的所述视频数据。
27. 根据权利要求26所述的方法，其中所述多个层包含所述视频数据位流的每一层，但所述视频数据位流的基础视图除外。
28. 根据权利要求26所述的方法，其中所述多个层包含所述视频数据位流的每一深度层。
29. 根据权利要求26所述的方法，其进一步包括至少部分基于所述相应层为纹理层还是深度层来确定是否在所述扩展中包含指示是否针对所述相应层启用所述译码工具的所述语法元素。
30. 根据权利要求23所述的方法，其中：所述一或多个完整的经译码视频序列为一或多个完整的经译码视频序列的第一集合，且所述方法进一步包括在所述视频数据位流中包含包含识别所述VPS的语法元素的序列参数集SPS，其中所述SPS为可应用于零或零个W上经译码视频序列的第二集合的语法结构。
31. 根据权利要求23所述的方法，其中所述译码工具包含W下各者中的一者；视图间参考的使用、深度图模型化模式的使用、从纹理到深度的运动向量继承的使用、视图间运动向量预测的使用及视图间残余预测的使用。
32. 根据权利要求23所述的方法，其中所述视频译码扩展包括高效率视频译码肥VC的多视图视频译码扩展、可缩放视频译码SVC扩展或3D视频译码3DV扩展中的一者。
33. -种视频编码装置，其包括一或多个处理器，所述一或多个处理器经配置W : 在视频数据位流中包含针对视频译码扩展的视频参数集扩展，所述扩展为VPS 内的语法结构，所述为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS 扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法兀素；当所述语法元素指示针对所述组可应用层启用所述译码工具时，通过使用所述译码工具编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；W及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
34. 根据权利要求33所述的视频编码装置，其中所述组可应用层包含所述视频数据位流的不包含基础层的所有层。
35. 根据权利要求33所述的视频编码装置，其中所述组可应用层包含所述视频数据位流的所有深度层。
36. 根据权利要求33所述的视频编码装置，其中：所述组可应用层仅包含所述视频数据位流的单个层，所述语法元素在所述扩展中的多个语法元素间，所述多个语法元素中的每一语法元素指示是否针对多个层中的单个不同层启用所述译码工具，且所述一或多个处理器经配置W使得对于所述多个语法元素中的每一语法元素：当所述相应语法元素指示针对所述多个层中的相应层启用所述译码工具时，通过使用所述译码工具编码与所述一或多个完整的经译码视频序列相关联且与所述相应层相关联的视频数据的至少一相应部分；W及当所述相应语法元素指示不针对所述相应层启用所述译码工具时，不使用所述译码工具来编码与所述一或多个完整的经译码视频序列相关联且与所述相应层相关联的所述视频数据。
37. 根据权利要求36所述的视频编码装置，其中所述多个层包含所述视频数据位流的每一层，但所述视频数据位流的基础视图除外。
38. 根据权利要求36所述的视频编码装置，其中所述多个层包含所述视频数据位流的每一深度层。
39. 根据权利要求36所述的视频编码装置，其进一步包括至少部分基于所述相应层为纹理层还是深度层来确定是否在所述扩展中包含指示是否针对所述相应层启用所述译码工具的所述语法元素。
40. 根据权利要求33所述的视频编码装置，其中：所述一或多个完整的经译码视频序列为一或多个完整的经译码视频序列的第一集合，且所述一或多个处理器经进一步配置W在所述视频数据位流中包含包含识别所述VPS 的语法元素的序列参数集SPS，其中所述SPS为可应用于零或零个W上经译码视频序列的第二集合的语法结构。
41. 根据权利要求33所述的视频编码装置，其中所述译码工具包含W下各者中的一者：视图间参考的使用、深度图模型化模式的使用、从纹理到深度的运动向量继承的使用、视图间运动向量预测的使用及视图间残余预测的使用。
42. 根据权利要求33所述的视频编码装置，其中所述视频译码扩展包括高效率视频译码肥VC的多视图视频译码MVC扩展、可缩放视频译码SVC扩展或3D视频译码3DV扩展中的一者。
43. -种视频编码装置，其包括：在视频数据位流中包含针对视频译码扩展的视频参数集扩展的装置，所述扩展为内的语法结构，所述为可应用于一或多个完整的经译码视频序列的语法结构，所述扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法元素；用于在所述语法元素指示针对所述组可应用层启用所述译码工具时通过使用所述译码工具编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分的装置；W及用于在所述语法元素指示不针对所述组可应用层启用所述译码工具时不使用所述译码工具来编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据的装置。
44. 一种计算机可读数据存储媒体，其具有存储于其上的指令，所述指令在被执行时配置视频编码装置W: 在视频数据位流中包含针对视频译码扩展的视频参数集扩展，所述扩展为VPS 内的语法结构，所述为可应用于一或多个完整的经译码视频序列的语法结构，所述VPS 扩展包含指示是否针对一组可应用层启用与所述视频译码扩展相关联的译码工具的语法兀素；当所述语法元素指示针对所述组可应用层启用所述译码工具时，通过使用所述译码工具编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的视频数据的至少一部分；W及当所述语法元素指示不针对所述组可应用层启用所述译码工具时，不使用所述译码工具来编码与所述一或多个完整的经译码视频序列相关联且与所述组可应用层相关联的所述视频数据。
【文档编号】H04N19/70GK104471943SQ201380038243
【公开日】2015年3月25日申请日期:2013年7月19日优先权日:2012年7月20日
【发明者】陈颖申请人:高通股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈颖;
技术所有人：高通股份有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。