视频译码中用于各种维度的译码参数集的制作方法

文档序号:7991437阅读:166来源:国知局
视频译码中用于各种维度的译码参数集的制作方法
【专利摘要】在一个实例中,一种用于对视频数据进行译码的装置包含经配置以进行以下操作的视频译码器:针对位流,对表示对所述位流启用了多个视频译码维度中的哪些视频译码维度的信息进行译码;以及在网络抽象层NAL单元的NAL单元标头中,对所述经启用视频译码维度中的每一者的值进行译码,但不对未经启用的所述视频译码维度的值进行译码,所述NAL单元包括根据所述经启用视频译码维度中的每一者的所述值进行译码的视频数据。以此方式,NAL单元标头可具有可变长度,同时仍提供所述NAL单元所对应于的可分级维度的信息。
【专利说明】视频译码中用于各种维度的译码参数集
[0001]本申请案主张以下美国临时申请案的利益:2011年8月I日申请的第61/513,996号、2011年9月27日申请的第61/539,925号、2011年11月8日申请的第61/557,300号以及2011年11月23日申请的第61/563,359号,所述申请案中的每一者特此以全文引用的方式并入。
【技术领域】
[0002]本发明涉及视频译码。
【背景技术】
[0003]数字视频能力可并入到各种各样的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电话、所谓的“智能电话”、视频电话会议装置、视频流装置等。数字视频装置实施多种视频译码技术,例如由 MPEG-2、MPEG-4、ITU-T H.263、ITU-TH.264/MPEG-4 第 10 部分高级视频译码(AVC)所界定的标准、目前正在开发中的高效视频译码(HEVC)标准以及此些标准的扩展中描述的那些技术。视频装置可通过实施此些视频译码技术来更有效地发射、接收、编码、解码和/或存储数字视频信息。
[0004]视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频片段(例如,视频帧或视频帧的部分)分割成视频块,所述视频块也可被称作树块、译码单元(CU)和/或译码节点。图片的经帧内译码(I)片段中的视频块使用关于同一图片中的相邻块中的参考样本的空间预测来进行编码。图片的经帧间译码(P或B)片段中的视频块可使用关于同一图片中的相邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
[0005]空间或时间预测产生用于待译码的块的预测块。残余数据表示待译码的原始块与预测块之间的像素差。经帧间译码块是根据以下两项来进行编码:指向形成预测块的参考样本的块的运动向量,以及指示经译码块与预测块之间的差的残余数据。经帧内译码块是根据帧内译码模式以及残余数据来进行编码。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,所述残余变换系数接着可被量化。可扫描经量化变换系数(最初排列成二维阵列)以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。

【发明内容】

[0006]一股来说,本发明描述了用于用信号通知视频数据的各种可分级维度的特性的技术。视频数据可按各种不同维度进行分级,例如空间分辨率、帧速率(时间)、视图(例如,为了支持三维(3D)视频播放)、色彩位深度、色度取样格式、质量或其它此类维度。一股来说,视频数据的可分级维度可包含一个或一个以上元素。举例来说,视图维度可包含用于二维视频的单个视图、用于立体视频的两个视图或用于多视图的N个视图(其中N是大于二的整数)。作为另一实例,时间维度可包含用于支持基础帧速率(例如,15个帧每秒(fps))的图片的第一层以及用于支持较高帧速率(例如,30fps、60fps和120fps)的一个或一个以上较高层。本发明的技术大体上涉及用信号通知位流或其子位流是否包含特定维度的多个层且如果是就用信号通知所述维度的特性的值,例如在网络抽象层(NAL)单元标头中,其可包含对用于各种维度的值中的每一者的位数目进行译码。以此方式,本发明的技术能够基于对于位流的不同经译码视频序列可发生改变的信息以及在位流的经译码视频序列内不发生改变的信息来分配每一语法元素的长度,而不是在NAL单元标头中对与一个可分级维度有关的每一语法元素总是使用固定长度的值。
[0007]在一个实例中,一种对视频数据进行译码的方法包含:针对位流,对表示对所述位流启用了多个视频译码维度中的哪些的信息进行译码;以及在网络抽象层(NAL)单元的NAL单元标头中,对表示所述经启用视频译码维度的语法元素的值进行译码,但不对表示未经启用的视频译码维度的语法元素的值进行译码,所述NAL单元包括根据所述经启用视频译码维度中的每一者的值进行译码的视频数据。
[0008]在另一实例中,一种用于对视频数据进行译码的装置包含经配置以进行以下操作的视频译码器:针对位流,对表示对所述位流启用了多个视频译码维度中的哪些的信息进行译码;以及在网络抽象层(NAL)单元的NAL单元标头中,对表示所述经启用视频译码维度的语法元素的值进行译码,但不对表示未经启用的所述视频译码维度的语法元素的值进行译码,所述NAL单元包括根据所述经启用视频译码维度中的每一者的值进行译码的视频数据。
[0009]在另一实例中,一种用于对视频数据进行译码的装置包含:用于针对位流,对表示对所述位流启用了多个视频译码维度中的哪些的信息进行译码的装置;以及用于在网络抽象层(NAL)单元的NAL单元标头中,对表示所述经启用视频译码维度的语法元素的值进行译码,但不对表示未经启用的视频译码维度的语法元素的值进行译码的装置,所述NAL单元包括根据所述经启用视频译码维度中的每一者的值进行译码的视频数据。
[0010]在另一实例中,一种计算机可读存储媒体经编码而具有在执行时致使处理器进行以下操作的指令:针对位流,对表示对所述位流启用了多个视频译码维度中的哪些的信息进行译码;以及在网络抽象层(NAL)单元的NAL单元标头中,对表示所述经启用视频译码维度的语法元素的值进行译码,但不对表示未经启用的所述视频译码维度的语法元素的值进行译码,所述NAL单元包括根据所述经启用视频译码维度中的每一者的值进行译码的视频数据。
[0011]一个或一个以上实例的细节陈述于附图以及以下描述中。其它特征、目标以及优势将从描述和附图以及从权利要求书中显而易见。
【专利附图】

【附图说明】
[0012]图1是说明可利用用于用信号通知视频数据的可分级维度的特性的技术的实例视频编码和解码系统的框图。
[0013]图2是说明可实施用于用信号通知视频数据的可分级维度的特性的技术的视频编码器的实例的框图。
[0014]图3是说明可实施用于用信号通知视频数据的可分级维度的特性的技术的视频解码器的实例的框图。
[0015]图4是说明包含另一组装置的系统的框图,所述另一组装置可执行本发明的用于用信号通知视频数据的可分级维度的特性的技术。
[0016]图5A和5B是说明根据本发明的技术的各种实例的NAL单元标头的实例的概念图。
[0017]图6是说明用于用信号通知视频数据的可分级维度的特性的实例方法的流程图。
[0018]图7是说明用于使用用信号通知的视频数据的可分级维度的特性的实例方法的流程图。
[0019]图8是说明用于用信号通知视频数据的可分级维度的特性以及用于使用用信号通知的视频数据的可分级维度的特性的另一实例方法的流程图。
【具体实施方式】
[0020]一股来说,本发明描述了用于用信号通知视频数据的各种维度的特性的技术。所述维度在本文中可被称作视频译码维度,或为简明起见而简称为“维度”。视频数据可按各种不同维度进行分级,例如空间分辨率、帧速率(时间)、视图(例如,为了支持三维(3D)视频播放)、色彩位深度、色度取样格式、质量或其它此类维度。因此,视频译码维度也可被称作“可分级视频译码维度”或简称为“可分级维度”。
[0021]视频数据的可分级维度可包含一个或一个以上元素。举例来说,视图维度可包含用于二维视频的单个视图、用于立体视频的两个视图或用于多视图的N个视图(其中N是大于二的整数)。作为另一实例,时间维度可包含用于支持基础帧速率(例如,15个帧每秒(fps))的图片的第一层以及用于支持较高帧速率(例如,30fps、60fps和120fps)的一个或一个以上较高层。本发明的技术大体上涉及用信号通知位流或其子位流是否包含用于特定维度的多个元素(例如,多个层)且如果是就用信号通知所述维度的特性的值,例如在网络抽象层(NAL)单元标头中。
[0022]可关于各种音频、视频或其它媒体译码标准来实施本发明的技术。为了举例说明,关于即将到来的高效视频译码(HEVC)标准的技术来论述本发明的技术。然而,应理解,也可针对其它译码标准来实施这些技术。即将到来的HEVC标准的新近草案(被称作HEVC工作草案7或WD7)描述于勃劳斯(Bross)等人的文件HCTVC-11003 “高效视频译码(HEVC)文本规范草案 7 (High Efficiency Video Coding (HEVC) Text Specification Draft7),,中(ITU-T SG16WP3 和 IS0/IEC JTC1/SC29/WG11 的视频译码联合组(JCT-VC)第 9 次会议:瑞士日内瓦,2012年4月27日到2012年5月7日),所述文件截止2012年7月30日都可从 http://phenix.1t-sudparis.eu/jet/doc_end_user/documents/9_Geneva/wgll/JCTVC-11003-v9.zip下载。视频译码标准的其它实例包含ITU-T H.261、IS0/IEC MPEG-1视觉、ITU-T H.262 或 IS0/IEC MPEG-2 视觉、ITU-T H.263、IS0/IEC MPEG-4 视觉以及 ITU-T
H.264(也被称作IS0/IEC MPEG-4AVC)。也可使用各种扩展来扩展视频译码标准。举例来说,ITU-T H.264/AVC包含可分级视频译码(SVC)扩展以及多视图视频译码(MVC)扩展。
[0023]如上文所指出,本发明的技术可用于在NAL单元标头中用信号通知各种可分级维度的特性。NAL单元通常包封较低层数据,例如视频译码层(VCL)数据或非VCL数据。VCL数据通常包含由视频编码器编码且由视频解码器解码的经译码视频数据。非VCL数据可包含对解码来说不是必需的但是对目的地装置来说可能是有用的信令数据。举例来说,非VCL数据可包含补充增强信息(SEI)消息。
[0024]为了进行比较,ITU-T H.264/AVC (本文中也被称作“H.264/AVC” )的MVC扩展中的NAL单元标头含有一字节NAL单元标头,包含NAL单元类型和nal_ref_idc语法元素。另夕卜,如果NAL单元类型是前缀NAL单元或正常MVC NAL单元,那么MVC NAL单元标头可包含MVC NAL单元标头扩展。MVC的NAL单元标头扩展含有以下语法元素:nor_idr_flag,用于指示ML单元是否属于可用于闭合GOP随机存取点的IDR/V-1DR图片;priority_id,其可用于单遍调适;view_id,用于指示当前所属视图的视图识别符;temporal_id,用于指示当前NAL单元的时间等级;anchor_pic_flag,用于指示NAL单元是否属于可用于开放G0P随机存取点的锚图片;以及inter_view_flag,用于指示是否用于其它视图中的NAL单元的视图间预测。MVC中的前缀NAL单元含有NAL单元标头以及其MVC NAL单元标头扩展。
[0025]同样为了进行比较,H.264/AVC的SVC扩展中的NAL单元标头可包含在NAL单元标头扩展中新增的语法元素,所述NAL单元标头扩展将H.264/AVC的常规一字节ML单元标头扩展到四个字节,用于以多个维度描述VCL NAL单元的特性,包含priority_id、temporal_id>dependency_id 以及 quality_id。在 H.264/AVC 的 SVC 扩展中,dependency_id与空间可分级性或粗粒度可分级(CGS)相关,且quality_id指示信噪比(SNR)/质量可分级性。Priority_id与对应NAL单元的优先级识别符相关,且temporal_id指定对应NAL单元的时间识别符(其可用以支持时间可分级性,例如变化的帧速率)。
[0026]再同样为了进行比较,HEVC中的VCL NAL单元包含比H.264/AVC中的NAL单元标头长的NAL单元标头,但是HEVC WD7NAL单元标头中的第一字节目前与H.264/AVC中的NAL单元标头相同。HEVC WD7NAL单元标头还含有temporal_id和output_flag语法元素。
[0027]如上文所示,H.264/AVC、SVC、MVC和HEVC的各种NAL单元标头包含用于支持不同可分级维度的语法元素的不同集合。HEVC可最终经配置以支持多个不同的可分级维度,例如H.264/AVC的SVC和MVC扩展的维度。本发明认识到在尝试支持不同HEVC扩展以便使用各种可分级维度时可能会出现各种问题。举例来说,在不同扩展中,可能需要不同类型的NAL单元标头扩展。通过提供各种不同类型的NAL单元标头扩展,HEVC的最终规范可最后具有多个NAL单元标头扩展语法表,这样对于与处理视频数据有关的装置来说可能会增加复杂性。
[0028]或者,HEVC的最终规范可指明具有用以支持所有可能语法元素的最大数目的位的NAL单元标头。如果NAL单元标头具有唯一的、固定长度的设计,那么语法元素中的许多可被设定为默认值(例如,0),且仅语法元素中的几个可具有设定值,这样造成了位的浪费。换句话说,具有足以同时支持所有可能的可分级维度的位的NAL单元标头可能会在没有用到某些可分级维度时导致位浪费在开销中。
[0029]本发明描述了与用信号通知视频数据的可分级维度的特性有关的各种技术。本发明描述了用于(例如)通过允许NAL单元标头具有可变长度来有效地对可支持各种可分级维度的NAL单元标头进行译码的某些技术。举例来说,维度范围参数集可指示一个或一个以上可分级维度中的哪些对于位流来说是活动的(即,经启用),且可进一步提供指示用以对用于所述活动的可分级维度的值进行译码的位的数目的数据。因此,NAL单元标头可包含用于活动的可分级维度的语法元素,省略了用于非活动的可分级维度(例如,仅具有一个可能值的可分级维度,所述值可改为在单独的数据结构(例如序列参数集(SPS))中用信号通知)的语法元素。以此方式,对于未经启用为可分级的维度(例如,其一个值被用信号通知且保持不变的维度),值无需在NAL单元标头中用信号通知。此外,索引到值映射表可将索引值映射到活动的可分级维度内的值,使得可在NAL单元标头中使用较少位来用信号通知活动的各种可分级维度的特性。
[0030]在另一实例中,NAL单元标头映射可指明NAL单元标头中的字段的布局。就是说,NAL单元标头映射可用于替代上文描述的维度范围参数集。NAL单元标头映射可包含于NAL单元标头映射参数集或序列参数集(SPS)中。一个NAL单元标头映射可应用于一整个位流。使用此实例的NAL单元标头映射可确保可用以添加额外的可分级维度的将来扩展与现有标准和现有扩展后向兼容。此实例的技术也可确保可剖析NAL单元标头和SPS,例如,通过避免NAL单元标头扩展包含在维度范围参数集和SPS中。此外,此实例的NAL单元标头可避免包含模拟开始码的数据,如HEVC WD7中所指明。此外,这些技术可利用与优先级识别符(priority_id)包含在NAL单元标头中(类似于SVC和MAC的priority_id值)相关联的某些益处。
[0031]图1是说明可利用用于用信号通知视频数据的可分级维度的特性的技术的实例视频编码和解码系统10的框图。如图1中所示,系统10包含源装置12,所述源装置提供在稍后时间由目的地装置14解码的经编码视频数据。明确地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12和目的地装置14可包括各种各样的装置中的任一者,包含桌上型计算机、笔记本(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话等电话手持机、所谓的“智能”板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流装置等。在一些情况中,源装置12和目的地装置14可经装备以进行无线通信。
[0032]目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括使得源装置12能够实时地将经编码视频数据直接发射到目的地装置14的通信媒体。经编码视频数据可根据通信标准(例如无线通信协议)进行调制,且发射到目的地装置14。所述通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一个或一个以上物理传输线。所述通信媒体可形成基于包的网络(例如局域网、广域网或例如因特网等全球网络)的部分。所述通信媒体可包含路由器、交换机、基站或可用于促进从源装置12到目的地装置14的通信的任何其它设备。
[0033]在一些实例中,经编码数据可从输出接口 22输出到存储装置。类似地,可通过输入接口从存储装置存取经编码数据。所述存储装置可包含多种分布式或局域存取的数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适数字存储媒体。在另一实例中,所述存储装置可对应于可存储由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含web服务器(例如,用于网站)、FTP服务器、网络附加存储(NAS)装置或本地磁盘驱动器。目的地装置14可通过任何标准数据连接(包含因特网连接)存取经编码视频数据。这可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,W1-Fi连接)、有线连接(例如,DSL、缆线调制解调器等)或两者的组合。经编码视频数据从存储装置的传输可以是流式传输、下载传输或其组合。
[0034]本发明的技术不一定限于无线应用或设置。所述技术可应用于支持多种多媒体应用中的任一者的视频译码,所述多媒体应用例如空中电视广播、有线电视传输、卫星电视传输、因特网流式视频传输(例如,动态自适应HTTP流式传输(DASH))、被编码到数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码、或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,从而支持多种应用,例如视频流式传输、视频播放、视频广播和/或视频电话。
[0035]在图1的实例中,源装置12包含视频源18、视频编码器20以及输出接口 22。目的地装置14包含输入接口 28、视频解码器30以及显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用用于用信号通知视频数据的可分级维度的特性的技术。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18 (例如外部相机)接收视频数据。同样地,目的地装置14可与外部显示装置介接,而不是包含一体式显示装置。
[0036]图1的所说明系统10仅为一个实例。用于用信号通知视频数据的可分级维度的特性的技术可通过任何数字视频编码和/或解码装置执行。虽然一股来说本发明的技术是通过视频编码装置执行,但是所述技术也可通过视频编码器/解码器(通常被称作“编解码器”)执行。此外,本发明的技术也可通过视频预处理器执行。源装置12和目的地装置14仅为此些译码装置的实例,其中源装置12产生用于发射到目的地装置14的经译码视频数据。在一些实例中,装置12、14可按照实大体上对称的方式操作以使得装置12、14中的每一者包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传输,例如用于视频流式传输、视频播放、视频广播或视频电话。
[0037]源装置12的视频源18可包含视频捕获装置(例如摄像机)、含有先前捕获的视频的视频档案和/或用以接收来自视频内容提供商的视频的视频馈送接口。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或将直播视频、存档视频和计算机产生的视频的组合作为源视频。在一些情况中,如果视频源18为摄像机,那么源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而,如上所述,本发明中所描述的技术一股来说可应用于视频译码,且可应用于无线和/或有线应用。在每一种情况中,所捕获、预先捕获或计算机产生的视频都可通过视频编码器20来编码。经编码视频信息可接着通过输出接口 22输出到计算机可读媒体16上。
[0038]计算机可读媒体16可包含暂时性媒体,例如无线广播或有线网络传输,或可包含存储媒体(即,非暂时性存储媒体),例如硬盘、闪存盘、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可从源装置12接收经编码视频数据且将经编码视频数据提供到目的地装置14,例如经由网络传输。类似地,媒体生产设施(例如光盘冲压设施)的计算装置可从源装置12接收经编码视频数据且生产含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体16可被视为包含各种形式的一个或一个以上计算机可读媒体。
[0039]目的地装置14的输入接口28接收来自计算机可读媒体16的信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息,所述语法信息也被视频解码器30使用,所述语法信息包含描述块和其它经译码单元(例如,G0P)的特性和/或处理的语法元素。显示装置32向用户显示经解码视频数据且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、有机发光二极管(0LED)显示器或另一类型的显示装置。
[0040]视频编码器20和视频解码器30可根据视频译码标准(例如目前正在开发中的高效视频译码(HEVC)标准)来操作,且可遵照HEVC测试模型(腿)。或者,视频编码器20和视频解码器30可根据其它专有或产业标准来操作,例如ITU-T H.264标准,或者被称作MPEG-4第10部分高级视频译码(AVC),或此些标准的扩展。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2和ITU-T H.263。尽管图1中未展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当的多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件和软件,以处理对共同数据流或单独数据流中的音频与视频两者的编码。如果适用,MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
[0041]ITU-T H.264/MPEG-4 (AVC)标准是由 ITU-T 视频译码专家组(VCEG)与 IS0/IEC 动画专家组(MPEG) —起制定,作为被称为联合视频小组(JVT)的集体伙伴关系的产品。在一些方面中,本发明中所描述的技术可应用于大体上遵照H.264标准的装置。H.264标准描述于ITU-T研究组提出的且注明日期为2005年3月的ITU-T推荐H.264“用于通用音视频服务的高级视频译码(Advanced Video Coding for generic audiovisual services),,,
H.264标准在本文中可被称作Η.264标准或Η.264规范或H.264/AVC标准或规范。联合视频小组(JVT)继续致力于对H.264/MPEG-4AVC的扩展。
[0042]视频编码器20和视频解码器30各自可实施为多种合适编码器电路中的任一者,例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分地以软件实施时,装置可将用于所述软件的指令存储于合适的非暂时性计算机可读媒体中且使用一个或一个以上处理器在硬件中执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含于一个或一个以上编码器或解码器中,视频编码器和视频解码器中的任一者可作为组合式编码器/解码器(编解码器)的部分而在相应装置中集成。
[0043]JCT-VC正致力于HEVC标准的开发。HEVC标准化努力是基于被称作HEVC测试模型(HM)的视频译码装置的演化模型。HM假定了相对于根据例如ITU-T H.264/AVC的现有装置来说的视频译码装置的若干额外能力。举例来说,尽管H.264提供了九种帧内预测编码模式,但是HM可提供多达三十三种帧内预测编码模式。
[0044]一股来说,HM的工作模型描述了视频帧或图片可被划分成树块或最大译码单元(LCU)的序列,所述树块或最大译码单元包含亮度样本和色度样本两者。位流内的语法数据可界定LCU的大小,LCU是就像素数目来说的最大译码单元。片段包含按译码次序为连续的许多树块。视频帧或图片可被分割成一个或一个以上片段。可根据四叉树将每一树块分裂成译码单元(CU)。一股来说,四叉树数据结构包含每CU—个节点,其中根节点对应于树块。如果⑶分裂成四个子⑶,那么与⑶对应的节点包含四个叶节点,所述叶节点中的每一者对应于子CU中的一者。
[0045]四叉树数据结构的每一节点可提供用于对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,指示与所述节点对应的CU是否分裂成子CU。可递归地定义用于CU的语法元素,且所述语法元素可取决于CU是否分裂成子CU。如果CU不进一步分裂,那么它被称作叶CU。在本发明中,叶CU的四个子CU也将被称作叶CU,即使原始叶CU没有明确地分裂。举例来说,如果16X 16大小的⑶不进一步分裂,那么四个8X8子⑶也将被称作叶⑶,尽管16 X 16⑶从未分裂。
[0046]CU具有与H.264标准的宏块类似的用途,除了 CU不具有大小差别之外。举例来说,树块可分裂成四个子代节点(也被称作子CU),且每一子代节点又可为父代节点且分裂成另外四个子代节点。最后的、不分裂的子代节点(被称作四叉树的叶节点)包括译码节点,也被称作叶CU。与经译码位流相关联的语法数据可界定树块可分裂的最大次数(被称作最大CU深度),且还可界定译码节点的最小大小。因此,位流也可界定最小译码单元(SCU)。本发明使用术语“块”来指代HEVC的上下文中的CU、PU或TU中的任一者或其它标准的上下文中的类似数据结构(例如,H.264/AVC中的宏块和子块)。
[0047]CU包含译码节点以及与所述译码节点相关联的预测单元(PU)和变换单元(TU)。⑶的大小对应于译码节点的大小且形状必须是正方形。⑶的大小可从8X8个像素一直到树块的大小(最大为64X64个像素或更大)。每一⑶可含有一个或一个以上I3U和一个或一个以上TU。与CU相关联的语法数据可描述(例如)CU分割成一个或一个以上I3U的情况。在CU是以跳过或直接模式编码、帧内预测模式编码还是帧间预测模式编码之间,分割模式可不同。PU可经分割而具有非正方形形状。与CU相关联的语法数据也可描述(例如)根据四叉树将⑶分割成一个或一个以上TU的情况。TU可为正方形或非正方形(例如,矩形)形状。
[0048]HEVC标准允许根据TU进行变换,TU对于不同⑶来说可为不同的。TU通常基于针对经分割IXU界定的给定⑶内的I3U的大小来定尺寸,但情况可能并非总是如此。TU通常与PU大小相同或小于PU。在一些实例中,可使用被称作“残余四叉树”(RQT)的四叉树结构将与CU对应的残余样本再分成较小单元。RQT的叶节点可被称作变换单元(TU)。可对与TU相关联的像素差值进行变换以产生变换系数,所述变换系数可被量化。
[0049]叶⑶可包含一个或一个以上预测单元(PU)。一股来说,I3U表示与对应⑶的全部或一部分对应的空间区域,且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关的数据。举例来说,当PU以帧内模式编码时,用于所述的数据可包含于残余四叉树(RQT)中,所述残余四叉树可包含描述与所述PU对应的TU的帧内预测模式的数据。作为另一实例,当PU以帧间模式编码时,PU可包含界定用于所述PU的一个或一个以上运动向量的数据。界定用于PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分离、用于运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片和/或用于运动向量的参考图片列表(例如,列表O、列表I或列表C)。
[0050]具有一个或一个以上I3U的叶⑶也可包含一个或一个以上变换单元(TU)。如上文所论述,可使用RQT (也被称作TU四叉树结构)来指定变换单元。举例来说,分裂旗标可指示叶CU是否分裂成四个变换单元。接着,可将每一变换单元进一步分裂成另外的子TU。当TU不进一步分裂时,它可被称作叶TU。一股来说,对于帧内译码,属于叶CU的所有叶TU共享同一种帧内预测模式。就是说,通常应用同一种帧内预测模式来计算叶CU的所有TU的预测值。对于帧内预测,视频编码器可使用帧内预测模式计算每一叶TU的残余值,为与所述TU对应的⑶部分与原始块之间的差。TU不一定限于ro的大小。因此,TU可大于或小于ro。对于帧内译码,可将ro与同一⑶的对应叶TU并置。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
[0051]此外,叶⑶的TU也可与相应四叉树数据结构(被称作残余四叉树(RQT))相关联。就是说,叶⑶可包含指示如何将叶⑶分割成TU的四叉树。TU四叉树的根节点通常对应于叶CU,而⑶四叉树的根节点通常对应于树块(或LCU)。RQT的未分裂TU被称作叶TU。一股来说,本发明使用术语CU和TU分别指代叶CU和叶TU,除非另外指出。
[0052]视频序列通常包含一连串视频帧或图片。图片组(G0P)通常包括一连串一个或一个以上视频图片。G0P可在G0P的标头、图片中的一者或一者以上的标头或别处包含语法数据,所述语法数据描述G0P中所包含的图片数目。图片的每一片段可包含描述相应片段的编码模式的片段语法数据。视频编码器20通常对个别视频片段内的视频块起作用以便对视频数据进行编码。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据所指定的译码标准而具有不同大小。
[0053]作为一实例,HM支持按各种TO大小进行的预测。假定特定⑶的大小是2NX 2N,那么HM支持TO大小为2NX2N或NXN的帧内预测以及对称TO大小为2NX2N、2NXN、NX2N或NXN的帧间预测。HM还支持TO大小为2NXnU、2NXnD、nLX 2N和nRX 2N的巾贞间预测的不对称分割。在不对称分割中,CU的一个方向不进行分割,而另一方向被分割成25%和75%。对应于25%分割的CU部分由“η”之后跟着“Up (上)”、“Down (下)”、“Left (左)”或“Right (右)”等指示来指示。因此,举例来说,“2NXnU”指代被水平地分割成2NX0.5NPU 在上且 2NX 1.5N PU 在下的 2NX 2N CU。
[0054]在本发明中,“NXN”与“N乘N”可互换使用以指代视频块在垂直和水平维度方面的像素维度,例如16X 16像素或16乘16像素。一股来说,16X16的块将在垂直方向上具有16个像素(y=16)且在水平方向上具有16个像素(x=16)。同样地,NXN的块通常在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可排列成行和列。此外,块在水平方向上无需一定具有与垂直方向上相同数目的像素。举例来说,块可包括NX Μ个像素,其中Μ未必等于Ν。
[0055]在使用CU的PU进行帧内预测或帧间预测译码之后,视频编码器20可计算CU的TU的残余数据。ro可包括描述在空间域(也被称作像素域)中产生预测像素数据的方法或模式的语法数据,且在对残余视频数据应用变换之后,TU可包括变换域中的系数,所述变换例如离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含用于CU的残余数据的TU,且接着对所述TU进行变换以产生用于CU的变换系数。
[0056]在进行任何变换以产生变换系数之后,视频编码器20可执行变换系数的量化。量化大体上是指将变换系数量化以可能地减少用于表示系数的数据量从而提供进一步压缩的过程。量化过程可减少与系数中的一些或全部相关联的位深度。举例来说,在量化期间,可将η位值向下舍入到m位值,其中η大于m。
[0057]在量化之后,视频编码器可扫描变换系数,从而从包含经量化变换系数的二维矩阵产生一维向量。所述扫描可经设计以将较高能量(且因此较低频率)系数放置于阵列的前部且将较低能量(且因此较高频率)系数放置于阵列的后部。在一些实例中,视频编码器20可利用预定义的扫描次序来扫描经量化变换系数,以产生可经熵编码的经串行化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可对所述一维向量进行熵编码,例如,根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法。视频编码器20也可对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30在解码视频数据过程中使用。
[0058]为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待发射的符号。所述上下文可(例如)与所述符号的相邻值是否非零有关。为了执行CAVLC,视频编码器20可为待发射的符号选择可变长度码。VLC中的码字可经建构,使得相对较短的码对应于概率较大的符号,而较长的码对应于概率较小的符号。以此方式,VLC的使用可相较于(例如)为待发射的每一符号使用等长码字实现位节省。概率确定可基于指派给符号的上下文。
[0059]一股来说,本发明描述了可通过源装置12、目的地装置14、视频编码器20、视频解码器30或视频数据的处理、输送、存储或检索中所涉及的其它装置执行的各种技术。为了举例说明,关于视频编码器20和视频解码器30来描述本发明的技术。然而,其它装置也可经配置而具有这些技术中的任一者或全部,例如视频预处理或后处理单元、包封器、解包封器、多路复用器、多路分用器、具有媒体知识的网络元件(MANE)或与视频数据的处理有关的其它装置。各种技术可独自地执行或以任何组合一起执行。
[0060]本发明引入了维度范围参数集,所述维度范围参数集可通过视频编码器20和视频解码器30进行译码。维度范围参数集可指定关于某一位流的每一可分级维度中的可分级性等级的范围。举例来说,维度范围参数集可指定以下各项中的任一者或全部的范围:空间维度、时间维度、SNR/质量维度、视图维度、色彩位深度维度、色度取样格式维度或其它此类可分级维度。维度范围参数集可应用于整个位流。换句话说,视频编码器20可对所述位流的所有视频数据进行编码,使得经编码视频数据与在维度范围参数集中用信号通知的数据一致,同时视频解码器30可至少部分地基于在维度范围参数集中用信号通知的数据对所述位流的所有经译码视频数据进行解码。
[0061]在位流中,NAL单元的属于特定可分级维度的特性可或不可发生变化,如由维度范围参数集的数据指示。举例来说,如果可分级维度的特定特性不发生变化且位流在所述特定可分级维度方面不是可分级的,那么无需在NAL单元标头中用信号通知所述特性。
[0062]如果可分级维度的特性可发生变化且具有N个可能的值,如由维度范围参数集指示,那么可分配NAL单元标头内的特定数目的位来表示所述可分级维度的特性。举例来说,假定N是整数,可分配NAL单元标头内的ceil (1g2 (N))个位来表示所述特性,其中ceil (X)返回X的“上限”或向上舍入值(向上舍入到下一个最近整数,假定所返回的值不是整数)。
[0063]视频编码器20可共同地用信号通知,且视频解码器30可共同地检索,作为特性集的在NAL单元标头中的所有可能维度的所有特性。所述特性集可映射到所有维度的所有特性。
[0064]维度的特性可发生变化。不是用信号通知可分级维度的真实值,而是在一些实例中,视频编码器20和视频解码器30可对可分级维度的真实值的索引值进行译码。举例来说,不是用信号通知视图维度的视图的view_id值,而是视频编码器20和视频解码器30可对视图次序索引值进行译码,所述视图次序索引值可通过单独的映射表映射到相应view_id值。作为另一实例,位流的位深度可分级维度可包含8位、10位和12位信号。不是针对此些色彩位深度在NAL单元标头中用信号通知“8”、“10”和“12”,而是视频编码器20和视频解码器30可使用值和“2”,所述值同样可分别映射到“8”、“10”和“12”。因此,视频编码器20和视频解码器30可经配置以对用于位流的索引到值映射表进行译码。所述索引到值映射表可形成维度范围参数集的部分,或可作为单独的数据集来进行译码。此映射表可应用于特定经译码视频序列或整个位流。
[0065]本发明还描述可应用于子位流提取的技术。当位流包含一个或一个以上可分级维度时,一些目的地装置可请求特定维度的各种等级,而其它目的地装置可仅请求所述特定维度的单个等级,例如,基础等级。网络内的具有媒体知识的网络元件(MANE)(图1中未展示,但可大体上对应于沿连接16的装置)可执行子位流提取以将所请求数据提供给各种目的地装置。
[0066]举例来说,视图维度可包含多个不同视图。一个目的地装置可以能够进行多视角三维播放,且可因此请求所有可用视图。因此,MANE可将包含所有可用视图的子位流(或全位流)提供给此目的地装置。另一目的地装置可仅能够进行立体三维播放,因此所述目的地装置仅请求两个视图。因此,不是将所有视图发送给此目的地装置,而是MANE可提取仅具有两个视图的子位流且将此子位流发送给所述目的地装置。
[0067]根据本发明的技术,执行子位流提取的装置(例如,MANE)可修改维度范围参数集以及索引到值映射表(如果提供的话),使得所提取子位流中的NAL单元的NAL单元标头消耗比全位流中的对应NAL单元的原始NAL单元标头少的位。举例来说,在目的地装置仅能够进行立体三维播放且接收具有(例如)映射到view_id32和159的视图次序索引“1”和“7”的视图的上述情况中,MANE可将所述视图次序索引的值分别调整为“0”和“1”,且调整映射表以将视图次序索引“0”映射到View_id32且将视图次序索引“1”映射到view_idl59。
[0068]下表1提供了用于维度范围参数集的语法的实例集合:
[0069]表1
[0070]
dim_range_parameter_set_data () {C 描述符
dim—parametersetidu(16)
temporalidcntbitu(3)
chroma—formatcnt—bit0 u(2)
【权利要求】
1.一种对视频数据进行译码的方法,所述方法包括: 针对位流,对表示对所述位流启用了多个视频译码维度中的哪些视频译码维度的信息进行译码;以及 在网络抽象层NAL单元的NAL单元标头中,对表示所述经启用视频译码维度的语法元素的值进行译码,但不对表示未经启用的所述视频译码维度的语法元素的值进行译码,所述NAL单元包括根据所述经启用视频译码维度中的每一者的所述值进行译码的视频数据。
2.根据权利要求1所述的方法,其中对所述经启用视频译码维度中的每一者的所述值进行译码包括: 对于所述经启用视频译码维度中的每一者,确定用于对所述相应值进行译码的用于所述语法元素的位的相应数目;以及 基于所述经确定的位的相应数目对所述经启用视频译码维度的所述语法元素的所述值进行译码。
3.根据权利要求2所述的方法,其进一步包括对于所述位流的所有视频数据,推断出未经启用的所述视频译码维度的默认值。
4.根据权利要求2所述的方法,其中所述多个视频译码维度包括多个可分级视频译码维度, 其中所述多个可分级视频译码维度包括优先级维度、空间维度、时间维度、信噪比SNR维度、质量维度、视图维度、色彩位深度维度、色度(chroma)取样格式维度以及依赖维度中的一者或一者以上。
5.根据权利要求2所述的方法,其中对所述表示启用了所述多个视频译码维度中的哪些视频译码维度的信息进行译码包括对维度范围参数集进行译码。
6.根据权利要求5所述的方法,其进一步包括对序列参数集的维度范围参数集识别符元素的值进行译码以对应于所述维度范围参数集。
7.根据权利要求2所述的方法,其中对所述表示启用了所述多个视频译码维度中的哪些视频译码维度的信息进行译码包括对NAL单元标头映射进行译码。
8.根据权利要求2所述的方法,其进一步包括对表示所述NAL单元标头中的位与所述经启用视频译码维度之间的对应的信息进行译码。
9.根据权利要求2所述的方法,其中所述经启用视频译码维度中的一者或一者以上的所述值包括进入所述相应经启用视频译码维度的可能值的相应集合中的索引值,所述方法进一步包括确定所述索引值中的每一者与所述相应索引值所映射到的所述相应集合的所述值中的一者之间的映射。
10.根据权利要求9所述的方法,其进一步包括对索引到值映射表进行译码,所述索引到值映射表包含定义所述值包括索引值的所述经启用视频译码维度中的所述一者或一者以上的所述映射的信息。
11.根据权利要求9所述的方法,其中所述经启用视频译码维度中的一者包括视图维度,其中对所述索引值进行译码包括在所述NAL单元标头中对所述视图维度的视图次序索引值进行译码,且其中确定所述映射包括确定所述视图次序索引值与所述视图维度的视图识别符(view_id)值之间的映射。
12.根据权利要求9所述的方法,其中确定所述映射包括根据视频译码器的预定义配置数据确定所述映射。
13.根据权利要求2所述的方法,其进一步包括基于所述经启用视频译码维度中的每一者的所述值对所述NAL单元的所述视频数据进行译码。
14.根据权利要求13所述的方法,其中对所述视频数据进行译码包括基于所述经启用视频译码维度中的每一者的所述值对所述视频数据进行解码。
15.根据权利要求13所述的方法,其中对所述视频数据进行译码包括基于所述经启用视频译码维度中的每一者的所述值对所述视频数据进行编码。
16.一种用于对视频数据进行译码的装置,所述装置包括经配置以进行以下操作的视频译码器:针对位流,对表示对所述位流启用了多个视频译码维度中的哪些视频译码维度的信息进行译码;以及在网络抽象层NAL单元的NAL单元标头中,对表示所述经启用视频译码维度的语法元素的值进行译码,但不对表示未经启用的所述视频译码维度的语法元素的值进行译码,所述NAL单元包括根据所述经启用视频译码维度中的每一者的所述值进行译码的视频数据。
17.根据权利要求16所述的装置,其中为了对所述经启用视频译码维度中的每一者的所述值进行译码,所述视频译码器经配置以:对于所述经启用视频译码维度中的每一者,确定用于表示所述相应值的位的相应数目;以及基于所述经确定的位的相应数目对所述经启用视频译码维度中的每一者的所述值进行译码。
18.根据权利要求17所述的装置,其中所述多个视频译码维度包括多个可分级视频译码维度,其中所述多个可分级视频译码维度包括优先级维度、空间维度、时间维度、信噪比SNR维度、质量维度、视图维度、色彩位深度维度、色度(chroma)取样格式维度以及依赖维度中的一者或一者以上。
19.根据权利要求17所述的装置,其中为了对所述表示启用了所述多个视频译码维度中的哪些视频译码维度的信息进行译码,所述视频译码器经配置以对维度范围参数集进行译码。
20.根据权利要求17所述的装`置,其中为了对所述表示启用了所述多个视频译码维度中的哪些视频译码维度的信息进行译码,所述视频译码器经配置以对NAL单元标头映射进行译码。
21.根据权利要求20所述的装置,其中为了对所述NAL单元标头映射进行译码,所述视频译码器经配置以对包括用于所述NAL单元标头映射的数据的NAL单元标头映射参数集NPS和包括用于所述NAL单元标头映射的数据的序列参数集SPS中的至少一者进行译码。
22.根据权利要求17所述的装置,其中所述视频译码器经配置以对于所述位流的所有视频数据,推断出未经启用的所述视频译码维度的默认值。
23.根据权利要求17所述的装置,其中所述经启用视频译码维度中的一者或一者以上的所述值包括进入所述相应经启用视频译码维度的可能值的相应集合中的索引值,且其中所述视频译码器经配置以确定所述索引值中的每一者与所述相应索引值所映射到的所述相应集合的所述值中的一者之间的映射。
24.根据权利要求23所述的装置,其中所述视频译码器经进一步配置以对索引到值映射表进行译码,所述索引到值映射表包含定义所述值包括索引值的所述经启用视频译码维度中的所述一者或一者以上的所述映射的信息。
25.根据权利要求23所述的装置,其中所述经启用视频译码维度中的一者包括视图维度,其中为了对所述索引值进行译码,所述视频译码器经配置以在所述NAL单元标头中对所述视图维度的视图次序索引值进行译码,且其中为了确定所述映射,所述视频译码器经配置以确定所述视图次序索引值与所述视图维度的视图识别符(view_id)值之间的映射。
26.根据权利要求17所述的装置,其中所述视频译码器经进一步配置以基于所述经启用视频译码维度中的每一者的所述值对所述NAL单元的所述视频数据进行译码。
27.根据权利要求26所述的装置,其中所述视频译码器包括视频解码器。
28.根据权利要求26所述的装置,其中所述视频译码器包括视频编码器。
29.根据权利要求16所述的装置,其中所述装置包括以下各项中的至少一者:集成电路;微处理器;以及包含所述视频译码器的无线通信装置。
30.一种用于对视频数据进行译码的装置,所述装置包括:用于针对位流对表示对所述位流启用了多个视频译码维度中的哪些视频译码维度的信息进行译码的装置;以及用于在网络抽象层NAL单元的NAL单元标头中对表示所述经启用视频译码维度的语法元素的值进行译码但不对表示未经启用的所述视频译码维度的语法元素的值进行译码的装置,所述NAL单元包括根据所述经启用视频译码维度中的每一者的所述值进行译码的视频数据。
31.根据权利要求30所述的装置,其中所述用于对所述经启用视频译码维度中的每一者的所述值进行译码的装置包括:用于对于所述经启用视频译码维度中的每一者确定用于表示所述相应值的位的相应数目的装置;以及用于基于所述经确定的位的相应数目对所述经启用视频译码维度中的每一者的所述值进行译码的装置。
32.根据权利要求31所述的装置,其中所述多个视频译码维度包括多个可分级视频译码维度,其中所述多个可分级视频译码维度包括优先级维度、空间维度、时间维度、信噪比SNR维度、质量维度、视图维度、色彩位深度维度、色度(chroma)取样格式维度以及依赖维度中的一者或一者以上。
33.根据权利要求31所述的装置,其中所述用于对所述表示启用了所述多个视频译码维度中的哪些视频译码维度的信息进行译码的装置包括用于对维度范围参数集和NAL单元标头映射中的至少一者进行译码的装置。
34.根据权利要求31所述的装置,其中所述经启用视频译码维度中的一者或一者以上的所述值包括进入所述相应经启用视频译码维度的可能值的相应集合中的索引值,所述装置进一步包括:用于确定所述索引值中的每一者与所述相应索引值所映射到的所述相应集合的所述值中的一者之间的映射的装置;以及用于对索引到值映射表进行译码的装置,所述索引到值映射表包含定义所述值包括索引值的所述经启用视频译码维度中的每一者的所述映射的信息。
35.根据权利要求34所述的装置,其中所述经启用视频译码维度中的一者包括视图维度,其中所述用于对所述索引值进行译码的装置包括用于在所述NAL单元标头中对所述视图维度的视图次序索引值进行译码的装置,且其中所述用于确定所述映射的装置包括用于确定所述视图次序索引值与所述视图维度的视图识别符(view_id)值之间的映射的装置。
36.根据权利要求31所述的装置,其进一步包括用于基于所述经启用视频译码维度中的每一者的所述值对所述NAL单元的所述视频数据进行译码的装置。
37.根据权利要求36所述的装置,其中所述用于对所述视频数据进行译码的装置包括用于基于所述经启用视频译码维度中的每一者的所述值对所述视频数据进行解码的装置。
38.根据权利 要求36所述的装置,其中所述用于对所述视频数据进行译码的装置包括用于基于所述经启用视频译码维度中的每一者的所述值对所述视频数据进行编码的装置。
39.一种上面存储有指令的计算机可读存储媒体,所述指令在执行时致使处理器进行以下操作: 针对位流,对表示对所述位流启用了多个视频译码维度中的哪些视频译码维度的信息进行译码;以及 在网络抽象层NAL单元的NAL单元标头中,对表示所述经启用视频译码维度的语法元素的值进行译码,但不对表示未经启用的所述视频译码维度的语法元素的值进行译码,所述NAL单元包括根据所述经启用视频译码维度中的每一者的所述值进行译码的视频数据。
40.根据权利要求39所述的计算机可读存储媒体,其中所述致使所述处理器对所述经启用视频译码维度中的每一者的所述值进行译码的指令包括致使所述处理器进行以下操作的指令: 对于所述经启用视频译码维度中的每一者,确定用于表示所述相应值的位的相应数目;以及 基于所述经确定的位的相应数目对所述经启用视频译码维度中的每一者的所述值进行译码。
41.根据权利要求40所述的计算机可读存储媒体,其中所述多个视频译码维度包括多个可分级视频译码维度,其中所述多个可分级视频译码维度包括优先级维度、空间维度、时间维度、信噪比SNR维度、质量维度、视图维度、色彩位深度维度、色度(chroma)取样格式维度以及依赖维度中的一者或一者以上。
42.根据权利要求40所述的计算机可读存储媒体,其中所述致使所述处理器对所述表示启用了所述多个视频译码维度中的哪些视频译码维度的信息进行译码的指令包括致使所述处理器对维度范围参数集和NAL单元标头映射中的至少一者进行译码的指令。
43.根据权利要求40所述的计算机可读存储媒体,其中所述经启用视频译码维度中的一者或一者以上的所述值包括进入所述相应经启用视频译码维度的可能值的相应集合中的索引值,所述计算机可读存储媒体进一步包括致使所述处理器进行以下操作的指令: 确定所述索引值中的每一者与所述相应索引值所映射到的所述相应集合的所述值中的一者之间的映射;以及 对索引到值映射表进行译码,所述索引到值映射表包含定义所述值包括索引值的所述经启用视频译码维度中的每一者的所述映射的信息。
44.根据权利要求43所述的计算机可读存储媒体,其中所述经启用视频译码维度中的一者包括视图维度,其中所述致使所述处理器对所述索引值进行译码的指令包括致使所述处理器在所述NAL单元标头中对所述视图维度的视图次序索引值进行译码的指令,且其中所述致使所述处理器确定所述映射的指令包括致使所述处理器确定所述视图次序索引值与所述视图维度的视图识别符(view_id)值之间的映射的指令。
45.根据权利要求40所述的计算机可读存储媒体,其中所述NAL单元包括所述位流的第一 NAL单元,所述计算机可读存储媒体进一步包括致使所述处理器进行以下操作的指令:提取所述位流的子位流,所述子位流包括第二 NAL单元,所述第二 NAL单元包含所述第一 NAL单元的所述视频数据的至少一部分;针对所述子位流,对表示对所述子位流启用了所述多个视频译码维度中的哪些视频译码维度的信息进行译码;以及在所述第二 NAL单元的经修改NAL单元标头中,对所述子位流的所述经启用视频译码维度中的每一者的值进行译码,但不对未经启用的所述视频译码维度的值进行译码,其中所述经修改NAL单元标头的位长度比所述第一 NAL单元的所述NAL单元标头的位长度短。
46.根据权利要求40所述的计算机可读存储媒体,其进一步包括致使所述处理器基于所述经启用视频译码维度中的每一者的所述值对所述NAL单元的所述视频数据进行译码的指令。
47.根据权利要求46所述的计算机可读存储媒体,其中所述致使所述处理器对所述视频数据进行译码的指令包括致使所述处理器基于所述经启用视频译码维度中的每一者的所述值对所述视频数据进行解码的指令。
48.根据权利要求46所述的计算机可读存储媒体,其中所述致使所述处理器对所述视频数据进行译码的指令包括致使所述处理器基于所述经启用视频译码维度中的每一者的所述值对所述视频数据进行编码的指令。
【文档编号】H04N19/40GK103733623SQ201280038356
【公开日】2014年4月16日 申请日期:2012年7月31日 优先权日:2011年8月1日
【发明者】陈盈, 马尔塔·卡切维奇, 王益魁 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1