视频译码中的目标输出层的制作方法

文档序号:8461039阅读:293来源:国知局
视频译码中的目标输出层的制作方法
【专利说明】
[0001] 本申请案主张2012年10月30日申请的美国临时专利申请案第61/720, 364号的 权利,所述申请案的全部内容特此以引用的方式并入。
技术领域
[0002] 本发明涉及视频译码。
【背景技术】
[0003] 数字视频能力可并入到广泛范围的装置中,所述装置包含数字电视、数字直播系 统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板型计算机、电子书阅 读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏主机、蜂窝式或 卫星无线电电话、所谓的"智能型手机"、视频电话会议装置、视频流式传输器装置,和其类 似者。数字视频装置实施视频译码技术,例如在由MPEG-2、MPEG-4、ITU-T H. 263、ITU-T H. 264/MPEG-4第10部分"先进视频译码(AVC) "定义的标准、目前正在开发的高效率视 频译码(HEVC)标准和这些标准的扩展(例如可缩放视频译码(SVC)和多视图视频译码 (MVC))中所描述的那些视频译码技术。布罗斯(Bross)等人的HEVC的工作草案(WD)的 版本6 "高效率视频译码(HEVC)文本规范草案6(High efficiency video coding(HEVC) text specification draft 6) "(ITU-T SG16WP3 和 IS0/IEC JTC1/SC29/WG11 的关于视频 译码的联合合作团队(JCT-VC),2012年2月I日到10日美国加利福尼亚圣荷西第8次会 议)可从 http://phenix. it-sudparis. eu/jct/doc_end_user/current_document. php ? id = 5096获得。视频装置可通过实施这些视频译码技术来更有效地发射、接收、编码、解码 和/或存储数字视频信息。
[0004] 视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或去除 视频序列中固有的冗余。对于基于块的视频译码来说,可将视频截块(例如,视频图片或视 频图片的一部分)分割为视频块,所述视频块也可称作树型块、译码单元(CU)和/或译码 节点。图片的帧内译码(I)截块中的视频块是使用相对于同一图片中的相邻块中的参考样 本的空间预测来编码。图片的帧间译码(P或B)截块中的视频块可使用相对于同一图片中 的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片 可被称作帧,且参考图片可被称作参考帧。
[0005] 空间预测或时间预测导致待译码块的预测性块。残余数据表示待译码的原始块与 预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量和指示经译码 块与预测性块之间的差的残余数据来编码帧间译码块。根据帧内译码模式和残余数据来编 码帧内译码块。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而导致残余变 换系数,可接着量化残余变换系数。可扫描最初布置成二维阵列的经量化的变换系数以便 产生变换系数的一维向量,且可应用熵译码以达成甚至更多压缩。

【发明内容】

[0006] 本发明的技术包含在多视图视频译码和/或可缩放视频译码中确定一或多个目 标输出层。例如,如当前HEVC基本规范(如上文所提及的WD 6)中所定义的操作点可包含 数个视频数据层,使得操作点指具有视频数据位流的一或多个层的层集合。在一些个例中, 这些层的仅一个子集可经解码用于输出(例如,显示)。根据本发明的方面,可定义具体地 识别供输出的目标视频数据层的输出操作点。
[0007] 在一个实例中,一种解码视频数据的方法包含:从多层位流获得包含多个层集合 的多个视频数据层,其中每一层集合含有所述多个层中的一或多个视频数据层;和基于所 述位流的一或多个语法元素来确定一或多个输出操作点,其中每一输出操作点与所述多个 层集合中的一个层集合和所述多个层中的一或多个目标输出层相关联。
[0008] 在另一实例中,一种用于编码视频数据的方法包含:编码包含多个层集合的多个 视频数据层,其中每一层集合含有所述多个层中的一或多个视频数据层;和编码指示一或 多个输出操作点的一或多个语法元素,其中每一输出操作点与所述多个层集合中的一个层 集合和所述多个层中的一或多个目标输出层相关联。
[0009] 在另一实例中,一种设备包含一或多个处理器,所述一或多个处理器经配置以对 包括多个视频数据层的多层位流进行译码,其中所述多个视频数据层与多个层集合相关 联,且其中每一层集合含有所述多个层中的一或多个视频数据层;和对所述位流的指示一 或多个输出操作点的一或多个语法元素进行译码,其中每一输出操作点与所述多个层集合 中的一个层集合和所述多个层中的一或多个目标输出层相关联。
[0010] 在另一实例中,一种用于译码视频数据的装置包含:用于对包括多个视频数据层 的多层位流进行译码的装置,其中所述多个视频数据层与多个层集合相关联,且其中每一 层集合含有所述多个层中的一或多个视频数据层;和用于对所述位流的指示一或多个输出 操作点的一或多个语法元素进行译码的装置,其中每一输出操作点与所述多个层集合中的 一个层集合和所述多个层中的一或多个目标输出层相关联。
[0011] 在另一实例中,一种非暂时性计算机可读存储媒体上面存储有指令,所述指令在 执行时使得用于对视频数据进行译码的装置的处理器进行以下操作:对包括多个视频数据 层的多层位流进行译码,其中所述多个视频数据层与多个层集合相关联,且其中每一层集 合含有所述多个层中的一或多个视频数据层;和对所述位流的指示一或多个输出操作点的 一或多个语法元素进行译码,其中每一输出操作点与所述多个层集合中的一个层集合和所 述多个层中的一或多个目标输出层相关联。
[0012] 一或多个实例的细节阐述于随附图式和以下描述中。其它特征、目标和优点将从 所述描述和所述图式以及从权利要求书显而易见。
【附图说明】
[0013] 图1为根据本发明的方面的说明可利用用于确定一或多个目标输出层的技术的 实例视频编码和解码系统的框图。
[0014] 图2为根据本发明的方面的说明可实施用于确定一或多个目标输出层的技术的 视频编码器的实例的框图。
[0015] 图3为根据本发明的方面的说明可实施用于确定一或多个目标输出层的技术的 视频解码器30的实例的框图。
[0016] 图4为说明实例MVC预测型样的概念图。
[0017] 图5为说明实例可缩放视频译码序列的概念图。
[0018] 图6为根据本发明的方面的说明用于编码输出操作点的实例过程的流程图。
[0019] 图7为根据本发明的方面的说明用于解码输出操作点的实例过程的流程图。
【具体实施方式】
[0020] 本发明的技术包含在多视图视频译码和/或可缩放视频译码中确定一或多个目 标输出层。当前,运动图片专家群组(MPEG)正基于即将来临的高效率视频译码(HEVC)标 准开发三维视频(3DV)标准。标准化努力的部分也包含基于HEVC的多视图视频编码解码 器和可缩放视频编码解码器的标准化。例如,一个标准化努力包含开发被称作MV-HEVC的 HEVC的多视图扩展,且另一努力是被称作3D-HEVC的深度增强型基于HEVC的全3DV编码解 码器。关于可缩放视频译码,视图可调性和/或空间可调性也可有助于三维视频服务,因而 这些可调性允许实现用于更多视图的回溯兼容扩展,和/或以允许由旧版装置进行解码的 方式增强视图的分辨率。
[0021] 对于三维视频数据,一般来说,每一视图对应于藉以俘获常见场景的对应视频数 据的不同视角或角度。经译码视图可用于视频数据的三维(3D)显示。例如,可使用不同 偏振的光而同时或接近同时地显示两个视图(例如,人类检视者的左眼视图和右眼视图), 且检视者可佩戴被动型偏光眼镜,使得检视者的眼睛中每一者接收到所述视图中的相应视 图。替代地,检视者可佩戴独立地遮挡每一眼睛的主动型眼镜,且显示器可与眼镜同步而在 每一眼睛的图像之间快速交替。
[0022] 通过例如如在ITU-T H. 264标准(或者被称作MPEG-4第10部分"先进视频译码 (AVC)标准")的附录H中所阐述的多视图视频译码(MVC)的多视图译码,特定视图的特定 图片被称作视图分量。即,视图的视图分量对应于视图的特定时间执行个体。多视图视频可 含有相对大量的视图间统计相依性,这是由于用以俘获多视图数据的所有摄影机从不同视 点俘获同一场景。这些相依性可被利用于组合式时间和/或视图间预测,其中不仅从时间 上相邻的图像而且从来自其它视图的对应图像来预测图像。即,可在同一存取单元中(即, 在同一时间执行个体内)的图片当中执行视图间预测。
[0023] 如上文所提及,可缩放视频译码也可用以对多个视图译码以提供视图可调性和/ 或空间可调性。例如,可缩放视频译码(SVC)在H.264/AVC标准的附录G中予以描述,且可 用以对视频数据的多个层进行译码。在一些个例中,每一层可对应于特定视图。
[0024] 如本文中所描述,视频"层"可通常指具有至少一个共同特性(例如视图、帧率、分 辨率或其类似者)的图片的序列。例如,层可包含与多视图视频数据的特定视图相关联的 视频数据。作为另一实例,层可包含与可缩放视频数据的特定层相关联的视频数据。因此, 本发明可互换地提及视频数据的层和视图。
[0025] 在任何状况下,视频译码器(例如,如下文更详细地描述的视频编码器或视频
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1