视频译码中的目标输出层的制作方法_4

文档序号：8461039阅读：来源：国知局

Cr样本阵列的图片的明度样本的译码块和色度样本的两个对应译码块，以及用以对译码块的样本进行译码的语法结构。在单色图片或具有三个分离色彩平面的图片中，CU可包括单一译码块和用以对译码块的样本进行译码的语法结构。译码块为样本的NXN块。
[0059] 所述四分树数据结构中的每一节点可提供针对对应CU的语法数据。例如，四分树中的节点可包含分裂旗标，从而指示是否将对应于节点的CU分裂成子CU。可递归地定义用于⑶的语法元素，且用于⑶的语法元素可视⑶是否分裂成子⑶而定。如果⑶未经进一步分裂，那么其被称作叶CU。在本发明中，即使不存在原始叶CU的显式分裂，叶CU的四个子⑶也被称作叶⑶。例如，如果16X 16大小的⑶未经进一步分裂，那么四个8X8子⑶ 也被称作叶⑶，尽管16 X 16⑶从未经分裂。
[0060] 除了⑶不具有大小区别之外，⑶的用途类似于H. 264标准的宏块的用途。例如，树型块可分裂成四个子节点（也被称作子CU)，且每一子节点又可为父节点并分裂成另外四个子节点。被称作四分树的叶节点的最终的未分裂子节点包括译码节点，所述译码节点也被称作叶CU。与经译码位流相关联的语法数据可定义可分裂树型块的最大次数（其被称作最大CU深度），且也可定义所述译码节点的最小大小。因而，位流也可定义最小译码单元 (SCU)。本发明使用术语"块"来指HEVC的内容脉络中的CU、PU或TU中的任一者，或其它标准的内容脉络中的类似数据结构（例如，在H. 264/AVC中的宏块和其子块）。
[0061] CU包含译码节点和与所述译码节点相关联的数个预测单元（PU)和变换单元 (TU)。CU的大小对应于译码节点的大小，且形状必须为正方形。CU的大小的范围可从8X8 像素直到具有最大64X64像素或大于64X64像素的树型块的大小。每一⑶可含有一或多个PU和一或多个TU。
[0062] -般来说，I3U表示对应于对应⑶的全部或一部分的空间区域，且可包含用于检索 PU的参考样本的数据。此外，PU包含与预测有关的数据。例如，当PU经帧内模式编码时，用于PU的数据可包含于残余四分树（RQT)中，残余四分树可包含描述对应于PU的TU的帧内预测模式的数据。作为另一实例，当PU经帧间模式编码时，可包含定义所述PU的一或多个运动向量的数据。预测块可为同一预测应用到的样本的矩形（即，正方形或非正方形）块。CU的PU可包括图片的明度样本的预测块、色度样本的两个对应预测块，和用以预测所述预测块样本的语法结构。在单色图片或具有三个分离色彩平面的图片中，PU可包括单一预测块和用以对预测块样本进行预测的语法结构。
[0063] TU可包含将（例如）以下各者的变换应用到残余视频数据之后在变换域中的系数：离散余弦变换（DCT)、整数变换、小波变换，或概念上类似的变换。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含CU的残余数据的TU，且接着变换所述TU以产生CU的变换系数。变换块可为同一变换应用到的样本的矩形块。CU的变换单元（TU)可包括明度样本的变换块、色度样本的两个对应变换块，和用以对变换块样本进行变换的语法结构。在单色图片或具有三个分离色彩平面的图片中，TU可包括单一变换块和用以对变换块样本进行变换的语法结构。
[0064] 在使用⑶的的帧内预测性或帧间预测性译码之后，视频编码器20可计算⑶ 的TU的残余数据。PU可包括描述在空间域（也称作像素域）中产生预测性像素数据的方法或模式的语法数据，且TU可包括在将例如离散余弦变换（DCT)、整数变换、小波变换或概念上类似的变换的变换应用到残余视频数据之后在变换域中的系数。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含CU的残余数据的TU，且接着变换所述TU以产生CU的变换系数。
[0065] 在应用任何变换以产生变换系数之后，视频编码器20可执行变换系数的量化。量化大体指如下过程：将变换系数量化以可能地减少用以表示所述系数的数据的量，从而提供进一步压缩。所述量化过程可减少与所述系数中的一些或全部相关联的位深度。例如，可在量化期间将η位值降值舍位到m位值，其中η大于m。
[0066] 在量化之后，视频编码器可扫描变换系数，从而从包含经量化的变换系数的二维矩阵产生一维向量。扫描可经设计成将较高能量（且因此较低频率）系数置于阵列前部，且将较低能量（且因此较高频率）系数置于阵列后部。在一些实例中，视频编码器20可利用预定义扫描次序来扫描经量化的变换系数，以产生可经熵编码的串列化向量。在其它实例中，视频编码器20可执行自适应性扫描。在扫描经量化的变换系数以形成一维向量之后，视频编码器20可（例如）根据上下文自适应性可变长度译码（CAVLC)、上下文自适应性二进制算术译码（CABAC)、基于语法的上下文自适应性二进制算术译码（SBAC)、概率区间分割熵（PIPE)译码或另一熵编码方法而熵编码所述一维向量。视频编码器20也可熵编码与经编码视频数据相关联的语法元素以供视频解码器30用于解码视频数据。
[0067] 为了执行CABAC，视频编码器20可将上下文模型内的上下文指派给待传输的符号。所述上下文可能关于（例如）符号的相邻值是否为非零。为了执行CAVLC，视频编码器20可针对待传输的符号选择可变长度码。可建构VLC中的码字使得相对较短码对应于更有可能的符号，而较长码对应于较不可能的符号。以此方式，使用VLC可达成位节省（与 (例如）针对待传输的每一符号使用等长度码字相比较）。概率确定可基于指派给符号的上下文。
[0068] 视频编码器20可进一步发送语法数据（例如，基于块的语法数据、基于图片的语法数据，和基于图片群组（GOP)的语法数据）到视频解码器30(例如，在图片标头、块标头、截块标头或GOP标头中）。GOP语法数据可描述相应GOP中的图片数目，且图片语法数据可指示用以编码对应图片的编码/预测模式。
[0069] 在一些实例中，视频编码器20可产生在解码视频数据时可使用的某些参数集，且视频解码器30可接收所述参数集。例如，参数集可包含通过分离地传信很少改变的信息来改善效率的SPS、PPS或VPS。此外，参数集的使用可允许实现重要标头信息的频带外传输，从而避免需要为了错误恢复进行冗余传输。在频带外传输实例中，参数集网络抽象层（NAL) 单元可在不同于例如补充增强信息（SEI)NAL单元的其它NAL单元的信道上进行传输。
[0070] SEI NAL单元（称作SEI消息）可含有对于从VCL NAL单元解码经译码图片样本不必要但可辅助与解码、显示、错误恢复和其它用途相关的过程的信息。SEI消息可含于非 VCL NAL单元中。SEI消息可包含于一些标准规范的规范性部分中，且因此对于顺应标准的解码器实施并非总是为强制的。SEI消息可为序列层级SEI消息或图片层级SEI消息。一些序列层级信息可含于SEI消息中，例如，SVC的实例中的可调性信息SEI消息和MVC中的视图可调性信息SEI消息中。
[0071 ] 在HEVC中，视频编码器20可定义操作点以指示子位流，可基于所述子位流的最高时间层级而从经编码位流提取所述子位流；以及nuh_reserved_zero_6bits的列表。例如，视频编码器20可传信根据下文展示的表1的操作点：
[0072] 表1 :操作点
[0073]
【主权项】
1. 一种解码视频数据的方法，所述方法包括：从多层位流获得包含多个层集合的多个视频数据层，其中每一层集合含有所述多个层中的一或多个视频数据层；以及基于所述位流的一或多个语法元素来确定一或多个输出操作点，其中每一输出操作点与所述多个层集合中的一个层集合和所述多个层中的一或多个目标输出层相关联。
2. 根据权利要求1所述的方法，其中所述语法元素为第一语法元素，所述方法进一步包括：基于所述位流的一或多个第二语法元素来确定所述输出操作点的所述一或多个目标输出层，其中所述第二语法元素不同于所述一或多个第一语法元素。
3. 根据权利要求2所述的方法，其中所述一或多个第二语法元素包括指示所述一或多个目标输出层中的每一者的一或多个语法元素。
4. 根据权利要求1所述的方法，其中所述多层位流包括多视图位流，使得每一层包括视频数据视图，且所述一或多个目标输出层包括一或多个目标输出视图。
5. 根据权利要求1所述的方法，其中所述多层位流包括一或多个深度层，使得确定所述一或多个输出操作点进一步包括确定一或多个目标输出深度层，所述一或多个目标输出深度层包括深度数据。
6. 根据权利要求1所述的方法，其中所述多层位流包括具有多个可缩放视频数据层的位流，使得确定所述一或多个输出操作点包括确定一或多个可缩放目标输出层。
7. 根据权利要求6所述的方法，其中确定所述输出操作点包括确定具有数值最高的 layer_id的所述可缩放目标输出层。
8. 根据权利要求1所述的方法，其进一步包括：解码所述一或多个输出操作点中的与所述层集合相关联的输出操作点；解码包含一或多个层的经解码但非输出层的集合，所述一或多个层并非所述一或多个目标输出层中的一者，但属于所述层集合；将经解码图片缓冲器中的包含于所述一或多个目标输出层中的第一经解码图片标记为待用于输出的图片；以及将所述经解码图片缓冲器中的包含于经解码但并非输出层的所述集合中的第二经解码图片标记为不用于输

完整全部详细技术资料下载

当前第4页1 2 3 4 5