使用扩展机制的层id信令的制作方法_4

文档序号：9872766阅读：来源：国知局

ID值的单独对(j，k)相关联。在此处，图10显示了关联语法结构可包括用于每对（j，k)的标志，并且所述关联语法结构的解析可设及跳过值0<k含j含n<N的对(j，k)，其中，所述第一相互依赖性语法结构表示在对(j，k)之间不存在相互依赖性(独立性）。
[0090] 目P，在W上部分中描述的内容能表示为"层标识符集群和集群依赖性信令"。在运方面，装置可能是视频解码器。因此，在操作时，视频解码器能够选择由（扩展的）layerID识别的位流的数据包，用于解码。然而，可替换地，该装置可W是能够基于外部因素（例如，网络利用率、关于解码器的知识等）丢弃由（扩展的UayerID识别的位流的数据包的网络元件。
[0091] 自然地，上述概念也影响编解码器的现有编码器，W由该概念改进:编码器(例如，图2的编码器)配置为使用层间预测在对应于信息量的不同等级的不同层上将视频材料编码入多层数据流10,所述多层数据流包括多个数据包12,每个数据包与所述不同层中的一层相关联，每层由基础层ID 20或基础层ID 20和扩展层ID 22索引，并且在所述多层数据流内插入表示在所述基础层ID 20能表示的几对不同值之间的相互依赖性的第一相互依赖性语法结构24W及表示在所述扩展层ID 22能表示的几对不同值之间的相互依赖性的第二相互依赖性语法结构26，设置所述第一相互依赖性语法结构和第二相互依赖性语法结构，W 便基于所述第一相互依赖性语法结构和第二相互依赖性语法结构，能构造显示在所述不同层之间的可能层间预测依赖性的层间依赖性描述14。
[0092] 接下来描述的细节设及通过有效的方式信令层相关的信息的可能性，其中，例如，运种层相关的信息可包括设及如相对于图2到图10概述的层间依赖性的信息。作为起始点，使用上面通常提出的情况，根据该情况，每个数据包206(比较图2)包括的层识别语法元素结构208由基础层ID字段108和扩展层ID字段112构成，如在图11中所述。图11示出了用于处理多层数据流(例如，网络元件218)或多层视频解码器202的装置100,如在图2中所示。装置 100显示为包括接收器102,所述接收器配置为接收由一系列数据包构成的多层视频信号，每个数据包包括层识别语法元素。
[0093] 由接收器102接收的多层视频信号104(对应于在图2中的204)由一系列数据包106 (对应于在图2中的206)构成，每个数据包包括层识别语法元素结构（对应于在图2中的 208)，该结构包括至少基础层ID字段108并且无条件地或者有条件地取决于高级语法元素或基础层ID字段108、扩展层ID字段112的值。
[0094]例如，数据包106可W是多层视频信号104细分成的NAL单元、薄片、瓷砖、图片或其他数据包。对于包括多个数据包106的多层视频信号的预定部分，例如，部分113,装置100也包括的层识别扩展器110从多层视频信号中读取最大语法元素，表示多层视频信号的预定部分113包括的数据包108的扩展层ID字段112的最大假定值。例如，预定部分113可能是编码的视频序列、块体、图片组等。最大语法元素114可包含在部分113的特殊数据包内，例如， VPS NAL单元。对于在预定部分113内的每个数据包，扩展器110基于由108并且有条件地112 构成的层ID语法结构，确定相应数据包的层ID。例如，运两个语法元素108和112的两个值的串联可造成层ID。
[00M]扩展器110可使用上面说明的最大语法元素，获得扩展层ID字段的位长度。可替换地，为此，可使用额外语法元素。甚至可替换地，可默认固定用于表示扩展层ID字段112的位数。
[0096] 然后，扩展器110基于最大假定值，确定在部分113内的最大层数。例如，扩展器110 也从数据流104中读取语法元素，对于部分103,表示在部分103内的数据包106的基础层ID 字段108的最大假定值，并且组合运两个最大假定值，用于确定最大层数。
[0097] 通过等于最大层数的多次反复解析多层视频信号的层表征语法部分，扩展器110 确定最大层数的每层的至少一个特征。有利地，数据流104不需要信令每个可能值的至少一个特征，即，并非用于扩展层ID字段112的整个基数，而是仅仅用于在该基数之中的实际上使用的子部分。此外，可甚至使用最大语法元素 114, W便如上所述，获得在数据流104内的扩展层ID字段112的表示位的数量。例如，"特征"可能是对其他层等的层内预测。
[0098] 换言之，相对于图11，描述了可W在数据流204/104内传输关于在考虑在兴趣预定部分113内的所有数据包106/206时实际上采用的扩展层ID字段的能表示状态的数量的明确信号作用。例如，假设扩展层ID字段112是N位的字段，那么/扩展层ID 120由扩展层ID字段112能表示。字段112的长度可通过在图12中使用虚线122表示的某个高级语法元素固定或者可信令并且设置在数据流内。然而，由于某种原因，并非所有可用扩展层ID字段可用于兴趣预定部分113内。在图12中，例如，说明了仅仅使用7个能表示的扩展层ID，即，通过阴影线。
[0099] 根据图11，最大语法元素114表示扩展层ID字段112的实际使用/假定值的运个数量。由于该语法元素114,所W可行的是，仅仅相对于扩展层ID的实际假定数量，而非用于扩展层ID字段112的能表示值的整个数量，将层特定的信息插入数据流内。因此，如在图12中的122中所示，例如，解析多层视频信号的装置可解析多层视频信号的某个层表征语法部分 124,解析的次数仅仅等于由语法元素114表示的最大层数，而非扩展层ID字段的实际可用/ 能表示值的整个数量。因此，通过数据流消耗的边信息量可保持更低。例如，在图6到图10的实例中，可行的是，将max_laye;r_W_ext设置为等于由语法元素114表示的扩展状态的最大假定数量，而非将该值设置为等于扩展层ID字段112的能表示值的整个数量。因此，"表征语法部分"124可由先前提出的标志direct_ext_dependency_f lag体现。
[0100] 如上所述，字段112的位长度的存在/信令可选。在任何情况下，与由语法元素122 设置的扩展层ID字段112的可用/能表示值的数量的更粗糖的设置相比，语法元素114表示实际使用的/活动的扩展层ID的数量的粒度/保真度增大。优选地，语法元素114表示扩展层 ID字段112的实际假定值的数量的保真度或粒度足够精细，W便表示实际假定值的精确数量。可替换地，由语法元素122提供的在I与字段112的可用/能表示值的最大数量的信号作用的保真度/粒度之间的某个地方的保真度/粒度也可行。换言之，最大语法元素114能表示扩展层ID字段108的最大假定值，W小于(n-1) 2为单位，n是扩展层ID字段的位长度，或者可能甚至是1。
[0101] 因此，根据图11和12,描述了装置(例如，网络元件或多层视频解码器)可包括接收器102和扩展器110,其中，接收器102配置为接收由一系列数据包106构成的多层视频信号 104,每个数据包包括层识别语法元素结构，该结构由基础层ID字段并且可能仅仅有条件地扩展层ID字段112构成，其中，对于包括在运系列数据包106之中的多个数据包106的多层视频信号的预定部分113,层识别扩展器110配置为从多层视频信号104中读取最大语法元素 114,最大语法元素114表示在预定部分113包括的数据包106之中的扩展层ID字段112的最大假定值。对于在预定部分113内的每个数据包106,扩展器110基于层识别语法元素结构，确定相应数据包106的层ID，例如，通过如上所述，串联字段108和112的基础层ID和扩展层 ID。扩展器110还基于最大假定值，确定在预定部分113内的最大层数，并且通过等于最大层数的多次反复解析层表征语法部分104,确定最大层数的每层的至少一个特征。在组合图11 和12的实施方式和上面相对于图2到图10概述的实施方式时，"最大层数"能表示每个集群的最大层数，在运种情况下，例如，"最大层数"的确定直接将最大假定值用作"最大层数"，并且"至少一个特征"可能是表示在第二相互依赖性语法结构内的层间依赖性的标志的数量。然而，特定的另一个实例也可能是在单独层ID的相应编码参数组的数据流内的信号作用。在运种情况下，"最大层数"可确定为等于所使用的或者能表示的基础层ID的数量乘W 最大假定值，即，实际上使用的/假定的扩展层ID的数量。其他实例也可行。在任何情况下，通过语法元素114传输实际假定值，能够保存有价值的边信息比特率。
[0102] 如上所述，图11和12的概念可与上面相对于图2到图10概述的概念组合，或者可单独使用，而不使用前面描述的概念。
[0103] 与上面相对于图2到图10提出的描述相似，然而，W下描述显示了如何将图11和12 的概念嵌入现有视频编解码器(例如，肥VC的扩展）内的可能性。
[0104] 在皿VC中，可从在视频和元数据包内明确信令的层标识符中获得称为LayerID的层标识符变量，例如，在视频或元数据包的每个块体内信令的nuh_laye;r_id和额外信息，形成特定数据包的新变量Layerld，W用于其识别。
[0105] 根据图11和12信令的额外信息可设及额外语法元素，比较layer_W_ext，例如，在视频或元数据包的报头或有效载荷的某个部分内，考虑特定的视频或元数据包属于增强层，从而与仅仅基础层传统装置保持兼容。在视频或元数据包属于基础层，但是由增强层处理能力装置处理时，可假设默认值用于layer_W_ext。
[0106] 图13提供信令额外信息的薄片段报头的实例，作为在包含在肥VC编码视频的增强层(；比较nuh_laye;r_id〉0)的视频数据包内的薄片报头中的语法元素 laye;r_id_ext。
[0107] 使用数学运算，W便将nuh_laye;r_id和laye;r_id_ext组合成Layerld，运允许更大的标识符空间并且对于nuh_laye;r_id和laye;r_id_ext的两个值的独特组合是独特的。例如，数学运算可将nuh_laye;r_id的位用作1日761'1(1变量的158，并且将1日761'_1(1_6义1:用作 LSB，反之亦然，例如，如下。
[0108] 如下确定变量Layer Id，其中，LengthOf Extens ion是在位方面的laye;r_id_ext语法元素的长度。
[0109] LayerId= (nuh_layer_id?LengthOf Extens ion)+layer_id_ext
[0110] 图11和12的概念可包括明确信令用于在视频或元数据包的报头或有效载荷的某个部分内传输额外信息（比较上面的LengthOf Extens ion)的位的量，W便有效利用传输的数据量。图14提供在元数据包（例如，HEVC视频参数组扩展语法）中信令的 LengthOfExtens ion值的示例性语法和语义。
[0111] laye;r_id_ext_len表示用于扩展Layer Id范围的位数。
[0112] 图11和12的概念包括明确信令用于编码的视频位流内的layer_id_ext语法元素的最大值，例如，max_laye;r_id_ext。在此基础上，可获得在视频或元数据包的报头或有效载荷的某个部分内传输额外信息化k较上面的LengthOfExtension)所需要的最低可能的位的量，W便有效利用传输的数据量。图15提供在元数据包(例如，肥VC视频参数组扩展语法）中信令的laye;r_id_ext语法元素值的最大值的示例性语法和语义。
[0113] max_laye;r_id_ext表示在编码的视频序列内的任何薄片报头内的laye;r_id_ext 语法元素的最大值。
[0114] 下面提供根据本发明的W上扩展的layer_id_ext语法元素的语义的两个示例性变体。
[0115] laye;r_id_ext与nuh_laye;r_id相结合使用，W识别层。使用laye;r_id_ext_len位，编码语法元素 lay er_ W_ext。在不存在时，其值推断为0。
[0116] laye;r_id_ext与nuh_laye;r_id相结合使用，W识别层。使用编码的CeiULog2 (max_lay e;r_id_ext))位，编码语法元素 lay e;r_id_ext。在不存在时，其值推断为0。
[0117] 在图16a-16c中可扩展提供皿VC视频编解码器标准的参数组或SEI消息的层标识符，而不解析依赖性。
[0118] 在分层编码场景中，调整与层标识符或其最大数量相关的信令，W覆盖扩展的层标识符空间化k较LayerId的值范围），而非规则的明确层标识符空间化k较nuh_laye;r_id的值范围），如在图17中的视频参数组扩展的语法表格示例性提供的，其中，如下示例性提供变量化 sMaxNumLayers。
[0119]规定在扩展层范围内的最大层数的变量VpsMaxNumLayer设置为等于（vps_max_ lay ers_minus 1)巧iayer-id-ex〇en. +1，
[0120] 或者
[0121] 规定在扩展层范围内的最大层数的变量VpsMaxNumLayer设置为等于（vps_max_ layers-minusl)*max_layer_id_ext.+1。
[0122] laye;r_W_in_nalu[i]规定与第i层的VCL NAL单元相关联的LayerId值的值。对于在从0到VpsMaxNumLayers -1 (包括0和VpsMaxNumLayers -1)的范围内的i，在不存在时， laye;r_id_in_nalu[ i ]的值推断为等于 i。
[0123] 在i大于0时，laye;r_id_in_nalu[ i]大于laye;r_id_in_nalu[ i-1 ]。
[0124] 对于在从 0 到vps_max_layers_minusl (包括 0 和 vps_max_layers_minusl)的范围内的i，变量LayerIdIn化S[ laye;r_id_in_nalu[ i ]]设置为等于i。
[0125] dimension_id[i][j]规定第i层的第j个存在的可扩展性维度类型的标识符。用于表示(1；[1116]13；[0]1_1(1[；[]。']的位数是(1；[1116]13；[0]1_1(1_16]1_111；[]11131。'] + 1位。对于在从0到 NumScalabilityTypes-I (包括O和NumScalabilityTypes-I)的范围内的i，在不存在时， dimension_id[i] [ j]推断为等于（（laye;r_id_in_nalu[i]&((l<<dimBitOffset[j+l] )-1)) 〉〉dimBitOffset[j])。
[0126]如下获得规定第i层的第smidx个可扩展性维度类型的标识符的变量 Scalabilityld[ i ] [smidx]、规定第i层的视图标识符的变量Viewld[ laye;r_id_in_nuh [i]]、W及规定第i层是否是视图可扩展性扩展层的变量ViewSca化XtLayerFlag: for ^ = 1; I

完整全部详细技术资料下载

当前第4页1 2 3 4 5 6