加权预测参数译码的制作方法

文档序号：7792891阅读：133来源：国知局

加权预测参数译码的制作方法
【专利摘要】本发明技术大体涉及加权预测参数的译码。视频译码器可基于另一参考图片列表的经译码的加权预测参数确定参考图片列表的所述加权预测参数。所述参考图片列表的实例包含出于译码目的构建的参考图片列表，包含组合参考图片列表。
【专利说明】加权预测参数译码
[0001] 本申请案请求2012年4月3日提交的美国临时申请案61/619, 856的权利，所述美国临时申请案的全部内容以引用的方式并入本文中。

【技术领域】
[0002] 本发明涉及视频译码，且更特别地涉及用于加权预测参数译码的技术。

【背景技术】
[0003] 数字视频能力可合并到各种各样的装置中，包含数字电视、数字直播系统、无线广播系统、个人数字助理（PDA)、膝上型计算机或桌上型计算机、平板计算机、电子书阅读器、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝电话或卫星无线电话、所谓的"智能电话"、视频电话会议装置、视频串流装置等。数字视频装置实施视频压缩技术，例如由 MPEG-2、MPEG-4、ITU-T H. 263、ITU-T H. 264/MPEG-4 第 10 部分高级视频译码（AVC)所界定的标准、目标正在开发中的高效视频译码（HEVC)标准以及这些标准的扩展中描述的那些技术。视频装置可通过实施这些视频压缩技术来更有效地发射、接收、编码、解码及/或存储数字视频信息。
[0004] 视频压缩技术执行空间（图片内）预测及/或时间（图片间）预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码，可将视频片段（即，视频帧或视频帧的部分）分割成视频块，所述视频块也可被称作树块、译码单元（CU)及/或译码节点。图片的经帧内译码（I)片段中的视频块使用关于同一图片中的相邻块中的参考样本的空间预测来进行编码。图片的经帧间译码（P或B)片段中的视频块可使用关于同一图片中的相邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧，且参考图片可被称作参考帧。
[0005] 空间或时间预测产生用于待译码的块的预测块。残余数据表示待译码的原始块与预测块之间的像素差。经帧间译码块是根据以下两项来进行编码：指向形成预测块的参考样本的块的运动向量，以及指示经译码块与预测块之间的差的残余数据。经帧内译码块是根据帧内译码模式以及残余数据来进行编码。为了进一步压缩，可将残余数据从像素域变换到变换域，从而产生残余变换系数，所述残余变换系数接着可被量化。可扫描经量化变换系数（最初排列成二维阵列）以便产生变换系数的一维向量，且可应用熵译码以实现更多压缩。

【发明内容】

[0006] -般来说，本发明是关于用于对加权预测参数进行译码的技术。加权预测参数可指示适用于参考图片的像素值的定标因素，所述像素值可用于对当前图片的块进行帧间预测。视频译码器识别一或两个参考图片列表中的参考图片。在一些实例中，如果两个参考图片列表实质上等效，那么视频译码器可对所述两个参考图片列表中的一个参考图片列表的加权预测参数进行译码，并基于经译码的加权预测参数确定另一参考图片列表的加权预测参数。
[0007] 在一些实施例中，视频译码器可根据所述两个参考图片列表构建组合参考图片列表。在这些实例中，视频译码器可对组合参考图片列表的加权预测参数进行译码，并根据组合参考图片列表的经译码的加权预测参数确定所述两个参考图片列表的加权预测参数。
[0008] 在一个实例中，本发明描述一种用于对视频数据进行译码的方法。所述方法包括：对第一列表的加权预测参数进行译码，其中第一列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片；基于第一列表的加权预测参数确定第二列表的加权预测参数，其中第二列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片；及至少基于经译码的加权预测参数以及经确定的加权预测参数中的一或多者对当前图片中的块进行帧间预测。
[0009] 在一个实例中，本发明描述一种用于对视频数据进行译码的装置。所述装置包括视频译码器，所述视频译码器经配置以进行以下操作：对第一列表的加权预测参数进行译码，其中第一列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片；基于第一列表的加权预测参数确定第二列表的加权预测参数，其中第二列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片；及至少基于经译码的加权预测参数以及经确定的加权预测参数中的一或多者对当前图片内的块进行帧间预测。
[0010] 在一个实例中，本发明描述一种在其上存储有指令的计算机可读存储媒体，所述指令在执行时使用于视频译码的装置的一或多个处理器进行以下操作：对第一列表的加权预测参数进行译码，其中第一列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片；基于第一列表的加权预测参数确定第二列表的加权预测参数，其中第二列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片；及至少基于经译码的加权预测参数和经确定的加权预测参数中的一或多者对当前图片内的块进行帧间预测。
[0011] 在一个实例中，本发明描述一种用于对视频数据进行译码的装置，所述装置包括：用于对第一列表的加权预测参数进行译码的装置，其中第一列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片；用于基于第一列表的加权预测参数确定第二列表的加权预测参数的装置，其中第二列表包含用于对当前图片内的一或多个块进行帧间预测的参考图片；及用于至少基于经译码的加权预测参数和经确定的加权预测参数中的一或多者对当前图片内的块进行帧间预测的装置。
[0012] 在一个实例中，本发明描述一种用于对视频数据进行译码的方法，所述方法包括：构建第一参考图片列表；构建第二参考图片列表；对至少第一语法元素进行译码，所述第一语法元素指示第一参考图片列表是否与第二参考图片列表相同；在第一语法元素指示第一参考图片列表与第二参考图片列表相同时，对在第一参考图片列表中识别的参考图片的加权预测参数进行译码，且不对在第二参考图片列表中识别的参考图片的加权预测参数进行译码；及在第一语法元素指示第一参考图片列表与第二参考图片列表相同时，根据在第一参考图片列表中识别的至少一个参考图片并基于所述参考图片的加权预测参数预测视频块。
[0013] 在一个实例中，本发明描述一种用于对视频数据进行译码的方法，所述方法包括：对至少第一语法元素进行译码，所述第一语法元素指示第一参考图片列表和第二参考图片列表的前N个元素是否相同；在所述前N个元素相同时，对指示第一参考图片列表的大小和第二参考图片列表的大小的信息进行译码；在第一参考图片列表的大小大于第二参考图片列表的大小时：构建第一参考图片列表；及从第一参考图片列表派生出第二参考图片列表；及在第二参考图片列表的大小大于第一参考图片列表的大小时：构建第二参考图片列表；及从第二参考图片列表派生出第一参考图片列表。
[0014] 一或多个实例的细节陈述于附图及以下描述中。其它特征、目标及优势将从描述及附图和从权利要求书中显而易见。

【专利附图】

【附图说明】
[0015] 图1是说明根据本发明中描述的一或多个实例的实例视频编码及解码系统的框图。
[0016] 图2A和2B是说明实质上等效的参考图片列表的实例的概念图。
[0017] 图3是说明可实施本发明中描述的技术的视频编码器的实例的框图。
[0018] 图4是说明可实施本发明中描述的技术的视频解码器的实例的框图。
[0019] 图5是说明根据本发明中描述的一或多个实例的视频编码器的示范性操作的流程图。
[0020] 图6是说明根据本发明中描述的一或多个实例的视频解码器的示范性操作的流程图。

【具体实施方式】
[0021] 视频译码器（例如，视频编码器或视频解码器）可对图片内的一或多个块进行帧内预测（例如，帧内预测编码或帧内预测解码）或对图片内的一或多个块进行帧间预测。为了对图片内的块进行帧间预测（例如，帧间预测编码块或帧间预测解码块），视频译码器构建一或两个参考图片列表（RefPicListO 和 RefPicListl)。RefPicListO 和 RefPicListl 中的每一者指示可潜在用于对当前图片内的块进行帧间预测的参考图片。举例来说，如果块是单预测的（例如，用一个参考图片预测），那么视频译码器可确定所述块的运动向量并确定所述运动向量所引用的参考图片。RefPicListO或RefPicListl可识别单向运动向量所引用的参考图片。如果块是双预测的（例如，用两个参考图片预测），那么视频译码器可确定所述块的两个运动向量（即，针对每一个参考图片的运动向量）。视频译码器还可确定 RefPicListO中第一运动向量所引用的参考图片和RefPicListl中第二运动向量所引用的参考图片。对于单预测或双预测实例，视频译码器可基于在一或多个参考图片中由一或多个运动向量所引用的一或多个块来帧间预测当前图片的块。
[0022] 另外，在一些实例中，视频译码器可确定每一参考图片列表中的每一参考图片的加权预测参数。加权预测参数可界定一定标因素，参考图片内的像素值将通过所述定标因素定标以用于帧间预测当前图片中的块。本发明中描述的技术提供确定每一参考图片列表中的参考图片的加权预测参数的有效方式。
[0023] 举例来说，当两个参考图片列表实质上等效时，视频编码器可不需要在经译码的位流中信号传递两个列表的加权预测参数。相反，视频编码器可在经译码的位流中信号传递实质上等效的列表中的一者的加权预测参数，且视频解码器可从经译码的位流中接收一个列表的加权预测参数并基于经信号传递的加权预测参数确定另一列表的加权预测参数。
[0024] 作为一个实例，假设RefPicListO和RefPicListl实质上等效。在此实例中，视频编码器可在经译码的位流中信号传递RefPicListO的加权预测参数，且视频解码器可基于 RefPicListO的加权预测参数确定RefPicListl的加权预测参数。通过这种方式，因为不需要信号传递两个列表的加权预测参数，所以可减少需要信号传递的资料的量，且其可足以信号传递所述列表中的仅一者的加权预测参数。
[0025] 在RefPicListO和RefPicListl被视为实质上等效时，可具有至少两种情况。在一种情况下，在 RefPicListO 和 RefPicListl 相同时，RefPicListO 和 RefPicListl 被视为实质上等效。由于 RefPicListO 和 RefPicListl 是相同的，RefPicListO 和 RefPicListl 以完全相同的顺序识别完全相同的参考图片。换句话说，RefPicListO和RefPicListl是彼此的副本。
[0026] 在另一种情况下，在一个列表的整体或子集与另一个列表的子集相同时， RefPicListO和RefPicListl被视为实质上等效。举例来说，假设RefPicListO包含Μ个条目（即，识别Μ个数目的参考图片）且RefPicListl包含Ν个条目（即，识别Ν个数目的参考图片）。还假设Μ大于N。在此实例中，如果RefPicListO中的前N个条目（即， RefPicListO的子集）与RefPicListl中的N个条目（S卩，RefPicListl的条目）在内容和顺序上相同时，那么为了确定加权预测参数，RefPicListO和RefPicListl被视为实质上等效。
[0027] 在一些实例中，在视频编码器确定RefPicListO和RefPicListl实质上等效时，视频编码器可在经译码的位流中信号传递指示RefPicListO和RefPicListl实质上等效的旗标。在RefPicListO和RefPicListl实质上等效时，视频编码器还可在经译码的位流中信号传递仅一个参考图片列表的加权预测参数。在其中RefPicListO和RefPicListl实质上等效是因为一个参考图片列表的整体或子集与另一参考图片列表的子集相同的实例中，视频编码器可在经译码的位流中信号传递两个参考图片列表中的较长列表（即，其子集与另一参考图片列表的整体或子集相同的参考图片列表）的加权预测参数。
[0028] 视频解码器可从经译码的位流中接收指示RefPicListO和RefPicListl实质上等效的旗标，且可预期仅接收所述列表中的一者的加权预测参数。在RefPicListO和 RefPicListl实质上等效时，视频解码器可针对RefPicListO和RefPicListl两者中的参考图片将接收到的加权预测参数设置为相等的。举例来说，视频解码器可能已经确定 RefPicListO 和 RefPicListl 的大小。如果视频解码器确定 RefPicListO 和 RefPicListl 的大小相同且RefPicListO和RefPicListl实质上等效，那么视频解码器可将接收到的加权预测参数设置为等于RefPicListO和RefPicListl两者的加权预测参数。
[0029] 然而，如果视频解码器确定RefPicListO和RefPicListl的大小不相同且 RefPicListO和RefPicListl实质上等效，那么视频解码器可预期接收两个列表中的较长列表的加权预测参数。例如，与先前实例一致，如果RefPicListO比RefPicListl长，那么视频解码器可预期从经译码的位流中接收RefPicListO的加权预测参数。接着，视频解码器可将RefPicListO的前N个条目的加权预测参数设置为等于RefPicListl的相应N个条目（S卩，将RefPicListO的子集设置为等于RefPicListl的整体是因为RefPicListl的大小为N)。
[0030] 一般来说，在 RefPicListO 和 RefPicListl 实质上等效且 RefPicListO 和 RefPicListl具有不同大小时，RefPicListO将比RefPicListl长的概率大于RefPicListl 比RefPicListO长的概率。因此，在一些实例中，只有在RefPicListO和RefPicListl的大小相同时，或在RefPicListO的大小比RefPicListl的大小长时，而非在RefPicListl的大小比RefPicListO的大小长时，视频编码器可在经译码的位流中仅信号传递一个列表的加权预测参数。通过这种方式，视频解码器可不需要确定视频解码器从经译码的位流中接收哪个列表的加权预测参数，因为在RefPicListO和RefPicListl实质上等效时，加权预测参数将总是适合RefPicListO。
[0031] 在一些实例中，技术可开发组合参考图片列表（被称作RefPicListO用于有效信号传递加权预测参数的用途。在一些实例中，视频编码器和视频解码器可各自构建各自的参考图片列表〇和列表1。另外，视频编码器和视频解码器可构建组合参考图片列表（即， RefPicListC)。其为经构建RefPicListO和RefPicListl中的参考图片的某一组合。在一些实例中，视频编码器和视频解码器可利用RefPicListC来识别用于帧间预测当前图片中的块的一或多个参考图片。
[0032] 根据本发明中描述的技术，视频编码器可在经译码的位流中信号传递指示是否将构建RefPicListC的旗标，且视频解码器可或可不回应于旗标的值而构建RefPicListC。在其中将构建RefPicListC的实例中，视频编码器可在经译码的位流中信号传递 RefPicListC中的参考图片而不是RefPicListO和RefPicListl中的图片的加权预测参数。在这些实例中，视频解码器可利用RefPicListC中的参考图片的加权预测参数来确定 RefPicListO和RefPicListl中的参考图片的加权预测参数。
[0033] 举例来说，视频解码器可能已利用某种技术以根据RefPicListO和RefPicListl 构建RefPicListC。因此，视频解码器可能已确定在RefPicListC中识别的参考图片与在RefPicListO和RefPicListl中识别的参考图片之间的映射。换句话说，因为视频解码器根据RefPicListO和RefPicListl构建了 RefPicListC,所以视频解码器可能够确定 RefPicListC中的特定参考图片是否来自RefPicListO或RefPicListl。通过这种方式，在实现RefPicListC的构建时，视频编码器可在经译码的位流中信号传递RefPicListC中的图片的加权预测参数而不是信号传递RefPicListO和RefPicListl中的图片的加权预测参数。
[0034] 在一些实例中，视频编码器和视频解码器可利用以上实例的任一组合（例如，在 RefPicListO和RefPicListl实质上等效的情况下或在实现RefPicListC的构建的情况下）。例如，视频编码器可信号传递指示RefPicListO和RefPicListl是否实质上等效的旗标并信号传递指示是否实现RefPicListC的构建的旗标。在此实例中，视频编码器可信号传递RefPicListC的加权预测参数，且如果RefPicListO和RefPicListl实质上等效并相同，那么视频解码器可将RefPicListC的加权预测参数设置为等于RefPicListO和 RefPicListl的加权预测参数。如果RefPicListO和RefPicListl实质上等效但因为大小不同而不相同（即，一者的子集与另一者的整体或子集相同），那么RefPicListC可等于 RefPicListO 或 RefPicListl 中的较长者，通常是 RefPicListO。
[0035] 作为另一实例，视频编码器可仅信号传递指示RefPicListO和RefPicListl是否实质上等效的旗标，但不信号传递指示是否将构建或将不构建RefPicListC的旗标。作为又另一实例，视频编码器可仅信号传递指示是否将构建或将不构建RefPicListC的旗标，且不信号传递指示RefPicListO和列表是否实质上等效的旗标。
[0036] 在任何情况下，视频译码器（例如，编码器或解码器）可经配置以译码（例如，编码或解码）第一列表的加权预测参数。视频译码器可根据第一列表的加权预测参数的经译码信号传递来确定第二列表的加权预测参数。第一列表可为组合参考图片列表 (RefPicListC)、第一参考图片列表（RefPicListO)或第二参考图片列表（RefPicListl)中的一者。
[0037] 图1是说明根据本发明中描述的一或多个实例的实例视频编码及解码系统的框图。举例来说，系统10包含源装置12和目的地装置14。源装置12和目的地装置14经配置以实施视频资料的译码，其中源装置12和目的地装置14各自译码图片。
[0038] 系统10可根据不同视频译码标准、专有标准或任何其它视频译码方式（包含多视图译码技术）来操作。以下内容描述视频译码标准的一些实例且不应被视为限制。视频译码标准包含 ITU-T H. 261、IS0/IEC MPEG-1 视觉、ITU-T H. 262 或 IS0/IEC MPEG-2 视觉、ITU-T H.263、IS0/IEC MPEG-4视觉以及 ITU-T Η·264(也被称作 IS0/IEC MPEG-4AVC)， ITU-T Η.264包含其可分级视频译码（SVC)扩展以及多视图视频译码（MVC)扩展。
[0039] 另外，存在新视频译码标准，即高效视频译码（HEVC)，其正由ITU-T视频译码专家组（VCEG)和IS0/IEC运动图片专家组（MPEG)的视频译码联合组（JCT-VC)开发。被称作 HEVC WD9的HEVC的近期工作草案截止于2013年3月12日，可从http://phenix. int-evry. fr/jct/doc_end_user/documents/ll_Shanghai/wgll/JCTVC-K1003-vl0· zip 获得。在下文被称作HEVC WD6的HEVC的较早版本的工作草案可在2012年4月3日从http://phenix. int-evry. fr/jct/doc_end_user/documents/8_San% 20Jose/wgll/JCTVC-H1003-v21. zip 获得。仅出于说明的目的，本文中所描述的技术用根据H. 264标准和HEVC标准的实例描述。
[0040] 如图1中所展示，系统10包含源装置12,所述源装置产生在稍后时间将由目的地装置14解码的经编码视频数据。源装置12和目的地装置14包括各种各样的装置中的任一者，包含无线手机（例如所谓的"智能"电话）、所谓的"智能"板或其它经装备以进行无线通信的这种无线装置。源装置12和目的地装置14的额外实例包含但不限于：数字电视、数字直播系统中的装置、无线直播系统中的装置、个人数字助理（PDA)、膝上型计算机、桌上型计算机、平板计算机、电子书阅读器、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝无线电话、卫星无线电话、视频电话会议装置和视频串流装置等。
[0041] 目的地装置14可经由链路16接收待解码的经编码视频数据。链路16包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中，链路16包括使得源装置12能够实时地将经编码视频数据直接发射到目的地装置14 的通信媒体。经编码视频数据可根据通信标准（例如无线通信协议）进行调制，且发射到目的地装置14。所述通信媒体可包括任何无线或有线通信媒体，例如射频（RF)频谱或一或多个物理传输线。所述通信媒体可形成基于数据包的网络（例如局域网、广域网或例如因特网的全球网络）的部分。所述通信媒体可包含路由器、交换机、基站或可用于促进从源装置12到目的地装置14的通信的任何其它设备。
[0042] 在一些实例中，经编码数据从输出接口 22输出到存储装置34。类似地，通过输入接口 28从存储装置34访问经编码数据。存储装置34的实例包含多种分布式或本地访问的数据存储媒体中的任一者，例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适数字存储媒体。在另一实例中，存储装置34对应于保存由源装置12产生的经编码视频的文件服务器或另一中间存储装置。在这些实例中，目的地装置14经由流式传输或下载从存储装置34访问所存储的视频数据。文件服务器为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含web服务器（例如，用于网站）、FTP服务器、网络附加存储（NAS)装置或本地磁盘驱动器。目的地装置14通过任何标准数据连接 (包含因特网连接）访问经编码视频数据。这可包含适合于访问存储于文件服务器上的经编码视频数据的无线信道（例如，Wi-Fi连接）、有线连接（例如，DSL、缆线调制解调器等）或两者的组合。经编码视频数据从存储装置34的传输可以是流式传输、下载传输或两者的组合。
[0043] 本发明的技术不一定限于无线应用或设置。所述技术可应用于支持多种多媒体应用中的任一者的视频译码，所述多媒体应用例如空中电视广播、有线电视传输、卫星电视传输、流式视频传输（例如，通过因特网）、存储在数据存储媒体上的数字视频的编码、存储于数据存储媒体上的数字视频的解码、或其它应用。在一些实例中，系统10可经配置以支持单向或双向视频传输，从而支持多种应用，例如视频流式传输、视频播放、视频广播及/或视频电话。
[0044] 在图1的实例中，源装置12包含视频源18、视频编码器20以及输出接口 22。在一些情况下，输出接口 22包含调制器/解调器（调制解调器）及/或发射器。在源装置12 中，视频源18包含一或多个源（例如，视频捕获装置（例如摄像机）、含有先前捕获的视频的视频档案、用以接收来自视频内容提供商的视频的视频馈送接口，及/或用于产生计算机图形资料作为源视频的计算机图形系统）、所述源的组合或任何其它源。作为一个实例，如果视频源18为摄像机，那么源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而，本发明中描述的技术一般来说可应用于视频译码，且可应用于无线及/或有线应用。
[0045] 视频编码器20对经撷取视频、预先撷取视频或计算机产生的视频进行编码。源装置12的输出接口 22经配置以将经编码视频数据发射到目的地装置14。经编码视频数据还可（或替代地）存储到存储装置34以供目的地装置14或其它装置随后访问，以进行解码及/或回放。
[0046] 目的地装置14包含输入接口 28、视频解码器30及显示装置32。在一些情况下，输入接口 28包含接收器及/或调制解调器。目的地装置14的输入接口 28通过链路16或从存储装置34接收经编码视频数据。通过链路16传达或提供在存储装置34上的经编码视频数据包含由视频编码器20产生的各种语法元素以供视频解码器（例如，视频解码器30) 在解码视频数据过程中使用。可包含此类语法元素与在通信媒体上发射、在存储媒体上存储或由文件服务器存储的经编码视频数据。
[0047] 显示装置32可与目的地装置14整合或在目的地装置14夕卜。在一些实例中，目的地装置14包含经整合显示装置并且还经配置以与外部显示装置接口连接。在其它实例中，目的地装置14为显示装置。通常，显示装置32向用户显示经解码视频数据，并且包括各种显示装置中的任一种，所述显示装置例如液晶显示器（LCD)、等离子显示器、有机发光二极管（OLED)显示器或另一类型的显示装置。
[0048] 视频编码器20及视频解码器30可根据各种视频译码标准（例如，上文所列的实例）来操作。然而，本发明中描述的技术不应视为如此受限。视频压缩标准的其它实例包含MPEG-2及ITU-T H. 263。专有性编码技术（例如，被称为0n2VP6/VP7/VP8的所述技术）还可以实施本文所描述的技术中的一或多种技术。
[0049] 然而，本发明的技术不限于任何特定译码标准。此外，即使本发明中描述的技术不一定符合特定标准，本发明中描述的技术可相对于各种标准进一步帮助译码效率。另外，本发明中描述的技术可为未来标准的一部分。为了便于理解，相对于发展中HEVC标准描述所述技术，但所述技术不限于HEVC标准并且可能扩展至不由特定标准定义的其它视频译码标准或视频译码技术。
[0050] 尽管图1中未展示，但在一些方面中，视频编码器20和视频解码器30可分别与音频编码器和解码器整合，且包含适当的MUX-DEMUX单元或其它硬件和软件，以处置共用数据流或单独数据流中的音频和视频两者的编码。如果适用，在一些实例中，MUX-DEMUX单元符合ITU H. 223复用器协议或其它协议（例如，用户数据报协议（UDP))。
[0051] 视频编码器20和视频解码器30各自可经实施为例如一个或一个以上微处理器、数字信号处理器（DSP)、专用集成电路（ASIC)、现场可编程门阵列（FPGA)、离散逻辑、软件、硬件、固件或其任何组合的多种合适编码器电路中的任一者。当技术部分地在软件中实施时，装置可将用于软件的指令存储在合适非暂时计算机可读媒体中并且使用一或多个处理器执行硬件中的指令，以执行本发明的技术。视频编码器20和视频解码器30其中一个可包含在一或多个编码器或解码器中，其任一个可整合作为各自的装置中的经组合编码器/ 解码器（CODEC)的部分。根据本发明中描述的技术，视频编码器20经配置以对视频数据进行编码，并且视频解码器30经配置以解码视频数据。
[0052] 视频序列通常包含一系列视频图片。图片组（G0P)通常包括一系列一或多个视频图片。G0P可包含G0P的组头中、G0P的一或多个图片的组头中或别处的语法数据，所述语法数据描述包含在G0P中的许多图片。每一图片可包含描述各自的图片的编码模式的图片语法数据。视频编码器20通常对个别视频图片内的视频块操作，以对视频数据进行编码。视频块可对应于宏块、宏块的分割及可能对应于分割的子块，如H. 264标准或最大译码单元（LCU)、译码单元（CU)、预测单元（PU)或变换单元（TU)中所定义，如HEVC标准中所定义。所述视频块可具有固定的或变化的大小，且可根据指定的译码标准而大小不同。每一视频图片可包含多个片段。每一片段可包含多个块。
[0053] 作为一实例，ITU-T H. 264标准支持各种块大小（例如，针对亮度分量的16乘16、 8乘8或4乘4,和针对色度分量的8X8)的帧内预测，以及各种块大小（例如，针对亮度分量的16X16、16X8、8X16、8X8、8X4、4X8和4X4,和针对色度分量的对应缩放的大小）的帧间预测。在本发明中，"NxN"和"N乘N"可互换地使用以指示关于垂直和水平尺寸的块的像素尺寸（例如，16x16个像素或16乘16个像素）。通常，16x16块将在垂直方向上具有16个像素（y = 16)及在水平方向上具有16个像素（X = 16)。同样，NxN块通常在垂直方向上具有N个像素及在水平方向上具有N个像素，其中N表示非负整数值。一块中的像素可布置成若干行和若干列。此外，块在水平方向上的像素数目不一定与垂直方向上的像素数目相同。举例来说，块可包括NXM个像素，其中Μ不一定等于N。
[0054] 当对所述块进行帧内预测译码（例如，经帧内预测）时，所述块可包含描述所述块的帧内预测模式的数据。作为另一实例，当对所述块进行帧间预测编码（例如，经帧间预测）时，所述块可包含定义所述块的运动向量的信息。定义所述块的运动向量的数据描述例如运动向量的水平分量、运动向量的垂直分量、运动向量的分解（例如，四分之一像素精度或八分之一像素精度）。另外，当进行帧间预测时，所述块可包含运动向量所指向的例如参考图片的参考索引信息，及/或运动向量的参考图片列表（例如，RefPicListO或 RefPicListl)。
[0055] JCT-VC正致力于HEVC标准的发展。HEVC标准化工作基于视频译码装置的被称为 HEVC测试模型（HM)的演化模型。HM根据（例如ITU-T H. 264/AVC)推测视频译码装置相对于现有装置的几种额外能力。举例来说，然而，H. 264提供九种帧内预测编码模式，HM可提供多达三十三个方向/角度帧内预测编码模式加 DC及平面模式。
[0056] HM的工作模式描述视频图片可被分为树块或最大译码单元（LCU)序列，包含亮度样本和色度样本两种。树块具有与H. 264标准的宏块类似的用途。片段包含译码次序中的许多连续树块。视频图片可分割为一或多个片段。每一树块根据四叉树可分裂为译码单元 (CU)。举例来说，作为四叉树的根节点的树块可分裂为四个子节点，且每一子节点进而可为母节点并且分裂为另外四个子节点。作为四叉树的叶节点的最终未分裂的子节点包括译码节点（即，经译码视频块）。与经译码位流相关联的语法数据可定义树块可被分裂的最大次数，并且还可定义译码节点的最小大小。在一些实例中，树块被称为LCU。
[0057] CU包含译码节点及与译码节点相关联的预测单元（PU)及变换单元（TU)。CU的大小对应于译码节点的大小并且CU的形状可为方形。在一些实例中，CU的大小范围为8x8 个像素到具有最大为64x64个像素或更大的树块的大小。在一些实例中，每一⑶含有一或多个PU及一或多个TU。与CU相关联的语法数据描述例如将CU分割为一或多个PU。在CU 是以跳过或直接模式编码、帧内预测模式编码或帧间预测模式编码之间，分割模式不同。在一些实例中，PU可经分割为形状为非方形。与CU相关联的语法数据例如也描述根据四叉树将CU分割为一或多个TU。TU的形状可为方形或非方形。
[0058] HEVC标准允许根据TU的变换，TU对于不同⑶来说可不同。TU通常基于经定义用于经分割的LCU的给定CU内的PU大小而设定大小，然而情况并非总是如此。TU通常与 PU大小相同或小于PU。在一些实例中，使用被称为"残余四叉树"(RQT)的四叉树结构将对应于CU的残余样本再分为较小单元。RQT的叶节点可被称为变换单元（TU)。在一些实例中，与TU相关联的像素差值经变换以产生经量化的变换系数。
[0059] 通常，TO包含与预测过程有关的数据。举例来说，当PU经帧内预测译码时，PU包含描述TO的帧内预测模式的数据。作为另一实例，当PU经帧间预测译码时，PU包含定义PU 的运动向量的数据。定义PU的运动向量的数据描述例如运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率（例如，四分之一像素精度或八分之一像素精度）、运动向量所指向的参考图片及/或运动向量的参考图片列表（例如，RefPicListO或RefPicListl)。
[0060] 通常，TU用于变换及量化过程。具有一或多个PU的给定⑶还可包含一或多个变换单元（TU)。在进行预测之后，视频编码器20可计算对应于PU的残余值。残余值包括可使用TU经变换为变换系数、经量化及扫描以产生用于熵译码的串行化变换系数的像素差值。本发明通常使用术语"视频块"来指代⑶的译码节点。在一些具体情况下，本发明还可使用术语"视频块"来指代树块，即LCU或CU，所述树块包含译码节点及PU和TU。
[0061] 作为实例，ΗΜ支持各种PU大小的预测。假设特定CU的大小为2Νχ2Ν，ΗΜ支持PU 大小为2Νχ2Ν或ΝχΝ的帧内预测及对称PU大小为2Νχ2Ν、2ΝχΝ、Νχ2Ν或ΝχΝ的帧间预测。 ΗΜ还支持PU大小为2NxnU、2NxnD、nLx2N及nRx2N的帧间预测的不对称分割。在不对称分割中，不对CU的一个方向进行分割，而另一方向被分割为25%和75%。对应于25%分割的 CU部分由"η"之后跟着"Up (上）"、"Down (下）"、"Left (左）"或"Right (右）"的指示来指示。因此，举例来说，"2NxnU"指代被水平地分割成2Νχ 0. 5N PU在上且2Nx 1.5N PU在下的 2Nx 2N CU。
[0062] 在Η. 264标准或HEVC标准中，在进行帧内预测或帧间预测译码之后，视频编码器 20可以HEVC或针对Η. 264中的宏块计算⑶的TU的残余数据。PU包括空间域（也被称为像素域）中的像素数据，并且在对残余视频数据应用变换（例如，离散余弦变换（DCT))、整数变换、小波变换或概念上类似的变换之后，TU包括变换域中的系数。残余数据可对应于未经编码图片的像素与对应于HEVC中PU的预测值或Η. 264中宏块的预测值之间的像素差。
[0063] 在一些实例中，在进行任何变换以产生变换系数之后，视频编码器20执行变换系数的量化。量化通常是指将变换系数量化以可能地减少用于表示系数的数据量从而提供进一步压缩的过程。量化过程减少与系数中的一些或全部相关联的位深度。举例来说，在量化期间，可将η位值向下舍入到m位值，其中η大于m。
[0064] 在一些实例中，视频编码器20利用预定义的扫描次序来扫描经量化变换系数，以产生可经熵编码的经串行化向量。在其它实例中，视频编码器20执行自适应扫描。在扫描经量化变换系数以形成一维向量之后，视频编码器20对所述一维向量进行熵编码，例如根据上下文自适应可变长度译码（CAVLC)、上下文自适应二进制算术译码（CABAC)、基于语法的上下文自适应二进制算术译码（SBAC)、概率区间分割熵（PIPE)译码或另一熵编码方法。视频编码器20也对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30在解码视频数据过程中使用。
[0065] 为了执行CABAC，视频编码器20可将上下文模型内的上下文指派给待发射的符号。上下文可（例如）与所述符号的相邻值是否为非零有关。为了执行CAVLC，视频编码器 20可为待发射的符号选择可变长度码。VLC中的码字可经构建，使得相对较短的码对应于概率较大的符号，而较长的码对应于概率较小的符号。以此方式，VLC的使用可相较于（例如）为待发射的每一符号使用等长码字实现位节省。概率确定可基于指派给符号的上下文。
[0066] 如上文所述，为了执行帧间预测译码（例如，由视频编码器20进行的帧间预测译码或由视频解码器30进行的帧间预测解码），视频编码器20和视频解码器30可配置为构建一或两个参考图片列表（即，RefPicListO和RefPicListl)。举例来说，在解码当前图片内的块之前，视频解码器30可构建RefPicListO和RefPicListl，其中RefPicListO和 RefPicListl识别参考图片，视频解码器30可潜在地使用所述参考图片以对当前图片内的块（例如，对当前图片内的块进行帧间预测解码）进行帧间预测。存在多种视频解码器 30可构建RefPicListO和RefPicListl的方式，并且本发明中描述的技术不限于用于构建 RefPicListO 和 RefPicListl 的任一具体技术。
[0067] 视频编码器20也可配置以构建RefPicListO和RefPicListl。举例来说，视频编码器20侧上的RefPicListO和RefPicListl可识别图片，视频编码器20可潜在地使用所述图片来对图片的块进行帧间预测编码，并且视频解码器30侧上的RefPicListO和 RefPicListl可识别图片，视频解码器30可潜在地使用所述图片来对图片的块进行帧间预测解码。视频编码器20所构建的RefPicListO和RefPicListl实质上可类似于视频解码器 30 所构建的各个 RefPicListO 和 RefPicListl。
[0068] 如上文所描述，RefPicListO和RefPicListl识别参考图片。在一些实例中， RefPicListO和RefPicListl可用其图片序列号（P0C)值来识别参考图片。P0C值为图片的唯一识别符并且指示输出或显示图片的次序。举例来说，具有较小P0C值的图片先于具有较大P0C值的图片输出或显示。P0C值不应与译码次序混淆。举例来说，有可能具有较小 P0C值的图片晚于具有较大P0C值的图片进行编码或解码。
[0069] 在一些实例中，存在与RefPicListO和RefPicListl中识别的每一图片相关联的加权预测参数。加权预测参数指示比例因子，视频解码器30利用所述比例因子来调整参考图片内像素的像素值，所述像素用于对当前图片内的块进行帧间预测（例如，对当前图片内的块进行帧间预测解码）。举例来说，如果RefPicListO中第一图片的加权预测参数为 'X'并且视频解码器30使用RefPicListO中第一图片来对当前图片中的块进行帧间预测，那么视频解码器30可用如运动向量所指示的RefPicListO中第一图片中的块的像素值乘以值X，所述块用于帧间预测。视频解码器30可将所得值用于对当前图片的块进行帧间预测。加权预测参数也可定义在调整像素值之后添加或减去的偏移。
[0070] 视频编码器20可配置以在经译码位流中用信号传递视频编码器30所构建的参考图片列表的加权预测参数。下表1说明语法元素的一个实例，视频编码器20将所述语法元素用信号传递至视频解码器30以用信号传递加权预测参数。表1实质上类似于HEVC WD6 的部分7. 3. 3. 8中的表。HEVC WD9的部分7. 3. 8. 4包含最新加权预测参数语法，所述语法类似于下表，其中由于HEVC标准从HEVC WD6至HEVC WD9的变化产生差异。
[0071] 表1-预测权重表语法
[0072]

【权利要求】
1. 一种用于译码视频数据的方法，所述方法包括：译码第一列表的加权预测参数，其中所述第一列表包含用于帧间预测当前图片内的一或多个块的参考图片；基于所述第一列表的所述加权预测参数确定第二列表的加权预测参数，其中所述第二列表包含用于帧间预测所述当前图片内的一或多个块的参考图片；及至少基于所述经译码的加权预测参数和所述确定的加权预测参数中的一或多者帧间预测所述当前图片中的块。
2. 根据权利要求1所述的方法，其中确定所述第二列表的所述加权预测参数包括仅基于所述第一列表的所述加权预测参数确定所述第二列表的所述加权预测参数。
3. 根据权利要求1所述的方法，其中确定所述第二列表的所述加权预测参数包括在不译码所述第二列表的所述加权预测参数的情况下确定所述第二列表的所述加权预测参数。
4. 根据权利要求1所述的方法，其中所述第一列表包括组合参考图片列表 (RefPicListC)、第一参考图片列表（RefPicListO)或第二参考图片列表（RefPicListl)中的一者，且所述第二列表与所述第一列表不同。
5. 根据权利要求1所述的方法，其进一步包括：译码指示所述第一列表和所述第二列表是否实质上等效的语法元素；其中确定所述第二列表的所述加权预测参数包括在所述语法元素指示所述第一列表和所述第二列表实质上等效时，基于所述第一列表确定所述第二列表的所述加权预测参数。
6. 根据权利要求5所述的方法，其中在所述第一列表和所述第二列表相同时，所述语法元素指示所述第一列表和所述第二列表实质上等效。
7. 根据权利要求5所述的方法，其中在所述第一列表比所述第二列表长时且在所述第一列表的前N个条目与所述第二列表的前N个条目相同时，所述语法元素指示所述第一列表和所述第二列表实质上等效。
8. 根据权利要求1所述的方法，其中译码包括使用视频解码器解码所述第一列表的所述加权预测参数；其中确定包括使用所述视频解码器基于所述第一列表的所述加权预测参数确定所述第二列表的加权预测参数；及其中帧间预测包括使用所述视频解码器至少基于所述经译码的加权预测参数和所述确定的加权预测参数中的一或多者帧间预测解码所述当前图片中的所述块。
9. 根据权利要求1所述的方法，其中译码包括使用视频编码器编码所述第一列表的所述加权预测参数；其中确定包括使用所述视频编码器基于所述第一列表的所述加权预测参数确定所述第二列表的加权预测参数；及其中帧间预测包括使用所述视频编码器至少基于所述经译码的加权预测参数和所述确定的加权预测参数中的一或多者帧间预测编码所述当前图片中的所述块。
10. -种用于译码视频数据的装置，所述装置包括视频译码器，所述视频译码器经配置以：译码第一列表的加权预测参数，其中所述第一列表包含用于帧间预测当前图片内的一或多个块的参考图片；基于所述第一列表的所述加权预测参数确定第二列表的加权预测参数，其中所述第二列表包含用于帧间预测所述当前图片内的一或多个块的参考图片；及至少基于所述经译码的加权预测参数和所述确定的加权预测参数中的一或多者帧间预测所述当前图片中的块。
11. 根据权利要求10所述的装置，其中，为确定所述第二列表的所述加权预测参数，所述视频译码器经配置以仅基于所述第一列表的所述加权预测参数确定所述第二列表的所述加权预测参数。
12. 根据权利要求10所述的装置，其中，为确定所述第二列表的所述加权预测参数，所述视频译码器经配置以在不译码所述第二列表的所述加权预测参数的情况下确定所述第二列表的所述加权预测参数。
13. 根据权利要求10所述的装置，其中所述第一列表包括组合参考图片列表 (RefPicListC)、第一参考图片列表（RefPicListO)或第二参考图片列表（RefPicListl)中的一者，且所述第二列表与所述第一列表不同。
14. 根据权利要求10所述的装置，其中所述视频译码器经配置以：译码指示所述第一列表和所述第二列表是否实质上等效的语法元素；其中，为确定所述第二列表的所述加权预测参数，所述视频译码器经配置以在所述语法元素指示所述第一列表和所述第二列表实质上等效时，基于所述第一列表确定所述第二列表的所述加权预测参数。
15. 根据权利要求14所述的装置，其中在所述第一列表和所述第二列表相同时，所述语法元素指示所述第一列表和所述第二列表实质上等效。
16. 根据权利要求14所述的装置，其中在所述第一列表比所述第二列表长时且在所述第一列表的前N个条目与所述第二列表的前N个条目相同时，所述语法元素指示所述第一列表和所述第二列表实质上等效。
17. 根据权利要求10所述的装置，其中所述视频译码器包括视频解码器，且其中所述视频解码器经配置以：解码所述第一列表的所述加权预测参数；基于所述第一列表的所述加权预测参数确定所述第二列表的所述加权预测参数；及至少基于所述经译码的加权预测参数和所述确定的加权预测参数中的所述一或多者帧间预测解码所述当前图片中的所述块。
18. 根据权利要求10所述的装置，其中视频译码器包括视频编码器，且其中所述视频编码器经配置以：编码所述第一列表的所述加权预测参数；基于所述第一列表的所述加权预测参数确定所述第二列表的所述加权预测参数；及至少基于所述经译码的加权预测参数和所述确定的加权预测参数中的所述一或多者帧间预测编码所述当前图片中的所述块。
19. 根据权利要求10所述的装置，其中所述装置包括以下中的一者：集成电路；微处理器；及包含所述视频译码器的无线装置。
20. -种在其上存储有指令的计算机可读存储媒体，所述指令在执行时使用于视频译码的装置的一或多个处理器进行以下操作：译码第一列表的加权预测参数，其中所述第一列表包含用于帧间预测当前图片内的一或多个块的参考图片；基于所述第一列表的所述加权预测参数确定第二列表的加权预测参数，其中所述第二列表包含用于帧间预测所述当前图片内的一或多个块的参考图片；及至少基于所述经译码的加权预测参数和所述确定的加权预测参数中的一或多者帧间预测所述当前图片中的块。
21. 根据权利要求20所述的计算机可读存储媒体，其中使所述一或多个处理器确定所述第二列表的所述加权预测参数的所述指令包括使所述一或多个处理器仅基于所述第一列表的所述加权预测参数确定所述第二列表的所述加权预测参数的指令。
22. 根据权利要求20所述的计算机可读存储媒体，其中使所述一或多个处理器确定所述第二列表的所述加权预测参数的所述指令包括使所述一或多个处理器在不译码所述第二列表的所述加权预测参数的情况下确定所述第二列表的所述加权预测参数的指令。
23. -种用于译码视频数据的装置，所述装置包括：用于译码第一列表的加权预测参数的装置，其中所述第一列表包含用于帧间预测当前图片内的一或多个块的参考图片；用于基于所述第一列表的所述加权预测参数确定第二列表的加权预测参数的装置，其中所述第二列表包含用于帧间预测所述当前图片内的一或多个块的参考图片；及用于至少基于所述经译码的加权预测参数和所述确定的加权预测参数中的一或多者帧间预测所述当前图片中的块的装置。
24. 根据权利要求23所述的装置，其中用于确定所述第二列表的所述加权预测参数的所述装置包括用于仅基于所述第一列表的所述加权预测参数确定所述第二列表的所述加权预测参数的装置。
25. 根据权利要求23所述的装置，其中用于确定所述第二列表的所述加权预测参数的所述装置包括用于在不译码所述第二列表的所述加权预测参数的情况下确定所述第二列表的所述加权预测参数的装置。
26. -种用于译码视频数据的方法，所述方法包括：构建第一参考图片列表；构建第二参考图片列表；译码至少第一语法元素，所述第一语法元素指示所述第一参考图片列表是否与所述第二参考图片列表相同；在所述第一语法元素指示所述第一参考图片列表与所述第二参考图片列表相同时，译码在所述第一参考图片列表中识别的参考图片的加权预测参数，且不译码在所述第二参考图片列表中识别的参考图片的加权预测参数；及在所述第一语法元素指示所述第一参考图片列表与所述第二参考图片列表相同时，根据在所述第一参考图片列表中识别的至少一个参考图片并基于所述参考图片的加权预测参数预测视频块。
27. -种用于译码视频数据的方法，所述方法包括：译码至少第一语法元素，所述第一语法元素指示第一参考图片列表和第二参考图片列表的前N个元素是否相同；在所述前N个元素相同时，译码指示所述第一参考图片列表的大小和所述第二参考图片列表的大小的信息；在所述第一参考图片列表的所述大小大于所述第二参考图片列表的所述大小时：构建所述第一参考图片列表；及从所述第一参考图片列表导出所述第二参考图片列表；及在所述第二参考图片列表的所述大小大于所述第一参考图片列表的所述大小时：构建所述第二参考图片列表；及从所述第二参考图片列表导出所述第一参考图片列表。
28. 根据权利要求27所述的方法，其进一步包括：在所述前N个元素相同时且在所述第一参考图片列表的所述大小大于所述第二参考图片列表的所述大小时：译码在所述第一参考图片列表中识别的参考图片的加权预测参数；不译码在所述第二参考图片列表中识别的参考图片的加权预测参数；及从在所述第一参考图片列表中识别的前N个参考图片的所述加权预测参数导出在所述第二参考图片列表中识别的所述参考图片的所述加权预测参数；及在所述前N个元素相同时且在所述第二参考图片列表的所述大小大于所述第一参考图片列表的所述大小时：译码在所述第二参考图片列表中识别的参考图片的加权预测参数；不译码在所述第一参考图片列表中识别的参考图片的加权预测参数；及从在所述第二参考图片列表中识别的所述前N个参考图片的所述加权预测参数导出在所述第一参考图片列表中识别的所述参考图片的所述加权预测参数。
【文档编号】H04N19/463GK104272742SQ201380023733
【公开日】2015年1月7日申请日期:2013年3月15日优先权日:2012年4月3日
【发明者】穆罕默德·蔡德·科班, 马尔塔·卡切维奇申请人:高通股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：穆罕默德·蔡德·科班;马尔塔·卡切维奇
技术所有人：高通股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。