视频译码中基于单预测相邻者的双预测合并模式的制作方法

文档序号:7989250阅读:129来源:国知局
视频译码中基于单预测相邻者的双预测合并模式的制作方法
【专利摘要】本发明描述双预测合并模式,其中双预测视频块从两个不同相邻块继承运动信息,其中所述两个不同相邻块各自在单预测模式中编码。双预测译码可改善在视频译码中实现压缩的能力。所描述的双预测合并模式可通过允许使用两个单独的单预测相邻者来界定视频块的双预测运动信息,而增加在合并模式译码的上下文中可使用的双预测候选者的数目。
【专利说明】视频译码中基于单预测相邻者的双预测合并模式
[0001]本申请案主张2011年3月21日申请的第61 / 454,862号美国临时申请案和2011年6月29日申请的第61 / 502,703号美国临时申请案的优先权,以上每一个美国临时申请案的全部内容以引用方式并入本文。
【技术领域】
[0002]本发明涉及用以压缩视频数据的视频译码技术,且更特定来说涉及在视频压缩中使用的视频译码模式。
背量技术
[0003]数字视频能力可并入到广泛多种视频装置中,包含数字电视机、数字直播系统、例如无线电话手持机等无线通信装置、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、数码相机、数字记录装置、视频游戏装置、视频游戏控制台、个人多媒体播放器和类似装置。此些视频装置可实施视频压缩技术,例如在MPEG-2、MPEG-4或ITU-T
H.264 / MPEG-4第10部分高级视频译码(AVC)中描述的那些技术,以便压缩视频数据。视频压缩技术执行空间预测和/或时间预测以减少或移除视频序列中固有的冗余。新的视频标准持续出现和演进,例如由作为MPEG与ITU-T之间的合作的“视频译码联合合作组”(JCTVC)开发的高效视频译码(HEVC)标准。新兴的HEVC标准有时称为H.265。
[0004]这些和其它视频译码标准和技术使用基于块的视频译码。基于块的视频译码技术将视频帧(或其部分)的视频数据划分为若干视频块,且随后使用基于预测块的压缩技术对所述视频块进行编码。可将视频块进一步划分为若干视频块分区。视频块(或其分区)可称为译码单元(CU)且可使用一种或一种以上视频特定编码技术以及一股数据压缩技术来编码。可选择不同模式且使用不同模式对视频块进行译码。
[0005]通过新兴的HEVC标准,可根据四叉树分割方案将最大译码单元(IXU)划分为越来越小的CU。可基于所谓的预测单元(PU)来预测CU,I3U可具有对应于CU的大小或小于CU的大小的分区大小,使得可使用多个PU来预测给定CU。
[0006]可使用不同模式对CU进行编码。举例来说,可使用不同帧内译码模式来基于同一帧或切片内的预测数据来对CU进行译码,以便利用视频帧内的空间冗余。替代地,可使用帧间译码模式基于来自另一帧或切片的预测数据来对CU进行译码,以便利用视频序列的帧上的时间冗余。在根据选定模式执行预测译码之后,可接着执行变换译码,例如离散余弦变换(DCT)、整数变换或类似变换。通过HEVC,变换译码可相对于变换单元(TU)而发生,TU在HEVC标准中也可具有变化的变换大小。还可执行变换系数的量化、经量化变换系数的扫描以及熵译码。例如在视频切片标头或视频块标头中用经编码视频数据用信号发送语法信息,以便向解码器告知如何对视频数据进行解码。尤其,语法信息可识别在不同视频块的视频译码中曾使用的模式。
[0007]合并模式是在视频压缩中使用的特定帧间译码模式。通过合并模式,相邻视频块的运动向量经继承以用于正经译码的当前视频块。在一些情况下,合并模式致使当前视频块继承预界定相邻者的运动向量,且在其它情况下,可使用索引值来识别当前视频块继承其运动向量的特定相邻者(例如,上方、右上方、左方、左下方或与时间邻近帧位于同一地点)。

【发明内容】

[0008]本发明描述一种双预测合并模式,其中在双预测合并模式中译码的视频块从两个不同相邻块继承其运动信息,其中所述两个不同相邻块各自在单预测模式中编码。双预测译码可改善实现压缩的能力或改善给定压缩等级下的视频质量。然而在一些情况下,可能不存在(或存在少量)在双预测模式中编码的相邻者,因此使双预测相对于合并模式编码不可用(或受限)。所描述的双预测合并模式可通过允许使用两个单独的单预测相邻者来界定视频块的双预测运动信息,而增加在合并模式译码的上下文中可使用的双预测候选者的数目。
[0009]在一个实例中,本发明描述对视频数据进行解码的方法。所述方法包括接收用于当前视频块的一个或一个以上语法元素,其中当前视频块是根据双预测合并模式来编码,且基于一个或一个以上语法元素,识别在单预测模式中译码的两个不同相邻视频块。所述方法还包括使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对当前视频块进行解码。
[0010]在另一实例中,本发明描述对视频数据进行编码的方法。所述方法包括:选择用于对当前视频块进行编码的双预测合并模式;识别在单预测模式中译码的两个不同相邻视频块;使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对所述当前视频块进行编码;以及产生一个或一个以上语法元素以向视频解码器识别所述两个不同相邻视频块。
[0011]在另一实例中,本发明描述对视频数据进行解码的视频解码装置。所述视频解码装置包括视频解码器,其经配置以接收用于当前视频块的一个或一个以上语法元素,其中当前视频块是根据双预测合并模式来编码,且基于一个或一个以上语法元素,识别在单预测模式中译码的两个不同相邻视频块。视频解码器经配置以使用两个不同相邻视频块的运动信息来根据双预测合并模式对当前视频块进行解码。
[0012]在另一实例中,本发明描述一种视频编码装置,其包括视频编码器,所述视频编码器经配置以:选择用于对当前视频块进行编码的双预测合并模式;识别在单预测模式中译码的两个不同相邻视频块;使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对所述当前视频块进行编码;以及产生一个或一个以上语法元素以向视频解码器识别所述两个不同相邻视频块。
[0013]在另一实例中,本发明描述一种用于对视频数据进行解码的装置,所述装置包括:用于接收用于当前视频块的一个或一个以上语法元素的装置,其中所述当前视频块是根据双预测合并模式编码的;用于基于所述一个或一个以上语法元素识别在单预测模式中译码的两个不同相邻视频块的装置;以及用于使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对当前视频块进行解码的装置。
[0014]在另一实例中,本发明描述一种用于对视频数据进行编码的装置,所述装置包括:用于选择用于对当前视频块进行编码的双预测合并模式的装置;用于识别在单预测模式中译码的两个不同相邻视频块的装置;用于使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对所述当前视频块进行编码的装置;以及用于产生一个或一个以上语法元素以向视频解码器识别所述两个不同相邻视频块的装置。
[0015]本发明中描述的技术可以硬件、软件、固件或其任一组合来实施。举例来说,各种技术可由一个或一个以上处理器实施或执行。如本文使用,处理器可指代微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)或其它等效集成或离散逻辑电路。软件可由一个或一个以上处理器执行。包括用以执行所述技术的指令的软件可初始存储在计算机可读媒体中且由处理器加载和执行。
[0016]因此,本发明还预期包括指令的计算机可读存储媒体,所述指令致使处理器执行本发明中描述的任何技术。在一些情况下,所述计算机可读存储媒体可形成计算机程序存储产品的一部分,所述计算机程序存储产品可出售给制造商和/或在装置中使用。计算机程序产品可包含计算机可读媒体,且在一些情况下还可包含封装材料。
[0017]确切地说,本发明还描述一种包括指令的计算机可读媒体,所述指令在执行后即刻致使处理器对视频数据进行解码,其中所述指令致使所述处理器进行以下操作:在接收到用于当前视频块的一个或一个以上语法元素后,其中所述当前视频块是根据双预测合并模式编码的,基于所述一个或一个以上语法元素识别在单预测模式中译码的两个不同相邻视频块;使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对当前视频块进行解码。
[0018]在又一实例中,本发明描述一种包括指令的计算机可读媒体,所述指令在执行后即刻致使处理器对视频数据进行编码,其中所述指令致使所述处理器进行以下操作:选择用于对当前视频块进行编码的双预测合并模式;识别在单预测模式中译码的两个不同相邻视频块;使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对所述当前视频块进行编码;以及产生一个或一个以上语法元素以向视频解码器识别所述两个不同相邻视频块。
[0019]在附图和以下描述中陈述本发明的一个或一个以上方面的细节。从描述和图式以及从权利要求书将明了本发明中描述的技术的其它特征、目的和优点。
【专利附图】

【附图说明】
[0020]图1是说明可实施本发明的技术中的一者或一者以上的一个示范性视频编码和解码系统的框图。
[0021]图2是说明与本发明的技术一致的译码单元(CU)的四叉树分割的概念图。
[0022]图3是说明与本发明的技术一致的CU、预测单元(PU)和变换单元(TU)之间的一些可能关系的概念图。
[0023]图4是说明可实施本发明的技术的视频编码器的框图。
[0024]图5是说明与本发明的一个或一个以上实例一致的编码器的示范性预测单元的框图。
[0025]图6是说明可实施本发明的技术的视频解码器的框图。
[0026]图7是说明与本发明一致的不同相邻视频块相对于当前视频块的位置使得当前视频块可在双预测合并模式中使用一个或一个以上不同相邻视频块的信息的概念图。[0027]图8和9是说明与本发明一致的技术的流程图。
【具体实施方式】
[0028]在大多数视频译码系统中,使用运动估计和运动补偿来减少视频序列中的时间冗余,以便实现数据压缩。在此情况下,可产生运动向量以便例如从另一视频帧或切片识别视频数据的预测块,其可用以预测正经译码的当前视频块的值。将预测视频块的值从当前视频块的值减去以产生残余数据块。将运动向量连同残余数据一起从编码器传送到解码器。解码器可定位同一预测块(基于运动向量),且通过组合残余数据与预测块的数据而重构经编码视频块。也可使用许多其它压缩技术,例如变换和熵译码,以进一步改善视频压缩。
[0029]运动估计过程通常在编码器处完成。运动信息(例如运动向量、运动向量索引、预测方向或其它信息)可经编码且从编码器发射到解码器,使得解码器可识别曾用以对给定视频块进行编码的同一预测块。可使用许多不同编码模式来允许两个不同帧之间的不同类型的时间预测或一给定帧内的不同类型的空间预测。
[0030]通过所谓的合并模式,相邻视频块的运动信息经继承以用于正经译码的当前视频块。在此情况下,对于在合并模式中译码的视频块不发射运动向量自身。而是,可使用索引值来识别当前视频块继承其运动向量(且可能其它运动信息)的相邻者。举例来说,运动信息可从上方相邻者、右上方相邻者、左方相邻者、左下方相邻者或与时间上邻近帧位于同一地点的时间相邻者继承。
[0031]对于大多数合并模式,如果相邻者在单预测模式中编码,那么当前视频块继承一个运动向量。如果相邻者在双预测模式中编码,那么当前视频块继承两个运动向量。在此些实例中,正在合并模式中译码的块受到其相邻者的运动信息的限制。单预测和双预测有时称为单向(P)预测和双向(B)预测,但术语“方向”通常是错放的,因为对于现代视频译码标准,双预测仅基于预测数据的两个不同列表且未规定方向。换句话说,用于双预测的两个不同列表中的数据可来自先前或后续的帧,且不需要分别相对于先前和后续两个帧是双向的。为此原因,本发明使用术语单预测和双预测,而不是术语单向预测和双向预测。
[0032]双预测译码可改善实现压缩的能力或改善给定压缩等级下的视频质量。然而,在一些情况下,可能不存在(或存在少量)在双预测模式中编码的相邻者,因此使得双预测在合并模式编码中不可用(或受限)。举例来说,对于常规合并模式,如果在相邻块中的任一者中不存在双预测模式,那么当前块可能会失去利用从双预测可能带来的益处的机会。
[0033]本发明将双预测合并模式描述为对合并模式技术的扩展或添加。更具体来说,本发明描述从两个不同相邻块继承运动信息的双预测合并模式,其中所述两个不同相邻块各自在单预测模式中编码。所描述的双预测合并模式可增加在合并模式译码的上下文中可使用的双预测候选者的数目。
[0034]图1是说明可实施本发明的技术的示范性视频编码和解码系统10的框图。如图1所示,系统10包含源装置12,所述源装置12经由通信信道15将经编码视频发射到目的地装置16。源装置12和目的地装置16可包括广范围的装置中的任一者。在一些情况下,源装置12和目的地装置16可包括无线通信装置手持机,例如所谓的蜂窝式或卫星无线电电话。然而,通常适用于双预测合并模式中的视频块的编码和解码的本发明的技术可应用于包含视频编码和/或解码能力的非无线装置。源装置12和目的地装置16仅是可支持本文描述的技术的译码装置的实例。
[0035]在图1的实例中,源装置12可包含视频源20、视频编码器22、调制器/解调器(调制解调器)23和发射器24。目的地装置16可包含接收器26、调制解调器27、视频解码器28和显示装置30。根据本发明,源装置12的视频编码器22可经配置以根据双预测合并模式对一个或一个以上视频块进行编码。对于双预测合并模式,视频块从两个不同相邻块继承其运动信息,其中所述两个不同相邻块各自在单预测模式中编码。可在视频编码器22处产生语法元素,以便识别在单预测模式中译码的所述两个不同相邻视频块。以此方式,视频解码器可基于由语法元素识别的两个不同相邻视频块的运动信息而重构双预测视频块。
[0036]更具体来说,视频编码器22可选择双预测合并模式用于对当前视频块进行编码,且识别在单预测模式中译码的两个不同相邻视频块。视频编码器22可使用所述两个不同相邻视频块的运动信息来根据双预测合并模式对当前视频块进行编码,且产生一个或一个以上语法元素来向视频解码器识别所述两个不同相邻视频块。
[0037]视频源20可包括视频俘获装置,例如摄像机、含有先前俘获的视频的视频档案、来自视频内容提供者的视频馈送或另一视频源。作为又一替代,视频源20可产生基于计算机图形的数据作为源视频,或直播视频、经归档视频和计算机产生的视频的组合。在一些情况下,如果视频源20是摄像机,则源装置12和目的地装置16可形成所谓的相机电话或视频电话。在每一情况下,所俘获、预俘获或计算机产生的视频均可由视频编码器22编码。
[0038]一旦视频数据由视频编码器22编码,经编码视频信息便可随后由调制解调器23根据一种通信标准来调制,所述通信标准例如是码分多址(CDMA)、正交频分多路复用(OFDM)或任何其它通信标准或技术。经编码和调制的数据可随后经由发射器24发射到目的地装置16。调制解调器23可包含为了信号调制而设计的各种混频器、滤波器、放大器或其它组件。发射器24可包含为了发射数据而设计的电路,包含放大器、滤波器和一个或一个以上天线。目的地装置16的接收器26经由信道15接收信息,且调制解调器27对所述信息进行解调。
[0039]由视频解码器28执行的视频解码过程可包含与由视频编码器22执行的编码技术互逆的技术。特定来说,视频解码器28可接收用于当前视频块的一个或一个以上语法元素,其中当前视频块是根据双预测合并模式来编码,且基于一个或一个以上语法元素,识别在单预测模式中译码的两个不同相邻视频块。视频解码器可使用两个不同相邻视频块的运动信息来根据双预测合并模式对当前视频块进行解码。
[0040]通信信道15可包括任何无线或有线通信媒体,例如射频(RF)频谱或者一种或一种以上物理传输线,或无线与有线媒体的任何组合。通信信道15可形成基于包的网络的一部分,所述网络例如为局域网、广域网或例如因特网的全球网。通信信道15大体上表示用于将视频数据从源装置12发射到目的地装置16的任何合适的通信媒体或不同通信媒体的集合。再次,图1仅是示范性的,且本发明的技术可适用于不一定包含编码与解码装置之间的任何数据通信的视频译码设定(例如,视频编码或视频解码)。在其它实例中,数据可从本地存储器检索、经由网络流式传输等。
[0041 ] 在一些情况下,视频编码器22和视频解码器28可大体上根据例如新兴的HEVC标准等视频压缩标准来操作。然而,本发明的技术也可在多种其它视频译码标准的上下文中应用,包含一些旧的标准或者新的或新兴的标准。虽然图1中未图示,但在一些情况中,视频编码器22和视频解码器28可各自与音频编码器和解码器集成,且可包含适当的多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件和软件,以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用,MUX-DEMUX单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
[0042]视频编码器22和视频解码器28各自可实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其组合。视频编码器22和视频解码器28中的每一者可包含于一个或一个以上编码器或解码器中,其中任一者可集成为相应的移动装置、订户装置、广播装置、服务器或类似装置中的组合式编码器/解码器(CODEC)的一部分。在本发明中,术语译码器指代编码器、解码器或编解码器,且术语译码器、编码器、解码器和编解码器全部指代与本发明一致的经设计以用于视频数据的译码(编码和/或解码)的特定机器。
[0043]在一些情况下,装置12、16可以大体上对称方式操作。举例来说,装置12、16中的每一者可包含视频编码和解码组件。因此,系统10可支持视频装置12、16之间的单向或双向视频发射,例如用于视频流式传输、视频回放、视频广播或视频电话。
[0044]在编码过程期间,视频编码器22可执行若干译码技术或操作。大体上,视频编码器22与HEVC标准一致地对视频数据块进行操作。与HEVC —致,视频块称为译码单元(CU),且许多CU存在于个别视频帧(或其它独立界定的视频单元,例如切片)内。帧、切片、帧的部分、图片群组或其它数据结构可经界定为包含多个CU的视频信息单元。CU可具有与HEVC标准一致的不同大小,且位流可将最大译码单元(LCU)界定为CU的最大大小。双预测合并模式可用以对LCU、CU或可能其它类型的视频块进行编码。对于HEVC标准,可根据四叉树分割方案将LCU划分为越来越小的CU,且在方案中界定的不同CU可进一步分割为所谓的预测单元(PU)。IXU、⑶和PU全部是本发明的意义内的视频块。
[0045]视频编码器22可执行预测译码,其中将正经译码的视频块(例如,IXU内的⑶的PU)与一个或一个以上预测候选者进行比较以便识别预测块。预测译码的此过程可为帧内的(在此情况下预测数据是基于同一视频帧或切片内的相邻帧内数据产生的)或帧间的(在此情况下预测数据是基于先前或后续帧或切片中的视频数据产生的)。可支持许多不同译码模式,且视频编码器22可选择合意的视频译码模式。根据本发明,可使用本文描述的双预测合并模式对至少一些视频块进行译码。
[0046]在产生预测块之后,将正经译码的当前视频块与预测块之间的差译码为残余块,且使用预测语法(例如在帧间译码的情况下的运动向量,或在帧内译码的情况下的预测模式)来识别预测块。而且,对于本文描述的双预测合并模式,预测语法(例如,语法元素)可向视频解码器识别两个不同相邻视频块。因此,解码器可基于语法元素识别在单预测模式中译码的两个不同相邻视频块,且使用所述两个不同相邻视频块的运动信息来根据双预测合并模式对当前视频块进行解码。
[0047]可对残余块进行变换和量化。变换技术可包括DCT过程或概念上类似的过程、整数变换、小波变换或其它类型的变换。在DCT过程中,作为实例,变换过程将一组像素值(例如,残余像素值)转换为变换系数,其可表示所述像素值在频域中的能量。HEVC标准允许根据变换单元(TU)的变换,所述TU对于不同CU可为不同的。TU通常基于为经分割LCU界定的给定CU内的PU的大小来定大小,但情况可能并非总是这样。TU通常与PU大小相同或小于PU。
[0048]量化可应用于变换系数,且通常涉及限制与任何给定变换系数相关联的位的数目的过程。更具体来说,可根据在LCU等级处界定的量化参数(QP)来应用量化。因此,可将相同等级的量化应用于与LCU内的CU的不同相关联的TU中的所有变换系数。然而,并非用信号发送QP自身,可以用LCU用信号发送QP的改变(即,差量)以指示相对于先前LCU的QP的改变。
[0049]在变换和量化之后,可对经量化和变换的残余视频块执行熵译码。语法元素也可包含在经熵译码位流中。通常,熵译码包括共同地压缩经量化变换系数序列和/或其它语法信息的一个或一个以上过程。可对经量化变换系数执行扫描技术以便从二维视频块界定一个或一个以上串行化一维系数向量。随后例如经由内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码过程,连同任何语法信息一起对扫描的系数进行熵译码。
[0050]作为编码过程的一部分,可对经编码视频块进行解码以便产生用于后续视频块的基于后续预测的译码的视频数据。这经常称为编码过程的解码循环,且通常模仿由解码器装置执行的解码。在编码器或解码器的解码循环中,可使用滤波技术来改善视频质量,且例如平滑像素边界且可能从经解码视频移除假象。此滤波可为环路内或环路后的。对于环路内滤波,经重构视频数据的滤波在译码循环中发生,这意味着经滤波数据由编码器或解码器存储供后续图像数据的预测中的后续使用。相反,对于环路后滤波,经重构视频数据的滤波在译码循环外发生,这意味着数据的未经滤波版本由编码器或解码器存储供后续图像数据的预测中的后续使用。环路滤波常常在单独的解块滤波过程之后,其通常将滤波应用于在邻近视频块的边界上或附近的像素,以便移除在视频块边界处显现的成块假象。
[0051]相对于先前译码标准,新兴的HEVC标准为视频块引入新的术语和块大小。特定来说,HEVC涉及译码单元(CU),其可根据四叉树分割方案来分割。“LCU”指代在给定情形中支持的最大大小的译码单元(例如,“最大译码单元”)。LCU大小可自身作为位流的一部分,例如作为序列等级语法来用信号发送。LCU可经分割为较小的CU。CU可经分割为用于预测目的的预测单元(PU)。PU可具有正方形或矩形形状。变换在新兴的HEVC标准中不是固定的,而是根据变换单元(TU)大小来界定,TU大小可为与给定CU相同的大小或可能更小。用于给定CU的残余数据可在TU中传送。语法元素可在LCU等级、CU等级、PU等级和TU等级下界定。
[0052]为了说明根据HEVC标准的视频块,图2概念上展示深度为64乘64的LCU,其随后根据四叉树分割方案经分割为较小的CU。称为“分裂旗标”的元素可经包含作为CU等级语法以指示任何给定⑶是否自身经再分为又四个⑶。在图2中,CUtl可包括IXU,CT1到CU4可包括LCU的子CU。如本发明中描述的双预测合并模式语法元素可在CU等级(或可能IXU等级,如果IXU未经分裂为较小的⑶)下界定。在一些实例中,也可能针对⑶的PU支持双预测合并模式。
[0053]图3进一步说明⑶、PU与TU之间的一种可能关系,其可与新兴的HEVC标准或其它标准一致。然而,其它关系也是可能的,且图3仅展示为一个可能实例。在此情况下,IXU的任何给定CU自身可经分割为PU,例如图3中说明的那些PU。给定CU的PU类型可作为CU等级语法来用信号发送。如图3所示,对于给定CU可界定对称类型PU和不对称类型PU。而且,对于四个对称类型PU和不对称类型中的每一者可界定两个不同TU结构。因此,可使用一位语法元素(TU大小旗标)来用信号发送TU大小,其也可取决于PU类型(对称或不对称)。可针对LCU界定经译码块模式(CBP)以便指示任何给定CU是否包含非零变换系数(例如,是否存在任何TU)。
[0054]在其它实例中,可与图3所示不同地界定TU。举例来说,使用称为“残余四叉树”(RQT)的四叉树结构,对应于CU的残余样本可经再分为较小的单元。RQT的叶节点可称为变换单元(TU)。在一些情况下,可根据四叉树结构针对CU界定TU,但TU可能不一定取决于针对任何给定CU界定的PU。用于预测的I3U可与任何CU的TU分开地界定。用于CU、TU和PU的若干不同类型的分割方案是可能的。
[0055]图4是说明与本发明一致的视频编码器50的框图。视频编码器50可对应于装置20的视频编码器22,或不同装置的视频编码器。如图4所示,视频编码器50包含预测编码单元32、四叉树分割单元31、加法器48和51,以及存储器34。视频编码器50还包含变换单元38和量化单元40,以及逆量化单元42和逆变换单元44。视频编码器50还包含熵译码单元46以及滤波器单元47,滤波器单元47可包含解块滤波器和环路后和/或环路内滤波器。经编码视频数据和界定编码方式的语法信息可传送到熵编码单元46,其对位流执行熵编码。
[0056]如图4所示,预测编码单元32可在视频块的编码中支持多种不同译码模式35。模式35可包含从不同视频帧(或切片)界定预测数据的帧间译码模式。帧间译码模式可为双预测的,意味着使用预测数据的两个不同列表(例如,列表O和列表I)(且通常两个不同运动向量)来识别预测数据。帧间译码模式可替代地为单预测的,意味着使用预测数据的一个列表(例如,列表O)(且通常一个运动向量)来识别预测数据。可结合预测数据的产生执行内插、偏移或其它技术。也可支持所谓的SKIP模式和DIRECT模式,其继承与另一帧(或切片)的位于同一地点的块相关联的运动信息。SKIP模式块不包含任何残余信息,而DIRECT模式块包含残余信息。
[0057]另外,模式35可包含帧间译码模式,其基于与正经译码的视频帧(或切片)相同的视频帧(或切片)内的数据界定预测数据。帧内译码模式可包含基于同一帧内的特定方向上的数据界定预测数据的方向模式,以及基于相邻数据的平均值或经加权平均值界定预测数据的DC和/或平面模式。预测编码单元32可基于某个准则选择用于给定块的模式,例如基于速率-失真分析或块的某些特性,例如块大小、纹理或其它特性。
[0058]根据本发明,预测编码单元32支持双预测合并模式35X。对于双预测合并模式35X,正经译码的视频块从两个不同相邻块继承运动信息,其中所述两个不同相邻块各自在单预测模式中编码。因此,用来自两个不同相邻视频块的两个不同运动向量对视频块进行译码。在此情况下,预测编码单元32输出对于给定块使用了双预测合并模式的指示,且输出识别共同地界定当前双预测块的运动信息的两个不同单预测相邻者的语法元素。与双预测合并模式相关联的预测块可组合为一个双预测块(可能使用加权因数),且可将双预测块从正经译码的块减去(经由求和器48)以界定与在双预测合并模式中译码的块相关联的残余数据。
[0059]运动信息可包括与两个不同相邻视频块相关联的两个不同单预测运动向量。这两个不同单预测运动向量可用作当前视频块的两个双预测运动向量。运动信息可进一步包括与两个不同单预测运动向量相关联的两个参考索引值,其中参考索引值识别与两个不同单预测运动向量相关联的预测数据的一个或一个以上列表。再次,残余数据可产生为正经译码的块与由共同地界定在预测中使用的双预测合并块的两个不同单预测运动向量界定的预测数据之间的差。
[0060]在HEVC的情况下,正经译码的当前视频块可包括根据四叉树分割方案相对于IXU界定的所谓CU。在此情况下,四叉树分割单元31可产生界定四叉树分割方案的LCU语法数据,且预测编码单元32可产生界定双预测合并模式的用于CU的模式信息,其中所述一个或一个以上语法元素(识别两个单预测相邻者)包含在用于CU的模式信息中。
[0061]所描述的双预测合并模式可增加在合并模式译码的上下文中可使用的双预测候选者的数目。举例来说,如果没有相邻者在双预测模式中译码,那么所描述的双预测合并模式可允许通过在预测当前视频块时组合两个相邻者的运动信息来利用双预测。而且,即使一个或一个以上相邻者在双预测模式中译码,根据所描述的双预测合并模式组合两个单向相邻者也仍可在一些情形中提供译码增益。
[0062]通常,在编码过程期间,视频编码器50接收输入视频数据。预测编码单元32对视频块(例如,CU和PU)执行预测译码技术。四叉树分割单元31可根据上文参见图2和3阐释的HEVC分割将LCU分解为较小的CU和PU。对于帧间译码,预测编码单元32将CU或PU与一个或一个以上视频参考帧或切片(例如,参考数据的一个或一个以上“列表”)中的各种预测候选者进行比较以便界定预测块。对于帧内译码,预测编码单元32基于同一视频帧或切片内的相邻数据产生预测块。预测编码单元32输出预测块,且加法器48将预测块从正经译码的CU或PU减去以便产生残余块。再次,可使用本文描述的双预测合并模式对至少一些视频块进行译码。
[0063]图5更详细说明视频编码器50的预测编码单元32的一个实例。预测编码单元32可包含从模式35中选择所要模式的模式选择单元75,作为一可能性,模式35包含双预测合并模式35X。对于帧间译码,预测编码单元32可包括运动估计(ME)单元76和运动补偿(MC)单元77,其识别指向预测数据的一个或一个以上运动向量且基于运动向量产生预测块。通常,将运动估计视为产生估计运动的所述一个或一个以上运动向量的过程。举例来说,运动向量可指示预测帧内的预测块相对于当前帧内正经译码的当前块的位移。在双预测合并模式35X的情况下,将两个相邻者的两个单向运动向量组合以产生双向预测。
[0064]运动补偿通常被视为基于由运动估计确定的运动向量来获取或产生预测块的过程。在一些情况下,用于帧间译码的运动补偿可包含达到子像素分辨率的内插,其准许运动估计过程估计视频块的运动达到此子像素分辨率。也可使用两个块的经加权组合(在双预测的情况下)。
[0065]对于帧内译码,预测编码单元32可包括帧内预测单元78。在此情况下,可基于当前视频块(例如,邻近于正经译码的视频块)内的数据产生预测数据。再次,帧内译码模式可包含基于同一帧内的特定方向上的数据界定预测数据的方向模式,以及基于相邻数据的平均值或经加权平均值界定预测数据的DC和/或平面模式。
[0066]速率-失真(R-D)单元79可比较不同模式中的视频块(例如,CU或PU)的译码结果。另外,R-D单元79可允许其它类型的参数调整,例如对内插、偏移、量化参数或可影响译码速率的其它因素的调整。模式选择单元75可在译码速率(S卩,块所需的译码位)和失真(例如,表示经译码块相对于原始块的视频质量)方面分析译码结果,以便为视频块做出模式选择。以此方式,R-D单元79提供对不同模式的结果的分析以允许模式选择单元75为不同视频块选择所要模式。与本发明一致,当R-D单元79例如由于译码增益或译码效率而将双预测合并模式35X识别为对于给定视频块的所要模式时可选择双预测合并模式35X。
[0067]再次参见图4,在预测编码单元32输出预测块之后,且在加法器48将预测块从正经译码视频块减去以便产生残余像素值的残余块之后,变换单元38将变换应用于残余块。变换可包括离散余弦变换(DCT)或概念上类似的变换,例如ITU H.264标准或HEVC标准界定的变换。可界定所谓的“蝴蝶”结构以执行变换,或也可使用基于矩阵的乘法。在一些实例中,与HEVC标准一致,变换的大小可对于不同CU而不同,例如取决于相对于给定LCU发生的分割的等级。可界定变换单元(TU)以便设定由变换单元38应用的变换大小。也可使用小波变换、整数变换、子带变换或其它类型的变换。在任一情况下,变换单元均将变换应用于残余块,从而产生残余变换系数块。大体上,变换可将残余信息从像素域转换到频域。
[0068]量化单元40随后量化残余变换系数以进一步减小位速率。量化单元40例如可限制用以对系数中的每一者进行译码的位的数目。特定来说,量化单元40可应用为LCU界定的差量QP以便界定将应用的量化等级(例如通过将差量QP与先前LCU的QP或某个其它已知QP进行组合)。在对残余样本执行量化之后,熵译码单元46可扫描数据且对数据进行熵编码。
[0069]CAVLC是由ITU H.264标准和新兴的HEVC标准支持的一种类型的熵译码技术,其可由熵译码单元46基于向量化基础来应用。CAVLC以有效地压缩系数和/或语法元素的串行化“游程”的方式使用可变长度译码(VLC)表。CABAC是由ITU H.264标准或新兴的HEVC标准支持的另一种类型的熵译码技术,其可由熵译码单元46基于向量化基础来应用。CABAC可涉及若干阶段,包含二进制化、上下文模型选择以及二进制算术译码。在此情况下,熵译码单元46根据CABAC对系数和语法元素进行译码。许多其它类型的熵译码技术也存在,且新的熵译码技术将可能在未来出现。本发明不限于任何特定的熵译码技术。
[0070]在熵编码单元46的熵译码之后,经编码视频可发射到另一装置,或经归档以用于稍后发射或检索。经编码视频可包括经熵译码向量和各种语法信息(在双预测合并模式的情况下包含界定两个相邻者的语法信息)。此信息可由解码器使用以适当地配置解码过程。逆量化单元42和逆变换单元44分别应用逆量化和逆变换以重构像素域中的残余块。求和器51将经重构残余块加到由预测编码单元32产生的预测块以产生经重构视频块以存储在存储器34中。然而在此存储之前,滤波器单元47可将滤波应用于视频块以改善视频质量。由滤波器单元47应用的滤波可减少假象且平滑像素边界。而且,滤波可通过产生包括与正经译码视频块的紧密匹配的预测视频块而改善压缩。
[0071]根据本发明,支持从两个不同相邻块继承运动信息的双预测合并模式35X,其中所述两个不同相邻块各自在单预测模式中编码。所描述的双预测合并模式35X可增加在合并模式译码的上下文中可使用的双预测候选者的数目。因此,R-D单元79 (图5)可将双预测合并模式35X识别为最合意的译码模式,因为此模式相对于其它模式实现译码增益。在此些情况下,模式选择单元75可选择双预测合并模式35X来对一个视频块进行译码。
[0072]图6是说明对以本文描述的方式编码的视频序列进行解码的视频解码器60的实例的框图。在一些实例中可由视频解码器60执行本发明的技术。特定来说,视频解码器60接收用于当前视频块的一个或一个以上语法元素,其中当前视频块是根据双预测合并模式来编码,且基于一个或一个以上语法元素,识别在单预测模式中译码的两个不同相邻视频块。视频解码器60随后使用两个不同相邻视频块的运动信息来根据双预测合并模式对当前视频块进行解码。
[0073]在视频解码器60处接收的视频序列可包括经编码图像帧集合、帧切片集合、经共同译码的图片群组(GOP)或广泛多种视频信息单元,所述单元包含经编码LCU(或其它视频块)和用以界定如何对此些LCU进行解码的语法信息。对LCU进行解码的过程可包含对译码模式的指示进行解码,所述译码模式可为本文描述的双预测合并模式。
[0074]视频解码器60包含熵解码单元52,其执行由图2的熵编码单元46执行的编码的互逆解码功能。特定来说,熵解码单元52可执行CAVLC或CABAC解码或由视频编码器50使用的任一其它类型的熵解码。视频解码器60还包含预测解码单元54、逆量化单元56、逆变换单元58、存储器62以及求和器64。特定来说,类似于视频编码器50,视频解码器60包含预测解码单元54和滤波器单元57。视频解码器60的预测解码单元54可包含运动补偿单元86,其对经帧间译码块进行解码且可能包含用于运动补偿过程中的子像素内插的一个或一个以上内插滤波器。预测解码单元54也可包含用于对帧内模式进行解码的帧内预测单元。预测解码单元54可支持包含双预测合并模式55X的多个模式35。滤波器单元57可对求和器64的输出进行滤波,且可接收经熵解码的滤波器信息以便界定在环路滤波中应用的滤波器系数。
[0075]在接收到经编码视频数据后,熵解码单元52执行由(图4中的编码器50的)熵编码单元46执行的编码的互逆解码。在解码器处,熵解码单元52剖析位流以确定LCU和与IXU相关联的对应分割。在一些实例中,IXU或IXU的⑶可界定曾使用的译码模式,且这些译码模式可包含双预测合并模式。因此,熵解码单元52可将识别双预测合并模式的语法信息转发到预测单元。在此情况下,语法信息可包含识别在单预测模式中译码的两个不同相邻视频块的一个或一个以上语法元素。在此情况下,预测解码单元54的MC单元86可使用两个不同相邻视频块的运动信息来根据双预测合并模式对当前视频块进行解码。也就是说,MC单元86可获取通过两个不同相邻视频块的运动信息识别的预测数据,且在双预测合并模式中对当前视频块进行解码时使用此预测数据的某种组合。
[0076]图7是展示为了双预测合并模式的目的可考虑的五个不同相邻者的一个实例的概念说明。在此实例中,为了双预测合并模式的目的可考虑上方(T)相邻者、右上方(TR)相邻者、左方(L)相邻者、左下方(BL)相邻者,以及与另一视频帧位于同一地点的时间(Temp)相邻者。当然,其它相邻者(空间或时间)也可用于运动信息的任何合并模式继承。
[0077]再次,对于合并模式,当前视频块可继承相邻候选块的所有运动信息。这意味着当前块将具有与选定相邻块相同的运动向量、相同的参考帧以及相同的预测模式(单预测或双预测)。选定相邻块可作为经编码位流的一部分来用信号发送,但运动信息不需要用信号发送,因为解码器可从选定相邻块获得运动信息。
[0078]与本发明一致,支持双预测合并模式,其从两个不同相邻块继承运动信息,其中所述两个不同相邻块各自在单预测模式中编码。所描述的双预测合并模式可增加在合并模式的上下文中可使用的双预测候选者的数目。双预测合并模式可用信号发送两个不同相邻者而不是用信号发送一个相邻者。双预测合并模式可为通过仅增加候选相邻块以包含其组合而对常规合并模式的扩展,或可为相对于常规合并模式的完全单独的模式。
[0079]假定图1所示的空间和时间候选相邻块,所描述的双预测合并模式可在至少两种情形中工作。在第一情形中,在单预测模式中对所有相邻候选相邻块进行译码。在此情况下,可选择候选块中的任两者,且可组合来自两个选定候选者的运动信息以实现双预测。举例来说,假定根据以下信息对图1所示的相邻块进行译码:
[0080]L:单预测,L0, refIdx=O
[0081]T:单预测,LI, refIdx=O
[0082]TR:单预测,L0, refIdx=I
[0083]BL:单预测,L0, refIdx=O
[0084]Temp:单预测,LI, refIdx=I
[0085]在此情况下,存在五个候选者中的任两者的10种组合。LO指代预测数据的第一列表,且LI指代预测数据的第二列表。refldx可包括对相应列表中的特定图片的索引。视频编码器可选择最佳组合(例如,在编码速率和失真方面)且可发送识别两个选定相邻块的语法信息。解码器可对语法信息进行解码且从选定相邻块获得运动信息。
[0086]在第二情形中,可在双预测模式中对候选相邻块中的至少一者进行译码。在此情况下,可考虑(组合地)单预测相邻块中的任两者以获得双预测合并模式候选者。然而,也可单独使用任何双预测块以考虑作为双预测合并候选者。举例来说,假定根据以下信息对图1所示的相邻块进行译码:
[0087]L:双预测,L0, refIdx=O, LI, refIdx=O
[0088]T:单预测,LI, refIdx=O
[0089]TR:单预测,L0, refIdx=I
[0090]BL:单预测,L0, refIdx=O
[0091]Temp:双预测,L0, refIdx=O, LI, refIdx=I
[0092]再次,LO可包括涉及预测数据的第一列表的值,LI可包括涉及预测数据的第二列表的值,且refldx可为界定对相应列表中的特定图片的索引的值。在此第二实例中,五个候选者中的两者已经是双预测模式,因此可单独考虑这两者以用于双预测合并模式的目的。另外,可考虑三个剩余单预测候选者的不同组合。因此,在此情况下,将存在5种双预测模式可能性:
[0093]1.L
[0094]2.Temp
[0095]3.T+TR
[0096]4.T+BL
[0097]5.TR+BL
[0098]在此第二实例中,编码器可从这五种可能性中选择(例如,在编码速率和失真方面)最佳相邻者(或相邻者的组合),且可发送识别在合并模式中曾使用哪一个别相邻者或相邻者组合的语法信息。解码器可对语法信息进行解码且从选定相邻块获得运动信息。
[0099]在图7的实例中,展示五个候选者。然而,在与图7的候选者相同的区域中或在其它区域中也可考虑额外候选者。在一些情况下,可存在若干上方(T)候选者、若干左上方(TL)候选者、若干左方(L)候选者、若干左下方(BL)候选者,以及若干时间(T)候选者。在一些情况下,当前块的大小可不同于候选者的大小,在此情况下,当前块的上方边缘或左方边缘可邻近于若干候选者。在其它情况下,可考虑在距当前视频块甚至更远距离处的候选者以用于本发明中描述的双预测合并模式的目的。根据本发明,可以有使用许多不同候选者的许多不同情形。因此,图7仅是相对于当前视频块说明五个相邻候选者的一个实例。
[0100]图8是说明与本发明一致的解码技术的流程图。将从图6的视频解码器60的角度来描述图8,但其它装置可执行类似技术。如图8所示,视频解码器60接收包含用于LCU以及用于IXU内的⑶的语法元素的IXU(801)。特定来说,熵解码单元52可接收包含IXU的位流且剖析位流以识别语法元素,所述语法元素可转发到预测解码单元54。因此,预测解码单元54可基于语法元素而界定CU的模式。在其它实例中,可在等级而非CU等级下界定模式。
[0101]在确定模式时,预测解码单元54识别在双预测合并模式中译码的任何CU (803)。如果任何CU均不在双预测合并模式中译码(“否”803),那么根据其模式对所述CU进行解码(804)。举例来说,可支持许多不同帧内模式和许多不同帧间模式。如果任何CU在双预测合并模式中译码(“是”803),那么此⑶为双预测的。然而,其用于双预测的运动向量来自如本文论述的两个单预测相邻者。在此情况下,预测解码单元54的MC单元86基于CU语法元素识别CU的两个不同单预测相邻者(805),且使用单预测相邻者的运动信息来对双预测⑶进行解码。
[0102]图9是说明与本发明一致的编码技术的流程图。将从图4的视频编码器50的角度来描述图9,但其它装置可执行类似技术。如图9所示,预测编码单元32支持用于CU的双预测合并模式。举例来说,预测编码单元32 (见图5)可包含模式选择单元75,其基于多个可能模式35而选择用于⑶的双预测合并模式35X。R-D单元75可通过分析ME单元76和MC单元77针对各种帧间模式的译码的结果以及通过分析帧内预测单元78针对帧内模式的译码的结果,来识别与不同模式相关联的译码速率以及质量或失真的等级。以此方式,模式选择单元75可识别针对任何给定情形的最佳模式。
[0103]一旦预测编码单元32选择用于⑶的双预测合并模式35X,那么预测单元识别在单预测模式中译码的两个不同相邻块(902)。识别在单预测模式中译码的两个不同相邻块的此过程可由ME单元76以类似于上文描述的方式执行。举例来说,ME单元76和MC单元77可从不同单预测相邻者产生运动信息的不同组合的译码结果,且R-D单元75可分析这些结果以确定与此些不同组合相关联的译码速率以及质量或失真。最终,R-D单元75可确定单预测相邻者的哪一双预测合并模式组合产生最佳译码结果。
[0104]因此,预测编码单元32使用两个单预测相邻者的最佳组合的运动信息来将⑶编码为双预测的(903)。当然,也可考虑任何双预测相邻者,且在速率-失真结果比使用两个单预测相邻者更好的情况下可能用于合并模式译码。预测单元32 (例如,ME单元76或MC单元77)产生用于CU的一个或一个以上语法元素以识别用于CU的双预测合并模式译码的两个不同单预测相邻者。举例来说,语法元素可包括识别CU的相邻者中的两者的索引值,所述相邻者例如图7中概念上说明的左方(L)相邻者、左下方(BL)相邻者、(T)上方相邻者、右上方(TR)相邻者,或位于同一地点的时间(T)相邻者。然而,也可使用用于语法元素的许多其它信令方案。
[0105]本发明的技术可在广泛多种装置或设备中实现,包含无线手持机和集成电路(IC)或一组IC(S卩,芯片组)。已描述经提供以强调功能方面的任何组件、模块或单元,且不一定需要通过不同硬件单元来实现所述组件、模块或单元。
[0106]因此,本文描述的技术可以硬件、软件、固件或其任一组合来实施。描述为模块或组件的任何特征可一起实施于集成逻辑装置中,或作为离散但可互操作的逻辑装置来单独实施。如果以软件实施,则所述技术可至少部分地由包括指令的计算机可读媒体实现,所述指令在执行时执行上文描述的方法中的一者或一者以上。计算机可读数据存储媒体可形成可包含封装材料的计算机程序产品的一部分。
[0107]计算机可读媒体可包括有形计算机可读存储媒体,例如,例如同步动态随机存取存储器(SDRAM)的随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器、磁性或光学数据存储媒体,和类似物。所述技术另外或替代地可至少部分地由以指令或数据结构的形式载运或传送代码且可由计算机存取、读取和/或执行的计算机可读通信媒体实现。
[0108]可由例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一个或一个以上处理器来执行指令。如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文描述的功能性可提供于经配置以用于编码和解码的专用软件模块或硬件模块内,或并入在组合式视频编码器-解码器(CODEC)中。并且,可将所述技术完全实施于一个或一个以上电路或逻辑元件中。
[0109]已描述了本发明的各种方面。这些和其它方面属于所附权利要求书的范围内。
【权利要求】
1.一种对视频数据进行解码的方法,所述方法包括: 接收用于当前视频块的一个或一个以上语法元素,其中所述当前视频块是根据双预测合并模式编码的; 基于所述一个或一个以上语法元素,识别在单预测模式中译码的两个不同相邻视频块;以及 使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对当前视频块进行解码。
2.根据权利要求1所述的方法,其中所述运动信息包括与所述两个不同相邻视频块相关联的两个不同单预测运动向量。
3.根据权利要求2所述的方法,其中所述运动信息进一步包括与所述两个不同单预测运动向量相关联的至少两个值,其中所述值识别与所述两个不同单预测运动向量相关联的预测数据的一个或一个以上列表。
4.根据权 利要求1所述的方法,其中所述当前视频块包括根据高效视频译码HEVC标准界定的译码单元CU,其中所述CU是根据四叉树分割方案相对于最大译码单元LCU来界定,所述方法进一步包括: 接收界定所述四叉树分割方案的LCU语法数据;以及 接收界定所述双预测合并模式的用于所述CU的模式信息,其中所述一个或一个以上语法元素包含在用于所述CU的所述模式信息中。
5.根据权利要求1所述的方法,其中所述当前视频块包括根据高效视频译码HEVC标准界定的译码单元CU的预测单元W。
6.一种对视频数据进行编码的方法,所述方法包括: 选择用于对当前视频块进行编码的双预测合并模式; 识别在单预测模式中译码的两个不同相邻视频块; 使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对所述当前视频块进行编码;以及 产生一个或一个以上语法元素以向视频解码器识别所述两个不同相邻视频块。
7.根据权利要求6所述的方法,其中所述运动信息包括与所述两个不同相邻视频块相关联的两个不同单预测运动向量。
8.根据权利要求7所述的方法,其中所述运动信息进一步包括与所述两个不同单预测运动向量相关联的至少两个值,其中所述值识别与所述两个不同单预测运动向量相关联的预测数据的一个或一个以上列表。
9.根据权利要求6所述的方法,其中所述当前视频块包括根据高效视频译码HEVC标准界定的译码单元CU,所述方法进一步包括: 根据四叉树分割方案相对于最大译码单元LCU界定所述CU ; 产生界定所述四叉树分割方案的LCU语法数据;以及 产生界定所述双预测合并模式的用于所述CU的模式信息,其中所述一个或一个以上语法元素包含在用于所述CU的所述模式信息中。
10.根据权利要求6所述的方法,其中所述当前视频块包括根据高效视频译码HEVC标准界定的译码单元CU的预测单元W。
11.一种对视频数据进行解码的视频解码装置,所述视频解码装置包括: 视频解码器,其经配置以: 接收用于当前视频块的一个或一个以上语法元素,其中所述当前视频块是根据双预测合并模式编码的; 基于所述一个或一个以上语法元素,识别在单预测模式中译码的两个不同相邻视频块;以及 使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对当前视频块进行解码。
12.根据权利要求11所述的视频解码装置,其中所述视频解码器包含: 熵解码单元,其经配置以接收和解码所述一个或一个以上语法元素;以及 预测单元,其经配置以识别所述两个不同相邻视频块,且使用所述两个不同相邻视频块的所述运动信息来对所述当前视频块进行解码。
13.根据权利要求11所述的视频解码装置,其中所述运动信息包括与所述两个不同相邻视频块相关联的两个不同单预测运动向量。
14.根据权利要求13所述的视频解码装置,其中所述运动信息进一步包括与所述两个不同单预测运动向量相关联 的至少两个值,其中所述值识别与所述两个不同单预测运动向量相关联的预测数据的一个或一个以上列表。
15.根据权利要求11所述的视频解码装置,其中所述当前视频块包括根据高效视频译码HEVC标准界定的译码单元CU,其中所述CU是根据四叉树分割方案相对于最大译码单元LCU来界定,其中所述解码器: 接收界定所述四叉树分割方案的LCU语法数据;以及 接收界定所述双预测合并模式的用于所述CU的模式信息,其中所述一个或一个以上语法元素包含在用于所述CU的所述模式信息中。
16.根据权利要求11所述的视频解码装置,其中所述当前视频块包括根据高效视频译码HEVC标准界定的译码单元⑶的预测单元PU。
17.根据权利要求11所述的视频解码装置,其中所述视频解码装置包括以下各项中的一者或一者以上: 集成电路; 微处理器;以及 无线通信装置,其包含视频编码器。
18.—种视频编码装置,其包括: 视频编码器,其经配置以: 选择用于对当前视频块进行编码的双预测合并模式; 识别在单预测模式中译码的两个不同相邻视频块; 使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对所述当前视频块进行编码;以及 产生一个或一个以上语法元素以向视频解码器识别所述两个不同相邻视频块。
19.根据权利要求18所述的视频编码装置,其中所述运动信息包括与所述两个不同相邻视频块相关联的两个不同单预测运动向量。
20.根据权利要求19所述的视频编码装置,其中所述运动信息进一步包括与所述两个不同单预测运动向量相关联的至少两个值,其中所述值识别与所述两个不同单预测运动向量相关联的预测数据的一个或一个以上列表。
21.根据权利要求18所述的视频编码装置,其中所述当前视频块包括根据高效视频译码HEVC标准界定的译码单元CU,其中所述视频编码器包含: 四叉树分割单元,其经配置以根据四叉树分割方案相对于最大译码单元LCU界定所述CU,且产生界定所述四叉树分割方案的LCU语法数据;以及 预测单元,其经配置以产生界定所述双预测合并模式的用于所述CU的模式信息,其中所述一个或一个以上语法元素包含在用于所述CU的所述模式信息中。
22.根据权利要求18所述的视频编码装置,其中所述当前视频块包括根据高效视频译码HEVC标准界定的译码单元⑶的预测单元PU。
23.根据权利要求18所述的视频编码装置,其中所述视频编码装置包括以下各项中的一者或一者以上: 集成电路; 微处理器;以及 无线通信装置,其包含视频编码器。
24.一种用于对视频数据进行解码的装置,所述装置包括: 用于接收用于当前视频块的一个或一个以上语法元素的装置,其中所述当前视频块是根据双预测合并模式编码 的; 用于基于所述一个或一个以上语法元素识别在单预测模式中译码的两个不同相邻视频块的装置;以及 用于使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对当前视频块进行解码的装置。
25.一种用于对视频数据进行编码的装置,所述装置包括: 用于选择用于对当前视频块进行编码的双预测合并模式的装置; 用于识别在单预测模式中译码的两个不同相邻视频块的装置; 用于使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对所述当前视频块进行编码的装置;以及 用于产生一个或一个以上语法元素以向视频解码器识别所述两个不同相邻视频块的>j-U ρ?α装直。
26.—种包括指令的计算机可读媒体,所述指令在执行后即刻致使处理器对视频数据进行解码,其中所述指令致使所述处理器进行以下操作: 在接收到用于当前视频块的一个或一个以上语法元素后,其中所述当前视频块是根据双预测合并模式编码的, 基于所述一个或一个以上语法元素识别在单预测模式中译码的两个不同相邻视频块;以及 使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对当前视频块进行解码。
27.一种包括指令的计算机可读媒体,所述指令在执行后即刻致使处理器对视频数据进行编码,其中所述指令致使所述处理器进行以下操作: 选择用于对当前视频块进行编码的双预测合并模式; 识别在单预测模式中译码的两个不同相邻视频块; 使用所述两个不同相邻视频块的运动信息来根据所述双预测合并模式对所述当前视频块进行编码;以及 产生一个或一个以上语法元素以`向视频解码器识别所述两个不同相邻视频块。
【文档编号】H04N7/36GK103460695SQ201280013912
【公开日】2013年12月18日 申请日期:2012年2月29日 优先权日:2011年3月21日
【发明者】郑云非, 钱威俊, 马尔塔·卡切维奇 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1