具有方向性分区的帧内预测模式译码的制作方法

文档序号:7990322阅读:163来源:国知局
具有方向性分区的帧内预测模式译码的制作方法
【专利摘要】一种视频译码器可基于非正方形分区的方向,使用所述非正方形分区来确定视频数据块的最可能模式。在所述非正方形分区的所述方向为垂直时,可选择左相邻块的帧内预测模式作为所述最可能帧内预测模式,且在所述非正方形分区的所述方向为水平时,可选择上方相邻块的帧内预测模式作为所述最可能帧内预测模式。
【专利说明】具有方向性分区的帧内预测模式译码
[0001]本申请案主张2011年6月3日申请的第61/493,331号美国临时申请案、2011年11月I日申请的第61/554,334号美国临时申请案和2012年I月13日申请的第61/586,597号美国临时申请案的优先权,以上每一个美国临时申请案的全部内容以引用方式并入本文。
【技术领域】
[0002]本发明涉及视频译码。
【背景技术】
[0003]数字视频能力可并入到广泛多种装置中,包含数字电视机、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流式传输装置和类似装置。数字视频装置实施视频压缩技术,例如由 MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4 第 10 部分高级视频译码(AVC)界定的标准、当前在开发的高效视频译码(HEVC)标准以及此些标准的扩展中描述的那些技术。视频装置可通过实施此些视频压缩技术来较有效地发射、接收、编码、解码和/或存储数字视频信息。
[0004]视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(即,视频帧或视频帧的一部分)分割为若干视频块,所述视频块也可称为树块、译码单元(CU)和/或译码节点。图片的经帧内译码(I)切片中的视频块是使用相对于同一图片中的相邻块中的参考样本的空间预测来编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可称为巾贞,且参考图片可称为参考中贞。
[0005]空间或时间预测得到待译码块的预测块。残余数据表示待译码的原始块与预测块之间的像素差。经帧间译码块是根据指向形成预测块的参考样本的块的运动向量以及指示经译码块与预测块之间的差的残余数据来编码。经帧内译码块是根据帧内译码模式和残余数据来编码。为了进一步压缩,可将残余数据从像素域变换到变换域,从而得到残余变换系数,所述系数随后可经量化。可扫描初始以二维阵列布置的经量化变换系数以便产生变换系数的一维向量,且可应用熵译码以实现甚至更多的压缩。

【发明内容】

[0006]大体上,本发明描述用于用信号发送用于视频译码的帧内预测模式的技术。所述技术可例如在用信号发送用于具有方向性(即,非正方形)分区的视频数据块的帧内预测模式时使用。方向性分区可例如为不对称分区、在2NxN或Nx2N译码模式中使用的分区,或短距离帧内预测模式分区。如下文将更详细阐释,方向性分区可大体上视为水平或垂直的。[0007]在一个实例中,一种对视频数据进行编码的方法包含:使用非正方形分区分割视频数据块;至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式;以及至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行译码。
[0008]在另一实例中,一种用于对视频数据进行译码的设备包含经配置以进行以下操作的视频编码器:使用非正方形分区分割视频数据块;至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式;以及至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行译码。
[0009]在另一实例中,一种对视频数据进行解码的方法包含:接收视频数据块;确定所述视频数据块是使用非正方形分区分割;至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式;至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行解码;以及使用所述实际帧内预测模式计算所述非正方形分区的预测数据。
[0010]在另一实例中,一种用于对视频数据进行译码的设备包含经配置以进行以下操作的视频解码器:接收视频数据块;确定所述视频数据块是使用非正方形分区分割;至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式;至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行解码;以及使用所述实际帧内预测模式计算所述非正方形分区的预测数据。
[0011]在另一实例中,一种设备包含:用于使用非正方形分区分割视频数据块的装置;用于至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式的装置;以及用于至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行译码的装置。
[0012]在另一实例中,一种存储指令的计算机可读存储媒体,所述指令在执行后即刻致使一个或一个以上处理器:使用非正方形分区分割视频数据块;至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式;以及至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行译码。
[0013]在另一实例中,一种设备包含:用于接收视频数据块的装置;用于确定所述视频数据块是使用非正方形分区分割的装置;用于至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式的装置;用于至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行解码的装置;以及用于使用所述实际帧内预测模式计算所述非正方形分区的预测数据的装置。
[0014]在另一实例中,一种存储指令的计算机可读存储媒体,所述指令在执行后即刻致使一个或一个以上处理器:接收视频数据块;确定视频数据块是使用非正方形分区分割;至少部分地基于非正方形分区的方向确定块的最可能帧内预测模式;至少部分地基于所确定最可能帧内预测模式对表示块的实际帧内预测模式的数据进行解码;以及使用实际帧内预测模式计算非正方形分区的预测数据。
【专利附图】

【附图说明】
[0015]图1是说明可实施本发明中描述的译码技术的实例性视频编码和解码系统的框图。
[0016]图2A是说明包含经SDIP预测⑶的实例性最大译码单元(IXU)的概念图。
[0017]图2B和2C是说明各种大小的经SDIP预测⑶的实例的概念图。
[0018]图3是说明可实施本发明中描述的译码技术的实例性视频编码器的框图。
[0019]图4展示可与本发明的技术一起使用的帧内预测模式的实例。
[0020]图5展示正译码的当前块、相对于当前块的左相邻先前经译码块以及相对于当前块的上方相邻先前经译码块的实例。
[0021]图6是说明可实施本发明中描述的译码技术的实例性视频解码器的框图。
[0022]图7是说明用于使用本发明中描述的译码技术对视频数据进行编码的实例性方法的流程图。
[0023]图8是说明用于使用本发明中描述的译码技术对视频数据进行解码的另一实例性方法的流程图。
【具体实施方式】
[0024]大体上,本发明描述用于用信号发送用于视频译码的帧内预测模式的技术。所述技术可例如在用信号发送用于具有方向性(即,非正方形)分区的视频数据块的帧内预测模式时使用。方向性分区可例如为在不对称运动分割中使用的分区、在2NxN或Nx2N译码模式中使用的分区,或短距离帧内预测模式分区。大体上,术语非正方形可用以描述非正方形的矩形块,例如,宽度(以像素为单位)大于其高度或高度大于其宽度的块。
[0025]视频数据包含快速连续地播放的帧(或图片)的序列以模拟运动。帧中的每一者可划分为块。视频编码器通过利用块之间的空间和时间冗余来尝试压缩视频数据。举例来说,视频编码器可通过使用大体上称为帧内预测的技术,相对于相邻先前经译码块而预测块来利用空间冗余。同样,视频编码器可通过使用大体上称为帧间预测的技术,相对于先前经译码帧的数据而预测块来利用时间冗余。具体来说,视频编码器根据空间相邻者的数据或根据先前经译码帧的数据来预测当前块,随后将所述块的残余值计算为所述块的实际值与所述块的预测值之间的差。视频编码器使用预测单元(PU)来表示译码单元(CU)的预测数据,且使用变换单元(TU)来表示残余数据。块的残余数据包含像素(或空间)域中的逐像素差值。视频编码器可进一步变换残余数据,从而在变换域中表示数据。
[0026]常规上,帧内预测模式译码涉及正方形(即,2Nx2N)像素块的使用。也就是说,例如视频编码器或视频解码器等视频译码装置可根据相邻的先前经译码块的像素预测2Nx2N块的像素中的每一者。已针对高效视频译码(HEVC)引入了短距离帧内预测(SDIP)。SDIP可涉及将2Nx2N块分割为四个平行矩形分区,根据相邻的先前经译码块的像素预测第一分区,且随后根据先前经译码分区的像素中的至少一些来预测后续分区。
[0027]SDIP分区可为水平的或垂直的,且在一些情况下,SDIP分区可进一步分割。举例来说,16xl6CU可分割为四个4xl6SDIP PU,且所述四个4xl6SDIP I3U中的一者或一者以上可分割为lxl6PU。为了阐释目的将大体上参考SDIP分区来描述本发明的技术,但所述技术也可适用于其它类型的非正方形分区。举例来说,本发明的技术也可结合Nx2N帧内预测模式和2NxN帧内预测模式或者其中块的宽度与高度为不同长度(以像素为单位)的其它情境来使用。[0028]在块已经编码之后,视频解码器可接收块的经译码数据。经译码数据可包含用以对块进行编码的帧内预测模式的表示,以及块的PU的分割的指示。以此方式,视频解码器可使用PU的相同分割且应用相同的帧内预测模式来对块进行解码。为了减少在用信号发送帧内预测模式时消耗的位的量,视频译码装置可基于相邻块的译码模式来确定当前块的译码模式的可能性。
[0029]为了实例目的假定块A、B和C是经帧内预测帧或切片的块,且分别对应于左相邻块、上方相邻块和待译码的当前块。例如视频编码器或视频解码器等视频译码装置可基于块A和B的帧内预测模式来确定块C的最可能帧内预测模式。大体上,与使用另一模式来预测相比,块C较可能使用块A或块B的模式来预测。通常,当块A和B具有相同帧内预测模式时,块C的最可能帧内预测模式是块A和B的帧内预测模式。另一方面,当块A和B具有不同的帧内预测模式时,视频译码装置可确定块C的帧内预测模式是较可能为块A的帧内预测模式还是较可能为块B的帧内预测模式。
[0030]本发明提供用于在给定SDIP分割的引入下将块A的帧内预测模式或块B的帧内预测模式选择为块C的最可能帧内预测模式的技术。如上所述,CU(例如,块C)的分割可与用以预测块的PU的帧内预测模式分开来用信号发送。
[0031]根据本发明的技术,当块C是使用SDIP分割时,SDIP分区的方向可影响块A的帧内预测模式比块B的帧内预测模式更可能还是更不可能,作为块C的候选帧内预测模式。举例来说,当块C经分割为垂直SDIP PU时,块A(例如,左相邻块)的帧内预测模式可视为块C的最可能的帧内预测模式。作为另一实例,当块C经分割为水平SDIP PU时,块B(例如,上方相邻块)的帧内预测模式可视为块C的最可能的帧内预测模式。如上所述,在其它实例中,当块C包含宽度比其高度长(以像素为单位)的分区时,水平帧内预测模式可比垂直帧内预测模式更可能被考虑,而当块C包含高度比其宽度长的分区时,垂直帧内预测模式可比水平帧内预测模式更可能被考虑。
[0032]在针对块C已确定最可能的帧内预测模式之后,视频译码装置可对实际上用以预测块C的帧内预测模式的表示进行译码。所述表示的此译码可基于所确定的最可能模式。举例来说,译码装置可对表示块C的实际帧内预测模式是否为最可能帧内预测模式的一位旗标的值进行译码。如果最可能帧内预测模式与实际帧内预测模式相同,那么不需要对另外的数据进行译码。在一些实例中,视频译码装置可在对实际上用以预测块C的帧内预测模式的表示进行译码时利用一个以上最可能帧内预测模式。在利用多个最可能帧内预测模式的此配置中,SDIP分区的方向可例如用以确定最可能帧内预测模式中的哪一者具有作为实际帧内预测模式的最大可能性。
[0033]当实际帧内预测模式与最可能帧内预测模式不相同时,视频译码装置可对表示实际帧内预测模式的额外数据进行译码。为此,视频译码装置可使用候选模式列表(例如,码字表),其可包含呈近似最可能到最不可能的次序的潜在帧内预测模式的列表。视频译码装置可经配置有多种此类列表。每一列表可将码字(例如,唯一二进制值)映射到帧内预测模式索引。根据本发明的技术,视频译码装置可基于块是否是使用SDIP来预测的,且如果是,则基于SDIP PU的方向而选择列表中的一者。
[0034]此外,在一些实例中,取决于SDIP方向,某些帧内预测模式可经配置为不可供视频编码器或解码器使用。举例来说,对于垂直SDIP PU,水平帧内预测模式(例如,水平帧内预测模式和在方向上类似的模式)可为不可用的。同样,对于水平SDIP PU,垂直帧内预测模式可为不可用的。因此,根据本发明的技术,候选模式列表可基于SDIP 的方向而省略经确定为不可用的模式的条目。以此方式,候选模式列表可省略垂直于和/或大体上垂直于SDIP I3U的方向的模式的条目。在其它实例中,为将使用SDIP分区来预测的块选择的候选模式列表可不省略垂直和/或大体上垂直的帧内预测模式,而是可基于垂直和/或大体上垂直的帧内预测模式与其它帧内预测模式相比较不可能而为垂直和/或大体上垂直的帧内预测模式指派较长码字。
[0035]图1是说明可利用本发明中描述的技术的实例性视频编码和解码系统10的框图。如图1所示,系统10包含源装置12,所述源装置12产生经编码视频以由目的地装置14在稍后时间解码。源装置12和目的地装置14可包括广泛多种装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话等电话手持机、所谓的“智能”板、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似装置。在一些情况下,源装置12和目的地装置14可针对无线通信而装备。
[0036]目的地装置14可经由链路16接收待解码的经编码视频数据。链路16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任一类型的媒体或装置。在一个实例中,链路16可包括通信媒体以使得源装置12能够实时地将经编码视频数据直接发射到目的地装置14。经编码视频数据可根据例如无线通信协议等通信标准而调制,且发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或者一种或一种以上物理传输线。通信媒体可形成基于包的网络的部分,所述网络例如为局域网、广域网或例如因特网的全球网。通信媒体可包含路由器、交换机、基站或可用于促进从源装置12到目的地装置14的通信的任何其它设备。
[0037]或者,经编码数据可从输出接口 22输出到存储装置32。类似地,经编码数据可通过输入接口 28从存储装置32存取。存储装置32可包含多种分布式或本地存取的数据存储媒体中的任一者,例如硬驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或任何其它合适的用于存储经编码视频数据的数字存储媒体。在又一实例中,存储装置32可对应于文件服务器或另一中间存储装置,其可保持由源装置12产生的经编码视频。目的地装置14可经由流式传输或下载从存储装置32存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任一类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可通过任何标准数据连接(包含因特网连接)存取经编码视频数据。这可包含适于存取存储在文件服务器上的经编码视频数据的无线信道(例如,W1-Fi连接)、有线连接(例如,DSL、电缆调制解调器等等)或两者的组合。经编码视频数据从存储装置32的发射可为流式传输发射、下载发射或两者的组合。
[0038]本发明的技术不一定限于无线应用或设定。所述技术可应用于视频译码以支持多种多媒体应用中的任一种,例如空中电视广播、闭路电视发射、卫星电视发射、流式传输视频发射(例如,经由因特网)、为存储在数据存储媒体上对数字视频的编码、对存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。[0039]在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口 22。在一些情况下,输出接口 22可包含调制器/解调器(调制解调器)和/或发射器。在源装置12中,视频源18可包含例如以下各项的源:例如摄像机等视频俘获装置、含有先前俘获视频的视频档案、用以从视频内容提供者接收视频的视频馈送接口,和/或用于产生计算机图形作为源视频的计算机图形系统,或此些源的组合。作为一个实例,如果视频源18是摄像机,则源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而,本发明中描述的技术可大体上适用于视频译码,且可适用于无线和/或有线应用。
[0040]所俘获、预俘获或计算机产生的视频可由视频编码器12编码。经编码视频数据可经由源装置20的输出接口 22直接发射到目的地装置14。经编码视频数据也可(或者)存储到存储装置32上供目的地装置14或其它装置稍后存取,用于解码和/或重放。
[0041]目的地装置14包含输入接口 28、视频解码器30和显示装置32。在一些情况下,输入接口 28可包含接收器和/或调制解调器。目的地装置14的输入接口 28经由链路16接收经编码视频数据。经由链路16传送或在存储装置32上提供的经编码视频数据可包含由视频编码器20产生的多种语法元素,其供例如视频解码器30等视频解码器用于对视频数据进行解码。此些语法元素可与经编码视频数据一起在通信媒体上发射、存储在存储媒体上或存储在文件服务器上。
[0042]显示装置32可与目的地装置14集成或在目的地装置14的外部。在一些实例中,目的地装置14可包含集成显示装置,且还经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。大体上,显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器,或另一类型的显示装置。
[0043]视频编码器20和视频解码器30各自可实施为多种合适编码器电路中的任一者,例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任一组合。当所述技术部分地以软件实施时,装置可将用于所述软件的指令存储在合适的非暂时性计算机可读媒体中,且使用一个或一个以上处理器执行硬件中的指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含于一个或一个以上编码器或解码器中,其中任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。
[0044]视频编码器20和视频解码器30可根据例如即将出现的高效视频译码(HEVC)标准等视频压缩标准来操作。然而本发明的技术不限于任何特定译码标准。其它实例包含ITU-TH.264标准,或者称为MPEG-4第10部分高级视频译码(AVC),MPEG_2和ITU-T H.263。虽然图1中未图示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当的多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件和软件,以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用,MUX-DEMUX单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
[0045]ITU-T H.264/MPEG-4 (AVC)标准是由 ITU-T 视频译码专家组(VCEG)连同 IS0/IEC动画专家组(MPEG) —起制订作为称为联合视频小组(JVT)的合作伙伴关系的产品。在一些方面中,本发明中描述的技术可应用于大体上符合H.264标准的装置。H.264标准由ITU-T研究组在ITU-T建议H.264用于一般视听服务的高级视频译码中描述且日期为2005年3月,其在本文可称为H.264标准或H.264规范或者H.264/AVC标准或规范。联合视频小组(JVT)持续致力于对H.264/MPEG-4AVC的扩展。类似于JVT,VCEG和MPEG已建立关于视频译码的联合合作小组(JCT-VC)以开发HEVC。
[0046]HEVC测试模型(麗)描述了可将视频帧或图片划分为包含亮度和色度样本两者的树块或最大译码单元(LCU)的序列。树块具有与H.264标准的宏块类似的目的。切片包含若干在译码次序上连续的树块。视频帧或图片可经分割为一个或一个以上切片。每一树块可根据四叉树而分裂为若干译码单元(CU)。举例来说,作为四叉树的根节点的树块可分裂为四个子节点,且每一子节点又可为母节点且分裂为另外四个子节点。作为四叉树的叶节点,最终未经分裂的子节点包括译码节点,即经译码视频块。与经译码位流相关联的语法数据可界定树块可经分裂的最大次数,且也可界定译码节点的最小大小。
[0047]CU包含译码节点以及与译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小且形状必须为正方形。CU的大小的范围可为从8x8像素直到具有最大64x64像素或更大的树块的大小。每一⑶可含有一个或一个以上PU和一个或一个以上TU。与CU相关联的语法数据可描述例如CU分割为一个或一个以上TO。分割模式在⑶经跳过或直接模式编码、经帧内预测模式编码还是经帧间预测模式编码之间可不同。PU可经分割为非正方形的形状。与CU相关联的语法数据还可描述例如CU根据四叉树而分割为一个或一个以上TU。TU可为正方形或非正方形的形状。
[0048]HEVC标准允许根据TU的变换,所述TU对于不同⑶可为不同的。TU通常基于为经分割IXU界定的给定⑶内的I3U的大小来定大小,但情况可能并非总是这样。TU通常与PU大小相同或小于PU。在一些实例中,使用称为“残余四叉树”(RQT)的四叉树结构,对应于CU的残余样本可经再分为较小的单元。RQT的叶节点可称为变换单元(TU)。与TU相关联的像素差值可经变换以产生可经量化的变换系数。
[0049]大体上,PU包含与预测过程相关的数据。举例来说,当经帧内模式编码时,PU可包含描述PU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含界定PU的运动向量的数据。界定PU的运动向量的数据可描述例如运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片,和/或运动向量的参考图片列表(例如,列表O、列表I或列表C)。
[0050]大体上,TU用于变换和量化过程。具有一个或一个以上I3U的给定⑶还可包含一个或一个以上变换单元(TU)。在预测之后,视频编码器20可计算对应于PU的残余值。残余值包括像素差值,所述像素差值可使用TU而变换为变换系数、经量化且经扫描以产生用于熵译码的经串行化变换系数。本发明通常使用术语“视频块”来指代CU的译码节点。在一些特定情况下,本发明也可使用术语“视频块”来指代树块,即IXU或⑶,其包含译码节点以及PU和TU。
[0051]视频序列通常包含一系列视频帧或图片。图片群组(GOP)通常包括一系列一个或一个以上视频图片。GOP可在GOP的标头、一个或一个以上图片的标头或其它地方包含描述所述GOP中包含的图片数目的语法数据。图片的每一切片可包含描述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作以便对视频数据进行编码。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据指定译码标准而大小不同。
[0052]作为一实例,HM支持各种I3U大小下的预测。假定特定⑶的大小为2Nx2N,则HM支持2Nx2N或NxN的PU大小的帧内预测以及2Nx2N、2NxN、Nx2N或NxN的对称I3U大小的帧间预测。HM还支持2NxnU、2NxnD、nLx2N和nRx2N的PU大小的帧间预测的不对称分割。在不对称分割中,⑶的一个方向未分割,而另一方向分割为25%和75%。⑶的对应于25%分区的部分由“η”指示,随后是“上”、“下”、“左”或“右”的指示。因此,举例来说,“2NxnU”指代经水平分割的2Nx2N⑶,其中顶部为2Nx0.5NPU且底部为2Nxl.5N PU。本发明的技术也可适用于基于分区的帧内预测,例如上文针对帧间预测描述的不对称分区。
[0053]HM可以短距离帧内预测(SDIP)预测模式来配置。在SDIP中,视频译码装置可将块(例如,叶节点CU)分割为若干平行预测单元(PU)。举例来说,HM可将16X16CU分割为使用SDIP来预测的四个4x16或四个16x4PU。对于SDIP,视频译码装置根据当前⑶的先前经译码块的相邻像素的值预测中的第一者。在对CU的对应于第一的区进行译码之后,视频译码装置根据当前⑶的先前经译码PU的相邻像素预测当前⑶的PU中的下一者。因此,并非使用专门来自先前经译码CU的像素作为用于帧内预测的参考像素,在SDIP中,同一 CU内的像素可用作用于CU的其它像素的参考像素。当然,取决于帧内预测方向,先前经译码CU的像素也可用于计算当前CU的当前PU的预测值以及当前CU的先前经译码PU的像素的参考。像素值在即将出现的HEVC标准中也称为“样本”,其称为亮度或“亮度”样本以及色度或“色度”样本。
[0054]例如基于当前⑶的大小可提供各种SDIP I3U分割方案。大体上,NxN⑶的SDIPPU可具有(N/4)xN或Nx(N/4)的大小,其中N为大于或等于4的整数。其它大小和分割方案也可为可用的,例如用于NxN CU的Nxl或ΙχΝ。以下表1提供可用于基于当前CU的大小构造SDIP PU的若干实例性分割方案。HEVC的SDIP PU可每⑶具有各种矩形大小。
[0055]表1
[0056]`
CU大小可用的SDIP PU大小
32x328x32,32x8
16x164x16, 16x4,1x16,16x1
8x82x8,8x2
[0057]图2A是说明包含经SDIP预测⑶的实例性IXU100的概念图。具体来说,在此实例中,LCU100 包含子 CU102、104、106、108、110、112 和 114。子 CU102、104、106、108、110、112和114中的每一者对应于叶节点⑶。在此实例中,非叶节点⑶也将包含子⑶104、106、108和110。叶节点子CU中的每一者可根据特定预测模式来预测。在此实例中,子CU108是使用SDIP预测的。因此,子CU108包含四个PU120A-120D(PU120)。如此实例中所示,PU120为子⑶108的水平TO。
[0058]图2B和2C是展示替代SDIP PU分区大小的实例的概念图,例如上文在表1中列出的分区大小。图2B展示各种大小的垂直SDIP分区的实例,且图2C展示各种大小的水平SDIP分区的实例。[0059]在本发明中,“NxN”和“N乘N”可以互换地使用以在垂直和水平尺寸方面指代视频块的像素尺寸,例如16x16像素或16乘16像素。大体上,16x16块将在垂直方向上具有16个像素(y=16)且在水平方向上具有16个像素(x=16)。同样,NxN块通常在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可以若干行和列布置。而且,块无需一定在水平方向上具有与垂直方向上相同数目的像素。举例来说,块可包括NxM个像素,其中M不一定等于N。
[0060]在使用CU的PU的帧内预测或帧间预测译码之后,视频编码器20可计算CU的TU的残余数据。PU可包括空间域(也称为像素域)中的像素数据,且TU可包括例如在对残余视频数据应用例如离散余弦变换(DCT)、整数变换、小波变换等变换或概念上类似的变换后的变换域中的系数。残余数据可对应于未经编码图片的像素之间的像素差和对应于PU的预测值。视频编码器20可形成包含⑶的残余数据的TU,且随后变换TU以产生⑶的变换系数。
[0061]在任何变换以产生变换系数后,视频编码器20可执行变换系数的量化。量化大体上指代其中变换系数经量化以可能地减少用以表示所述系数的数据量从而提供进一步压缩的过程。量化过程可产生与系数中的一些或全部相关联的位深度。举例来说,在量化期间可将η位值下舍入到m位值,其中η大于m。
[0062]在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化变换系数以产生可经熵编码的经串行化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法对所述一维向量进行熵编码。视频编码器20还可对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30用于对视频数据进行解码。
[0063]为了执行CABAC,视频编码器20可将上下文模型内的上下文指派于待发射的符号。所述上下文可例如涉及符号的相邻值是否为非零。为了执行CAVLC,视频编码器20可针对待发射符号选择可变长度译码。VLC中的码字可经构造以使得相对较短的码对应于较可能的符号,而较长的码对应于较不可能的符号。以此方式,VLC的使用可例如针对待发射的每一符号使用相等长度码字来实现位节省。概率确定可基于对符号指派的上下文。
[0064]图3是说明可实施本发明中描述的SDIP译码技术的实例性视频编码器20的框图。视频编码器20可执行视频切片内的视频块的帧内和帧间译码。帧内译码依赖于空间预测来减少或移除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测来减少或移除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指代若干基于空间的压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指代若干基于时间的压缩模式中的任一者。
[0065]在图3的实例中,视频编码器20包含分割单元35、预测模块41、参考图片存储器64、求和器50、变换模块52、量化单元54以及熵编码单元56。预测模块41包含运动估计单元42、运动补偿单元44和帧内预测模块46。对于视频块重构,视频编码器20还包含逆量化单元58、逆变换模块60和求和器62。还可包含例如解块滤波器、自适应环路滤波器和/或样本自适应偏移(SAO)滤波器(图3中未图示)等一个或一个以上环路滤波器(环路内或环路后)以对经重构视频块进行滤波。如果需要,则这些一个或一个以上环路滤波器将通常对求和器62的输出进行滤波。也可使用额外的环路滤波器(环路内或环路后)。
[0066]如图3所示,视频编码器20接收视频数据,且分割单元35将数据分割为视频块。此分割也可包含分割为切片、瓦片或其它较大单元,以及视频块分割,例如根据LCU和CU的四叉树结构。视频编码器20通常说明对待编码视频切片内的视频块进行编码的组件。切片可经划分为多个视频块(且可能划分为若干组视频块,称为瓦片)。预测模块41可基于误差结果(例如,译码速率和失真水平)为当前视频块选择多个可能译码模式中的一者,例如多个帧内译码模式中的一者或多个帧间译码模式中的一者。作为选择译码模式的部分,预测模块41可尝试各种分割策略且选择得到合意误差结果的分割策略。这些分割策略可包含使用正方形和非正方形分区两者。预测模块41可将所得经帧内或帧间译码块提供到求和器50以产生残余块数据且提供到求和器62以重构经编码块以用作参考图片。
[0067]预测模块41内的帧内预测模块46可相对于与待译码当前块相同的帧或切片中的一个或一个以上相邻块执行当前视频块的帧内预测译码以提供空间压缩。预测模块41内的运动估计单元42和运动补偿单元44相对于一个或一个以上参考图片中的一个或一个以上预测块执行当前视频块的帧间预测译码以提供时间压缩。
[0068]如果为当前视频块选择帧间预测而非帧内预测,那么运动估计单元42可经配置以根据视频序列的预定模式来确定视频切片的帧间预测模式。预定模式可将序列中的视频切片指定为P切片、B切片或GPB切片。运动估计单元42和运动补偿单元44可高度集成,但为了概念目的而分开来说明。由运动估计单元42执行的运动估计是产生估计视频块的运动的运动向量的过程。举例来说,运动向量可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测块的位移。
[0069]预测块为被发现在像素差方面紧密匹配于待译码视频块的的块,所述像素差可通过绝对差和(SAD)、平方差和(SSD)或其它差量度来确定。在一些实例中,视频编码器20可计算存储在参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置和分数像素位置的运动搜索,且输出具有分数像素精度的运动向量。
[0070]运动估计单元42通过将PU的位置与参考图片的预测块的位置进行比较来计算经帧间译码切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表O)或第二参考图片列表(列表I),其中每一者识别存储在参考图片存储器64中的一个或一个以上参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56和运动补偿单元44。
[0071]由运动补偿单元44执行的运动补偿可涉及基于由运动估计确定的运动向量来获取或产生预测块,可能执行达到子像素精度的内插。在接收到当前视频块的PU的运动向量后,运动补偿单兀44可即刻在参考图片列表中的一者中定位运动向量指向的预测块。视频编码器20通过从正译码的当前视频块的像素值减去预测块的像素值而形成像素差值,来形成残余视频块。像素差值形成块的残余数据,且可包含亮度和色度差分量两者。求和器50表示执行此减法运算的组件。运动补偿单元44还可产生与视频块和视频切片相关联的语法元素,供视频解码器30用于对视频切片的视频块进行解码。[0072]帧内预测模块46可对当前块进行帧内预测,作为对如上所述由运动估计单元42和运动补偿单元44执行的帧间预测的替代。具体来说,帧内预测模块46可确定将用以对当前块进行编码的帧内预测模式。在一些实例中,帧内预测模块46可例如在单独的编码遍次期间使用各种帧内预测模块对当前块进行编码,且帧内预测模块46(或在一些实例中,模式选择单元40)可从测试模式中选择将使用的适当帧内预测模式。举例来说,帧内预测模块46可使用用于各种经测试帧内预测模式的速率-失真分析来计算速率-失真值,且在经测试模式中选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析通常确定经编码块与曾经编码以产生经编码块的原始未经编码块之间的失真(或误差)的量,以及用以产生经编码块的位速率(即,位数目)。帧内预测模块46可根据各种经编码块的失真和速率来计算比率,以确定哪一帧内预测模式展现块的最佳速率-失真值。
[0073]图4展示可与HEVC —起使用的帧内预测模式和对应模式索引的实例。图4的箭头大体上表示预测方向,且数字表示模式索引。模式索引用作对应帧内预测模式的识别符。如下文将更详细阐释,候选模式列表可将码字映射到模式索引,使得视频编码器20可产生码字作为用于用信号发送选定帧内预测模式的模式索引的方式。视频编码器20可维持或产生具有码字到模式索引的不同映射的多个候选模式列表。基于译码上下文,视频编码器20可选择特定候选模式列表,使得在特定上下文中最可能的帧内预测模式映射到较短码字,而较不可能的帧内预测模式映射到较长码字。对于使用SDIP分区来译码的CU,候选模式列表的选择可基于SDIP分区的方向。举例来说,如果CU具有垂直SDIP分区,则视频编码器20可选择其中垂直或大体上垂直于SDIP分区的帧内预测模式映射到较长码字(指示所述帧内预测模式通常比其它帧内预测模式较不可能)的候选模式列表。
[0074]根据本发明的技术,当视频编码器20正使用SDIP模式对CU进行译码时,视频编码器20可从包含比以上表2中所示帧内预测模式数目少的帧内预测模式的候选模式列表中选择实际预测模式。具体来说,视频编码器20可从省略了大体上垂直于SDIP分区方向的帧内预测模式的条目的候选模式列表中选择实际预测模式。举例来说,参见图4,对于使用水平SDIP分区预测的CU,视频编码器20可从省略了垂直预测模式I的条目或大体上垂直预测模式12、22、23和13的条目的候选模式列表中选择实际帧内预测模式。类似地,对于使用垂直SDIP分区预测的CU,视频编码器20可从省略了水平预测模式2的条目或大体上水平帧内预测模式16、30、31和17的条目的候选模式列表中选择实际帧内预测模式。在各种实施方案中,可从候选模式列表中省略较多或较少大体上垂直预测模式。
[0075]在选择块的帧内预测模式之后,帧内预测模块46可将指示块的选定帧内预测模式的信息提供到熵编码单元56。熵编码单元56可根据本发明的技术对指示选定帧内预测模式的信息进行编码。
[0076]熵编码单元56可基于块的一个或一个以上最可能帧内预测模式来用信号发送块的选定(即,实际)帧内预测模式。如下文将更详细阐释,所述一个或一个以上最可能帧内预测模式的确定可基于块的SDIP分区的方向。在使用一个最可能帧内预测模式的实例中,熵编码单元56可产生第一语法元素,例如I位旗标,以指示块的实际帧内预测模式是否与块的最可能帧内预测相同。如果块的实际帧内预测模式与块的最可能帧内预测模式相同,那么熵编码单元56不需要产生任何额外语法来识别块的实际帧内预测模式。如果实际帧内预测模式不是最可能帧内预测模式,则熵编码单元56可产生额外语法以识别实际帧内预测模式。额外语法可例如为用以识别块的实际帧内预测模式的码字。码字可映射到候选模式列表上的实际帧内预测模式。
[0077]在其中熵编码单元56基于两个最可能帧内预测模式用信号发送选定帧内预测模式的实例中,熵编码单元56可产生第一位以指示实际帧内预测模式是否为所述两个最可能帧内预测模式中的一者。如果实际帧内预测模式是所述两个最可能帧内预测模式中的一者,则熵编码单元56可产生第二位,其指示所述两个最可能帧内预测模式中的哪一者是实际帧内预测模式。如果选定帧内预测模式不是所述两个最可能帧内预测模式中的一者,则熵编码单元56可产生额外语法以识别实际帧内预测模式。额外语法可例如为用以识别块的实际帧内预测模式的码字。码字可映射到候选模式列表上的帧内预测模式。
[0078]在另一实例中,熵编码单元56可使用三个最可能模式来用信号发送选定帧内预测模式。在此实例中,熵编码单元56可产生第一位以指示实际帧内预测模式是否为三个最可能帧内预测模式中的一者。如果实际帧内预测模式是所述三个最可能帧内预测模式中的一者,则熵编码单元56可产生额外位,其指示所述三个最可能帧内预测模式中的哪一者是实际帧内预测模式。熵编码单元56可使用具有可变长度的码字来用信号发送所述三个最可能模式中的哪一者是实际帧内预测模式。举例来说,一位码字(例如,O)可指示实际帧内预测模式为第一最可能模式,而两位码字(例如,10和11)可指示实际帧内预测模式为第二或第三最可能模式中的一者。如下文将更详细阐释,本发明的技术可用以确定可用一位码字用信号发送的第一最可能模式是否对应于上方相邻块或左相邻块的帧内预测模式。通过将较可能模式指派于第一最可能模式而非第二或第三最可能模式,由于第一最可能模式是使用一位码字而非两位码字来用信号发送,因此可实现位节省。在此上下文中,“较可能”指代候选模式被选择为实际帧内预测模式的可能性。
[0079]当使用三个最可能模式时,如果选定帧内预测模式不是所述三个最可能帧内预测模式中的一者,则熵编码单元56可产生额外语法以识别实际帧内预测模式。额外语法可例如为用以识别块的实际帧内预测模式的码字。码字可映射到候选模式列表上的帧内预测模式。候选模式列表可例如排除所述三个最可能模式,因为第一位已经指示实际帧内预测模式不是所述三个最可能模式中的一者。
[0080]如上文介绍,一个或一个以上最可能帧内预测模式的选择可基于用以对已经译码的相邻块进行译码的帧内预测模式。图5展示三个视频块的实例,包含块51,块51表示当前正译码的块。块51具有其上方的已经译码块(上方相邻者块55)和其左边的已经译码块(左相邻者块53)。假定视频编码器20正在实施光栅扫描次序,即从左到右且从顶部到底部对块进行译码,则块55和53是在块51经译码之前译码。因此,与块55和53相关的信息可用以对块51进行译码。
[0081]根据本发明的技术,当块51是使用SDIP分割时,SDIP分区的方向可影响块55的帧内预测模式比块53的帧内预测模式更可能还是更不可能,作为块55的候选帧内预测模式。举例来说,当块51经分割为垂直SDIP PU时,块53的帧内预测模式可视为块51的最可能的帧内预测模式。作为另一实例,当块51经分割为水平SDIP PU时,块55的帧内预测模式可视为块51的最可能的帧内预测模式。在其它实例中,这可颠倒,其中当块51经分割为水平SDIP分区时块55的帧内预测模式为块51的最可能帧内预测模式,且当块51经分割为垂直SDIP分区时块53的帧内预测模式为块51的最可能帧内预测模式。[0082]在其中熵编码单元56如上所述使用三个最可能模式的实例中,块51的SDIP分区的方向可用以确定块53和55中的哪一者用以确定第一最可能模式。在其中块53和55是使用相同帧内预测模式来译码的实例中,则第一最可能模式可对应于块53和55的帧内预测模式,而第二和第三最可能模式是基于某个其它准则来选择。其它准则可例如涉及选择具有接近于块53和55的帧内预测模式的角度的预测角度的帧内预测模式,可涉及总是选择同一模式(例如,总是DC或总是平面),或可涉及某个其它准则。
[0083]在其中块53和55是使用不同帧内预测模式来译码的实例中,熵编码单元56可选择所述不同帧内预测模式中的每一者以用作最可能模式。根据本发明的技术,熵编码单元56选择所述两个模式中的哪一者作为第一最可能帧内预测模式可基于块51的SDIP分区的方向。举例来说,如果块51经分割为垂直SDIP PU,则熵编码单元56可选择块53的帧内预测模式作为第一最可能模式,选择块55的帧内预测模式作为第二最可能模式,且可使用某个其它准则选择第三最可能模式。如果块51经分割为水平SDIP PU,则熵编码单元56可选择块55的帧内预测模式作为第一最可能模式,选择块53的帧内预测模式作为第二最可能模式,且可使用某个其它准则选择第三最可能模式。由于根据此实例,第一最可能模式是使用一位码字来用信号发送且第二最可能模式是使用两位码字来用信号发送,因此通过将较可能发生的帧内预测模式指派于第一最可能模式可实现位节省。
[0084]虽然至此已关于水平和垂直分区且不参考特定大小而大体描述了本发明的技术,但应了解,所述技术可应用于SDIP分区的所有大小,例如以上在表I中包含的实例性大小。另外,在一些实施方案中,本发明的技术也可仅针对特定大小的SDIP分区而非所有SDIP分区来实施。作为一个实例,对于具有1x16或16xlSDIP分区的⑶,可根据上文描述的技术确定最可能帧内预测模式和候选模式列表,而对于其它大小的SDIP分区,使用其它技术确定中贞内预测模式和候选模式列表。
[0085]在预测模块41产生当前视频块的预测块之后,视频编码器20通过从当前视频块减去预测块而形成残余视频块。残余块中的残余视频数据可包含在一个或一个以上TU中且应用于变换模块52。变换模块52使用例如离散余弦变换(DCT)或概念上类似的变换等变换将残余视频数据变换为残余变换系数。变换模块52可将残余视频数据从像素域转换到变换域,例如频域。
[0086]变换模块52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减小位速率。量化过程可产生与系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可随后执行对包含经量化变换系数的矩阵的扫描。或者,熵编码单元56可执行扫描。
[0087]在量化后,熵编码单元56对经量化变换系数进行熵编码。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法或技术。在熵编码单元56的熵编码之后,经编码位流可发射到视频解码器30,或经归档以用于视频解码器30的稍后发射或检索。熵编码单元56还可对正译码的当前视频切片的运动向量和其它语法元素进行熵编码。作为执行CABAC的部分,熵编码单元56可使用选定候选模式列表(例如,码字表)作为二进制化表,意味着候选模式列表可用以确定选定帧内预测模式的二进制表示。熵译码单元56可随后对选定帧内预测模式的二进制表示执行算术译码。
[0088]逆量化单元58和逆变换模块60分别应用逆量化和逆变换以重构像素域中的残余块,用于稍后用作参考图片的参考块。运动补偿单元44可通过将残余块加到参考图片列表中的一者内的参考图片中的一者的预测块来计算参考块。运动补偿单元44还可将一个或一个以上内插滤波器应用于经重构残余块以计算子整数像素值以用于运动估计。求和器62将经重构残余块加到由运动补偿单元44产生的经运动补偿预测块以产生参考块以存储在参考图片存储器64中。参考块可由运动估计单元42和运动补偿单元44用作参考块以对后续视频帧或图片中的块进行帧间预测。
[0089]以此方式,图3的视频编码器20表示经配置以进行以下操作的视频编码器的实例:使用非正方形分区分割视频数据块;至少部分地基于非正方形分区的方向确定块的最可能帧内预测模式;至少部分地基于所确定最可能帧内预测模式对表示块的实际帧内预测模式的数据进行译码;以及使用实际帧内预测模式计算非正方形分区的预测数据。当确定最可能帧内预测模式时,视频编码器20也可经配置以在非正方形分区的方向为垂直时选择左相邻块的帧内预测模式作为最可能帧内预测模式,且在非正方形分区的方向为水平时选择上方相邻块的帧内预测模式作为最可能帧内预测模式。当左相邻块的帧内预测模式不同于上方相邻块的帧内预测模式时且当非正方形分区的方向为垂直时,视频编码器20可选择左相邻块的帧内预测模式作为最可能帧内预测模式。当左相邻块的帧内预测模式不同于上方相邻块的帧内预测模式时且当非正方形分区的方向为水平时,视频编码器20可选择上方相邻块的帧内预测模式作为最可能帧内预测模式。
[0090]当对表示实际帧内预测模式的数据进行译码时,视频编码器20可经配置以确定旗标的值。旗标的值可指示实际帧内预测模式是否与最可能帧内预测模式相同。当对表示实际预测模式的数据进行译码时包括,视频编码器20可经配置以基于非正方形分区的方向选择候选模式列表,且使用选定候选模式列表对表示实际预测模式的数据进行译码。在一些实例中,选定候选模式列表可省略大体上垂直于非正方形分区的方向的巾贞内预测模式的条目。举例来说,如果非正方形分区的方向为垂直,则选定候选列表可不包含水平帧内预测模式,或如果非正方形分区的方向为水平,则选定候选列表可不包含垂直帧内预测模式。
[0091]图6是说明可实施本发明中描述的技术的实例性视频解码器30的框图。在图6的实例中,视频解码器30包含熵解码单元80、预测模块81、逆量化单元86、逆变换单元88、求和器90以及参考图片存储器92。预测模块81包含运动补偿单元82和帧内预测模块84。在一些实例中,视频解码器30可执行与关于图3的视频编码器20描述的编码遍次大体上互逆的解码遍次。
[0092]在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块的经编码视频位流和相关联语法元素。视频解码器30的熵解码单元80对位流进行熵解码以产生经量化系数、运动向量和其它语法元素。熵解码单元80可例如对经CABAC译码数据进行解码。熵解码单元80将经解码语法元素转发到预测模块81。视频解码器30可在视频切片级和/或视频块级接收语法元素。
[0093]当视频帧经译码为经帧间译码(即,B、P或GPB)切片时,预测模块81的运动补偿单元82基于从熵解码单元80接收的运动向量和其它语法元素来产生当前视频切片的视频块的预测块。预测块可从参考图片列表中的一者内的参考图片中的一者产生。视频解码器30可基于存储在参考图片存储器92中的参考图片,使用默认构造技术来构造参考帧列表,列表O和列表I。
[0094]运动补偿单元82通过剖析运动向量和其它语法元素来确定当前视频切片的视频块的预测信息,且使用预测信息来产生正解码的当前视频块的预测块。举例来说,运动补偿单元82使用所接收语法元素中的一些来确定用以对视频切片的视频块进行译码的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的一个或一个以上参考图片列表的构造信息、切片的每一经帧间编码视频块的运动向量、切片的每一经帧间译码视频块的帧间预测状态,以及用以对当前视频切片中的视频块进行解码的其它信息。
[0095]运动补偿单元82还可基于内插滤波器执行内插。运动补偿单元82可使用由视频编码器20在视频块编码期间使用的内插滤波器来计算参考块的子整数像素的经内插值。在此情况下,运动补偿单元82可根据所接收语法元素来确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测块。
[0096]当视频切片经译码为经帧内译码⑴切片时,预测模块81的帧内预测模块84可基于用信号发送的帧内预测模式和来自当前帧或图片的先前经解码块的数据来产生当前视频切片的视频块的预测数据。如先前参见图5阐释,假定视频解码器30正根据光栅扫描次序对视频块进行解码,则块55和块53是在块51之前解码。因此,与块55和/或块53相关联的信息可用作对块51进行解码的部分。
[0097]帧内预测模块84可以与上文针对视频编码器20描述的相同方式来识别正解码的块的最可能帧内预测模式,意味着帧内预测模块84可例如基于已经解码左相邻块和已经解码上方相邻块来识别一个或一个以上最可能帧内预测模式。所述一个或一个以上最可能帧内预测模式的确定也可例如至少部分地基于正解码的块的SDIP分区的方向。再次返回参见图5作为实例,如果块51经分割为垂直SDIP PU,则帧内预测模块84可将块53的帧内预测模式识别为块51的最可能帧内预测模式。作为另一实例,如果块51经分割为水平SDIP PU,则帧内预测模块84可将块55的帧内预测模式识别为块51的最可能帧内预测模式。
[0098]在其中帧内预测模块84识别三个最可能模式的实例中,帧内预测模块84可使用块51的SDIP分区的方向来确定块53和55中的哪一者用以确定第一最可能模式。在其中块53和55是使用相同帧内预测模式来译码的实例中,则帧内预测模块84可选择第一最可能模式作为块53和55的帧内预测模式,且基于某个其它准则来选择第二和第三最可能模式。其它准则可例如涉及选择具有接近于块53和55的帧内模式的角度的预测角度的帧内预测模式,可涉及总是选择同一模式(例如,总是DC或总是平面),或可涉及某个其它准则。
[0099]在其中块53和55是使用不同帧内预测模式来译码的实例中,帧内预测模块84可选择所述不同帧内预测模式中的每一者作为最可能模式。根据本发明的技术,模块84选择所述两个帧内预测中的哪一者作为第一最可能帧内预测模式可基于块51的SDIP分区的方向。举例来说,如果块51经分割为垂直SDIP PU,则帧内预测模块84可选择块53的帧内预测模式作为第一最可能模式,选择块55的帧内预测模式作为第二最可能模式,且使用某个其它准则来选择第三最可能模式。如果块51经分割为水平SDIP PU,则帧内预测模块84可选择块55的帧内预测模式作为第一最可能模式,选择块53的帧内预测模式作为第二最可能模式,且使用某个其它准则来选择第三最可能模式。大体上,视频解码器30可实施与视频编码器20所实施技术相同的技术用于确定最可能帧内预测模式,以便最小化必须在经编码位流中用信号发送的语法的量。
[0100]如果使用一个最可能模式,则帧内预测模块84可剖析第一位或位系列以确定正解码的块的实际帧内预测模式是否为最可能帧内预测模式。如果实际模式不是最可能帧内预测模式,则帧内预测模块84可基于额外语法而确定实际帧内预测模式,所述额外语法例如为使用候选模式列表映射到模式索引的所接收码字。
[0101]如果使用一个以上最可能模式,则帧内预测模块84可剖析第一位或位系列以确定实际帧内预测模式是否为最可能模式中的一者。如果实际帧内预测模式是最可能模式中的一者,则帧内预测模块84可剖析额外位以确定最可能模式中的哪一者对应于实际模式。如果实际帧内预测模式不是最可能模式中的一者,则帧内预测模块84可接收额外语法,所述额外语法例如为使用候选模式列表映射到模式索引的码字。
[0102]视频解码器30可产生或维持由视频编码器20产生或维持的相同候选模式列表。视频解码器30还可以与视频编码器20相同的方式从一个或一个以上候选列表中选择候选模式列表。举例来说,视频解码器30可基于译码上下文来选择候选模式列表。作为此上下文的一个实例,对于使用SDIP分区来译码的CU,候选模式列表的选择可基于SDIP分区的方向。举例来说,如果⑶具有垂直SDIP分区,则视频解码器30可选择其中垂直或大体上垂直于SDIP分区的帧内预测模式映射到较长码字(指示所述帧内预测模式通常比其它帧内预测模式较不可能)的候选模式列表。
[0103]另外,当视频解码器30正使用SDIP模式对⑶进行解码时,视频解码器20可使用包含比以上表2中所示帧内预测模式数目少的帧内预测模式的候选模式列表选择实际预测模式。具体来说,视频解码器20可使用省略了大体上垂直于SDIP分区方向的帧内预测模式的条目的候选模式列表选择实际预测模式。举例来说,参见图4,对于使用水平SDIP分区预测的CU,视频解码器30可使用省略了垂直预测模式I的条目或大体上垂直预测模式12、22、23和13的条目的候选模式列表选择实际帧内预测模式。类似地,对于使用垂直SDIP分区预测的CU,视频解码器30可从省略了水平预测模式2的条目或大体上水平帧内预测模式16、30、31和17的条目的候选模式列表中选择实际帧内预测模式。在各种实施方案中,可从候选模式列表中省略较多或较少大体上垂直预测模式。
[0104]逆量化单元86逆量化(即,解量化)在位流中提供且由熵解码单元80解码的经量化变换系数。逆量化过程可包含使用由视频编码器20针对视频切片中的每一视频块计算的量化参数来确定量化程度,且同样确定应当应用的逆量化程度。逆变换模块88对变换系数应用逆变换,例如逆DCT、逆整数变换或概念上类似的逆变换过程,以便产生像素域中的残余块。
[0105]在预测模块81基于帧内预测或运动补偿产生当前视频块的预测块之后,视频解码器30通过将来自逆变换模块88的残余块与由预测模块81产生的对应预测块进行求和来形成经解码视频块。求和器90表示执行此求和运算的组件。如果需要,则还可应用解块滤波器以对经解码块进行滤波以便移除成块假象。也可使用其它环路滤波器(在译码环路中或在译码环路之后)来平滑像素转变,或另外改善视频质量。随后将给定帧或图片中的经解码视频块存储在参考图片存储器92中,所述参考图片存储器存储用于后续运动补偿的参考图片。参考图片存储器92还存储经解码视频用于稍后在例如图1的显示装置32等显示装置上呈现。
[0106]以此方式,图4的视频解码器30表示经配置以进行以下操作的视频解码器的实例:接收视频数据块;确定视频数据块是使用非正方形分区分割;至少部分地基于非正方形分区的方向确定块的最可能帧内预测模式;至少部分地基于所确定最可能帧内预测模式对表示块的实际帧内预测模式的数据进行解码;以及使用实际帧内预测模式计算非正方形分区的预测数据。作为确定最可能帧内预测模式的部分,视频解码器30可经配置以在非正方形分区的方向为垂直时选择左相邻块的帧内预测模式作为最可能帧内预测模式,且在非正方形分区的方向为水平时选择上方相邻块的帧内预测模式作为最可能帧内预测模式。当左相邻块的帧内预测模式不同于上方相邻块的帧内预测模式时且当非正方形分区的方向为垂直时,视频解码器30可选择左相邻块的帧内预测模式作为最可能帧内预测模式。当左相邻块的帧内预测模式不同于上方相邻块的帧内预测模式时且当非正方形分区的方向为水平时,视频解码器30可选择上方相邻块的帧内预测模式作为最可能帧内预测模式。
[0107]作为对表示实际帧内预测模式的数据进行解码的部分,视频解码器30可经配置以确定旗标的值。旗标的值可指示实际帧内预测模式是否与最可能帧内预测模式相同。作为对表示实际预测模式的数据进行解码的部分,视频解码器30可经配置以基于非正方形分区的方向选择候选模式列表,且使用选定候选模式列表对表示实际预测模式的数据进行译码。在一些实例中,选定候选模式列表可省略大体上垂直于非正方形分区的方向的巾贞内预测模式的条目。举例来说,如果非正方形分区的方向为垂直,则选定候选列表可不包含水平帧内预测模式,或如果非正方形分区的方向为水平,则选定候选列表可不包含垂直帧内预测模式。
[0108]在一些实例中,亮度巾贞内预测模式(intra_pred_mode)语法的产生和剖析可包含两种情况,其取决于相邻块(例如,图5中的块55和53)的“intra_pred_mode”的值。如下文将更详细阐释,所述两个情况可涉及使用一个最可能模式或两个最可能模式。视频解码器30表示经配置以剖析此语法的视频解码器的实例,且视频编码器20表示经配置以产生此语法的视频编码器的实例。在此实例中,候选模式列表的值(candModeList)和候选模式数目(NumMPMC)可从相邻块的 intra_pred_mode (candlntraPredModeA 和CandIntraPredModeB)导出,如下:
[0109]-如果两个CandIntraPredModeN ( BP , candlntraPredModeA 和CandIntraPredModeB两者)不可用,则可将值(例如,对应于DC模式的值2或值I)指派于candModeList [O],且将NumMPMC设定为等于1,意味着使用一个最可能模式。
[0110]-否则,如果仅一个CandIntraPredModeN可用或如果两个 CandIntraPredModeN相同,则将此CandIntraPredModeN指派于candModeList [O],且将NumMPMC设定为等于1,意味着使用一个最可能模式。
[0111]-否则,将两个CandIntraPredModeN指派于候选模式列表,其中两者中的较小者处于candModeList [O]且较大者处于candModeList [I],且将NumMPMC设定为等于2,意味着使用两个最可能模式。
[0112]-1ntraPredMode [xB] [yB](即,通过坐标xB和yB识别的块的巾贞内预测模式)可通过应用以下程序来导出。[0113]-如果prev—intra—pred—flag [xB] [yB]为真,则将 IntraPredMode [xB] [yB]设定为等于 candModeList [mpm—idx[xB] [yB]],其中 prev—intra—pred—flag [xB] [yB]对应于指示实际预测模式是否为最可能模式的旗标。
[0114]-否则通过应用以下程序来导出IntraPredMode[xB][yB]
[0115]-1ntraPredMode[xB][yB]=rem—intra—luma—pred—mode,其中 rem—intra—luma—pred—mode对应于包含实际巾贞内预测模式的索引(cldx)的额外语法。
[0116]-for (cldx=0 ;cldx < NumMPMCand ;cldx++)
[0117]如果(IntraPredMode[xB][yB] > =CandModeList [cldx])
[0118]IntraPredMode [xB] [yB] ++
[0119]根据本发明的技术,视频解码器30可基于正译码的CU的分区方向来选择优选候选模式以用作最可能巾贞内预测模式。举例来说,当candlntraPredModeA和CandIntraPredModeB不同时,不同于规则块,基于不同分区方向对candlntraPredModeA或CandIntraPredModeB可存在一些较高优先级。举例来说,如果分区方向是hNx2N或ΙχΝ,则当前块的巾贞内预测模式可更可能为candlntraPredModeA而非candlntraPredModeB。如果分区方向是2NxhN或Nxl,则当前块的巾贞内预测模式可更可能为candlntraPredModeB而非candlntraPredModeA。
[0120]因此,视频解码器30可经配置以基于以下准则确定最可能帧内预测模式。
[0121]-如果两个CandIntraPredModeN不可用,则将值(例如,2、1或任一其它模式索引)指派于candModeList [O]且将NumMPMC设定为等于I
[0122]-否则,如果仅一个CandIntraPredModeN可用或如果两个 CandIntraPredModeN相同,则将此 CandIntraPredModeN 指派于 candModeList [O],且将 NumMPMC 设定为等于 I
[0123]-否则,如果SdipFlag等于值假,意味着当前块不是使用SDIP分区译码的,则将两个CandIntraPredModeN指派于候选模式列表,其中两者中的较小者处于candModeList [O]且较大者处于candModeList [I],且将NumMPMC设定为等于2。
[0124]-否则,如果SdipFlag等于值真,意味着当前块是使用SDIP分区译码的,且分区方向为 hNx2N 或 ΙχΝ,则将 candlntraPredModeA 指派于 candModeList [O]且将candlntraPredModeB 指派于 candModeList [I],且将 NumMPMC 设定为等于 2。
[0125]-否则|,将candlntraPredModeB 指派于 candModeList [O]且将candlntraPredModeA 指派于 candModeList [I],且将 NumMPMC 设定为等于 2。
[0126]另外,视频解码器30可基于分区方向来选择候选模式列表(rem—intra—luma—pred—mode)。以此方式,语法元素“rem—intra—luma—pred—mode”可具有对分区方向的某种相依性,且在分区方向不同时可单独地译码。举例来说,视频解码器30可使用不同组的上下文用于作为hNx2N/lxN或2NxhN或Nxl的分区方向,其中h表示一半(即,hN等于N的一半)。举例来说,视频解码器30可使用不同的查找表用于作为hNx2N/lxN或2NxhN或Nxl的分区方向,以产生用于二进制化过程的码字。
[0127]视频解码器30还可如上所述基于块的分区方向来选择帧内预测模式的子集。举例来说,当分区形状为hNx2N/lxN时,垂直预测模式可比水平预测模式更普遍。则通过包含顶部N个最可能帧内预测模式可形成帧内预测模式的子集。随着分区的帧内预测模式数目的减小,表示每一模式所需的总开销可减少。还可通过在模式决策期间去除一些预测模式来减少编码器复杂性。
[0128]图7是说明根据本发明的技术对视频数据进行编码的实例性方法的流程图。为了实例目的,关于图1和3的视频编码器20描述图7的方法,但其它类型的视频编码器也可实施所述方法。
[0129]视频编码器20可使用非正方形分区分割视频数据块(171)。视频编码器20可例如使用对应于上文相对于图2A和2B论述的SDIP分区的形状和大小的一个或一个以上非正方形分区分割视频块。
[0130]视频编码器20可至少部分地基于非正方形分区的方向确定块的最可能帧内预测模式(172)。确定最可能帧内预测模式可例如包含在非正方形分区的方向为垂直时选择左相邻块的帧内预测模式作为最可能帧内预测模式,且在非正方形分区的方向为水平时选择上方相邻块的帧内预测模式作为最可能帧内预测模式。确定最可能帧内预测模式还可例如包含在左相邻块的帧内预测模式不同于上方相邻块的帧内预测模式时且在非正方形分区的方向为垂直时将左相邻块的帧内预测模式选择为最可能帧内预测模式,和/或在左相邻块的帧内预测模式不同于上方相邻块的帧内预测模式时且在非正方形分区的方向为水平时将上方相邻块的帧内预测模式选择为最可能帧内预测模式。
[0131]视频编码器20可至少部分地基于所确定最可能帧内预测模式对表示块的实际帧内预测模式的数据进行译码(173)。对表示实际帧内预测模式的数据进行译码可例如包含确定指示实际帧内预测模式是否与最可能帧内预测模式相同的旗标的值。对表示实际帧内预测模式的数据进行译码还可例如包含基于非正方形分区的方向选择候选模式列表,且使用选定候选模式列表对表示实际预测模式的数据进行译码。选定候选模式列表可省略大体上垂直于非正方形分区的方向的帧内预测模式的条目。举例来说,如果SDIP分区的方向为垂直,则选定候选列表可省略水平帧内预测模式,且如果非正方形分区的方向为水平,则选定候选列表可省略垂直帧内预测模式。选定候选模式列表可例如为可用以二进制化实际帧内预测模式的指示的码字表,且经二进制化指示可经CABAC译码。
[0132]视频编码器20可使用实际帧内预测模式计算非正方形分区的预测数据(174)。如上文阐释,预测数据可用以计算残余数据,其经变换、量化和熵译码。
[0133]图8是说明根据本发明的技术对视频数据进行解码的实例性方法的流程图。为了实例目的,关于图1和6的视频解码器30描述图8的方法,但其它类型的视频解码器也可实施所述方法。
[0134]视频解码器30可接收视频数据块(181)且确定视频数据块是使用非正方形分区分割(182)。视频解码器30可至少部分地基于非正方形分区的方向确定块的最可能帧内预测模式(183)。
[0135]为了确定最可能帧内预测模式,视频编码器30可例如在非正方形分区的方向为垂直时选择左相邻块的帧内预测模式作为最可能帧内预测模式,且在非正方形分区的方向为水平时选择上方相邻块的帧内预测模式作为最可能帧内预测模式。为了确定最可能帧内预测模式,视频编码器30还可在左相邻块的帧内预测模式不同于上方相邻块的帧内预测模式时且在非正方形分区的方向为垂直时将左相邻块的帧内预测模式选择为最可能帧内预测模式,和/或在左相邻块的帧内预测模式不同于上方相邻块的帧内预测模式时且在非正方形分区的方向为水平时将上方相邻块的帧内预测模式选择为最可能帧内预测模式。[0136]视频解码器30可至少部分地基于所确定最可能帧内预测模式对表示块的实际帧内预测模式的数据进行解码(184)。为了对表示实际帧内预测模式的数据进行解码,视频解码器30可确定指示实际帧内预测模式是否与最可能帧内预测模式相同的旗标的值。视频解码器30还可基于非正方形分区的方向选择候选模式列表,且使用选定候选模式列表对表示实际预测模式的数据进行译码。选定候选模式列表可省略大体上垂直于非正方形分区的方向的帧内预测模式的条目。举例来说,如果非正方形分区的方向为垂直,则选定候选列表可不包含水平帧内预测模式,且如果非正方形分区的方向为水平,则选定候选列表可不包含垂直帧内预测模式。
[0137]视频编码器30可使用实际帧内预测模式计算非正方形分区的预测数据(185)。
[0138]在一个或一个以上实例中,所描述的功能可以硬件、软件、固件或其任一组合来实施。如果以软件实施,那么功能可作为一个或一个以上指令或代码存储在计算机可读媒体上或经由计算机可读媒体传输,且由基于硬件的处理单元执行。计算机可读媒体可包含对应于例如数据存储媒体等有形媒体的计算机可读存储媒体,或包含促进计算机程序例如根据通信协议从一处传送到另一处的任何媒体的通信媒体。以此方式,计算机可读媒体通常可对应于(I)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一个或一个以上计算机或者一个或一个以上处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
[0139]举例来说且并非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来以指令或数据结构的形式存储所要程序代码且可由计算机存取的任何其它媒体。而且,恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源传输指令,则同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电及微波等无线技术包含于媒体的定义中。然而应了解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它瞬时媒体,而是针对非瞬时有形存储媒体。如本文中所使用,磁盘及光盘包含压缩光盘(⑶)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘及蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘使用激光以光学方式再生数据。上文的组合也应包含在计算机可读媒体的范围内。
[0140]可由例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一个或一个以上处理器来执行指令。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文描述的功能性可提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入在组合式编解码器中。并且,可将所述技术完全实施于一个或一个以上电路或逻辑元件中。
[0141]本发明的技术可在广泛多种装置或设备中实施,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但不一定需要通过不同硬件单元来实现。而是,如上所述,各种单元可在编解码器硬件单元中组合或由互操作硬件单元(包含如上所述的一个或一个以上处理器)的集合结合合适软件和/或固件来提供。
[0142]已描述了各种实例。这些和其它实例属于所附权利要求书的范围内。
【权利要求】
1.一种对视频数据进行编码的方法,所述方法包括: 使用非正方形分区分割视频数据块; 至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式;以及至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行译码。
2.根据权利要求1所述的方法,其中确定所述最可能帧内预测模式包括: 当所述非正方形分区的所述方向为垂直时,选择左相邻块的帧内预测模式作为所述最可能帧内预测模式;以及 当所述非正方形分区的所述方向为水平时,选择上方相邻块的帧内预测模式作为所述最可能帧内预测模式。
3.根据权利要求1所述的方法,其中确定所述最可能帧内预测模式包括: 当左相邻块的所述帧内预测模式不同于上方相邻块的所述帧内预测模式时且当所述非正方形分区的所述方向为垂直时,选择所述左相邻块的所述帧内预测模式作为所述最可能帧内预测模式。
4.根据权利要求1 所述的方法,其中确定所述最可能帧内预测模式包括: 当左相邻块的所述帧内预测模式不同于上方相邻块的所述帧内预测模式时且当所述非正方形分区的所述方向为水平时,选择所述上方相邻块的所述帧内预测模式作为所述最可能帧内预测模式。
5.根据权利要求1所述的方法,其中对表示所述实际帧内预测模式的所述数据进行译码包括确定旗标的值,其中所述旗标的所述值指示所述实际帧内预测模式是否与所述最可能帧内预测模式相同。
6.根据权利要求1所述的方法,其中对表示所述实际预测模式的所述数据进行译码包括: 基于所述非正方形分区的所述方向选择码字表;以及 使用所述选定码字表对表示所述实际预测模式的所述数据进行译码。
7.根据权利要求6所述的方法,其中所述选定码字表省略大体上垂直于所述非正方形分区的所述方向的帧内预测模式的条目。
8.根据权利要求6所述的方法,其中所述非正方形分区的所述方向为垂直,且所述选定码字表省略水平帧内预测模式。
9.根据权利要求6所述的方法,其中所述非正方形分区的所述方向为水平,且所述选定码字表省略垂直帧内预测模式。
10.根据权利要求1所述的方法,其中使用非正方形分区分割所述视频数据块包括使用短距离帧内预测SDIP模式分区分割所述块。
11.根据权利要求1所述的方法,其中所述非正方形分区包括2NxN或Nx2N分区中的一者。
12.根据权利要求1所述的方法,其中所述非正方形分区包括不对称分区。
13.根据权利要求1所述的方法,其进一步包括: 使用所述实际帧内预测模式计算所述非正方形分区的预测数据。
14.根据权利要求1所述的方法,其中至少部分地基于所述所确定最可能帧内预测模式对表示所述块的所述实际帧内预测模式的数据进行译码包括将所述实际帧内预测模式的指示二进制化且将上下文自适应二进制算术译码CABAC应用于所述经二进制化指示。
15.一种用于对视频数据进行译码的设备,所述设备包括经配置以进行以下操作的视频编码器:使用非正方形分区分割视频数据块;至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式;以及至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行译码。
16.根据权利要求15所述的设备,其中所述视频编码器进一步经配置以通过以下方式确定所述最可能帧内预测模式: 当所述非正方形分区的所述方向为垂直时,选择左相邻块的帧内预测模式作为所述最可能帧内预测模式;以及 当所述非正方形分区的所述方向为水平时,选择上方相邻块的帧内预测模式作为所述最可能帧内预测模式。
17.根据权利要求15所述的设备,其中所述视频编码器进一步经配置以通过以下方式确定所述最可能帧内预测模式: 当左相邻块的所述帧内预测模式不同于上方相邻块的所述帧内预测模式时且当所述非正方形分区的所述方向为垂直时,选择所述左相邻块的所述帧内预测模式作为所述最可能帧内预测模式。
18.根据权利要求15所述的设备,其中所述视频编码器进一步经配置以通过以下方式确定所述最可能帧内预测模式: 当左相邻块的所述帧内预测`模式不同于上方相邻块的所述帧内预测模式时且当所述非正方形分区的所述方向为水平时,选择所述上方相邻块的所述帧内预测模式作为所述最可能帧内预测模式。
19.根据权利要求15所述的设备,其中所述视频编码器进一步经配置以通过确定旗标的值对表示所述实际帧内预测模式的所述数据进行译码,其中所述旗标的所述值指示所述实际帧内预测模式是否与所述最可能帧内预测模式相同。
20.根据权利要求15所述的设备,其中所述视频编码器进一步经配置以通过以下方式对表示所述实际预测模式的所述数据进行译码: 基于所述非正方形分区的所述方向选择码字表;以及 使用所述选定码字表对表示所述实际预测模式的所述数据进行译码。
21.根据权利要求20所述的设备,其中所述选定码字表省略垂直于所述非正方形分区的所述方向的帧内预测模式的条目。
22.根据权利要求20所述的设备,其中所述非正方形分区的所述方向为垂直,且所述选定码字表省略水平帧内预测模式。
23.根据权利要求20所述的设备,其中所述非正方形分区的所述方向为水平,且所述选定码字表省略垂直帧内预测模式。
24.根据权利要求15所述的设备,其中视频译码器经配置以使用短距离帧内预测SDIP模式分区分割所述视频数据块。
25.根据权利要求15所述的设备,其中所述非正方形分区包括2NxN或Nx2N分区中的一者O
26.根据权利要求15所述的设备,其中所述非正方形分区包括不对称分区。
27.根据权利要求15所述的设备,其中所述视频编码器进一步经配置以使用所述实际帧内预测模式计算所述非正方形分区的预测数据。
28.根据权利要求15所述的设备,其中所述视频编码器进一步经配置以将所述实际帧内预测的指示二进制化且将上下文自适应二进制算术译码CABAC应用于所述经二进制化指示。
29.根据权利要求15所述的设备,其中所述设备包括以下各项中的至少一者: 集成电路; 微处理器;以及 无线通信装置,其包含所述视频译码器。
30.一种对视频数据进行解码的方法,所述方法包括: 接收视频数据块; 确定所述视频数据块是使用非正方形分区分割; 至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式; 至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行解码;以及 使用所述实际帧内预测模式计算所述非正方形分区的预测数据。
31.根据权利要求30所述的方法,其中确定所述最可能帧内预测模式包括: 当所述非正方形分区的所述方向为垂直时,选择左相邻块的帧内预测模式作为所述最可能帧内预测模式;以及 当所述非正方形分区的所述方向为水平时,选择上方相邻块的帧内预测模式作为所述最可能帧内预测模式。
32.根据权利要求30所述的方法,其中确定所述最可能帧内预测模式包括: 当左相邻块的所述帧内预测模式不同于上方相邻块的所述帧内预测模式时且当所述非正方形分区的所述方向为垂直时,选择所述左相邻块的所述帧内预测模式作为所述最可能帧内预测模式。
33.根据权利要求30所述的方法,其中确定所述最可能帧内预测模式包括: 当左相邻块的所述帧内预测模式不同于上方相邻块的所述帧内预测模式时且当所述非正方形分区的所述方向为水平时,选择所述上方相邻块的所述帧内预测模式作为所述最可能帧内预测模式。
34.根据权利要求30所述的方法,其中对表示所述实际帧内预测模式的所述数据进行解码包括确定旗标的值,其中所述旗标的所述值指示所述实际帧内预测模式是否与所述最可能帧内预测模式相同。
35.根据权利要求30所述的方法,其中对表示所述实际预测模式的所述数据进行解码包括: 基于所述非正方形分区的所述方向选择码字表;以及 使用所述选定码字表对表示所述实际预测模式的所述数据进行解码。
36.根据权利要求35所述的方法,其中所述选定码字表省略大体上垂直于所述非正方形分区的所述方向的帧内预测模式的条目。
37.根据权利要求35所述的方法,其中所述非正方形分区的所述方向为垂直,且所述选定码字表省略水平帧内预测模式。
38.根据权利要求35所述的方法,其中所述非正方形分区的所述方向为水平,且所述选定码字表省略垂直帧内预测模式。
39.根据权利要求30所述的方法,其中确定所述视频数据块是使用非正方形分区分割包括确定所述视频数据块是使用短距离帧内预测SDIP模式分区分割。
40.根据权利要求30所述的方法,其中所述非正方形分区包括2NxN或Nx2N分区中的一者O
41.根据权利要求30所述的方法,其中所述非正方形分区包括不对称分区。
42.根据权利要求30所述的方法,其进一步包括: 将上下文自适应二进制算术译码CABAC应用于所述数据以确定所述实际帧内预测模式的经二进制化指示; 使用所述选定码字表将所述实际帧内预测模式的所述经二进制化指示映射到所述实际预测模式。
43.一种用于对视频数据进行译码的设备,所述设备包括经配置以进行以下操作的视频解码器:接收视频数据块;确定所述视频数据块是使用非正方形分区分割;至少部分地基于所述非正方形分区的方向 确定所述块的最可能帧内预测模式;至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行解码;以及使用所述实际帧内预测模式计算所述非正方形分区的预测数据。
44.根据权利要求43所述的设备,其中所述视频解码器经配置以通过以下方式确定所述最可能帧内预测模式: 当所述非正方形分区的所述方向为垂直时,选择左相邻块的帧内预测模式作为所述最可能帧内预测模式;以及 当所述非正方形分区的所述方向为水平时,选择上方相邻块的帧内预测模式作为所述最可能帧内预测模式。
45.根据权利要求43所述的设备,其中所述视频解码器经配置以通过以下方式确定所述最可能帧内预测模式: 当左相邻块的所述帧内预测模式不同于上方相邻块的所述帧内预测模式时且当所述非正方形分区的所述方向为垂直时,选择所述左相邻块的所述帧内预测模式作为所述最可能帧内预测模式。
46.根据权利要求43所述的设备,其中所述视频解码器经配置以通过以下方式确定所述最可能帧内预测模式: 当左相邻块的所述帧内预测模式不同于上方相邻块的所述帧内预测模式时且当所述非正方形分区的所述方向为水平时,选择所述上方相邻块的所述帧内预测模式作为所述最可能帧内预测模式。
47.根据权利要求43所述的设备,其中所述视频解码器进一步经配置以通过确定旗标的值对表示所述实际帧内预测模式的所述数据进行解码,其中所述旗标的所述值指示所述实际帧内预测模式是否与所述最可能帧内预测模式相同。
48.根据权利要求43所述的设备,其中所述视频解码器进一步经配置以通过以下方式对表示所述实际预测模式的所述数据进行解码: 基于所述非正方形分区的所述方向选择码字表;以及 使用所述选定码字表对表示所述实际预测模式的所述数据进行解码。
49.根据权利要求48所述的设备,其中所述选定码字表省略大体上垂直于所述非正方形分区的所述方向的帧内预测模式的条目。
50.根据权利要求48所述的设备,其中所述非正方形分区的所述方向为垂直,且所述选定码字表省略水平帧内预测模式。
51.根据权利要求48所述的设备,其中所述非正方形分区的所述方向为水平,且所述选定码字表省略垂直帧内预测模式。
52.根据权利要求43所述的设备,其中所述视频解码器进一步经配置以通过确定所述视频数据块是使用短距离帧内预测SDIP模式分区分割而确定所述视频数据块是使用非正方形分区分割。
53.根据权利要求43所述的设备,其中所述非正方形分区包括2NxN或Nx2N分区中的一者。
54.根据权利要求43所述的设备,其中所述非正方形分区包括不对称分区。
55.根据权利要求43所述的设备,其中所述视频解码器进一步经配置以将上下文自适应二进制算术译码CABAC应用于所述数据以确定所述实际帧内预测模式的经二进制化指示,以及使用所述选定码字表 将所述实际帧内预测模式的所述经二进制化指示映射到所述实际预测模式。
56.根据权利要求43所述的设备,其中所述设备包括以下各项中的至少一者: 集成电路; 微处理器;以及 无线通信装置,其包含视频译码器。
57.—种设备,其包括: 用于使用非正方形分区分割视频数据块的装置; 用于至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式的装置;以及 用于至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行译码的装置。
58.一种存储指令的计算机可读存储媒体,所述指令在执行后即刻致使一个或一个以上处理器: 使用非正方形分区分割视频数据块; 至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式;以及 至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行译码。
59.一种设备,其包括: 用于接收视频数据块的装置; 用于确定所述视频数据块是使用非正方形分区分割的装置; 用于至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式的装置; 用于至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行解码的装置;以及 用于使用所述实际帧内预测模式计算所述非正方形分区的预测数据的装置。
60.一种存储指令的计算机可读存储媒体,所述指令在执行后即刻致使一个或一个以上处理器: 接收视频数据块; 确定所述视频数据块是使用非正方形分区分割; 至少部分地基于所述非正方形分区的方向确定所述块的最可能帧内预测模式; 至少部分地基于所述所确定最可能帧内预测模式对表示所述块的实际帧内预测模式的数据进行解码;以及 使用所述实际帧内预测模式计 算所述非正方形分区的预测数据。
【文档编号】H04N19/60GK103563389SQ201280026246
【公开日】2014年2月5日 申请日期:2012年6月1日 优先权日:2011年6月3日
【发明者】钱威俊, 郑云非, 马尔塔·卡切维奇 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1