为视频译码中非方形块确定预测参数的制作方法

文档序号:15886007发布日期:2018-11-09 18:53阅读:161来源:国知局
为视频译码中非方形块确定预测参数的制作方法

本发明涉及视频编码及视频解码。

背景技术

数字视频能力可结合到广泛范围的装置中,所述装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(pda)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流式处理装置等等。数字视频装置实施视频译码技术,诸如由mpeg-2、mpeg-4、itu-th.263、itu-th.264/mpeg-4、part10、高级视频译码(avc)、高效率视频译码(hevc或h.265)标准及此类标准的扩展所定义的标准中所描述的视频译码技术。视频装置可通过实施此类视频译码技术来更有效地发射、接收、编码、解码及/或存储数字视频信息。

视频译码技术包含空间(图片内)预测及/或时间(图片间)预测以缩减或移除为视频序列所固有的冗余。对于基于块的视频译码,可将视频切片(例如,视频帧或视频帧的部分)分割成视频块,其也可被称作树型块、译码单元(cu)及/或译码节点。图片可被称作帧,且参考图片可被称作参考帧。

空间或时间预测产生用于待译码块的预测性块。残余数据表示原始经译码块与预测性块之间的像素差。为了进行进一步压缩,可将残余数据从像素域变换为变换域,从而产生残余变换系数,其接着可被量化。可应用熵译码以达成甚至更多的压缩。



技术实现要素:

本发明描述用于译码已使用独立亮度及色度分割框架而分割的视频数据的技术。在一些实例中,本发明描述用于在存在对应于色度块的两个或多于两个亮度块时(例如,在两个或多于两个亮度块与色度块共置时)确定如何将来自亮度块的译码信息再用于色度块的技术。

在其它实例中,本发明描述用于在视频数据块可被分割成非方形块时确定用于位置相依帧内预测比较(pdpc)模式的参数的技术。在一些实例中,可使用多个查找表来确定pdpc参数,所述查找表包含用于垂直相关参数及水平相关参数的单独表。

在本发明的一个实例中,一种解码视频数据的方法包括:接收经编码视频数据的位流,所述经编码视频数据表示经分割亮度块及经分割色度块,其中所述色度块是独立于所述亮度块被分割;确定对应于所述相应经分割亮度块的相应译码模式;根据所述经确定相应译码模式来解码所述相应经分割亮度块;解码指示与所述相应经分割亮度块相关联的所述相应译码模式待用于解码第一经分割色度块的第一语法元素,其中所述第一经分割色度块与两个或多于两个经分割亮度块对准;根据所述两个或多于两个经分割亮度块的所述相应译码模式的函数而为所述第一经分割色度块确定色度译码模式;及根据所述经确定色度译码模式来解码所述第一经分割色度块。

在本发明的另一实例中,一种经配置以解码视频数据的设备包括:存储器,其经配置以存储经编码视频数据的位流;及一或多个处理器,其经配置以进行以下操作:接收经编码视频数据的所述位流,所述经编码视频数据表示经分割亮度块及经分割色度块,其中所述色度块是独立于所述亮度块被分割;确定对应于所述相应经分割亮度块的相应译码模式;根据所述经确定相应译码模式来解码所述相应经分割亮度块;解码指示与所述相应经分割亮度块相关联的所述相应译码模式待用于解码第一经分割色度块的第一语法元素,其中所述第一经分割色度块与两个或多于两个经分割亮度块对准;根据所述两个或多于两个经分割亮度块的所述相应译码模式的函数而为所述第一经分割色度块确定色度译码模式;及根据所述经确定色度译码模式来解码所述第一经分割色度块。

在本发明的另一实例中,一种经配置以解码视频数据的设备包括:用于接收经编码视频数据的位流的装置,所述经编码视频数据表示经分割亮度块及经分割色度块,其中所述色度块是独立于所述亮度块被分割;用于确定对应于所述相应经分割亮度块的相应译码模式的装置;用于根据所述经确定相应译码模式来解码所述相应经分割亮度块的装置;用于解码指示与所述相应经分割亮度块相关联的所述相应译码模式待用于解码第一经分割色度块的第一语法元素的装置,其中所述第一经分割色度块与两个或多于两个经分割亮度块对准;用于根据所述两个或多于两个经分割亮度块的所述相应译码模式的函数而为所述第一经分割色度块确定色度译码模式的装置;及用于根据所述经确定色度译码模式来解码所述第一经分割色度块的装置。

在另一实例中,本发明描述一种非暂时性计算机可读存储媒体,其存储指令,所述指令在被执行时致使经配置以解码视频数据的一或多个处理器进行以下操作:接收经编码视频数据的位流,所述经编码视频数据表示经分割亮度块及经分割色度块,其中所述色度块是独立于所述亮度块被分割;确定对应于所述相应经分割亮度块的相应译码模式;根据所述经确定相应译码模式来解码所述相应经分割亮度块;解码指示与所述相应经分割亮度块相关联的所述相应译码模式待用于解码第一经分割色度块的第一语法元素,其中所述第一经分割色度块与两个或多于两个经分割亮度块对准;根据所述两个或多于两个经分割亮度块的所述相应译码模式的函数而为所述第一经分割色度块确定色度译码模式;及根据所述经确定色度译码模式来解码所述第一经分割色度块。

在本发明的另一实例中,一种解码视频数据的方法包括:接收使用位置相依帧内预测组合(pdpc)模式而编码的视频数据块,所述视频数据块具有由宽度及高度界定的非方形形状;基于所述视频数据块的所述宽度或所述高度中的一或多者来确定一或多个pdpc参数;及使用所述pdpc模式及所述经确定pdpc参数来解码所述视频数据块。

在本发明的另一实例中,一种经配置以解码视频数据的设备包括:存储器,其经配置以存储使用pdpc模式而编码的视频数据块,所述视频数据块具有由宽度及高度界定的非方形形状;及一或多个处理器,其经配置以进行以下操作:接收所述视频数据块;基于所述视频数据块的所述宽度或所述高度中的一或多者来确定一或多个pdpc参数;及使用所述pdpc模式及所述经确定pdpc参数来解码所述视频数据块。

在本发明的另一实例中,一种经配置以解码视频数据的设备包括:用于接收使用pdpc模式而编码的视频数据块的装置,所述视频数据块具有由宽度及高度界定的非方形形状;用于基于所述视频数据块的所述宽度或所述高度中的一或多者来确定一或多个pdpc参数的装置;及用于使用所述pdpc模式及所述经确定pdpc参数来解码所述视频数据块的装置。

在另一实例中,本发明描述一种非暂时性计算机可读存储媒体,其存储指令,所述指令在被执行时致使经配置以解码视频数据的装置的一或多个处理器进行以下操作:接收使用pdpc模式而编码的视频数据块,所述视频数据块具有由宽度及高度界定的非方形形状;基于所述视频数据块的所述宽度或所述高度中的一或多者来确定一或多个pdpc参数;及使用所述pdpc模式及所述经确定pdpc参数来解码所述视频数据块。

在本发明的另一实例中,一种编码视频数据的方法包括:接收视频数据块,所述视频数据块具有由宽度及高度界定的非方形形状;基于所述视频数据块的所述宽度或所述高度中的一或多者来确定一或多个pdpc参数;及使用pdpc模式及所述经确定pdpc参数来编码所述视频数据块。

在本发明的另一实例中,一种经配置以编码视频数据的设备包括:存储器,其经配置以存储视频数据块,所述视频数据块具有由宽度及高度界定的非方形形状;及一或多个处理器,其经配置以进行以下操作:接收所述视频数据块;基于所述视频数据块的所述宽度或所述高度中的一或多者来确定一或多个pdpc参数;及使用pdpc模式及所述经确定pdpc参数来编码所述视频数据块。

附图及以下描述中阐述本发明的一或多个方面的细节。本发明中所描述的技术的其它特征、目标及优点将从描述及附图且从权利要求书显而易见。

附图说明

图1为绘示经配置以实施本发明的技术的实例视频编码及解码系统的框图。

图2a为绘示使用四元树加二元树(qtbt)结构的块分割的实例的概念图。

图2b为绘示对应于使用图2a的qtbt结构的块分割的实例树型结构的概念图。

图3为绘示根据本发明的技术的亮度及色度相对分割的实例的概念图。

图4为绘示根据本发明的技术的亮度及色度相对分割的另一实例的概念图。

图5a绘示根据本发明的技术使用未经滤波参考的4×4块的预测。

图5b绘示根据本发明的技术使用经滤波参考的4×4块的预测。

图6为绘示根据本发明的一个实例的用于确定矩形块中使用的预测参数集合的嵌套表的使用的概念图。

图7为绘示经配置以实施本发明的技术的视频编码器的实例的框图。

图8为绘示经配置以实施本发明的技术的视频解码器的实例的框图。

图9为绘示根据本发明的技术的视频译码器的实例操作的流程图。

图10为绘示根据本发明的技术的视频解码器的实例操作的流程图。

图11为绘示根据本发明的技术的视频编码器的实例操作的流程图。

图12为绘示根据本发明的技术的视频解码器的实例操作的流程图。

具体实施方式

根据一些视频块分割技术,视频数据的色度块是独立于视频数据的亮度块被分割,使得一些色度块可不与单一对应亮度块直接对准。因而,变得难以将与亮度块相关的语法元素再用于色度块,这是由于亮度块与色度块之间可不存在一对一对应性。本发明描述用于在亮度及色度块被独立地分割的情形中使用对应于视频数据的亮度块的信息(例如,语法元素)来译码视频数据的色度块的技术。

本发明还描述用于确定用于位置相依帧内预测组合(pdpc)译码模式的译码参数的技术。在一个实例中,本发明描述用于为分割成非方形块(例如,非方形、矩形块)的视频块确定pdpc参数的技术。

图1为绘示可经配置以执行本发明的技术的实例视频编码及解码系统10的框图。如图1所展示,系统10包含源装置12,其提供稍后将由目的地装置14解码的经编码视频数据。具体地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含桌上型计算机、笔记本(例如,膝上型)计算机、平板计算机、机顶盒、电话手机(诸如所谓的“智能”电话(或更一般化地为移动站))、平板计算机、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式处理装置等等。移动站可为能够经由无线网络而通信的任何装置。在一些状况下,源装置12及目的地装置14可经装备以用于无线通信。因此,源装置12及目的地装置14可为无线通信装置(例如,移动站)。源装置12为实例视频编码装置(即,用于编码视频数据的装置)。目的地装置14为实例视频解码装置(即,用于解码视频数据的装置)。

在图1的实例中,源装置12包含视频源18、经配置以存储视频数据的存储媒体20、视频编码器22,及输出接口24。目的地装置14包含输入接口26、经配置以存储经编码视频数据的存储媒体28、视频解码器30,及显示装置32。在其它实例中,源装置12及目的地装置14可包含其它组件或布置。举例来说,源装置12可从外部视频源(诸如外部相机)接收视频数据。同样地,目的地装置14可与外部显示装置介接,而非包含集成显示装置32。

图1的所绘示系统10仅仅为一个实例。用于处理及/或译码(例如,编码及/或解码)视频数据的技术可由任何数字视频编码及/或解码装置执行。尽管本发明的技术通常是由视频编码装置及/或视频解码装置执行,但所述技术也可由视频编码器/解码器(通常被称作“编解码器(codec)”)执行。源装置12及目的地装置14仅仅为源装置12产生经译码视频数据以供发射到目的地装置14的此类译码装置的实例。在一些实例中,源装置12及目的地装置14可以基本上对称方式而操作,使得源装置12及目的地装置14中的每一者包含视频编码及解码组件。因此,系统10可支持源装置12与目的地装置14之间的单向或双向视频发射,例如,用于视频流式处理、视频回放、视频广播或视频电话。

源装置12的视频源18可包含视频捕获装置,诸如摄像机、含有经先前捕获视频的视频存档,及/或用以从视频内容提供者接收视频数据的视频馈送接口。作为另外替代方案,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、经存档视频与经计算机产生视频的组合。源装置12可包括经配置以存储视频数据的一或多个数据存储媒体(例如,存储媒体20)。本发明中所描述的技术可大体上适用于视频译码,且可应用于无线及/或有线应用。在每一状况下,可由视频编码器22编码经捕获、经预捕获或经计算机产生视频。输出接口24可将经编码视频信息(例如,经编码视频数据的位流)输出到计算机可读媒体16。

目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一些实例中,计算机可读媒体16包括用以使源装置12能够实时地将经编码视频数据直接发射到目的地装置14的通信媒体。可根据通信标准(诸如无线通信协议)来调制经编码视频数据,且将其发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,诸如射频(rf)频谱或一或多个物理传输线。通信媒体可形成基于数据包的网络(诸如局域网、广域网,或诸如因特网的全局网络)的部分。通信媒体可包含路由器、交换机、基站,或可有用于促进从源装置12到目的地装置14的通信的任何其它设备。目的地装置14可包括经配置以存储经编码视频数据及经解码视频数据的一或多个数据存储媒体。

在一些实例中,可将经编码数据从输出接口24输出到存储装置。相似地,可由输入接口从存储装置存取经编码数据。存储装置可包含多种分布式或本地存取数据存储媒体中的任一者,诸如硬盘驱动器、蓝光光盘、dvd、cd-rom、闪速存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适数字存储媒体。在另外实例中,存储装置可对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流式处理或下载而从存储装置存取经存储视频数据。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含web服务器(例如,用于网站)、ftp服务器、网络连接存储(nas)装置,或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包含因特网连接)来存取经编码视频数据。此数据连接可包含适合于存取存储在文件服务器上的经编码视频数据的无线信道(例如,wi-fi连接)、有线连接(例如,dsl、电缆调制解调器等等)或此两者的组合。来自存储装置的经编码视频数据的发射可为流式处理发射、下载发射或其组合。

本发明中所描述的技术可应用于视频译码以支持多种多媒体应用中的任一者,诸如空中电视广播、有线电视发射、卫星电视发射、因特网流式处理视频发射(诸如http动态自适应流式处理(dash))、编码到数据存储媒体上的数字视频、存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持诸如视频流式处理、视频回放、视频广播及/或视频电话的应用。

计算机可读媒体16可包含:暂时性媒体,诸如无线广播或有线网络发射;或存储媒体(即,非暂时性存储媒体),诸如硬盘、闪存驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未展示)可从源装置12接收经编码视频数据,且例如经由网络发射将经编码视频数据提供到目的地装置14。相似地,媒体生产设施(诸如光盘冲压设施)的计算装置可从源装置12接收经编码视频数据且生产含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体16可被理解为包含各种形式的一或多个计算机可读媒体。

目的地装置14的输入接口26从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器22的视频编码器22定义的语法信息,所述语法信息也是由视频解码器30使用,所述语法信息包含描述块及其它经译码单元(例如,图片群组(gop))的特性及/或处理的语法元素。存储媒体28可存储由输入接口26接收的经编码视频数据。显示装置32将经解码视频数据显示给用户,且可包括多种显示装置中的任一者,诸如阴极射线管(crt)、液晶显示器(lcd)、等离子体显示器、有机发光二极管(oled)显示器,或另一类型的显示装置。

视频编码器22及视频解码器30各自可被实施为多种合适视频编码器及/或视频解码器电路系统中的任一者,诸如一或多个微处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)、离散逻辑、软件、硬件、固件或其任何组合。在技术是部分地以软件予以实施时,装置可将用于软件的指令存储在合适非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器来执行指令以执行本发明的技术。视频编码器22及视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述一或多个编码器或解码器中的任一者可被集成为相应装置中的组合式编解码器的部分。

在一些实例中,视频编码器22及视频解码器30可根据视频译码标准而操作。实例视频译码标准包含但不限于itu-th.261、iso/iecmpeg-1visual、itu-th.262或iso/iecmpeg-2visual、itu-th.263、iso/iecmpeg-4visual及itu-th.264(也被称为iso/iecmpeg-4avc),包含其可伸缩视频译码(svc)及多视图视频译码(mvc)扩展。另外,itu-t视频译码专家团体(vceg)及iso/iec动画专家团体(mpeg)的视频译码联合协作小组(jct-vc)已开发新视频译码标准,即,高效率视频译码(hevc)或itu-th.265,包含其范围及屏幕内容译码扩展、3d视频译码(3d-hevc)以及多视图扩展(mv-hevc)及可伸缩扩展(shvc)。

在其它实例中,视频编码器22及视频解码器30可经配置以根据其它视频译码技术及/或标准(包含正由联合视频探索小组(jvet)探索的新视频译码技术)而操作。在本发明的一些实例中,视频编码器22及视频解码器30可经配置以根据使用独立亮度及色度分割使得视频数据的亮度及色度块无需对准的视频译码技术而操作。此类分割技术可导致色度块在图片的特定位置内不对准于单一亮度块的情形。在本发明的其它实例中,视频编码器22及视频解码器30可经配置以根据使用允许非方形块的分割框架的视频译码技术而操作。

根据本发明的技术,如下文将更详细地所描述,视频解码器30可经配置以进行以下操作:接收经编码视频数据的位流,经编码视频数据表示经分割亮度块及经分割色度块,其中色度块是独立于亮度块被分割;确定对应于相应经分割亮度块的相应译码模式;根据经确定相应译码模式来解码相应经分割亮度块;解码指示与相应经分割亮度块相关联的相应译码模式待用于解码第一经分割色度块的第一语法元素,其中第一经分割色度块与两个或多于两个经分割亮度块对准;根据两个或多于两个经分割亮度块的相应译码模式的函数而为第一经分割色度块确定色度译码模式;及根据经确定色度译码模式来解码第一经分割色度块。视频编码器22可经配置以执行与视频解码器30的技术互逆的技术。在一些实例中,视频编码器22可经配置以基于两个或多于两个经分割亮度块的相应译码模式的函数来产生指示色度块是否将再用来自两个或多于两个亮度块的译码模式信息的语法元素。

在hevc及其它视频译码规范中,视频序列通常包含一系列图片。图片也可被称作“帧”。图片可包含三个样本阵列,被表示为sl、scb及scr。sl为亮度样本的二维阵列(例如,块)。scb为cb彩度样本的二维阵列。scr为cr彩度样本的二维阵列。彩度样本也可在本文中被称作“色度”样本。在其它情况下,图片可为单色的,且可仅包含亮度样本阵列。

为了产生图片的经编码表示(例如,经编码视频位流),视频编码器22可产生译码树型单元(ctu)集合。所述ctu中的每一者可包括亮度样本的译码树型块、色度样本的两个对应译码树型块,及用以译码所述译码树型块的样本的语法结构。在单色图片或具有三个单独颜色平面的图片中,ctu可包括单一译码树型块及用以译码所述译码树型块的样本的语法结构。译码树型块可为样本的n×n块。ctu也可被称作“树型块”或“最大译码单元”(lcu)。hevc的ctu可大致地类似于诸如h.264/avc的其它标准的宏块。然而,ctu未必限于特定大小,且可包含一或多个译码单元(cu)。切片可包含按光栅扫描次序连续地排序的整数数目个ctu。

为了产生经译码ctu,视频编码器22可对ctu的译码树型块递归地执行四元树分割以将译码树型块划分成译码块,因此名称为“译码树型单元”。译码块为样本的n×n块。cu可包括具有亮度样本阵列、cb样本阵列及cr样本阵列的图片的亮度样本的译码块及色度样本的两个对应译码块,及用以译码所述译码块的样本的语法结构。在单色图片或具有三个单独颜色平面的图片中,cu可包括单一译码块及用以译码所述译码块的样本的语法结构。

视频编码器22可将cu的译码块分割成一或多个预测块。预测块为被应用相同预测的样本的矩形(即,方形或非方形)块。cu的预测单元(pu)可包括亮度样本的预测块、色度样本的两个对应预测块,及用以预测所述预测块的语法结构。在单色图片或具有三个单独颜色平面的图片中,pu可包括单一预测块及用以预测所述预测块的语法结构。视频编码器22可针对cu的每一pu的预测块(例如,亮度、cb及cr预测块)产生预测性块(例如,亮度、cb及cr预测性块)。

视频编码器22可使用帧内预测或帧间预测以产生用于pu的预测性块。如果视频编码器22使用帧内预测以产生pu的预测性块,那么视频编码器22可基于包含pu的图片的经解码样本来产生pu的预测性块。

在视频编码器22产生用于cu的一或多个pu的预测性块(例如,亮度、cb及cr预测性块)之后,视频编码器22可产生用于cu的一或多个残余块。作为一个实例,视频编码器22可产生用于cu的亮度残余块。cu的亮度残余块中的每一样本指示cu的预测性亮度块中的一者中的亮度样本与cu的原始亮度译码块中的对应样本之间的差。另外,视频编码器22可产生用于cu的cb残余块。在色度预测的一个实例中,cu的cb残余块中的每一样本可指示cu的预测性cb块中的一者中的cb样本与cu的原始cb译码块中的对应样本之间的差。视频编码器22还可产生用于cu的cr残余块。cu的cr残余块中的每一样本可指示cu的预测性cr块中的一者中的cr样本与cu的原始cr译码块中的对应样本之间的差。然而,应理解,可使用用于色度预测的其它技术。

此外,视频编码器22可使用四元树分割以将cu的残余块(例如,亮度、cb及cr残余块)分解成一或多个变换块(例如,亮度、cb及cr变换块)。变换块为被应用相同变换的样本的矩形(例如,方形或非方形)块。cu的变换单元(tu)可包括亮度样本的变换块、色度样本的两个对应变换块,及用以变换所述变换块样本的语法结构。因此,cu的每一tu可具有亮度变换块、cb变换块及cr变换块。tu的亮度变换块可为cu的亮度残余块的子块。cb变换块可为cu的cb残余块的子块。cr变换块可为cu的cr残余块的子块。在单色图片或具有三个单独颜色平面的图片中,tu可包括单一变换块及用以变换所述变换块的样本的语法结构。

视频编码器22可将一或多个变换应用于tu的变换块以产生用于tu的系数块。举例来说,视频编码器22可将一或多个变换应用于tu的亮度变换块以产生用于tu的亮度系数块。系数块可为变换系数的二维阵列。变换系数可为标量。视频编码器22可将一或多个变换应用于tu的cb变换块以产生用于tu的cb系数块。视频编码器22可将一或多个变换应用于tu的cr变换块以产生用于tu的cr系数块。

在产生系数块(例如,亮度系数块、cb系数块或cr系数块)之后,视频编码器22可量化系数块。量化通常是指变换系数经量化以可能地缩减用以表示变换系数的数据的量而提供进一步压缩的过程。在视频编码器22量化系数块之后,视频编码器22可熵编码指示经量化变换系数的语法元素。举例来说,视频编码器22可对指示经量化变换系数的语法元素执行上下文自适应二进制算术译码(cabac)。

视频编码器22可输出包含形成经译码图片及关联数据的表示的位序列的位流。因此,位流包括视频数据的经编码表示。位流可包括网络抽象层(nal)单元序列。nal单元为含有nal单元中的数据的类型的指示及含有所述数据的呈在必要时散置有仿真预防位的原始字节序列有效负载(rbsp)的形式的字节的语法结构。nal单元中的每一者可包含nal单元标头且封装rbsp。nal单元标头可包含指示nal单元类型码的语法元素。由nal单元的nal单元标头指定的nal单元类型码指示nal单元的类型。rbsp可为含有封装在nal单元内的整数数目个字节的语法结构。在一些情况下,rbsp包含零个位。

视频解码器30可接收由视频编码器22产生的经编码视频位流。另外,视频解码器30可分析位流以从位流获得语法元素。视频解码器30可至少部分地基于从位流获得的语法元素来重构视频数据的图片。用以重构视频数据的过程可与由视频编码器22执行的过程大体上互逆。举例来说,视频解码器30可使用pu的运动向量以确定用于当前cu的pu的预测性块。另外,视频解码器30可反量化当前cu的tu的系数块。视频解码器30可对系数块执行反变换以重构当前cu的tu的变换块。视频解码器30可通过将用于当前cu的pu的预测性块的样本与当前cu的tu的变换块的对应样本相加来重构当前cu的译码块。通过重构用于图片的每一cu的译码块,视频解码器30可重构图片。

在一些实例视频编解码器框架(诸如hevc的四元树分割框架)中,联合地执行将视频数据分割成用于颜色分量的块(例如,亮度块及色度块)。即,在一些实例中,以相同方式分割亮度块及色度块,使得不多于一个亮度块对应于图片内的特定位置中的色度块。在一个实例中,视频数据块的分割区可被进一步划分成子块。与视频块或视频块的分割区相关的信息(例如,样本值及指示视频块将被如何译码的语法元素)存储在子块级处。或,更一般化地,与视频块或视频块的分割区相关的信息可与视频数据块的一或多个代表性位置(例如,对应于任何样本或子样本)相关地被存储。举例来说,如果分割区为16×16像素,且分割区中的每一子块为4×4像素,那么在分割区中存在16个子块。信息是以子块粒度(在此实例中为4×4)被存储,且所有16个子块可具有相同信息。

在本发明的上下文中,术语“分割区”、“块”及“经分割块”可被互换地使用。一般来说,块为被执行视频译码的样本(例如,亮度或色度样本)群组。在本发明的上下文中,“子块”为块的具有存储用于块的译码模式信息的关联存储器位置的分区。

视频编码器22及视频解码器30可分配存储器中的位置以用于存储用于每一代表性位置(例如,子块)的信息。在一些实例中,信息的值(例如,用于特定译码模式的特定语法元素的值)可存储在与每一代表性位置(例如,子块)相关联的单独存储器位置中。在其它实例中,信息可经一次存储以用于分割区的多个代表性位置(例如,子块)中的一者。分割区的其它子块的存储器位置可包含指向存储信息的实际值的存储器位置的指针。下文将参考子块来描述本发明的技术,但应理解,可使用块的任何代表性位置。

如上文所提及,存储在子块级处的信息可为用以对分割区执行译码处理的任何信息。此类信息可为经发信语法信息或经派生补充信息。经派生补充信息的一个实例可为从与译码亮度块相关的信息派生的用以译码色度块的信息。供在hevc中使用的经派生补充信息的一个实例为直接模式信息,其中亮度帧内预测信息(例如,帧内预测方向)用于色度预测而不发信用于色度块的帧内预测方向自身。信息的其它实例可为模式决策,诸如帧内预测或帧间预测、帧内预测方向、运动信息等等。

在比较亮度及色度分割区大小时,可考虑色度颜色格式(例如,色度子取样格式),诸如4:4:4、4:2:2、4:2:0。举例来说,如果亮度分割区为16×16像素,那么对应或共置型色度分割区对于4:2:0颜色格式为8×8,且对于4:4:4色度颜色格式为16×16。分割区未必为方形,且可为例如矩形形状。因而,对于4:2:0色度子取样格式,亮度及色度分割区将不为相同的大小。然而,在亮度及色度块被联合地分割时,所得分割仍产生对应于任何特定色度块的仅一个亮度块。

联合视频探索小组(jvet)当前正在研究四元树加二元树(qtbt)分割结构。在j.an等人的“blockpartitioningstructurefornextgenerationvideocoding”(国际电信联盟,com16-c966,2015年9月(在下文中为“vceg提案com16-c966”))中,针对除了hevc以外的未来视频译码标准描述qtbt分割技术。模拟已展示所提议的qtbt结构可比hevc中使用的四元树结构更有效。

在vceg提案com16-c966中所描述的qtbt结构中,首先使用四元树分割技术来分割ctb,其中一个节点的四元树拆分可被反复直到节点达到最小允许四元树叶节点大小。可通过语法元素minqtsize的值向视频解码器30指示最小允许四元树叶节点大小。如果四元树叶节点大小不大于最大允许二元树根节点大小(例如,如由语法元素maxbtsize所指示),那么可使用二元树分割来进一步分割四元树叶节点。一个节点的二元树分割可被反复直到节点达到最小允许二元树叶节点大小(例如,如由语法元素minbtsize所指示)或最大允许二元树深度(例如,如由语法元素maxbtdepth所指示)。vceg提案com16-c966使用术语“cu”来指二元树叶节点。在vceg提案com16-c966中,cu用于预测(例如,帧内预测、帧间预测等等)及变换而无任何进一步分割。一般来说,根据qtbt技术,对于二元树拆分存在两种拆分类型:对称水平拆分及对称垂直拆分。在每一状况下,通过顺着中间水平地或垂直地划分块来拆分块。这不同于四元树分割,四元树分割将块划分成四个块。

在qtbt分割结构的一个实例中,ctu大小经设置为128×128(例如,128×128亮度块及两个对应64×64色度块),minqtsize经设置为16×16,maxbtsize经设置为64×64,minbtsize(对于宽度及高度两者)经设置为4,且maxbtdepth经设置为4。四元树分割首先应用于ctu以产生四元树叶节点。四元树叶节点可具有从16×16(即,minqtsize为16×16)到128×128(即,ctu大小)的大小。根据qtbt分割的一个实例,如果叶四元树节点为128×128,那么叶四元树节点不能由二元树进一步拆分,这是由于叶四元树节点的大小超过maxbtsize(即,64×64)。否则,叶四元树节点由二元树进一步分割。因此,四元树叶节点也为二元树的根节点且具有为0的二元树深度。二元树深度达到maxbtdepth(例如,4)暗示不存在进一步拆分。二元树节点具有等于minbtsize(例如,4)的宽度暗示不存在进一步水平拆分。相似地,二元树节点具有等于minbtsize的高度暗示无进一步垂直拆分。二元树的叶节点(cu)被进一步处理(例如,通过执行预测过程及变换过程)而无任何进一步分割。

图2a绘示使用qtbt分割技术而分割的块50(例如,ctb)的实例。如图2a所展示,在使用qtbt分割技术的情况下,通过每一块的中心对称地拆分所得块中的每一者。图2b绘示对应于图2a的块分割的树型结构。图2b中的实线指示四元树拆分且点线指示二元树拆分。在一个实例中,在二元树的每一拆分(即,非叶)节点中,发信语法元素(例如,旗标)以指示所执行的拆分的类型(例如,水平或垂直),其中0指示水平拆分且1指示垂直拆分。对于四元树拆分,无需指示拆分类型,这是由于四元树拆分始终将块水平地及垂直地拆分成具有相等大小的4个子块。

如图2b所展示,在节点70处,使用四元树分割将块50拆分成图2a所展示的四个块51、52、53及54。块54未被进一步拆分,且因此为叶节点。在节点72处,使用二元树分割将块51进一步拆分成两个块。如图2b所展示,节点72是以1予以标记,这指示垂直拆分。因而,节点72处的拆分产生块57以及包含块55及56两者的块。在节点74处通过进一步垂直拆分来产生块55及56。在节点76处,使用二元树分割将块52进一步拆分成两个块58及59。如图2b所展示,节点76是以1予以标记,这指示水平拆分。

在节点78处,使用四元树分割将块53拆分成4个相等大小块。块63及66是根据此四元树分割而产生且未被进一步拆分。在节点80处,首先使用垂直二元树拆分来拆分左上部块,从而产生块60及右垂直块。接着使用水平二元树拆分将右垂直块拆分成块61及62。在节点84处,使用水平二元树拆分将在节点78处根据四元树拆分而产生的右下块拆分成块64及65。

在qtbt分割的一个实例中,可针对i切片彼此独立地执行亮度及色度分割,这与例如hevc相反,在hevc中,针对亮度及色度块联合地执行四元树分割。即,在正被研究的一些实例中,亮度块及色度块可被单独地分割,使得亮度块及色度块不会直接重叠。因而,在qtbt分割的一些实例中,可以使得至少一个经分割色度块不与单一经分割亮度块空间上对准的方式来分割色度块。即,与特定色度块共置的亮度样本可在两个或多于两个不同亮度分割区内。

如上文所描述,在一些实例中,可从与对应亮度块相关的信息派生与色度块将被如何译码相关的信息。然而,如果亮度及色度分割被独立地执行,那么亮度及色度块可不对准(例如,亮度及色度块可不对应于同一像素集合)。举例来说,色度分割可使得色度块大于或小于对应亮度分割区。另外,色度块可空间上重叠于两个或多于两个亮度块。如上文所阐释,如果经分割色度块大于经分割亮度块,那么状况可为:存在空间上对应于特定色度块的多于一个亮度块,且因此存在与对应于色度分割区的大小的亮度分割区相关联的多于一个亮度信息(例如,语法元素等等)集合。在此类状况下,不清楚的是如何从亮度信息派生色度信息。应理解,亮度及色度块被独立地分割的任何分割结构可出现此类情形,而非仅仅是正由jvet研究的实例qtbt分割结构才出现此类情形。

鉴于这些缺点,本发明描述用于从用于使用单独及/或独立亮度及色度分割而分割的图片的亮度信息派生色度信息的方法及装置。如上文所描述,亮度及色度分割可未对准,例如,具有不同大小或形状。来自亮度块的经派生信息(例如,经确定译码模式信息)可用作色度信息(例如,待用于色度块的译码模式)的预测值或用以译码视频数据的色度块。替代地或另外,亮度信息可用于色度信息的上下文译码中的上下文建模。任选地,上下文建模可与预测信息组合。应理解,下文所描述的技术中的每一者可被独立地使用或可以任何组合而与其它技术组合。

作为本发明的一个实例,视频编码器22使用特定译码模式(例如,特定帧内预测模式、特定帧间预测模式、特定滤波模式、特定运动向量预测模式等等)来编码视频数据的亮度块。在一些实例中,视频编码器22可进一步编码指示什么译码模式用以编码特定亮度块的语法元素。视频解码器30可经配置以解码语法元素以确定用以解码亮度块的译码模式。在其它实例中,视频解码器30可不接收明确地指示特定译码模式的语法元素。更确切地说,视频解码器30可经配置以基于各种视频特性(例如,块大小、来自相邻块的信息等等)及预定规则集合来派生用于亮度块的特定译码模式。在其它实例中,视频解码器30可基于经明确发信的语法元素与预定规则的组合来确定译码模式。

在一个实例中,视频编码器22可任选地使用与对应亮度块相同的译码模式来编码色度块(例如,cr块及/或cb块)。视频编码器22可发信向视频解码器30指示将用于确定用于亮度块的译码模式的任何经发信或经派生信息再用作一或多个对应色度块的译码模式的预测值的语法元素(例如,旗标),而非视频编码器22仅仅发信指示用于色度块的译码模式的语法元素及/或其它信息。举例来说,可针对一或多个色度块译码旗标以指示是否以与对应亮度块相同的译码模式译码色度块。如果否,那么视频编码器22独立地产生指示用于色度块的译码模式的语法元素,其中视频编码器22可考虑色度模式不等于亮度模式。即,视频编码器22及视频解码器可能够确定用于色度块的译码模式不与用于亮度块的译码模式相同,且因此,用于亮度块的译码模式可作为用于色度块的可能性而被排除。在另外实例中,单独上下文可用以译码指示是否使用与亮度分量相同的模式来译码色度分量的旗标。

在上文所描述的实例中,假定视频编码器22及视频解码器30首先译码亮度块,接着译码一或多个色度块。在此实例中,在色度块正被译码时,亮度信息已经可用。如果视频编码器22及视频解码器30经配置以按另一次序译码块(例如,首先译码色度块),那么可仅仅在以下实例中调换亮度及色度术语。

在本发明的一个实例中,视频解码器30可经配置以接收经编码视频数据的位流且在存储器(例如,图1的存储媒体28)中存储经编码视频数据。经编码视频数据可表示经分割亮度块及经分割色度块两者。在一些实例中,经分割色度块可包含cr色度块及cb色度块两者。如本发明中所使用,术语“色度块”可指包含任何类型的色度信息的任何类型的块。在本发明的实例中,独立于亮度块来分割色度块。即,视频编码器22可经配置以使用用于亮度块及色度块的单独分割结构来编码视频数据。

此类单独分割结构可引起至少一个经分割色度块不与单一经分割亮度块对准。因而,对于图片的特定空间位置,视频编码器22可分割单一色度块,但分割多个亮度块。然而,应理解,对于图片的其它空间位置,亮度块与色度块之间可存在1对1对应性,或对于单一亮度块可存在多个色度块。上文所描述的qtbt分割结构为亮度及色度块被独立地/单独地分割的一种类型的分割结构。然而,本发明的技术可应用于根据亮度及色度块被独立地分割的任何分割结构而分割的视频数据。

视频解码器30可经进一步配置以为经编码视频位流中接收的相应经分割亮度块确定译码模式,且根据经确定相应译码模式来解码相应经分割亮度块。视频解码器30可经配置以从由经编码视频位流中接收的语法元素指示的信息确定译码模式。此类语法元素可明确地指示译码模式。在其它实例中,视频解码器30可经配置以从视频数据的特性及一些预定规则隐含地为亮度块确定译码模式。在其它实例中,视频解码器30可使用经明确发信的语法元素与来自预定规则及视频数据特性的经隐含确定的译码模式的组合而为亮度块确定译码模式。

在本发明的上下文中,译码模式可为向视频解码器30指示视频编码器22如何编码经编码视频数据及视频解码器30应如何解码视频数据的任何信息。实例译码模式可包含用于色度帧内预测的直接模式、位置相依帧内预测组合(pdpc)旗标(例如,指示是否使用pdpc模式)、pdpc参数、用于非可分离次级变换(nsst)的次级变换集、增强型多重变换(emt)、自适应多重变换(atm),及用于选择熵译码数据模型的上下文。以上各者为色度译码模式的实例,所述色度译码模式可从由视频解码器30确定的亮度译码模式(用以译码亮度块的译码模式)派生,且已用于jvet中研究的jem测试模型中。然而,应理解,译码模式可包含用于译码亮度块的任何译码模式,所述译码模式可再用于译码色度块或用以预测用于色度块的译码模式。

不管译码模式的类型,或译码模式被确定的方式,视频解码器30皆可经配置以将用于特定经分割亮度块的经确定译码模式存储在与特定经分割亮度块相关联的多个不同存储器位置中。如下文将参考图3更详细地所阐释,特定经分割亮度块可被划分成子块,且视频解码器30可将为整个特定经分割亮度块而确定的译码模式存储在对应于子块中的每一者的存储器位置中。因此,对于划分成n个子块的特定经分割亮度块,译码模式存储在n个不同存储器位置中,每一存储器位置对应于经分割亮度块内的特定空间上定位的子块。子块可为任何大小的矩形或方形块。在一些实例中,子块可为仅仅一个样本,即,大小为1×1的块。在一些实例中,每一存储器位置可存储明确地指示用于特定经分割亮度块的译码模式的数据。在其它实例中,与特定经分割亮度块相关联的一或多个存储器位置明确地存储指示译码模式的信息,而与特定经分割亮度块相关联的其它存储器位置存储指向明确地存储译码模式的存储器位置的指针。

根据本发明的一些实例,视频解码器30可经配置以再用经接收用于亮度块的译码模式信息以供在解码色度块时使用。在一些实例中,视频解码器30可接收及解码指示与相应经分割亮度块相关联的译码模式是否待用于解码特定经分割色度块的第一语法元素。如上文所描述,经分割色度块可与两个或多于两个不同经分割亮度块空间上对准。因而,可难以确定如何将亮度译码模式再用于此类色度块,这是由于不清楚从哪一亮度块继承(例如,再用)译码模式信息。通过在对应于多个子块位置的多个存储器位置中存储亮度译码模式信息,视频解码器30可经配置以使用经存储用于对应于特定色度块的空间位置的子块的译码模式信息的函数来确定来自亮度块的哪些译码模式信息再用于特定色度块。在此上下文中,函数可为由视频解码器30使用以确定两个或多于两个共置型分割亮度块中的哪一者(些)再用于经分割色度块的预定规则及分析技术集合。一旦确定将再用的亮度译码模式,视频解码器30就可运用经确定译码模式来解码特定经分割色度块。

视频解码器30可经配置以基于存储在与经分割亮度块的子块相关联的存储器位置中的译码模式信息的函数而从两个或多于两个空间上对准亮度块确定将再用哪一译码模式。可使用若干不同函数。在本发明的一个实例中,视频解码器30可经配置以执行对应于与色度分割区共置的两个或多于两个亮度分割区的亮度译码模式信息的统计分析。供色度块使用的来自亮度块的经确定亮度译码模式信息可为整个亮度译码模式信息(例如,与色度块共置的每一亮度子块中所含有的译码模式信息)及亮度译码模式信息跨越亮度块中的共置型子块如何变化(例如,信息相似或不同到什么程度)的函数。用于译码模式再用的先前技术与本发明的技术的一个差异为亮度译码模式信息可由于单独亮度及色度分割而与多于一个亮度块(或分割区)相关。

可用于确定来自两个或多于两个经分割亮度块的什么亮度译码模式信息可再用于共置型色度块的函数的实例可包含但不限于下文所描述的函数中的一或多者。在一个实例中,视频解码器30可执行包含指示两个或多于两个经分割亮度块的经确定相应译码模式的译码模式信息的统计分析的函数。译码模式信息存储在与两个或多于两个经分割亮度块的相应子块相关联的相应存储器位置中。在一个实例中,视频解码器30可分析译码模式信息且返回(例如,用以确定用途及从存储器获得)对于两个或多于两个经分割亮度块的共置型子块最常出现的译码模式信息。即,函数返回用于对应亮度块中的大部分亮度信息。以此方式,函数指示来自两个或多于两个经分割亮度块的特定亮度译码模式信息待再用于共置型色度块。

在其它实例中,视频解码器30可使用执行用于两个或多于两个经分割亮度块的子块的译码模式信息的分析的函数,分析包含测量亮度译码模式信息的梯度或高阶导数以测量所述信息的平滑度。举例来说,两个或多于两个亮度块中的一些极端(例如,离群值)译码模式信息(其可非常不同于与两个或多于两个亮度块相关的大部分译码模式信息)可被忽略且不再用于色度块。在其它实例中,视频解码器30可将不同权重指派给经存储用于相应子块的亮度译码模式信息,且使用译码模式的加权平均值以确定哪一模式再用于色度块。可基于与色度块共置的亮度子块的相对位置来指派权重。

在其它实例中,用以确定什么亮度译码模式再用于色度块的函数可包含以下视频译码特性中的一或多者。可由视频解码器30使用以确定什么亮度译码模式再用于色度块的函数可包含块的形状(矩形、方形)、块定向(垂直或水平定向的矩形块)、色度块的形状、含有代表性位置的亮度块的形状、亮度及/或色度块的宽度或高度、对应于色度块的区域的更频繁使用的亮度模式。在其它实例中,函数可基于预测模式或代表性位置中的亮度信息。举例来说,如果视频解码器30经配置以再用亮度帧内模式以用于色度块,但代表性位置中的亮度块是以帧间模式予以译码,那么视频解码器30可经配置以选择另一代表性位置以确定再用于色度块的亮度帧内模式。更一般化地,如果视频解码器30确定什么亮度信息再用于译码色度块,但亮度信息可对于此色度块并非有效,那么视频解码器30可考虑来自亮度块中的另一代表性位置的亮度信息,或以其它方式可使用某一默认亮度信息。

在本发明的另一实例中,视频解码器30可基于预定子块位置来再用译码模式信息。举例来说,视频解码器30可仅仅再用经存储用于与色度块共置的特定子块位置的译码模式信息。作为一个实例,视频解码器30可再用存储在与分割色度块的特定拐角共置的亮度子块处的译码模式信息。可使用任何拐角子块。作为另一实例,视频解码器30可再用存储在与分割色度块的中心共置的亮度子块处的译码模式信息。在其它实例中,视频解码器30可执行经存储用于某一预定数目个亮度子块位置的译码模式信息的统计分析(例如,如上文所描述)。即,视频解码器30可使用分析亮度分割区的某些子块且基于其中所含有的亮度信息来派生色度信息的函数。

在另一实例中,视频解码器30可将经分割色度块划分成多个子块,例如,1×1、2×2、4×4或其它大小的子块。接着,对于每一子块,视频解码器30可继承(例如,再用)经存储用于特定亮度子块的亮度译码模式信息以用于共置型色度子块。以此方式,可在单一色度块中应用来自对应亮度块的不同译码信息。

如上文所论述,视频解码器30可使用多个预定函数中的一者以用于确定如何将亮度译码模式信息再用于色度块。在一些实例中,视频解码器30可经配置以使用单一预定函数,且针对所有图片使用所述函数。在其它实例中,视频解码器30可基于一些视频译码特性来确定将使用哪一函数。在其它实例中,视频编码器22可经配置以发信向视频解码器30指示将使用什么函数来确定如何再用亮度译码模式信息的语法元素。可在任何级(例如,序列级、图片级、切片级、图像块级、ctb级等等)处发信此类语法元素。

图3为绘示根据本发明的技术的亮度及色度相对分割的实例的概念图。如图3所展示,按照分割区(例如,经分割亮度块)将信息存储在分割区的子块(虚线方框)中。子块可具有任何大小,下至个别样本的大小。图3展示一个色度分割区(无论呈4:4:4还是4:2:0子取样格式)可具有多于一个关联亮度分割区。因而,单一色度分割区可具有多于一个对应亮度信息集合。亮度分割区的某些代表性位置(例如,子块)可用以分析亮度信息(例如,译码模式),以便派生用于对应色度分割区的色度信息,如上文所描述。

图4为绘示根据本发明的技术的亮度及色度相对分割的另一实例的概念图。如图4所展示,按照分割区将信息存储在亮度分割区的子块(虚线方框)中。图4展示一个色度分割区中的每一子块可具有一个关联亮度子块,且可分析关联的一个亮度子块的亮度信息以派生用于对应色度子块的色度信息。

以下章节描述可使用本发明的技术的一些实例。在色度直接模式中,亮度帧内方向用于色度帧内预测。此模式的实例用于hevc中。根据本发明的一个实例技术,在色度及亮度结构不对准(例如,由于独立色度及亮度分割)时,选择中心代表性亮度子块以获得亮度帧内预测模式,亮度帧内预测模式接着作为直接模式而应用于色度分割区。对应亮度分割区的其它亮度子块可具有不同于选定子块的其它帧内方向。还可使用其它函数以代替使用如上文所阐释的中心代表性子块。

在另一实例中,在色度直接模式中,在色度及亮度结构不对准时,在2×2(或4×4)子块单元中执行色度帧内预测。对于每一2×2(或4×4)色度子块,识别一个关联4×4亮度子块,且此经识别4×4亮度子块的帧内预测模式应用于当前色度2×2(或4×4)子块。

在另一实例中,色度pdpc控制旗标(即,pdpc模式被应用或未被应用)及pdpc参数是例如从中心代表性亮度子块派生,且应用于色度分割区。还可使用其它函数以代替使用如上文所阐释的中心代表性子块。

在另一实例中,次级变换(nsst)集是由视频解码器30从中心代表性亮度子块选择且应用于色度分割区。还可使用其它函数以代替使用如上文所阐释的中心代表性子块。

相似技术可由视频解码器30应用于从亮度信息派生的任何色度信息。

参考视频解码器30而描述前述实例。然而,视频编码器22可使用相同技术以用于确定如何将针对亮度块所产生、派生及/或发信的信息再用于色度块。具体地说,视频编码器22可基于将由视频解码器使用以确定将再用什么亮度译码模式信息的函数来确定是否发信指示亮度译码模式信息是否应再用于色度块的语法元素。

以下章节描述用于为可被分割成非方形矩形分割区的视频数据块确定用于位置相依帧内预测组合(pdpc)译码模式的参数的技术。上文所描述的qtbt分割结构为允许非方形矩形块的分割结构的实例。然而,本发明的技术可与产生非方形矩形块的任何分割结构一起使用。

在使用pdpc译码模式来译码视频数据时,视频编码器22及/或视频解码器30可使用定义如何基于经滤波及未经滤波参考值及基于经预测像素的位置来组合预测的一或多个参数化方程式。本发明描述若干参数集合,使得视频编码器22可经配置以测试所述参数集合(例如,经由使用速率-失真分析)且将最佳参数(例如,被测试的那些参数当中引起最佳速率-失真效能的参数)发信到视频解码器30。在其它实例中,视频解码器30可经配置以从视频数据的特性(例如,块大小、块高度、块宽度等等)确定pdpc参数。

图5a绘示根据本发明的技术使用未经滤波参考(r)的4×4块(p)的预测。图5b绘示根据本发明的技术使用经滤波参考(s)的4×4块(q)的预测。尽管图5a及5b两者绘示4×4像素块及17(4×4+1)个相应参考值,但本发明的技术可应用于任何块大小及任何数目个参考值。

在执行pdpc译码模式时,视频编码器22及/或视频解码器30可利用经滤波(q)预测与未经滤波(p)预测之间的组合,使得可使用来自经滤波(s)及未经滤波(r)参考阵列的像素值来计算用于待译码的当前块的经预测块。

在pdpc的技术的一个实例中,在给出仅分别使用未经滤波及经滤波参考r及s而计算的任何两个像素预测pr[x,y]及qs[x,y]集合的情况下,由v[x,y]表示的像素的组合式经预测值是由下式定义:

v[x,y]=c[x,y]pr[x,y]+(1-c[x,y])qs[x,y](1)

其中c[x,y]为组合参数集合。权重c[x,y]的值可为介于0与1之间的值。权重c[x,y]及(1-c[x,y])的总和可等于1。

在某些实例中,可不实际的是具有与块中的像素的数目一样大的参数集合。在此类实例中,c[x,y]可由小得多的参数集合加方程式定义以计算来自那些参数的所有组合值。在此类实例中,可使用以下公式:

其中g及dv,dh∈{1,2}为预测参数,n为块大小,pr[x,y]及qs[x,y]为使用根据hevc标准所计算的预测值,对于特定模式,分别使用未经滤波及经滤波参考,且

为由预测参数定义的标准化因数(即,用以使经指派到的总权重增加到1)。

公式2可经一般化用于公式2a中的任何视频译码标准:

其中g及dv,dh∈{1,2}为预测参数,n为块大小,为使用根据视频译码标准(或视频译码方案或算法)所计算的预测值,对于特定模式,分别使用未经滤波及经滤波参考,且

为由预测参数定义的标准化因数(即,用以使经指派到的总权重增加到1)。

这些预测参数可包含用以根据所使用的预测模式的类型(例如,hevc的dc、平面及33方向性模式)来提供经预测项的最佳线性组合的权重。举例来说,hevc含有35个预测模式。查找表可以用于预测模式中的每一者的预测参数g,dv及dh中的每一者的值(即,用于每一预测模式的g,dv及dh的35个值)予以构造。此类值可在具有视频的位流中被编码,或可为事先由编码器及解码器所知的常量值且可无需在文件或位流中被发射。g,dv及dh的值可由优化训练算法通过找到用于针对训练视频集合给出最佳压缩的预测参数的值而确定。

在另一实例中,对于每一预测模式存在多个预定义预测参数集(例如,在查找表中),且选定预测参数集(而非参数自身)在经编码文件或位流中发射到解码器。在另一实例中,g,dv及dh的值可由视频编码器在运作中产生且在经编码文件或位流中发射到解码器。

在另一实例中,代替使用hevc预测,执行这些技术的视频译码装置可使用hevc的经修改版本,类似于使用65方向性预测以代替33方向性预测的版本。事实上,可使用任何类型的帧内预测。

在另一实例中,可选择公式以促进计算。举例来说,我们可使用以下类型的预测值

其中

此类途径可采用hevc(或其它)预测的线性。在将h定义为来自预定义集合的滤波器k的脉冲响应的情况下,如果我们具有

s=ar+(1-a)(h*r)(7)

其中“*”表示卷积,那么

即,可从线性组合参考计算线性组合预测。

公式4、6及8可针对公式4a、6a及8a中的任何视频译码标准而被一般化:

其中

此类途径可采用译码标准的预测的线性。在将h定义为来自预定义集合的滤波器k的脉冲响应的情况下,如果我们具有

s=ar+(1-a)(h*r)(7a)

其中“*”表示卷积,那么

即,可从线性组合参考计算线性组合预测。

在实例中,预测函数可仅使用参考向量(例如,r及s)作为输入。在此实例中,如果参考已被滤波或尚未被滤波,那么参考向量的行为不会改变。如果r与s相等(例如,某一未经滤波参考r恰好与另一经滤波参考s相同),那么应用于经滤波及未经滤波参考的预测性函数(例如,pr[x,y](也被写为p(x,y,r))等于ps[x,y](也被写为p(x,y,s)))相等。另外,像素预测p及q可等效(例如,在给出相同输入的情况下产生相同输出)。在此类实例中,可运用替换像素预测q[x,y]的像素预测p[x,y]来重写公式(1)到(8)。

在另一实例中,预测(例如,函数集合)可取决于参考已被滤波的信息而改变。在此实例中,可表示不同函数集合(例如,pr[x,y]及qs[x,y])。在此状况下,即使r与s相等,pr[x,y]及qs[x,y]仍可不相等。换句话说,取决于输入是否已被滤波,相同输入可产生不同输出。在此类实例中,p[x,y]可不能够由q[x,y]替换。

所展示的预测方程式的优点为:在运用参数化公式化的情况下,可使用诸如训练的技术而针对不同类型的视频纹理确定最佳参数集合(即,优化预测准确度的最佳参数集合)。又可在一些实例中通过针对一些典型类型的纹理计算若干预测值参数集合且具有编码器测试来自每一集合的预测值且将得到最佳压缩的预测值编码为边信息的压缩方案来扩展此途径。

在上文所描述的技术的一些实例中,在启用pdpc译码模式时,用于pdpc模式的帧内预测加权及控制(例如,使用经滤波或未经滤波样本)的pdpc参数被预计算且存储在查找表(lut)中。在一个实例中,视频解码器30根据块大小及帧内预测方向来确定pdpc参数。用于pdpc译码模式的先前技术假定经帧内预测块的大小始终为方形。

jvet测试模型包含pdpc译码模式。如上文所论述,jvet测试模型使用qtbt分割,其允许非方形矩形块。以下章节论述用于矩形块的pdpc译码的扩展的实例技术。然而,应理解,本发明的技术可用于确定用于使用非方形块的任何预测模式的预测模式参数,所述预测模式包含根据样本位置将加权平均值应用于预测值及参考样本的预测模式。

建议以对于水平相关参数使用块的宽度以存储或存取来自lut的pdpc参数且对于垂直相关参数使用块的高度以存储或存取来自lut的pdpc参数的方式修改用于确定pdpc参数的lut的结构,或用于派生来自lut的参数的技术。对于不具有水平或垂直关系的其它参数,可应用块宽度及高度的函数以存储或存取来自lut的那些参数。

视频解码器30可接收已使用pdpc模式而编码的视频数据块。在此实例中,视频数据块可具有由宽度及高度界定的非方形矩形形状。视频解码器30可依据帧内预测模式及块的宽度来确定水平相关pdpc参数。视频解码器30可依据帧内预测模式及块的高度来确定垂直相关pdpc参数。另外,视频解码器30可基于帧内预测模式以及块的高度及宽度的函数来确定非方向性pdpc参数(例如,既不水平相关也不垂直相关的pdpc参数)。上文以上标v指示实例垂直相关参数。上文以上标h指示实例水平相关参数。举例来说,函数可为但不限于块的宽度及高度的最大值或最小值,或块的高度及宽度的加权平均值,其中加权可取决于一个尺寸如何大于块的另一尺寸。举例来说,相比于加权平均值中的另一尺寸,较大尺寸(宽度或高度)可具有较大权重。

由于存在被允许的仅某一数目个块形状(宽度及高度),故还可明确地针对所有可能的块宽度及高度或子组合来表示此函数。举例来说,如果我们具有nw及nh可能块宽度及高度,那么大小为nw×nh的表可针对每一矩形或方形块存储待在帧内预测过程中使用的数据。

图6为绘示根据本发明的一个实例的用于确定矩形块中使用的预测参数集合的嵌套表的使用的概念图。视频解码器30可使用一或多个lut来确定pdpc参数,所述一或多个lut的条目是关于块的宽度及高度两者被加索引。如图6所展示,宽度(w)及/或高度(h)可用作对大小到参数表90的输入。大小到参数表90可经配置为含有指向预测参数表92中的条目的索引的(lut)。如上文所论述,大小到参数表90可具有大小nw×nh以考虑nw及nh可能块宽度及高度。在此实例中,大小到参数表90可用于单一帧内预测模式(例如,dc、平面或其它预测方向)。在其它实例中,大小到参数表90可含有用于所有帧内预测模式的条目,且使用块高度、块宽度及帧内预测模式作为到表中的条目。一般来说,为了最小化存储器,视频解码器30及视频编码器22可经配置以组合行及列中的表条目,从而缩减表(例如,大小到参数表90)的大小,且可能地产生具有不同大小的若干表。

作为一个实例,在假定特定帧内预测模式的情况下,视频解码器30可使用正被解码的视频数据块的宽度来存取大小到参数表90中的条目以确定一或多个水平相关pdpc参数。基于块的宽度,大小到参数表90中的对应条目可用作对预测参数表92的输入。预测参数表92具有大小np×ne且含有实际pdpc参数的条目。因而,从大小到参数表90获得的条目为指向预测参数表92中的实际水平相关pdpc参数的索引,其接着用于解码块94中。

同样地,视频解码器30可使用正被解码的视频数据块的高度来存取大小到参数表90中的条目以确定一或多个垂直相关pdpc参数。基于块的宽度,大小到参数表90中的对应条目可用作对预测参数表92的输入以获得预测参数表92中的实际垂直相关pdpc参数,其接着用于解码块94中。相同过程可应用于基于块的高度及宽度的函数而加索引的非方向性pdpc参数。

图7为绘示可实施本发明的技术的实例视频编码器22的框图。图7是出于阐释的目的而被提供,且不应被视为限制如本发明中广泛地示范及描述的技术。本发明的技术可适用于各种译码标准或方法。

在图7的实例中,视频编码器22包含预测处理单元100、视频数据存储器101、残余产生单元102、变换处理单元104、量化单元106、反量化单元108、反变换处理单元110、重构单元112、滤波器单元114、经解码图片缓冲器116及熵编码单元118。预测处理单元100包含帧间预测处理单元120及帧内预测处理单元126。帧间预测处理单元120可包含运动估计单元及运动补偿单元(未展示)。

视频数据存储器101可经配置以存储待由视频编码器22的组件编码的视频数据。存储在视频数据存储器101中的视频数据可例如从视频源18获得。经解码图片缓冲器116可为参考图片存储器,其存储用于由视频编码器22在编码视频数据(例如,在帧内或帧间译码模式中)时使用的参考视频数据。视频数据存储器101及经解码图片缓冲器116可由多种存储器装置中的任一者形成,诸如动态随机存取存储器(dram),包含同步dram(sdram)、磁阻式ram(mram)、电阻式ram(rram)或其它类型的存储器装置。可由同一存储器装置或单独存储器装置提供视频数据存储器101及经解码图片缓冲器116。在各种实例中,视频数据存储器101可与视频编码器22的其它组件一起在芯片上,或相对于那些组件在芯片外。视频数据存储器101可与图1的存储媒体20相同或为图1的存储媒体20的部分。

视频编码器22接收视频数据。视频编码器22可编码视频数据的图片的切片中的每一ctu。ctu中的每一者可与相等大小的亮度译码树型块(ctb)及图片的对应ctb相关联。作为编码ctu的部分,预测处理单元100可执行分割以将ctu的ctb划分成逐渐较小的块。在一些实例中,视频编码器22可使用qtbt结构来分割块。较小块可为cu的译码块。举例来说,预测处理单元100可根据树型结构来分割与ctu相关联的ctb。根据本发明的一或多种技术,对于树型结构的每一深度级处的树型结构的每一相应非叶节点,对于相应非叶节点存在多个允许拆分图案,且对应于相应非叶节点的视频块根据多个允许拆分图案中的一者而分割成对应于相应非叶节点的子节点的视频块。

视频编码器22可编码ctu的cu以产生cu的经编码表示(即,经译码cu)。作为编码cu的部分,预测处理单元100可分割与cu的一或多个pu中的cu相关联的译码块。因此,每一pu可与亮度预测块及对应色度预测块相关联。视频编码器22及视频解码器30可支持具有各种大小的pu。如上文所指示,cu的大小可指cu的亮度译码块的大小,且pu的大小可指pu的亮度预测块的大小。假定特定cu的大小为2n×2n,那么视频编码器22及视频解码器30可支持用于帧内预测的2n×2n或n×n的pu大小,及用于帧间预测的2n×2n、2n×n、n×2n、n×n或相似者的对称pu大小。视频编码器22及视频解码器30还可支持用于帧间预测的2n×nu、2n×nd、nl×2n及nr×2n的pu大小的不对称分割。

帧间预测处理单元120可通过对cu的每一pu执行帧间预测来产生用于pu的预测性数据。用于pu的预测性数据可包含pu的预测性块及用于pu的运动信息。取决于pu在i切片中、在p切片中还是在b切片中,帧间预测处理单元120可针对cu的pu执行不同操作。在i切片中,所有pu被帧内预测。因此,如果pu在i切片中,那么帧间预测处理单元120不对pu执行帧间预测。因此,对于在i模式中编码的块,使用空间预测而从同一帧内的经先前编码的相邻块形成经预测块。如果pu在p切片中,那么帧间预测处理单元120可使用单向帧间预测以产生pu的预测性块。如果pu在b切片中,那么帧间预测处理单元120可使用单向或双向帧间预测以产生pu的预测性块。

帧内预测处理单元126可通过对pu执行帧内预测来产生用于pu的预测性数据。用于pu的预测性数据可包含pu的预测性块及各种语法元素。帧内预测处理单元126可对i切片、p切片及b切片中的pu执行帧内预测。

为了对pu执行帧内预测,帧内预测处理单元126可使用多个帧内预测模式以产生用于pu的多个预测性数据集合。帧内预测处理单元126可使用来自相邻pu的样本块的样本以产生用于pu的预测性块。对于pu、cu及ctu,假定从左到右、从上而下的编码次序,那么相邻pu可在pu上方、右上方、左上方或左边。帧内预测处理单元126可使用各种数目个帧内预测模式,例如,33个方向性帧内预测模式。在一些实例中,帧内预测模式的数目可取决于与pu相关联的区的大小。另外,如下文将参考图11更详细地所描述,帧内预测处理单元126可经配置以依据视频数据块的高度及/或宽度来确定用于编码视频数据块的pdpc参数。

预测处理单元100可从由帧间预测处理单元120产生的用于pu的预测性数据当中或从由帧内预测处理单元126产生的用于pu的预测性数据当中选择用于cu的pu的预测性数据。在一些实例中,预测处理单元100基于预测性数据集合的速率/失真度量来选择用于cu的pu的预测性数据。选定预测性数据的预测性块可在本文中被称作选定预测性块。

残余产生单元102可基于用于cu的译码块(例如,亮度、cb及cr译码块)及用于cu的pu的选定预测性块(例如,预测性亮度、cb及cr块)来产生用于cu的残余块(例如,亮度、cb及cr残余块)。举例来说,残余产生单元102可产生cu的残余块,使得残余块中的每一样本具有等于cu的译码块中的样本与cu的pu的对应选定预测性块中的对应样本之间的差的值。

变换处理单元104可执行四元树分割以将与cu相关联的残余块分割成与cu的tu相关联的变换块。因此,tu可与亮度变换块及两个色度变换块相关联。cu的tu的亮度及色度变换块的大小及位置可或可不基于cu的pu的预测块的大小及位置。被称为“残余四元树”(rqt)的四元树结构可包含与区中的每一者相关联的节点。cu的tu可对应于rqt的叶节点。

变换处理单元104可通过将一或多个变换应用于tu的变换块来产生用于cu的每一tu的变换系数块。变换处理单元104可将各种变换应用于与tu相关联的变换块。举例来说,变换处理单元104可将离散余弦变换(dct)、方向性变换或概念上相似变换应用于变换块。在一些实例中,变换处理单元104不将变换应用于变换块。在此类实例中,变换块可被视为变换系数块。

量化单元106可量化系数块中的变换系数。量化过程可缩减与变换系数中的一些或全部相关联的位深度。举例来说,n位变换系数可在量化期间被降值舍入到m位变换系数,其中n大于m。量化单元106可基于与cu相关联的量化参数(qp)值来量化与cu的tu相关联的系数块。视频编码器22可通过调整与cu相关联的qp值来调整应用于与cu相关联的系数块的量化程度。量化可引入信息损失。因此,经量化变换系数相比于原始变换系数可具有较低精确度。

反量化单元108及反变换处理单元110可分别将反量化及反变换应用于系数块,以从系数块重构残余块。重构单元112可将经重构残余块与来自由预测处理单元100产生的一或多个预测性块的对应样本相加以产生与tu相关联的经重构变换块。通过以此方式重构用于cu的每一tu的变换块,视频编码器22可重构cu的译码块。

滤波器单元114可执行一或多个解块操作以缩减与cu相关联的译码块中的块假影。在滤波器单元114对经重构译码块执行一或多个解块操作之后,经解码图片缓冲器116可存储经重构译码块。帧间预测处理单元120可使用含有经重构译码块的参考图片以对其它图片的pu执行帧间预测。另外,帧内预测处理单元126可使用经解码图片缓冲器116中的经重构译码块以对与cu相同的图片中的其它pu执行帧内预测。

熵编码单元118可从视频编码器22的其它功能组件接收数据。举例来说,熵编码单元118可从量化单元106接收系数块,且可从预测处理单元100接收语法元素。熵编码单元118可对数据执行一或多个熵编码操作以产生经熵编码数据。举例来说,熵编码单元118可对数据执行cabac操作、上下文自适应可变长度译码(cavlc)操作、可变到可变(v2v)长度译码操作、基于语法的上下文自适应二进制算术译码(sbac)操作、概率区间分割熵(pipe)译码操作、指数哥伦布(exponential-golomb)编码操作,或另一类型的熵编码操作。视频编码器22可输出包含由熵编码单元118产生的经熵编码数据的位流。举例来说,位流可包含表示用于cu的rqt的数据。

图8为绘示经配置以实施本发明的技术的实例视频解码器30的框图。图8是出于阐释的目的而被提供,且并不限制如本发明中广泛地示范及描述的技术。出于阐释的目的,本发明在hevc译码的上下文中描述视频解码器30。然而,本发明的技术可适用于其它译码标准或方法,包含允许非方形分割及/或独立亮度及色度分割的技术。

在图8的实例中,视频解码器30包含熵解码单元150、视频数据存储器151、预测处理单元152、反量化单元154、反变换处理单元156、重构单元158、滤波器单元160,及经解码图片缓冲器162。预测处理单元152包含运动补偿单元164及帧内预测处理单元166。在其它实例中,视频解码器30可包含更多、更少或不同的功能组件。

视频数据存储器151可存储待由视频解码器30的组件解码的经编码视频数据,诸如经编码视频位流。可例如从计算机可读媒体16(例如,从本地视频源(诸如相机))经由视频数据的有线或无线网络通信或通过存取物理数据存储媒体而获得存储在视频数据存储器151中的视频数据。视频数据存储器151可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(cpb)。经解码图片缓冲器162可为存储用于由视频解码器30在解码视频数据(例如,以帧内或帧间译码模式)时使用的参考视频数据的参考图片存储器。视频数据存储器151及经解码图片缓冲器162可由多种存储器装置中的任一者形成,诸如动态随机存取存储器(dram),包含同步dram(sdram)、磁阻式ram(mram)、电阻式ram(rram)或其它类型的存储器装置。可由同一存储器装置或单独存储器装置提供视频数据存储器151及经解码图片缓冲器162。在各种实例中,视频数据存储器151可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。视频数据存储器151可与图1的存储媒体28相同或为图1的存储媒体28的部分。

视频数据存储器151接收及存储位流的经编码视频数据(例如,nal单元)。熵解码单元150可从视频数据存储器151接收经编码视频数据(例如,nal单元),且可分析nal单元以获得语法元素。熵解码单元150可熵解码nal单元中的经熵编码语法元素。预测处理单元152、反量化单元154、反变换处理单元156、重构单元158及滤波器单元160可基于从位流提取的语法元素来产生经解码视频数据。熵解码单元150可执行与熵编码单元118的过程大体上互逆的过程。

根据本发明的一些实例,熵解码单元150可确定树型结构作为从位流获得语法元素的部分。树型结构可指定如何将初始视频块(诸如ctb)分割成较小视频块(诸如译码单元)。根据本发明的一或多种技术,对于树型结构的每一深度级处的树型结构的每一相应非叶节点,对于相应非叶节点存在多个允许拆分图案,且对应于相应非叶节点的视频块根据多个允许拆分图案中的一者而分割成对应于相应非叶节点的子节点的视频块。

另外,如下文将参考图10更详细地所阐释,视频解码器30可经配置以确定在存在对应于单一色度块的两个或多于两个亮度块的情形中如何再用经接收用于亮度块的译码模式信息以供在解码色度块时使用。

除了从位流获得语法元素以外,视频解码器30还可对未经分割cu执行重构操作。为了对cu执行重构操作,视频解码器30可对cu的每一tu执行重构操作。通过针对cu的每一tu执行重构操作,视频解码器30可重构cu的残余块。

作为对cu的tu执行重构操作的部分,反量化单元154可反量化(即,解量化)与tu相关联的系数块。在反量化单元154反量化系数块之后,反变换处理单元156可将一或多个反变换应用于系数块以便产生与tu相关联的残余块。举例来说,反变换处理单元156可将反dct、反整数变换、反卡洛南-洛伊(karhunen-loeve)变换(klt)、反旋转变换、反方向性变换或另一反变换应用于系数块。

如果使用帧内预测来编码pu,那么帧内预测处理单元166可执行帧内预测以产生pu的预测性块。帧内预测处理单元166可使用帧内预测模式以基于样本空间上相邻块来产生pu的预测性块。帧内预测处理单元166可基于从位流获得的一或多个语法元素来确定用于pu的帧内预测模式。另外,如下文将参考图12更详细地所描述,帧内预测处理单元166可经配置以依据视频数据块的高度及/或宽度来确定用于编码视频数据块的pdpc参数。

如果使用帧间预测来编码pu,那么熵解码单元150可确定用于pu的运动信息。运动补偿单元164可基于pu的运动信息来确定一或多个参考块。运动补偿单元164可基于一或多个参考块来产生用于pu的预测性块(例如,预测性亮度、cb及cr块)。

重构单元158可使用用于cu的tu的变换块(例如,亮度、cb及cr变换块)及cu的pu的预测性块(例如,亮度、cb及cr块)(即,在适用时为帧内预测数据或帧间预测数据)以重构用于cu的译码块(例如,亮度、cb及cr译码块)。举例来说,重构单元158可将变换块(例如,亮度、cb及cr变换块)的样本与预测性块(例如,亮度、cb及cr预测性块)的对应样本相加以重构cu的译码块(例如,亮度、cb及cr译码块)。

滤波器单元160可执行解块操作以缩减与cu的译码块相关联的块假影。视频解码器30可将cu的译码块存储在经解码图片缓冲器162中。经解码图片缓冲器162可提供参考图片以用于后续运动补偿、帧内预测及在显示装置(诸如图1的显示装置32)上的呈现。举例来说,视频解码器30可基于经解码图片缓冲器162中的块而针对其它cu的pu执行帧内预测或帧间预测操作。

图9为绘示根据本发明的技术的视频译码器的实例操作的流程图。视频译码器可为视频编码器22及/或视频解码器30。根据本发明的技术,编码器22及/或视频解码器30可经配置以进行以下操作:将视频数据分割成亮度分量的分割区(200);将视频数据分割成色度分量的分割区,其中色度分量是独立于亮度分量被分割(202);译码亮度分量的第一分割区(204);译码指示与译码亮度分量的第一分割区相关联的信息是否待用于译码色度分量的第二分割区的语法元素(206);及根据语法元素来译码色度分量的第二分割区(208)。

图10为绘示根据本发明的技术的视频解码器的实例操作的流程图。图10的技术可由视频解码器30的一或多个硬件结构执行。

在本发明的一个实例中,视频解码器30可经配置以接收经编码视频数据的位流,经编码视频数据表示经分割亮度块及经分割色度块,其中色度块是独立于亮度块被分割(212)。视频解码器30可经进一步配置以确定对应于相应经分割亮度块的相应译码模式(214),及根据经确定相应译码模式来解码相应经分割亮度块(216)。

视频解码器30可经进一步配置以解码指示与相应经分割亮度块相关联的相应译码模式待用于解码第一经分割色度块的第一语法元素,其中第一经分割色度块与两个或多于两个经分割亮度块对准(218)。视频解码器30可进一步根据两个或多于两个经分割亮度块的相应译码模式的函数而为第一经分割色度块确定色度译码模式(220),及根据经确定色度译码模式来解码第一经分割色度块(222)。

在本发明的一个实例中,色度块是独立于亮度块被分割,使得至少一个经分割色度块不与单一经分割亮度块对准。

在本发明的另一实例中,为了确定对应于相应经分割亮度块的相应译码模式,视频解码器30可经进一步配置以进行以下操作:接收对应于相应经分割亮度块的第二语法元素,第二语法元素指示相应译码模式;及解码对应于相应经分割亮度块的第二语法元素以确定相应译码模式。

在本发明的另一实例中,为了确定对应于相应经分割亮度块的相应译码模式,视频解码器30经进一步配置以从相应经分割亮度块的一或多个代表性位置选择一或多个相应译码模式。在另一实例中,视频解码器30经配置以根据函数来选择一或多个相应译码模式。

在另一实例中,一或多个代表性位置包含相应经分割亮度块的中心代表性位置,且其中为了根据函数而为第一经分割色度块确定色度译码模式,视频解码器30经进一步配置以获得经存储用于中心代表性位置的指示经确定相应译码模式的信息。

在另一实例中,一或多个代表性位置包含相应经分割亮度块的拐角代表性位置,且其中为了根据函数而为第一经分割色度块确定色度译码模式,视频解码器30经进一步配置以获得经存储用于拐角代表性位置的指示经确定相应译码模式的信息。在一个实例中,一或多个代表性位置包括一或多个子块。

在本发明的另一实例中,视频解码器30可经进一步配置以将相应经分割亮度块划分成相应子块,及将指示经确定相应译码模式的信息存储在与相应子块相关联的相应存储器位置中。

在本发明的另一实例中,函数包含两个或多于两个经分割亮度块的一或多个相应子块的位置。在本发明的另一实例中,一或多个相应子块的位置为两个或多于两个经分割亮度块的中心子块,且其中为了根据函数而为第一经分割色度块确定色度译码模式,视频解码器30经配置以获得经存储用于中心子块的指示经确定相应译码模式的信息。

在本发明的另一实例中,一或多个相应子块的位置为多于两个经分割亮度块的拐角子块,且其中为了根据函数而为第一经分割色度块确定色度译码模式,视频解码器30经配置以获得经存储用于拐角子块的指示经确定相应译码模式的信息。

在本发明的另一实例中,函数包含与相应子块相关联的相应存储器位置中指示经确定相应译码模式的信息的统计分析。

在本发明的另一实例中,为了根据函数而为第一经分割色度块确定色度译码模式,视频解码器30经进一步配置以使用梯度或高阶导数中的一者来分析存储在相应存储器位置中的信息。

在本发明的另一实例中,信息包含以下各者中的一或多者:用于色度预测的直接模式的指示、预测方向、运动信息、用于位置相依帧内预测组合模式的旗标、用于位置相依帧内预测组合模式的一或多个参数、用于非可分离变换的一或多个第二变换集、增强型多重变换、自适应多重变换,或用于确定熵译码数据模型的一或多个上下文。

在本发明的另一实例中,视频解码器30可经配置以接收指示函数的第三语法元素。

在本发明的另一实例中,视频解码器30为无线通信装置的部分,无线通信装置进一步包括经配置以接收经编码视频数据的位流的接收器。在一个实例中,无线通信装置为移动站,且经编码视频数据的位流是由接收器接收且根据蜂窝式通信标准予以调制。

图11为绘示根据本发明的技术的视频编码器22的实例操作的流程图。图12的技术可由视频编码器22的一或多个硬件结构执行。

在本发明的一个实例中,视频编码器22可经配置以进行以下操作:接收视频数据块,视频数据块具有由宽度及高度界定的非方形形状(230);基于视频数据块的宽度或高度中的一或多者来确定一或多个pdpc参数(232);及使用pdpc模式及经确定pdpc参数来编码视频数据块(234)。如上文所论述,应理解,图11的技术可用于确定用于使用非方形块的任何预测模式的预测模式参数,所述预测模式包含根据样本位置将加权平均值应用于预测值及参考样本的预测模式。

在一个实例中,一或多个pdpc参数包含一或多个水平相关pdpc参数及一或多个垂直相关pdpc参数,且其中为了确定一或多个pdpc参数,视频编码器22经进一步配置以基于视频数据块的宽度来确定一或多个水平相关pdpc参数,及基于视频数据块的高度来确定一多个垂直相关pdpc参数。

在本发明的另一实例中,为了确定一或多个水平相关pdpc参数,视频编码器22经进一步配置以依据视频数据块的宽度来检索一或多个查找表的一或多个条目,且其中为了确定一或多个垂直相关pdpc参数,视频编码器22经进一步配置以依据视频数据块的高度来检索一或多个查找表的一或多个条目。

在本发明的另一实例中,为了依据视频数据块的宽度来检索一或多个查找表的一或多个条目,视频编码器22经进一步配置以进行以下操作:基于视频数据块的宽度而在第一查找表中检索第一索引,第一索引指向第二查找表中的第一条目;及基于经检索第一索引而在第二查找表中检索一或多个水平相关pdpc参数。在另外实例中,为了依据视频数据块的高度来检索一或多个查找表的一或多个条目,视频编码器22经进一步配置以进行以下操作:基于视频数据块的高度而在第一查找表中检索第二索引,第二索引指向第二查找表中的第二条目;及基于经检索第二索引而在第二查找表中检索一或多个垂直相关pdpc参数。

在本发明的另一实例中,一或多个pdpc参数包含不水平相关且不垂直相关的一或多个非方向性pdpc参数,且其中为了确定一或多个pdpc参数,视频编码器22经进一步配置以基于视频数据块的宽度及高度的函数来确定一或多个非方向性pdpc参数。

在本发明的另一实例中,函数为以下各者中的一或多者:视频数据块的宽度及高度的最小值、视频数据块的宽度及高度的最大值,或视频数据块的宽度及高度的加权平均值。在另外实例中,为了确定一或多个非方向性pdpc参数,视频编码器22经进一步配置以依据视频数据块的宽度及高度来存取一或多个查找表的一或多个条目。

在本发明的另一实例中,视频编码器22包含在无线通信装置中,无线通信装置进一步包括经配置以发射经编码视频数据块的发射器。在另一实例中,无线通信装置为移动站,且经编码视频数据块是由发射器发射且根据蜂窝式通信标准予以调制。

图12为绘示根据本发明的技术的视频解码器30的实例操作的流程图。图12的技术可由视频解码器30的一或多个硬件结构执行。

在本发明的一个实例中,视频解码器30经配置以进行以下操作:接收使用pdpc模式而编码的视频数据块,视频数据块具有由宽度及高度界定的非方形形状(240);基于视频数据块的宽度或高度中的一或多者来确定一或多个pdpc参数(242);及使用pdpc模式及经确定pdpc参数来解码视频数据块(244)。如上文所论述,应理解,图12的技术可用于确定用于使用非方形块的任何预测模式的预测模式参数,所述预测模式包含根据样本位置将加权平均值应用于预测值及参考样本的预测模式。

在本发明的一个实例中,一或多个pdpc参数包含一或多个水平相关pdpc参数及一或多个垂直相关pdpc参数,且其中为了确定一或多个pdpc参数,视频解码器30经进一步配置以基于视频数据块的宽度来确定一或多个水平相关pdpc参数,及基于视频数据块的高度来确定一或多个垂直相关pdpc参数。

在本发明的另一实例中,为了确定一或多个水平相关pdpc参数,视频解码器30经进一步配置以依据视频数据块的宽度来检索一或多个查找表的一或多个条目,且其中为了确定一或多个垂直相关pdpc参数,视频解码器30经进一步配置以依据视频数据块的高度来检索一或多个查找表的一或多个条目。

在本发明的另一实例中,为了依据视频数据块的宽度来检索一或多个查找表的一或多个条目,视频解码器30经进一步配置以进行以下操作:基于视频数据块的宽度而在第一查找表中检索第一索引,第一索引指向第二查找表中的第一条目;及基于经检索第一索引而在第二查找表中检索一或多个水平相关pdpc参数。在另外实例中,为了依据视频数据块的高度来检索一或多个查找表的一或多个条目,视频解码器30经进一步配置以进行以下操作:基于视频数据块的高度而在第一查找表中检索第二索引,第二索引指向第二查找表中的第二条目;及基于经检索第二索引而在第二查找表中检索一或多个垂直相关pdpc参数。

在另一实例中,一或多个pdpc参数包含不水平相关且不垂直相关的一或多个非方向性pdpc参数,且其中为了确定一或多个pdpc参数,视频解码器30经进一步配置以基于视频数据块的宽度及高度的函数来确定一或多个非方向性pdpc参数。

在另一实例中,函数为以下各者中的一或多者:视频数据块的宽度及高度的最小值、视频数据块的宽度及高度的最大值,或视频数据块的宽度及高度的加权平均值。

在本发明的另一实例中,为了确定一或多个非方向性pdpc参数,视频解码器30经进一步配置以依据视频数据块的宽度及高度来存取一或多个查找表的一或多个条目。

在本发明的另一实例中,视频解码器30为无线通信装置的部分,无线通信装置进一步包括经配置以接收视频数据块的接收器。在另一实例中,无线通信装置为移动站,且视频数据块是由接收器接收且根据蜂窝式通信标准予以调制。

已出于说明的目的而关于hevc标准的扩展来描述本发明的某些方面。然而,本发明中所描述的技术可有用于其它视频译码过程,包含在开发中或尚未开发的其它标准或专有视频译码过程。

如本发明中所描述的视频译码器可指视频编码器或视频解码器。相似地,视频译码单元可指视频编码器或视频解码器。同样地,在适用时,视频译码可指视频编码或视频解码。

应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可以不同序列被执行、可被添加、合并或完全省去(例如,并非所有所描述动作或事件对于所述技术的实践是必要的)。此外,在某些实例中,可同时地(例如,经由多线程处理、中断处理或多个处理器)而非依序地执行动作或事件。

在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合予以实施。如果以软件予以实施,那么所述功能可作为一或多个指令或代码而存储在计算机可读媒体上或经由计算机可读媒体进行发射,且由基于硬件的处理单元执行。计算机可读媒体可包含:计算机可读存储媒体,其对应于有形媒体,诸如数据存储媒体;或通信媒体,其包含促进将计算机程序从一处传送到另一处(例如,根据通信协议)的任何媒体。以此方式,计算机可读媒体通常可对应于(1)为非暂时性的有形计算机可读存储媒体,或(2)诸如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索指令、代码及/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。

作为实例而非限制,此类计算机可读存储媒体可包括ram、rom、eeprom、cd-rom或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、闪速存储器,或可用以存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。此外,任何连接被适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字订户线(dsl)或无线技术(诸如红外线、无线电及微波)而从网站、服务器或其它远程源发射指令,那么同轴电缆、光缆、双绞线、dsl或无线技术(诸如红外线、无线电及微波)包含在媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是涉及非暂时性有形存储媒体。如本文中所使用,磁盘及光盘包含压缩光盘(cd)、激光光盘、光学光盘、数字多功能光盘(dvd)、软盘及蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘运用激光以光学方式再现数据。以上各者的组合也应包含在计算机可读媒体的范围内。

可由诸如一或多个数字信号处理器(dsp)、通用微处理器、专用集成电路(asic)、现场可编程逻辑阵列(fpga)或其它等效集成或离散逻辑电路系统的一或多个处理器执行指令。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可提供在经配置用于编码及解码的专用硬件及/或软件模块内,或结合在组合式编解码器中。此外,所述技术可完全地实施在一或多个电路或逻辑元件中。

本发明的技术可实施在多种装置或设备中,所述装置或设备包含无线手机、集成电路(ic)或ic集合(例如,芯片集)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必要求由不同硬件单元来实现。更确切地说,如上文所描述,各种单元可组合在编解码器硬件单元中,或由互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合合适的软件及/或固件而提供。

已描述了各种实例。这些及其它实例在所附权利要求书的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1