具有联合像素/变换为基础的量化的视频译码的量化参数控制的制作方法

文档序号:21699535发布日期:2020-07-31 23:00阅读:153来源:国知局
本申请案请求2018年12月18日提交的美国申请案第16/224,320号的优先权,所述申请案请求2017年12月19日提交的美国临时申请案62/607,887的权益,以上所列申请案中的每一者的全部内容以引用的方式并入。本发明涉及视频编码及视频解码。
背景技术
::数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(pda)、膝上型或台式计算机、平板电脑、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频流式传输装置及其类似者。数字视频装置实施视频压缩技术,例如,由mpeg-2、mpeg-4、itu-th.263、itu-th.264/mpeg-4第10部分高级视频译码(avc)定义的标准、最近定案的高效视频译码(hevc)标准及这些标准的扩展中所描述的技术。视频装置可通过实施这些视频压缩技术而更有效地发射、接收、编码、解码及/或存储数字视频信息。视频压缩技术执行空间(图片内)预测及/或时间(图片间)预测来减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(即,视频帧或视频帧的一部分)分割成视频块,其也可被称作树型块、译码单元(cu)及/或译码节点。图片的经帧内译码(i)切片中的视频块是使用关于同一图片中的邻近块中的参考样本的空间预测来编码的。图片的经帧间译码(p或b)切片中的视频块可使用关于同一图片中的邻近块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。空间或时间预测产生用于待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。经帧间译码块根据指向形成预测性块的参考样本的块的运动向量来编码,且残余数据指示经译码块与预测性块之间的差异。经帧内译码块根据帧内译码模式及残余数据编码。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,随后可量化残余变换系数。可扫描最初布置成二维阵列的经量化变换系数以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。技术实现要素:本发明的一或多个方面涉及用高动态范围(hdr)及广色域(wcg)表示对视频信号,例如视频数据进行译码的领域。根据一个实例,一种用于处理高动态范围及/或广色域(hdr/wcg)视频数据的方法包含:确定用于所述hdr/wcg视频数据的块的经量化变换系数的量化参数;基于所述经确定量化参数对所述经量化变换系数进行逆量化以确定经解量化变换系数;基于所述经解量化变换系数,确定所述hdr/wcg视频数据的所述块的残余值块;基于所述残余值块,确定所述hdr/wcg视频数据的所述块的经重建块;确定用于所述hdr/wcg视频数据的所述块的一或多个动态范围调整(dra)参数;基于所述经确定量化参数调整所述一或多个dra参数以确定一或多个经调整dra参数;及使用所述一或多个经调整dra参数对所述hdr/wcg视频数据的所述经重建块执行dra。根据另一实例,一种用于处理高动态范围及/或广色域(hdr/wcg)视频数据的装置包含:存储器,其经配置以存储视频数据;及一或多个处理器,其耦合到所述存储器且经配置以:确定用于所述hdr/wcg视频数据的块的经量化变换系数的量化参数;基于所述经确定量化参数对所述经量化变换系数进行逆量化以确定经解量化变换系数;基于所述经解量化变换系数,确定所述hdr/wcg视频数据的所述块的残余值块;基于所述残余值块,确定所述hdr/wcg视频数据的所述块的经重建块;确定用于所述hdr/wcg视频数据的所述块的一或多个动态范围调整(dra)参数;基于所述经确定量化参数调整所述一或多个dra参数以确定一或多个经调整dra参数;及使用所述一或多个经调整dra参数对所述hdr/wcg视频数据的所述经重建块执行dra。根据另一实例,一种计算机可读媒体存储在由一或多个处理器执行时使得所述一或多个处理器进行以下操作的指令:确定用于所述高动态范围及/或广色域(hdr/wcg)视频数据的块的经量化变换系数的量化参数;基于所述经确定量化参数对所述经量化变换系数进行逆量化以确定经解量化变换系数;基于所述经解量化变换系数,确定所述hdr/wcg视频数据的所述块的残余值块;基于所述残余值块,确定所述hdr/wcg视频数据的所述块的经重建块;确定用于所述hdr/wcg视频数据的所述块的一或多个动态范围调整(dra)参数;基于所述经确定量化参数调整所述一或多个dra参数以确定一或多个经调整dra参数;及使用所述一或多个经调整dra参数对所述hdr/wcg视频数据的所述经重建块执行dra。根据另一实例,一种用于处理高动态范围及/或广色域(hdr/wcg)视频数据的设备包含:用于确定用于所述hdr/wcg视频数据的块的经量化变换系数的量化参数的装置;用于基于所述经确定量化参数对所述经量化变换系数进行逆量化以确定经解量化变换系数的装置;用于基于所述经解量化变换系数确定所述hdr/wcg视频数据的所述块的残余值块的装置;用于基于所述残余值块确定所述hdr/wcg视频数据的所述块的经重建块的装置;用于确定用于所述hdr/wcg视频数据的所述块的一或多个动态范围调整(dra)参数的装置;用于基于所述经确定量化参数调整所述一或多个dra参数以确定一或多个经调整dra参数的装置;及用于使用所述一或多个经调整dra参数对所述hdr/wcg视频数据的所述经重建块执行dra的装置。在附图及以下描述中阐述本发明的一或多个实例的细节。其它特征、目标及优点将从实施方式、图式及权利要求书显而易见。附图说明图1为说明可利用本发明中所描述的技术的实例视频编码及解码系统的框图。图2为说明hdr数据的概念的概念图。图3为说明实例色域的概念图。图4为说明hdr/wcg表示转换的实例的流程图。图5为说明hdr/wcg逆转换的实例的流程图。图6为说明用于从感知上均匀的码层级到线性明度的视频数据转换(包含sdr及hdr)的电光转移函数(eotf)的实例的概念图。图7展示pqtf(st2084eotf)的实例观测。图8展示lcs函数的实例。图9展示具有dra的视频译码系统的实例。图10为说明可实施本发明中所描述的技术的实例视频编码器的框图。图11为说明可实施本发明中所描述的技术的实例视频解码器的框图。图12为说明根据本发明的技术的用于解码视频数据的视频解码器的实例操作的流程图。具体实施方式本发明描述与使用高动态范围(hdr)及广色域(wcg)表示对视频信号进行译码的领域相关的技术。更具体地说,本发明描述应用于某些色彩空间中的视频数据以实现hdr及wcg视频数据的更有效压缩的传信及操作。本发明的技术可改进用于对hdr及wcg视频数据进行译码的混合型视频译码系统的压缩效率。如将在下文更详细地解释,hdr视频一般指代动态范围大于标准动态范围(sdr)视频的动态范围的视频。wcg一般指代用可包含更鲜明色彩(例如更红的红色、更绿的绿色、更蓝的蓝色等)的更宽色域表示的视频。hdr及wcg均可使视频看起来更逼真。虽然使视频看起来更逼真,但hdr及wcg也可增加与编码及解码视频数据相关联的复杂度。本发明的技术可帮助降低与编码及解码hdr及wcg视频数据相关联的复杂度,且更具体地说,可通过协调在量化变换系数时在变换域中执行的量化与在执行动态范围调整(dra)时在像素域中执行的缩放及量化来降低与编码及解码hdr及wcg视频数据相关联的复杂度。图1为说明可处理hdr/wcg视频数据且利用本发明中所描述的dra技术的实例视频编码及解码系统10的框图。如图1中所展示,系统10包含源装置12,其提供稍后将由目的地装置14解码的经编码视频数据。特定地说,源装置12通过计算机可读媒体16将视频数据提供到目的地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含台式计算机、笔记型计算机(即,膝上型计算机)、平板电脑、机顶盒、例如所谓的“智能”电话的电话手机、所谓的“智能”平板、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似者。在一些情况下,源装置12及目的地装置14可经装备以用于无线通信。目的地装置14可通过计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括任何类型的能够将经编码视频数据从源装置12移动到目的地装置14的媒体或装置。在一个实例中,计算机可读媒体16可包括使得源装置12能够实时将经编码视频数据直接发射到目的地装置14的通信媒体。经编码视频数据可根据通信标准(例如有线或无线通信协议)进行调制,且发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(rf)频谱或一或多个物理发射线。通信媒体可形成基于包的网络(例如,局域网、广域网或例如因特网的全域网络)的部分。通信媒体可包含路由器、交换器、基站或可用于促进从源装置12到目的地装置14的通信的任何其它设备。在其它实例中,计算机可读媒体16可包含非暂时性存储媒体,例如硬盘、闪存驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未展示)可例如通过网络发射从源装置12接收经编码视频数据且将经编码视频数据提供到目的地装置14。类似地,例如光盘冲压设施的媒体生产设施的计算装置可从源装置12接收经编码视频数据且生产含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体16可理解为包含各种形式的一或多个计算机可读媒体。在一些实例中,经编码数据可从输出接口22输出到存储装置。类似地,经编码数据可通过输入接口从存储装置存取。存储装置可包含多种分布式或本地存取的数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、dvd、cd-rom、闪存存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可通过流式传输或下载从存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、ftp服务器、网络附接存储(nas)装置或本地磁盘驱动器。目的地装置14可通过任何标准数据连接(包含因特网连接)而存取经编码视频数据。这可包含无线通道(例如,wi-fi连接)、有线连接(例如,dsl、有线电视调制解调器等)或适用于存取存储于文件服务器上的经编码视频数据的两者的组合。经编码视频数据从存储装置的发射可为流式传输发射、下载发射或其组合。本发明的技术不必限于无线应用或设定。所述技术可应用于支持多种多媒体应用中的任一者的视频译码,所述多媒体应用例如空中电视广播、有线电视发射、卫星电视发射、因特网流式传输视频发射(例如,http动态适应性流式传输(dash))、经编码到数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射,从而支持例如视频流式传输、视频播放、视频广播及/或视频电话的应用。在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。目的地装置14包含输入接口28、预处理单元19、视频解码器30及显示装置32。根据本发明,源装置12的预处理单元19可经配置以实施本发明的技术,包含应用于某些色彩空间中的视频数据以实现hdr及wcg视频数据的更有效压缩的传信及相关操作。在一些实例中,预处理单元19可与视频编码器20分离。在其它实例中,预处理单元19可为视频编码器20的部分。在其它实例中,源装置及目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如,外部相机)接收视频数据。同样地,目的地装置14可与外部显示装置介接,而非包含集成式显示装置。图1的所说明系统10仅为一个实例。用于对hdr及wcg视频数据进行处理及译码的技术可由任何数字视频编码及/或视频解码装置执行。此外,本发明的技术也可由视频预处理器及/或视频后处理器执行。视频预处理器可为经配置以在编码(例如,在hevc或其它编码)之前对视频数据进行处理的任何装置。视频后处理器可为经配置以在解码(例如,在hevc或其它解码)之后对视频数据进行处理的任何装置。源装置12及目的地装置14仅为源装置12产生经译码视频数据以供发射到目的地装置14的这类译码装置的实例。在一些实例中,装置12、14可以大体上对称的方式操作,使得装置12、14中的每一者包含视频编码及解码组件,以及视频预处理器及视频后处理器(例如,分别为预处理单元及后处理单元31)。因此,系统10可支持视频装置12、14之间的单向或双向视频发射以用于例如视频流式传输、视频播放、视频广播或视频电话。源装置12的视频源18可包含视频捕捉装置,例如摄像机、含有先前捕捉的视频的视频存档及/或用以从视频内容提供者接收视频的视频馈送接口。作为另一替代,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、存档视频及计算机产生的视频的组合。在一些情况下,如果视频源18为摄像机,那么源装置12及目的地装置14可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术可适用于视频译码及视频处理,一般来说,且可应用于无线及/或有线应用。在各种情况下,可由视频编码器20编码所捕捉、经预先捕捉或计算机产生的视频。经编码视频信息随后可通过输出接口22输出到计算机可读媒体16上。目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息(其也供视频解码器30使用),所述语法信息包含描述块及其它经经译码单元(例如,图片群组(gop))的特征及/或处理的语法元素。显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如阴极射线管(crt)、液晶显示器(lcd)、等离子体显示器、有机发光二极管(oled)显示器或另一类型的显示装置。视频编码器20及视频解码器30可各自实施为多种合适编码器或编码器电路中的任一者,例如,一或多个微处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分实施于软件中时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器执行所述指令,从而执行本发明的技术。视频编码器20及视频解码器30中的每一者可包含在一或多个编码器或解码器中,编码器或解码器中的任一者可集成为各别装置中的组合式编码器/解码器(编码解码器(codec))的部分。预处理单元19及后处理单元31可各自实施为多种合适的编码器电路中的任一者,例如一或多个微处理器、dsp、asic、fpga、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分实施于软件中时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器执行所述指令,从而执行本发明的技术。视频编码器20及视频解码器30可根据视频压缩标准(例如,最近定案的高效视频译码(hevc)标准)来操作,且可符合hevc测试模型(hm)。视频编码器20及视频解码器30可另外根据hevc扩展(例如范围扩展、多视图扩展(mv-hevc),或已由视频译码联合合作小组(jct-vc)以及itu-t视频译码专家组(vceg)及iso/iec动画专家组(mpeg)的3d视频译码扩展开发联合合作小组(jct-3v)开发的可缩放扩展(shvc))来操作。视频编码器20及视频解码器30也可根据其它专有或行业标准(例如itu-th.264标准,被替代地称作iso/iecmpeg-4第10部分高级视频译码(avc))或这些标准的扩展(例如可缩放视频译码(svc)及多视图视频译码(mvc)扩展)来操作。然而,本发明的技术不限于任何特定译码标准。视频压缩标准的其它实例包含itu-th.261、iso/iecmpeg-1visual、itu-th.262或iso/iecmpeg-2visual、itu-th.263及iso/iecmpeg-4visual。itu-tvceg(q6/16)及iso/iecmpeg(jtc1/sc29/wg11)现正研究对于将具有显著超过当前hevc标准(包含其当前扩展及针对屏幕内容译码及高动态范围译码的近期扩展)的压缩能力的未来视频译码技术标准化的潜在需要。所述群组一起从事于的联合合作工作中的这种探索活动(被称为联合视频探索小组(jvet))以评估所提出的压缩技术设计。jvet在2015年10月19日到21日期间第一次会面且开发了被称作联合探索模型(jem)的参考软件的若干不同版本。这些参考软件的一个实例被称为jem7且描述于j.chen、e.alshina、g.j.sullivan、j.-r.ohm、j.boyce,“联合探索测试模型7的算法描述(algorithmdescriptionofjointexplorationtestmodel7)”,jvet-g1001,2017年7月13日到21日。基于itu-tvceg(q6/16)及iso/iecmpeg(jtc1/sc29/wg11)的工作,被称作通用视频译码(vvc)标准的新视频译码标准正由vceg及mpeg的联合视频专家小组(jvet)开发。vvc的早期草案可在文件jvet-j1001“通用视频译码(草案1)”中获得且其算法描述可在文件jvet-j1002“关于通用视频译码及测试模型1(vtm1)的算法描述(algorithmdescriptionforversatilevideocodingandtestmodel1(vtm1))”中获得。vvc的另一早期草案可在文件jvet-l1001“通用视频译码(草案3)”中获得且其算法描述可在文件jvet-l1002“关于通用视频译码及测试模型3(vtm3)的算法描述(algorithmdescriptionforversatilevideocodingandtestmodel3(vtm3))”中获得。本发明的技术可利用hevc术语,以易于解释。然而,不应假定本发明的技术受限于hevc,而实际上,明确预期本发明的技术可实施于hevc的后续标准及其扩展中。在hevc及其它视频实例译码标准中,视频序列可包含一系列图片。图片也可被称作“帧”。图片可包含三个样本阵列,标示为sl、scb及scr。sl为明度样本的二维阵列(即,块)。scb为cb彩度样本的二维阵列。scr为cr彩度样本的二维阵列。彩度样本也可在本文中被称作“色度(chroma)”样本。在其它情况下,图片可为单色的且可仅包含明度样本阵列。视频编码器20可产生一组译码树单元(ctu)。ctu中的每一者可包括明度样本的译码树型块、色度样本的两个对应译码树型块,及用以对所述译码树型块的样本进行译码的语法结构。在单色图片或具有三个单独色彩平面的图片中,ctu可包括单一译码树型块及用于对所述译码树型块的样本进行译码的语法结构。译码树型块可为样本的n×n块。ctu也可被称作“树型块”或“最大译码单元(lcu)”。hevc的ctu可大致类似于例如h.264/avc的其它视频译码标准的宏块。然而,ctu未必限于特定大小,且可包含一或多个译码单元(cu)。切片可包含在光栅扫描中连续排序的整数数目个ctu。本发明可使用术语“视频单元”或“视频块”以指代样本的一或多个块,及用于对一或多个样本块的样本进行译码的语法结构。视频单元的实例类型可包含hevc中的ctu、cu、pu、变换单元(tu),或其它视频译码标准中的宏块、宏块分割区等等。为产生经译码ctu,视频编码器20可对ctu的译码树型块递归地执行四叉树分割,以将译码树型块划分成译码块,之后命名为“译码树型单元”。译码块为样本的n×n块。cu可包括具有明度样本阵列、cb样本阵列及cr样本阵列的图片的明度样本的译码块及色度样本的两个对应的译码块,及用于对所述译码块的样本进行译码的语法结构。在单色图片或具有三个单独色彩平面的图片中,cu可包括单一译码块及用以对所述译码块的样本进行译码的语法结构。视频编码器20可将cu的译码块分割成一或多个预测块。预测块可为应用相同预测的样本的矩形(即,正方形或非正方形)块。cu的预测单元(pu)可包括图片的明度样本的预测块、图片的色度样本的两个对应的预测块及用以对预测块样本进行预测的语法结构。在单色图片或具有三个单独色彩平面的图片中,pu可包括单一预测块,及用以对预测块样本进行预测的语法结构。视频编码器20可针对cu的每一pu的明度、cb及cr预测块产生预测性明度、cb及cr块。视频编码器20可使用帧内预测或帧间预测来产生pu的预测性块。如果视频编码器20使用帧内预测产生pu的预测性块,那么视频编码器20可基于与pu相关联的图片的经解码样本产生pu的预测性块。如果视频编码器20使用帧间预测来产生pu的预测性块,那么视频编码器20可基于不同于与pu相关联的图片的一或多个图片的经解码样本而产生pu的预测性块。帧间预测可为单向帧间预测(即,单向预测)或双向帧间预测(即,双向预测)。为执行单向预测或双向预测,视频编码器20可产生当前切片的第一参考图片列表(refpiclist0)及第二参考图片列表(refpiclist1)。参考图片列表中的每一者可包含一或多个参考图片。当使用单向预测时,视频编码器20可搜索refpiclist0及refpiclist1中的任一者或两者中的参考图片,以确定参考图片内的参考位置。此外,当使用单向预测时,视频编码器20可至少部分基于对应于参考位置的样本产生pu的预测性样本块。此外,当使用单向预测时,视频编码器20可产生指示pu的预测块与参考位置之间的空间位移的单一运动向量。为了指示pu的预测块与参考位置之间的空间位移,运动向量可包含指定pu的预测块与参考位置之间的水平位移的水平分量且可包含指定pu的预测块与参考位置之间的垂直位移的垂直分量。当使用双向预测来编码pu时,视频编码器20可确定refpiclist0中的参考图片中的第一参考位置及refpiclist1中的参考图片中的第二参考位置。视频编码器20随后可至少部分基于对应于第一及第二参考位置的样本而产生pu的预测性块。此外,当使用双向预测编码pu时,视频编码器20可产生指示pu的样本块与第一参考位置之间的空间位移的第一运动,及指示pu的预测块与第二参考位置之间的空间位移的第二运动。在视频编码器20产生cu的一或多个pu的预测性明度、cb及cr块之后,视频编码器20可产生cu的明度残余块。cu的明度残余块中的每一样本指示cu的预测性明度块中的一者中的明度样本与cu的原始明度译码块中的对应样本之间的差异。另外,视频编码器20可产生cu的cb残余块。cu的cb残余块中的每一样本可指示cu的预测性cb块中的一者中的cb样本与cu的原始cb译码块中的对应样本之间的差异。视频编码器20也可产生cu的cr残余块。cu的cr残余块中的每一样本可指示cu的预测性cr块中的一者中的cr样本与cu的原始cr译码块中的对应样本之间的差异。此外,视频编码器20可使用四叉树分割将cu的明度、cb及cr残余块分解成一或多个明度、cb及cr变换块。变换块可为对其应用相同变换的样本的矩形块。cu的变换单元(tu)可包括明度样本的变换块、色度样本的两个对应变换块及用以对变换块样本进行变换的语法结构。在单色图片或具有三个单独色彩平面的图片中,tu可包括单一变换块,及用以对变换块样本进行变换的语法结构。因此,cu的每一tu可与明度变换块、cb变换块及cr变换块相关联。与tu相关联的明度变换块可为cu的明度残余块的子块。cb变换块可为cu的cb残余块的子块。cr变换块可为cu的cr残余块的子块。视频编码器20可将一或多个变换应用于tu的明度变换块以产生tu的明度系数块。系数块可为变换系数的二维阵列。变换系数可为纯量。视频编码器20可将一或多个变换应用于tu的cb变换块以产生tu的cb系数块。视频编码器20可将一或多个变换应用于tu的cr变换块以产生用于tu的cr系数块。在jem7中,可使用四叉树二叉树(qtbt)分割结构而非使用上文所描述的hevc的四叉树分割结构。qtbt结构去除多个分割区类型的概念。即,qtbt结构去除cu、pu及tu概念的分离,且支持cu分割区形状的更大灵活性。在qtbt块结构中,cu可具有正方形或矩形形状。在一个实例中,cu为按四叉树结构的第一分割区。四叉树叶节点通过二叉树结构进一步分割。在一些实例中,存在两种拆分类型:对称水平拆分及对称竖直拆分。二叉树叶节点被称作cu,且所述分段(即,cu)用于预测及变换处理而无需任何进一步分割。这意味着cu、pu及tu在qtbt译码块结构中具有相同块大小。在jem中,cu有时由具有不同色彩分量的译码块(cb)组成。举例来说,在4:2:0色度格式的p及b切片的情况下,一个cu含有一个明度cb及两个色度cb,且有时由具有单一分量的cb组成。举例来说,在i切片的情况下,一个cu含有仅一个明度cb或仅两个色度cb。在产生系数块(例如,明度系数块、cb系数块或cr系数块)之后,视频编码器20可量化系数块。量化一般指代变换系数经量化以可能减少用以表示变换系数的数据的量从而提供进一步压缩的过程。此外,视频编码器20可对变换系数进行逆量化,且将逆变换应用于变换系数,以便重建图片的cu的tu的变换块。视频编码器20可使用cu的tu的经重建变换块及cu的pu的预测性块来重建cu的译码块。通过重建图片的每一cu的译码块,视频编码器20可重建图片。视频编码器20可将经重建图片存储于经解码图片缓冲器(dpb)中。视频编码器20可将dpb中的经重建图片用于帧间预测及帧内预测。在视频编码器20量化系数块之后,视频编码器20可熵编码指示经量化变换系数的语法元素。举例来说,视频编码器20可对指示经量化变换系数的语法元素执行上下文适应性二进制算术译码(cabac)。视频编码器20可在位流中输出经熵编码的语法元素。视频编码器20可输出包含形成经译码图片及相关联数据的表示的位序列的位流。所述位流可包括网络抽象层(nal)单元的序列。nal单元中的每一者包含nal单元标头,且封装原始字节序列有效负载(rbsp)。nal单元标头可包含指示nal单元类型码的语法元素。由nal单元的nal单元标头指定的nal单元类型码指示nal单元的类型。rbsp可为封装在nal单元内的含有整数数目个字节的语法结构。在一些情况下,rbsp包含零个位。不同类型的nal单元可封装不同类型的rbsp。举例来说,第一类型的nal单元可封装图片参数集(pps)的rbsp,第二类型的nal单元可封装经译码切片的rbsp,第三类型的nal单元可封装补充增强信息(sei)的rbsp等等。pps为可含有适用于零或多个完整经译码图片的语法元素的语法结构。封装视频译码数据的rbsp(与参数集及sei消息的rbsp相对)的nal单元可被称作视频译码层(vcl)nal单元。封装经译码切片的nal单元在本文中可被称作经译码切片nal单元。用于经译码切片的rbsp可包含切片标头及切片数据。视频解码器30可接收位流。另外,视频解码器30可剖析位流以从位流解码语法元素。视频解码器30可至少部分基于从位流解码的语法元素重建视频数据的图片。重建视频数据的过程可大体上与由视频编码器20执行的过程互逆。举例来说,视频解码器30可使用pu的运动向量确定当前cu的pu的预测性块。视频解码器30可使用pu的一或多个运动向量产生pu的预测性块。另外,视频解码器30可对与当前cu的tu相关联的系数块进行逆量化。视频解码器30可对系数块执行逆变换以重建与当前cu的tu相关联的变换块。通过将当前cu的pu的预测性样本块的样本新增到当前cu的tu的变换块的对应样本,视频解码器30可重构当前cu的译码块。通过重建图片的每一cu的译码块,视频解码器30可重建图片。视频解码器30可将经解码图片存储于经解码图片缓冲器中以供输出及/或供用于解码其它图片。预期下一代视频应用使用表示具有hdr及wcg的经捕捉景物的视频数据来操作。所利用的动态范围及色域的参数为视频内容的两个独立属性,且出于数字电视及多媒体服务的目的,其规格由若干国际标准定义。举例来说,itu-rrec.709定义例如标准动态范围及标准色域的用于hdtv的参数,且itu-rrec.2020指定uhdtv参数,例如高动态范围及广色域。还存在指定其它系统中的所述属性的其它sdo文件,例如p3色域在smpte-231-2中进行定义,且hdr的一些参数在stmpte-2084中进行定义。在下文中提供视频数据的动态范围及色域的简要描述。视频编码器20及视频解码器30,分别结合例如预处理单元19及后处理单元31的其它组件,可实施动态范围译码。动态范围通常经定义为视频信号的最小与最大亮度之间的比率。动态范围还依据“光圈值(f-stop)”测量,其中一个光圈值对应于所述信号动态范围的倍增。在mpeg的定义中,高动态范围内容为以大于16个光圈值的亮度变化为特征的这类内容。在一些术语中,10个光圈值与16个光圈值之间的层级被视为中间动态范围,但在其它定义中可被视为hdr。同时,人类视觉系统能够感知大得多的动态范围且包含适应机制以使所谓的同步范围变窄。当前视频应用及服务由rec.709调节且提供sdr,其通常支持每平米大约0.1烛光到100烛光(cd)的范围的亮度(或明度)(通常被称作“尼特(nit)”),从而导致小于10个光圈值。预期下一代视频服务提供达16个光圈值的动态范围,且尽管详细规范目前尚处于开发中,但其一些初始参数已在smpte-2084及rec.2020中经指定。图2展示人类视觉及显示能力的实例。对由hdtv的sdr提供的动态范围、uhdtv的经预期hdr及hvs动态范围的观测展示于图2中。图3展示色域的实例。除hdr以外更逼真的视频体验的另一方面为色彩维度,其常规地由色域定义。图3展示sdr色域(基于bt.709红色、绿色及蓝色原色的三角形100)以及uhdtv的较宽色域(基于bt.2020红色、绿色及蓝色原色的三角形102)。图3也描绘所谓的频谱轨迹(形状104),其表示天然色彩的界限。如通过图3所说明,从bt.709到bt.2020移动原色旨在提供具有多约70%色彩的uhdtv服务。d65为给定规范指定白色。色域规范的实例展示于表1中。表1用于所选色彩空间的比色参数视频编码器20及视频解码器30可执行hdr视频数据的压缩。hdr/wcg通常以每分量(甚至浮点)的极高精度获取及存储,具有4:4:4色度格式及极宽色彩空间(例如,xyz)。这表示以高精确度为目标且在数学上(几乎)无损。然而,这种格式以大量冗余为特征且对于压缩目的并非最优。具有基于hvs的假定的较低精确度格式通常用于目前先进技术的视频应用。出于压缩目的的典型hdr视频数据格式转换由如图4中所展示的三个主要要素组成:(1)用于动态范围压缩的非线性转移函数(tf),(2)到更紧密或稳固色彩空间的色彩转换,及(3)浮点到整数表示转换(量化)。出于压缩目的的视频数据格式转换过程的一个实例包含三个主要过程,如图4中所展示。图4的技术可由源装置12执行。线性rgb数据110可为hdr/wcg视频数据且可以浮点表示存储。可使用用于动态范围压缩的非线性转移函数(tf)112来压缩线性rgb数据110。转移函数112可使用任何数目的非线性转移函数(例如,如smpte-2084中所定义的pqtf)来压缩线性rgb数据110。在一些实例中,色彩转换过程114将经压缩数据转换成较适用于由混合型视频编码器压缩的更紧密或稳固的色彩空间(例如,yuv或ycrcb色彩空间)。随后使用浮点到整数表示量化单元116对所述数据进行量化以产生经转换hdr的数据118。在这个实例中,hdr的数据118呈整数表示。hdr的数据现呈较适用于由混合型视频编码器(例如应用hevc技术的视频编码器20)来压缩的格式。图4中所描绘的过程的次序是作为实例给出对,且在其它应用中可改变。举例来说,色彩转换可先于tf过程。另外,例如空间次采样的额外处理可应用于色彩分量。在解码器(例如,视频解码器30)处的逆转换描绘于图5中。图5的技术可由视频解码器30及/或后处理单元31在目的地装置14处执行。经转换hdr的数据120可在目的地装置14处通过使用混合型视频解码器(例如,应用hevc技术的视频解码器30)解码视频数据而获得。hdr的数据120随后可由逆量化单元122来进行逆量化。随后可将逆向色彩转换过程124应用于经逆量化hdr的数据。逆向色彩转换过程124可为色彩转换过程114的逆向。举例来说,逆向色彩转换过程124可将hdr的数据从ycrcb格式转换回到rgb格式。接下来,可将逆转移函数126应用于数据以新增回到通过转移函数112压缩的动态范围,从而重建线性rgb数据128。线性及浮点表示中的输入rgb数据的高动态范围通过所利用的非线性转移函数tf(例如,如smpte-2084中所定义的pqtf)来压缩,之后其经转换成较适用于压缩的目标色彩空间(例如,ycbcr),且随后经量化以实现整数表示。这些元素的次序是作为实例给出的,且可在真实世界应用中改变,例如,色彩转换可先于tf模块以及额外处理(例如空间次采样)可应用于色彩分量。更详细地描述这些三个分量。视频编码器20及视频解码器30可利用转移函数(tf)。将tf应用于数据以压缩数据的动态范围且使得可使用有限数目个位表示数据。所述函数通常为一维(1d)非线性函数,其反映终端用户显示器的电光转移函数(eotf)的逆向转移函数,如rec.709中的sdr所指定;或近似于对亮度变化的hvs感知,如hdr的smpte-2084中所指定的pqtf。oetf的逆向过程为eotf(电光转移函数),其将码层级映射回到明度。图6展示tf的若干实例。st2084的规范如下定义eotf应用。将tf应用于正规化线性r、g、b值,这产生r'g'b'的非线性表示。st2084通过norm=10000定义正规化,其与10000尼特(cd/m2)的峰值亮度相关联。其中图7展示pqtf(st2084eotf)的实例观测。在输入值(线性色彩值)经正规化到范围0..1的情况下,在图7中观测pqeotf的正规化输出值(非线性色彩值)。如从曲线可见,输入信号的动态范围的1%(低照明)转换成输出信号的动态范围的50%。通常,eotf经定义为具有浮点准确度的函数,因此如果应用逆向tf(所谓的oetf),那么不会将误差引入到具有这种非线性的信号。st2084中所指定的逆向tf(oetf)经定义为inversepq函数:其中通过浮点准确度,依序应用eotf及oetf提供不具有误差的完美重建。然而,对于流式传输或广播服务,这种表示并非最优的。在以下章节中描述具有非线性r'g'b'数据的固定位准确度的更紧密表示。应注意,eotf及oetf为当前非常活跃的研究的主题,且一些hdr视频译码系统中所利用的tf可不同于st2084。视频编码器20及视频解码器30可经配置以实施色彩变换。rgb数据通常用作输入,这是因为rgb数据由图像捕捉传感器产生。然而,所述色彩空间在组件当中具有高冗余且对于紧密表示而言并非最优的。为实现更紧密及更稳固的表示,rgb分量通常转换成更适用于压缩(例如ycbcr)的更不相关的色彩空间。所述色彩空间将呈明度形式的亮度及呈不同的不相关分量的色彩信息分离。对于现代视频译码系统,通常使用的色彩空间为ycbcr,如itu-rbt.709或itu-rbt.709中所指定。bt.709标准中的ycbcr色彩空间指定从r'g'b'到y'cbcr的以下转换过程(非恒定明度表示):以上过程也可使用避免cb及cr分量的除法的以下近似转换来实施:itu-rbt.2020标准指定从r'g'b'到y'cbcr(非恒定明度表示)的以下转换过程:以上过程也可使用避免cb及cr分量的除法的以下近似转换来实施:应注意,两个色彩空间均保持正规化;因此,对于在0...1范围内正规化的输入值,所得值将映射到0…1的范围。一般来说,通过浮点准确度所实施的色彩变换提供完美的重建,因此所述过程无损。视频编码器20及视频解码器30可实施量化/固定点转换。上文所描述的处理阶段通常以浮点准确度表示实施,因此可被视为无损。然而,对于大多数消费型电子装置应用,这种类型的准确度可被视为冗余且昂贵的。对于这类应用,通常将目标色彩空间中的输入数据转换成目标位深度固定点准确度。某些研究展示,10位到12位准确度结合pqtf足以提供具有低于恰可辨差异的失真的16个光圈值的hdr数据。以10位准确度表示的数据可通过大部分目前先进技术视频译码解决方案进一步进行译码。这个转换过程包含信号量化且为有损译码元素并且是经引入到经转换数据的不准确度的来源。应用于目标色彩空间(在这个实例中,ycbcr)中的码字的这类量化的实例展示于下文中。将以浮点准确度表示的输入值ycbcr转换成y值的固定位深度bitdepthy及色度值(cb、cr)的固定位深度bitdepthc的信号。其中round(x)=sign(x)*floor(abs(x)+0.5)如果x<0,那么sign(x)=-1,如果x=0,那么sign(x)=0,如果x>0,那么sign(x)=1floor(x)小于或等于x的最大整数如果x>=0,那么abs(x)=x,如果x<0,那么abs(x)=-xclip1y(x)=clip3(0,(1<<bitdepthy)-1,x)clip1c(x)=clip3(0,(1<<bitdepthc)-1,x)如果z<x,那么clip3(x,y,z)=x,如果z>y,那么clip3(x,y,z)=y,否则clip3(x,y,z)=z视频编码器20及视频解码器30可实施dra。dra最初在《实现具有向后兼容能力的高动态范围视频译码的动态范围调整sei(dynamicrangeadjustmentseitoenablehighdynamicrangevideocodingwithbackward-compatiblecapability)》,d.rusanovskyy、a.k.ramasubramonian、d.bugdayci、s.lee、j.sole、m.karczewicz,vceg文件com16-c1027-e,2015年9月(下文的参考文献1)中提出。作者提出以针对输入值x的非重叠动态范围分割区(范围){ri}的群所定义的分段线性函数f(x)的形式实施dra,其中i为范围指数,其中范围为0到n-1(包含端点),且其中n为用于定义dra函数在范围{ri}的总数目。假定dra的范围由属于范围ri的最小x值及最大x值定义(例如[xi,xi+1-1]),其中xi及xi+1分别表示范围ri及ri+1的最小值。应用于视频的y色彩分量(明度),dra函数sy通过应用于每一x∈[xi,xi+1-1]的比例sy,i及偏移oy,i定义,因此sy={sy,i,oy,i}。在这种情况下,对于任一ri,及每一x∈[xi,xi+1-1],输出值x计算如下:x=sy,i*(x-oy,i)(8)对于在解码器处进行的用于明度分量y的逆向dra映射过程,dra函数sy由应用于每一x∈[xi,xi+1-1]的比例sy,i及偏移oy,i值的逆向定义。在这种情况下,对于任一ri,及每一x∈[xi,xi+1-1],经重建值x计算如下:x=x/sy,i+oy,i(9)用于色度分量cb及cr的正向dra映射过程定义如下。实例是通过表示cb色彩分量的样本的项“u”给出对,“u”属于范围ri,u∈[ui,ui+1-1],因此su={su,i,ou,i}:u=su,i*(u-oy,i)+offset(10)其中等于2(bitdepth-1)的offset表示双极cb、cr信号偏移。在解码器处针对色度分量cb及cr进行的逆向dra映射过程定义如下。实例是通过表示经再映射cb色彩分量的样本的u项给出,u属于范围ri,u∈[ui,ui+1-1]:u=(u-offset)/su,i+oy,i(11)其中等于2(bitdepth-1)的offset表示双极cb、cr信号偏移。视频编码器20及视频解码器30也可实施明度驱动色度缩放(lcs)。lcs最初在《jctvc-w0101hdrce2:关于ce2.a-1lcs的报告(jctvc-w0101hdrce2:reportonce2.a-1lcs)》,a.k.ramasubramonian、j.sole、d.rusanovskyy、d.bugdayci、m.karczewicz(下文的参考文献2)中提出。在参考文献2中,提出通过采用与经处理色度样本相关联的亮度信息调整色度信息(例如cb及cr)的技术。类似于参考文献1的dra方法,其经提出以cb的缩放因数su及cr的缩放因数sv,i应用于色度样本。然而,代替针对方程式(3)及(4)中可通过色度值u或v获得的范围集合{ri}以分段线性函数su={su,i,ou,i}的形式定义dra,lcs方法提出利用明度值y导出用于色度样本的缩放因数。在这种情况下,色度样本u(或v)的正向lcs映射如下进行:u=su,i(y)*(u-offset)+offset(12)在解码器侧处进行的逆向lcs过程定义如下:u=(u-offset)/su,i(y)+offset(13)更详细地,对于位于(x,y)处的给定像素,色度样本cb(x,y)或cr(x,y)以从通过对应明度值y'(x,y)所确定的lcs函数scb(或scr)导出的因数来缩放。在色度样本的正向lcs处,cb(或cr)值及相关联明度值y'被视为到色度缩放函数scb(或scr)的输入,且cb或cr如方程式9中所展示经转换成cb'及cr'。在解码器侧处,应用逆向lcs,经重建cb'或cr'如方程式(10)中所展示经转换成cb或cr。图8展示lcs函数的实例,关于实例中的lcs函数,将具有较小明度值的像素的色度分量乘以较小缩放因数。现将论述dra样本缩放与量化参数之间的关系。为了调整压缩比,视频编码器20利用基于块变换的视频译码方案,例如hevc,其利用应用于变换系数的纯量量化器。视频编码器20可基于量化参数(qp)控制纯量量化器,其中qp与纯量量化器之间的关系定义如下:scaler=exp(qp/6)*log(2.0))(16)逆函数如下定义hevc中纯量量化器与qp之间的关系:qp=log2(scaler)*6;(17)当实施dra时,视频编码器20及视频解码器30有效地缩放像素数据且考虑变换特性,其可针对一大类信号经映射到应用于变换域中的纯量。因此,定义以下关系:dqp=log2(scaledra)*6;(18)其中dqp为通过hevc(例如通过针对输入数据部署dra)引入的近似qp偏移。用于现代视频译码系统中的非线性(例如应用转移函数smpte2084)及色彩表示(例如itu-rbt.2020或bt.22100)中的一些可导致以在信号表示的动态范围及色彩分量内的所感知失真或恰可辨差异(jnd)阈值的显著变化为特征的视频数据表示。这可经感知为经处理数据范围内的不等信噪比。为解决这个问题及线性化信号的动态范围中的译码(量化)误差分布,提出参考文献1的dra方法。参考文献1提出在应用混合型基于变换的视频译码方案h.265/hevc之前应用dra以实现st2084/bt.2020容器中的码字重新分布,如图9中所展示。通过dra实现的重新分布以动态范围内的感知失真(信噪比)的线性化为目标。为在解码器侧处补偿所述重新分布,及将数据转换成原始st2084/bt.2020表示,在视频解码之后将逆向dra过程应用于数据。所述dra方案的另一实例在《jctvc-w0101hdrce2:关于ce2.a-1lcs的报告中的hdr中的明度驱动色度缩放(lcs)(luma-drivenchromascaling(lcs)designinhdrinjctvc-w0101hdrce2:reportonce2.a-1lcs)》,a.k.ramasubramonian、j.sole、d.rusanovskyy、d.bugdayci、m.karczewicz(下文的参考文献2)中提出。参考文献2提出通过采用与经处理色度样本相关联的亮度信息调整色度信息(例如cb及cr)的技术。类似于参考文献1的dra方法,其经提出以cb的缩放因数su及cr的缩放因数sv,i应用于色度样本。然而,代替针对方程式(3)及(4)中可通过色度值u或v获得的范围集合{ri}以分段线性函数su={su,i,ou,i}的形式定义dra,lcs方法提出利用明度值y导出用于色度样本的缩放因数。应用于通过每样本有限数目个位(例如,10个位)表示的视频信号的dra技术可按像素层级量化分类。与在变换域中部署基于块的纯量量化的视频译码(例如,h.265/hevc)组合产生具有像素及变换域中的联合信号量化的视频译码系统。一些视频译码方案的设计可并有基于量化误差的假定/估计而引入经译码信号的视频译码工具、标准化决策制定逻辑及参数。在这些工具的实例当中,可列举解码器侧处的h.265/hevc解块滤波器(例如,hevc第8.7.2项)及qp导出过程(例如,hevc第8.6.1项)。在像素层级处应用dra可引入无法正确估计的量化误差,其可导致在解码器处利用的决策逻辑为非最优译码决策。作为一实例,hevc规范的表8-10定义在qp导出期间于编码器及解码器两者处利用的色度qp转变,其可产生通过不反映应用于当前色度块的样本的像素量化/缩放的方程式8-259/8-260导出的qp指数。本发明描述用于具有联合像素/变换为基础的量化的视频译码的量化参数控制的技术。这些系统的实例为利用变换域中的量化的常规混合视频译码及在前/后处理阶段或在视频译码的编码循环内在像素域中执行缩放/量化的dra的组合。视频编码器20及视频解码器30可执行用于解码器qp处置的dra比例补偿。用于三个色彩分量的dra比例经调整以补偿视频编码解码器中的qp处置。假定用于3个色彩分量(例如,y、cb、cr)的dra的参数通过以下变量定义:进行像素处理的dra参数通过经译码位流传信或在解码器侧从位流中所传信的语法元素导出。所述dra参数通过考虑描述变换系数的量化的信息来进一步调整。dra′y=fun(dray,qpx)dra′cb=fun(dracb,qpx)dra′cr=fun(dracr,qpx)(19b)qpx表示由视频编码器20针对给定像素块进行及以位流传信到视频解码器30或以旁侧信息的形式(例如以预列表信息的形式)提供到视频解码器30的qp调整或操纵。这个过程的输出为将应用于经解码样本(ydec,cbdec,crdec)的经调整dra参数(dra′y,dra′cb,dra′cr)。yo=fun(dra′y,ydec)cbo=fun(dra′cb,cbdec)cro=fun(dra′cr,crdec)(20)视频编码器20及视频解码器30可调整qp信息以反映应用于像素的dra的影响。改变在解码器侧处做出的决策中所利用的qp信息以反映应用于经解码图片的像素的dra的影响。qp′y=fun(qpx,dray)qp′cb=fun(qpx,dracb)qp′cr=fun(qpx,dracr)(21)qpx为由解码器在不考虑通过dra处理对当前经处理像素实施的缩放的情况下导出的qp参数。这个过程的输出为在解码器侧处的决策制定过程中所利用的经调整qp(qp′y,qp′cb,qp′cr)。在一些实例中,仅解码算法中的方法的子集将在决策制定过程中使用经调整qp。将在下文描述本发明的所提出技术的实施的若干非限制性实例。现将描述用于色度qp转变表格的dra比例补偿。在一些实例中,解码器的参数的导出可基于从经位流的语法元素导出及通过解码器侧处可用的旁侧信息进一步改变的本地qp信息。所述处理的实例在hevc规范中的第8.6.1项:–变量qpcb及qpcr分别经设定为等于如在表8-9中基于等于qpicb及qpicr的指数qpi指定的qpc值,且qpicb及qpicr导出如下:qpicb=clip3(-qpbdoffsetc,57,qpy+pps_cb_qp_offset+slice_cb_qp_offset)(8-257)qpicr=clip3(-qpbdoffsetc,57,qpy+pps_cr_qp_offset+slice_cr_qp_offset)(8-258)–如果chromaarraytype等于1,那么变量qpcb及qpcr分别经设定为等于如在表8-10中基于等于qpicb及qpicr的指数qpi指定的qpc值。–否则,变量qpcb及qpcr分别基于等于qpicb及qpicr的指数qpi经设定等于min(qpi,51)。–cb及cr分量的色度量化参数qp'cb及qp'cr导出如下:qp'cb=qpcb+qpbdoffsetc(8-259)qp'cr=qpcr+qpbdoffsetc(8-260)表8-9-作为qpi的函数的qpc的规范qpi<303031323334353637383940414243>43qpc=qpi2930313233333434353536363737=qpi-6在这个实例中,用于色度分量的dra比例参数可经改变以反映由所述处理引入的qp转变。以下实例是针对cb分量给出的,cr分量的导出是类似的。视频解码器30可通过表8-10导出用于cb分量的色度量化参数。qp信息经估计:变量updatedqp1进一步用于解码处理序,且shiftqp1提供关于对通过表8-10引入的qp的影响的估计。为了协调解码器中通过dra及qp处置进行的像素层级量化,dra缩放函数改变如下:estimateqp2=qpcb+qpbdpffsetc+scale2qp(dracb)(23)其中scale2qp(dracb)进行从比例到qp进行转换,类似地展示于方程式18中updatedqp2=fun(table8-10,estimateqp2)(24)shiftqp2=updatedqp2-estimateqp2;在一些实例中,尤其就跨分量dra实施(例如,lcs)而言,方程式(23)将包含根据y分量的dra比例估计的qp偏移项及根据用以产生cb分量的dra的色度比例(addndracbscale)估计的额外qp偏移项。例如estimateqp2=qpcb+qpbdpffsetc+scale2qp(dray)+scale2qp(addndracbscale)变量updatedqp2提供在dra将通过变换域缩放进行的情况下的qp的估计,且shfitqp2提供对通过表8-10引入的qp的影响的估计。在某些情况下,估计的shiftqp1将不等于shiftqp2。为了补偿这种差异,dra的比例可如下随乘数变化:shiftscale=qp2scale(shiftqp2-shiftqp1)(25)dracb'=shiftscale*dracb其中函数qp2scale将qp变量转换成如方程式16中所展示的相关联量化器比例。这个过程的输出为应用于经解码样本cbdec的经调整dra比例。在一些实例中,比例到qp转换函数scale2qp的输出(dracb)及所得estimateqp2为非整数值。为了定址表8-10的要素,到表8-10的输入及输出qp值可如下经内插于整数条目之间:qp1=fun(table8-10,(int)estimateqp2;qp2=fun(table8-10,(int)(estimateqp2+1.0));(26)shiftqp2=qp1+(qp2-qp1)*(estimateqp2-(int)estimateqp2);在另外其它实例中,表8-10的条目(或类似列表信息)可通过分析性函数定义或明确地在位流中传信。在另一实例中,shiftscale可如下经计算以补偿表8-10shiftqp1的影响:shiftscale=qp2scale(shiftqp1)在一些实例中,用于初始化方程式22及23的qp指数可通过位流传信以便避免剖析及处理相依性。在一些实例中,视频编码器20可估计用于本文所描述的经提出技术的参数且通过位流将那些参数传信到视频解码器30(后设数据、sei消息、vui或spspps或切片标头等)。视频解码器30随后接收来自位流的参数。在一些实例中,视频编码器20可导出所提出技术的参数。视频解码器30可根据输入信号或根据与输入信号相关联的其它可用参数实施指定过程且执行相同导出。在一些实例中,视频编码器20可明确地将所提出技术的参数传信到视频解码器30。在另一实例中,视频编码器20及视频解码器30可根据其它输入信号参数(例如输入色域及目标色彩容器(色彩原色)的参数导出所述参数。图10为说明可实施本发明中所描述的技术的实例视频编码器20的框图。视频编码器20可执行视频切片内的视频块的帧内译码及帧间译码。帧内译码依赖于空间预测以减少或去除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测以减小或去除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(i模式)可指代若干基于空间的压缩模式中的任一者。帧间模式(例如,单向预测(p模式)或双向预测(b模式))可指代若干基于时间的压缩模式中的任一者。在图10的实例中,视频编码器20包含视频数据存储器33、分割单元35、预测处理单元41、求和器50、变换处理单元52、量化单元54、熵编码单元56。预测处理单元41包含运动估计单元(meu)42、运动补偿单元(mcu)44及帧内预测处理单元46。对于视频块重建,视频编码器20还包含逆量化单元58、逆变换处理单元60、求和器62、滤波器单元64及经解码图片缓冲器(dpb)66。如图10中所展示,视频编码器20接收视频数据且将所接收的视频数据存储于视频数据存储器33中。视频数据存储器33可存储待由视频编码器20的组件编码的视频数据。存储于视频数据存储器33中的视频数据可例如从视频源18获得。dpb66可为存储供视频编码器20例如以帧内或帧间译码模式编码视频数据的参考视频数据的参考图片存储器。视频数据存储器33及dpb66可由例如动态随机存取存储器(dram)(包含同步dram(sdram))、磁阻式ram(mram)、电阻式ram(rram)或其它类型的存储器装置的多种存储器装置中的任一者形成。视频数据存储器33及dpb66可由同一存储器装置或单独的存储器装置提供。在各种实例中,视频数据存储器33可与视频编码器20的其它组件一起在芯片上,或相对于那些组件在芯片外。分割单元35从视频数据存储器33检索视频数据且将视频数据分割成视频块。这种分割也可包含分割成切片、单元片或其它较大单元以及例如根据lcu及cu的四叉树结构分割的视频块。视频编码器20大体上说明对待编码视频切片内的视频块进行编码的组件。切片可划分成多个视频块(且可能划分成被称作单元片的视频块集合)。预测处理单元41可基于误差结果(例如,译码速率及失真程度)为当前视频块选择多个可能译码模式中的一者,例如多个帧内译码模式中的一者或多个帧间译码模式中的一者。预测处理单元41可将所得经帧内或帧间译码块提供到求和器50以产生残余块数据且提供到求和器62以重建经编码块以用作参考图片。预测处理单元41内的帧内预测处理单元46可执行当前视频块相对于与待译码的当前块相同的帧或切片中的一或多个相邻块的帧内预测性译码以提供空间压缩。预测处理单元41内的运动估计单元42及运动补偿单元44执行当前视频块相对于一或多个参考图片中的一或多个预测性块的帧间预测性译码以提供时间压缩。运动估计单元42可经配置以根据视频序列的预定图案来确定用于视频切片的帧间预测模式。预定图案可将序列中的视频切片指定为p切片或b切片。运动估计单元42及运动补偿单元44可高度集成,但出于概念目的而分开说明。由运动估计单元42执行的运动估计为产生运动向量的过程,所述运动向量估计视频块的运动。举例来说,运动向量可指示当前视频帧或图片内的视频块的pu相对于参考图片内的预测性块的位移。预测性块为就像素差而言被发现紧密地匹配待译码视频块的pu的块,所述像素差可由绝对差总和(sumofabsolutedifference;sad)、平方差总和(sumofsquaredifference;ssd)或其它差异度量确定。在一些实例中,视频编码器20可计算存储于dpb66中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行关于全像素位置及分数像素位置的运动搜索且输出具有分数像素精确度的运动向量。运动估计单元42通过比较pu的位置与参考图片的预测性块的位置来计算经帧间译码切片中的视频块的pu的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述列表中的每一者识别存储于dpb66中的一或多个参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56及运动补偿单元44。由运动补偿单元44执行的运动补偿可涉及基于由运动估计(可能执行到子像素精确度的内插)确定的运动向量而提取或产生预测性块。在接收到当前视频块的pu的运动向量之后,运动补偿单元44可在参考图片列表中的一者中定位运动向量所指向的预测性块。视频编码器20通过从正在译码的当前视频块的像素值减去预测性块的像素值来形成残余视频块,从而形成像素差值。像素差形成用于块的残余数据,且可包含明度及色度差异分量两者。求和器50表示执行这种减法运算的一或多个组件。运动补偿单元44也可产生与视频块及视频切片相关联的语法元素以供视频解码器30在解码视频切片的视频块时使用。在预测处理单元41通过帧内预测或帧间预测产生当前视频块的预测性块之后,视频编码器20通过从当前视频块减去预测性块而形成残余视频块。残余块中的残余视频数据可包含于一或多个tu中且应用于变换处理单元52。变换处理单元52使用例如离散余弦变换(dct)或概念上类似的变换将残余视频数据变换为残余变换系数。变换处理单元52可将残余视频数据从像素域转换到变换域(例如,频域)。变换处理单元52可将所得变换系数发送到量化单元54。量化单元54对变换系数进行量化以进一步降低位速率。量化过程可减小与一些或所有系数相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54随后可执行对包含经量化的变换系数的矩阵的扫描。在另一实例中,熵编码单元56可执行所述扫描。在量化之后,熵编码单元56对经量化变换系数进行熵编码。举例来说,熵编码单元56可执行上下文适应性可变长度译码(cavlc)、上下文适应性二进制算术译码(cabac)、基于语法的上下文适应性二进制算术译码(sbac)、概率区间分割熵(pipe)译码或另一熵编码方法或技术。在由熵编码单元56熵编码之后,经编码位流可发射到视频解码器30,或经存档以供视频解码器30稍后发射或检索。熵编码单元56也可熵编码正译码的当前视频切片的运动向量及其它语法元素。逆量化单元58及逆变换处理单元60分别应用逆量化及逆变换以重建像素域中的残余块以供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块新增到参考图片列表中的一者内的参考图片中的一者的预测性块来计算参考块。运动补偿单元44也可将一或多个内插滤波器应用到经重建残余块,以计算用于运动估计的子整数像素值。求和器62将重建残余块新增到通过运动补偿单元44产生的经运动补偿预测块以产生经重建块。滤波器单元64对经重构块(例如,求和器62的输出)进行滤波且将经滤波的经重构块存储于dpb66中以供用作参考块。参考块可由运动估计单元42及运动补偿单元44用作参考块以对后续视频帧或图片中的块进行帧间预测。滤波器单元64旨在表示解块滤波器、样本适应性偏移滤波器及适应性回路滤波器或其它类型的滤波器中的一或多者。解块滤波器可例如将解块滤波应用于滤波器块边界,以从经重建视频去除块效应伪影。样本适应性偏移滤波器可将偏移应用到经重建像素值以便改进总体译码质量。也可使用额外回路滤波器(回路内或回路后)。本发明中所描述的各种技术可由视频编码器20及/或预处理单元19单独地或彼此组合地执行。举例来说,视频编码器20及/或预处理单元19可经配置以处理hdr/wcg视频数据。视频编码器20及/或预处理单元19可经配置以:确定用于hdr/wcg视频数据的块的经量化变换系数的量化参数;基于经确定量化参数对经量化变换系数进行逆量化以确定经解量化变换系数;基于经解量化变换系数,确定hdr/wcg视频数据的块的残余值块;基于残余值块,确定hdr/wcg视频数据的块的经重建块;确定用于hdr/wcg视频数据的块的一或多个dra参数;基于经确定量化参数调整一或多个dra参数以确定一或多个经调整dra参数;及使用一或多个经调整dra参数对hdr/wcg视频数据的经重建块执行dra。视频编码器20及/或预处理单元19可另外或替代地经配置以:确定用于hdr/wcg视频数据的块的经量化变换系数的量化参数;基于经确定量化参数对经量化变换系数进行量化以确定经量化变换系数;基于经确定量化参数确定用于hdr/wcg视频数据的块的一或多个参数;及基于经确定量化参数调整一或多个dra参数以确定一或多个经调整dra参数。图11为说明可实施本发明中所描述的技术的实例视频解码器30的框图。图11的视频解码器30可例如经配置以接收上文关于图10的视频编码器20所描述的传信。在图11的实例中,视频解码器30包含视频数据存储器78、熵解码单元80、预测处理单元81、逆量化单元86、逆变换处理单元88、求和器90、滤波器单元92及dpb94。预测处理单元81包含运动补偿单元82及帧内预测单元84。在一些实例中,视频解码器30可执行与关于来自图10的视频编码器20所描述的编码遍次互逆的解码遍次。在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块及相关联语法元素的经编码视频位流。视频解码器30将所接收的经编码视频位流存储于视频数据存储器78中。视频数据存储器78可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。存储于视频数据存储器78中的视频数据可例如通过链路16从存储装置26或从本地视频源(例如相机)或通过存取物理数据存储媒体而获得。视频数据存储器78可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(cpb)。dpb94可为存储供视频解码器30用于例如以帧内或帧间译码模式解码视频数据的参考视频数据的参考图片存储器。视频数据存储器78及dpb94可由例如dram、sdram、mram、rram或其它类型的存储器装置的多种存储器装置中的任一者形成。视频数据存储器78及dpb94可由同一存储器装置或单独的存储器装置提供。在各种实例中,视频数据存储器78可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。视频解码器30的熵解码单元80对存储于视频数据存储器78中的视频数据进行熵解码以产生经量化系数、运动向量及其它语法元素。熵解码单元80将运动向量及其它语法元素转发到预测处理单元81。视频解码器30可在视频切片层级及/或视频块层级处接收语法元素。当视频切片经译码为经帧内译码(i)切片时,预测处理单元81的帧内预测处理单元84可基于来自当前帧或图片的先前经解码块的经传信帧内预测模式及数据来产生用于当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码切片(例如,b切片或p切片)时,预测处理单元81的运动补偿单元82基于从熵解码单元80接收的运动向量及其它语法元素产生用于当前视频切片的视频块的预测性块。预测性块可从参考图片列表中的一者内的参考图片中的一者产生。视频解码器30可基于存储于dpb94中的参考图片使用默认构建技术来构建参考帧列表,列表0及列表1。运动补偿单元82通过剖析运动向量及其它语法元素来确定当前视频切片的视频块的预测信息,且使用所述预测信息产生用于正解码的当前视频块的预测性块。举例来说,运动补偿单元82使用所接收语法元素中的一些确定用于译码视频切片的视频块的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,b切片或p切片)、切片的参考图片列表中的一或多者的构建信息、切片的每一经帧间编码视频块的运动向量、切片的每一经帧间译码视频块的帧间预测状态及用以解码当前视频切片中的视频块的其它信息。运动补偿单元82也可执行基于内插滤波器的内插。运动补偿单元82可使用如由视频编码器20在视频块的编码期间所使用的内插滤波器,以计算参考块的子整数像素的内插值。在这种情况下,运动补偿单元82可从所接收语法元素确定由视频编码器20所使用的内插滤波器且使用所述内插滤波器产生预测性块。逆量化单元86对位流中所提供且由熵解码单元80解码的经量化变换系数进行逆量化,即解量化。逆量化过程可包含使用由视频编码器20针对视频切片中的每一视频块计算的量化参数,以确定量化程度及(同样地)应该应用的逆量化程度。逆变换处理单元88将逆变换(例如,逆向dct、逆向整数变换或概念上类似的逆变换过程)应用于变换系数,以便产生像素域中的残余块。在预测处理单元使用例如帧内或帧间预测产生当前视频块的预测性块之后,视频解码器30通过对来自逆变换处理单元88的残余块与由运动补偿单元82产生的对应预测性块进行求和而形成经重建视频块。求和器90表示执行所述求和运算的一或多个组件。滤波器单元92使用例如解块滤波、sao滤波、适应性回路滤波或其它类型的滤波器中的一或多者对经重建视频块进行滤波。也可使用其它回路滤波器(在译码回路内或在译码回路之后)使像素转变平滑,或以其它方式改进视频质量。给定帧或图片中的经解码视频块随后存储于dpb94中,所述dpb存储用于后续运动补偿的参考图片。dpb94可为额外存储器的部分或与其分离,所述额外存储器存储用于稍后呈现于显示装置(例如图1的显示装置32)上的经解码视频。本发明中所描述的各种技术可由视频解码器30及/或后处理单元31单独地或彼此组合地执行。举例来说,视频解码器30及/或后处理单元31可经配置以处理hdr/wcg视频数据。视频解码器30及/或后处理单元31可经配置以:确定用于hdr/wcg视频数据的块的经量化变换系数的量化参数;基于经确定量化参数对经量化变换系数进行逆量化以确定经解量化变换系数;基于经解量化变换系数,确定hdr/wcg视频数据的块的残余值块;基于残余值块,确定hdr/wcg视频数据的块的经重建块;确定用于hdr/wcg视频数据的块的一或多个dra参数;基于经确定量化参数调整一或多个dra参数以确定一或多个经调整dra参数;及使用一或多个经调整dra参数对hdr/wcg视频数据的经重建块执行dra。图12为说明根据本发明的技术的用于解码视频数据的视频解码器的实例操作的流程图。举例来说,关于图12所描述的视频解码器可为用于输出可显示经解码视频的例如视频解码器30的视频解码器,或可为实施于视频编码器,例如视频编码器20的解码回路中的视频解码器,所述解码回路包含预测处理单元41、逆量化单元58、逆变换处理单元60、滤波器单元64及dpb66。图12的技术中的一些可由与视频解码器分离的实体(例如预处理单元19或后处理单元31)执行,但为简单起见,图12的所有技术将描述为由视频解码器执行。视频解码器确定用于hdr/wcg视频数据的块的经量化变换系数的量化参数(200)。视频解码器基于经确定量化参数对经量化变换系数进行逆量化以确定经解量化变换系数(210)。基于经解量化变换系数,视频解码器确定hdr/wcg视频数据的块的残余值块(220)。基于残余值块,视频解码器确定hdr/wcg视频数据的块的经重建块(230)。视频解码器确定用于hdr/wcg视频数据的块的一或多个dra参数(240)。为了确定用于hdr/wcg视频数据的块的一或多个dra参数,视频解码器可接收对一或多个dra参数的指示作为hdr/wcg视频数据中的语法元素或可以其它方式导出一或多个dra参数。视频解码器基于经确定量化参数调整一或多个dra参数以确定一或多个经调整dra参数(250)。用于hdr/wcg视频数据的块的一或多个dra参数可包含用于hdr/wcg视频数据的块的明度分量的缩放参数及用于hdr/wcg视频数据的块的明度分量的偏移参数,且用于hdr/wcg视频数据的块的一或多个经调整dra参数可包含用于hdr/wcg视频数据的块的明度分量的经调整缩放参数及用于hdr/wcg视频数据的块的明度分量的经调整偏移参数。用于hdr/wcg视频数据的块的一或多个dra参数可包含用于hdr/wcg视频数据的块的色度分量的缩放参数及用于hdr/wcg视频数据的块的色度分量的偏移参数,且用于hdr/wcg视频数据的块的一或多个经调整dra参数可包含用于hdr/wcg视频数据的块的色度分量的经调整缩放参数及用于hdr/wcg视频数据的块的色度分量的经调整偏移参数。一或多个经调整dra参数可包含用于hdr/wcg视频数据的块的第一色度分量的经调整dra参数及用于hdr/wcg视频数据的块的第二色度分量的经调整dra参数。一或多个经调整dra参数可包含用于hdr/wcg视频数据的块的明度分量的经调整dra参数、用于hdr/wcg视频数据的块的第一色度分量的经调整dra参数及用于hdr/wcg视频数据的块的第二色度分量的经调整dra参数。视频解码器使用一或多个经调整dra参数对hdr/wcg视频数据的经重建块执行dra(260)。视频解码器也可输出由执行dra产生的经调整视频数据。视频解码器可例如输出经调整视频数据以供显示或可通过存储经调整视频数据来输出经调整视频数据。视频解码器可存储经调整视频数据以供将来显示或可存储经调整视频数据以供编码或解码视频数据的将来块。在一或多个实例中,所描述功能可实施于硬件、软件、固件或其任何组合中。如果实施于软件中,那么所述功能可作为一或多个指令或代码存储在计算机可读媒体上或通过计算机可读媒体发射,且由基于硬件的处理单元执行。计算机可读媒体可包含:计算机可读存储媒体,其对应于例如数据存储媒体的有形媒体;或通信媒体,其包含例如根据通信协议促进计算机程序从一处转移到另一处的任何媒体。以这种方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索指令、代码及/或数据结构以用于实施本发明所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。作为实例而非限制,这些计算机可读存储媒体可包括ram、rom、eeprom、cd-rom或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、闪存存储器或可用于存储呈指令或数据结构形式的所要程序码且可由计算机存取的任何其它媒体。而且,将任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴缆线、光缆、双绞线、数字订户线(dsl)或无线技术(例如红外线、无线电及微波)从网站、服务器或其它远程源发射指令,那么同轴缆线、光缆、双绞线、dsl或无线技术(例如红外线、无线电及微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而是实际上有关非暂时性有形存储媒体。如本文所用,磁盘及光盘包含压缩光盘(cd)、激光光盘、光学光盘、数字影音光盘(dvd)、软盘及蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘通过激光以光学方式再生数据。以上各者的组合也应包含于计算机可读媒体的范围内。指令可由例如一或多个数字信号处理器(dsp)、通用微处理器、专用集成电路(asic)、场可编程逻辑阵列(fpga)或其它等效集成或离散逻辑电路的一或多个处理器执行。因此,如本文所用的术语“处理器”可指代前述结构或适用于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文中所描述的功能性提供在经配置以用于编码及解码的专用硬件及/或软件模块内,或并入于组合式编码解码器中。而且,所述技术可完全实施于一或多个电路或逻辑元件中。本发明的技术可实施于广泛多种装置或设备中,包含无线手持机、集成电路(ic)或ic集合(例如,芯片组)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元来实现。相反地,如上文所描述,各种单元可组合于编码解码器硬件单元中,或由互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合合适软件及/或固件来提供。各种实例已予以描述。这些及其它实例在以下权利要求书的范围内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1