到高动态范围和/或广色域视频数据的固定转移函数的内容自适应应用的制作方法

文档序号:13809846阅读:356来源:国知局
到高动态范围和/或广色域视频数据的固定转移函数的内容自适应应用的制作方法

本申请案主张2015年6月8日申请的美国临时申请案第62/172,713号和2015年6月24日申请的美国临时申请案第62/184,216号的权益,每一美国临时申请案的全部内容以引用的方式并入本文中。

本发明涉及视频译码。



背景技术:

数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(pda)、膝上型或台式计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流式传输装置和类似物。数字视频装置实施视频译码技术,例如由mpeg-2、mpeg-4、itu-th.263、itu-th.264/mpeg-4第10部分先进视频译码(avc)、itu-th.265、高效率视频译码(hevc)所定义的标准和这些标准的扩展中所描述的那些技术。视频装置可通过实施此类视频译码技术来更高效地发射、接收、编码、解码和/或存储数字视频信息。

视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(例如,视频帧或视频帧的一部分)分割成视频块(其也可被称作树型块)、译码单元(cu)和/或译码节点。图片的经帧内译码(i)的切片中的视频块是使用关于同一图片中的邻近块中的参考样本的空间预测来编码。图片的帧间译码(p或b)切片中的视频块可使用关于同一图片中的邻近块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。

空间或时间预测产生待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量和指示经译码块与预测性块之间的差异的残余数据来编码经帧间译码块。经帧内译码块是根据帧内译码模式与残余数据来编码。为了进行进一步压缩,可将残余数据从像素域变换到变换域,从而导致残余变换系数,可接着量化所述残余变换系数。可扫描最初布置成二维阵列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以达成甚至较多压缩。



技术实现要素:

本发明涉及处理视频数据,包含处理视频数据以符合高动态范围(hdr)/宽色域(wcg)色彩容器。如在下文中将更详细地解释,本发明的技术在编码侧上在应用静态转移函数之前应用对色彩值的预处理和/或对来自静态转移函数的应用的输出应用后处理。通过应用预处理,所述实例可产生色彩值,当通过应用所述静态转移函数将所述色彩值压紧到不同的动态范围中时所述色彩值线性化输出码字。通过应用后处理,所述实例可在解码侧上应用编码侧上的所述操作的反向操作以重新构建所述色彩值。

在一个实例中,本发明描述一种视频处理的方法,所述方法包括:接收表示视频数据的经压紧的色彩值的第一多个码字,经压紧的色彩值表示第一动态范围内的色彩;使用对视频数据非自适应的反向静态转移函数基于第一多个码字解压(uncompact)第二多个码字以产生解压的色彩值,解压的色彩值表示第二、不同动态范围内的色彩,其中第二多个码字为来自经反向后处理的第一多个码字或第一多个码字的码字中的一个;反向后处理第一多个码字以产生第二多个码字或反向预处理解压的色彩值中的至少一个;以及输出解压的色彩值或经反向预处理的解压的色彩值。

在一个实例中,本发明描述一种视频处理的方法,所述方法包括:接收表示第一动态范围内的色彩的视频数据的多个色彩值;使用对经压紧的视频数据非自适应的静态转移函数压紧色彩值以产生表示经压紧的色彩值的多个码字,经压紧的色彩值表示第二、不同动态范围内的色彩;在压紧之前预处理色彩值以产生被压紧的色彩值或后处理由压紧色彩值产生的码字中的至少一个;以及基于经压紧的色彩值或经后处理的经压紧的色彩值中的一个来输出色彩值。

在一个实例中,本发明描述一种用于视频处理的装置,所述装置包括经配置以存储视频数据的视频数据存储器以及包括固定功能或可编程电路中的至少一个的视频后处理器。视频后处理器经配置以:从视频数据存储器接收表示视频数据的经压紧的色彩值的第一多个码字,经压紧的色彩值表示第一动态范围内的色彩;使用对视频数据非自适应的反向静态转移函数基于第一多个码字解压第二多个码字以产生解压的色彩值,解压的色彩值表示第二、不同动态范围内的色彩,其中第二多个码字为来自经反向后处理的第一多个码字或第一多个码字的码字中的一个;反向后处理第一多个码字以产生第二多个码字或反向预处理解压的色彩值中的至少一个;以及输出解压的色彩值或经反向预处理的解压的色彩值。

在一个实例中,本发明描述一种用于视频处理的装置,所述装置包括经配置以存储视频数据的视频数据存储器以及包括固定功能或可编程电路中的至少一个的视频预处理器。所述视频预处理器经配置以:从视频数据存储器接收表示第一动态范围内的色彩的视频数据的多个色彩值;使用对经压紧的视频数据非自适应的静态转移函数压紧色彩值以产生表示经压紧的色彩值的多个码字,经压紧的色彩值表示第二、不同动态范围内的色彩;在压紧之前预处理色彩值以产生被压紧的色彩值或后处理由压紧色彩值产生的码字中的至少一个;以及基于经压紧的色彩值或经后处理的经压紧的色彩值中的一个来输出色彩值。

在一个实例中,本发明描述一种存储指令的计算机可读存储媒体,当执行所述指令时使得用于视频处理的装置的一或多个处理器:接收表示视频数据的经压紧的色彩值的第一多个码字,经压紧的色彩值表示第一动态范围内的色彩;使用对视频数据非自适应的反向静态转移函数基于第一多个码字解压第二多个码字以产生解压的色彩值,解压的色彩值表示第二、不同动态范围内的色彩,其中第二多个码字为来自经反向后处理的第一多个码字或第一多个码字的码字中的一个;反向后处理第一多个码字以产生第二多个码字或反向预处理解压的色彩值中的至少一个;以及输出解压的色彩值或经反向预处理的解压的色彩值。

在一个实例中,本发明描述一种用于视频处理的装置,所述装置包括:用于接收表示视频数据的经压紧的色彩值的第一多个码字的装置,经压紧的色彩值表示第一动态范围内的色彩;用于使用对视频数据非自适应的反向静态转移函数基于第一多个码字解压第二多个码字以产生解压的色彩值的装置,解压的色彩值表示第二、不同动态范围内的色彩,其中第二多个码字为来自经反向后处理的第一多个码字或第一多个码字的码字中的一个;用于反向后处理第一多个码字以产生第二多个码字的装置或用于反向预处理解压的色彩值的装置中的至少一个;以及用于输出解压的色彩值或经反向预处理的解压的色彩值的装置。

在附图和以下描述中阐述一或多个实例的细节。其它特征、目标和优点根据描述、图式和权利要求书将是显而易见的。

附图说明

图1为说明经配置以实施本发明的技术的实例视频编码和解码系统的框图。

图2为说明高动态范围(hdr)数据的概念的图式。

图3为比较高清晰度电视(hdtv)(bt.709)与超高清晰度电视(uhdtv)(bt.2020)的视频信号的色域的概念图。

图4为展示hdr/wcg表示转换的概念图。

图5为展示hdr/wcg反向转换的概念图。

图6为展示实例转移函数的概念图。

图7为展示pqtf(st2084eotf)的输出对比输入的可视化的概念图。

图8为展示具备自适应形状转移函数(tf)的内容自适应hdr处理管线(编码器侧)的概念图。

图9为展示具备固定tf的内容自适应hdr处理管线(编码器侧)的概念图。

图10为展示具备固定tf的内容自适应hdr处理管线(解码器侧)的概念图。

图11为展示具备静态tf的内容自适应hdr管线(编码器侧)的概念图。

图12为展示具备静态tf的内容自适应hdr管线(解码器侧)的概念图。

图13a展示出于可视化目的的与pqtf(st2084)重迭的hdr信号的线性光信号(红色分量)的直方图的实例。

图13b展示由将pqtf(st2084)应用于线性光信号(红色分量)产生的非线性信号的直方图的实例。

图14为由pqtf以及根据本发明中所描述的技术的处理所产生的非线性信号的直方图输出。

图15a为说明在预处理之后pqtf对信号统计数据的影响的图。

图15b为说明由pqtf产生的输出非线性信号的直方图的图。

图16a为说明标准化非线性信号s的直方图的图。

图16b为说明在后处理之后的标准化非线性信号s2的直方图的图。

图17a为说明出于如st2084中所定义的hdr的目的的非线性pqtf的图。

图17b为说明在scale2=1以及offset2=0的情况下经模型化的通过本发明中所描述的技术的线性转移函数y=x的图。

图17c为说明在scalse2=1.5以及offset=-0.25的情况下经模型化的通过本发明中所描述的技术的线性转移函数的图。

图18为说明在应用转移函数之后且在本发明中所描述的后处理技术之前执行色彩转换的实例的概念图。

图19为说明在本发明中所描述的反向后处理技术之后且在应用反向转移函数之前执行反向色彩转换的实例的概念图。

图20a为说明将s2的直方图截割到某一范围的后处理的图。

图20b为说明将s2的直方图截割到某一范围的后处理的另一图。

图20c为说明将s2的直方图截割到某一范围的后处理的另一图。

图21a以及21b为说明在具有尾部处置的本发明中所描述的后处理技术之后的码字的直方图的图。

图22为说明具备静态tf的内容自适应hdr管线(编码器侧)的另一实例的概念图。

图23为说明具备静态tf的内容自适应hdr管线(解码器侧)的另一实例的概念图。

图24为说明具有两个经保留的经译码处置色彩值的直方图的图。

图25a以及25b为说明由本发明中所描述的技术实施的参数自适应函数的图。

图26a、26b以及26c为说明在用本发明中所描述的技术实施的逐段线性转移函数应用到输入信号的情况下的后处理以及此后处理对输出信号的直方图的影响的图。

图27说明作为实例的混合对数伽玛转移函数以及潜在目标范围。

图28说明环绕拐点的拋物线的斜率为可调整的转移函数。

图29为说明在内容自适应高动态范围(hdr)系统中的视频处理的实例方法的流程图。

图30为说明在内容自适应高动态范围(hdr)系统中的视频处理的另一实例方法的流程图。

具体实施方式

本发明涉及译码具有高动态范围(hdr)和宽色域(wcg)表示的视频信号的领域。更特定来说,本发明的技术包含应用于某些色彩空间中的视频数据以实现hdr和wcg视频数据的更高效压缩的信令和操作。所提出的技术可改善用于译码hdr和wcg视频数据的混合式视频译码系统(例如,基于hevc的视频译码器)的压缩效率。

包含混合式视频译码标准的视频译码标准包含itu-th.261、iso/iecmpeg-1visual、itu-th.262或iso/iecmpeg-2visual、itu-th.263、iso/iecmpeg-4visual和itu-th.264(也被称作iso/iecmpeg-4avc),包含其可缩放视频译码(svc)和多视图视频译码(mvc)扩展。新视频译码标准的设计(即,hevc)已由itu-t视频译码专家组(vceg)和iso/iec动画专家组(mpeg)的关于视频译码的联合合作小组(jct-vc)定案。布罗斯(bross)等人的被称作hevc工作草案10(wd10)的hevc草案规范“高效率视频译码(hevc)文本规范草案10(针对fdis和最后号召)(highefficiencyvideocoding(hevc)textspecificationdraft10(forfdis&lastcall))”(itu-tsg16wp3与iso/iecjtc1/sc29/wg11的关于视频译码的联合合作小组(jct-vc),第12次会议:瑞士日内瓦,2013年1月14日到23日,jctvc-l1003v34)可从http://phenix.int-evry.fr/jct/doc_end_user/documents/12_geneva/wg11/jctvc-l1003-v34.zip获得。定案的hevc标准被称作hevc版本1。

王(wang)等人的缺陷报告“高效率视频译码(hevc)缺陷报告(highefficiencyvideocoding(hevc)defectreport)”(itu-tsg16wp3与iso/iecjtc1/sc29/wg11的关于视频译码的联合合作小组(jct-vc),第14次会议:奥地利维也纳,2013年7月25日到8月2日,jctvc-n1003v1)可从http://phenix.int-evry.fr/jct/doc_end_user/documents/14_vienna/wg11/jctvc-n1003-v1.zip获得。经定案的hevc标准文献在2013年4月经公布为itu-th.265,系列h:视听和多媒体系统,视听服务基础架构-移动视频的译码,高效视频译码(国际电信联盟(itu)的电信标准化部门),且在2014年10月公布另一版本。

图1为说明可利用本发明的技术的实例视频编码和解码系统10的框图。如图1中所展示,系统10包含提供稍后将由目的地装置14解码的经编码视频数据的源装置12。明确地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12和目的地装置14可包括广泛范围的装置中的任一者,包含台式计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如,所谓的“智能”电话)、所谓的“智能”平板计算机、电视机、摄影机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似物。在一些状况下,源装置12和目的地装置14可能经装备以用于无线通信。

目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任一类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体以使源装置12能够实时地将经编码视频数据直接发射到目的地装置14。可根据通信标准(例如,无线通信协议)调制经编码视频数据,且将其发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如,射频(rf)频谱或一或多个物理发射线。通信媒体可形成基于封包的网络(例如局域网、广域网或全球网络,例如因特网)的一部分。通信媒体可包含路由器、交换器、基站或任何其它可适用于促进从源装置12到目的地装置14的通信的装备。

在一些实例中,经编码数据可从输出接口22输出到存储装置。类似地,可通过输入接口从存储装置存取经编码数据。存储装置可包含各种分散式或本地存取的数据存储媒体中的任一者,例如,硬盘机、蓝光(blu-ray)光盘、dvd、cd-rom、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置存取经存储的视频数据。文件服务器可为能够存储经编码视频数据且将彼经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、ftp服务器、网络附接存储(nas)装置或本地磁盘机。目的地装置14可经由任何标准数据连接(包含因特网连接)而存取经编码的视频数据。此数据连接可包含无线信道(例如,wi-fi连接)、有线连接(例如,dsl、电缆调制解调器等)或两者的适合于存取存储于文件服务器上的经编码视频数据的组合。从存储装置的经编码视频数据的发射可为流式传输发射、下载发射或其组合。

本发明的技术不必限于无线应用或设定。所述技术可适用于支持各种多媒体应用中的任一者的视频译码,所述应用例如,空中电视广播、有线电视传输、卫星电视发射、因特网流式传输视频发射(例如,经由http的动态自适应流式传输(dash))、经编码到数据存储媒体上的数字视频、存储在数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持应用(例如,视频流式传输、视频播放、视频广播和/或视频电话)。

在图1的实例中,源装置12包含视频源18、视频编码单元21(其包含视频预处理器19和视频编码器20)以及输出接口22。目的地装置14包含输入接口28、视频解码单元29(其包含视频解码器30和视频后处理器31)以及显示装置32。根据本发明,视频预处理器19和视频后处理器31可经配置以应用本发明中所描述的实例技术。举例来说,视频预处理器19和视频后处理器31可包含经配置以应用静态转移函数的静态转移函数单元,也具有可调适信号特性的预处理和后处理单元。

在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如外部摄影机)接收视频数据。同样地,目的地装置14可与外部显示装置介接,而非包含集成式显示装置。

图1中所说明的系统10仅为一个实例。用于处理视频数据的技术可通过任何数字视频编码和/或解码装置来执行。尽管本发明的技术一般由视频编码装置执行,但所述技术也可由视频编码器/解码器(通常被称作“codec”)执行。为了易于描述,参照在源装置12和目的地装置14中的相应一者中预形成本发明中所描述的实例技术的视频预处理器19和视频后处理器31来描述本发明。源装置12和目的地装置14仅为此类译码装置的实例,其中源装置12产生经译码视频数据以供发射到目的地装置14。在一些实例中,装置12、14可以大体上对称的方式操作,使得装置12、14中的每一者包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传播,以用于(例如)视频流式传输、视频播放、视频广播或视频电话。

源装置12的视频源18可包含视频俘获装置,例如摄像机、含有先前俘获的视频的视频存档和/或用以从视频内容提供者接收视频的视频馈送接口。作为另一替代,视频源18可将基于计算机图形的数据产生为源视频、或产生实况视频、存档视频和计算机产生的视频的组合。在一些状况下,如果视频源18为摄像机,那么源装置12和目的地装置14可形成所谓的摄影机电话或视频电话。然而,如上文所提及,本发明所描述的技术一般可适用于视频译码,且可适用于无线和/或有线应用。在每一状况下,经俘获、经预俘获或计算机产生的视频可由视频编码单元21编码。经编码视频信息可接着由输出接口22输出到计算机可读媒体16上。

计算机可读媒体16可包含瞬间媒体,例如,无线广播或有线网络发射,或存储媒体(即,非暂时性存储媒体),例如,硬盘、闪存盘、紧密光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可从源装置12接收经编码视频数据,且(例如)经由网络发射将经编码视频数据提供到目的地装置14。类似地,媒体产生设施(例如光盘冲压设施)的计算装置可从源装置12接收经编码视频数据且产生含有经编码视频数据的光盘。因此,在各种实例中,可理解计算机可读媒体16包含各种形式的一或多个计算机可读媒体。

目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码单元21的视频编码器20定义的语法信息(其也由视频解码单元29的视频解码器30所使用),包含描述块和其它经译码单元(例如,图片群组(gop))的特性和/或处理的语法元素。显示装置32将经解码视频数据显示给用户,且可包括各种显示装置中的任一者,例如,阴极射线管(crt)、液晶显示器(lcd)、等离子显示器、有机发光二极管(oled)显示器或另一类型的显示装置。

如所说明,视频预处理器19从视频源18接收视频数据。视频预处理器19可经配置以处理视频数据以将其转换成适用于通过视频编码器20编码的形式。举例来说,视频预处理器19可执移动态范围压紧(例如,使用非线性转移函数)、到较紧密或稳固的色彩空间的色彩转换和/或浮点到整数表示的转换。视频编码器20可对由视频预处理器19输出的视频数据执行视频编码。视频解码器30可执行视频编码器20的反向操作以解码视频数据,且视频后处理器31可执行视频预处理器19的反向操作以将视频数据转换成适用于显示器的形式。举例来说,视频后处理器31可执行整数到浮点转换、从紧密或稳固色彩空间的色彩转换和/或动态范围压紧的反向操作以产生适用于显示器的视频数据。

视频编码单元21和视频解码单元29各可实施为各种固定功能和可编程电路中的任一者,例如一或多个微处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器执行指令以执行本发明的技术。视频编码单元21和视频解码单元29中的每一者可包含于一或多个编码器或解码器中,编码器或解码器中的任一者可集成为相应装置中的组合式编码器/解码器(codec)的部分。

尽管视频预处理器19和视频编码器20经说明为视频编码单元21内的独立单元,且视频后处理器31和视频解码器30经说明为视频解码单元29内的独立单元,但本发明中所描述的技术并不限于此。视频预处理器19和视频编码器20可形成为共同装置(例如,同一集成电路或容纳在同一芯片或芯片封装内)。类似地,视频后处理器31和视频解码器30可形成为共同装置(例如,同一集成电路或容纳在同一芯片或芯片封装内)。

在一些实例中,视频编码器20和视频解码器30根据例如以下各者的视频压缩标准操作:iso/iecmpeg-4visual和itu-th.264(也被称为iso/iecmpeg-4avc),包含其可缩放视频译码(svc)扩展、多视图视频译码(mvc)扩展和基于mvc的三维视频(3dv)扩展。在一些情况下,遵守基于mvc的3dv的任何位流始终含有与mvc简档(例如,立体高简档)一致的子位流。此外,存在持续努力以产生h.264/avc的3dv译码扩展,即基于avc的3dv。视频译码标准的其它实例包含itu-th.261、iso/iecmpeg-1visual、itu-th.262或iso/iecmpeg-2visual、itu-th.263、iso/iecmpeg-4visual和itu-th.264、iso/iecvisual。在其它实例中,视频编码器20和视频解码器30可经配置以根据itu-th.265,hevc标准操作。

在hevc和其它视频译码标准中,视频序列通常包含一系列图片。图片也可被称作“帧”。图片可包含表示为sl、scb和scr的三个样本阵列。sl为明度样本的二维阵列(即,块)。scb是cb色度样本的二维阵列。scr是cr色度样本的二维阵列。色度样本也可在本文中被称作“色度”样本。在其它情况下,图片可为单色的,且可仅包含明度样本阵列。

视频编码器20可产生一组译码树状结构单元(ctu)。ctu中的每一者可包括明度样本的译码树型块、色度样本的两个对应译码树型块和用以译码译码树型块的样本的语法结构。在单色图片或具有三个单独彩色平面的图片中,ctu可包括单一译码树型块和用于译码所述译码树型块的样本的语法结构。译码树型块可为样本的n×n块。ctu也可被称作“树型块”或“最大译码单元”(lcu)。hevc的ctu可广泛地类似于例如h.264/avc的其它视频译码标准的宏块。然而,ctu未必限于特定大小,且可包含一或多个译码单元(cu)。切片可包含在光栅扫描中连续排序的整数数目个ctu。

本发明可使用术语“视频单元”或“视频块”以指样本的一或多个块,和用于译码样本的一或多个块的样本的语法结构。视频单元的实例类型可包含hevc中的ctu、cu、pu、变换单元(tu),或其它视频译码标准中的宏块、宏块分割区等等。

视频编码器20可将cu的译码块分割为一或多个预测块。预测块可为应用相同预测的样本的矩形(即,正方形或非正方形)块。cu的预测单元(pu)可包括图片的明度样本的预测块,图片的色度样本的两个对应预测块,和用于对预测块样本进行预测的语法结构。在单色图片或具有三个单独彩色平面的图片中,pu可包括单一预测块,和用以对预测块样本进行预测的语法结构。视频编码器20可针对cu的每一pu的明度、cb和cr预测块产生预测性明度、cb和cr块。

视频编码器20可使用帧内预测或帧间预测来产生pu的预测性块。如果视频编码器20使用帧内预测产生pu的预测性块,那么视频编码器20可基于与pu相关联的图片的经解码样本产生pu的预测性块。

在视频编码器20产生cu的一或多个pu的预测性明度块、预测性cb块和预测性cr块之后,视频编码器20可产生cu的明度残余块。cu的明度残余块中的每一样本指示cu的预测性明度块中的一个中的明度样本与cu的原始明度译码块中的对应样本之间的差异。另外,视频编码器20可产生cu的cb残余块。cu的cb残余块中的每一样本可指示cu的预测性cb块中的一个中的cb样本与cu的原始cb译码块中的对应样本之间的差异。视频编码器20也可产生cu的cr残余块。cu的cr残余块中的每一样本可指示cu的预测性cr块的一者中的cr样本与cu的原始cr译码块中的对应样本之间的差异。

此外,视频编码器20可使用四分树分割以将cu的明度、cb和cr残余块分解成一或多个明度、cb和cr变换块。变换块可为应用相同变换的样本的矩形块。cu的变换单元(tu)可包括明度样本的变换块、色度样本的两个对应变换块和用于对变换块样本进行变换的语法结构。在单色图片或具有三个单独彩色平面的图片中,tu可包括单一变换块,和用以对变换块样本进行变换的语法结构。因此,cu的每一tu可与明度变换块、cb变换块和cr变换块相关联。与tu相关联的明度变换块可为cu的明度残余块的子块。cb变换块可为cu的cb残余块的子块。cr变换块可为cu的cr残余块的子块。

视频编码器20可将一或多个变换应用于tu的明度变换块,以产生tu的明度系数块。系数块可为变换系数的二维阵列。变换系数可为纯量。视频编码器20可将一或多个变换应用于tu的cb变换块,以产生tu的cb系数块。视频编码器20可将一或多个变换应用于tu的cr变换块以产生tu的cr系数块。

在产生系数块(例如,明度系数块、cb系数块或cr系数块)之后,视频编码器20可量化系数块。量化大体上指变换系数经量化以可能减少用以表示变换系数的数据的量从而提供进一步压缩的过程。此外,视频编码器20可反量化变换系数,并将反向变换应用到变换系数,以便重新构建图片的cu的tu的变换块。视频编码器20可使用cu的tu的经重新构建的变换块和cu的pu的预测性块来重新构建cu的译码块。通过重新构建图片的每一cu的译码块,视频编码器20可重新构建图片。视频编码器20可将经重新构建的图片存储于经解码图片缓冲器(dpb)中。视频编码器20可将dpb中的经重新构建图片用于帧间预测和帧内预测。

在视频编码器20量化系数块之后,视频编码器20可熵编码指示经量化变换系数的语法元素。举例来说,视频编码器20可对指示经量化变换系数的语法元素执行上下文自适应二进制算术译码(cabac)。视频编码器20可在位流中输出经熵编码的语法元素。

视频编码器20可输出包含形成经译码图片和相关联数据的表示的位序列的位流。位流可包括网络抽象层(nal)单元的序列。所述nal单元中的每一者包含nal单元标头且囊封原始字节序列酬载(rbsp)。nal单元标头可包含指示nal单元类型码的语法元素。通过nal单元的nal单元标头所指定的nal单元类型码指示nal单元的类型。rbsp可为囊封于nal单元内的含有整数数目个字节的语法结构。在一些情况下,rbsp包含零个位。

不同类型的nal单元可囊封不同类型的rbsp。举例来说,第一类型的nal单元可囊封图片参数集(pps)的rbsp,第二类型的nal单元可囊封经译码切片的rbsp,第三类型的nal单元可囊封补充增强信息(sei)的rbsp等等。pps为可含有适用于零个或更多个完整经译码图片的语法元素的语法结构。囊封用于视频译码数据的rbsp(相反于用于参数集和sei消息的rbsp)的nal单元可被称作视频译码层(vcl)nal单元。囊封经译码切片的nal单元在本文中可被称作经译码切片nal单元。用于经译码切片的rbsp可包含切片标头和切片数据。

视频解码器30可接收位流。另外,视频解码器30可剖析位流以从位流解码语法元素。视频解码器30可至少部分基于从位流解码的语法元素而重新构建视频数据的图片。重新构建视频数据的过程可与由视频编码器20执行的过程大体互逆。举例来说,视频解码器30可使用pu的运动向量确定当前cu的pu的预测性块。视频解码器30可使用pu的一或多个运动向量产生pu的预测性块。

另外,视频解码器30可反量化与当前cu的tu相关联的系数块。视频解码器30可对系数块执行反向变换以重新构建与当前cu的tu相关联的变换块。通过将当前cu的pu的预测性样本块的样本添加到当前cu的tu的变换块的对应样本,视频解码器30可重新构建当前cu的译码块。通过重新构建图片的每一cu的译码块,视频解码器30可重新构建图片。视频解码器30可将经解码图片存储于经解码图片缓冲器中,以用于输出和/或用于解码其它图片。

预料下一代视频应用对以hdr(高动态范围)和wcg(宽色域)表示经俘获的场景的视频数据操作。所利用的动态范围和色域的参数为视频内容的两个独立属性,且其出于数字电视和多媒体服务的目的的规范由若干国际标准定义。举例来说,itu-rrec.709定义hdtv(高清晰度电视)的参数,例如标准动态范围(sdr)和标准色域,且itu-rrec.2020指定例如hdr和wcg的uhdtv(超高清晰度电视)参数。也存在其它标准开发组织(sdo)文献,其指定其它系统中的动态范围和色域属性,例如p3色域定义于smpte-231-2(运动图片和电视工程师协会)中,且hdr的一些参数定义于stmpte-2084中。在下文中提供视频数据的动态范围和色域的简要描述。

动态范围通常经定义为视频信号的最小与最大亮度之间的比率。也可依据‘f光阑’测量动态范围,其中一个f光阑对应于信号动态范围的加倍。在mpeg的定义中,hdr内容为以大于16个f光阑的亮度变化为特征的此类内容。在一些条件下,10个f光阑与16个f光阑之间的等级被视为中间动态范围,但在其它定义中可被视为hdr。在一些实例中,hdr视频内容可为相较于传统使用的具备标准动态范围的视频内容(例如,如由itu-rrec.bt.709指定的视频内容)具有较高动态范围的任何视频内容。同时,人类视觉系统(hvs)能够感知大得多的动态范围。然而,hvs包含用以窄化所谓同时范围的自适应机制。对由hdtv的sdr、uhdtv的经预期hdr提供的动态范围和hvs动态范围的可视化展示于图2中。

当前视频应用和服务由rec.709管控且提供sdr,通常支持每m2大约0.1到100烛光(candela,cd)(常常被称作“尼特(nit)”)的亮度(或明度)范围,从而导致小于10个f光阑。下一代视频服务经预期以提供高达16个f光阑的动态范围。尽管详细规范当前在开发中,但在smpte-2084和rec.2020中已经指定一些初始参数。

除hdr以外更真实的视频体验的另一方面为色彩维度,其常规地由色域定义。图3为展示sdr色域(基于bt.709红色、绿色和蓝色原色的三角形)以及uhdtv的较宽色域(基于bt.2020红色、绿色和蓝色原色的三角形)的概念图。图3也描绘所谓的频谱轨迹(由舌片形状的区定界),其表示天然色彩的界限。如由图3所说明,从bt.709原色到bt.2020原色的移动旨在为uhdtv服务提供多约70%的色彩。d65指定给定规范(例如,bt.709和/或bt.2020规范)的白色。

色域规范的几个实例展示于表1中。

表1.色域参数

如表1中可以看出,色域可由白点的x和y值且由原色(例如,红色(r)、绿色(g)以及蓝色(b))的x和y值定义。x和y值表示色彩的色度(x)和亮度(y),如由cie1931色彩空间定义。cie1931色彩空间定义纯色(例如,就波长来说)之间的联系和人眼如何感知此类色彩。

通常在每分量极高精度下(甚至浮点)以4:4:4色度格式和极宽色彩空间(例如,cie1931xyz色彩空间)获取和存储hdr/wcg。此表示以高精度为目标且在数学上(几乎)无损。然而,此格式特征可包含许多冗余且对于压缩目的来说并非最佳的。具备基于hvs的假定的较低精确度格式通常用于目前先进技术的视频应用。

出于压缩的目的,典型的视频数据格式转换由三个主要过程构成,如图4中所展示。可由视频预处理器19执行图4的技术。线性rgb数据110可为hdr/wcg视频数据且可以浮点表示存储。可使用用于动态范围压紧的非线性转移函数(tf)来压紧线性rgb数据110。举例来说,视频预处理器19可包含经配置以使用用于动态范围压紧的非线性转移函数的转移函数(tf)单元112。

tf单元112的输出可为一组码字,其中每一码字表示色彩值(例如,照明等级)的范围。动态范围压紧意味着线性rgb数据110的动态范围可为第一动态范围(例如,如在图2中所说明的人类视觉范围)。所得码字的动态范围可为第二动态范围(例如,如在图2中所说明的hdr显示范围)。因此,码字相较于线性rgb数据110俘获较小动态范围,且因此,tf单元112执移动态范围压紧。

tf单元112执行非线性函数,其意义在于码字与输入色彩值之间的映射并非相等地间隔开(例如,码字为非线性码字)。非线性码字意味着输入色彩值的改变并不显现为输出码字的线性比例改变,而是显现为码字的非线性改变。举例来说,如果色彩值表示低照明,那么输入色彩值的小改变将导致由tf单元112输出的码字的小改变。然而,如果色彩值表示高照明,那么对于码字的小改变将需要输入色彩值的相对较大的改变。由每一码字表示的照明范围并非恒定的(例如,第一码字对于第一照明范围为相同的且第二码字对于第二照明范围为相同的,且第一与第二范围不同)。下文所描述的图7说明由tf单元112所应用的转移函数的特性。

如更详细地描述,技术可缩放和偏移tf单元112接收的线性rgb数据110,且/或缩放和偏移tf单元112输出的码字以较好地利用码字空间。tf单元112可使用任何数目的非线性转移函数(例如,如smpte-2084中所定义的pq(感知量化器)tf)来压紧线性rgb数据110(或经缩放和偏移的rgb数据)。

在一些实例中,色彩转换单元114将经压紧的数据转换成较适用于通过视频编码器20压缩的较紧密或稳固的色彩空间(例如,经由色彩转换单元转换成yuv或ycrcb色彩空间)。如更详细地描述,在一些实例中,在色彩转换单元114执行色彩转换之前,所述技术可缩放和偏移由tf单元112应用tf所输出的码字。色彩转换单元114可接收这些经缩放和偏移的码字。在一些实例中,一些经缩放和偏移的码字可大于或小于相应阈值;对于这些码字,所述技术可指派相应经设定码字。

接着使用浮点到整数表示转换(例如,经由量化单元116)来量化此数据以产生发射到视频编码器20以被编码的视频数据(例如,hdr数据118)。在此实例中,hdr数据118呈整数表示。hdr数据118现可呈较适用于由视频编码器20压缩的格式。应理解,图4中所描绘的过程的次序被给定作为实例,且在其它应用中可改变。举例来说,色彩转换可先于tf处理。另外,视频预处理器19可将较多处理(例如,空间次采样)应用于色彩分量。

因此,在图4中,通过由tf单元112所利用的非线性转移函数(例如,如smpte-2084中所定义的pqtf)来压紧呈线性和浮点表示的输入rgb数据110的高动态范围,之后将其转换成较适用于压缩的目标色彩空间(例如,由色彩转换单元114)(例如,ycbcr),且接着经量化(例如,量化单元116)以达成整数表示。这些元件的次序经给定作为实例,且在真实世界应用中可改变,例如色彩转换可先于tf模块(例如,tf单元112)。如此类空间次采样的额外处理可在tf单元112应用转移函数之前应用到色彩分量。

在解码器侧处的反向转换描绘于图5中。可由视频后处理器31执行图5的技术。举例来说,视频后处理器31从视频解码器30接收视频数据(例如,hdr数据120)且反量化单元122可反量化数据;反向色彩转换单元124执行反向色彩转换;且反向非线性转移函数单元126执行反向非线性转移以产生线性rgb数据128。

反向色彩转换单元124执行的反向色彩转换过程可为色彩转换单元114执行的色彩转换过程的反向过程。举例来说,反向色彩转换单元124可将hdr数据从ycrcb格式转换回到rgb格式。反向转移函数单元126可将反向转移函数应用于数据以添加回由tf单元112压紧的动态范围,从而重建线性rgb数据128。

在本发明中所描述的实例技术中,在反向转移函数单元126执行反向转移函数之前,视频后处理器31可应用反向后处理;且在反向转移函数单元126执行反向转移函数之后,视频后处理器31可应用反向预处理。举例来说,如上文所描述,在一些实例中,视频预处理器19可在tf单元112之前应用预处理(例如,缩放和偏移)且可在tf单元112之后应用后处理(例如,缩放和偏移)。为了补偿预处理和后处理,视频后处理器31可在反向tf单元126执行反向转移函数之前应用反向后处理且在反向tf单元126执行反向转移函数之后应用反向预处理。应用预处理和后处理两者以及反向后处理和反向预处理两者为可选的。在一些实例中,视频预处理器19可应用预处理和后处理中的一个,但不可应用两者,且对于此类实例,视频后处理器31可应用由视频预处理器19所应用的处理的反向处理。

进一步详细地描述图4中所说明的实例视频预处理器19,其中理解图5中所说明的实例视频后处理器31大体上执行互逆操作。将转移函数应用于数据(例如,hdr/wcgrgb视频数据)以压紧其动态范围且使得有可能通过有限数目的位表示数据。表示数据的这些有限数目的位被称为码字。此函数通常为一维(1d)非线性函数,其反映如rec.709中针对sdr所指定的终端用户显示器的电光转移函数(eotf)的逆函数,或近似在smpte-2084中针对hdr所指定的pqtf的对亮度改变的hvs感知。oetf的反向处理(例如,如由视频后处理器31执行)为eotf(电光转移函数),其将码等级映射回到明度。图6展示非线性tf的若干实例。这些转移函数也可分开地应用于每一r、g和b分量。

在本发明的上下文中,术语“信号值”或“色彩值”可用于描述对应于图像元素的特定色彩分量(例如,r、g、b或y)的值的明度级。信号值通常表示线性光等级(明度值)。术语“码等级”、“数字码值”或“码字”可指图像信号值的数字表示。通常,此数字表示表示非线性信号值。eotf表示提供到显示装置(例如,显示装置32)的非线性信号值与由显示装置产生的线性色彩值之间的关系。

st2084的规范定义eotf应用如下。将tf应用于标准化线性r、g、b值,此导致r'g'b'的非线性表示。st2084按norm=10000定义标准化,norm=10000与10000尼特(烛光/平方米)的峰值亮度相关联。

○r'=pq_tf(max(0,min(r/norm,1)))(1)

○g'=pq_tf(max(0,min(g/norm,1)))(1)

○b'=pq_tf(max(0,min(b/norm,1)))

其中

通过x轴上的经标准化到范围0…1的输入值(线性色彩值)和y轴上的标准化输出值(非线性色彩值),在图7中将pqeotf可视化。如根据图7中的曲线可以看出,将输入信号的动态范围的百分的1(低照明)转换成输出信号的动态范围的50%。

存在可用以表示输入线性色彩值的有限数目个码字。图7说明对于pqeotf,大致50%的可用码字被专用于低照明输入信号,使得较少可用码字用于较高照明输入信号。因此,相对高照明输入信号的轻微改变可能未经俘获,这是因为表示这些轻微改变的码字不足。然而,可存在用于低照明输入信号的不必要的较大数目的可用码字,意味着甚至相对低照明输入信号的极轻微的改变也可由不同码字表示。因此,可存在用于低照明输入信号的可用码字的较大分布和用于高照明输入信号的可用码字的相对低分布。

通常,eotf经定义为具备浮点准确度的函数。因此,如果应用反向tf(即,所谓的oetf),那么无误差引入到具备此非线性的信号。st2084中所指定的反向tf(oetf)经定义为inversepq函数:

其中

通过浮点准确度,依序应用eotf和oetf提供不具有误差的完美的重新构建。然而,对于流式传输或广播服务,此表示并非最佳的。在下文中描述非线性r′g′b′数据的具备固定位准确度的较紧密表示。应注意,eotf和oetf为当前非常活跃的研究的主题,且一些hdr视频译码系统中所利用的tf可不同于st2084。

对于hdr,其它转移函数也在考虑中。实例包含菲利普(philips)tf或bbc混合式“对数伽玛”tf。bbc混合式“对数伽玛”tf是基于rec709tf,以用于sdr回溯兼容性。为了延伸动态范围,bbc混合式将第三部分添加到较高输入明度下的rec709曲线。曲线的新部分为对数函数。

rec709中所定义的oetf为:

其中l为图像的明度,0≤l≤1;且v为对应的电信号。在rec2020中,同一方程式经指定为:

其中e为通过参考白电平标准化且与将由参考摄影机色彩信道r、g、b检测到的隐式光强度成比例的电压。e′为所得非线性信号。

对于10位的系统,α=1.099且β=0.018

对于12位的系统,α=1.0993且β=0.0181

尽管未经明确地陈述,但α和β为以下联立方程式的解:

4.5β=αβ0.45-(α-1)

4.5=0.45αβ-0.55

第一方程式为在e=β时线性函数和伽玛函数的值的平均化,且第二方程式为也在e=β时两个函数的梯度。

在下文中展示混合式“对数伽玛”中的额外部分且图27说明oetf。举例来说,图27展示作为实例的混合式对数伽玛转移函数和潜在目标范围。

在图27中,通过a、b、c、d以及e标记相应曲线以与曲线图的右下方方框中的相应图例匹配。明确地说,a对应于10位的pq-eotf,b对应于8位的bt.709eotf,c对应于10位的bt.709eotf,d对应于10位的bbc混合式对数伽玛eotf以及e对应于12位的pq-eotf。

图28说明环绕拐点的拋物线的斜率为可调整的转移函数。图28仅作为具备斜率调整实例5000[烛光/平方米]的一个实例而经说明。然而,具备可调整斜率的转移函数的其它实例为可能的。

rgb数据通常用作输入,这是因为其由图像俘获传感器产生。然而,此色彩空间在其分量当中具有高冗余且对于紧密表示来说并非最佳的。为了达成较紧密且较稳固的表示,通常将rgb分量转换成较适用于压缩的较不相关的色彩空间(例如ycbcr)(即,执行色彩变换)。此色彩空间将呈明度形式的亮度和呈不同的不相关分量的色彩信息分隔开。

对于现代视频译码系统,通常使用的色彩空间为ycbcr,如itu-rbt.709或itu-rbt.709中所指定。bt.709标准中的ycbcr色彩空间指定从r′g′b′到y′cbcr(非恒定明度表示)的以下转换过程:

○y′=0.2126*r′+0.7152*g′+0.0722*b′(3)

以上过程也可使用避免cb和cr分量的除法的以下近似转换来实施:

○y′=0.212600*r′+0.715200*g′+0.072200*b′

○cb=-0.114572*r′-0.385428*g′+0.500000*b′(4)

○cr=0.500000*r′-0.454153*g′-0.045847*b′

itu-rbt.2020标准指定从r′g′b′到y′cbcr(非恒定明度表示)的以下转换过程:

○y′=0.2627*r′+0.6780*g′+0.0593*b′

以上过程也可使用避免cb和cr分量的除法的以下近似转换来实施:

应注意,两个色彩空间均保持标准化。因此,对于在0…1范围内经标准化的输入值,所得值将映射到范围0…1。一般来说,通过浮点准确度所实施的色彩转换提供完美的重新构建,因此此过程无损。

对于量化和/或固定点转换,上文所描述的处理阶段通常以浮点准确度表示实施,因此所述处理阶段可被视为无损的。然而,对于大多数消费型电子装置应用,此类型的准确度可被视为冗余且昂贵的。对于此类服务,将目标色彩空间中的输入数据转换成目标位深度固定点准确度。某些研究展示与pqtf组合的10到12位的准确度足以为具有16个f光阑的hdr数据提供小于恰可辨差异(just-noticeabledifference)的失真。可用大多数目前先进技术的视频译码解决方案来进一步译码用10位准确度表示的数据。此转换过程包含信号量化且为有损译码元件,且为经引入到经转换数据的不准确度源。

应用到目标色彩空间(在此实例中,ycbcr)中的码字的此类量化的实例展示在下文中。将以浮点准确度表示的输入值ycbcr转换成具有y值的固定位深度bitdepthy和色度值(cb、cr)的bitdepthc的信号。

其中

round(x)=sign(x)*floor(abs(x)+0.5)

如果x<0,那么sign(x)=-1;如果x=0,那么sign(x)=0;如果x>0,那么sign(x)=1

floor(x)小于或等于x的最大整数

如果x>=0,那么abs(x)=x;如果x<0,那么abs(x)=-x

clip1y(x)=clip3(0,(1<<bitdepthy)-1,x)

clip1c(x)=clip3(0,(1<<bitdepthc)-1,x)

如果z<x,那么clip3(x,y,z)=x;如果z>y,那么clip3(x,y,z)=y;否则clip3(x,y,z)=z

一些技术可能不十分适合于hdr和wcg视频数据。大多数当前可公开获得的用于hdr视频系统的用途的eotf(例如,ph、菲利浦以及bbc)为独立地应用于r、g和b分量且并不考虑hdr视频时空统计数据或区域亮度级的静态的、与内容无关的1d转移函数。就hdr视频译码系统中的此类eotf利用来说,此方法将导致对于hdr视频内容的所提供视觉质量来说的非最佳位分配。

当前所利用的hdr处理管线的第二问题为目标色彩空间中的非线性码字从浮点准确度表示到表示的静态转换。通常,码字空间为固定的且在时间和空间上变化的hdr内容将无法得到最佳表示。以下提供关于这两个问题的更多细节。

关于静态1deotf的非最佳性,st2084中所定义的eotf指定表示为pqtf的静态的、与内容无关的1d转移函数,其假定地基于在亮度的特定等级(几烛光/平方米)下人类视觉系统(hvs)的感知敏感度。尽管大多数研究定义对以烛光/平方米为单位的亮度的hvs感知敏感度,但pqtf被独立地应用于色彩值r、g和b中的每一者,如在方程式1中(例如,以确定r′、g′以及b′);且并不利用此rgb像素的亮度强度。此导致pqtf在近似对所得r′g′b′的非线性的hvs敏感度时的可能的不准确度,例如r′g′b′色彩值的组合可导致不同等级的亮度,所述亮度本应与相较于独立地应用于r、g、b分量中的每一者的pqtf值的另一pqtf值相关联。

此外,归因于此设计意向,pqtf组合了两个模式(所谓的夜间亮光视觉和微光(所谓的夜间)视觉)下的hvs敏感度。当场景的亮度在0.03cd/m2以下时后一视觉开始起作用,且以以降低色彩感知为代价的高得多的敏感度为特征。为了实现高敏感度,所利用的pqtf将较大量的码字提供到低明度值,如图7中所反映。如果图片的亮度为低hvs,那么此类码字分布可为最佳的且将在夜间视觉模式下操作。举例来说,如果码字对亮度的较小改变敏感,那么此类码字分布可为最佳的。然而,典型的hdr图片可以明亮的场景和暗的有噪声的片段为特征,归因于从最接近的明亮样本的遮蔽,暗的有噪声的片段将不影响视觉质量但将大大影响使用当前静态tf的位速率。

关于对码字空间的低效利用,量化以浮点准确度所表示的非线性码字(y′、cb、cr)和其如方程式(7)中所展示的具有固定数目的位的表示(dy′、dcb、dcr)为hdr管线的主要压缩工具。通常,在量化之前输入信号的动态范围小于1.0,且对于y分量属于在0…1内的范围,以及对于cb和cr分量属于范围-0.5…0.5。

然而,hdr信号的实际分布逐帧地变化,因此,如方程式(7)中所展示的量化将不提供最小量化误差,且可通过调整hdr信号的动态范围以与等于1.0的预料范围匹配来改善。

为了解决上文所描述的问题,可考虑以下解决方案。eotf可经定义为具有依据内容性质(例如,在帧层级)改变的形状的动态的、内容自适应转移函数,如图8中所说明。图8说明具有自适应形状tf单元112′的内容自适应hdr处理管线(编码器侧)。举例来说,图8说明视频预处理器19的另一实例,其包含由tf单元所利用的自适应形状tf函数。

图8的组件大体上与图4的组件一致。在图8的实例中,与图4中的实例的那些组件具有相同参考标号的组件相同。然而,在图8中,自适应tf单元112′应用自适应tf,而非tf单元112应用静态tf,如图4中所说明。在此实例中,自适应tf单元112′执行数据压紧的方式为自适应的且可基于视频内容而改变。尽管对应的视频后处理器31未经说明,但此实例视频后处理器31将执行自适应反向转移函数而非图5的反向转移函数单元126的静态反向转移函数。视频预处理器19将输出指示tf单元112′用以调适tf的参数的信息。视频后处理器31将相应地接收指示tf单元112′用以调适自适应反向转移函数的参数的此类信息。

然而,此技术可需要转移函数适应的参数的广泛信令以及支持此适应性的实施方案,例如存储多个查找表或实施方案分支。此外,pqeotf的非最佳性的某些方面可经由3d转移函数解决。对于某些实施方案和信令成本,此类方法可能太昂贵。

在本发明中,信令指输出用于解码或以其它方式重新构建视频数据的语法元素或其它视频数据。经信令的参数可经存储以供目的地装置14稍后检索或可直接发射到目的地装置14。

本发明描述使用静态固定转移函数(tf)的内容自适应hdr视频系统。本发明描述将静态tf保持在管线中,但使信号特性适应固定处理流程。此可通过自适应处理待由tf处理的信号或由应用tf所产生的信号而达成。某些技术可对这些适应机制两者进行组合。在解码器(例如,视频后处理器31)处,将应用自适应过程(其与在编码器侧(例如,视频预处理器19)处所应用的过程反向)。

图9为展示具备固定tf的内容自适应hdr处理管线(编码器侧)的概念图。如所说明,视频预处理器19包含预处理单元134(也被称作动态范围调整(dra1)、tf单元112、后处理单元138(也被称作dra2)、色彩转换单元114和量化单元116。

在所说明的实例中,视频预处理器19可经配置为固定功能和可编程电路。举例来说,视频预处理器19可包含共同或分开地形成预处理单元134、tf单元112、后处理单元138、色彩转换单元114和量化单元116的晶体管、电容器、电感器、无源和有源组件、算术逻辑单元(alu)、初等函数单元(efu)和类似物。在一些实例中,视频预处理器19包含可编程核心,其执行使得预处理单元134、tf单元112、后处理单元138、色彩转换单元114和量化单元116执行其相应功能的指令。在这些实例中,视频数据存储器132或某一其它存储器可存储由视频预处理器19执行的指令。

在图9中,为了易于理解,也说明视频数据存储器132。举例来说,视频数据存储器132可在视频预处理器19接收视频数据之前暂时存储视频数据。作为另一实例,视频预处理器19输出的任何视频数据可暂时存储在视频数据存储器132中(例如,在输出到视频编码器20之前存储在视频数据存储器中)。视频数据存储器132可为视频预处理器19的一部分或可在视频预处理器19外部。

可(例如)从视频源18获得存储于视频数据存储器132中的视频数据。视频数据存储器132可由例如动态随机存取存储器(dram)的各种存储器装置中的任一者形成,包含同步dram(sdram)、磁阻式ram(mram)、电阻式ram(rram)或其它类型的存储器装置。在各种实例中,视频数据存储器132可与视频预处理器19的其它组件一起在芯片上,或相对于那些组件在芯片外。

如下文更详细地描述,预处理单元134(例如,dra1)在静态转移函数单元112应用静态转移函数之前预处理线性rbg数据110。预处理的一部分包含缩放和偏移(例如,将输入值与因数相乘以缩放,且添加值以偏移)。在一些实例中,预处理单元134基于视频内容预处理视频数据(例如,缩放因数和偏移因数是基于视频内容)。tf单元112接着将转移函数应用于经缩放和偏移的输入值以产生多个码字。在此实例中,tf单元112应用压紧输入值的动态范围的静态转移函数以使得所产生的多个码字表示相较于输入色彩值(例如,线性rgb数据110)较小的动态范围内的色彩。

后处理单元136(例如,dra2)对由tf单元112所产生的码字执行后处理功能。举例来说,tf单元112的输出可为表示色彩值的非线性码字。后处理单元136也可缩放和偏移由tf单元112输出的码字。色彩转换单元114对后处理单元138的输出执行色彩转换(例如,从rgb转换到ycrcb),且量化单元116对色彩转换单元114的输出执行量化。

通过预处理线性rgb数据110,预处理单元134可经配置以缩放和偏移线性rgb数据110,使得尽管tf单元112应用静态转移函数,但到tf单元112的输入经调整使得tf单元112的输出码字更为线性。另外,通过预处理线性rgb数据110,预处理单元134可使用视频内容以选择考虑到时空统计数据或区域亮度级的缩放和偏移参数。

可存在预处理单元134可确定缩放和偏移参数的各种方式。作为一个实例,预处理单元134可确定图片中色彩中的每一者的直方图(例如,确定红色的直方图、绿色的直方图以及蓝色的直方图)。直方图指示有多少特定色彩的像素具有特定照明等级。可通过tf单元112将应用的转移函数的数学表示来预编程预处理单元134,以使得预处理单元134可缩放和偏移色彩值以提高tf单元112输出的码字的线性。

预处理单元134可在输入信号的允许的码字空间的完整动态范围[0…1]内的有限跨距[hist_min…hist_max]内使输入信号的直方图标准化。预处理单元134可通过水平地拉伸色彩值中的每一者的直方图且基于经拉伸的直方图确定偏移和缩放而确定待应用于输入信号的缩放和偏移参数。举例来说,用于确定偏移和缩放的方程式可为:

offset1=-hist_min

scale1=1/(hist_max-hist_min)

预处理单元134可使用offset1和scale1的方程式确定色彩中的每一者的偏移和缩放参数,且应用如更详细地描述的offset1和scale1参数以缩放和偏移色彩值。可存在预处理单元134确定用于预处理的偏移和缩放参数的各种其它方式,且以上方程式被提供作为一个实例。

后处理单元138可以类似方式确定偏移和缩放参数,但是后处理单元138对色彩码字应用确定偏移和缩放参数。举例来说,后处理单元138可确定tf单元112输出的码字中的每一者的直方图。后处理单元138可在经允许的码字空间的完整动态范围[0…1]内的有限跨距[hist_min…hist_max]内将码字的直方图标准化。后处理单元138可通过拉伸针对色彩值中的每一者的码字中的每一者的直方图且基于经拉伸的直方图确定偏移和缩放而确定待应用于码字的缩放和偏移参数。举例来说,用于确定偏移和缩放的方程式可为:

offset1=-hist_min

scale1=1/(hist_max-hist_min)

后处理单元138可使用offset2和scale2的方程式确定色彩中的每一者的偏移和缩放参数,且应用如更详细地描述的offset2和scale2参数以缩放和偏移码字。可存在预处理单元138确定用于后处理的偏移和缩放参数的各种其它方式,且以上方程式被提供作为一个实例。

尽管色彩转换单元114经说明为在后处理单元138之后,但在一些实例中,色彩转换单元114可首先将色彩从rgb转换到ycrcb。后处理单元138可对ycrcb码字执行操作。对于明度(y)分量,后处理单元138可使用类似于上文所描述的那些技术的技术来确定缩放和偏移值。下文描述用于确定色度分量的缩放和偏移的技术。

后处理单元138可根据输入视频信号的比色和输出视频信号的目标比色来确定cb和cr色彩分量的缩放和偏移参数。举例来说,考虑由原色坐标(xxt,yxt)所指定的目标(t)色彩容器,其中x指r、g、b色彩分量:

和由原色坐标(xxn,yxn)所指定的原生(n)色域,其中x指r、g、b色彩分量:

两个色域的白点坐标等于whitep=(xw,yw)。dra参数估计单元(例如,后处理单元138)可导出随原色坐标与白点之间的距离而变的cb和cr色彩分量的scalecb和scalecr。此估计的一个实例给定如下:

rdt=sqrt((primet(1,1)-whitep(1,1))^2+(primen(1,2)-whitep(1,2))^2)

gdt=sqrt((primet(2,1)-whitep(1,1))^2+(primen(2,2)-whitep(1,2))^2)

bdt=sqrt((primet(3,1)-whitep(1,1))^2+(primen(3,2)-whitep(1,2))^2)

rdn=sqrt((primen(1,1)-whitep(1,1))^2+(primen(1,2)-whitep(1,2))^2)

gdn=sqrt((primen(2,1)-whitep(1,1))^2+(primen(2,2)-whitep(1,2))^2)

bdn=sqrt((primen(3,1)-whitep(1,1))^2+(primen(3,2)-whitep(1,2))^2)

scalecb=bdt/bdn

scalecr=sqrt((rdt/rdn)^2+(gdt/gdn)^2)

可将此类实施例的cb和cr偏移参数设定为等于0:

offsetcb=offsetcr=0

在一些实例中,色彩转换单元114可在预处理单元134应用预处理之前将rgb转换到ycrcb。对于此类实例,预处理单元134可对于ycrcb值执行与上文针对后处理单元138所描述的那些操作类似的操作,不过是在tf单元112应用转移函数之前对输入色彩值执行。

预处理单元134可基于直方图来确定缩放和偏移因数以确定当被应用于输入色彩值时产生使得当tf单元112应用转移函数时tf单元112的输出为线性码字(例如,由码字表示的色彩值范围跨越色彩和码字空间相对相同)的输出的缩放和偏移因数。在一些实例中,后处理单元138可将缩放和偏移应用到tf单元112输出的码字。后处理单元138可修改码字以更好地使用可用码字范围。举例来说,tf单元112的输出可为并不利用整个码字空间的码字。通过跨越码字空间散布码字,可改善量化单元116的信号对量化噪声比。

信号对量化噪声比通常反映最大标称信号强度与量化误差(也被称作量化噪声)之间的关系:snr=e(x^2)/e(n^2),其中e(x^2)为信号的功率,e(n^2)为量化噪声的功率;其中^表示指数操作,e为能量且n为噪声。

将信号x与>1.0的缩放参数相乘将导致信号功率的提高,且因此将导致改善的信号对量化噪声比:snr2=e((scale*x)^2)/e(n^2)>snr。

视频编码器20接收视频预处理器19的输出,对视频预处理器19输出的视频数据进行编码,且输出经编码视频数据以供稍后由视频解码器30解码且由视频后处理器31处理。在一些实例中,视频编码器20可对指示预处理单元134和后处理单元138中的一个或两个的缩放和偏移因数的信息进行编码和信令。在一些实例中,视频预处理器19可输出例如直方图的信息,视频后处理器31根据所述信息确定缩放和偏移因数;而非编码和信令指示缩放和偏移因数的信息。视频预处理器19输出的指示视频数据由预处理单元134预处理或由后处理单元138后处理的方式的信息可被称作自适应转移函数(atf)参数。

应理解,在各种实例中,由tf单元112所应用的转移函数为静态的(例如,非内容自适应的)。然而,输出到tf单元112的数据可经调适(例如,由预处理单元134)和/或tf单元112输出的数据可经调适(例如,由后处理单元138)。以此方式,视频预处理器19输出表示经减小的动态范围(相较于线性rgb数据110的动态范围)内的色彩的码字,其中输出码字是基于视频内容。因此,通过调适到tf单元112的输入和tf单元112的输出,预处理单元134、tf单元112以及后处理单元138的组合起应用自适应转移函数的作用。

图10为展示具备固定tf的内容自适应hdr处理管线(解码器侧)的概念图。如所说明,视频后处理器31包含反量化单元122、反向色彩转换单元124、反向后处理单元144、反向tf单元126以及反向预处理单元142。

在所说明的实例中,视频后处理器31可经配置为固定功能和可编程电路。举例来说,视频后处理器31可包含共同或分开地形成反量化单元122、反向色彩转换单元124、反向后处理单元144、反向tf单元126以及反向预处理单元142的晶体管、电容器、电感器、无源和有源组件、算术逻辑单元(alu)、初等函数单元(efu)和类似物。在一些实例中,视频后处理器31包含可编程核心,其执行使得反量化单元122、反向色彩转换单元124、反向后处理单元144、反向tf单元126和反向预处理单元142执行其相应功能的指令。在这些实例中,视频数据存储器140或某一其它存储器可存储由视频后处理器31执行的指令。

在图10中,为了易于理解,也说明视频数据存储器140。举例来说,视频数据存储器140可暂时存储由视频后处理器31输出的视频数据。作为另一实例,视频解码器30输出到视频后处理器31的任何视频数据可暂时存储在视频数据存储器140中(例如,在由视频后处理器31接收之前存储在视频数据存储器中)。视频数据存储器140可为视频后处理器31的一部分或可在视频后处理器31外部。

举例来说,存储在视频数据存储器140中的视频数据可输出到显示装置32。视频数据存储器140可由例如动态随机存取存储器(dram)的各种存储器装置中的任一者形成,包含同步dram(sdram)、磁阻式ram(mram)、电阻式ram(rram)或其它类型的存储器装置。在各种实例中,视频数据存储器140可与视频后处理器31的其它组件一起在芯片上,或相对于那些组件在芯片外。

视频后处理器31可经配置以执行视频预处理器19的反向处理。举例来说,视频解码器30将经解码视频数据输出到视频后处理器31,经解码视频数据大体上可类似于视频预处理器19输出到视频编码器20的视频数据。另外,视频解码器30可将自适应转移函数(atf)参数输出到视频后处理器31以执行由视频预处理器19执行的预处理和后处理的反向处理。

反量化单元122从视频解码器30接收视频数据且执行量化单元116的反向操作。反量化单元122的输出为未经量化的视频数据。反向色彩转换单元执行与色彩转换单元114执行的操作反向的操作。举例来说,如果色彩转换单元114将rgb色彩转换到ycrcb色彩,那么反向色彩转换单元124将ycrcb色彩转化成rgb色彩。

反向后处理单元144可执行后处理单元138的反向操作。反向后处理单元144接收表示第一动态范围内的色彩的码字,所述第一动态范围在此状况下为与后处理单元138的输出相同的动态范围。

并非与后处理单元138一样乘以缩放因数,反向后处理单元144可除以与后处理单元138乘以的缩放因数大体上类似的缩放因数。如果后处理单元138从经缩放码字减去偏移量,那么反向后处理单元144可将偏移量添加到经反向缩放的码字。反向后处理单元144的输出可为并不跨越整个码字空间散布的码字。在一些实例中,反向后处理单元144可从视频预处理器19接收缩放和偏移参数(例如,缩放和偏移因数)。在一些实例中,反向后处理单元144可接收信息,根据所述信息反向后处理单元144确定缩放和偏移因数。

反向tf单元126执行tf单元112的反向操作。举例来说,tf单元112将色彩值压紧于表示相较于色彩值的动态范围的较小动态范围的码字中。反向tf单元126将色彩值从较小动态范围扩展回到较大动态范围中。反向tf单元126的输出可为线性rgb数据;然而,可需要去除某种预处理以产生原始rgb数据。

反向预处理单元142接收反向tf单元126的输出且执行由预处理单元134所应用的预处理的反向处理。反向后处理单元144接收表示第二动态范围内的色彩的色彩值,所述第二动态范围在此状况下为与预处理单元134的输出相同的动态范围。

并非与处理预处理单元134一样乘以缩放因数,反向预处理单元142可除以与预处理单元134乘以的缩放因数大体上类似的缩放因数。如果预处理单元134从经缩放色彩值减去偏移量,那么反向预处理单元142可将偏移量添加到经反向缩放的色彩值。在一些实例中,反向预处理单元142可从视频预处理器19接收缩放和偏移参数(例如,缩放和偏移因数)。在一些实例中,反向预处理单元142可接收信息(例如,直方图信息),根据所述信息反向预处理单元142确定缩放和偏移因数。

反向预处理单元142的输出可为线性rgb数据128。线性rgb数据128和线性rgb数据110应大体上类似。显示装置32可显示线性rgb数据128。

类似于tf单元112,反向tf单元126应用的反向转移函数为静态反向转移函数(例如,不对视频内容自适应)。然而,输出到反向tf单元126的数据可经调适(例如,由反向后处理单元144)和/或反向tf单元126输出的数据可经调适(例如,由反向预处理单元142)。以此方式,视频后处理器31输出表示并不处于减小的动态范围(相较于后处理单元138的输出的减小的动态范围)内的色彩的色彩值。因此,通过调适到反向tf单元126的输入和反向tf单元126的输出,反向后处理单元144、反向tf单元126以及反向预处理单元142的组合起应用自适应反向转移函数的作用。

尽管图9中说明预处理单元134和后处理单元138两者,但本发明中所描述的实例技术并不限于此。在一些实例中,视频预处理器19可包含预处理单元134,但可不包含后处理单元138。在一些实例中,视频预处理器19可包含后处理单元138,但可不包含预处理单元134。

因此,图9说明用于内容自适应hdr系统中的视频处理的装置(例如,源装置12)的实例,其中装置包含视频数据存储器132和视频预处理器19。视频预处理器19包括固定功能或可编程电路中的至少一个或两个的组合,且经配置以接收表示第一动态范围内的色彩的视频数据(例如,线性rgb数据110)的多个色彩值。视频预处理器19包含tf单元112,其经配置以使用对经压紧的视频数据非自适应的静态转移函数来压紧色彩值以产生表示第二动态范围内的经压紧的色彩值的多个码字。第二动态范围比第一动态范围紧凑。

视频预处理器19可包含预处理单元134或后处理单元138中的至少一个。预处理单元134经配置以在压紧之前预处理色彩值以产生被压紧的色彩值。后处理单元138经配置以后处理由压紧色彩值所产生的码字。视频预处理器19可经配置以基于经压紧的色彩值(例如,在不存在后处理单元138的实例中)或经后处理的经压紧的色彩值(例如,在后处理单元138为视频预处理器19的一部分的实例中)中的一个而输出色彩值(例如,量化单元116的输出)。

此外,尽管图10中说明反向后处理单元144和反向预处理单元142两者,但本发明中所描述的实例技术并不限于此。在一些实例中,视频后处理器31可包含反向后处理单元144,但可不包含反向预处理单元142(例如,在视频预处理器19并不包含预处理单元134的实例中,但技术并不限于此)。在一些实例中,视频后处理器31可包含反向预处理单元142,但可不包含反向后处理单元144(例如,在视频预处理器19并不包含后处理单元138的实例中,但技术并不限于此)。

因此,图10说明用于内容自适应hdr系统中的视频处理的装置(例如,目的地装置14)的实例,其中装置包含视频数据存储器140和视频后处理器31。视频后处理器31包括固定功能或可编程电路中的至少一个或两个的组合,且经配置以接收表示视频数据的经压紧的色彩值的第一多个码字。经压紧的色彩值表示第一动态范围(例如,与视频预处理器19输出的码字的经压紧的动态范围大体上类似的动态范围)内的色彩。视频后处理器31包含反向tf单元126,其经配置以使用对视频数据非自适应的反向静态转移函数基于所述第一多个码字解压第二多个码字以产生解压的色彩值。解压的色彩值表示第二动态范围(例如,与线性rgb数据110大体上类似的动态范围)内的色彩。所述第二多个码字为来自经反向后处理的第一多个码字(例如,在包含反向后处理单元144的实例中)或第一多个码字(例如,在不包含反向后处理单元144的实例中)的码字中的一个。

视频后处理器31可包含反向后处理单元144或反向预处理单元142中的至少一个。反向后处理单元144经配置以反向后处理第一多个码字以产生解压的第二多个码字。反向预处理单元142经配置以反向预处理由解压第二多个码字所产生的解压的色彩值。视频预处理器19可经配置以输出解压的色彩值(例如,在并不包含反向预处理单元142的实例中反向tf单元126的输出)或经反向预处理的解压的色彩值(例如,反向预处理单元142的输出)以供显示。

图9和10说明用于减少由固定(例如,静态)转移函数产生的伪讯的内容自适应动态范围调整(dra)的实例技术。然而,通过预处理和/或后处理tf单元112接收或输出的数据,且通过反向后处理和/或反向预处理反向tf单元126接收或输出的数据,实例技术仍可使用静态转移函数,但仍达成内容自适应dra。

本发明描述使用静态固定转移函数(tf)的内容自适应hdr视频系统。下文描述可一起使用或可保持分开的一些实例。为了方便起见,在理解各种排列和组合均有可能的情况下,分开描述所述实例。

如上文所描述,本发明中所描述的技术在管线中利用静态tf(例如,用于产生经编码的视频内容),但使信号特性适应于固定处理流程。此可通过自适应处理待由tf单元112处理的信号(例如,通过预处理单元134)或自适应处理由tf单元112应用tf所产生的信号(例如,通过后处理单元138)而达成。

在一个实例中,预处理单元134可通过在tf单元112应用转移函数之前线性(缩放和偏移)预处理输入线性色彩值而实现自适应性。除预处理单元134的外或替代预处理单元134,后处理单元138可通过线性(缩放和偏移)后处理由tf单元112将tf应用于线性色彩值所产生的非线性码字而实现自适应性。反向后处理单元144、反向tf单元126以及反向预处理单元142可分别应用后处理单元138、tf单元112和预处理单元134的反向操作。

预处理单元134可通过应用偏移offset1和缩放scale1而将线性预处理应用到输入信号s(例如,线性rgb110)以达成tf输出的优选码字分布(例如,使得每一码字表示输入色彩值(例如,明度)的大致相等范围)。后处理单元138可将线性后处理应用到tf单元112的输出。线性后处理由参数scale2和offset2定义,且允许实现在tf单元112应用转移函数之后对可用码字空间(动态范围)的高效利用。

在上文所描述的实例中,预处理单元134对线性rgb数据110应用预处理。然而,本发明中所描述的技术不受如此限制。rgb为hdr的一个色彩空间,预处理单元134可对所述色彩空间执行预处理。一般来说,预处理单元134可实施在tf单元112应用转移函数之前的hdr处理流程的任何色彩空间(例如,在所说明的实例中的输入线性rgb中,但其它色彩空间也为可能的,例如ycbcr色彩空间)中的预处理。

反向预处理单元142也可经配置以在任何色彩空间中执行反向预处理。在这些实例中,反向预处理单元142可从反向tf单元126接收非线性色彩值(例如,非线性rgb数据,但包含ycbcr的其它色彩空间为可能的)。

以上实例描述后处理单元138在rgb色彩空间(例如,非线性rgb,归因于由tf单元112所应用的转移函数)中执行后处理。然而,本发明中所描述的技术不受如此限制。rgb为hdr的一个色彩空间,后处理单元138可对所述色彩空间执行后处理。一般来说,后处理单元138可实施在tf单元112应用转移函数之后的hdr处理流程的任何色彩空间(例如,在所说明的实例中的非线性rgb中,但其它色彩空间也为可能的,例如ycbcr色彩空间)中的后处理。

反向后处理单元144也可经配置以在任何色彩空间中执行反向后处理。在这些实例中,反向后处理单元144可有可能在反量化之后从视频解码器30接收色彩值(例如,非线性经压紧的rgb数据,但包含ycbcr的其它色彩空间为可能的)。

如上文所描述,在编码器侧的预处理单元134可根据输入或目标色彩空间(例如,线性rgb数据110或ycrcb,如果色彩转换单元114接收线性rgb数据110且将色彩转换成ycrcb值)或用以产生较好参数导出的补充色彩空间中的hdr信号性质(例如直方图分布)导出且应用例如scale1和offset1因数的参数。后处理单元138也可根据tf单元112的输出导出和应用参数,例如scale2和offset2因数。

预处理单元134和/或后处理单元138可输出反向预处理单元142和反向后处理单元144分别利用以执行预处理单元134和后处理单元138的反向操作的scale1和offset1因数和/或scale2和offset2因数。在一些实例中,预处理单元134和后处理单元138可输出用于确定scale1、offset1、scale2和/或offset2的信息而非输出scale1、offset1、scale2和/或offset2因数,以使得反向预处理单元142和反向后处理单元144可使用相同过程确定用于反向处理的scale1、offset1、scale2和/或offset2。在一些状况下,预处理单元134和后处理单元138可输出一或多个scale1、offset1、scale2和/或offset2且输出可用以导出其它各者的信息。

在一些实例中,视频预处理器19(例如,经由控制器电路)可选择性地启用对预处理单元134和/或后处理单元138的使用。因此,视频预处理器19可输出指示是否启用预处理单元134和/或后处理单元138的信息。作为响应,视频后处理器31(例如,经由控制器电路)可选择性地启用对反向后处理单元144和/或反向预处理单元142的使用。

可存在视频编码器20可对各种参数进行编码且输出各种参数的各种方式。举例来说,视频编码器20可信令参数且视频解码器30可接收借助于sei(补充增强信息)/vui(视频可用性信息)经由位流、或作为旁侧信息提供到解码器侧(例如,视频后处理器31)或根据其它标识(例如,输入和输出色彩空间、所利用的转移函数等等)由解码器侧(例如,通过视频后处理器31)导出的参数。

下文描述可根据本发明中所描述的实例技术应用的实例技术。可分开或以任何组合形式应用这些技术中的每一者。此外,在下文中进一步更详细地描述这些技术中的每一者。

在上述实例中,视频预处理器19可以各种方式信令参数信息。仅作为一个实例,视频编码器20包含编码单元(例如,熵编码单元),且熵编码单元可对经信令的参数信息进行编码。类似地,视频解码器30包含解码单元(例如,熵解码单元),且熵解码单元可解码经信令的参数信息且视频后处理器31可从视频解码器30接收参数信息。可存在可信令和接收参数信息的各种方式,且本发明中所描述的技术并不限于任何特定技术。此外,如上文所示,在所有状况下,视频预处理器19可不需要信令参数信息。在一些实例中,视频后处理器31可导出参数信息而不必从视频预处理器19接收参数信息。

下文为仅出于说明的目的所使用的实例实施方案且不应将其视为限制。举例来说,本发明描述通过在应用tf(例如,静态、非内容自适应的)之前线性(缩放和偏移)预处理输入线性色彩值和/或通过线性(缩放和偏移)后处理由应用于线性色彩值的tf所产生的非线性码字而实现自适应性。以下为技术的实施方案的若干非限制性实例。

图11中展示所提出的正向atf处理流程。在此实例中,输入色彩空间(例如,rgb)中的线性信号分量s正由预处理单元134预处理以产生输出信号s1。tf单元112将转移函数应用于s1的值,产生输出码字s1。在下一步骤中,由后处理单元138后处理s1的码字以产生输出值s2。

图12为图11中所说明的atf处理流程的反向处理流程。举例来说,反向后处理单元144对码字s2′执行反向后处理。码字s2′大体上可类似于码字s2。通过反向后处理单元144的反向后处理的输出为码字s1′。码字s1′可类似于码字s1。反向tf单元126接收码字s1′,且反向tf单元126的输出为s1′,其表示色彩值且类似于色彩值s1。反向预处理单元142将s1'接收作为输入且输出色彩值s′。色彩值s′大体上类似于色彩值s。

为了易于说明,图11和12中未说明各种过程。举例来说,图11和12中未说明色彩转换和量化以及其相应反向过程。

下文描述预处理单元134和反向预处理单元142可执行的实例操作和算法。预处理单元134由参数scale1和offset1定义。预处理单元134以将输入信号特性调整为由tf单元112所应用的转移函数的某些性质为目标。图13a和13b中说明此类处理的实例。图13a展示与pqt转移函数重迭的hdr信号的红色分量的直方图;应注意,出于可视化目的,以不同比例展示信号。图13b中展示由pqtf产生的非线性信号的直方图(例如,如果tf单元112应用pqtf而不使用预处理单元134)。

如所说明,通过pqtf的曲线(其与图7相同),pqtf将更多码字提供到低亮度样本,例如允许通过输出动态范围的50%表示输入动态范围的0…1%。对于某些类别的信号和/或应用,此类分布可能并非最佳的。

对于线性预处理,预处理单元134可将线性预处理应用到输入信号s,从而通过应用偏移offset1和缩放scale1达成从tf单元112输出的tf的优选码字分布。

s1=scale1*(s-offset1)(8)

由方程式8产生的信号值s1被利用于方程式1中,且应用方程式(3到7)中所指定的hdr处理管线(例如,由色彩转换单元114和量化单元116)。

在解码器侧(例如,视频后处理器31)处,反向预处理单元142将与预处理反向的操作应用如下:

其中术语s1'表示由如方程式2中所指定的反向tf产生的线性色彩值。换句话说,s1'为由反向tf单元126应用的反向转移函数的输出。

图14中展示具有参数(scale1=0.1且offset1=0.0001)的此类预处理的效果。图14由与图13a所说明的输入相同的输入产生。可以看出,s1信号的码字相较于图13b中所说明的实例更高效地占据可用动态范围,且高亮度值的表示较准确,这是因为所述码字占据大得多的动态范围(参见图14中的直方图s1的经拉伸的峰值,相较于图13b中的直方图峰值)。

在一些实例中,到tf单元112的输入可为双极信号。双极信号希望指示预处理单元138输出的一些值为负值且其它值为正值。为了使得能够由tf单元112将静态tf甚至应用于(且由反向tf单元126应用反向静态tf)双极信号,tf单元112可调整预处理单元134的输出和/或在应用转移函数之后调整输出。举例来说,如果预处理单元134的输出为负值,那么tf单元126可将转移函数应用于预处理单元134的输出的绝对值,且将结果乘以sign(s)函数的输出,其中s为预处理单元134的输出,且对于s<0,sign(s)=-1;对于s=0,sign(s)=0;以及对于s>0,sign(s)=1。因此,为了使得能够应用静态tf,tf单元112可利用经正值定义的函数,对于双极信号,所述函数暗示对双极信号的正负号的某种特殊处理。

下文描述具有双极信号处置的转移函数。在一些实例中,技术可修改方程式(1)以能够处置双极输入信号。

此技术可允许图9的tf单元112在动态范围的所需区域处分配所要陡度的tf,例如如果需要对中等亮度级的信号的较准确表示。图15a和15b中展示参数scale=0.1且offset=0.1的此概念的可视化。

因此,用于双极信号的反向tf将经定义为经修改的方程式2:

举例来说,对于输入码字为正的状况,图10的反向tf单元126可应用反向转移函数。对于为负的输入码字,反向tf单元126可确定输入码字的绝对值且将反向转移函数应用于输入码字的绝对值。tf单元126可将结果乘以sign()函数的输出,其中到sign()函数的输入为反向tf单元126所接收的码字。

下文描述后处理单元138和反向后处理单元144可执行的实例操作和算法。后处理单元138由参数scale2和offset2定义,且允许实现在由tf单元112应用tf之后对可用码字空间(动态范围)的高效利用。在下文中描述此类处理的实例。

以下为在由tf单元112应用tf之后的hdr信号的实例。图16a展示在由tf单元112应用tf之后hdr信号的红色分量的直方图。如所说明,在此实例中,信号的直方图并不占据完整码字空间,而是实际上仅利用码字的60%。在信号以浮点准确度表示之前,此类表示均并非问题。然而,可较高效地利用未使用的码字预算以减小由方程式7引入的量化误差。

后处理单元138可将偏移和缩放的线性操作应用到在由tf单元112应用tf之后所产生的码字s:

s2=scale2*(s-offset2)(12)

在某些构架中,后处理单元138(图9)可如下将所得s值截割到所指定的动态范围:

s2=min(maxvalue,max(s2,minvalue))(13)

在此后处理之后,在方程式(3)中利用信号值s2,且后接方程式(3到7)中所指定的hdr处理流程。

在解码器侧(例如,视频后处理器31)处,如下实施可应用与后处理反向的操作的反向后处理单元144:

在某些构架中,反向后处理单元144可如下将所得s值截割到所指定的动态范围:

s′=min(maxvalue,max(s′,minvalue))(15)

其中术语s2'表示经解码的非线性色彩值。

图16b中展示通过参数(scale=0.8且offset=0)的此类后处理的效果。可以看出,s2信号的码字较高效地占据可用码字空间(动态范围),且高亮度值的表示较准确,这是因为所述码字占据大得多的动态范围(参见图16b中的直方图s2的经拉伸的峰值,相较于图16a中的直方图峰值)。

在上述实例中,并非应用方程式(12)的操作,后处理单元138可被视为应用第二转移函数(其为线性转移函数)而非tf单元112应用的非线性转移函数。应用此第二转移函数可等效于使输入码字与scale2相乘且加上offset2,且反向后处理单元144应用此过程的反向操作。因此,在一些实例中,可经由额外线性转移函数tf2部署后处理单元138和反向后处理单元144(图10)的技术。可经由scale2和offset2指定此额外线性转移函数tf2的参数,例如如图17a到17c中所展示。

举例来说,图17a说明与图7(例如,tf单元112应用的静态转移函数)相同的转移函数行为。图17b说明在scale2=1且offset2=0的情况下后处理单元138应用于tf单元112的输出的转移函数。图17c说明在scale2=1.5且offset2=-0.25的情况下后处理单元138应用于tf单元112的输出的转移函数。

以上实例描述存在预处理单元134(dra1)和/或后处理单元138(dra2)以及对应反向预处理单元142和反向后处理单元144的状况。在一些实例中,可在色彩转换(例如,在目标色彩空间中)之后而非在色彩转换之前执行后处理。举例来说,如图18中所说明,tf单元112输出到色彩转换单元114,且后处理单元150在色彩转换之后应用后处理。类似地,如图19中所说明,反向后处理单元152对反量化单元122的输出且在反向色彩转换单元124应用色彩转换之前应用反向后处理。在图18和19中,为了方便起见,预处理单元134和反向预处理单元142未经说明,且可包含于其它实例中。

后处理单元150和反向后处理单元152可以类似于后处理单元138和反向后处理单元144的方式但在不同色彩空间(例如,ycbcr色彩空间而非rgb色彩空间)中作用。举例来说,后处理单元150和反向后处理单元152可利用scale2和offset2参数以供缩放和偏移。下文描述在目标色彩空间处的后处理。

对于利用某些目标色彩空间(例如,bt709或bt2020的ycbcr)的一些hdr系统,且用对于r、g和b的3个分量利用相同参数的后处理,可在输出色彩空间中应用后处理而非在输入rgb色彩空间中应用后处理。

举例来说,对于ycbcr色彩变换,如方程式3和5中所定义:

○y'=a*r'+b*g′+c*b'(16)

其中变量a、b、c、d1和d2为色彩空间的参数,且r′、g′、b′为在应用eotf之后输入色彩空间中的非线性色彩值。

定义于方程式12和13中的后处理被应用于输入色彩空间处,即应用于r'、g′、b′,从而产生输出值r2′、g2′、b2′:

在方程式17中,假定r、g和b域中后处理的参数相同。

然而,归因于定义于方程式16和17中的过程的线性,后处理可实施于目标色彩空间中:

其中后处理单元150计算后处理的参数如下:

在解码器侧(例如,视频后处理器31)处,由反向后处理单元152进行的后处理的反向操作可实施如下:

其中变量y2′、cb和cr为经解码且经解量化的分量,且如方程式19中所展示计算反向后处理的参数。

对于定义于bt2020中的ycbcr色彩变换,从输入色彩空间中的后处理的参数和色彩变换的参数导出实施于目标色彩空间中的后处理的参数如下:

在一些实例中,具有从输入色彩空间中的后处理的参数导出的参数的实施于目标色彩空间中的方程式20可实施为以下方程式20a:

offsety=offset2

offsetcb=0

offsetcr=0

在一些实例中,可经由乘法而非除法来实施上述方程式20a。

对于非线性处理,除上文所描述的预处理和后处理技术的外,后处理单元138或150和反向后处理单元144或152也可利用某些非线性技术以进一步改善码字利用。作为直方图尾部处置的一个实例,后处理单元138或150和反向后处理单元144或152可通过应用于处于指定范围外的样本的参数性逐段指定的转移函数来补充上文所定义的线性码字后处理。

上文所指定的hdr信号的处理流程通常在预定义的范围内操作。

range={minvalue,maxvalue}

在标准化信号和上述方程式的状况下,值为:

经由将offset2和scale2应用于码字s1,方程式12中所提出的后处理(例如,如通过后处理单元138执行)可导致所得s2值溢出所指定的范围边界的情形。为了确保数据保持处于指定范围内,可将截割操作应用到方程式13中的范围{minvalue…maxvalue},例如如图20a到20c中所展示。

图20a为说明将截割应用到s2的直方图的范围的后处理的图。图20b为说明在方程式10中的后处理之后将截割应用到s2的直方图的范围的后处理的另一图。图20c为说明在方程式11中的截割之后将截割应用到s2的直方图的范围的后处理的另一图。

如图20c中所说明,在后处理之后应用截割将导致指定范围外的信息的不可恢复的损失。为了通过应用scale2/offset2高效地表示有限码字空间中的hdr信号且保存对hvs感知的tf假定,后处理单元138或150可通过对产生指定范围外的码字的色彩样本的特殊处置来补充上文所定义的码字后处理,从而允许内容自适应直方图尾部处置。

对于处于范围外的由方程式12产生的所有s2,后处理单元138或150可应用参数性逐段指定的转移函数。视频编码器20将那些样本的表示的参数与属于指定范围的s2码字分开地编码和信令。

作为说明,可提供操作以将由方程式12产生的码字s2根据其与如方程式22中所指定的所支持的数据范围的关系归类。

其中s2in样本属于range=[minvalue…maxvalue],s2low为范围外的样本集,且其小于或等于minvalue;以及s2high为范围外的样本且其大于或等于maxvalue。

所述技术可通过个别地指定/确定/信令处于范围外的s2low和s2high中的每一者的码字值或指定/确定/信令最佳地表示范围外的信息的码字群组来替换针对s2low和s2high的色彩值的方程式13中的截割操作。

下文为可替换对样本s2low和s2high的截割的实例确定过程的非限制性实例:

a.确定s2low和s2low中的每一者的平均值:

smin=mean(s2low)(26)

smax=mean(s2high)

b.确定s2low和s2high中的每一者的中位值:

smin=median(s2low)(27)

smax=median(s2high)

c.确定依据某些准则(例如,最小绝对差总和(sad)、均方误差(mse)或速率失真优化(rdo)成本)最佳地表示那些样本集合中的每一者的s2low和s2high中的每一者的值。

smin=f4n(s2low)(28)

smax=fun(s2high)

在这些实例中,每一样本值s2low或s2high将不用如方程式(13)中所展示的经截割的值替换,而是分别用方程式(26、27)中导出的smin和smax值替换。

所提出的非线性处理的参数为表示s2low和s2high中的每一者的码字。将这些码字信令到解码器侧(例如,视频后处理器31)且由反向后处理单元144或152在重新构建的过程中利用:

举例来说,在参数性逐段处理的以上实例中,后处理单元138或150可缩放和偏移(例如,将scale2和offset2应用于)由tf单元112压紧色彩值(例如,由应用转移函数产生的动态范围压紧)所产生的码字。后处理单元138或150可确定一组经缩放和偏移的码字具有小于最小阈值或大于最大阈值的值。后处理单元138或150可将第一码字(例如,smin)指派到具有小于最小阈值的值的所述组经缩放和偏移的码字,且将第二码字(例如,smax)指派到具有大于最小阈值的值的所述组经缩放和偏移的码字。对于在最小值与最大值之间的经缩放和偏移的码字,后处理单元138或150可如以上实例中所描述地应用缩放和偏移。

反向后处理单元144或152(图10或图19)可执行参数性逐段处理的反向处理。举例来说,反向后处理单元144或152可确定来自从视频解码器30所接收到的多个码字的第一组码字表示具有小于最小阈值或大于最大阈值的值的经压紧的色彩值(例如,其中由通过tf单元112应用转移函数而压紧动态范围)。反向后处理单元144或152可确定来自所述多个码字的第二组码字表示具有大于或等于最小阈值且小于或等于最大阈值的值的经压紧的色彩值。对于此类实例,反向后处理单元144或152可将第一码字(例如,smin)指派到第一组码字中的小于最小阈值的码字且将第二码字(例如,smax)指派到第一组码字中的大于最大阈值的码字。可经由视频编码器20从视频预处理器19信令smin和smax的值。反向后处理单元144或152可使用与上文所描述的那些技术相同的实例技术反向缩放和偏移第二组码字(例如,大于最小值且小于最大值的那些码字)。

在以上实例中,描述逐段应用缩放和偏移参数。在一些实例中,可对于预处理单元134和后处理单元138或152两者以及反向后处理单元144或152和反向预处理单元142两者延伸缩放和偏移参数的此类逐段应用。

举例来说,反向后处理单元144或152接收的码字可包含第一组码字和第二组码字。第一组码字表示具有属于动态范围的第一分割区的值的经压紧的色彩值,且第二组码字表示具有属于动态范围的第二分割区的值的经压紧的色彩值。在这些实例中,反向后处理单元144或152可用第一组缩放和偏移参数(例如,第一scale2和第一offset2)来缩放和偏移第一组码字。反向后处理单元144或152可用第二组缩放和偏移参数(例如,第二scale2和第二offset2)来缩放和偏移第二组码字。

作为另一实例,反向预处理单元142接收的色彩值可包含第一组解压的色彩值和第二组解压的色彩值。第一组解压的色彩值表示具有属于动态范围的第一分割区的值的解压的色彩值,且第二组解压的色彩值表示具有属于动态范围的第二分割区的值的解压的色彩值。在这些实例中,反向预处理单元142可用第一组缩放和偏移参数(例如,第一scale1和第一offset1)来缩放和偏移第一组色彩值。反向预处理单元142可用第二组缩放和偏移参数(例如,第二scale1和第二offset1)来缩放和偏移第二组色彩值。

类似地,预处理单元134可确定第一组色彩值具有属于动态范围的第一分割区的值,且确定第二组色彩值具有属于动态范围的第二分割区的值。预处理单元134可用第一组缩放和偏移参数(例如,第一scale1和第一offset1)来缩放和偏移第一组色彩值。预处理单元134可用第二组缩放和偏移参数(例如,第二scale1和第二offset1)来缩放和偏移第二组色彩值。

后处理单元138或152可确定来自多个码字的第一组码字具有属于动态范围的第一分割区的值,且确定来自多个码字的第二组码字具有属于动态范围的第二分割区的值。后处理单元138或152可用第一组缩放和偏移参数(例如,第一scale2和第一offset2)来缩放和偏移第一组码字且可用第二组缩放和偏移参数(例如,第二scale2和第二offset2)来缩放和偏移第二组码字。

图21a和21b为说明在具有尾部处置的后处理之后的码字的直方图的图。图22为说明具备静态tf的内容自适应hdr管线(编码器侧)的另一实例的概念图。图23为说明具备静态tf的内容自适应hdr管线(解码器侧)的另一实例的概念图。图22和23实际上与图11和12相同,但图22和23说明在一些实例中,如果经缩放和偏移的值在范围外,那么输出smin和smax码字;且说明在一些实例中,如果所述值在范围外,那么smin′和smax′(两者类似于smin和smax)为所接收到的码字。

在上述实例中,对于小于最小值的码字,使单个码字反转;且对于大于最大值的码字,使单个码字反转。在一些实例中,属于指定范围外的直方图尾部的码字可用多于单个经保留码字的码字表示。

后处理单元138可确定且信令码字s的动态范围的指定区域的多个经保留的码字。在解码器侧(例如,视频后处理器31)处,反向后处理单元144可确定指定区域的经保留的码字。所述技术可在解码器处确定、信令且应用与经保留码字中的每一者相关联的信号值s′。

图24为说明具有两个经保留的码字处置色彩值的直方图的图。举例来说,在图24中展示此实例的可视化,在s2low中有2个经保留的码字处置色彩值。在此实例中,将s2low码字分裂在两个子范围中,其中分别用码字smin1和smin2来译码每一子范围。在类似于方程式26到28的过程中,在编码器侧处(例如,由视频预处理器19)确定与这些码字中的每一者相关联的值;将所述值信令到解码器30且在解码器侧处(例如,由视频后处理器31)经由方程式29应用。

在一些实例中,所述技术可以转移函数的形式实施。转移函数的非线性部分(即,给定实例中的直方图尾部处置)可用自适应转移函数模型化,其中两个经保留的码字与在解码器侧处经确定(例如,在解码器侧处经信令和应用)的值相关联。

图25a和25b为说明参数自适应函数的图。图25a说明在scale2=1.5且offset=-0.25的情况下经模型化的线性转移函数(tf2),且图25b说明在scale2=1.5且offset=-0.25的情况下经模型化的线性转移函数(tf2)和参数化的非线性区段。非线性区段是用与2个经确定且经信令到解码器的色彩值smin1和smin2相关联的2个码字而参数化,且将s2high的码字截割到范围的maxvalue。

下文描述通过逐段线性转移函数的后处理(例如,通过后处理单元138或150)。后处理单元138或150可将s的码字空间分裂成有限数目个区段r,使得:

范围={ri},其中i=0..n(30)

对于这些区段ri中的每一者,后处理单元138或150确定独立后处理参数scale2i和offset2i,且信令和在编码器侧和解码器侧处将scale2i和offset2i参数应用于码字s以产生输出s2。

scales={scale2i};offsets={offset2i};i=0..n

就转移函数来说,实例算法可经模型化如下。图26a到26c为说明具有逐段线性转移函数的后处理的图。图26a说明由pqtf产生的s信号的直方图,图26b说明后处理的参数性逐段线性tf,且图26c说明由后处理的tf产生的s2信号的直方图。

在图26a中的s信号的直方图中,用垂直栅格展示动态范围的引入区段。可以看出,信号占据约80%的可用码字,且可利用20%的可用码字以减小量化误差,如方程式12和13中所提出。同时,直方图展示相当大部分的码字位于从码字范围的0.6伸到0.8的第4区段中。可利用可用码字预算以改善此特定第4区段的量化误差,使得不会改变其它区段的表示的准确度。

这些r区段(n=5)的后处理参数可撰写如下:

scales2={1,1,1,2,1};offsets2={-0.1,-0.1,-0.1,-0.1,0.1}

这将导致图26b中所展示的逐段线性转移函数。由应用此tf产生的s2信号的直方图展示于图26c中。如所见,直方图移位到左侧以占据更多码字且位于第4区段中的峰值伸到较大动态范围,因此提供表示的较高准确度且减小量化误差。

一般来说,此方案的参数可包含:

a.动态范围的分割区数

b.区段中的每一者的范围

c.这些区段中的每一者的scale和offset

应用:

a.在一些实例中,技术可包含预处理、后处理以及非线性处理技术。在一些实例中,所述技术可用应用于在指定范围内的样本的参数性逐段指定的转移函数补充如上文所定义的线性码字后处理。在一个实例中,所述技术可保留指定范围内的有限数目个码字以识别调用此参数性转移函数的样本。

b.在一些实例中,预处理和后处理技术经定义为缩放和偏移,即应用到输入信号的scale1和offset1和/或scale2和offset2。在一些实例中,以转移函数的形式实施技术。

c.在一些实例中,非线性处理可包含用于定义属于指定范围外的色彩值的单个参数,一个参数用于小于minvalue的样本且另一个参数用于大于maxvalue的样本。在一些实例中,可应用经分开定义的转移函数。

d.在一些实例中,独立地针对每一色彩分量(独立参数集)(例如,独立地针对r、g、b或y)进行动态范围调整(dra)。在一些实例中,将单个跨分量参数集应用于所有色彩分量。

e.在一些实例中,可确定整个视频序列的参数。在一些实例中,所述参数可在时间上经调适或为时空自适应的。

f.在一些实例中,可在具备sdr兼容性的hdr系统中利用所提出的处理。在此类系统中,通过使用中的某一转移函数,将所提出的技术应用到表示hdr信号(例如,大于100尼特和/或小于0.01尼特)的码字,使得其余码字未经处理,因此提供sdr兼容性。

参数导出:

a.在一些实例中,独立地导出预处理和后处理的参数。在一些实例中,联合地导出预处理和后处理的参数。

b.在一些实例中,从使量化误差最小化的过程导出或通过使成本函数最小化导出参数,所述成本函数是由由转换和译码产生的位速率的加权总和和由这两个有损过程引入的失真形成。

c.在一些实例中,对于每一分量,可使用关于彼分量的信息分开确定参数和/或可通过使用跨分量信息导出所述参数。

d.在一些实例中,可根据转移函数tf的类型和性质确定参数(例如,应用范围),例如处理可仅应用到表示hdr信号(例如,大于100尼特)的码字且表示<=100的sdr信号的码字保持不变。

e.在一些实例中,可将范围参数作为旁侧信息提供到解码器且随在处理时所利用的tf而变地应用所述参数。

f.在一些实例中,可根据转移函数tf的类型和性质确定参数(例如,应用范围),例如对于以转变为特征的tf,可利用转变(拐点)位置以确定应用处理的动态范围。

g.参数可包含对多个经保留码字和其实际值的识别

h.参数可包含对与经保留码字相关联的过程的识别

i.参数可包含用于应用所确定的处理的码字空间内的子范围的数目

j.参数可包含供应用所确定的处理的码字值子范围识别

参数信令:

a.在一些实例中,在编码器侧(例如,视频预处理器19)处估计参数且将其经由位流(元数据、sei消息、vui等)信令到解码器(例如,视频后处理器31)。解码器从位流接收参数。

b.在一些实例中,经由指定过程从输入信号或从与输入信号和处理流程相关联的其它可用参数在编码器和解码器侧处导出参数。

c.在一些实例中,显式地信令参数且所述参数足以用于在解码器侧处执行dra。在一些实例中,从其它输入信号参数(例如,输入色域和目标色彩容器(原色)的参数)导出参数。

d.在一些实例中,所提出的系统的参数可经信令为系统中所利用的转移函数(tf)的参数,或作为旁侧信息提供到解码器以用于特定转移函数。

e.所提出的方案的参数可借助于sei/vui通过位流信令或作为旁侧信息提供到解码器,或由解码器从其它识别(例如,输入和输出色彩空间、所利用的转移函数等等)导出所述参数。

图29为说明在内容自适应高动态范围(hdr)系统中的视频处理的实例方法的流程图。关于视频后处理器31描述图29的实例以将所接收到的视频数据转换成供显示的视频数据。在一些实例中,视频后处理器31可针对每一色彩执行实例技术(一次针对红色分量,一次针对绿色分量,且一次针对蓝色分量)以使得所述处理为独立的。

视频后处理器31接收表示视频数据的经压紧的色彩值的第一多个码字,其中经压紧的色彩值表示第一动态范围内的色彩(200)。举例来说,为了降低位速率,视频预处理器19可已压紧色彩值的动态范围。压紧的结果为第一多个码字。视频后处理器31可直接从视频解码器30或经由视频数据存储器140接收第一多个码字。经压紧的色彩值可处于特定色彩空间(例如,rgb或ycrcb)中。可由反量化单元122反量化经压紧的色彩值。

反向后处理单元144或152可应用反向后处理功能,其减小码字的范围以产生第二多个码字(202)。在一些实例中,反向后处理单元144可对经色彩转换的码字(例如,经由反向色彩转换单元124转换的色彩)应用反向后处理操作。在一些实例中,反向后处理单元152可在色彩转换之前应用反向后处理,且反向色彩转换单元124可转换反向后处理单元152的输出。

反向后处理单元144或152可对第一多个码字执行反向缩放和偏移。反向后处理单元144或152可接收缩放和偏移参数(例如,scale2和offset2)。在一些实例中,反向后处理单元144或152可接收信息,根据信息,反向后处理单元144或152确定缩放和偏移参数。一般来说,反向后处理单元144或152可从所接收到的位流或经分开信令的旁侧信息导出缩放和偏移参数以用于对码字的反向缩放和偏移。当接收位流中的缩放和偏移参数时,反向后处理单元144或152接收缩放和偏移参数以及待处理的图片数据。当将缩放和偏移参数作为经分开信令的旁侧信息接收时,反向后处理单元144或152接收缩放和偏移参数,而不具有待处理的任何图片数据(例如,在任何图片数据之前接收缩放和偏移参数)。

在一些实例中,并非对于码字的所有值将缩放和偏移应用到第一多个码字,反向后处理单元144或152可应用逐段缩放和偏移。举例来说,反向后处理单元144或152可确定来自第一多个码字的第一组码字表示具有小于最小阈值或大于最大阈值的值的经压紧的色彩值且来自第一多个码字的第二组码字表示具有小于最大阈值且大于最小阈值的值的经压紧的色彩值。

反向后处理单元144或152可将第一码字(例如,smin′)指派到第一组码字中的小于最小阈值的码字,且将第二码字(例如,smax′)指派到第一组码字中的大于最大阈值的码字。反向后处理单元144或152可反向缩放和偏移(例如,基于scale2和offset2)第二组码字。尽管描述一个最小阈值和一个最大阈值,但在一些实例中,可存在多个此类阈值以及针对所述阈值中的每一者的经保留的码字。反向后处理单元144或152可接收smin′、smax′或经保留的码字;接收关于如何确定这些码字的信息,或这些码字可预存储在视频数据存储器140中。

在使用反向后处理单元152的实例中,反向tf单元126从反向后处理单元144或从反向色彩转换单元124接收输出。然而,在一些实例中,反向后处理单元144或152可能未经启用或可能不可用。在这些实例中,反向tf单元126接收第一多个码字。

反向tf单元126可使用对视频数据非自适应的反向静态转移函数基于第一多个码字解压第二多个码字以产生解压的色彩值(204)。解压的色彩值表示第二动态范围内的色彩。第二多个码字为来自经反向后处理的第一多个码字(例如,在反向色彩转换之后来自反向后处理单元144或来自反向后处理单元152的输出)或第一多个码字(例如,其中反向后处理单元144或152经停用或不可用)的码中的一个。

在一些实例中,反向tf单元126可输出解压的色彩值以供输出用于显示或进一步处理(208)。然而,在一些实例(例如,其中视频预处理器19在压紧之前应用预处理)中,反向tf单元126可将解压的色彩值输出到反向预处理单元142。在此状况下,反向预处理单元142可输出经反向预处理的解压的色彩值以供显示或进一步处理,如在下文中参看任选地选用的操作206所论述。解压的色彩值的动态范围可大于反向tf单元126接收的码字的动态范围。换句话说,反向tf单元126增大码字的动态范围以产生具有较高动态范围的解压的色彩值。

在一些实例中,反向预处理单元142可对解压的色彩值应用反向预处理(206)。反向预处理单元142可接收缩放和偏移参数(例如,scale1和offset1)。在一些实例中,反向预处理单元142可接收信息,根据信息,反向预处理单元142确定缩放和偏移参数(例如,图片中的色彩的直方图)。反向预处理单元142输出所得经反向预处理的解压的色彩值以供显示或进一步处理(208)。

一般来说,反向预处理单元142可从所接收到的位流或经分开信令的旁侧信息导出缩放和偏移参数以用于对码字的反向缩放和偏移。当接收位流中的缩放和偏移参数时,反向预处理单元142接收缩放和偏移参数以及待处理的图片数据。当接收经分开信令的旁侧信息中的缩放和偏移参数时,反向预处理单元142接收缩放和偏移参数,而不具有待处理的任何图片数据(例如,在任何图片数据之前接收缩放和偏移参数)。

如上文所描述,视频后处理器31可执行反向后处理第一多个码字以产生第二多个码字或对解压的色彩值执行反向预处理中的至少一个。然而,在一些实例中,视频后处理器31可执行反向后处理第一多个码字以产生第二多个码字(例如,经由反向后处理单元144或152)和反向预处理解压的色彩值(例如,经由反向预处理单元142)以产生经反向预处理的解压的色彩值两者。

图30为说明在内容自适应高动态范围(hdr)系统中的视频处理的另一实例方法的流程图。关于视频预处理器19描述图30的实例以将所接收到的视频数据转换成供发射的视频数据。在一些实例中,视频预处理器19可针对每一色彩执行实例技术(一次针对红色分量,一次针对绿色分量,且一次针对蓝色分量)以使得所述处理为独立的。

视频预处理器19接收表示第一动态范围内的色彩的视频数据的多个色彩值(300)。举例来说,视频预处理器19可接收存储在视频数据存储器132中的视频数据,其中此类数据是从视频源18接收到的。色彩值可处于rgb色彩空间中,但色彩转换单元114有可能在处理之前将色彩转换到ycrcb色彩空间。

预处理单元134可对色彩值执行预处理,使得当由tf单元112处理预处理色彩值时,所得码字各自大致表示色彩值的范围,或至少并不受到很大加权使得低照明色彩由大得多的范围的码字表示且高照明色彩由相对较小范围的码字表示(302)。举例来说,预处理单元134可缩放和偏移(例如,经由scale1和offset1)。预处理单元134可基于图片中的色彩值的直方图确定缩放和偏移参数(例如,基于输入线性色彩值自适应地确定缩放因数和偏移因数)。预处理单元134可输出scale1和offset1的值或可输出可用以确定scale1和offset1的值的信息。举例来说,视频预处理器19可使得视频编码器20在位流中或作为旁侧信息信令缩放和偏移参数以用于缩放和偏移输入线性色彩值。

tf单元112可接收预处理单元134的输出以用于压紧色彩值。然而,如所说明,在一些实例中,预处理单元134可能未经启用或不可用。在这些实例中,tf单元112可接收多个色彩值而不会预处理所述色彩值。

tf单元112可使用对经压紧的视频数据非自适应的静态转移函数压紧色彩值以产生表示经压紧的色彩值的多个码字,其中经压紧的色彩值表示第二动态范围内的色彩(304)。tf单元112可减小色彩值的动态范围,从而促进此类色彩值的发射。

在一些实例中,tf单元112可基于由码字表示的经压紧的色彩值输出色彩值(308)。然而,在一些实例中,后处理单元138或150可后处理由压紧色彩值产生的码字以产生更好地使用码字空间的码字(例如,提高对可用码字空间的使用)(306)。后处理单元150可接收色彩转换单元114的输出以供后处理,且色彩转换单元114接收tf单元112的输出。后处理单元138或150可用scale2缩放且用offset2偏移。举例来说,视频预处理器19可使得视频编码器20在位流中或作为旁侧信息信令缩放和偏移参数以用于对码字的缩放和偏移。

在一些实例中,并非对于码字的所有值将缩放和偏移应用到tf单元112输出的多个码字,后处理单元138或150可应用逐段缩放和偏移。举例来说,后处理单元138或150可确定一组经缩放和偏移的码字具有小于最小阈值或大于最大阈值的值。后处理单元138或150可将第一码字(smin)指派到具有小于最小阈值的值的所述组经缩放和偏移的码字,且将第二码字(smax)指派到具有大于最大阈值的值的所述组经缩放和偏移的码字。对于其它码字,后处理单元138或150可缩放和偏移其它码字(例如,基于scale2和offset2)。尽管描述一个最小阈值和一个最大阈值,但在一些实例中,可存在多个此类阈值以及针对所述阈值中的每一者的经保留的码字。后处理单元138或150可输出smin、smax或经保留的码字的信息,或输出关于如何确定这些码字的信息。

视频预处理器19可基于经压紧的色彩值或经后处理的经压紧的色彩值中的一个而输出色彩值(308)。举例来说,如果启用后处理单元138或150,那么视频预处理器19可基于经后处理的经压紧的色彩值而输出色彩值。如果后处理单元138或150未经启用或不可用,那么视频预处理器19可基于如由tf单元112压紧且无后处理的经压紧的色彩值而输出色彩值。然而,色彩转换单元114和量化单元116可在输出之前执行相应处理。

应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可以不同序列执行,可添加、合并或完全省略所述动作或事件(例如,并非所有所描述动作或事件对于所述技术的实践都是必要的)。此外,在某些实例中,可例如通过多线程处理、中断处理或多个处理器同时而非顺序执移动作或事件。

在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么所述功能可作为一或多个指令或代码而存储于计算机可读媒体上或经由计算机可读媒体进行发射,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体(其包含促进(例如)根据通信协议将计算机程序从一处转移到另一处的任何媒体)。以此方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中所描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。

通过实例而非限制,这些计算机可读存储媒体可包括ram、rom、eeprom、cd-rom或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用于存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。另外,任何连接被恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字订户线(dsl)或无线技术(例如,红外线、无线电和微波)从网站、服务器或其它远程源发射指令,那么同轴电缆、光缆、双绞线、dsl或无线技术(例如,红外线、无线电和微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而是针对非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含紧密光盘(cd)、激光光盘、光学光盘、数字影音光盘(dvd)、软盘和蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘使用激光以光学方式再生数据。以上的组合也应包含于计算机可读媒体的范围内。

可由例如一或多个数字信号处理器(dsp)、通用微处理器、专用集成电路(asic)、现场可编程逻辑阵列(fpga)或其它等效集成式或离散逻辑电路的一或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可提供于经配置用于编码和解码的专用硬件和/或软件模块内,或并入组合式编码解码器中。此外,所述技术可完全实施于一或多个电路或逻辑元件中。

本发明的技术可在广泛多种装置或装备中实施,所述装置或装备包含无线手机、集成电路(ic)或ic集合(例如,芯片组)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必要求由不同硬件单元来实现。确切来说,如上文所描述,可将各种单元组合于编码解码器硬件单元中,或通过互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合合适的软件和/或固件来提供所述单元。

已描述各种实例。这些和其它实例在以下权利要求书的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1