颜色空间和用于视频的解码器的制造方法

文档序号：10664041阅读：352来源：国知局

颜色空间和用于视频的解码器的制造方法
【专利摘要】因为我们所需要的是新的改进的且非常不同的颜色编码空间以用于能够可靠地编码目前浮现的高动态范围视频以用于诸如SIM2新时期之类的浮现的HDR显示器上的良好质量渲染，因此具有输入（308）的视频编码器（300）以从视频源（301）获取视频，其中像素颜色被编码在（XYZ）颜色编码中，视频编码器包括光电子转换单元（304），其布置成将像素颜色的亮度（Y）转换成具有预确定的代码分配函数（F）的明度（Y’），其特征在于视频编码器包括色品确定单元（310），其布置成利用数学色品定义编码具有预确定的阈值明度（E’）以下的明度的像素颜色的色品(u’’,v’’)，其产出针对用于具有低于针对用于具有预确定的阈值明度（E’）以上的明度的像素颜色的特定色调的最大可编码饱和度(S_bH)的预确定的阈值明度（E’）以下的明度的像素颜色的特定色调的最大可编码饱和度(S_bL)，以及针对具有特定色调和等于或大于预确定的阈值明度(E’)的明度的颜色的像素的恒定最大可编码饱和度(S_bH)。
【专利说明】
颜色空间和用于视频的解码器
技术领域
[0001] 本发明涉及用于在新的颜色空间定义中编码视频(静止图像的集合）的方法和装置，以及具有更容易的解码的使用这样的颜色空间的解码器和解码方法。
【背景技术】
[0002] 自19世纪以来，已经在驱动坐标的RGB空间中表示了添加颜色重现以用于生成红色、绿色和蓝色原色光输出。因为为这些不同原色给出不同强度(亮度)是使所谓的色域(通过由可能的最大驱动(例如Rmax)定义的三个矢量获取的菱形形状）内的所有颜色对应于比如XYZ那样的某种通用颜色空间中的原色的方式。或者类似的，人们可以在从原色导出的另一线性空间（例如XYZ或UVW)中定义这样的颜色。这通过矢量的线性组合来完成，即人们可以通过用另一颜色空间定义中的旧的那些与转换矩阵相乘来计算新的颜色坐标。
[0003] 现在非常有用并且在历史上对于黑白电视而言必要的是具有消色差方向，其仅编码亮度Y，因为视觉系统也具有针对它的分离处理通道。这通过将色域放置在其尖端来获得，尖端是黑色的，其在图la中通过黑色点来表示。颜色表示空间的色域当关联到参考监视器(或如果参考未经定义则信号被发送到的任何监视器)时是色域101。在该相同哲理中，人们还可以想象理论原色，其可以变成无限明亮的，从而导致圆锥体形状102。根据该原理定义若干颜色空间，特别地封闭的那些，因为它们对绘画也是有用的，其中人们必须混合纯色与白色和黑色，并且不能够高于纸面白色（例如Munsell颜色树、NCS和Coloroid是这样的 (双）圆锥体颜色空间的示例，并且CIELUV和CIELAB是开放圆锥体）。
[0004] 在电视世界及其视频编码中，围绕该哲理的颜色空间的特定集合已经浮现。由于 CRT具有总计达近似输入驱动电压的平方的输出亮度的gamma(并且这同样适用于分离的颜色通道），因此决定预补偿它并且向电视接收器发送信号，其被定义为线性相机信号的近似平方根（即例如R'为R的平方根，如由相机捕获的场景中的红色的量，并且在例如[0,0.7伏] 的范围内）。现在由于人们需要在现有黑色和白色传输系统(NTSC或PAL)的顶部上构建，因此人们还利用使用消色差（"黑和白"）坐标的该哲理，以及承载信号的两个颜色信息R-Y、B-Y(然后可以从其导出G-Y)。线性系统中的Y将被计算为a*R+b*G+c*B，其中a，b和c是取决于原色的常量。
[0005] 然而，人们在所导出的坐标R'、G'、B'（即平方根信号）的非线性空间中进行这些简单的矩阵化计算。尽管最大可能色域的菱形形状不被这样的数学运算改变，但是其内的所有颜色的定位/定义改变。这意味着除其它之外Y' = &*1?'+13*6'+(3*8'不再是传达所有颜色的精确亮度的实数亮度信号，这就是为何其被称为明度(在本文本中我们使用词语明度以用于沿消色差轴的所有所导出的/重定义的信号，其不是线性亮度，即与所使用的映射函数无关，即不一定是平方根，而是人们喜欢的Y到Y'的任何函数;并且我们然后将Y '视为表示颜色的亮度Y的技术编码）。这是所谓的恒定亮度问题，因为某种亮度信息不在Y'中而是在色度坐标Cr，Cb中。这些被定义为Cr= m*(R'-Y'）和Cb= n*(B'-Y'），并且在本文本中我们将它们称为色度，因为它们随颜色亮度增加而增长得更大(还使用术语彩度）。因此这些坐标具有关于它们的某种彩色方面，而且这与明亮度方面混合(在心理视觉上这本身不坏，因为颜色性也是随明亮度增长的外观因素）。如果人们精确地进行相同逆解码，问题将不会如此糟糕，但是编码在这样的系统中的颜色上的任何变换(其还形成当前MPEG标准的基础)创建问题，比如例如亮度和颜色误差。这发生在例如人们对色度子采样到较低分辨率时，并且人们必然应当避免在这样的空间中做出颜色分级，因为结果可以到处都是(尽管一些图像处理软件在这样的空间中工作）。因此这不是表示颜色的最方便的颜色空间，因为其具有人们必须迀就的问题。另一问题在于坐标可以增长得相当大，从而要求许多比特来用于编码，如果Rmax等非常大的话(或者换言之，色度空间需要许多比特以能够仍旧具有足够的精度以用于非常小的色度值），如关于HDR信号那样，尽管这可以通过定义从R等定义R'的强非线性明度曲线来部分地缓解。呈现给SMPTE的这样的编码空间的最新示例是YDzDx颜色空间，其可能需要至少10比特或优选地更多（12比特）以用于良好的（宽色域但精确的)颜色编码，并且这样大的字被硬件制造商视为不太方便的。
[0006] 第二种类型的颜色空间拓扑（图lb)浮现，尽管其中存在较少变型。如果我们将线性颜色投影到单位平面105,我们得到类型x=X/(X+Y+Z)和y=Y/(X+Y+Z)的透视变换(并且这同样适用于例如CIELUV)。此后z=l-x-y，我们仅需要两个这样的色品坐标。这样的空间的优点在于其将圆锥体变换成有限宽度柱体。即人们可以将单个色品(x，y)或(u，v)与一些光所光照的特定频谱反射曲线的对象相关联，并且该值然后独立于亮度Y，即其定义对象的颜色而与多少光落在其上无关。这样的颜色然后通常利用主波长和纯度来描述，或者更多人类量色调和饱和度。针对任何可能色调的最大饱和度是形成马蹄铁形边界103的单色颜色，并且针对特定添加显示(或颜色空间）的每一个色调的最大饱和度由RGB三角形确定。事实上，需要3D视图，因为添加重现或颜色空间的色域104是帐篷形状的，其中峰值白色W是其中所有颜色通道(即RGB局部显示子像素三元组中的局部像素)被最大地驱动的条件。
[0007] 基于色度的颜色空间，作为NTSC，BT.601和BT. 709的后代用于电视/视频，例如各种MPEG和其它数字压缩标准的Y'CrCb，已经在实践中足够好，尽管存在若干已知问题，特别地由于不当的非线性所致的各种颜色通道的混合(例如如果在颜色分量上做出某种操作则亮度改变，或者当人们仅想要改变饱和度(或更好彩度)时色调改变等）。基于色品的颜色空间，比如Yxy或Lu'v'，从未用于图像传输，仅用于科学图像分析。
[0008] 特另丨抛，1?· Mantiuk等人："Lossy compression of high dynamic range images and video"Proc. SPIE-IS&T Electronic imaging Vol. 6057， 2006年1月16日，第1-10 页，应对发现用于HDR图像或视频的有损编码的颜色空间。特别地他们设计了场景参照编码，其可以处置没有月亮的天空l〇exp(-5) nit和太阳表面100亿nit之间的所有亮度。这显然不能利用经典CIE 1976 Luv空间来处置，其被设计成处置比方说作为几百nit的100%反射白色与某个0.5%黑色（即LDR图像内容)之间的典型反射颜色。它们定义新的对数类型明度轴以用于颜色空间，其中明度尝试紧密地跟随人类视觉的特点并且因而具有第一阈值以下的第一线性部分，然后功率低行为，以及第二阈值以上的对数行为。基于此的logL-uv颜色模型是拓扑柱体形状色品表示的示例。
[0009] W0 2010/104624也定义了类似对数类型明度，但是现在具有纯对数字符，其可以编码高达10000nit的实际亮度。它们通过在段落[0087]中的等式3A和3B中定义uv色品来从此做出颜色空间，即这使颜色空间也是柱状的。
[0010] Larson G. W:"LogLuv encoding for full-gamut, high-dynamic range images"，Journal of graphics tools ^association for computing machinery，vol· 3， no. 1，1999年1月22日，第15-31页也描述了用于HDR静止图像的编码。其再次使用明度的对数定义，使得可以利用16比特像素颜色字来编码高动态范围的亮度，并且利用每一个8比特编码颜色色品（等式3a和3b)。因此该颜色空间的形状再次仅仅是柱状的，具有对数明度轴。所得编码图像然后以TIFF格式输出。
[0011] Masahiro Okuda和Nicola Adami:"Effective color space representation for wavelet based compression of HDR images"，第14届图像分析和处理国际会议 (ICIAP)，2007年9月13-17日，再次提出使用Greg Ward的该LogLuv编码，但是现在是使用在 JPEG200中的小波框架中。
[0012]最近，浮现开始编码高动态范围（HDR)视频材料的期望。这些是编码成优选地在具有至少1000nit的峰值白色的显示器上渲染的视频图像，并且典型地有意思的图像是还包含明亮度的大跨度之上的对象的那些。例如，包含室内和有阳光的室外对象二者的场景可以具有1 000:1以上的图像内亮度对比度，并且高达10,000,因为黑色典型地可以反射完全反射性白色的5%和甚至0.5%，并且取决于室内几何结构(例如大部分从室外光照屏蔽并且因而仅被间接光照的长走廊)室内照度典型地为室外照度的k*l/100。同样在夜晚场景中，被例如201ux街道照明光照的对象可以编码远至比例如灯更低的相机像素中的亮度。存在以高质量渲染这样的场景的期望，使得事实上视频图像的室外有阳光的部分看起来示出看起来相对现实的日光，并且灯应当在HDR显示器上发光，因而还存在可信地编码所有这些像素亮度的期望（以及优选地关于场景的甚至更有用的元数据，或者其艺术分级）。对于静止图片，开发了编解码器，其编码线性颜色坐标，但是其中这可以针对单个静止物而进行，对于视频，速度和硬件考虑(是否例如处理1C的成本或BD盘上的空间）不允许或至少不推荐使用这样的编码，即我们需要不同的个体，其关于技术限制更加实用。
[0013] 在给定我们在HDR编码中所具有的更复杂的约束的情况下，现有技术颜色空间不再最优，特别是对于图像的较暗部分的行为（在HDR中流行场景是具有明亮光的昏暗地下室，但是在任何情况中在亮度范围的较低部分中将存在比针对LDR经典低动态范围图像在统计学上更大量的明显像素）不是最优的。而且，由于对于HDR我们想要具有对明度代码分配函数（其定义经捕获或分级的亮度Y到表示它们的代码Y'的映射，参见例如W02012/ 147022)的丰富控制，因此相比于Y'CrCb的平方根的更严重非线性的性质将使比如图la的示例性一个那样的编码典型使用的色度空间的电视中的错误行为表现得更加不当。例如，这将发生在空间子采样从4:4:4到4:2:0的颜色信号时，而且出于许多其它原因，这必须利用改变颜色坐标来完成。
[0014] 因而本发明以下呈现的教导的目标是提供一种改进的颜色编码空间、改进的编码器实现，以及改进的解码器实现，其处置这样的问题方面并且导致更加合适的视频编码系统，其能够处置HDR内容（借此我们不意图也说那些实施例并不非常适合用于编码LDR内容)。

【发明内容】

[0015] 我们以下描述的实施例解决尤其是针对HDR图像的电视编码(或处理)的大多数问题，特别地借助于具有输入(308)的视频编码器(300)以从视频源(301)获取视频，其中像素颜色被编码在标准化设备独立线性颜色编码(XYZ)中，视频编码器包括光电子转换单元 (304)，其布置成将像素颜色的亮度(Y)转换成具有预确定的代码分配函数(F)的明度(Y'），其特征在于视频编码器包括色品确定单元(310)，其布置成利用数学色品定义编码像素颜色的色品(u''，v''），其对于具有特定色调和预确定的阈值明度(E'）以下的明度的像素颜色产出最大可编码饱和度(S_bL)，最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品(11''，，'）平面中的颜色距利用等式3 = 8収以（1!〃-11、)2+(，-，〇2)计算的预指定的白色点(u'' w，v''w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度，其低于针对预确定的阈值明度(E'）以上的像素颜色明度的该特定色调的最大可编码饱和度(S_bH)，并且其针对具有特定色调和等于或高于预确定的阈值明度(E'）的像素颜色产出恒定的最大可编码饱和度(S_bH)。
[0016] 这种编码方式具有许多优点，诸如例如色品和消色差方向的去耦合，以及不使用过高的比特率以用于编码较暗的图像或图像的较暗部分，其通常发生在HDR中，例如当人们编码非常暗的夜晚场景时（要指出的是，即使颜色误差可以在一个渲染中由于那些像素颜色的昏暗而可以不被感知到，在一些系统中那些经编码的像素颜色也可能被处理，例如通过用户激活tv上的明亮化功能，或使用该分级以颜色变换到要在其它渲染参数之下渲染的另一经导出的分级，诸如显示峰值白色和平均周围亮度，并且为此该颜色可能需要以高精度编码，因为颜色误差然后可能变得更加可见）。
[0017] 这仅仅是说编码器以这样的方式定义新的（u''，v''）色品平面，即对于较暗颜色 (E'以下明度），针对任何色调的最饱和的可能颜色的饱和度不能够变得过高，事实上，其甚至不能变得如可以针对明度Y'= E'的颜色实现的5(1!''，，'）的值那样高(其上典型地最大饱和度将恒定，从而导致正常颜色表示的柱体行为）。即，根据适合用于编码的这样的技术行为，编码器实现与正常色品定义相反的某种色品平面区段降低方案，以使最暗颜色的色品更低。例如那些色品可以减半。我们缩放色品的可能值的事实意味着我们可以使用与正常uv编码相同的策略进行编码，但是现在分配更少的比特，例如由于以下事实:如果颜色值通过缩小而变得更接近单个值，则需要较少的DCT值来接近原始值，因此这将典型地发生在 DCT和视频编码器的运行长度编码中（并且如果该色品数据是有噪声的，其不需要是精确编码的噪声）。值Ε'将当然被选择为对于任何技术系统而言尽可能有用，即尽管一般地将不存在绝对精确准则，但是典型的设计目标是降低需要用于编码典型地存在于暗色中的噪声的编码比特的量，因为噪声对编码而言不是有意义的。因此编码器的设计者可以例如在实验室中固定用于Ε '的良好值，其对所有典型的例如MPEG-HEVC视频有效，或者用于视频的具体子类别的具体不同值，比如例如不同源内容。因此什么颜色范围将出现，以及因而典型地编码它们所需要的比特量将因而取决于颜色的明度，特别是它们是否是如由其在阈值明度Ε' 周围的相对定位定义的暗色。所呈现的编码器和方法对于高动态范围图像尤其有用，其中黑色可以在噪声方面进入深处，尤其是当相机不是如编码器将预期的那么高动态范围时，但是在任何情况中由于没有智能代码分配，因此较高动态范围的图片中的更多信息将要求更多比特，其可能在需要处置图像的所有系统中刚好不是可得到的。
[0018] 至于所输入的颜色，我们假定根据标准观看者CIE 1931 ΧΥΖ颜色空间进行编码，但是当然本领域技术人员将理解到在编码器中实际输入颜色的方式不是限制，并且它们也刚好可以是例如Lab、某种RGB编码等。只要颜色以唯一可理解的方式定义，我们的编码器和方法就可以将它们重计算成具有Z轴上的某种明度表示（即某种亮度的函数)和正交于此的某种色品表示的表示，但是CIE 1976 uv颜色平面由于其相对良好的颜色均匀性及其对自然中的所有颜色的涵盖而是有利的，但是当然在期望的情况下相同原理还可以应用在使用例如根据某种RGB原色的(r，g)色品平面和典型地某个白色点的编码器中。
[0019]视频编码器(300)，其中进一步地针对具有阈值明度(E'）以下的明度的颜色的最大可编码饱和度(S_bL)作为像素颜色的明度(Y'）的单调函数而减小。事实上，设想到用于 E'以下的较暗颜色的若干色品区段降低机制并且其良好地工作(单调性不是绝对要求的，因为可以存在降低暗色的其它方式，其仍旧导致那里的相对小的区段平面，我们可以例如在定义用于E '以下的每一个明度Y'的任何2D缩放映射的LUT中定义它），但是作为例如从最黑的黑色开始随明度值成线性或成二次的单调函数的降低最大可能饱和度的那个是良好简单的一个，并且典型地还易于在硬件或计算软件中实现。这确保我们需要用于其中记录颜色的区的越来越少的比特，尤其是在色品表示中可能变得更加有噪声时。这将创建 Crayon形状颜色空间，如例如在图3a中那样。定义衰减函数的方式还定义Crayon尖端的钝度。这对于要编码的视频而言是有用的。一方面在一些优选实施例中我们想要具有最暗明度的颜色具有最大饱和度，然后明显量的噪声不能创建用于编码该不太有用的数据的大量比特。单调函数不仅容易设计，和例如在飞行中计算，而且是有用的，因为生成要编码的u，v 信号中的噪声的函数经由产出u，v的投影等式取决于明度而提升它。如我们示出的一些另外的考虑可以设计Crayon尖端的钝度，通过除其它之外将数字压缩自身的特性考虑在内，例如DCT解码误差。一般而言，当应用我们的教导时人们应当这样设计Crayon尖端（即衰减函数），如果人们主要将其用于最小化昏暗有噪声的图像区中所浪费的编码比特率，使得跨那些低明度区的所有噪声因素（即其中噪声开始丧失视觉上明显的信号的任何贡献)可以具有最小影响。这种衰减函数的优化可以在飞行中通过分析例如图像集合的噪声统计量来完成，在该情况下典型地特定衰减函数形状将从发射器被传送至接收器，例如作为LUT，或者人们可以设计实施例，其使用对于大多数内容平均良好的固定策略(并且然后典型地比必要的编码略多的噪声，但是仍旧远少于没有Crayon尖端）。其间，实施例可以使用数个(例如3个)预同意的函数，其可以在发射器侧选择，并且发射器传送数个所选择的函数，使得发射器（自动地或利用人类在显示器上检查他的（多个)选择的结果）可以取决于例如是否使用给出洁净信号的高端大像素阱相机或者甚至用于创建计算机图形视频的计算机或有噪声的廉价消费相机等而发送不同的函数。
[0020] 视频编码器(300)包括空间子采样单元(302)，其布置成降低颜色信息的空间分辨率，所述单元布置成在线性(XYZ)像素颜色上执行通过因子(SS)的子采样，并且输出（XYZ) 像素颜色的经子采样的图像作为用于色品确定单元(310)的输入。Yuv视频编码对许多类型的（HDR或LDR)视频是有用的，因此还有未经子采样的图像，但是由于典型地视频编码器使用子采样（例如如果我们在遗留MPEG编码技术中编码u，v分量就如同它们是CrCb图像那样），因此有利的是使用最优子采样和重构方法以用于这样的Yuv编码，其除其它之外涉及仍旧关于像素亮度呈线性的颜色表示中的编码器处的子采样（即XYZ的某种颜色基础变换或XYZ自身）。
[0021] 有利的是以较低分辨率编码颜色信息。我们的新编码技术具有关于如何和在哪里进行子采样的相当大的自由度。
[0022]有利的是视频编码器(300)的实施例，其中在8,10,12或14比特的字中编码明度。尽管我们不想要将我们自身限制到用于颜色分量的特定比特率，但是由于事实上我们的实施例可以在原理上与任何比特率一起工作，尤其是对于HDR视频，因此我们可以以比经典的基于色度的表示更少的比特率得到类似的质量(注意:在我们使用术语色度的情况下，这可以是线性基于亮度的颜色坐标，但是典型地在视频编码中使用非线性的那些，例如在应用标准化功率函数(例如Rec. 709等）之后，其近似为平方根）。更智能的一个选择代码分配或光电子转换函数0ECF，在原理上需要更少的比特来编码所有相关图像信息。我们的实施例可以使用单个标准化函数或在飞行中生成的且共同编码为元数据的一个二者，例如每个图像镜头或场景。
[0023] 视频编码器(300 )实施例，其中色品编码在6，7，8，9，10，11或12比特的字中以用于每一个色品坐标。我们的色品编码允许利用少于基于色度的编码的比特而从高亮度或明度到低亮度或明度得到非常良好的精确性。
[0024] 一种视频编码方法，包括： -从视频源(301)接收输入视频，其中像素颜色编码在标准化设备独立线性颜色编码 (XYZ)中， -通过将预确定的代码分配函数(F)应用于亮度(Y)以获得明度(Y'）来执行像素亮度 (Y)的光电子转换， -其特征在于方法还包括计算具有利用数学色品定义的预确定的阈值明度(E'）以下的明度(Y'）的像素颜色的色品（u''，v''），其产出针对用于具有预确定的阈值明度(E'）以下的明度的像素颜色的特定色调的最大可编码饱和度(S_bL)，其低于针对用于具有预确定的阈值明度(E'）以上的明度的像素颜色的特定色调的最大可编码饱和度(S_bH)，最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品(u' '，v' '）平面中的颜色距利用等式S = sqrt((u〃 - u〃w)2 + (v〃- v〃w)2)计算的预指定的白色点(u''w，v''w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度，以及针对具有特定色调和等于或大于预确定的阈值明度(E'）的明度的颜色的像素的恒定最大可编码饱和度 (S_bH)〇
[0025] 视频编码信号（S_im)，其特征在于对于视频的图像，像素的颜色编码在由消色差明度(Y'）坐标和两个色品坐标(u''，v''）定义的颜色空间中，颜色空间被定义为具有以下性质：对于颜色空间的较低明度部分(LL)，由具有阈值明度(E'）以下的明度的较低明度部分中的所有颜色定义，针对特定色调(h)和阈值明度(E'）以下的明度的颜色的最大可编码饱和度(S_bL)低于针对具有该特定色调和阈值明度(E'）以上的明度的颜色的最大可编码饱和度（S_bH)，最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品（u' '， ν''）平面中的颜色距利用等式S = Sqrt((U〃 - u〃w)2 + (v〃- v〃w)2)计算的预指定的白色点(u' 'w，v' 'w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度，并且针对特定色调和阈值明度(E '）以上的任何明度的颜色的最大可编码饱和度 (S_bH)是恒定的。
[0026] 视频编码信号（S_im)，其中针对具有阈值明度(E'）以下的明度的颜色的最大可编码饱和度(S_bL)作为颜色的明度(Y '）的单调函数而减小。
[0027]视频解码器（350)布置成接收和解码利用定义在线性设备独立颜色编码(X，Y， Ζ)或线性三色原色能量颜色定义（R, G, Β)或经gamma预校正的三色原色能量颜色定义 (R' '，G' '，B' '）设备独立颜色编码中的像素颜色定义的图像，编码视频信号（S_im)经由输入(358)接收，编码视频信号（S_im)具有针对图像的编码在有消色差明度(Y'）坐标和两个色品坐标(u''，v''）定义的颜色空间中的像素颜色，颜色空间被定义为具有以下性质:对于颜色空间的较低明度部分(LL)，由具有阈值明度(E'）以下的明度的较低明度部分中的所有颜色定义，针对特定色调(h)和阈值明度(E'）以下的明度的颜色的最大可编码饱和度（S_ bL)低于针对具有该特定色调和阈值明度(E'）以上的明度的颜色的最大可编码饱和度(S_ bH)，最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品(u' '，v' '）平面中的颜色距利用等式S = Sqrt((u'' - u''w)2 + (ν'' - v''w)2)计算的预指定的白色点 (u' 'w，v' 'w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度，并且针对特定色调和阈值明度(E '）以上的任何明度的颜色的最大可编码饱和度(S_bH) 是恒定的。
[0028] 视频解码器(350)具有颜色变换单元(351，355)，其布置成将反校正应用于颜色空间的较低明度部分(LL)中的颜色的降低的饱和度。由此解码器可以在遵循该颜色编码技术之后重获取暗色的正确颜色。
[0029]视频解码器(350)具有缩放单元（356或405)，其布置用于将像素的经解码的亮度独立色品颜色分量(R-Y/Y，G-Y/Y，B-Y/Y或R"/Y' '，G' 7Y' '，B' 7Y' '）缩放到颜色(R_Y，G-Y，B-Y或R' '，G' '，B' '），其具有其正确意图的亮度，通过用于缩放亮度或明度值(Y或Y' '），缩放单元布置成在线性亮度或非线性明度域中完成缩放。典型地缩放将需要不多于用于当前处理的像素颜色的对应明度(或亮度)坐标的倍数。非常有用的是在亮度独立颜色平面或空间中工作。例如，例如连接的显示器的到另一颜色空间的色品变换可以在那些单位明度平面中完成。为了获得具有适当正确亮度的真实颜色，并且(例如XYZ)颜色可以转换成用于驱动显示器的R，G，B值，我们必须将那些单位亮度颜色缩放到其正确的原始颜色，或者甚至如果人们进行亮度改变变换以用于获得比原始输入的图像的那些更适合于所连接的显示器的亮度，缩放一些新的有利输出明度或者用于要渲染的颜色的亮度。
[0030] 视频解码器(350)，其中缩放单元（356或405)通过将被处理的像素的亮度的最大值和阈值亮度(E)分别与被处理的像素的明度的最大值以及阈值明度(E'）相乘来执行缩放。这是实现用于颜色空间的所期望的crayon形状的计算上简单低成本的版本。
[0031] 一种视频解码的方法，包括： -接收输入信号(s_im)，其中像素颜色定义在由消色差明度(Y'）坐标和两个色品坐标 (u''，v''）定义的颜色空间中，颜色空间被定义为具有以下性质:对于颜色空间的较低明度部分(LL)，由具有阈值明度(E'）以下的明度的较低明度部分中的所有颜色定义，针对特定色调(h)和阈值明度(E'）以下的明度的颜色的最大可编码饱和度(S_bL)低于针对具有该特定色调和阈值明度(E'）以上的明度的颜色的最大可编码饱和度(S_bH)，最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品（u' '，v' '）平面中的颜色距利用等式S = S = sqrt((u'' - u''w)2 + (v'' - v''w)2)计算的预指定的白色点（u''w，v''w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度，并且针对特定色调和阈值明度(E '）以上的任何明度的颜色的最大可编码饱和度(S_bH)是恒定的，以及 -将这些像素颜色定义解码成线性颜色编码或经gamma预校正的设备独立颜色编码 (R，，，G，，，B，，）。
[0032]我们的技术可以以各种形式和方式体现，诸如例如存储器产品，诸如存储新的视频编码信号（S_im)的蓝光盘或固态存储器卡，或在从视频源（399)到解码器（350)的网络 (320)之上操作视频通信的方法，其中方法包括在网络之上传输新的视频编码信号(S_im)，或者计算机程序产品，其包括使得处理器能够实现根据我们的发明的原理的各种编码或解码方法实施例的代码。
[0033]另外有意思的实施例是视频解码器(350)，其具有用于接收视频信号（S_im)的输入(358)，其中像素颜色利用消色差明度(Y'）坐标和两个色品坐标(u''，v''）编码，视频解码器包括缩放单元(356)，其布置成通过利用消色差明度进行缩放来变换亮度相关色度颜色表示中的色品颜色。这允许人们在消色差和色品方向上想要的任何编码或处理的非常完美的去耦合。对经正确亮度缩放的颜色表示（即例如线性表示，其等同于具有在尺寸上随 XYZ增长的颜色坐标的XYZ或者更精确地其Y;但是这还可以仍旧包含某种非线性，比如例如经gamma变换的表示，但是在任何情况中，输出再次为某种色度颜色空间表示）的最终缩放然后可以在结尾处完成，甚至在显示器的gamma域中，或者消色差方向映射的任何接续可以在结尾处凝结完成，典型地利用最终明度缩放函数。
[0034]视频解码器(350)，其中包括色品基础变换单元(352)，在颜色处理管线中的缩放单元(356)之前的定位处，基础变换单元(352)布置成进行到新颜色表示的变换，在单位亮度2或3维颜色表示中，所述新颜色表示优选地为单位(R，G，B)-个。本领域技术人员将从我们的教导认识到颜色平面中的颜色变换的等同物，以及单位缩放的空间中的3D变换（即典型地其中明度具有最大之一，以及比如例如类似缩放的(R-Y)/Y的亮度独立3色坐标），并且在该情况中两个坐标是足够或有利的（例如用于从u''，v''旋转到另一颜色空间，比如 CIELab的a，b等），并且在该情况下3个坐标是有利的，诸如例如用于进行预备计算以用于得到3个RGB驱动值。因此人们可以在颜色平面中进行人们期望的无论什么基础变换。
[0035] 一种视频解码器(350)包括光电子转换单元(404)，其布置成向其输入颜色坐标应用功率函数，所述单元在颜色处理管线中位于缩放单元(356)之前的定位处。这允许已经变换到显示器Ι/gamma预补偿空间，并且在该gamma空间中进行明度缩放。
[0036] 一种视频解码器(350)包括空间上采样单元(353)，其布置成通过应用内插函数以获得在那些输入图像中间的像素值来增加具有颜色坐标(u''）的像素的输入图像的分辨率，空间上采样单元(353)在颜色处理管线中位于缩放单元(356)之前的定位处。我们的颜色编码的另一有意思的行为是人们将优选地以最高分辨率(例如4K或8K)进行缩放并且在处理链中较早地以亮度独立表示中的无论什么分辨率进行所有其它处理。当然，当相乘时，色品和消色差像素图像二者必须具有相同分辨率，但是人们可以刚好在相乘之前延迟空间上采样。例如，上采样可以在R''/Υ''等坐标上进行以用于显示驱动，即在亮度独立显示 ga_a颜色表示中。这创建最高锐利度（即当仅使用4:2:0编码时人们实际上具有几乎4:4:4 的精度;要指出的是，编码器处的空间子采样在线性颜色空间中发生）。
[0037] 一种视频解码的方法，包括： -接收视频信号（S_im)，其中像素颜色利用消色差明度（Y'）坐标和两个色品坐标 (u''，v''）编码，以及 -通过利用消色差明度进行缩放，变换亮度相关色度颜色表示中的色品颜色。
[0038] -种视频解码的方法，包括在缩放之前将输入色品坐标变换成另一亮度独立颜色表示，诸如（(R-Y)/Y，（G-Y)/Y，（B_Y)/Y)。
[0039] -种视频解码的方法包括在缩放之前向添加重现颜色通道(R/Y，G/Y，B/Y)的亮度独立表示应用功率函数。
[0040] -种视频解码的方法包括在缩放之前对亮度独立颜色表示进行空间上采样。
[0041] -种视频编码器(300)，其布置成编码其中像素颜色编码在任何输入颜色表示(X， Y，Z)中的视频编码到视频信号（S_im)中，其中像素颜色编码在通过消色差明度(Y'）坐标和两个亮度独立色品坐标(u ' '，v ' '）定义的颜色编码中。
[0042] 所有这些实施例可以再次实现为许多其它变型、方法、信号(无论是通过网络连接传输还是被存储）、计算机程序等。
【附图说明】
[0043] 根据本发明的方法和装置的这些和其它方面将从以下描述的实现方式和实施例是明显的，并且将参照以下描述的实现方式和实施例和参照附图进行阐述，附图仅仅充当例示更一般的概念的非限制性具体图示，并且其中虚线用于指示组件是可选的，非虚线组件不一定是关键的。虚线还可以用于指示被解释为关键的元件被隐藏在对象的内部中，或者用于非有形事物，诸如例如对象/区的选择（以及它们可以如何在显示器上示出）。
[0044] 在附图中：图1示意性地图示了用于现有技术颜色空间的两个可能拓扑，圆锥体和柱体；图2示意性地图示了例如通过有线电视系统的用于视频的示例性通信系统，以及我们的编码器的实施例，以及我们的解码器的实施例；图3示意性地图示了我们引入的新的crayon形状颜色空间，其对于编码颜色是有用的，特别是当牵涉等同于或类似于DCT编码的种类的数据压缩时。
【具体实施方式】
[0045] 图2示出根据新发明的原理并且遵照新颜色空间定义的编码系统的第一示例性实施例，其具有视频编码器300,以及可能的解码器中的特定一个，即解码器305(存在构建可以处置Crayon空间定义的视频图像并且可以处置例如特定方式的色品u' '，v' '子采样的解码器的各种方式，进行所期望的颜色处理等，但是我们仅教导一个以给出原理）。我们假定编码器经由输入连接308从已经以CIE XYZ格式供给视频图像的视频源301得到视频输入，其为独立线性颜色编码的设备。当然，解码器可以包括或连接到进行典型视频转换的另外的单元，比如例如从OpenEXR格式或某种RAW相机格式等的映射。当我们说视频时我们假定技术读者理解到还可以存在视频解码方面，比如例如所涉及的反DCT变换，以及产出图像集合所必要的任何事物，其中像素具有编码为(X，Y，Z)的颜色，其为解释我们发明的实施例的细节所需要的部分。当然，我们以下从(Χ，Υ，Ζ)开始呈现的等式还可以从另一线性颜色空间开始导出，比如例如具有标准化RGB原色的（R，G，Β)，但是我们将从广泛已知的CIE ΧΥΖ空间开始解释我们的实施例。至于艺术部分，我们将假定源301递送主HDR分级，其将是例如由至少一个颜色分级器重新上色的电影以得到正确的艺术外观(例如将温和的蓝天转换成美丽的泛紫的一个），但是输入当然可以具有实际上接连的相关图像的任何集合，诸如例如相机 RAW输出，或要升级的遗留LDR(低动态范围）电影等。我们还将假定输入是以高质量分辨率，比如例如4K，但是技术读者将理解到，其它分辨率是可能的，并且特别地我们的实施例特别良好地适合于应对用于不同颜色分量的各种分辨率。
[0046]典型地，虽然是可选地，空间子采样单元302将在执行色品中的颜色信息的确定之前下转换信号，因为眼睛对颜色信息不太敏锐，并且因而人们可以在分辨率上节约以用于色品图像，并且例如在单个要编码的图片中交错两个色品分量图像(我们已经开发了我们的系统使得该进一步编码可以利用遗留编码器完成，比如例如MPEG式编码器，比如AVC编码器，即通过进行DCT-ing等）。例如，空间子采样单元(302)可以使用两个方向上的子采样因子ss=2，以从4:4:4去往4:2:0。
[0047]现在该原始或降低的分辨率(X，Y，Z )_xK信号(其中X表示任意分辨率，例如从8K原始到2Κ输入以用于确定色品信息）是用于色品确定单元310的输入。在我们的实施例中，我们不使用色度类型颜色空间，而是基于色品的一个，因为这具有一些非常有利的性质。然而，不能也使用标准色品空间（即色品平面+某个亮度或明度或光亮度轴），尤其是用于HDR 视频编码。
[0048]尽管在原理上可以使用其它色品平面定义。我们将假定我们使我们的定义基于 CIE 1976 Y'u'v'空间，或者更精确地其色品平面，然而我们将通过色品坐标的新定义来对其重成形，我们因此将利用双原色(u''，v''）来进行指示。如果人们使用经典CIELUV 1976 定义(有用地重新公式化）：
所得颜色空间和其中编码的颜色将具有一些良好性质。首先，一个非常强大且可用的性质是人们已经将明度（即编码亮度的坐标或生理视觉重申的明亮度)从颜色的纯色品性质（即与色度相对，其还仍旧包含一些亮度信息）去耦合。但是通过在过去几年内的进一步思考和实验，发明人及其同事更加深入地洞察到该去耦合具有尤其对于HDR视频编码的主要重要性的性质：人们可以使用任何代码分配函数或者光电子转换函数E0CF以编码所要求的亮度(无论由相机或其分级捕获的那些，还是要由接收视频的显示器输出的那些），例如非常高ga_a的那些，或者甚至混合比如S形状的那些，或者甚至不连续的那些(人们可以将明度想象为与色度相关联的某种"伪亮度"）。这"不关心的性质"还意味着我们可以仅在色品"单位亮度"平面中去耦合一些所期望的处理(是否编码或例如颜色处理，比如重分级以获得另一外观），无论是沿明度轴的亮度的什么混合。这还导致以下洞察:HDR编码以及甚至其它外观的编码(对用于例如中等动态范围显示器的所要求的驱动分级的可调谐性)变得相对简单，因为人们需要一个图像来编码空间对象纹理结构，这可以利用(u''，v''）和某种参考阴影(Y'）完成，并且人们可以通过首先进行Y'的主要重定义并且然后进行另外需要的处理以实现(u' '，v' '）方向中的最优外观来转换到其它照明情形。
[0049]因此我们将假定光电子转换单元304应用任何预选的有意思的颜色分配功能。这可以是经典gamma 2.2功能，但是对于HDR较高gamma是优选的。我们可以例如使用Dolby PQ 功能。或者我们可以使用：
其中m和gamma是常量，并且v被定义为(Y-Y_black)/(Y_white_Y_black)。要指出的是，消色差轴的任意性意味着在原理上我们还可以使用线性亮度，并且可以通过使用亮度阈值定义而不是明度一个来重制定例如我们的编码器权利要求。
[0050]该编码的另一优点在于无论什么亮度，色品都保留在相同宽度维度内。这意味着相比于基于色度的颜色空间，我们可以总是使用相同量的比特以用于编码色品，并且具有一直沿颜色空间的竖直遍历的更好精度。相比于Y'DzDx颜色编码，其需要多于10个并且优选地12比特以用于色品分量，我们可以利用仅10比特来得到高质量，并且利用8比特得到甚至合理的质量。我们可以例如在可能色品的最大范围之上均勾地分配比特，u= [0，0.7 ]，v= [0,0.6]，或者稍微更紧的边界，例如[0,0.623]，[0.016, 0.587](我们将甚至剪掉一些不常见的非常饱和的颜色，但是对于宽色域编码而言，如果包括所有可能的物理颜色则可以是有用的）。
[0051 ]去耦合的另一优点在于这完美地实现了不仅具有HDR(即明亮亮度和/或大亮度对比度比）编码而且还有宽色域颜色编码的期望，因为(u''，v''）可以编码在自然中可实现的任何色品。其中在我们的新的基于crayon形状颜色空间定义中，RGB显示器将具有帐篷形状，比如在图lb中那样，但是其中其底部部分现在在底部尖端中被拟合(夹捏），我们还可以使用我们编码的颜色来驱动例如包括红色、黄色、泛黄-绿色、绿色、青色、蓝色和紫色激光器的多原色显示器，其可以渲染非常饱和且明亮的颜色。
[0052]所解决的另一主要问题，因为我们实际上仅具有色品中的色品信息，在于我们可以避免大颜色串扰问题，其发生在颜色边界处，特别是在经典基于色度的电视编码中（例如 1像素宽深红色和浅灰色线条的条纹图案，或互补颜色），例如当牵涉子采样时。使用Y'DzDx 空间可以引入主要颜色误差（例如深红色/浅灰色线条交错转换成奇怪的亮橙色颜色）。首先在线性XYZ域中进行子采样并且然后使用我们的（u' '，v' '）的我们的实现方式创建正常颜色，而不管色品信息的4:2:0编码。
[0053]然而，这样的柱体Y'u'v'编码的缺点在于由于通过Y的划分，深颜色变得非常有噪声，其增加基于变换的编码器所要求的比特率。因此我们已经重定义了颜色空间定义，以及因而定义从(X，Y，Z)到(u''，v''）的映射的对应透视变换，使得编码器可以例如新视频编码完美地处置该问题，即不诉诸于所有种类的另外的诡计，比如例如去噪等。
[0054]我们的新透视变换导致如图3a中所示的crayon形状颜色空间。底部部分已经在尺寸方面夸大地示出以能够绘制它，因为锥形尖端将仅针对最深可编码颜色而出现，落在底部部分LL中。其中该部分对应于预确定的阈值明度E'，并且鉴于亮度方向及其任意可选 0ECF的分离，利用任何选择E '还对应于阈值亮度E的唯一值，其可以通过向E '应用0ECF函数的反函数来确定，即E0CF(电光转换函数hE或E'可以例如固定在编码器和解码器的硬件中 (可通用的值），或者其可以在每种情况中选择，并且例如与信号公共传递，例如存储在存储视频的BD盘上。E的值可以典型地在范围[0.01，10]内或者更优选地[0.01，5] nit，经由通过颜色空间的峰值白色的划分转换成单位表示。因此没有用于特定输入颜色的颜色编码可以以大于(U_xx，v_xx)的色品发生的事实可以通过陈述Cray on尖端中的色域的边界朝向固定值收缩来更加精确地陈述。这可以在数学上通过使用饱和度sqrt(du' ' ~2+dv' ' ~2)来定义，其中du' '=u' '-U' '_w, dv"=v"-v' '_￥和(11' '_w，v"_w)是参考白色的色品。色域的马蹄铁形状的外边界确定针对每一个色调（角度)的最大可能饱和度(对于该主波长的单色颜色或"色调"）。如我们看到的，这些外边界对于具有E'以上的明度Y'的颜色保持相同，但是对于具有E'以下的明度的颜色变得更小。我们已经示出针对紫色的最大饱和度在E'以上如何保持相同S_bH，并且在该crayon颜色空间的示例性实施例中随Y'减小，并且被重命名为 S_bL，在E'以下。这具有以下优点:无论如何有噪声，针对深色的该重定义的小色品不能消耗过多比特。另一方面，在E'以上，我们发现色品的良好性质，即它们完美且良好均匀缩放的从亮度信息的去耦合。
[0055] 因此编码器必须应用透视映射以获得u' '，ν' '，其实现该行为(实现这一点的等式的任何定义将满足我们的新编码技术的所期望的特性）。实现这一点的一种方式在图3b 中示出，并且使编码器将非单位增益g(Y'）应用于具有E'以下的明度的颜色的饱和度。优选地，解码器然后应用倒数增益（即如果8_611(3 〇(1從为0.5则8_(1扣〇(1虹为2.0)以获得用于经重构的颜色的相同颜色饱和度。
[0056] 我们已经示出线性示例，但是可以使用其它函数，诸如例如：如果0〈=Y'〈E'，g(Y'） =Y'*((E'+l/E'）-Y'），如果Y'>=E'，g(Y'）=l。
[0057] 因此色品空间公式可以进行为：（u' '，v' '）= (u'_w，v'_w)+g(Y'）*[(u'，v'）_(u'_ w，v'_w)]，其中(u'_w，v'_w)是用于某个预确定的白色点的色品。因此将小于一的任何非单位增益应用于最暗颜色的色品将使它们去饱和到所选白色点。如果要编码的特定像素颜色的明度在E'以上，则我们将应用增益乘数1，即输出色品(u''，v''）等于要编码的原始颜色的输入色品（u'，v'）。这还意味着对于任何色调而言，要DCT编码的高亮度块的输出像素中的最大可能色品或更精确地最大可能饱和度（被定义为距白色点的距离）将是由CIE 1976 uv变换自身定义的值。对于以下的Y'值，我们将要利用在以上示例中自身为仅明度Y' 的合适函数的增益进行缩放。因此仅仅为了清楚起见，在以上等式中，如果例如E'为0.2,则用于Y' =0.1的第二项的值将为5.1，使得乘积因而增益为0.51，即去饱和到所有颜色的饱和度的一半，因而最大饱和的那些对于每个色调也是可能的。
[0058]实现crayon形状的颜色空间的有利实施例将重新编码定义色品的透视变换中的较低亮度的定义。
[0059]如果我们定义适当的G(Y)函数，即较低Y区中的适当形状，我们可以根据期望调谐色品值，即那里的crayon尖端的宽度轮廓。因此我们看到色品从线性颜色非平衡以及影响缩放的该G-因子中导出（X-Y)，（ Z-Y)。对于中性颜色(X=Y=Z)尖端将使饱和度缩小到其最低白色点(u"，v"）= (4/19, 9/19)，对于(Χ，Υ，Ζ)=(0,0,0)而言。
[0060] crayon尖端的G(Y)实现仅仅是实现它的一种容易的方式，因为可以存在这样做的其它方式，例如通过使用类似于Y或Y'的其它相关函数，只要编码空间色域的几何形状行为相同即可。
[0061] 非常容易的可能（可选)实施例是我们在图2中示出的那个，即使用Max(Y，E)作为用于G(Y)的种类函数。
[0062]我们的编码器的有利简单实施例首先通过矩阵化单元303进行矩阵化以确定X-Y 和Z-Y值，例如在2K分辨率图像中。由透视变换单元306应用的透视变换然后是以上变换，但是在图2实施例中我们已经通过外部最大函数拆分crayon锥形并且通过最大值计算单元 305执行，来自其的结果被填充在透视等式的最后项的位置处。最后编码器进一步编码和根据任何预先存在(或能够用于视频传输的将来的视频编码标准，例如MPEG标准)策略在格式化器307中格式化包含数据Y'和(u''，v''）的图像，并且在视频信号S_im中对此进行编码，可能地连同元数据MET，诸如例如参考显示器上的峰值白色或从其进行编码分级，以及可能地还有针对E或类似地E'选择的值。
[0063]该视频信号S_im然后可以经由输出309发送到视频传输系统320上的任何接收装置，其不受限地可以是例如包含视频的存储器产品，比如BD盘或固态存储器卡，或者任何网络连接，比如例如卫星TV广播连接，或互联网网络连接等。取代于在任何网络之上串行，视频还可能之前已经存储在某种存储设备399上，其可以在任何所期望的时刻充当视频源，例如用于按需在互联网之上的视频。
[0064]接收到该信号，我们在图2中示出视频解码器360的第一可能实施例，其可能合并在相同的总体系统中，例如当分级者想要检查当在特定渲染情形中渲染时他的分级将看起来像什么（例如在调暗环境之下的5000 nit HDR显示器，或昏暗环境之下的1200nit显示器），或者该接收器可以位于另一位置，并且由另一实体或人员所拥有。非限制性地，该解码器360可以形成例如电视或显示器、机顶盒、计算机、电影院中的数字相机处置单元等的部分。
[0065]解码器将理想地大部分(尽管不是必要的）精确地翻转在编码器处完成的处理，以接收原始颜色，其本身不需要在XYZ中表示，但是可以直接变换成显示器370所要求的某种显示相关颜色空间中的一些驱动颜色坐标，典型地RGB，但是这还可以是多原色坐标。因此从输入358,第一信号路径向应用作为0ECF的逆操作的E0CF的电光转换单元354发送明度Y' 图像，以恢复用于像素的原始亮度Y。再次如果我们已经使用了crayon颜色空间的Max(Y，E) 定义，可以可选地存在所包括的最大值计算单元355,并且否则在逆向透视变换单元351所应用的数学函数中考虑饱和度减小。该单元将例如计算下式：
即这些是仅色品量(注意：人们还可以将它们视为X_Y/Max(Y，E)，但是这无关紧要，因为它们是消色差量，单独从(u' '，v' '）色品可导出），与像素的颜色具有无论什么亮度无关。它们仍旧需要稍后乘以正确的亮度，以获得完整颜色。
[0066] 该式的分子是线性X，Y和Z坐标的线性组合。因此我们可以进行这上面的矩阵化，以获得线性R，G，B坐标，尽管仍旧被适当亮度参照为缩放因子。这通过矩阵化单元352实现，产出作为输出的(R-Y) /Y，（G-Y) /Y和(B-Y) /Y。如对技术人员已知的，映射矩阵的系数取决于所使用的实际原色，以用于颜色空间的定义，例如EBU原色(转换到显示器的实际原色可以稍后由色域映射单元360完成，其还应用显示器的0ETF以在实际驱动值(R' '，G' '，B' '）中预补偿它(例如这可以是显示器370,其预期Rec. 709编码，或者其可以是复杂驱动方案，比如例如用于SM2,但是这超出我们的发明的教导）。我们已经使用双重首要内容来清楚地强调这不是颜色空间的代码分配函数的非线性，而是显示器的非线性，并且(^了?_(1是特定连接的显示器的所要求的非线性光电子传输函数。如果我们在编码器中进行空间子采样，上采样单元353将该信号转换到例如4K分辨率。要指出的是，该上采样已经被有意放置在处理链中的该位置中以具有更好的颜色串扰性能。现在线性差异值(色度)R-Y等通过与适当亮度相乘来获得，例如Max(Y，E)。最后通过向这些色度添加每个像素的线性亮度，我们得到线性(R，G，B)颜色坐标，其在输出359上输出。
[0067]在线性空间中对于HDR视频进行计算的缺点在于20(或更多）比特字是必要的以用于能够表示百万：1 (或10000:0.01 nit)对比度率像素亮度。
[0068] 尽管如在图3中概念性示出的Crayon版本作为实施例工作，但是人们可以定义不同且更加合适的Y' 'u' 'ν' ' Crayon空间。关于衰减--或与Y/epsilon或Y' '/epsilon' '相乘一一到(接近)零的问题在于人们必须在接收器处利用无限增益进行放大。在没有任何误差的最大程度精确的系统中，这将不成问题，因为在接收器侧处原始u'v'（如根据CIE 1976)可以被重获得。然而，在实践中人们必须将典型技术限制考虑在内。一方面将存在uv 坐标上的误差du和dv，其除其它之外主要来自暗区中的相机噪声。但是这些无论是什么，它们通过衰减而明显降低。但是可以存在由于所使用的编码技术的另外的色品误差。幸运的是那些典型地将不是大的，并且不值得过多注意，因为它们仅仅是微小的变色，其典型地无论如何都已经是暗色，因此眼睛并不如此良好地注意到略微泛绿与略微泛蓝的黑色之间的差异。然而更严重的关注点在于也可以存在接收器处的Y''通道上的误差，并且这些已经在数学上更加严重，由于它们在成倍缩放中。人们可以具有经恢复的u'v'中的严重饱和误差，并且甚至无效、非物理值。因此我们需要计及使用更钝的crayon尖端。我们将用于此的衰减的数学公式则为： Atten = clip(l，Y''/E''，1/K)，其中K可以是例如 128〇
[0069] 对于其中Y' '在E' '以下的Crayon尖端区，通过该划分的乘法实现线性衰减，其当然变成1，其中它们相等并且Crayon的竖直主体边界继续，但是我们可以明确地将衰减定界成最小地没有乘1的衰减。更有意思的方面是限制到128。反转线性函数(701)以获得放大增益以进行衰减以重获得正确的u'，v'值，我们对于该成倍增益当然获得双曲线，其为曲线 703，对其我们现在看到剪裁到最大值而不是去往无限。因此然而我们限定衰减，无论是经剪裁还是未经剪裁，实际上重要的是在接收器处剪裁重提升的增益(例如gain(Y"）= CLIP (1，E"/ Y"，K=128))。由于无论什么u''，v''值，无论例如（0,0)还是与一些小误差混淆 (即产出（du，dv)而不是(0,0))，我们应当从不在接收器处过多地提升该u''，v''重构，特别是如果du或dv是大的话。甚至更好的策略是然后进行软剪裁，人们可以容易地通过做出跟随线性路径的增益曲线的最低部分来设计它，并且优选地利用相对小的斜率。不过小，因为然后我们不显著衰减u'v'值，并且编码过多相机噪声，其增加我们所需要的编码比特预算或在图像的其它部分中创建压缩伪像。但是斜率不过大，因为然后如果接收器在其Y''值中做出误差dY' '，则这可以导致与需要用于获取正确的u'，v'像素颜色非常不同的增益提升 (g+dg)，即产出过于饱和的经重构的颜色，或者因为du'不需要等于dv'，一般仅某个大颜色误差。因此该斜率部分应当在每一个系统中平衡，或者平均地对于数个典型将来系统是良好的。人们可以选择各种斜率（10比特Y''示例，其中E''大约为256)。因为这是传输的我们的u'v'颜色的非常定义，接收器必须知晓使用哪个Crayon尖端函数，即该信息必须也被传输，并且存在这样做的各种方式。例如S_im中的元数据可以包括指定例如接收器必须使用的特定增益函数的LUT(对应于通过例如观看一个或多个显示器上的典型重构质量而使用的内容创建器的所选衰减函数）。或者可替换地，可以发送函数的参数功能描述。例如如果我们知晓crayon尖端的上部区保持线性，我们仅需要编码尖端的最底部部分，并且我们可以例如发送其中软剪裁偏离开始的点（例如P'或P)，以及函数描述，例如线性段的斜率等。除了这些简单且有利的变型之外，本领域技术人员应当理解到可以存在定义Crayon尖端的各种其它方式。
[0070] 如何确定用于E' '的良好示例性位置。我们现在假定我们将具有Y' '的尖端定义作为我们的HDR-E0TF定义的明度，并且因而E''也是如此。我们假定我们具有例如用于5000 nit参考监视器的HDR编码。假定具有10比特水平左右的噪声的典型相机材料，这将其放置在峰值白色的1/1000左右处，即我们将假定在5000 nit显示器上渲染的5 nit以下我们将看到许多噪声，其将需要MPEG DCT编码之前的u'v'的衰减。我们已经可以计算对于例如12 比特明度(最大代码4096)，epsilon E''将为1024,其将其放置在代码轴的25%处。这将看起来是高的，但是要记住的是HDR明度代码分配的E0TF是高度非线性的，因此25%明度代码实际上是相当暗的。大约5 nit或实际上0.1%明度。Epsilon点E''是其中水平线改变成斜线，并且从E0TF我们可以看到这落在大约1000明度代码(或25%)或5 nit亮度上。如果人们具有洁净得多的主信号可以计算类似的策略，例如从更好的将来相机，或者计算机图形生成器，并且类似的crayon尖端衰减策略可以设计用于更严重的数字(DCT或其它例如小波)编码及其所设想到的噪声等。
[0071] 在本文本中公开的算法组件(完整或部分地)在实践中实现为硬件(例如专用1C的部分)或作为运行在特殊数字信号处理器或通用处理器上的软件等。
[0072] 应当对技术人员而言从我们的呈现可理解的是哪些组件可以是可选的改进并且可以与其它组件组合实现，以及方法的（可选)步骤如何对应于装置的相应构件，并且反之亦然。词语"装置"在本申请中以其最宽泛的含义使用，即构件分组允许特定目标的实现，并且可以因而例如是KX的小电路部分），或者专用器具(诸如具有显示器的器具），或者联网系统的部分等。"布置"也意图以最宽泛的含义使用，因此其可以包括除其它之外的单个装置、装置的部分、协同操作的装置(的部分)的集合等。
[0073]计算机程序产品指示应当理解为涵盖命令集合的任何物理实现，其使得通用或专用处理器在一系列加载步骤(其可以包括中间转换步骤，诸如平移到中间语言和最终处理器语言）之后能够将命令录入到处理器中，并且能够执行本发明的任何特性功能。特别地，计算机程序产品可以实现为诸如例如盘或磁带之类的载体上的数据、存在于存储器中的数据、经由网络连接一一有线或无线一一行进的数据或纸张上的程序代码。除程序代码之外，要求用于程序的特性数据还可以体现为计算机程序产品。
[0074]要求用于方法的操作的一些步骤可能已经存在于处理器的功能中而不是描述在计算机程序产品中，诸如数据输入和输出步骤。
[0075]应当指出的是，以上提到的实施例说明而不是限制本发明。在本领域技术人员可以容易地实现所呈现的示例到权利要求的其它区的映射的情况下，我们为了简洁而没有深入地提到所有这些选项。除如权利要求中组合的本发明的元素的实施例之外，元素的其它组合是可能的。元素的任何组合可以实现在单个专用元素中。
【主权项】
1. 一种具有输入（308)的视频编码器(300)以从视频源（301)获取视频，其中像素颜色被编码在标准化设备独立线性颜色编码(XYZ)中，视频编码器包括光电子转换单元(304)，其布置成将像素颜色的亮度(Y)转换成具有预确定的代码分配函数(F)的明度(Y'），其特征在于视频编码器包括色品确定单元(310)，其布置成利用数学色品定义编码像素颜色的色品（u''，v''），其对于具有特定色调和预确定的阈值明度(E'）以下的明度的像素颜色产出最大可编码饱和度(S_bL)，最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品（1 1'>''）平面中的颜色距利用等式3 = 8(^((11〃-11、)2+(，-，〇 2)计算的预指定的白色点(u''w，v''w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度，其低于针对预确定的阈值明度(E'）以上的像素颜色明度的该特定色调的最大可编码饱和度(S_bH)，并且其针对具有特定色调和等于或高于预确定的阈值明度(E'）的像素颜色产出恒定的最大可编码饱和度(S_bH)。2. 如权利要求1中所要求保护的视频编码器(300)，其中针对具有阈值明度(E'）以下的明度的颜色的最大可编码饱和度(S_bL)作为像素颜色的明度(Y'）的单调函数而减小。3. 如权利要求1或2中所要求保护的视频编码器(300)，包括空间子采样单元(302)，其布置成降低颜色信息的空间分辨率，所述单元布置成在线性(XYZ)像素颜色上执行通过因子(ss)的子采样，并且输出(XYZ)像素颜色的经子采样的图像作为用于色品确定单元(310) 的输入。4. 如上述权利要求中任一项中所要求保护的视频编码器(300)，其中在8,10,12或14比特的字中编码明度。5. 如上述权利要求中任一项中所要求保护的视频编码器(300)，其中色品编码在6,7， 8,9,10,11或12比特的字中以用于每一个色品坐标。6. -种视频编码方法，包括： -从视频源(301)接收输入视频，其中像素颜色编码在标准化设备独立线性颜色编码 (XYZ)中， -通过将预确定的代码分配函数(F)应用于亮度(Y)以获得明度(Y'）来执行像素亮度 (Y)的光电子转换， -其特征在于方法还包括计算具有利用数学色品定义的预确定的阈值明度(E'）以下的明度(Y'）的像素颜色的色品（u''，v''），其产出针对用于具有预确定的阈值明度(E'）以下的明度的像素颜色的特定色调的最大可编码饱和度(S_bL)，其低于针对用于具有预确定的阈值明度(E'）以上的明度的像素颜色的特定色调的最大可编码饱和度(S_bH)，最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品(u' '，v' '）平面中的颜色距利用等式S = sqrt((u〃 - u〃w)2 + (v〃- v〃w)2)计算的预指定的白色点(u''w，v''w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度，以及针对具有特定色调和等于或大于预确定的阈值明度(E'）的明度的颜色的像素的恒定最大可编码饱和度 (S_bH)〇7. -种视频编码信号（S_im)，其特征在于对于视频的图像，像素的颜色编码在由消色差明度(Y'）坐标和两个色品坐标(u''，v''）定义的颜色空间中，颜色空间被定义为具有以下性质:对于颜色空间的较低明度部分(LL)，由具有阈值明度(E'）以下的明度的较低明度部分中的所有颜色定义，针对特定色调(h)和阈值明度(E'）以下的明度的颜色的最大可编码饱和度(S_bL)低于针对具有该特定色调和阈值明度(E'）以上的明度的颜色的最大可编码饱和度（S_bH)，最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品 (u''，v''）平面中的颜色距利用等式S = Sqrt((U〃 - u〃w)2 + (v〃- v〃w)2)计算的预指定的白色点(u' 'w，v' 'w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度，并且针对特定色调和阈值明度(E'）以上的任何明度的颜色的最大可编码饱和度(S_bH)是恒定的。8. 如权利要求7中所要求保护的视频编码信号（S_im)，其中针对具有阈值明度(E'）以下的明度的颜色的最大可编码饱和度(S_bL)作为颜色的明度(Y'）的单调函数而减小。9. 一种视频解码器(350)，其布置成接收和解码利用定义在线性设备独立颜色编码(X， Υ, Z)或线性三色原色能量颜色定义(R, G, B)或经gamma预校正的三色原色能量颜色定义 (R' '，G' '，B' '）设备独立颜色编码中的像素颜色定义的图像，编码视频信号（S_im)经由输入(358)接收，编码视频信号（S_im)具有针对图像的编码在有消色差明度(Y'）坐标和两个色品坐标(u''，v''）定义的颜色空间中的像素颜色，颜色空间被定义为具有以下性质:对于颜色空间的较低明度部分(LL)，由具有阈值明度(E'）以下的明度的较低明度部分中的所有颜色定义，针对特定色调(h)和阈值明度(E'）以下的明度的颜色的最大可编码饱和度（S_ bL)低于针对具有该特定色调和阈值明度(E'）以上的明度的颜色的最大可编码饱和度(S_ bH)，最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品(u' '，v' '）平面中的颜色距利用等式S = Sqrt((u'' - u''w)2 + (ν'' - v''w)2)计算的预指定的白色点 (u' 'w，v' 'w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度，并且针对特定色调和阈值明度(E '）以上的任何明度的颜色的最大可编码饱和度(S_bH) 是恒定的。10. 如权利要求9中所要求保护的视频解码器（350)，具有单元(351，355)，其布置成将反校正应用于颜色空间的较低明度部分(LL)中的颜色的降低的饱和度。11. 如权利要求9或10中所要求保护的视频解码器(350)，具有缩放单元(356或405)，其布置用于将像素的经解码的亮度独立色品颜色分量(R-Y/Y，G-Y/Y，B-Y/Y或R"/Y' '，G' '/ Y' '，B' '/Υ' '）缩放到颜色(R-Y，G-Y，B-Y或R' '，G' '，B' '），其具有其正确意图的亮度，通过用于缩放亮度或明度值(Y或Y''），缩放单元布置成在线性亮度或非线性明度域中完成缩放。12. 如权利要求11中所要求保护的视频解码器(350)，其中缩放单元(356或405)通过将被处理的像素的亮度的最大值和阈值亮度(E)分别与被处理的像素的明度的最大值以及阈值明度(E '）相乘来执行缩放。13. -种视频解码的方法，包括： -接收输入信号（S_im)，其中像素颜色定义在由消色差明度(Y'）坐标和两个色品坐标 (u''，v''）定义的颜色空间中，颜色空间被定义为具有以下性质:对于颜色空间的较低明度部分(LL)，由具有阈值明度(E'）以下的明度的较低明度部分中的所有颜色定义，针对特定色调(h)和阈值明度(E'）以下的明度的颜色的最大可编码饱和度(S_bL)低于针对具有该特定色调和阈值明度(E'）以上的明度的颜色的最大可编码饱和度(S_bH)，最大可编码饱和度是针对具有这样的色调和如根据用于明度的色品（u' '，v' '）平面中的颜色距利用等式S = sqrt((u'' - u''w)2 + (v'' - v''w)2)计算的预指定的白色点(u''w，v''w)的距离计算的预确定的阈值明度以下的明度的任何像素颜色的最高可能饱和度，并且针对特定色调和阈值明度(E '）以上的任何明度的颜色的最大可编码饱和度(S_bH)是恒定的，以及 -将这些像素颜色定义解码成线性颜色编码或经gamma预校正的设备独立颜色编码 (R，，，G，，，B，，）。14. 一种存储器产品，诸如蓝光盘或固态存储器卡，其存储如权利要求7或8中所要求保护的视频编码信号(S_im)。15. -种在从视频源(399)到解码器(350)的网络(320)之上操作视频通信的方法，其中方法包括在网络之上传输如权利要求7或8中所要求保护的视频编码信号(S_im)。16. -种计算机程序产品，包括代码化权利要求6或13的我们的方法的所有步骤的代码，从而使得处理器能够通过执行那些步骤来实现权利要求6或13的方法。
【文档编号】H04N1/64GK106031143SQ201580009610
【公开日】2016年10月12日
【申请日】2015年2月12日
【发明人】J.H.C.J.斯特斯森, R.J.范登维勒尤坦, J.G.R.范莫里克, R.尼兰德
【申请人】皇家飞利浦有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：J.H.C.J.斯特斯森;R.J.范登维勒尤坦;J.G.R.范莫里克;R.尼兰德;
技术所有人：皇家飞利浦有限公司;
我是此专利的发明人

上一篇：生成运动补偿视频帧的方法和设备的制造方法
上一篇：在视频编码中用于调色板预测和共享的方法和装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。