用于适配高动态范围图片的平均亮度的编码和解码方法以及对应的编码器和解码器的制造方法_2

文档序号:9583882阅读:来源:国知局
的第一实施例的编码方法的流程图;
[0048] 图2描绘了根据本发明的编码方法的步骤10的详细实现;
[0049] 图3描绘了根据本发明的编码方法的步骤12的详细实现;
[0050] 图4和图5描绘了根据本发明的编码方法的步骤14的详细实现;
[0051] 图6和图7描绘了根据本发明的第二实施例的编码方法的流程图;
[0052] 图8描绘了根据本发明的编码方法的步骤70的详细实现;
[0053] 图9描绘了根据本发明的具体实施例的解码方法的流程图;
[0054] 图10描绘了根据本发明的解码方法的步骤92的详细实现;
[0055] 图11描绘了根据本发明的解码方法的步骤94的详细实现;
[0056] 图12表示根据本发明的编码器;W及
[0057] 图13表示根据本发明的解码器。
【具体实施方式】 阳05引皿R图片通常被表示为一组像素。色彩值;元组(例如,化G,B)值)与每个像 素相关联。运样的值通常是(但并非必然是)W8个W上的比特来表示的浮点值。运些图 片通常由皿R成像系统所捕捉,与当前的标准数字成像相比,皿R成像系统被配置为捕捉在 图片的最亮区域和最暗区域之间的更大的动态范围。皿R图片因此更精确地表示在真实景 象中发现的强度等级的范围,并通常通过相同主题的多个不同曝光的图片的方式而被捕捉 到。
[0059] 公开了一种用于编码具有N个皿R图片的序列的方法。N是大于或等于1的整数。 在第一特定且非限制性实施例中,为了编码整个序列,向序列的每幅图片独立地应用相同 的步骤。因此,图1描绘了根据本发明的第一实施例的编码方法的流程图。更准确地,图1 描绘了应用于序列的当前皿R图片Pi的编码方法的步骤,其中,i是标识该图片在序列中的 位置的整数索引。 W60] 在步骤10中,获得表示当前皿R图片Pi的平均亮度的值avg_lum。根据特定实施 例,获得该值包括确定例如图2中所描绘的值。根据变型,从存储器(可选地,通信网络的 远程设备的存储器)获得该值。事实上,可通过另一应用确定值avg_lum。
[OOW] 在步骤12中,基于值avg_lum并基于所定义的平均亮度值desired_avg_lum处 理皿R图片Pi,W得到明亮度得到很好平衡的图片。更准确地,处理皿R图片Pi,使得已 处理图片P/的对应平均亮度值(表示为proc_avg_lum)接近desired_avg_lum,或与 avg-lum相tk至少更接近desired_avg_lum,良P|avg_lum-desired_avg_lum| > |proc_ avg_lum-desired_avg_lum|。例如,处理皿R图片Pi包括应用伽马校正。因此,对于Pi的 每个像素,其值V被改变为yY,其中,丫是伽马因子并等于l〇g2(desired_avg_value)/ log2(avg_lum)。通过向图片Pi应用伽马曲线,所产生的图片的平均亮度值从avg_lum向接 近desired_median_value的值偏移。特别是针对暗图片,伽马校正生成更适合于MPEG编码 的明亮度得到很好平衡的图片。所定义的平均亮度值desired_avg_lum被定义为使得已处 理图片Pl'与Pl相比编码花费更少。事实上,传统编码器被定义为在具有明亮度得到很好 平衡的图片的最优条件下工作。因此,将desired_avg_lum有利地定义为中间灰度(也称 为18%灰度)。该灰度是亮度标度上在感知上大约位于黑和白之间的中间位置处的色调, 并因此对应于对于人眼而言明亮度得到很好平衡的图片。可W将其他值用于desired_avg_ lum,只要已处理图片P/的明亮度与Pi的明亮度相比得到更好的平衡。因此,将皿R图片 的对应平均亮度值从avg_lum修改为接近desired_avg_lum的值p;roc_avg_lum。 阳06引在步骤14中,将已处理图片P/分解为第一LDR图片和第二LDR图化其中,第一LDR图片与皿R图片具有相同的分辨率,W及与皿R图片相比具有较低分辨率的第二LDR图 片表示皿R图片的整体照度。第一LDR图片表示景象的结构、细节等。例如,将双调制分解 方法用于该目的。在Oh的题为"化曲dynamicrangepic1:ureencodingforBri曲tSide display"的论文中公开的方法是运种双调制方法的示例。双调制分解方法的优点是提供可 使用单个编码器(对应地,解码器)来分布的两个8比特数据平面。本发明不受特定的双 调制分解方法所限,即,其可使用任何的双调制分解技术或整体照度映射技术。更一般地, 可使用根据皿R图片来提供运种第一LDR图片和第二LDR图片的任何方法。
[0063] 在步骤16中,使用单个编码器将第一LDR图片和第二LDR图片编码为流F。可将 标准的消费级MPEG编码器用于该目的。更准确地,使用具有时间和空间预测的经典编码方 法(例如,基于MPEG2、MPEG4、AVC、H. 263、肥VC等)来编码第一LDR图片。运种方法是本领 域技术人员所周知的。其经典地包括:确定残差,使用例如DCT(离散余弦变换的英文首字 母简写)将残差变换为系数,对系数进行量化并对已量化的系数进行赌编码。将具有较低 分辨率的第二LDR图片有利地无损编码到流F中例如作为补充增强信息消息(SEI消息), 或无损编码到用户数据中。在若干视频编码标准中,且具体地在IS0/IEC14496-10 :2005 的附录D中定义了运种SEI消息。根据变型,将第二LDR图片编码到图片的已知在解码器 侧要被裁剪的区域中。事实上,对于1920x1080皿格式,输入图片是1920x1080,且在解码器 侧裁剪8条线。将运8条线有利地用于传输第二LDR图片的数据。在该情况下,在不压缩 的情况下编码对应数据,例如使用IPCM(帖内脉冲编码调制)无损编码模式来进行。根据 另一变型,例如使用IPCM模式将第二LDR图片的数据无损地编码到第一LDR图片的一些有 效的线中。在该情况下,在解码器侧将运些线替换为黑色值、白色值或灰色值,W限制伪像。 除了该两幅LDR图片之外,将作为avg_lum的函数的数据编码到流F中。事实上,在解码器 侧使用该数据来反转处理步骤12。根据本发明的特定特征,所编码的数据是avg_lum。根 据变型,将伽马因子丫或其倒数1/丫而不是avg_lum编码到流中。根据本发明的特定特 征,还将值desired_avg_lum编码到流F中。根据变型,不对该值编码,且该值在解码器侧 是已知的。在编码伽马因子丫或其倒数1/丫时,不对值desired_avg_lum进行编码。
[0064] 图2描绘了根据特定且非限制性实施例的编码方法的步骤10的详细实现。在该 具体实施例中,获得值avg_lum包括确定该值。 W65] 在步骤100中,将log2函数(W2为底取对数)应用到皿R图片的像素值化G和B值)。事实上,log2函数的形状被视为是对亮度的人眼反应的粗略估计。
[0066] 在步骤102中,确定像素log2值的最低值和最高值。可W将=个分量R、G、B- 起考虑或独立考虑。在后者情况下,因此确定3个最低值和3个最高值。将最低值表示为 min,且将最高值表示为max。根据变型,从存储器(可选地,从通信网络的远程设备)获得 该值。
[0067] 在步骤104中,将像素log2值关于所确定的min和max值进行归一化。因此,归 一化的l〇g2值位于范围[0 ;1]内。
[0068] 在步骤106中,根据W下公式,由归一化的log2值确定像素的亮度值:
[0069] Y= 0. 2126*R+0. 7152*G+0. 0722地,其中,R、G和B是归一化的像素log2 值。该 等式通常用于将巧,G,B)分量变换为狂,Y,幻分量。本发明不限于该特定等式。事实上, 可W使用其他等式,例如Y= 0. 299R+0. 587G+0. 114B。该等式通常用于将巧,G,B)分量变 换为Rec. 709灯,U,V)分量。
[0070] 在步骤108中,根据步骤106处确定的亮度值来确定表示皿R图片Pi的平均亮度 值的值avg_lum。例如,将avg_lum设置为亮度值的中间值。根据变型,将avg_lum设置为 所有亮度值的平均值。
[007U在步骤16中,除了avg_lum值或者除了丫或1/丫之外,还对min值和max值进 行编码。
[0072] 图3描绘了根据特定且非限制性实施例的编码方法的步骤12的详细实现。 阳07;3] 在步骤120中,根据avg_lum和desired_avg_lum确定伽马因子丫。将伽马因子 设置为 1〇邑2 (desired_avg_value) /log2 (avg_lum)。将desired_avg_lum例如设置为 0. 18, W对应于中间灰度。可W使用其他任何可提高编码效率的值。 阳074] 在步骤122处,向步骤104处获得的归一化log2值应用伽马校正。因此,对于Pi 的每个像素,其归一化l〇g2值V改变为VY。通过向图片Pi应用伽马曲线,所产生的图片 的平均亮度值从avg_lum向接近desired_median_value的值偏移。
[0075] 图4和图5描绘了根据本发明的具体且非限制性实施例的编码方法的步骤14的 详细实现。可W使用任何其他双调制方法,即,产生与皿R图片具有相同分辨率的LDR图片 W及表示皿R图片的整体照度的具有较低分辨率的LDR图片的任何方法。
[0076] 在步骤140中,将已处理图片P
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1