用于估计视频质量评估的内容复杂度的方法和装置的制造方法_2

文档序号:8909503阅读:来源:国知局
CT系数做索引;以及DCT al指代第1个 分区中的量化的DC系数。
[0024] 上面的CU计算可以应用于任何大小的块(或例如HEVC的其他标准中的编码单元 /预测单元)和块内的任何分区。在本应用中,例如等式(1)中计算的、基于预测残差的能 量计算的内容不可预测性参数被表示为未处理的CU参数。
[0025] 预测技术根据编码画面类型而变化。例如,I画面仅支持帧内预测并且可以具有 比P和B画面更大的预测残差。由于帧间预测,P画面通常具有比I画面更小的预测残差。 因为双向帧间预测,B画面通常具有比I和P画面更小的预测残差。也就是说,不同类型的 画面包含不同数值尺度的预测残差,即使对应的画面可以具有类似内容(例如,画面属于 相同场景,或画面之间的相似度度量小于阈值)。因此,被计算为画面上的预测残差能量的 未处理的CU参数不仅取决于视频内容,而且取决于画面类型,并且因此可能不能准确地反 映画面的复杂度。
[0026] 图1A分别示出被编码为I、P和B画面的三个示例原始画面。图1B示出对应的未 处理的CU参数。为了可视化,CU参数被对数地映射为像素亮度(即,图1B中的像素的亮 度对应于图1A中的宏块的CU参数的值)。像素越亮,CU参数越大。虽然三个原始画面在 图像内容上非常类似,并且因此在感知的内容复杂度上非常类似,但是I画面具有最大未 处理的CU参数并且B画面具有最小未处理的CU参数。在图2A和2B中示出的另一示例中 也进行类似观察。
[0027] 图3示出不同画面类型的宏块的未处理的⑶参数值的示例分布。概率分布函数 通过具有15的区间(bin)宽度(即,未处理的⑶参数值的间隔)的标准化直方图来近似。 在576行视频的连续250帧中,对来自I、P和B画面的全部宏块分别计算未处理的CU参数。 总地,未处理的⑶参数对于I画面最大,并且对于B画面最小。从I、P到B画面,概率分布 曲线的尾部变得更细。图3的图例列出r分布参数,其单独地适用于每种类型的画面。在 该示例中,我们观察到形状参数(I画面为〇. 033, P画面为0. 041并且B画面为0. 049)相 当类似,而缩放参数(I画面为4916, P画面为1086并且B画面为324)非常不同。
[0028] 根据图1-3中示出的示例,我们观察到即使当感知的内容复杂度非常类似时,未 处理的CU参数可以随着画面类型显著变化。为了更准确地测量内容复杂度,本原理针对一 种考虑到上文所述的感知到的变化的用于改进估计的内容不可预测性参数的方法和装置。 具体地,对未处理的CU参数进行缩放以与在另一编码配置中获得的CU参数对准,使得对准 的CU参数更接近地反映感知到的内容复杂度。当另一块具有与当前块类似的内容时,在CU 参数对准之后,在一个编码配置中的当前块的对准的CU参数的值与在另一编码配置中该 另一块的对准的CU参数的值基本上相同。
[0029] 所提出的CU参数对准方法基于下文中讨论的两个一般假设。
[0030] 假设1宏块的未处理的⑶参数值遵照独立伽马分布(r分布)。r分布的、具有 形状参数k和缩放参数0的、被表示为Y~r (k,0)的随机变量Y具有概率分布函数:
[0031] 对于 y 彡 0 和 k, 9 > 0
[0032] 假设1基于宏块的未处理的CU参数被定义为预测残差或像素的方差的观察结果, 以及下列引理:
[0033] 引理:如果Xl,x2,...,xn为独立同分布
...道机变量,则它们的方差, Bf _ .
伽马分布的特殊情6
[0034] 严格地说,相邻像素和残差都不是独立高斯分布的,因此我们作出它们的方差遵 照具有宽松的形状参数k的广义r分布r (k,2 〇 2),其中k不再准确地等于(n-1) /2的小 心的近似。通常,相邻像素的相关性和稀疏性使得k比(n-l)/2小得多。然而,尽管编码配 置不同,但是对于相同视觉内容,这种相关性应相对一致。因此,我们进行下列假设。
[0035] 假设2在不同配置下,(相同或类似内容的)未处理的CU参数分布具有常量形状 参数k和可能不同的缩放参数0。
[0036] 基于上述假设,CU对准的问题变为估计不同配置的缩放参数0。假设存在两种配 置X和Y,估计问题可以通过CU训练集合{ x}#p {y} Y上的分布参数的最大似然估计来解 决。
[0037]
[0038] 其中x和y分别表示在不同配置X和Y下的MB的未处理的⑶参数值,并且%和 %分别是集合{X} {X} Y的总数。
[0039] 随后,我们可以对于每一种配置对准MB方式(MB-wise)的⑶,并且获得对准的MB 方式的cu (被表示为fD ),例如:
[0040]
[0041] 在下文中,我们提供一种用于解决如等式(3)中描述的估计问题的示例实施例。 参考等式(2)和(3),对数似然为
[0042]
[0043] 关于0 x将对数似然的导数设置为零,得到:
[0044]
[0045] 并且导致0 最大似然估计:
[0046]
[0047] 类似地,0 Y的最大似然估计可以被推导为:
[0048]
[0049] 因此,在没有估计k的情况下,我们具有:
[0050]
(
[0051] 也就是说,等式(5)提供配置X和Y的缩放参数0之间的比例,其中比例也被称 为对准缩放因子,以对未处理的CU参数进行缩放,以便在配置X和Y之间将它们对准。
[0052] 在一个示例中,当ITU-T P. NBAMS (视频媒体流传输质量的参数非侵入式比特流评 估)数据库用于训练时,我们推导对准缩放因子并且估计视频序列的内容复杂度作为视频 序列的全部画面中的全部可用MB的对准的CU参数的平均值。在该示例中,内容复杂度被 细化为⑶的加权组合:
[0053]
[0054] 其中t G {1},t G {P}和t G {B}分别表示I画面、P画面和B画面,CUr为第r 个MB的未处理的内容不可预测性参数值,T为画面的总数,c为常数,并且| r 11表示第r个 MB中的分区的总数。常数20. 6为I画面和B画面之间的对准缩放因子,并且常数3. 52为 P画面和B画面之间的对准缩放因子。
[0055] 对于图1A和2A的示例,对准的⑶参数分别在图1C和2C中示出。与图1B和2B 中示出的未处理的CU参数相比较,对准的CU参数跨越不同画面类型上具有更类似的缩放。 因此,对准的CU参数可以更好地反映内容复杂度。
[0056] 除了画面类型之外,其他编码配置,例如使用的压缩标准、最大连续B画面、 GOP(画面群组)结构、即时刷新率和帧内预测的预测方向的总数可以影响预测效率并且从 而影响B、P或I画面的平均未处理的CU参数值,特别是当不频繁地使用I帧时(即,使用 长GOP)。此外,未处理的CU参数值还取决于视频分辨率和帧速率。例如,更高的分辨率或 帧速率通常导致更低的未处理的CU参数值。因此,需要跨越不同配置确定对准。在一个实 施例中,取决于编码配置,可以使用不同训练集合并且因此可以相应地估计对准缩放因子。 例如,关于分辨率
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1