用于测量视频数据质量的方法和设备的制作方法

文档序号:7862091阅读:411来源:国知局
专利名称:用于测量视频数据质量的方法和设备的制作方法
技术领域
本发明涉及一种用于测量视频数据质量的方法和设备,尤其涉及一种在不参考源视频数据的情况下估计画面质量的方法和系统。
视频专家的最终目标是为观众提供最能在感观上吸引人的视频图像。其中一种确定最终图像质量好坏的方法是要求一组观众观看某些视频序列并要求他们提供自己的看法。另一种分析视频序列的方法是提供一种自动机制来评估视频质量优越或下降。为此目的,这其中使用了不同的量度来估计总的视频质量量度,其中包括例如清晰度、块效应(blocking)、振荡(ringing)、削波(clipping)、噪声、对比度和瞬时减损(temporal impairment)。在没有客观的质量量度的情况下,要想使用正规的主观测试来执行视频质量的例行评估,那么这将会非常耗时并且成本很高,此外,对处于使用中的应用来说,这是不可能实现的。因此,本发明提出了一种用于静止和编码视频的客观质量评估,它能在不使用源数据的情况下测量视频数据的改善和下降。
本发明针对的是一种在不使用参考图像的情况下评估视频数据质量的设备和方法。
根据本发明的一个方面,在这里提供了一种生成用于估计输入视频数据质量的主观参考模型的方法。该方法包括以下步骤从多个采样视频数据中获取多个平均主观得分;为多个平均主观得分中的每一个得分计算多个图像量度;将多个图像量度中的至少某些量度转换成相应的感觉质量量度;以及基于多个图像量度和感觉质量量度来导出模型。然后,使用主观参考模型来为任何给定输入视频数据产生一个客观质量量度。平均主观得分则是如下获取的在某种预定条件下向多个观众显示多个采样视频数据;根据预定准则,将多个采样视频数据中的每一个数据转换成多个经过处理的视频数据;以及,基于多个采样视频数据和相应的经过处理的视频数据来获取平均主观得分。在本实施例中,多个采样视频数据表示的是普通用户通常会观看的大范围的视频序列。多个图像量度则包含了块效应、振荡、削波、噪声、对比度和清晰度量度中的至少一个量度,感觉质量量度则包含了块效应、振荡、削波和清晰度感觉量度中的至少一个量度。
从下文中附图所示的优选实施例的详细描述中可以更清楚地了解到本发明的前述及其他特征和优点,在附图不同的视图中,相同的参考字符指的是相同的部分。这些附图不必按比例绘制;相反,重点在于说明本发明的原理。


图1是本发明实施例适用的简化框图;图2是描述依照本发明获取用于预测客观质量得分的主观参考得分的操作步骤的流程图;图3是在图2的获取主观参考得分的处理过程中生成的表格;图4是在图2的获取主观参考得分的处理过程中生成的另一个表格;图5描述的是依照图2所述的操作步骤而产生的主观参考得分;图6是依照本发明的图像处理系统的详细功能框图;以及图7是描述根据从依照本发明的主观参考得分导出的常用函数来获取客观质量得分成分的处理的功能图。
在以下描述中将会对特有结构、接口和技术等之类的细节进行阐述,以便彻底理解本发明,但这仅仅是为了进行说明而不是加以限制。此外,为了简明起见,在这里将会省略关于公知设备、电路和方法的详细描述,以免不必要的细节导致本发明的描述不清楚。
图1描述的是本发明实施例适用的图像处理系统10。如图1所示,系统10包括一个或多个视频/图像源12、一个或多个输入/输出设备14、一个处理器16、一个存储器18以及一个显示设备20。输入输出设备14、处理器16和存储器18可以经由通信介质22来进行通信,其中通信介质22可以表示总线、通信网络、电路、电路卡或其他设备的一个或多个内部连接,此外还可以表示这些和其他通信介质的一部分或其组合。存储器18不但可以表示基于盘片的光/磁存储单元、电子存储器,而且还可以表示这些和其他存储设备的某些部分或组合。应该注意的是,与图像处理系统10相关联的不同功能操作可以整体或者局部地在由存储器18保存并由处理器16执行的一个或多个软件程序/信号处理例程中实施。然而在其他实施例中,也可以使用专用集成电路(ASIC)之类的硬件电路来取代软件指令或是与之相结合以便实施本发明。
此外,在这里不应将“处理器”或“控制器”的显性使用解释成仅仅指能够执行软件的硬件,而且可以隐性包含但不局限于数字信号处理器(DSP)硬件、用于存储软件的只读存储器(ROM)、随机存取存储器(RAM)以及非易失存储器。此外这其中也可以包含其他的常规和/或定制硬件。它们的功能可以通过程序逻辑操作、专用逻辑、程序控制与专用逻辑的交互作用、甚至是手动方式来加以实现,从文中可以更为具体地了解到实施者可选的特定技术。
以下将参考图2和5来对本发明的详细描述进行说明。
本领域普通技术人员将会了解,客观质量量度中的基本任务通常是模拟主观图像质量,它表示的是观众群体在受控环境中的平均判定。主观图像质量会受到减损和属性之类的图像特征的组合感觉的影响。因此,本发明提供了获取主观参考模型的装置,该模型可用于产生表示输入图像质量下降或提高的客观质量得分。
参考图2,其中阐明的是产生主观参考模型的过程,该模型被用于产生输入视频数据的客观图像量度。首先,在步骤100中产生一组n个视频序列,这些序列指的是一般观众在大多数视频应用中所看到的内容。从一组K个原始视频(本领域普通技术人员将会了解,这是指那些直接来自视频捕获/生成设备的没有减损或是特别增强的视频)开始,每一个视频都会经受多种不同处理,例如数量为L的处理,在这些处理中将会应用诸如块效应、噪声、压缩、清晰度、增强或其任何组合之类的变化等级的质量影响因素,以便将视频序列转换成多个不同的视频数据,从而对其进行评分。举个例子,如图4所示,其中结合了设定在0.25、0.5、0.75和1.0的清晰度来处理视频序列S1,以便产生四个不同等级的清晰度,然后则要求观众观看每一组视频序列,以便获取平均主观得分S11、S12、S13以及S14。此外还对视频序列S1执行了设定在1Mb/s、2Mb/s和5Mb/s的位速率的压缩,并且获取了相应的平均主观得分S21、S22和S23。同样,在这里还结合了三个不同等级的位速率来对同一个视频序列S1进行处理,同时在每一个等级都删除了指定数量的块效应,S31、S32、S33。就噪声而言,在这里将大小为30dB、35dB和40dB的高斯噪声进一步应用于视频序列S1,并且通过对其进行观看而产生一个平均主观得分S41、S42和S43。处于三个不同等级30dB、35dB和40dB的噪声与三个清晰度等级0.25、0.5和0.75相混合,然后通过观众观看来获取平均设定值S51、S52、S53、S61、S62、S63、S71、S72以及S73。对0.25和0.5这两个清晰度等级来说,大小为3Mb/s和5Mb/s的压缩将会产生平均得分S81、S82、S83和S84。此外在这里还将噪声和指定数量的噪声缩减量引入视频序列S1,以便产生平均主观得分S91、S92和S93。如果我们要产生总数为n的测试序列,那么n将会等于K×L,或是将原始视频数目与处理数目相乘,以便产生多个质量等级。应该指出的是,每一个原始视频序列都转换成了图4所示的用于说明的特定数量的等级,并且由此不应当限制本发明的范围。相应地,根据本发明的教导,在这里也可以进行其他的转换组合,由此不应该对本发明的范围构成限制。
在步骤120中,通过向众多测试观众(m)显示多个视频序列,可以获取相应的平均主观质量得分。举个例子,在这里将多达21个观众分成3个一组(也就是说,每次使用三个观众来进行测试)。然后则要求各组评估大范围的视频序列并对其进行评分。为了提高可靠性,主观质量得分必须是使用一个可重复过程获取的,例如国际电联(ITU)建议500中描述的过程,其中该建议的内容在这里引入作为参考。ITU提供了执行主观质量记分时所要遵循的测试条件列表。
在步骤130中,对每n个视频序列的主观得分的平均值进行计算。其结果制成了如图3所示的表格,其中Vn表示的是不同的视频序列,Sn表示的是从观众那里得到的相应的平均主观得分。如图5所示,在步骤140,从步骤100生成的每n个视频序列中提取涉及减损和属性的多个图像量度,例如块效应(B)、振荡(R)、削波(C)、噪声(N)、对比度(CN)以及清晰度(SH)。本领域普通技术人员将会了解,假设在图像捕获过程之后,原始视频输入没有减损和增强。然而在接收端,视频质量将会因为与传送(即噪声)、压缩(即MPEG假象(artifact))和图像处理(即由有限精度算法所造成的削波)相关联的不同因素而受到影响。如图5所示,其中使用了图像特征组来确定客观质量模型,该模型则从输入视频信号的所有块效应、振荡、削波、噪声、对比度和清晰度中计算步骤130中生成的主观得分。本领域普通技术人员将会了解,如果步骤100中生成的视频序列表示的是用户视频质量,那么该客观质量模型将能预测该组中并未包含的新视频序列的主观质量。
在步骤150中,根据如图5所示的所获取图像量度来得到满足各组图像量度条件的主观参考模型F(稍后将会对此进行说明)。在本实施例中,以这种方式获取的主观参考模型提供了一个函数模型,该模型可以在没有可用参考源视频信号的情况下评估视频质量。
参考图6,其中描述了根据图2中步骤150的图像量度来推导主观参考模型的过程。方框210~300表示的是图5所示的每一个图像量度。各个图像量度的计算可以通过多种方式实现,尽管这一点在本领域是众所周知的,然而为了完整起见,在下文中将会对计算各个图像量度的特性以及某些示范性方式进行简要描述。
方框310表示的是块效应(B),它是因为粗糙量化MPEG编码标准中的(8×8象素块)DCT系数而造成的。本领域普通技术人员将会了解,其中一种最有名的MPEG假象就是块假象。块假象的数量和可视性会随着压缩的提高而增加,也就是说,较低的比特率将会增加其数量和可视性。压缩视频的感觉质量在很大程度上受到块假象的影响。块假象可以作为在覆盖该图像的8×8的网格上发现的1×8的像素边缘的数目来进行测量。因此,块效应是以落在所使用的最可能的编码网格上的垂直和水平边缘数目为基础的。
块假象(B)的计算在本领域中是众所周知的,它可以通过多种方式实施。举例来说,其中一种公知的测量块效应的方法借助的是像素n和n+1的不连续性的大小,其中n是8(网格大小)的倍数。如果存在不连续性并且不连续性低于20这个阈值,那么这种不连续性处于一个块边缘。如果在8个连续行(从第i行到第i+8行)中发现边缘,则将其视为一个块假象。另一种量化不连续的方法是在块的两边使用线性像素外推的不连续性大小。
参考图6,假设B(k,l,t)=[xklt(i,j)](i,j)∈
2]]>是位于第k列第1行以及时间t的序列的亮度块。如图6所示,B(k,l,t)与B(k+1,l,t)这两个块之间的假象值即为使用相邻象素外推值为八个行估计的边界上的不连续性。因此,对这些块的每个第j行而言,外推像素值是根据一阶外推法估计的(El)j=32xklt(7,j)-12xklt(6,j),]]>(Er)j=32xk+1lt(0,j)-12xk+1lt(1,j).]]>因此,垂直假象值是八个不连续的均值Vm=18Σj=07(ΔAv)j=18|Σj=07((Er)j-(Ei)j)|.]]>方框320表示的是振荡假象(R),它是第二知名的MPEG假象。与依赖于均匀或平滑区域存在与否的块效应所不同,振荡取决于图像中的边缘数量。如果数值很高的单个象素接近变化很强的边缘或是处于非自然平滑的区域(主要是在卡通之类的合成视频中发现的),那么振荡是作为这些象素的计数(导致局部变化超出某个阈值)而被检测的。因此,振荡是一种围绕高对比度边缘的闪烁(shimmering)效应,并且取决于其将本身显示为边缘双倍的方向。振荡假象(R)的测量在本领域是众所周知的,它可以采用多种方式实施。例如,其中一种检测和测量振荡的方法包括以下步骤使用一个用于边缘转变的很高阈值来检测强变化边缘。
检测与强变化边缘相邻并且变化很小的区域(低活动区域)。
将局部变化(通常是在一个方向上使用少至两个的相邻象素来进行计算)很大的象素检测成振荡象素。举例来说,如果在低活动区域中,附近象素的局部变化为3,那么振荡象素的局部变化必须至少为该值的四倍。这其中可以使用下列条件(σv(i,j)>3)∧(σv(i,j)≥4.abs(Yi-1,j-Yi+1,j))或(σh(i,j)>3)∧(σv(i,j)≥4.abs(Yi,j-1-Yi,j+1))其中σv,h是像素Yi,j与其相邻象素Yi+1,j之间的亮度差。图像上的所有振荡象素之和即为振荡值。
方框340表示的是削波假象(C)。削波是所用处理的算术精度在图象值(亮度与色度分量)的比特数中施加的截断。它会导致产生范围有限的值,由此缩小了动态范围,从而会出现细节丢失或是将失真引入高对比度区域中。然而,如果极值超出动态范围限制,那么将会出现饱和现象并且象素将会被削波(也就是说,对8比特精度而言,像素将会选取大小为255或0的最大/最小值)。削波测量是图像中发现的被削波像素数目的一个函数。在没有对象素削波的时候,削波量度定义为0.0,在对1%或更多象素进行削波的时候,削波量度定义为1.0。通过在左边、右边、顶部和底部上将5%的边缘应用于图像,可以避免对任何空白或黑条进行计数,并且可以加速测量。
削波(C)的计算在本领域是众所周知的,它可以通过多种方式实施。例如,削波测量算法可以通过对图像上除顶部、底部、左边和右边的5%的边缘之外的每个像素进行测试来执行。然后,如果像素值为0或最大(如果精度为8比特,则其为255),那么我们将会增加削波象素的计数。在结束计数时,我们将其与图像中的像素总数(边缘除外)相除,以便获取一个作为百分数的计数。削波像素百分数则是使用以下规则转换成一个削波量度的如果其为0%,那么削波为0;如果其小于1%,那么削波与其百分数相等;以及如果其为1%或更大,则削波为1.0。
方框360表示的是噪声假象(N)。在平滑区域或是具有平滑变换的区域,噪声是最引人注目的。它会给出图像不干净的主观印象,或者将某些非预期的内容重叠在图像上。因此,在空间和时间维度上,噪声是一个随机变化,它显现的是与图像传送和生成相联系的随机处理所导致的视频图像变化程度。在某些情况下,非常少量的噪声会增加纹理的逼真度(与塑料或合成外观相比),此外还发现,该少量噪声会提高感觉质量。然而,大多数噪声会导致细节模糊,并且降低可视信息的质量。
噪声(N)的计算在本领域是众所周知的,它可以通过多种方式实施。举例来说,典型的算法包括以下步骤将图像划分成很小的块。
对每个块的强度变化进行测量。
假设噪声强度的幅度远远小于信号的幅度,那么变化最小的块(或者变化最小的块的平均值)应该与一个恒定亮度区相对应。
使用一组高通滤波器或是一个带通滤波器来滤出DC分量。
使用滤波器的输出总和来计算变化或噪声。
以下给出了在该算法中使用的滤波器[-0.13,-0.32,-0.64,-0.77,-0.58,-0.13,0.58,1.22,1.54,1.22,0.58,-0.13,-0.58,-0.77,-0.64,-0.32,-0.13]
由此可以获取在各个滤波器处于各个象素上的具有合成输出的图像(除了每一行两端的8个边界象素之外)。输出是使用一个削波函数削波的,由此确保只对那些在感觉上有作用的噪声进行计数。所使用的削波函数是clip(x)={0→if(x<ThresholdLow)x→if(x>ThresholdHigh)((x-ThresholdLow)*ThresholdHigh(ThresholdHigh-ThresholdLow))→otherwise]]>削波函数阈值是从感觉阈值的沃森模型(Watson’s model)中导出的。该模型是用以下等式描述的Y(f)=100.466(log(f)+0.4)2-0.31]]>任何滤波器的削波阈值都是如下给出的Th= ∫Y(f′)S(f′)df′其中S(f’)是滤波器的空间频谱响应。f’是先前等式中的空间频率f的归一化版本,它补偿的是观看距离。削波响应是在变化最小的m个窗口中的各个窗口上取平均值的。m个此类响应的平均值即为我们从某个滤波器中得到的噪声量度。该算法的总的噪声量度则是作为四个滤波器的噪声量度之和来进行计算的。
方框380表示的是对比度假象(CN)。对比度是所关注象素亮度与背景之间的差值,对比灵敏度则是区分对象和背景的能力。对比度(CN)的计算在本领域是众所周知的,它可以通过多种方式实施。举例来说,测量对比度的基本算法如下所示首先,对排除了左边、右边、顶部和底部的5%的边缘的图像的亮度直方图进行计算。其次,对各自包含了5%的总能量的直方图上部和下部进行分离。最后,通过将直方图上部和下部之间的差值与直方图中的最大亮度相除来对该差值进行归一化,由此计算出所述差值。
方框400表示的是清晰度量度,它既可以通过空间域中的边缘定义来测量,也可以通过变换域中的高频特性来测量。申请人在2002年6月14日提交了美国申请10/172,416,其中公开了一种基于局部边缘峭度来计算清晰度量度的新方法,由此在这里引入这种与计算清晰度量度有关的公共主题来作为参考。简要的说,清晰度量度考虑的是空间和局部频率信息,并且使用了围绕图像边缘的8×8的块的加权峭度。结果,清晰度量度显示出与感觉清晰度高度相关,即只受清晰度影响的质量变化。这样一来,通过使用相应美国申请08/846,982中公开的方法,可以确定感觉清晰度量度。
继续参考图4,在如上所述确定了相应量度之后将会执行方框320~360,以便将某些量度输出修改成一个感觉量度。从一个模拟开始,振荡和块效应值将会与一组压缩视频序列的主观得分相比较,这个得分揭示的是对那些用高于5~8Mb/s的位速率编码的序列来说,主观得分是最高的,并且这些序列显示了少量振荡和块效应。虽然有时候它们是相关的,但是块效应和振荡都是独立的假象,必须分别对其进行解释。质量与块效应和/或振荡之间的相关性并不是线性的(也就是说,对质量所造成的感觉效果很可能是一个对数或指数函数)。在二者全都存在的时候,块效应和振荡的组合效应并不是线性累加的。而且,振荡和块效应的相关比例并不是恒定的;有时候块效应会占据优势,有时候则是振荡占据优势。同样,需要将块效应/振荡变换成感觉质量单元,并且需要说明其对质量所产生的组合感觉效应。应用于各个特征的感觉函数可以是从线性到对数或多项式形式的简单变化,也可以是被发现与主观数据(与用于衡量归一化的常数因数相加)恰当关联的函数的应用。因此,在这里将会执行方框320~360,这样一来,用于块效应(B)、振荡(R)和噪声(N)的感觉函数是平方根(此外还使用了一个大小为40的比例因数),对削波而言,它是该值与2.5相乘并且加1的结果,由此提升到了1.5的乘幂。
在将块效应、振荡和削波变换成感觉质量单元之后,方框380~460将被执行,以便说明其对质量的组合感觉影响。在数学上,这个处理是如下表示的方框380-(1+CN+SH5)B1/240,]]>
方框400-(1+CN+SH5)B(1+B)R1/240]]>方框420-(1+CN)(1+2.5C)3/2方框440-2(N)(SH)(CN)方框460-(NCN)1/2(1+2.5C)2]]>方框500+SH在步骤480中,当通过确定客观质量得分来实现与主观得分高度相关的时候,NROQM包含了所有的交互作用或是处于任何组合之中。
在数学上,NROOM可以如下表示NROQM(B,R,C,N,CN,SH)=]]>-(1+CN+SH5)B1/240---(1a)]]>-(1+CN+SH5)B(1+B)R1/240---(1b)]]>-(1+CN)(1+2.5C)3/2---(1c)]]>-2(N)(SH)(CN)---(1d)]]>-(NCN)1/2(1+2.5C)2---(1e)]]>-(0.6+CN)2---(1f)]]>+SH---(1g)]]>如上所示,NROQM包含了下列交互作用对比度和清晰度对块效应和振荡的助长效果,这解释了这些假象提高的可视性(参见在以上等式的部分1a和1b中的第一项);块效应和振荡之间的掩蔽效果,这使得振荡在块效应很小的时候更为明显(参见1b第二项);对比度对削波的助长效果,这使得削波在对比度很高的情况下将会更为明显(参见1c中的项(1+CN));清晰度和对比度对噪声的助长效果(参见1d);削波和对比度对噪声的掩蔽效应,这样将会避免在存在削波的时候对噪声进行太大的加权,这受对比度的影响(参见1e)。
应该指出的是,由于清晰度(1g)是其单独支持的感觉清晰度的量度,因此清晰度是等式1中的唯一正项。在对比度高于0.4的情况下,1f项将被用于减少内容的(小)基准(baseline),如果使用的是一个无基准对比度量度,那么这一项应该是不存在的,但是说明对比度交互作用的项却必须得到保留。同样,在这种情况下也可以包括一个用于对比度的正项。
在一个替换实施例中,运动假象的量度可以进一步提高NROQM的总体性能。瞬时减损特征包含了以下各项中的至少三项的加权和连续帧中的能量差(在低速运动情况下由它来指示假象);抖动(帧速率变换所导致的对运动所进行的不自然调制,否则该运动为平滑运动);IBP漂移(一个介于I帧与先前帧之间的差值,它是由运动估计误差造成的,该误差在两个I帧或GOP之间的B和P帧中增加);运动矢量的运动场平滑标准偏差(运动矢量表示对象从一个图像到下一个图像的位置变化,低标准偏差表示的是平滑运动);蚊式噪声(固定边缘周围的噪声,它是作为边缘像素周围的很小邻域中的象素中的总和或是绝对帧差值来计算的);有鉴于上述内容,替换的NROQM函数可以表示如下NROQMopt=NROQM(B,R,C,N,CN,SH)+F(MOT)+G(CN),其中F(MOT)表示运动减损的加权和,G(CN)表示的是独立于内容的对比度量度。
参考图6,一旦得到了常规函数模型,那么可以在一个系统中实现所述函数,该系统可以包括电视、机顶盒、台式机、膝上计算机或掌上计算机、便携式可视电话、个人数字助理(PDA)以及视频/图像存储设备,例如盒式磁带录像机(VCR)、数字摄像器(DVR)、TiVO设备、常规视频处理系统等等,此外还可以包括这些与其他设备的某些部分或组合,以便在不使用输入数据的情况下估计输入数据质量。
从上文中可以明显看出,本发明具有如下优点,那就是图像量度系统10在没有使用源参考数据的情况下提供了一个与主观得分高度相关的质量量度NROQM。在现有技术中,以原始视频为参考并不适合进行服务中质量监视以及连续质量控制系统的研发。因此,本发明的教导有益于很多视频应用,例如视频成像器的聚焦调整、视频处理算法的研发、实时视频质量监视/控制以及连网视频的实时质量控制。
虽然在这里说明和描述了本发明的优选实施例,但是本领域技术人员将会了解,在不脱离本发明真实范围的情况下,还可以进行不同的修改和变化,并且可以使用等价物来替换其部件。此外还可以执行多种修改,以便在不脱离中心范围的情况下与特定情况以及本发明的教导相适应。因此,本发明并不局限于那些作为执行本发明的最佳模式而被公开的特定实施例,与此相反,本发明包含了落入所附权利要求范围中的所有实施例。
权利要求
1.一种生成用于估计输入视频数据质量的主观参考模型的方法,该方法包括以下步骤从多个采样视频数据中获取多个平均主观得分;为多个所述平均主观得分中的每一个得分计算多个图像量度;将多个所述图像量度中的至少一些量度转换成相应的感觉质量量度;以及根据多个所述图像量度以及所述感觉质量量度来导出所述模型。
2.权利要求1的方法,还包括将所述主观参考模型应用于所述输入视频数据,以便产生一个客观质量量度的步骤。
3.权利要求1的方法,其中,步骤(a)还包括如下步骤在预定条件下,将多个所述采样视频数据提供给多个观众;根据预定准则而将多个所述采样视频数据中的每一个转换成多个经过处理的视频数据;以及根据多个所述采样视频数据以及相应的所述经过处理的视频数据来获取所述平均主观得分。
4.权利要求3的方法,其中,转换步骤还包括对多个所述采样视频数据的清晰度、压缩、噪声和块效应或是它们的任何组合进行修改的步骤。
5.权利要求3的方法,其中,所述预定条件复合国际电信联盟(ITU)的建议500。
6.权利要求1的方法,其中,多个所述采样视频数据表示的是普通用户通常观看的大范围的视频序列。
7.权利要求1的方法,其中,多个所述图像量度包含块效应、振荡、削波、噪声、对比度以及清晰度量度中的至少一个。
8.权利要求1的方法,其中,所述感觉质量量度包含块效应、振荡、削波和清晰度感觉量度中的至少一个。
9.权利要求1的方法,其中,导出所述主观参考模型的步骤还包括对所述计算得到的图像量度与所述感觉图像量度之间的组合感觉效果进行计算的步骤。
10.权利要求9的方法,其中,计算所述组合感觉效果的步骤包括对从多个所述图像量度中的至少一些量度中测得的对比度量度、感觉清晰度量度以及感觉块效应量度之间的交互作用进行计算的步骤。
11.权利要求9的方法,其中,计算所述组合感觉效果的步骤包括对从多个所述图像量度中的至少一些量度中测得的感觉振荡量度以及感觉块效应量度之间的交互作用进行计算的步骤。
12.权利要求9的方法,其中,计算所述组合感觉效果的步骤包括对从多个所述图像量度中的至少一些量度中测得的对比度量度以及感觉削波量度之间的交互作用进行计算的步骤。
13.权利要求9的方法,其中,计算所述组合感觉效果的步骤包括对从多个所述图像量度中的至少一些量度中测得的感觉清晰度量度、对比度量度以及噪声量度之间的交互作用进行计算的步骤。
14.权利要求9的方法,其中,计算所述组合感觉效果的步骤包括对从多个所述图像量度中的至少一些量度中测得的感觉削波量度、对比度量度以及噪声量度之间的交互作用进行计算的步骤。
15.一种生成用于估计输入视频数据质量的主观参考模型的设备,包括处理器;与所述处理器相耦合的存储器,所述存储器被配置成允许处理器进行以下操作从多个采样视频数据中获取多个平均主观得分;为多个所述平均主观得分中的每一个得分计算多个图像量度;将多个所述图像量度中的至少一些量度转换成相应的感觉质量量度;以及根据多个所述图像量度以及所述感觉质量量度来导出所述模型。
16.权利要求15的设备,其中,所述存储器还被配置成允许所述处理器将所述主观参考模型应用于所述输入视频数据,以便产生一个客观质量量度。
17.权利要求15的设备,其中,为了获取多个所述平均主观得分,所述存储器还被配置成允许所述处理器在预定条件下,将多个所述采样视频数据提供给多个观众;根据预定准则而将多个所述采样视频数据中的每一个转换成多个经过处理的视频数据;以及根据多个所述采样视频数据以及相应的所述经过处理的视频数据来获取所述平均主观得分。
18.权利要求17的设备,其中,为了根据所述预定准则而将多个所述采样视频数据中的每一个都转换成所述多个经过处理的视频数据,所述存储器还被配置成允许所述处理器对多个所述采样视频数据的清晰度、压缩、噪声和块效应或是它们的任何组合进行修改。
19.权利要求15的设备,其中,多个所述图像量度包含块效应、振荡、削波、噪声、对比度以及清晰度量度中的至少一个。
20.权利要求15的设备,其中,所述感觉质量量度包含块效应、振荡、削波和清晰度感觉量度中的至少一个。
21.权利要求15的设备,其中,所述存储器还被配置成允许所述处理器对所述计算得到的图像量度与所述感觉图像量度之间的组合感觉效果进行计算。
22.权利要求15的设备,其中,所述存储器还被配置成允许所述处理器对从多个所述图像量度中的至少一些量度中测得的对比度量度、感觉清晰度量度以及感觉块效应量度之间的交互作用进行计算。
23.权利要求21的设备,其中,为了计算所述组合感觉效果,所述存储器还被配置成允许所述处理器对从多个所述图像量度中的至少一些量度中测得的感觉振荡量度以及感觉块效应量度之间的交互作用进行计算。
24.权利要求21的设备,其中,为了计算所述组合感觉效果,所述存储器还被配置成允许所述处理器对从多个所述图像量度中的至少一些量度中测得的对比度量度与感觉削波量度之间的交互作用进行计算。
25.权利要求21的设备,其中,为了计算所述组合感觉效果,所述存储器还被配置成允许所述处理器对从多个所述图像量度中的至少一些量度中测得的感觉清晰度量度、对比度量度以及噪声量度之间的交互作用进行计算。
26.权利要求21的设备,其中,为了计算所述组合感觉效果,所述存储器还被配置成允许所述处理器对从多个所述图像量度中的至少一些量度中测得的感觉削波量度、对比度量度以及噪声量度之间的交互作用进行计算。
全文摘要
本发明涉及一种生成用于估计输入视频数据质量的模型的方法和设备。该设备被配置成从多个采样视频数据中获取多个平均主观得分,并且为所述多个平均主观得分中的每一个计算多个图像量度。所述多个图像量度中的一些量度转换成相应的感觉质量量度,然后则基于计算得到的质量量度以及感觉质量量度来预测图像质量量度。
文档编号H04N17/00GK1669338SQ03816772
公开日2005年9月14日 申请日期2003年6月20日 优先权日2002年7月17日
发明者J·E·卡维德斯 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1