视频信号内阻塞的谐波测量的制作方法

文档序号:7749322阅读:211来源:国知局
专利名称:视频信号内阻塞的谐波测量的制作方法
技术领域
本发明涉及对视频图象信号的图象质量的评估,尤其是涉及一种谐波方法以及装置,用于测量视频图象信号内的阻塞(blockiness)。
在带宽非常重要的数字视频传输例如是在卫星链路上的传输中,视频信号经受了各种程度的压缩,以减小每个视频信道所需的带宽。一般所用的压缩标准,例如象JPEG、MPEG或其独占的变型,都是“有损的”——为获取更高的压缩,这些压缩标准允许在由视频信号所表示的图象中出现失真。失真的大小是图象复杂度以及压缩编码器所允许使用的每秒的比特数(比特率)的函数。理论上,在依然将视频图象或画面传送给不受干扰赝象(artifact)的客户时,压缩量最大。
当前分析画面质量的设备,例如由美国的Oregon,Beaverton的Tektronix公司制造的PQA200画面质量分析仪就是基于这种标准的。将通过视频系统传输的视频信号与测量设备内的作为基准视频信号的原始视频信号相比。基准视频信号既可以被存储在测量设备内,也可以通过一些其它的无失真路径被传送到测量设备。基准视频信号的使用对极端精确的算法是必需的,例如是Sarnoff CorporationJNDmetrixTM的人类视觉模型算法。但是,这意味着只能对某一类视频信号进行测量,这类信号的内容或是已经事先知道,或是可以立即得到的,例如双重监视源处的编码器。
测量基于离散余弦变换(DCT)的编解码器降级的另一种可能的方法包括直接检查压缩视频流内的量化程度的粗糙度,该压缩的视频流有选择地与通过视频信道外的某些装置传送的原始图象的复杂度的测量——压缩基准的一种形式相组合。这种方法并不一定精确,而在任何情况下都只能对压缩视频信号进行测量,而对于已经被解压缩的视频以及有可能通过其它系统的视频,则不能进行测量,包括在最终用户传输之前的其它附加的编解码器。
所需要的是一种方法和装置,它允许在没有阻塞周期的在先了解的情况和存在图象内容产生的噪声的情况下,测量例如是在使用离散余弦变换压缩视频时所产生的阻塞赝象信号。
因此,本发明提供了用于测量视频输入信号内阻塞的一种谐波方法和装置。得到对于视频输入信号的视频场的功率谱如同在边缘滤波之后的视频行内的行总和的快速傅立叶变换。来自功率谱较高频率端的最大频率峰值是一开始就选定的,而且所确定的峰值的公共周期表示公共的频率间隔。考虑到在1/2以及2倍的公共频率间隔处的峰值所构成的影响,在公共频率间隔处的峰值的幅度被校正。对在公共频率间隔处的峰值的经过校正的幅度进行平均,并将其归一化,以便对视频输入信号产生一个阻塞量度。
当阅读了联系附加权利要求书以及附图的以下详细的说明书之后,可以更清楚地了解本发明的目的、优点以及其它新颖的特征。


图1A-D是具有或不具有阻塞的,并具有寄生峰值的视频信号的谱图。
图2是依据本发明的用于测量视频信号内的阻塞的流程图。
图3是依据本发明的用于测量视频信号内的阻塞的装置的框图。
本发明是基于这样一种观察而作出的,即由阻塞赝象信号所劣化的视频场的频谱具有一种特征形式,如图1A-D所示。视频场的这种频谱是这样获取的,即通过对载有视频Iuma含量的每一行执行边缘滤波、将来自一个视频场的所有视频行都加到一行上,之后,对所得到的行采用傅立叶变换,例如是快速傅立叶变换(FFT)。
图1A表示了视频场的典型频谱,它是由缺少阻塞赝象信号的视频内容所产生的。这种频谱随场的不同而稍有变化,这取决于内容,但其形状的基本特性得以保持。图1B显示了阻塞赝象信号出现于视频内时的典型频谱。这里,峰值位于某个频率的整数倍处,该频率是出现块界的周期的倒数。理想情况是,所有的峰值在幅度上相等,但隐含滤波的影响可导致波形的变化,如图1C所示。视频内容通常富有具有尖锐边缘的图象,或是载有由有限脉冲响应(FIR)数字滤波招来的赝象信号的图象。在这种情况下,可能产生图1D所示的情况,这里频谱内的各个峰值都是沿着表示阻塞赝象信号的峰值出现的。
图2中所示的是一种允许从测量结果中消除频谱内的寄生频率峰值的方法,这样,就允许对由阻塞赝象信号所产生的频谱内容的识别和测量。从所产生的频谱峰值中间,对来自频谱较高频率端的大的峰值进行分类,并抛弃那些未落到频率间隔整数倍上的频谱峰值。通过这样做,就抑制了频谱内的大部分寄生峰值,只剩下由阻塞赝象信号所产生的峰值。这样,在视频内出现的阻塞的量被确定,作为从这些频谱峰值导出的某种聚集度量(aggregate measure),这样一种度量是峰值幅度的平均值。
一旦得到了聚集行的频谱,就对其进行分析,以确定有优势的频谱峰值,以及,这些峰值是否是被规则地隔开的,以表示阻塞。舍弃与最低频率接收器相应的头N个离散傅立叶变换(DFT)系数,其中N对于512点的DFT可等于50,在所述最低频率接收器中,设有大部分的自然画面的能量。之后,对频谱进行滤波,以获取平滑的基线频谱,再从原始频谱中减去该基线频谱,从而得到一个标准化的频谱。这种做法消除了大部分的噪声例如白噪声,以及来自频谱的画面内容能量。这样,就发现了频谱内的最大的P峰值,并对这一聚集用一个公共周期搜寻。该公共周期与图象内的主要的阻塞周期相应。
一旦确定了主要的阻塞周期,就可计算出在该周期内的阻塞的量。为此,在消除了从一半以及2倍阻塞周期处的峰值所估测出的影响后,就可度量出平均谐波峰值高度。之后,用阻塞周期对阻塞量进行标定,以获取归一化的阻塞量度,可以在不同周期上对这种度量进行比较。
一般来说,阻塞具有独立的水平以及垂直分量。作为折衷,仅计算上述水平分量。为计算垂直分量,上述的水平阻塞检测是由原始输入图象的转置执行的。理想地,阻塞的实施计算出每行的频谱,并通过平均来聚集,而不是首先聚集,再计算频谱。这防止了不同行的相位特性失真聚集频谱,即,在计算出幅度之前,将彼此消除掉。但这种技术时下还过于昂贵,所以,还使用只在一个方向(水平方向)上测量阻塞的不是特别可靠的实现方法。
1.具有相等的阻塞量的两帧之间的频谱系数的幅度与阻塞的周期成正比,具有较长周期的帧在其频谱中也具有较多的峰值。因此,如果帧1具有阻塞周期8,帧2具有阻塞周期16,则帧1在幅度两倍于来自帧2的频谱峰值的情况下具有同数数量频谱峰值的一半。通过由阻塞周期归一化阻塞的结果,用于量化阻塞的这一度量考虑了这一事实。
2.如果一帧包括其享公共谐波即8和16,8和12等的多个阻塞周期的倍数,则聚集频谱失真。例如,对于8和16的情况,由于来自阻塞周期为16的能量贡献,因而对于阻塞周期为8的所有频谱峰值都增加了。不考虑这一可能性,则可能计算出的阻塞周期为8的能量比实际出现的要大。相反,为测量阻塞周期为16的频谱峰值,与周期为8的峰值一致的偶数频谱峰值要比奇数峰值大。这就提议以下方法来估测周期为8和周期为16的阻塞能量的相对贡献给出所需的阻塞周期P,为估测频谱能量,计算周期为2*P的奇次谐波的平均能量,并从所有周期为P的峰值中减去该平均能量。当前这种实现方法对潜在的公共(P,2P)二次谐波的情况执行了这种一阶校正,但不能对考虑了任意共享的谐波配置的更多的一般(N*P,M*P)情况执行这种校正。
3.如果目的是计算一个已知周期的阻塞度量,则可通过仅仅直接计算所需频率的DFT系数而不是计算整个频谱,就有可能在功效上得到改善。例如对于为8的阻塞,对于512点的DFT实现方案,只需要计算64、128和192处的系数。大于256的频谱系数反映出那些小于256的频谱系数。
4.由于DFT仅对整数频率接收器进行计算,因此当谐波落入分数频率边界上时,就会引入一些错误。也可以计算较大的方案例即使用具有补零的1024点DFT,或使用一些内插进形式进行计算。但随着内插频谱拖尾效应的出现,在DFT内引起几个相邻的接收器接收来自分数谐波的能量。在DFT中的点数越少,则阻塞度量的准确度和精确度就越差。
虽然上述说明的方法导出了整个图象的阻塞的聚集度量,但也可将该方法应用于视频图象的局部区域,且也可以依据底图象的人类视觉滤波,从加权的阻塞的局部测量组成它,从而得到阻塞的聚集测量。
现在,请参见图3,要求实现所述方法的装置包括一个视频信号接收器12,它能将视频信号转换为数字形式,以便其能被存储在计算机存储器14内的阵列内或位图内;一个滤波器16,用于获取如上所述的频谱。之后,如上所述,通过适当的分析仪18,将有关的阻塞缺损的频谱峰值信息隔离,并在适当的显示器20上报告阻塞测量。
这样,本发明提供了利用频率谐波的一种阻塞度量,通过从一个输入视频信号中产生一个功率谱、从该频谱中选出最大峰值、舍弃不是频率的整数倍的那些峰值、找到与每一组峰值相应的最大的阻塞的量、并报告占优势峰值组的阻塞周期以及量。
权利要求
1.利用谐波测量输入视频信号内的阻塞的一种方法,包括以下步骤对输入视频信号的一个视频场产生一个功率谱;从所述功率谱中选出一组峰值,这些峰值位于公共频率间隔上;以及对所述峰值组,确定其阻塞度量。
2.如权利要求1所述的方法,其中所述产生步骤包括以下步骤对所述视频场进行滤波,以强化边缘;将经过滤波的视频场的行相加为一个单行;以及对所述单行执行一个傅立叶变换,以产生所述功率谱。
3.如权利要求1所述的方法,其中所述选择步骤包括以下步骤对所述功率谱的较高频率端上的大的峰值分类,以获取最初的峰值组;以及寻找最初的峰值组,以找到在峰值之间具有一个公共周期的峰值组,所述公共周期确定了公共频率间隔。
4.如权利要求3所述的方法,其中所述分选步骤包括以下步骤舍弃表示与最小频率接收器相应的视频场的内容的头N个离散傅立叶变换系数;对所述功率谱进行滤波,以获取平滑的基准频谱;从所述功率谱中减去所述平滑的基线频谱,以获取归一化的频谱;以及找出所述归一化频谱中最大的P峰值,作为最初的峰值组。
5.如权利要求1所述的方法,其中所述确定步骤包括对所述峰值组的幅度进行平均,以作为阻塞度量的步骤。
6.如权利要求3所述的方法,其中所述确定步骤包括以下步骤消除由在一半的以及两倍的公共周期处的峰值所增加的峰值组的幅度的贡献;测量在公共周期处的峰值的平均谐波峰值幅度,以获取一个阻塞量;以及用公共周期来标定所述阻塞量,以获取一个归一化阻塞度量,作为所述阻塞的度量。
7.如权利要求6所述的方法,其中所述消除步骤包括以下步骤对两倍的公共周期的奇次谐波处的峰值幅度进行平均,以产生一个平均的幅度基值;以及从所述公共周期处的所述峰值幅度中减去所述平均幅度基值。
全文摘要
测量视频信号内的阻塞的一种方法产生了用于视频信号的一个视频场的功率谱。在所述功率谱的较高频率端上的功率谱的最大峰值是一开始就选定的,并确定了峰值之间的公共频率间隔。从出于公共频率间隔处的峰值幅度中减去由不处于公共频率间隔上的峰值对处于公共频率间隔上的峰值幅度的贡献。这样就得到了处于公共频率间隔处的经校正峰值幅度的平均,且该平均被归一化,以作为对所述视频信号的一个阻塞度量。
文档编号H04N7/30GK1309506SQ0013648
公开日2001年8月22日 申请日期2000年12月21日 优先权日1999年12月22日
发明者B·扬科, J·赖茨 申请人:特克特朗尼克公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1