一种用于数字视频处理的运动检测和解交错方法及其装置的制作方法

文档序号:7962422阅读:143来源:国知局
专利名称:一种用于数字视频处理的运动检测和解交错方法及其装置的制作方法
技术领域
本发明涉及数字视频技术领域,特别涉及运动自适应解交错技术,尤其涉及一种用于数字视频处理运动自适应解交错技术的运动检测和解交错方法及其装置。
背景技术
在视频处理中,解交错技术是一种将隔行扫描的场信号转换为逐行扫描的帧信号的技术。早期出现的解交错技术包括场内处理方法和场间处理方法,其中,场内处理方法是指每一帧图像仅由一场内的像素生成,场内丢失的像素行由已存在的像素插值得到,其优点是在运动区域不会出现“羽化”现象,缺点是图像的垂直分辨率低,图像细节被破坏;场间处理方法是用相邻多个场共同生成一帧图像,比如最简单的就是将相邻两场直接合并,其优点是图像垂直分辨率高,在画面的静止部分可以得到完美的效果,但是在运动区域,由于两场拍摄时刻不同,物体位置也不一样,因此会出现严重的“羽化”现象。
上述两种方法的共同点是运算量小,成本低。在上述方法的基础上,继续发展出性能更好的解交错技术,包括运动自适应方法和运动补偿方法。运动自适应方法是将上述两种方法的优点结合起来,在增加少量运算量的前提下达到更好的图像质量,其基本原理是将画面分为运动区域和静止区域,在不同区域内使用不同的解交错技术。运动补偿方法虽然图像质量最佳,但运算复杂度非常高,因此仅仅被用于高端产品。就目前的硬件实现水平来说,运动自适应方法拥有最佳的性价比。
运动自适应方法中最核心的问题就是如何进行运动区域和静止区域的的划分,又称为运动检测,目前常用的运动检测方法可大致分为基于块和基于像素的运动检测。所谓基于块的运动检测是将整个画面分成若干块,如1/4画面、1/16画面、8×8象素块等,然后对每一块进行运动检测;这种方法相对来说比较简单,区域的划分比较整齐,并且不太容易出现误判,但是会因为块的大小和形状出现明显的块效应,而且对于块内同时包含运动区域和静止区域的情况无法区别处理;基于像素的运动检测方法相对复杂,区域的划分以像素为单位,对画面的处理非常细致,缺点在于由于单个像素的独立性,容易出现误判,例如将静止区域中某些像素点判断为运动点,因而造成图像质量下降甚至出现明显的坏点。

发明内容
有鉴于此,本发明的目的在于,提出一种用于数字视频处理运动解交错的运动检测方法,可以实现基于像素的运动检测,并且大大降低出现误判的可能性。该方法包括如下步骤A、接收隔行扫描数字视频数据,根据隔行扫描连续4场图像的像素差生成当前处理的一帧逐行扫描图像内各个像素的运动标志位;B、在当前处理的一帧逐行扫描图像中选取一个待处理的像素为目标像素,计算其周围一定范围内像素运动标志位的加权和;C、将所得加权和与预先设置的多个门限进行比较,根据比较结果选择对目标像素的解交错处理模式并对目标像素的运动标志位进行校正。
若当前处理第3帧逐行扫描图像,则步骤A包括A11、计算第3场与第1场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;A12、计算第4场与第2场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;A13、将步骤A1和步骤A2所得各个运动标志位合并,得到第3帧逐行扫描图像每一个像素位置的运动标志位。
若当前处理第n帧逐行扫描图像,且n≥4,则步骤A包括A21、计算第n+1场与第n-1场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;A22、将步骤A21得到的各个像素位置运动标志位替换处理第n-1帧逐行扫描图像时所得的对应像素位置的运动标志位,将替换之后的第n-1帧逐行扫描图像的各个像素位置的运动标志位作为第n帧逐行扫描图像各个像素位置的运动标志位。
若所述像素的取值位宽为8比特,则所述PDT的取值范围为4~16;若像素的取值为其他位宽,则所述PDT的取值范围进行同比例增减。
所述步骤B包括B1、在预设的多个加权系数表中选择一个加权系数表;B2、以目标像素的位置为中心,用所选的加权系数表确定需要进行加权求和的运动标志位,将所确定的运动标志位与所选加权系数表中对应的权重值分别相乘后再累加,并除以加权系数表权重之和,得到归一化的运动标志加权和Flagsum。
步骤B1所述选择加权系数表包括设置N1×N1个权重值所构成的加权系数表为默认加权系数表,判断目标像素如果选用默认加权系数表,则对应的运动标志位的范围是否会超出视频图像之外,若是,则取该目标像素垂直和水平方向上距离图像边界最近像素数目为N2,选择(2N2+1)×(2N2+1)个权重值所构成的加权系数表;否则就选择默认加权系数表。
较佳地,所述N1取为3、5、7或9。
确定所述加权系数表中各个权重值的方法是a、每个权重值取0~10范围内的整数;
b、越靠近加权系数表中心的权重值越大;c、加权系数表内奇数行的权重值之和与偶数行的权重值之和相等或近似相等。
所述运动标志加权和为归一化的Flagsum,并预先设置静止门限ST、中等门限IT以及运动门限MT,并且0≤ST≤IT≤MT≤1,则所述步骤C包括C1、将Flagsum与所述预先设置的三个门限比较,若Flagsum≤ST,则执行步骤C2;若ST<Flagsum≤IT,则执行C3;若IT<Flagsum≤MT则执行C4,若Flagsum>MT则执行C5;C2、对目标像素采用场间解交错处理方法,如果目标像素的运动标志位为1,则改为0,如果目标像素的运动标志位为0,则保持不变;C3、对目标像素采用场间解交错处理方法,目标像素的运动标志位保持不变;C4、对目标像素采用场内解交错处理方法,目标像素的运动标志位保持不变;C5、对目标像素采用场内解交错处理方法,如果目标像素的运动标志位为0,则改为1;如果目标像素的运动标志位为1,则保持不变。
较佳地,所述ST的取值范围为0~0.4,IT的取值范围为0.2~0.5,MT的取值范围为0.6~1。
步骤C之后进一步包括D、判断目标像素是否为当前处理的这一帧逐行扫描图像的最后一个像素,若是执行步骤E,否则转至步骤B;E、判断是否接收到新的隔行扫描数字视频数据,若是,将下一帧逐行扫描图像作为当前处理的逐行扫描图像,并转至步骤A,否则结束本流程。
本发明的另一目的在于,提出一种用于数字视频处理的解交错方法,可以根据准确的基于像素的运动检测的结果,选择相应的解交错模式对隔行扫描图像进行处理,大大提高解交错所生成的逐行扫描图像的品质。该方法包括如下步骤a、接收隔行扫描数字视频数据,根据隔行扫描连续4场图像的像素差生成当前处理的一帧逐行扫描图像内各个像素的运动标志位;b、在当前处理的一帧逐行扫描图像中选取一个待处理的像素为目标像素,计算其周围一定范围内像素运动标志位的加权和;c、将所得加权和与预先设置的多个门限进行比较,根据比较结果选择对目标像素的解交错处理模式并对目标像素的运动标志位进行校正;d、根据所选择的解交错模式对隔行扫描图像中的目标像素进行解交错处理。
若当前处理第3帧逐行扫描图像,则步骤a包括a11、计算第3场与第1场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;a12、计算第4场与第2场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;a13、将步骤a11和步骤a12所得各个运动标志位合并,得到第3帧逐行扫描图像每一个像素位置的运动标志位。
若当前处理第n帧逐行扫描图像,且n≥4,则步骤a包括a21、计算第n+1场与第n-1场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;a22、将步骤A21得到的各个像素位置运动标志位替换处理第n-1帧逐行扫描图像时所得的对应像素位置的运动标志位,将替换之后的第n-1帧逐行扫描图像的各个像素位置的运动标志位作为第n帧逐行扫描图像各个像素位置的运动标志位。
所述运动标志加权和为归一化的Flagsum,并预先设置静止门限ST、中等门限IT以及运动门限MT,并且0≤ST≤IT≤MT≤1,则所述步骤c包括c1、将Flagsum与所述预先设置的三个门限比较,若Flagsum≤ST,则执行步骤c2;若ST<Flagsum≤IT,则执行c3;若IT<Flagsum≤MT则执行c4,若Flagsum>MT则执行c5;c2、对目标像素采用场间解交错处理方法,如果目标像素的运动标志位为1,则改为0,如果目标像素的运动标志位为0,则保持不变;c3、对目标像素采用场间解交错处理方法,目标像素的运动标志位保持不变;c4、对目标像素采用场内解交错处理方法,目标像素的运动标志位保持不变;c5、对目标像素采用场内解交错处理方法,如果目标像素的运动标志位为0,则改为1;如果目标像素的运动标志位为1,则保持不变。
步骤d之后进一步包括e、判断目标像素是否为当前处理的这一帧逐行扫描图像的最后一个像素,若是执行步骤f,否则转至步骤b;f、输出当前处理的这一帧逐行扫描图像,判断是否接收到新的隔行扫描数字视频数据,若是,将下一帧逐行扫描图像作为当前处理的逐行扫描图像,并转至步骤a,否则结束本流程。
本发明的目的还在于,提出一种一种用于数字视频处理的解交错装置,可以根据准确的基于像素的运动检测的结果,选择相应的解交错模式对隔行扫描图像进行处理,大大提高解交错所生成的逐行扫描图像的品质。该装置包括用于缓存隔行扫描视频数据的数字视频存储器(210)以及用于对来自数字视频存储器(210)的隔行扫描视频数据进行解交错处理的解交错模块(230),该装置还进一步包括运动标志位生成模块(221),用于根据来自数字视频存储器(210)前后连续四场的隔行扫描视频数据,计算其中偶场之间每个像素的像素差以及奇场之间每个像素的像素差,将所得像素差与预先设置的PDT比较,根据比较结果生成逐行扫描的一帧视频图像每一个像素的运动标志位,将所生成的运动标志位发送至运动标志位图存储器(222);运动标志位图存储器(222),用于存储当前需要处理的一帧逐行扫描视频图像的所有像素的运动标志位所构成的运动标志位图,根据运动标志位生成模块(221)所生成的运动标志位以及像素状态判决及标志位更新模块(224)的校正信号更新所存储的运动标志位图;对逐行扫描的一帧视频图像中需要生成的每一个目标像素确定其运动检测窗的大小,并将所确定的运动检测窗内的各个运动标志位发送至加权模块(223);加权模块(223),用于将所收到的运动标志位与预先设置的权重值分别相乘后再累加求和,将所得运动标志加权和发送至像素状态判决及标志位更新模块(224);像素状态判决及标志位更新模块(224),用于将来自加权模块(223)的Flagsum与预先设置的多个门限值比较,根据比较的结果生成目标像素的处理指示位以及对目标像素的运动标志位的校正信号,将所生成的处理指示位发送至解交错模块(230),将校正信号发送至运动标志位图存储器(222);所述解交错模块(230)用于根据来自像素状态判决及标志位更新模块(224)的处理指示位,选择相应的解交错处理模块对所收到的隔行扫描数字视频数据进行处理并输出逐行扫描数字视频数据。
其中,所述运动标志位图存储器(222)进一步包括运动检测窗选择模块,用于设置一定大小的运动检测窗为默认运动检测窗,在对目标像素采用默认运动检测窗之前判断是否该默认运动检测窗超出视频图像范围,若是则根据目标像素距离图像边界的最近距离确定运动检测窗的大小,否则选择默认运动检测窗。
所述加权模块(223)预设多个不同大小的加权系数表,所述加权模块(223)将所收到的运动标志位与预先设置的权重值分别相乘后再累加求和为加权模块(223)根据所收到运动标志位的数目,从预先设置的多个加权系数表中选择一个具有相同数目的权重值的加权系数表,用所选择的加权系数表中的权重值与对应的运动标志位分别相乘后再累加求和。
从以上技术方案可以看出,首先利用连续4场的像素差值生成一个完整的像素运动标志位图,然后利用运动检测窗选定当前目标像素周围一定范围内的像素运动标志位,计算窗内标志位的加权和作为判断目标像素是否运动的依据;并采用多门限判决方法,在判定像素运动与否的同时及时更正错误的运动标志,从而将现有的基于块和基于像素的运动检测方法的优点相结合,又避免了它们各自的缺点;并且,这些经过校正后的标志位又作为后续帧处理的参考,可大大提高运动检测的速度与准确度。因此,本发明的有益效果在于,实现了运动检测中区域划分精确到以像素为单位,并且尽可能避免发生误判,快速、细致而准确地进行视频图像处理。


图1为本发明实施例计算像素运动标志位图以及选取目标像素运动检测窗的示意图;图2为本发明解交错装置结构示意图;图3为本发明方法对隔行扫描数字视频数据实现带有运动检测的解交错处理,输出逐行扫描的数字视频数据的流程图。
具体实施例方式
本发明的核心内容在于如何提高运动检测的准确度,所采用的技术手段包括首先生成一帧逐行扫描图像内各个像素的运动标志位,由这些运动标志位组成完整的像素运动标志位图;对于每一个目标像素,计算其周围一定范围内像素运动标志位的加权和;根据所得加权和以及预先设置的多门限,判断目标像素是否运动并及时更正错误的运动标志位。
为使本发明的目的、技术方案和优点更加清楚,下面结合附图与具体实施例对本发明作进一步的详细阐述。
本发明实施例所述的应用场景中,假定当前处理的场为第n场,n为偶数,即该场只在偶数序号的行上有像素。为了将隔行扫描的第n场转化为逐行扫描的第n帧,需要生成奇数序号的行上的像素。这里要说明的是通常视频信号都包括3个分量,如RGB或YCbCr,即每个像素由3个值组成,对于3个分量信号的处理方法完全相同,相互独立且并行实现。通常像素的每一个分量用一个4~16个比特的无符号数表示,通常取为8比特,即分量的取值范围为0~255。以下如未加说明,所述关于像素的计算都是针对像素某个分量信号的计算。
图1为本发明实施例计算像素运动标志位图以及选取目标像素运动检测窗的示意图。图1所示画面大小为11×8,其中偶数行像素的运动标志位是根据第n场与第n-2场相同位置的像素差值得到;具体来说,以行序号为2,列序号为3的像素为例,计算第n场的行序号为2、列序号为3的像素与第n-2场的行序号为2、列序号为3的像素之差,将所得像素差与预先设定的像素差门限(Pixel Difference Threshold,PDT)比较,如果大于PDT则将该位置的像素标志位设置为1,如果小于或等于PDT则将该位置的像素标志位设置为0,图1中假设将该位置设置为1;对于偶数行其他位置的运动标识位执行同样的操作,这样就得到偶数行各个像素运动标志位。对于奇数行的运动标志位,则是采用相同的方法,根据n+1场与n-1场对应位置的像素差得到。然后将所有位置上的像素运动标志位合并在一起,得到完整第n帧的像素运动标志位图101。
PDT为大于零的整数,其作用是将运动像素与静止像素区别开来。理想情况下,在相隔的两场同一位置的静止像素应该完全相同,其像素差应为零;但由于实际情况下存在噪声等因素的影响,其像素差并不为零,而为一个比较小的数。若像素的取值位宽为8比特,则PDT可取范围在4~16之内的一个整数,如果像素的取值位宽为其他值,则PDT的取值范围同比例增减例如像素表示数位宽增1,为9比特数,则PDT的取值范围乘2,为8~32;像素表示数位宽减1,则PDT的取值范围乘1/2,为2~8,其他则依此类推。PDT值越大,过滤噪声的效果越好,但也可能将更多的运动像素误判为静止像素。
在像素运动标志位图101中,选取一个像素为目标像素,所述目标像素的选取方式通常是按照从左至右、从上到下的顺序依次选取。图1中所选择的目标像素102的行序号为3,列序号为5。然后在目标像素周围设置运动检测窗103,运动检测窗以目标像素为中心,在平面内中心对称,通常可取为N×N(N为奇数)的正方形窗,其中N表示像素数目。窗的面积越大,则考虑的像素信息越多,受某些个别像素的影响就小,对于运动或静止区域中间位置的像素判断越准确,但受到外围不相关像素的影响变大,处于运动区域和静止区域边界的像素更容易判错。通常窗的面积以9×9像素为上限,下限则仅是目标像素本身,即1×1。图1所示的运动检测窗103为5×5的正方形。
然后将运动检测窗103内的运动标志位与预先设置的加权系数表依照公式FlagSum(x0,y0)=Σi=0N-1Σj=0N-1Flag(x0-N-12+i,y0-N-12+j)·Coef(i,j)---(1)]]>得到目标像素的加权和FlagSum(x0,y0)。其中x0和y0分别为目标像素的行序号和列序号;Flag(x,y)表示运动检测窗内的运动标志位,FLAG(x0,y0)表示由这些运动标志位组成的,与目标像素相对应的运动检测窗;Coef(i,j)(i=0,1,...,N-1,j=0,1,...,N-1)为N×N的加权系数表,加权系数表中所包括的权重值的数目与运动检测窗所包括的运动标志位数目相同,且二者形状也相同。如图1所示,本实施例运动检测窗内的运动标志位为FLAG(3,5)=1000011100111110011110001,]]>相应的加权系数表为
Coef(5,5)=0111012421144441242101110,]]>求得FlagSum(3,5)=28。加权系数表中权重值之和CSUM=40,运动标志位的加权和一定是大于等于零且小于等于CSUM。将FlagSum(3,5)除以CSUM可以得到归一化的运动标志加权和为0.7。
以上所述运动检测窗以及加权系数表的形状也可不局限于正方形,例如取为8边形,实际上所有的窗形状都可看作是加权系数表中含有0系数的正方形窗,例如上述例子中如运动检测窗和加权系数表取为8边形,则FLAG1(3,5)=*000*111001111100111*000*,]]>Coef1(5,5)=*111*124211444112421*111*,]]>其中符号*表示未取该点的值,其实等效于加权系数表中该点取为零,因此由FLA G1(3,5)和Coef1(5,5)求得FlagSum1(3,5)仍为28。
对于图像边缘的目标像素,可以相应减小运动检测窗并采用相应的加权系数表,其大小以不超出图像边界为准,对于处于图像最外沿的目标像素,窗的大小可取为1×1;对于图像中部的像素,可以适当加大窗以采用更多的标志位做参考。加权系数表中的每个权重值选取0~10之间的整数,尤其以2的幂次方即1、2、4、8为较佳选取值,并且距离中心目标像素越近,权重值越大;在满足以上原则基础上尽量保证窗内奇数行和偶数行的权重值之和相等,例如5×5的加权系数表可取为Coef2(5,5)=1111112421124211242111111]]>对图像的处理效果比Coef(5,5)更好。
根据所得到的运动标志加权和FlagSum(3,5)可以判断当前目标像素属于运动区域还是静止区域,并对该位置的运动标志位进行校正。具体做法是预先设置三个门限,即静止门限(Still Threshold,ST),中等门限(IntermediateThreshold,IT)和运动门限(Motion Threshold,MT),且满足0≤ST≤IT≤MT≤≤CSUM,如果把CSUM作为归一化系数将门限值归一化,则上式表示为0≤ST≤IT≤MT≤1。
在满足以上关系的基础上,IT的取值反映了对处理模式的偏重程度,IT越小,则越容易将目标像素判断为运动像素而采用场内处理方式,反之则更容易判断为静止像素而采用场间处理方式,归一化后IT的取值范围应在0.2~0.5之间,从推荐范围可看出应该偏重于场内处理方法;ST和MT的取值范围反映了对目标像素进行校正的临界点,ST值越大,则将像素标志由运动改为静止的概率越大,也就越偏向于场间处理方法;MT值越小,则将像素标志由静止改为运动的概率越大,也就越偏内处理方法。归一化的ST取值范围应在0~0.4之间,MT的取值范围应在0.6~1之间,当ST为0或者MT为1时,等效于两门限判决;当ST为0且MT为1时,等效于单门限判决。
根据归一化的运动标志加权和与所设置的门限值的比较结果进行如下判断如果Flagsum≤ST,则目标像素肯定在静止区域,后续将对该点采用场间处理方法;如果目标像素的运动标志位为1,则改为0;如果目标像素的运动标志位为0,则保持不变;如果ST<Flagsum≤IT,则目标像素很可能在静止区域,后续将对该点采用场间处理方法;目标像素的运动标志位保持不变;如果IT<Flagsum≤MT,则目标像素很可能在运动区域,后续将对该点采用场内处理方法;目标像素的运动标志位保持不变;
如果MT<Flagsum,则目标像素肯定在运动区域,后续将对该点采用场内处理方法;如果目标像素的运动标志位为0,则改为1;如果目标像素的运动标志位为1,则保持不变。
对于第n场的其他像素,同样通过上述过程进行处理,这样就得到了第n帧所有奇数行的像素,同时,运动标志位图中奇数行的像素运动标志也得到校正。当处理第n+1帧,需要得到那些丢失了的偶数行的像素时,首先会计算新的偶场即第n+2场与第n场间的像素差并与门限PDT比较得到偶数行像素的运动标志位,而奇数行的运动标志位将保留上次校正后的结果,因此实际后续每一帧的处理中,都只需要计算一半像素的运动标志位。得到运动标志位后,就可根据上述方法处理得到n+1帧所有偶数行的像素,以后不断循环执行这样的处理步骤就可以得到每一帧图像。如果目标像素的生成与运动标志位的校正同步进行,并且像素处理顺序是自上而下,从左向右,那么目标像素上面和左面的标志都已经被校正过,即运动检测窗内至少一半的运动标志位已被校正过,这可大大提高像素运动判决的准确度。
图2所示为本发明解交错装置的结构示意图,其中,数字视频存储器210用于缓存所接收的隔行扫描未压缩数字视频数据,并将所存储的隔行扫描未压缩数字视频数据分别发送至运动检测装置220和解交错模块230;运动检测装置220用于根据所接收的隔行扫描未压缩数字视频数据生成逐行扫描视频图像每一帧每一个像素的运动标志位;对每一个目标像素,取该像素周围一定范围内的运动标志位与预设的加权系数相乘得到运动标志加权和,将所得运动标志加权和与预设的门限相比较,根据比较的结果生成目标像素的处理指示位并校正目标像素的运动标志位,校正后的运动标志位用于后续逐行扫描视频帧的处理中,所生成的处理指示位发送至解交错模块230;所述处理指示位用于指示解交错模块230是采用场间解交错处理模式还是采用场内解交错处理模式对所述目标像素进行处理,例如,处理指示位设置为0表示采用场间解交错处理模式,为1表示采用场内解交错处理模式;解交错模块230中内置了多种解交错处理模式,至少包括一种场间解交错处理模式和一种场内解交错处理模式,用于将所收到的隔行扫描未压缩数字视频数据,根据来自运动检测装置220的处理指示位对所要生成的逐行扫描视频图像中缺失的像素采用相应的解交错处理模式,处理后生成并输出逐行扫描数字未压缩视频数据。
所述运动检测装置220包括如下组成部分运动标志位生成模块221,用于根据来自数字视频存储器210前后连续四场的隔行扫描视频数据,计算其中偶场之间每个像素的像素差以及奇场之间每个像素的像素差,将所得像素差与预先设置的绝对门限PDT比较,根据比较结果生成逐行扫描的一帧视频图像每一个像素的运动标志位,将所生成的运动标志位发送至运动标志位图存储器222;运动标志位图存储器222,用于存储当前需要处理的一帧逐行扫描视频图像的运动标志位图,根据运动标志位生成模块221所生成的运动标志位以及像素状态判决及标志位更新模块224校正后的运动标志位更新所存储的运动标志位图;对逐行扫描的一帧视频图像中需要生成的每一个目标像素确定其运动检测窗的大小,并将所确定的运动检测窗内的各个运动标志位发送至加权模块223;所述选择运动检测窗的原则是对于图像中部的目标像素可适当选择较大的运动检测窗,而对于图像边缘的目标像素,其运动检测窗的范围不能超出图像之外,可以在运动标志位图存储器222中进一步包括一个运动检测窗选择模块,用于设置默认的N1×N1运动检测窗,判断目标像素如果选用默认运动检测窗,则默认运动检测窗的范围是否会超出视频图像之外,若是,则取该目标像素垂直和水平方向上距离图像边界最近像素数目为N2,采用(2N2+1)×(2N2+1)的运动检测窗;否则就采用默认运动检测窗;加权模块223,根据所收到的运动标志位的数目,从预先设置的多个加权系数表中选择一个具有相同数目的权重值的加权系数表对所收到的运动标志位进行加权求和,将所得运动标志加权和归一化后再输入像素状态判决及标志位更新模块224;所述归一化即将运动标志加权和除以所述加权系数表中的权重系数之和;像素状态判决及标志位更新模块224,用于将加权模块223的归一化的运动标志加权和与预先设置的多个门限值比较,根据比较的结果生成目标像素的处理指示位以及对目标像素的运动标志位的校正信号,将所生成的处理指示位发送至解交错模块230,将校正信号发送至运动标志位图存储器222。
以上述三门限为例,生成校正信号包括若运动标志加权和Flagsum≤ST,则生成一个将目标像素运动标志位校正为0的校正信号,例如生成一个数值为0的信号;MT<Flagsum则生成一个将目标像素运动标志位校正为1的校正信号,例如生成一个数值为1的信号;其他情况则不生成校正信号;运动标志位图存储器222收到校正信号后,将校正信号的值作为目标像素运动标志位的值。生成处理指示位则包括若Flagsum≤IT,则处理指示位设置为1,表示采用场间解交错处理方法,若Flagsum>IT,则处理指示位设置为0,表示采用场内解交错处理方法。
以上所述由运动标志位图存储器222选择运动检测窗,再由加权模块223根据所选择的运动检测窗选择相应大小的加权系数表,等效于选择合适大小的加权系数表。
根据图2所示装置,本发明对隔行扫描数字视频数据实现带有运动检测的解交错处理,输出逐行扫描的数字视频数据的流程如图3所示,包括如下步骤步骤301接收并缓存未压缩的隔行扫描数字视频数据,一般来说,若当前处理第n帧逐行扫描数字视频数据,则需要缓存n-2、n-1、n、n+1四场的隔行扫描数字视频数据,对于之前接收的隔行扫描数字视频数据可以及时删除以节省存储空间。
步骤302根据缓存的隔行扫描图像前后共四场的像素,得到当前处理的一帧逐行扫描图像中每一个像素的运动标志位,具体过程为
若n为偶数,则求第n场与第n-2场对应位置的像素差,将所得像素差与预先设置的绝对门限(PDT)比较,根据比较结果得到偶数行像素的运动标志位;求第n+1场与第n-1场对应位置的像素差,将所得像素差与PDT比较,根据比较结果得到奇数行像素的运动标志位;若n为奇数,则求第n场与第n-2场对应位置的像素差,将所得像素差与PDT比较,根据比较结果得到奇数行像素的运动标志位;求第n+1场与第n-1场对应位置的像素差,将所得像素差与PDT比较,根据比较结果得到偶数行像素的运动标志位;将上述得到的偶数行和奇数行的运动标志位合并在一起,就得到包括第n帧每一个像素的运动标志位在内的运动标志位图。
实际上,本发明方法处理每一帧逐行扫描图像时,需要连续4场隔行扫描图像,因此当处理第1帧和第2帧逐行扫描图像时,无法应用本发明方法,而可以采用现有技术的解交错方法进行处理,即此时数字视频存储器210将所收到的隔行扫描未压缩数字视频数据直接发送至解交错模块230进行处理;只有当数字视频存储器210已经存储了起始的连续4场隔行扫描图像的数据时,才可以应用本发明方法开始处理第3帧逐行扫描图像,且只有处理第3帧逐行扫描图像时才需要分别计算奇数行和偶数行的运动标志位;对后续每一帧的处理中,只有一半像素的运动标志位需要重新计算。例如当处理第n+1帧逐行扫描图像时,只需计算第n+2场与第n场的像素差,而第n+1场与与第n-1场的像素差保留处理第n帧时已经得到的结果,以后的每一帧都可以此类推。
步骤303依照自左至右,从上到下的顺序依次选择当前处理的逐行扫描图像中所缺失的一个像素作为目标像素,并在预设的各种大小的加权系数表中选择一个加权系数表与目标像素周围相应范围内的运动标志位相乘后再累加得到目标像素的运动标志加权和Flagsum。
所述选择加权系数表为设置默认的N1×N1加权系数表,判断目标像素如果选用默认加权系数表,则对应的运动标志位的范围是否会超出视频图像之外,若是,则取该目标像素垂直和水平方向上距离图像边界最近像素数目为N2,采用(2N2+1)×(2N2+1)的加权系数表;否则就采用N1×N1加权系数表。根据实际需要,N1可以取为3、5、7或9。
选择了加权系数表后,则确定需要进行加权求和的运动标志位为目标像素及其周围像素与所选择加权系数表各个权重值所对应的运动标志位;将所确定的各个运动标志位与所选择加权系数表中对应的权重分别相乘后再累加得到运动标志加权和,然后除以权重系数表中权重之和进行归一化,就得到归一化的运动标志加权和Flagsum。
步骤304根据所得运动标志加权和,选择对目标像素适当的解交错处理方式,并对目标像素的运动标志位进行校正。具体来说,预先设置归一化的静止门限ST、中等门限IT和运动门限MT,且0≤ST≤IT≤MT≤1;如果Flagsum≤ST,则对该点采用场间解交错处理方法;如果目标像素的运动标志位为1,则改为0;如果目标像素的运动标志位为0,则保持不变;如果ST<Flagsum≤IT,则对目标像素采用场间解交错处理方法;目标像素的运动标志位保持不变;如果IT<Flagsum≤MT,则对目标像素采用场内解交错处理方法;目标像素的运动标志位保持不变;如果MT<Flagsum,对目标像素采用场内解交错处理方法;如果目标像素的运动标志位为0,则改为1;如果目标像素的运动标志位为1,则保持不变。
步骤305采用所选择的解交错处理方式对目标像素进行处理,并将处理后的目标像素作为逐行扫描图像的像素输出。
步骤306判断目标像素是否为当前处理的这一帧逐行扫描图像的最后一个像素,若是执行步骤307,否则转至步骤303;步骤307判断是否接收到新的未压缩隔行扫描数字视频数据,若是,将下一帧逐行扫描图像作为当前处理的逐行扫描图像,并转至步骤301,否则结束本流程。
上述流程中,步骤303所得运动标志加权和也可不进行归一化处理,则门限值MT、IT、ST也是未归一化的取值。
本领域人员应当了解,以上所述像素标志位、处理指示位、运动门限MT、中等门限IT、静止门限ST等的取值只是一种示例,其实际取值可不限于此,本发明并为对以上各个量的实际数值作出限定。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种用于数字视频处理的运动检测方法,其特征在于,该方法包括如下步骤A、接收隔行扫描数字视频数据,根据隔行扫描连续4场图像的像素差生成当前处理的一帧逐行扫描图像内各个像素的运动标志位;B、在当前处理的一帧逐行扫描图像中选取一个待处理的像素为目标像素,计算其周围一定范围内像素运动标志位的加权和;C、将所得加权和与预先设置的多个门限进行比较,根据比较结果选择对目标像素的解交错处理模式并对目标像素的运动标志位进行校正。
2.根据权利要求1所述的方法,其特征在于,若当前处理第3帧逐行扫描图像,则步骤A包括A11、计算第3场与第1场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;A12、计算第4场与第2场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;A13、将步骤A1和步骤A2所得各个运动标志位合并,得到第3帧逐行扫描图像每一个像素位置的运动标志位。
3.根据权利要求1所述的方法,其特征在于,若当前处理第n帧逐行扫描图像,且n≥4,则步骤A包括A21、计算第n+1场与第n-1场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;A22、将步骤A21得到的各个像素位置运动标志位替换处理第n-1帧逐行扫描图像时所得的对应像素位置的运动标志位,将替换之后的第n-1帧逐行扫描图像的各个像素位置的运动标志位作为第n帧逐行扫描图像各个像素位置的运动标志位。
4.根据权利要求2或3所述的方法,其特征在于,若所述像素的取值位宽为8比特,则所述PDT的取值范围为4~16;若像素的取值为其他位宽,则所述PDT的取值范围进行同比例增减。
5.根据权利要求1所述的方法,其特征在于,所述步骤B包括B1、在预设的多个加权系数表中选择一个加权系数表;B2、以目标像素的位置为中心,用所选的加权系数表确定需要进行加权求和的运动标志位,将所确定的运动标志位与所选加权系数表中对应的权重值分别相乘后再累加,并除以加权系数表权重之和,得到归一化的运动标志加权和Flagsum。
6.根据权利要求5所述的方法,其特征在于,步骤B1所述选择加权系数表包括设置N1×N1个权重值所构成的加权系数表为默认加权系数表,判断目标像素如果选用默认加权系数表,则对应的运动标志位的范围是否会超出视频图像之外,若是,则取该目标像素垂直和水平方向上距离图像边界最近像素数目为N2,选择(2N2+1)×(2N2+1)个权重值所构成的加权系数表;否则就选择默认加权系数表。
7.根据权利要求6所述的方法,其特征在于,所述N1取为3、5、7或9。
8.根据权利要求5、6或7所述的方法,其特征在于,确定所述加权系数表中各个权重值的方法是a、每个权重值取0~10范围内的整数;b、越靠近加权系数表中心的权重值越大;c、加权系数表内奇数行的权重值之和与偶数行的权重值之和相等或近似相等。
9.根据权利要求1所述的方法,其特征在于,所述运动标志加权和为归一化的Flagsum,并预先设置静止门限ST、中等门限IT以及运动门限MT,并且0≤ST≤IT≤MT≤1,则所述步骤C包括C1、将Flagsum与所述预先设置的三个门限比较,若Flagsum≤ST,则执行步骤C2;若ST<Flagsum≤IT,则执行C3;若IT<Flagsum≤MT则执行C4,若Flagsum>MT则执行C5;C2、对目标像素采用场间解交错处理方法,如果目标像素的运动标志位为1,则改为0,如果目标像素的运动标志位为0,则保持不变;C3、对目标像素采用场间解交错处理方法,目标像素的运动标志位保持不变;C4、对目标像素采用场内解交错处理方法,目标像素的运动标志位保持不变;C5、对目标像素采用场内解交错处理方法,如果目标像素的运动标志位为0,则改为1;如果目标像素的运动标志位为1,则保持不变。
10.根据权利要求9所述的方法,其特征在于,所述ST的取值范围为0~0.4,IT的取值范围为0.2~0.5,MT的取值范围为0.6~1。
11.根据权利要求1、2、3、5、6、7、9或10所述的方法,其特征在于,步骤C之后进一步包括D、判断目标像素是否为当前处理的这一帧逐行扫描图像的最后一个像素,若是执行步骤E,否则转至步骤B;E、判断是否接收到新的隔行扫描数字视频数据,若是,将下一帧逐行扫描图像作为当前处理的逐行扫描图像,并转至步骤A,否则结束本流程。
12.一种用于数字视频处理的解交错方法,其特征在于,该方法包括如下步骤a、接收隔行扫描数字视频数据,根据隔行扫描连续4场图像的像素差生成当前处理的一帧逐行扫描图像内各个像素的运动标志位;b、在当前处理的一帧逐行扫描图像中选取一个待处理的像素为目标像素,计算其周围一定范围内像素运动标志位的加权和;c、将所得加权和与预先设置的多个门限进行比较,根据比较结果选择对目标像素的解交错处理模式并对目标像素的运动标志位进行校正;d、根据所选择的解交错模式对隔行扫描图像中的目标像素进行解交错处理。
13.根据权利要求12所述的方法,其特征在于,若当前处理第3帧逐行扫描图像,则步骤a包括a11、计算第3场与第1场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;a12、计算第4场与第2场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;a13、将步骤a11和步骤a12所得各个运动标志位合并,得到第3帧逐行扫描图像每一个像素位置的运动标志位。
14.根据权利要求1所述的方法,其特征在于,若当前处理第n帧逐行扫描图像,且n≥4,则步骤a包括a21、计算第n+1场与第n-1场隔行扫描图像各个相同位置像素的像素差,并将所得像素差与预先设置的绝对门限PDT比较,若像素差大于PDT,则将该像素差对应的像素位置的运动标志位设置为1,否则设置为0;a22、将步骤A21得到的各个像素位置运动标志位替换处理第n-1帧逐行扫描图像时所得的对应像素位置的运动标志位,将替换之后的第n-1帧逐行扫描图像的各个像素位置的运动标志位作为第n帧逐行扫描图像各个像素位置的运动标志位。
15.根据权利要求12所述的方法,其特征在于,所述运动标志加权和为归一化的Flagsum,并预先设置静止门限ST、中等门限IT以及运动门限MT,并且0≤ST≤IT≤MT≤1,则所述步骤c包括c1、将Flagsum与所述预先设置的三个门限比较,若Flagsum≤ST,则执行步骤c2;若ST<Flagsum≤IT,则执行c3;若IT<Flagsum≤MT则执行c4,若Flagsum>MT则执行c5;c2、对目标像素采用场间解交错处理方法,如果目标像素的运动标志位为1,则改为0,如果目标像素的运动标志位为0,则保持不变;c3、对目标像素采用场间解交错处理方法,目标像素的运动标志位保持不变;c4、对目标像素采用场内解交错处理方法,目标像素的运动标志位保持不变;c5、对目标像素采用场内解交错处理方法,如果目标像素的运动标志位为0,则改为1;如果目标像素的运动标志位为1,则保持不变。
16.根据权利要求12~15任一项所述的方法,其特征在于,步骤d之后进一步包括e、判断目标像素是否为当前处理的这一帧逐行扫描图像的最后一个像素,若是执行步骤f,否则转至步骤b;f、输出当前处理的这一帧逐行扫描图像,判断是否接收到新的隔行扫描数字视频数据,若是,将下一帧逐行扫描图像作为当前处理的逐行扫描图像,并转至步骤a,否则结束本流程。
17.一种用于数字视频处理的解交错装置,包括用于缓存隔行扫描视频数据的数字视频存储器(210)以及用于对来自数字视频存储器(210)的隔行扫描视频数据进行解交错处理的解交错模块(230),其特征在于,该装置进一步包括运动标志位生成模块(221),用于根据来自数字视频存储器(210)前后连续四场的隔行扫描视频数据,计算其中偶场之间每个像素的像素差以及奇场之间每个像素的像素差,将所得像素差与预先设置的PDT比较,根据比较结果生成逐行扫描的一帧视频图像每一个像素的运动标志位,将所生成的运动标志位发送至运动标志位图存储器(222);运动标志位图存储器(222),用于存储当前需要处理的一帧逐行扫描视频图像的所有像素的运动标志位所构成的运动标志位图,根据运动标志位生成模块(221)所生成的运动标志位以及像素状态判决及标志位更新模块(224)的校正信号更新所存储的运动标志位图;对逐行扫描的一帧视频图像中需要生成的每一个目标像素确定其运动检测窗的大小,并将所确定的运动检测窗内的各个运动标志位发送至加权模块(223);加权模块(223),用于将所收到的运动标志位与预先设置的权重值分别相乘后再累加求和,将所得运动标志加权和发送至像素状态判决及标志位更新模块(224);像素状态判决及标志位更新模块(224),用于将来自加权模块(223)的Flagsum与预先设置的多个门限值比较,根据比较的结果生成目标像素的处理指示位以及对目标像素的运动标志位的校正信号,将所生成的处理指示位发送至解交错模块(230),将校正信号发送至运动标志位图存储器(222);所述解交错模块(230)用于根据来自像素状态判决及标志位更新模块(224)的处理指示位,选择相应的解交错处理模块对所收到的隔行扫描数字视频数据进行处理并输出逐行扫描数字视频数据。
18.根据权利要求17所述的装置,其特征在于,所述运动标志位图存储器(222)进一步包括运动检测窗选择模块,用于设置一定大小的运动检测窗为默认运动检测窗,在对目标像素采用默认运动检测窗之前判断是否该默认运动检测窗超出视频图像范围,若是则根据目标像素距离图像边界的最近距离确定运动检测窗的大小,否则选择默认运动检测窗。
19.根据权利要求17所述的装置,其特征在于,所述加权模块(223)预设多个不同大小的加权系数表,所述加权模块(223)将所收到的运动标志位与预先设置的权重值分别相乘后再累加求和为加权模块(223)根据所收到运动标志位的数目,从预先设置的多个加权系数表中选择一个具有相同数目的权重值的加权系数表,用所选择的加权系数表中的权重值与对应的运动标志位分别相乘后再累加求和。
全文摘要
本发明公开了一种用于数字视频处理的运动检测方法,该方法包括如下步骤A、接收隔行扫描数字视频数据,根据隔行扫描连续4场图像的像素差生成当前处理的一帧逐行扫描图像内各个像素的运动标志位;B、在当前处理的一帧逐行扫描图像中选取一个待处理的像素为目标像素,计算其周围一定范围内像素运动标志位的加权和;C、将所得加权和与预先设置的多个门限进行比较,根据比较结果选择对目标像素的解交错处理模式并对目标像素的运动标志位进行校正。本发明还公开了一种用于数字视频处理的解交错方法及其装置。通过应用本发明方案,运动检测的区域划分精确到以像素为单位,并且尽可能避免发生误判,快速、细致而准确地进行视频图像的解交错处理。
文档编号H04N7/015GK1889673SQ20061008703
公开日2007年1月3日 申请日期2006年6月12日 优先权日2006年6月12日
发明者邱嵩, 汪源 申请人:北京中星微电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1