利用分级块分裂和运动分割进行目标边界准确运动的检测的制作方法

文档序号:6469005阅读:179来源:国知局
专利名称:利用分级块分裂和运动分割进行目标边界准确运动的检测的制作方法
技术领域
本发明描述了一种新型的运动检测方法,其与现有技术的方法相比生成了更为准确和均匀的运动图(motion map),其中所拥有的运动检测错误数量更少。
图像处理的目标之一是(例如在人工视觉领域)模拟人类视觉系统的某些特征诸如复杂环境内识别物体运动并跟踪它们行为的技能。
跟踪应用中的第一个步骤是检测环境中的运动目标,对目标像素进行分类并将它们聚集在连接的区域内,这些区域由能够使它们被识别的特征进行表征,这就降低了给出现场全局感观的问题复杂性。以这种方式在环境中的所述区域和实际运动的目标之间建立了连接并且利用象平面上所述区域的行为代替现场中目标的行为。
在运动检测领域中,有三个子领域值得关注环境建模、运动分割(motionsegmentation)和目标分类。
运动分割中存在的问题是在视频或图像序列中发现独立的运动目标并因而将从中提取出来的场面或特征聚集在具有公共运动的区域内。在大多数情况下,分割取决于图像灰度值或颜色,有时由织构表示延伸。然而,在图像序列的情况下,运动信息也已经是过去数十年在分割过程中常用的。
大多数的运动分割技术因而处理光流、或仅是图像差,作为被发送到标准分割方法中预先计算的特征。
通常可以列举一些对运动检测器的重要要求。以下各项可以认为是在图像处理应用中对运动检测处理的要求 正确性最基本的说法是检测过程应当使理想环境内的假正(false positive)和假负(false negative)最小化。
鲁棒性应当能够在一定程度上抵抗噪声的影响。
均匀性这应当能够确保目标运动的正确描述。通常人类视觉系统对假的、局部错误敏感。因此,最好获得图画景象的语义目标内一致处理的均匀图。
精确性其对于精确描述目标以避免图画内的语义目标之间的影响是很重要的。
通过满足上述要求可以为了图像处理应用以适当的方式而在视频序列内来描述目标静止或移动状态。通常对于消费电子产品而言,其它的要求是运动检测算法的复杂性。

背景技术
对于运动分割,在科学文献已经给出了两种主要的方法图像差和背景扣除。前者包括时间t时的帧和时间t-1时的帧之间的阈值差;该方法在计算方面比较好并在两帧之间提供即时的目标运动检测;然而,其有两个帧速度和目标速度所导致的公知的缺点前景孔径(foreground aperture)和重影(ghosting)。
在运动分割中存在的问题是所谓的“幻影(ghost)”和“阴影”。其大约是在帧比较内识别为运动部分的显示部分。然而,上述显示部分没有对应真实目标并因而不应该在目标分类中考虑。
当将目标记录在背景参考模型并将其从背景中移除和擦掉时,会出现“幻影”。术语“阴影”表示阴影,从而使搜索目标的阴影和“幻影”的阴影能互相区分开。
在当前的去交错(de-interlacing)框架的现有技术中,运动检测算法试图在两个相继的输入场之间检测运动。由此从随后的多个场中得到的像素差并与阈值比较。如果像素差小于给定的阈值,则没有包含运动。如果另一方面各个场之间的像素差大于特定的阈值,则假定有运动。在一些文献中已经描述了像素选择和初始过程的各种不同的配置。
考虑到现有技术,主要有两类检测错误被观察,这样会在图像的赝象中导致典型的去交错应用 假正运动区域被错误地检测成静止区域,这样会导致“老鼠牙”赝象。
假负静止区域被检测成运动区域,这在高垂直细节中会导致“闪烁赝象”。


发明内容
本发明的一个目的是加强运动检测错误中的目标边界处理,而能保持目标形状。
本发明的另一个目的是提高静止或运动目标内运动信息的准确性。
本发明的在一个目的是通过消除像素错误提高运动图的均匀性。
本发明的上述目的是通过下面的精确运动图生成设备实现的,该设备可以被操作来接收和处理包括有运动图的输入数据并输出最终的运动图,所述运动图识别至少两幅连续图像之间的像素的非运动和运动,所述装置包括可以被操作来接收和处理所述输入数据并输出第一信号M1、第二信号M2和第三信号M3的处理分割装置,从而所述信号M1、M2和M3分别是特征图,其基于所述输入数据并描述至少两幅连续图像之间的特性;所述第一信号M1描述静止边缘、所述第二信号M2描述运动边缘、并且所述第三信号M3描述运动平坦区域;和可以被操作来接收和处理所述第一信号M1、所述第二信号M2和所述第三信号M3并输出所述最终的运动图的组合逻辑装置,所述最终的运动图基于所述信号M1、M2和M3。
优选地,组合逻辑装置可以被操作来基于形态关闭操作“关闭”A而将信号M2处理为信号A。
优选地,操作“关闭”A包括在形态侵蚀操作(morphological closingoperation)前面的形态扩张操作(morphological dilatation operation)。
优选地,组合逻辑装置可以被操作来基于后处理操作前面的形态关闭操作“关闭”B而将信号M3处理成信号B。
优选地,操作“关闭”B包括形态侵蚀操作前面的形态扩张操作。
优选地,处理操作包括一个二维边缘保存滤波器。
优选地,后处理操作包括一个二维中值滤波器。
优选地,所述组合逻辑装置可以被操作来将信号M1反转为信号C。
优选地,所述组合逻辑装置可以被操作来将信号A、B和C组合在一起成为最终的运动图。
优选地,所述输入数据包括边缘图、所述边缘图识别一幅图像的边缘,所述处理分割装置包括可以被操作来接收和处理运动图并输出预处理运动图的预处理装置;和可以被操作来接收和处理预处理过的运动图和边缘图并输出信号M1、M2和M3的分割装置。
优选地,所述精确运动图生成装置,进一步包括可以被操作来接收和处理图像数据并输出包括运动图的所述输入数据的图像分析装置。
优选地,所述图像分析装置包括可以被操作来接收和处理所述图像数据并输出所述运动图的运动检测装置;和可以被操作来接收和处理所述图像数据并输出所述边缘图的边缘检测装置,所述图像分析装置可以被操作来输出包括有所述运动图和所述边缘图的所述输入数据。
优选地,所述运动检测装置可以被操作来基于具有分级块分裂的精确运动检测来处理。
优选地,所述边缘检测装置可以被操作来基于3×3苏贝尔算符(Sobeloperator)进行处理。
本发明的上述目的还可以通过下面的精确运动图生成方法实现,该方法用于接收和处理包括有运动图的输入数据并输出最终的运动图,从而所述运动图识别至少两幅连续图像之间的像素的非运动和运动,该方法包括接收和处理所述输入数据并输出第一信号M1、第二信号M2和第三信号M3的处理分割步骤,从而所述信号M1、M2和M3分别是特征图,其基于所述输入数据并描述至少两幅连续图像之间的特性;所述第一信号M1描述静止边缘、所述第二信号M2描述运动边缘、并且所述第三信号M3描述运动平坦区域;和接收和处理所述第一信号M1、所述第二信号M2和所述第三信号M3并输出所述最终的运动图的组合逻辑步骤,从而所述最终的运动图基于所述信号M1、M2和M3。
优选地,所述组合逻辑步骤基于形态关闭操作“关闭”A而将信号M2处理为信号A。
优选地,所述操作“关闭”A包括在形态侵蚀操作前面的形态扩张操作。
优选地,所述组合逻辑步骤基于后处理操作前面的形态关闭操作“关闭”B而将信号M3处理成信号B。
优选地,操作“关闭”B包括形态侵蚀操作前面的形态扩张操作。
优选地,所述后处理操作包括一个二维边缘保存滤波器。
优选地,所述后处理操作包括一个二维中值滤波器。
优选地,在组合逻辑步骤期间将信号M1被反转为信号C。
优选地,在组合逻辑步骤期间将信号A、B和C组合在一起成为最终的运动图。
优选地,所述输入数据包括边缘图、所述边缘图识别一幅图像的边缘,所述处理分割步骤包括接收和处理运动图并输出预处理运动图的预处理步骤;和接收和处理预处理过的运动图和边缘图并输出信号M1、M2和M3的分割步骤。
优选地,所述精确运动图生成方法进一步包括接收和处理图像数据并输出包括有运动图的所述输入数据的图像分析步骤。
优选地,所述图像分析步骤进一步包括接收和处理所述图像数据并输出所述运动图的运动检测步骤;和接收和处理所述图像数据并输出所述边缘图的边缘检测步骤,所述图像分析步骤输出包括有所述运动图和所述边缘图的所述输入数据。
优选地,所述运动检测步骤基于具有分级块分裂的精确运动检测来处理。
优选地,所述边缘检测步骤基于3×3苏贝尔算符来处理。



本发明的上述和其他特征和优点通过下面参考附图详细的描述,将变得愈加显而易见,其中 图1示出了现有技术中准确运动检测足迹的实施例; 图2示出了包括本发明实施例的运动检测系统的方框图; 图3示出了5×5膨胀遮罩的实施例; 图4示出了3×3膨胀或侵蚀遮罩或5 Tap中间交叉的实施例; 图5示出了运动分割系统的实施例; 图6示出了AMD-HBS系统的实施例; 图7示出了分级块分裂处理的流程图; 图8示出了精确运动检测装置的实施例。

具体实施例方式 运动检测将提供连续图像序列中的某些局部区域是否是静止的信息,因而其包括没有运动、或处于运动状态的信息。运动检测系统的输出典型地是二进制运动图,其描述了某些局部区域的状态,如像素等级或块等级。所述像素或块的运动图值对于静止状态通常是0并且对于特定存在运动的像素是1。
运动向量图可以包含大于l的值,例如从0到10的所有整数值,从而不同像素和/或目标的速度可以互相区分开。运动向量图表示运动速度,并且运动图更准确的是指运动的存在。对于运动向量图,如果在运动向量图内仅允许一个值,则x和y方向的两个不同图需要区分水平和垂直运动。
应当指出,表述“场”是指图像的交错表示,其可以是奇数或偶数场。如果仅参考逐行材料如电影则使用词“帧”。
后面部分将描述具有不同复杂等级的运动检测模型的实施例,其可以至少用在两个连续的图像之间 在“基于运动检测的一个场存储器内”,使I(x,y,t)表示当前场并且I(x,y,t-1)表示具有相反扫描光栅的前一场。符号x表示各个场的列,并且符号y表示类似方式中的行。符合t表示视频场的时间。因此场差d1利用下述公式表示为 d1(x,y,t)=|I(x,y,t)-I(x,y,t-1)| (1) 基于从公式(1)得到绝对值差,根据下面的关系式确定运动结果
公式(2)的结果可以解释为作为当前场具有相同绝对值的运动图。各个运动图的像素值在没有检测到运动即为静止内容的情况下为0,并且在存在运动的情况下为1。在上述技术中,两个连续场之间的像素差信息包含空间偏移。这意味着由于交错扫描当前场象素信息对于前一场是没有用的。因而必须插补缺少的信息,其可以容易地通过线性平均得到。如果它们包含高垂直场频,“基于运动检测的一个场”会将静止图形错误地检测为运动。另一种可能性是将两幅图片都插补到普通、虚拟的光栅。
在“基于运动检测两场存储器”内,绝对值像素差d2通过具有相同光栅的两场计算得到,意味着相同奇偶运动检测。该差没有空间补偿,因为两场包括交错扫描内的相同的行 d2(x,y,t)=|I(x,y,t-1)-I(x,y,t+1)| (3) 基于公式(2)的绝对值差,根据下面的关系式确定运动结果
该绝对值差通过具有场延迟2t的两场计算得出。像素信息现在被调整并不包含空间信息,因此与以前相比不需要插补。因为运动结果仍旧是基于单独的差,根据公式(3)的“基于运动检测的两场存储器”在有噪声的情况下容易出错。
在“基于运动检测的三场存储器”内,三场存储器被合并。因此一组两场像素差d3根据下面的公式计算得出 在简单实现方式中,逻辑函数描述符F被像素差的最大值代替。因而运动结果是基于公式(5)的右侧函数的最大像素差的。逻辑函数F可以更普遍地被想到为预设的所有可能逻辑关系式的结合。
运动结果基于公式(5)的左侧并被描述如下
像素差的范围被扩展并且随之得到的运动图与前面描述的运动检测技术相比对于抑制噪声能力更强。
现在描述利用织构检测方法的“三场存储器型运动检测”。织构检测以基于方差测量的像素为基础。为了从四个不同的去交错算法中选择一个,织构检测的结果与运动图链接。
在“基于运动检测的四场存储器”内,存在用于运动检测的四场存储器技术,其能提高运动检测的准确性并减少运动检测错误的数量。运动判定基于三个运动行为图的估算。存在两种运动检测错误 错误A将运动区域误认为静止区域。这会导致所谓“老鼠牙”赝象并被定义为假正。
错误B将静止区域误认为运动区域。这种假负在存在高垂直细节时会导致所谓“闪烁赝象”。
精确运动检测(AMD)算法是基于5个连续场的像素数据的检测,调用四场存储器。通过比较图1所示的相同奇偶场的像素值得到运动信息。如果像素差超过预定阈值,则各个参考场内的像素假定为是移动的。
在AMD方法中,利用下面定义的绝对值像素差计算三个初始运动行为图 R=|Xn-1-Xn+1| (9) 其中, Tn=I(x,y-1,t),Tn+2=I(x,y-1,t+2),Tn-2=I(x,y-1,t-2), Bn=I(x,y+1,t),Bn+2=I(x,y+1,t+2),Bn-2=I(x,y+1,t-2)(10) Xn-1=I(x,y,t-1),Xn+2=I(x,y,t+1) 在图1中示出了具有三个轴x,y和t的精确运动检测覆盖区,从而横坐标是时间轴t102,纵坐标是线轴y103并且第三个轴是圆柱轴x 104。时间轴表示时间点t-2、t-1、t、t+1和t+2。线轴y表示线y-1、y和y+1。并且,图1中示出的Tn 108、Tn+2 111、Tn-2 105、Bn 109、Bn+2 112和Bn-2 106分别是图形序列I(x,y,t)内的参考像素位置或块位置。此外,图1内还示出了帧Xn-1107和帧Xn+1 110。从而例如像素位置Tn-2和Bn-2处于相同的时间点,但是它们的线y是位移的,并且例如Bn-2和Bn具有相同的线y,但它们的时间点是位移的。
基于从公式(7)、(8)和(9)得到的绝对值差P、Q和R的值,最终的运动图mmAMD根据下面的关系式在两个步骤内被计算
并且
最后运动图mmAMD的生成过程如下 如果场参考t-2和t+2内的像素差是下面的一个阈值T,由此顶部和底部线被平均,则仅计算R。因而运动信息仅从插补像素的两个直接的邻居(t-1和t+1)得到。在与现有的“两场存储器运动检测”比较中,其中P和Q都小于T,AMD算法降低了假正的概率。这主要是由于假定运动物体维数高于像素等级。第二点是延伸的检索区域,因为考虑了5个像素,所以其消除了噪声影响。
在所有其他情况下,采用(P,Q,R)的3-tap中间值来确定运动图。如果P或Q之一大于T,则中间值取决于运动行为图R。如果R小于或等于T,并且M小于T,从而假定没有运动。如果R大于T,并且M大于T从而假定存在运动。因而与公共5场运动检测相比可以很好地降低假负。
AMD系统在抗噪声以及产生假正和假负的数目方面要优于上述的基于运动检测系统的两场和三场存储器。
然而,上述AMD产生运动图提高了物体边界附近的精确性并且可以包括运动或静止物体内部的孔。在上述范围内,孔被定义为与正确的指定周围环境相比具有相反值的错误的指定区域。
在本发明中,运动检测系统可以以分级块分裂功能进行扩展,从而运动检测系统是基于AMD系统的并且其扩展是以精确运动检测-分级块分裂(AMD-HBS)系统为参考的。上述扩展背后的基本思想是粗糙—精细的细化理念,其提供了运动物体边界的精确运动图和物体内的均匀运动图。
此外,后处理也可以应用到运动检测系统。在一个实施例中,运动检测利用图6示出的AMD-HBS系统的装置625表示。一个建议的后处理能减少剩余的像素错误以及运动图中静止和运动区域的交叠区域。因此,其提供了在三个不同的特征图内运动图的分割,其描述了至少两个连续图像之间的运动边缘、运动平坦区域和静止边缘。上述分割通过例如具有二进制边缘图的运动图的逻辑运算或单独基于运动图来实现。通过降低物体边缘或分界线处的假正和假负上述分割的结果被用于改进运动检测结果。
详细讲,特征图“运动边缘”描述了至少两个图像的一个序列的所有运动边缘。特征图“运动平坦区域”描述了上述序列内的所有运动区域。上述区域是具有运动物体的正常的区域,其具有恒定的颜色和/或亮度恒定;最后上述可比较的较大区域的运动与运动边缘的运动向量的数量相比可以描述为一个运动向量或更少。特征图“静止边缘”描述至少两个图像内的一个序列的所有非运动边缘。
下面描述三个有用的不同的运动分割 ●背景扣除 将观测帧的像素分别与计算的背景场景的像素进行比较。将上述差图并与一个阈值进行比较。在一个场景中得到没有背景运动的好的结果。
●基于下述方法的运动检测 使连续的图像互相比较。与背景扣除相似的是将上述差图并将其与一个阈值进行比较。得到具有很多运动好的结果,从而在物体内的慢速改变区域内生成孔。此外,不需要参考模型并因而减少了计算过程。
●基于下述方法的运动估计 计算两个连续图像之间的运动向量。具有相似方向和值的相比被汇总到一个称之为束的集合里。一个大的优点是在相机运动期间可以认可运动物体。另一方面,由于高计算过程因而实时计算比较困难。
在完成两个连续帧的比较和计算之后,可以分别采用阈值来将二进制值分配到像素。在另一个实施例中,不同的阈值或值范围可以应用为分布分配不必要的二进制值但很少基于所述不同值的数量。另一个实施例是阈值是尺寸阈值,其忽略了小的显示部分,因为上述部分在大部分时间是没有用的;因而在仅有大部分移动物体必须被追踪、检测或处理的情况下,可以从运动检测结果中忽略较小的运动物体。
图2图解了一个运动检测系统的概略图 在图2的实施例中,示出了可接收和处理图像输入数据201并输出最终的运动图数据205的运动检测系统211。运动检测系统211包括运动检测装置206、精细装置(refinement device)208和边缘检测装置207。精细装置208包括预处理装置209和运动分割装置210。
运动检测装置206可以被操作来接收和处理图像输入数据201到运动图数据201并输出所述运动图数据202。在运动检测装置206检测过程中,图像输入数据201识别和描述至少两个连续图像之间的运动或动作并利用一般的运动图201表示运动的像素或块。
边缘检测装置207可以被操作来接收和处理所述图像输入数据201到边缘图数据203并输出所述边缘图数据203。在边缘检测装置207检测过程中,图像输入数据201识别或描述边缘并利用生成的边缘图指明边缘像素。
精细装置208可以被操作来接收和处理包括运动图数据202和边缘图数据203的输入数据并输出所述最终的运动图数据205。
预处理装置209可以被操作来接收和处理运动图数据202并输出预处理运动图数据204。
运动分割装置210可以被操作来接收和处理预处理运动图数据204和边缘图数据203并输出所述最终的运动图数据205。
当然,本发明并不局限于图2所示的结构,但其可以包括附加的模块和装置等,如放大器、过滤器等来修改和处理数据。
随后将给出精细系统的详细描述。首先,将解释分级块分裂(HBS)方法。
上述方法结合精确运动检测-分级块分裂(AMD-HBS)系统以提高得到的运动图mmAMD来克服错误的检测。通过上述方法,可以关闭运动物体内的孔并且可以减少静止区域的假正。此外,可以提高物体边界附近运动图的正确性。下面将详细描述分级块分裂。
基于运动检测的块被应用到交错输入场,与图1所示的基于像素的过程相似。使交错输入为具有图像分辨率为X×Y的场I(x,y,t)。
在初始步骤中,输入场I被分成尺寸为BStart×BStart的N0=(X/BStart)×(Y/BStart)块B。N0代表输入场被分成的块的数量。块差以初始块尺寸开始被计算,为了标记块交替分裂块尺寸直到达到目标块尺寸。块差通过与上述场差比较来计算,但仅考虑两幅图像输入I(x,y,t)和I(x,y,t-1)的各个块来同时代替两幅完整的图像输入。模拟结果已示出为提供有优选结果的具有BStart=2和BTarget=1的值。块值的数学值通过下面的公式给出 R=|XnHBS-1-XnHBS+1| (15) 并且BnHBS、TnHBS-2、BnHBS-2、、BnHBS+2 XnHBS、XnHBS 也是同样(16) 在上述初始步骤完成以后,实行分裂处理。分裂处理将实际块分成四个或更多在垂直和水平方向具有一半维数的子块。一个块被分裂,如果其与周围8个邻居内的任何一个邻居块具有不同值。在分裂过程中,不但实际块被分裂,具有不同值的相邻块也被分裂。
当然,子块可以具有相同的尺寸或者甚至是相同的维数。另一方面,子块可以具有完全不同的尺寸和维数。上述块可以仅与例如其相邻块进行比较,其具有相同的尺寸或维数或经历了相同数量的分裂。上述块还可以对称或非对称地分成少于、等于或大于4块。
此外,有待分裂的块还可以与例如四个位于被分裂块的侧边的相邻块进行比较。或与位于被分裂的块的水平或垂直行的2个相邻块进行比较。
在一帧与随后帧的被分裂的块与相邻块进行比较期间,其被检测在所述帧之间移动的块是否处于静止状态。块的状态可以是“运动”或“不运动”。
在示出的特定块与其相邻块不同的情况下,如特定块处于运动状态而相邻块处于非运动状态和/或反之亦然,所述特定块和所述相连块都将被分裂并且将分裂得到的块与其各个相邻块进行比较并且必要的分裂也是如此。首先,比较在检测到相邻块与所述特定块不同的情况下执行比较。然后,所有与所述特定块不同的相邻块都与所述特定块一样再次被分裂。该方法提高了运动图的精确性并且能更好地识别和检测运动和非运动的边界。
AMD-HBS可以通过例如图6、2和8分别示出的装置625、206和801来执行。
对于上述粗糙-精细的方法,精确检测物体边界的运动并同时关闭物体内的孔是可能的。在一个粗糙等级内,语义物体的内部被分配一致的运动信息。在精细等级内,如果需要,物体边界附近的语义物体的运动信息可以被精细。
图7示出了包括步骤701到711的HBS程序的流程图。
步骤701是流程图的初始步骤并且其表示HBS程序的开始。步骤701之后是步骤702。
在步骤702内,两个连续场I分别被分成N块,具有尺寸为2的初始块。步骤702之后是步骤703。
在步骤703内,将两个连续场的各个块都用于计算块差。步骤703之后是步骤704。
在步骤704内,该过程精选具有各个块差的第一块。步骤704之后是步骤705。
在步骤705内,将块差与其8个相邻的块分别进行比较,并且确定块差值与相邻块差值是否不同。如果该值不同,意味着问题的答案是“是”,则继续到步骤706。如果该值相同,意味着问题的答案是“否”,则继续到步骤707。
在步骤706内,将被分析的块和比较的相邻块分裂,除非已经达到了尺寸为1的分裂目标。
在步骤707内,该过程检查所有块是否都已经比较过一次。在其他实施例中其检查所有块是否已经比较过第二、第三次等等。如果是“否”,则继续到步骤710。如果是“是”,则继续到步骤708。
在步骤708内,该过程检查尺寸为1的块目标是否达到了任何块。如果是“否”,则继续到步骤709。如果是“是”,则继续到步骤711。
在步骤709内,该过程检查任何块是否具有块不同值,其不同于相邻块并直到它被分裂。如果有块留下,意味着“是”,则继续到步骤710。如果是“否”,则继续到步骤711。
在步骤710内,将下一块进行到比较步骤705。
在步骤711内,HBS程序过程结束。
在上述过程的另一个实施例中,每个块都有被分裂直到达到目标大小或者相邻块的块差值相似或相等。然后该过程会进入到下一块。
在图7中存在很多可以结束分级块分裂程序的出口条件 ●所有块都已经比较完,该块在程序结束时仍具有不同值,目标块尺寸达到具有不同值的块; 上述可以考虑为存在很多可能的情况 ●所有块都已经比较完,在程序结束时没有具有不同值的块,达到目标块尺寸; 上述情况时可能的但很少出现,因为图像将示出一个相对光滑的块值的梯度 ●所有块已经比较完,在程序结束时上述块不具有不同值,没有达到目标块尺寸; 在例如图像没有明显物体或边界线时会出现上述情况 在本发明的其他实施例中,负责的出口条件的询问可以总结如下 最后HBS程序将继续,直到所有块已经至少比较过一次并且所有具有被分裂的具有不同块差的块直到达到目标尺寸或相邻块之间没有不同的块差。
对于具有相同值块差的块和相邻块,应当考虑上述值不是必须相等而是允许存在特定的公差和阈值,所述阈值可以通过用户或程序本身和/或手动调整。反之亦然,具有不同值的块差的块和其相邻块意味着上述值可以超过特定公差和阈值,当与其他进行比较时。
在关闭物体内部孔方面模拟已经示出了稳定的结果,然而一个大的块尺寸如32×32或16×16已经使块交叠或伸出到实际的物体。标记等级分裂步骤结束的块尺寸应该设置为维数维1×1的像素等级。当选择较大的目标块尺寸时,容易在很多情况下错配物体形状。在一个实施例中,算法采用初始块尺寸维2×2并且目标块尺寸维1×1。
对于实际场内的运动得到的运动图mmAMD-HBS是1并且对于没有运动的为0。

并且
在AMD-HBS系统的实施例中,在于AMD-HBS系统的运动信息结合中使用边缘检测如图2的装置207表示的以得到一组特征图如运动分割的运动边缘、运动平面和/或静止边缘。
通常,边缘检测不限于特定的边缘检测方法。可以使用任何边缘检测算法,从而边缘检测应该传送精确边缘信息并能很好地一致噪声。
在AMD-HBS系统的实施例中,边缘检测块包括一个3×3苏贝尔算符。如果在当前像素位置存在边缘则得到的边缘图是1,并且在其他情况下是0。在很多感光边缘检测器内,将边缘检测的初始参数设置为较小的值,因为这对于检测很多边缘信息是很重要的,原因在于该分割能直接从某个区域的边缘行为得到。苏贝尔算符的缺点在于边缘图和初始物体行政存在至少1个像素交叠,但其在自动连接高细节区域的特征图内相对较厚的边缘线的特性是其优点。
苏贝尔算符是图像处理过程(尤其是边缘检测算法)中采用的算符。在技术上,苏贝尔算符是一种离散微分算符,计算图像强度函数的梯度近似。在图像的每一点上,苏贝尔算符的结果是相应的梯度向量或者是该向量的标准。
简而言之,算符计算每个点处图像强度的梯度,给出从亮到暗的最大可能增加值的方向和在该方向上速度的变化。其结果示出了在该点上图像变化如何“陡”或“平滑”,并因此表示边缘的图像部分如何相似,因而边缘的可能性与方向计算相比比较可靠并易于解释。
算术上,两个可变函数的梯度(在这种情况下是图像强度函数)在每个图像点处是具有水平和垂直方向分量的2D向量。在每个图像点处,在最大可能强度方向内的梯度向量点逐渐增加,并且梯度向量的长度对应于在此方向上的变化速度。这意味着在该图像点上苏贝尔算符的结果,其存在于固定图像强度区域内,是零向量并且在边缘点处是从暗到亮越过边缘的向量。
因为数字图像的强度函数仅在离散点处是可知的,该函数的导数不能被定义除非假定其是潜在的连续强度函数,其已经在图像点处被取样。对于一些另外的假设,连续强度函数的导数可以被计算为取样强度函数,也就是数字图像。可以得出任何特殊点处的隐身都是实际上所有图像点处强度值的函数。然而,上述导数函数的近似值都可以被定义为具有更好或更差的精确度。
苏贝尔算符代表了图像梯度相当不准确的近似,但其在很多应用中的实际使用过程中已经足够。更确切的是,其仅使用每个图像点附近的3×3区域内的强度值来估算相应的图像梯度,并且其仅使用整数值系数,其对图像强度加权以生成梯度估计。
精细系统208或808包括预处理模块209或804和运动分割模块210。精细系统可以被操作来接收和处理运动图和边缘图并输出最终的运动图。运动图202或811可以通过运动检测模块提供并且边缘图203或812可以通过边缘检测模块提供。精细系统的功能在图2、5、6或8中提供。将在下面的段落中对其进行详细描述。
预处理的主要任务是减少运动图内剩余的假正或假负并进一步提高运动图的一致性。因此,可以使用任何能减少脉冲噪声的边缘保存空间滤波。
在一个实施例中,可以选择一种二维中值滤波。该中值滤波是具有可以消除脉冲噪声并保存边缘特性的等级序列滤波。这意味着中值滤波可以保持物体形状并可以消除假正和假负。
在图像处理中,经常有必要在执行高级处理步骤如边缘检测之前在图像内执行高度的噪声减少处理。中值滤波是一种非线性数字滤波技术,用于从图像或其他信号中去除噪声。其思想是检查输入样本并确定其是否是代表性信号。其利用具有奇数数目的样本的窗口来实现。将窗口内的值被数字顺序分类;中值,也就是窗口中心的样本作为输出被选择。将最老的样本丢弃,并生成新的样本,并重复该计算过程。
中值滤波在图像处理中用于减少斑点噪声和局部珠光体化噪声尤其有用。其边缘保存特性使其在出现了不希望的边缘模糊的情况下尤其有用。
还有其他的非线性滤波,其可以代替前述的中值滤波,如最小值或最大值滤波。
在AMD-HBS系统的实施例中,使用一个二维5-tap中值滤波器从运动图中移除具有1或2像素延伸物的像素结构并使物体平滑且保存物体形状和边缘。当前的实施例采用图4中示出的3个具有中值遮罩(mask)402重复盘旋或图2中的预处理滤波器209、图6内的626或图8内的804。
图5内图解了运动分割系统的功能图。
如上所述,得到的运动图mmAMD-HBS是更精确更均匀的,但仍然存在着精细精致细节如不透明覆盖物被错误地当作运动被检测的可能性。这样就会特定区域内导致“闪烁赝象”。
如果精细静止细节近似内的运动图被延伸到运动物体如背景,则就会出现第二个问题。这种现象在任何细节物体附近会导致出现所谓的“晕轮效应(haloeffect)”,在更糟糕的情况下会包含很多“老鼠牙”赝象。如果在静止背景前面存在精细细节移动,也当然会看到相同的赝象。
中间结果示出了具有所述5-tap中值的反复滤波在噪声减少和其形状内部物体平滑度方面能提供好的结果。作为选择,还存在很多类型的能检测到的形态关闭和打开操作,其对于侵蚀和扩张采用不同的结构单元。
在图像处理中,通过其他组B设定的二维组(图像)A的关闭是上述组扩张的侵蚀, C(A,B)=(A+B)-B 此处,加号代表扩张操作且减号代表侵蚀操作,一个具有 关闭,与打开一起,可以用于形态噪声移除。打开操作移除小物体,而关闭操作移除小孔。
在上述情况下,当上述形态操作都对后加工处理过滤运动图不够敏感时,因为其不能移除像素等级上的所有错误并关闭物体内部的孔且同事保存物体形状,将设计和采用更尖端的后加工处理,其与预分割特征图上的形态操作合在一起。
在下面,将出现上述问题的解决方案,其与图像分割应用合在一起,从而使至少两幅图像的一幅图像或运动图被分割为包含静止边缘、运动边缘和/或运动平坦区域的特征图。
运动分割后加工处理如精细系统208或运动检测系统如211的特定分割装置210以提高运动或静止物体的运动图的稳定性和精确性为目标。此外,其也可以提高运动图的均匀性。
在一般方法中,输入运动图如202被分割成三个不同的特征图。上述特征图分别表示输入运动图的运动边缘、运动平坦区域和静止边缘部分。上述分割可以利用能将运动图分割成各个特征图的任何分割技术实现。在其他实施例中,上述分割可以通过具有前面所述的边缘检测系统提供的边缘图的运动图的一组逻辑运算来实现。这意味着数据813没有必要包括本发明所有实施例的所述边缘图数据。仅有运动图数据811必须是所述数据813的一部分。
在一个实施例中,图5内的信号路径“运动边缘”501根据称为“关闭”A如在装置519内的形态关闭操作被处理。关闭操作包括有后面跟随有形态侵蚀的形态扩张。在上述关闭操作背后的主要思想是利用扩张擦作充满运动边缘内部的孔并利用侵蚀操作保持外部边缘形状。后加工处理的主要好处是能充满小孔且能保存边缘形状。
在一个实施例中,信号路径“运动平坦区域”502利用被标注为“关闭”B的关闭操作来处理,“关闭”B如在装置521内进行,其后跟随有如在装置521中进行的后加工处理操作。关闭操作应当充满运动物体内的孔并保持物体的外部形状。在一般实施例中,后加工处理块包括有一个二维边缘保存过滤器,其能减少脉冲噪声。在更详细的实施例中,后加工处理块是一个前面所述的二维中值滤波器。
在一个实施例中,信号路径A和B利用如装置518内的逻辑OR连接组合在一起。逻辑OR连接的结果与装置514内的信号路径C组合在一起,其表示反转的特征图“静止区域”503。因而静止边缘被从运动图中剪切出来。运动分割的结果就是最终的运动图。
图5示出了运动分割装置210,其与图2示出的一个装置对应。运动分割装置210包括四个AND逻辑装置511到514、三个INV逻辑装置515到517、一个OR逻装置518、一个“关闭”A装置519、一个“关闭”B装置520和一个后加工处理装置521。
AND逻辑装置511可以被操作来接收和处理预处理运动图数据204和边缘图数据203并输出运动边缘数据501。
AND逻辑装置512可以被操作来接收和处理预处理运动图数据204和反转的边缘图数据509并输出运动平面数据502。
AND逻辑装置513可以被操作来接收和处理边缘图数据203和反转的运动图数据510并输出静止边缘数据503。
AND逻辑装置514可以被操作来接收和处理信号AB’507和信号C508并输出最终的运动图数据205。
所有AND逻辑装置511到514都可以被操作来根据逻辑或布尔操作AND分别与各个输入数据组合在一起。
INV逻辑装置515可以被操作来接收和处理边缘图数据203并输出反转的边缘图数据509。
INV逻辑装置516可以被操作来接收和处理预处理运动图数据204并输出反转的运动图数据510。
INV逻辑装置517可以被操作来接收和处理静止边缘图数据503并输出信号C508。
所有INV逻辑装置515到517都可以被操作来根据逻辑或布尔操作否定或也称之为反转将各个输入数据反转。
OR逻辑装置518可以被操作来根据逻辑操作OR接收、处理和组合信号A504和信号B’506并输出信号AB’507。
“关闭”A装置519可以被操作来接收和处理运动边缘数据501并输出信号A 504。
“关闭”B装置520可以被操作来接收和处理运动平面数据502并输出信号B 505。
关闭操作通过前面所述的扩张和随后的侵蚀操作来实现。
后加工处理装置521可以被操作来接收和处理信号B 505并输出信号B’,其优选利用图6内装置632示出的5 Tap中值滤波器来执行。
应当强调的是,所有输出数据,即图2、5、6和8内示出的各个装置输出的,都是基于各个输入数据的,其已经被所述装置接收。
在图6示出的AMD-HBS系统的实施例中,运动检测精细系统将运动图mmAMD-HBS分割成具有下述特性的三个不同的特征图。
信号路径运动边缘描述运动细节如文本、结构的特征图。运动细节特征图是通过在5tap中值滤波重复3次以后具有二进制运动图mmAMD-HBS的二进制边缘图的逻辑运算生成的。上述图像特征图利用图4的模型实现3×3扩张。上述扩张导致充满精细结构的小间隙内部并且在静止区域内运动细节的交叠。下述的3×3侵蚀操作移除交叠区域的某些部分并将运动细节的外部形状减小到其原始尺寸。上述两个处理过程的结果是得到特征图,其中运动细节内部的孔和小间隙被关闭并且原始物体形状被保存。
信号路径运动平面描述了平面运动区域的处理步骤如大的均匀性物体或背景。“运动平面”图像特征图通过在5tap中值滤波重复3次以后具有二进制运动图mmAMD-HBS的反转二进制边缘图的逻辑运算生成的。与路径运动边缘相似的是,在侵蚀步骤后执行扩张步骤。其主要不同在为了扩张所需的更大的模型尺寸(见图6)。可以使用扩张处理内的大的模型,因为其下面的区域是平面的并且应该整体被标记为运动区域。均匀的静止背景前面的运动平面物体可以被扩张。生成晕轮的可能性比静止背景生成的赝象更不容易被看到,其延伸到运动物体。因而物体内部的孔通过5×5扩张被关闭并且前面的物体形状通过5tap中值低通滤波后面的3×3侵蚀来估算。当然,可以改变扩张遮罩的尺寸和维数。
从信号路径静止边缘得到的特征图包括静止细节。图像特征图静止细节是通过在5tap中值滤波重复3次以后具有反转的二进制运动图mmAMD-HBS的二进制边缘图的逻辑运算生成的。重要的是在整个运动检测过程中保持细节静止区域如文本覆盖图。因此,静止细节路径的反转结果通过与运动细节和运动平面的OR关系再AND关系连接在一起。因而,精细静止细节被从运动细节路径和运动平面路径得到的扩张的运动图中剪切出来。最终的运动图是一个AMD-HBS系统的输出。
图6示出了AMD-HBS系统633的实施例,其与图5相比更详细和延伸的块图。系统633包括四个AND逻辑装置617到620、三个INV逻辑装置621到623、一个OR逻辑装置624、一个精确运动检测分级块分裂装置625、一个三次反复5—tap中值滤波器626、一个边缘检测装置627、一个3×3扩张操作装置628、一个3×3侵蚀操作装置629、一个5×5扩张操作装置630、一个3×3侵蚀操作装置631和一个5-tap中值滤波器632。
装置628和629是图5描述的“关闭”A装置519的一部分,从而所述装置628和629的组合根据装置519操作。
装置630和631是图5描述的“关闭”B装置520的一部分,从而所示装置630和631的组合根据装置520操作。
滤波器632对应于图5描述的后处理装置521。
所有图5描述的AND逻辑装置511到514、INV逻辑装置515到517和OR逻辑装置518分别对应于AND逻辑装置617到620、INV逻辑装置621到623和OR逻辑装置624。
图2描述的装置206、207和209分别对应于装置625、627和626。
图8示出了精确运动检测装置809,其可以对应于运动检测系统211并可以被操作来接收和处理包括有一组至少两幅图像的图像输入数据并输出最终的运动图数据818。所述装置809包括图像分析装置803及精细装置808。
在本发明中,信号M1、M2和M3分别对应于信号815、816和817。
图像分析装置包括运动检测装置801和边缘检测装置802、所述装置803可以被操作来接收和处理图像输入数据810并输出包括有边缘图数据812和运动图数据811的数据813。运动检测装置801和边缘检测装置802分别对应于图2示出的装置206和207。
精细装置808包括预处理分割装置806和组合逻辑装置807。
预处理分割装置806可以被操作来接收和处理所述数据813并输出静止边缘数据815、运动边缘数据816和运动平坦区域数据817。装置806包括预处理装置804和分割装置805。预处理装置804可以被操作来接收和处理运动图数据811并输出预处理过的运动图数据814并可以对应于图2描述的预处理装置209。
分割装置805可以被操作来接收和处理预处理过的运动图数据814和边缘图数据812并输出静止边缘数据815、运动边缘数据816和运动平坦区域数据817组合逻辑装置807可以被操作来接收和处理静止边缘数据815、运动边缘数据816和运动平坦区域数据817并输出最终的运动图数据818。
最后,图5描述的装置514、517、518、519、520和521可以是组合逻辑装置807的一部分。同样图6描述的装置620、623、624、628、629、630、631和632也可以是组合逻辑装置807的一部分。图5描述的装置511、512、513、515和516可以是分割装置805的一部分。图6描述的装置617、618、619、621和622可以是分割装置805的一部分。
现在描述本发明和现有技术之间的主要不同优点。
前述方法的一个实施例提供了物体内部的均匀运动图,并且还保持了物体边界的高精确运动图。这一点可以通过将AMD算法和均匀块分裂功能得到,其组合了运动图的粗糙-精细细节。分别原则是基于相邻块之间的不同。
原理是仅在具有不同状态的物体边界附近再分配运动图的像素,其描述运动或静止状态。计算的复杂性不依赖图像特征,而是依赖运动物体的数量和特性。
本发明方法的一个实施例是提供运动图,与现有技术的实施方式相比其生成更少的假正或假负。这一点是通过将精细系统内的预处理适用到运动图得到的(图2)。
本发明方法的一个实施例提供具有小数目假正和假负的运动图尤其是在物体边界附近。这一点可以通过将运动分割精细应用到运动图得到的。
本发明方法的一个实施例在其空间精确性方面可以调整的,这是由于运动检测过程的等级组合,而且在其精细精确性方面(如像素或子像素上的分裂)也是可以的。该分级块分裂方法以及运动分割后处理不仅仅限于前面所述的运动检测过程而且适用于软件操作。
本发明方法一个实施例的优点可以进一步在视频处理步骤中看出,如非隔行和运动估计。插补赝象通过更高的均匀性、空间精确性和减少假正和假负的数量。
上面所述的仅是本发明的优选实施例,而其保护范围不受说明书的限制。本领域普通技术人员容易想到的本发明公开的技术范围内的任何变化和替代均属于在本发明的保护范围。因此,本发明的保护范围应当由权利要求进行限定。
附图标记 101精确运动检测足迹 102时间轴 103y-轴 104x-轴 105像素/块位置Tn-2 106像素/块位置Bn-2 107帧Xn-1 108像素/块Tn 109像素/块位置Bn 110帧Xn+1 111像素/块位置Tn+2 112像素/块位置Bn+2 201图像输入数据 202运动图数据 203边缘图数据 204预处理运动图数据 205最终的运动图数据 206运动检测装置 207边缘检测装置 208精细装置 209预处理装置 210运动分割装置 211运动检测系统 3015×5扩张遮罩 4013×3扩张/侵蚀遮罩 4025-Tap中值交叉 501运动边缘 502运动平面 503静止边缘 504信号A 505信号B 506信号B’ 507信号AB’ 508信号C 509反转的边缘图 510反转的运动图 511-514 AND逻辑 515—517 INV逻辑 518OR逻辑 519“关闭”A 520“关闭”B 521后处理 601运动图 602边缘图 603预处理运动图 604反转的边缘图 605反转的运动图 606运动细节 607运动平面 608静止细节 609信号A1 610信号A2 611信号B1 612信号B2 613信号B2’ 614信号D 615信号C 616最终的运动图 617-620 AND逻辑 621-623 INV逻辑 624OR逻辑 625精确运动检测-分级块分裂(AMD-HBS) 6263重复,5-tap中值 627边缘检测 6283×3扩张 6293×3侵蚀 6305×5扩张 6313×3侵蚀 6325-tap中值 633AMD-HBS系统 701分级块分裂程序开始 702划分块—步骤 703块差计算—步骤 704 以初始块开始—步骤 705 比较—询问 706 分裂—步骤 707 所有块比较—询问 708 目标块大小—询问 709 块差—询问 710 进入到下一块—步骤 711 分级块分裂程序结束 801 运动检测装置 802 边缘检测装置 803 图像分析装置 804 预处理装置 805 分割装置 806 处理分割装置 807 组合逻辑装置 808 精细装置 809 精确运动检测装置 810 图像输入数据 811 运动图数据 812 边缘图数据 813 包括有边缘图数据和运动图数据的数据 814 预处理运动图数据 815 静止边缘数据M1 816 运动边缘数据M2 817 运动平坦区域数据M3 818 最终的运动图数据
权利要求
1、一种精确运动图生成装置,该精确运动图生成装置可以被操作来接收和处理包括有运动图的输入数据并输出最终的运动图,
从而所述运动图识别至少两幅连续图像之间像素的非运动和运动,
该装置包括
处理分割装置(806),该处理分割装置(806)可以被操作来接收和处理所述输入数据并输出第一信号M1、第二信号M2和第三信号M3,从而所述信号M1、M2和M3分别是特征图,其基于所述输入数据并描述至少两幅连续图像之间的特性;
所述第一信号M1描述静止边缘、
所述第二信号M2描述运动边缘、并且
所述第三信号M3描述运动平坦区域;和
组合逻辑装置(807),该组合逻辑装置(807)可以被操作来接收和处理所述第一信号M1、所述第二信号M2和所述第三信号M3并输出所述最终的运动图,
从而所述最终的运动图是基于所述信号M1、M2和M3的。
2、根据权利要求1所述的精确运动图生成装置,所述组合逻辑装置(807)可以被操作来基于形态关闭操作“关闭”A而将信号M2处理为信号A。
3、根据权利要求2所述的精确运动图生成装置,所述操作“关闭”A包括在形态侵蚀操作前面的形态扩张操作。
4、根据前面任一权利要求所述的精确运动图生成装置,所述组合逻辑装置(807)可以被操作来基于后处理操作前面的形态关闭操作“关闭”B而将信号M3处理成信号B。
5、根据权利要求4所述的精确运动图生成装置,从而操作“关闭”B包括形态侵蚀操作前面的形态扩张操作。
6、根据权利要求4或5所述的精确运动图生成装置,从而所述后处理操作包括二维边缘保存滤波器。
7、根据权利要求6所述的精确运动图生成装置,从而所述后处理操作包括二维中值滤波器。
8、根据前面任一权利要求所述的精确运动图生成装置,从而所述组合逻辑装置(807)可以被操作来将信号M1反转为信号C。
9、根据权利要求2、4和8所述的精确运动图生成装置,从而所述组合逻辑装置(807)可以被操作来将信号A、B和C组合在一起称为最终的运动图。
10、根据前面任一权利要求所述的精确运动图生成装置,其中所述输入数据包括边缘图、所述边缘图识别图像的边缘,
所述处理分割装置(806)包括
预处理装置(804),该预处理装置(804)可以被操作来接收和处理运动图并输出预处理运动图;和
分割装置(805),该分割装置(805)可以被操作来接收和处理预处理过的运动图和边缘图并输出信号M1、M2和M3。
11、根据权利要求1到9任一权利要求所述的精确运动图生成装置,进一步包括
图像分析装置(803),该图像分析装置(803)可以被操作来接收和处理图像数据并输出包括有运动图的所述输入数据。
12、根据权利要求10和11所述的精确运动图生成装置,所述图像分析装置(803)包括
运动检测装置(801),该运动检测装置(801)可以被操作来接收和处理所述图像数据并输出所述运动图;和
边缘检测装置(802),该边缘检测装置(802)可以被操作来接收和处理所述图像数据并输出所述边缘图,
所述图像分析装置(803)可以被操作来输出包括所述运动图和所述边缘图的所述输入数据。
13、根据权利要求12所述的精确运动图生成装置,所述运动检测装置(801)可以被操作来基于具有等级块分裂的精确运动检测来处理。
14、根据权利要求12或13所述的精确运动图生成装置,所述边缘检测装置(802)可以被操作来基于3×3苏贝尔算符进行处理。
15、一种精确运动图生成方法,该精确运动图生成方法用于接收和处理包括有运动图的输入数据并输出最终的运动图的,所述运动图识别至少两幅连续图像之间的像素的非运动和运动,该方法包括
接收和处理所述输入数据并输出第一信号M1、第二信号M2和第三信号M3的处理分割步骤,从而所述信号M1、M2和M3分别是特征图,其基于所述输入数据并描述至少两幅连续图像之间的特性;
所述第一信号M1描述静止边缘、
所述第二信号M2描述运动边缘、并且
所述第三信号M3描述运动平坦区域;和
组合逻辑步骤,该组合逻辑步骤用于接收和处理所述第一信号M1、所述第二信号M2和所述第三信号M3并输出所述最终的运动图,
从而所述最终的运动图基于所述信号M1、M2和M3。
16、根据权利要求15所述的精确运动图生成方法,在所述组合逻辑步骤期间,基于形态关闭操作“关闭”A而将信号M2处理为信号A。
17、根据权利要求16所述的精确运动图生成方法,所述操作“关闭”A包括在形态侵蚀操作前面的形态扩张操作。
18、根据权利要求1到17任一权利要求所述的精确运动图生成方法,在所述组合逻辑步骤期间,基于后处理操作前面的形态关闭操作的“关闭”B而将信号M3处理成信号B。
19、根据权利要求18所述的精确运动图生成方法,该操作“关闭”B包括形态侵蚀操作前面的形态扩张操作。
20、根据权利要求18或19所述的精确运动图生成方法,所述后处理操作包括一个二维边缘保存滤波器。
21、根据权利要求20所述的精确运动图生成方法,所述后处理操作包括一个二维中值滤波器。
22、根据权利要求1到21任一权利要求所述的精确运动图生成方法,在所述组合逻辑步骤期间,信号M1被反转为信号C。
23、根据权利要求16、18和22所述的精确运动图生成方法,在所述组合逻辑步骤期间,将信号A、B和C被组合在一起成为最终的运动图。
24、根据权利要求1到23任一权利要求所述的精确运动图生成方法,其中所述输入数据包括边缘图、所述边缘图识别图像的边缘,
所述处理分割步骤包括
接收和处理运动图并输出预处理运动图的预处理步骤;和
接收和处理预处理过的运动图和边缘图并输出信号M1、M2和M3的分割步骤。
25、根据权利要求1到23任一权利要求所述的精确运动图生成方法,进一步包括
接收和处理图像数据并输出包括有运动图的所述输入数据的图像分析步骤。
26、根据权利要求24和25所述的精确运动图生成方法,所述图像分析步骤包括
接收和处理所述图像数据并输出所述运动图的运动检测步骤;和
接收和处理所述图像数据并输出所述边缘图的边缘检测步骤,
所述图像分析步骤用于输出包括所述运动图和所述边缘图的所述输入数据。
27、根据权利要求26所述的精确运动图生成方法,所述运动检测步骤基于具有分级块分裂的精确运动检测来进行处理。
28、根据权利要求26或27所述的精确运动图生成方法,所述边缘检测步骤基于3×3苏贝尔算符来进行处理。
29、一种可以被操作来接收和处理图像输入数据并输出运动图的精确运动检测-分级块分裂、AMD-HBS设备(206),
所述图像输入数据包括至少两幅连续图像,并且
所述运动图识别所述至少两幅连续图像之间的块和/或像素的非运动或运动,
所述设备可以被操作来
将所述图像输入数据的至少两幅连续图像分裂为多个具有特定起始块尺寸的块,
检测所述至少两幅图像之间的块的非运动或运动,和
在检测到所述特定块的非运动和至少一个其相邻块的运动情况下,附加地分裂该特定块和至少一个其相邻块,并且反之亦然,
所述运动图包括块和/或像素,这些块或像素的大小基于所述特定起始块尺寸和所述块的分裂。
30、一种接收和处理图像输入数据并输出运动图的精确运动检测-分级块分裂、AMD-HBS方法,
所述图像输入数据包括至少两幅连续图像,并且
所述运动图识别所述至少两幅连续图像之间的块和/或像素的非运动或运动,
所述方法包括以下步骤
将所述图像输入数据的至少两幅连续图像分裂为多个具有特定起始块尺寸的块的初始分裂步骤,
检测所述至少两幅图像之间的块的非运动或运动的检测步骤,和
在检测到所述特定块的非运动和至少一个其相邻块的运动情况下,分裂该特定块和至少一个其相邻块的附加分裂步骤,并且反之亦然,
所述运动图包括块和/或像素,这些块或像素的大小基于所述初始分裂步骤和所述附加分裂步骤。
全文摘要
本发明涉及利用分级块分裂和运动分割进行目标边界准确运动的检测。尤其涉及一种运动检测领域的用于运动分割的设备,初始运动图被处理为更精确的最终的运动图,其识别至少两幅连续图像之间的像素的非运动或运动。所述设备包括处理分割装置和组合逻辑装置。在上述设备中初始运动图被处理为三个不同的特征图,其分别描述至少两幅连续图像之间的静止边缘、运动边缘和运动平坦区域。本发明进一步涉及一种适用于运动检测领域的运动分割的相应方法。
文档编号G06T7/20GK101533514SQ20081018988
公开日2009年9月16日 申请日期2008年11月14日 优先权日2007年11月14日
发明者P·斯普林格, O·埃德勒 申请人:索尼株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1