一种自适应的运动目标视觉检测方法与流程

文档序号：11251913阅读：1002来源：国知局

本发明属于计算机视觉、视频分析和人工智能结合的技术领域，具体涉及一种自适应的运动目标视觉检测方法。

背景技术：

传统的运动目标视觉检测方法包括：光流法、帧差法以及背景差分法。其中，光流法检测准确性高，但其计算复杂且抗干扰能力差，若没有特定的硬件支持则难以满足对实时处理的要求。帧差法是这三种类型算法中最简单高效的一种算法，其能有效适应环境的动态变化，但是难以获得完整的运动目标，检测时容易出现空洞现象，检测效果不理想。

而背景差分法不仅能适应动态的环境，而且能够检测出完整的目标形状，被广泛应用于运动目标检测邻域中。背景差分法的关键点是要训练出一个精准的背景模型，因此不同的研究人员提出不同的训练方法，得到不同的背景差分算法。典型的有混合高斯模型算法、kde算法、codebook算法、vibe算法、subsense算法、adadgs算法等。

上述的各个算法虽然能较好地适应某种场景，且在特定的数据集上表现良好，但由于运动目标和外部环境的多样性，某一个特定的算法难以保证在这些不同的条件下都具有良好的检测表现。尽管还有其他的运动目标检测算法相继被提出，依然没有一种算法能同时适应不同的环境，并获得良好的检测效果。

技术实现要素：

为了解决上述技术问题，本发提供了一种自适应运动目标检视觉测算法，实现不同环境下运动目标的鲁棒检测。

本发明所采用的技术方案是：一种自适应的运动目标视觉检测方法，其特征在于，包括以下步骤：

步骤1：输入第一帧图像；

步骤2：初始化n种不同的运动目标检测算法在各像素点x处的权重ωi(x)，其中i∈[1,n]，x∈[1,m]，m为图像像素点的个数；

步骤3：针对n种不同的运动目标检测算法，对输入的图像序列进行检测，获得不同的前景图像观测值{f1,f2,…,fn}；

步骤4：根据ωi(x)和前景图像观测值{f1,f2,…,fn}估计真实的前景图像估计值

步骤5：将前景图像估计值与{f1,f2,…,fn}进行比较，更新各算法在各像素点的权重ωi(x)；

步骤6：若当前图像为最后一帧，则结束算法，否则输入下一帧图像，重复步骤3-步骤5。

本发明的有益效果是：本发明采用多种算法同时对同一图像序列进行检测，并利用加权组合的方式对各算法模块检测的结果进行有效融合，估计真实的前景图像。通过对各算法模块整体表现的预估以及对权重参数的自适应实现了复杂环境下运动目标的鲁棒检测。在实际应用中，相比其他运动目标检测算法，本发明提出的自适应运动目标检测算法能获得更加完整且噪声干扰更少的运动目标。

附图说明

图1是本发明实施例自适应运动目标检测算法的整体框架图；

图2是本发明实施例指标fm计算过程中各参数物理含义示意图；

图3是本发明实施例中采集的源图像；

图4是本发明实施例中源图像运动目标的真实标记；

图5是本发明实施例中lbadasom算法的检测结果图像；

图6是本发明实施例中lobster算法的检测结果图像；

图7是本发明实施例中subsense算法的检测结果图像；

图8是本发明实施例中dpzivgmm算法的检测结果图像；

图9是本发明实施例中vibe算法的检测结果图像；

图10是本发明实施例算法的检测结果图像。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

请见图1，本发明提供的一种自适应的运动目标视觉检测方法，包括以下步骤：

步骤1：输入第一帧图像；

步骤2：初始化n种不同的运动目标检测算法在各像素点x处的权重ωi(x)，其中i∈[1,n]，x∈[1,m]，m为图像像素点的个数；

ωi(x)＝1/n；

本实施例采用多线程以及分布式并行处理，n种不同的运动目标检测算法包括dpzivgmm算法、lbadasom算法、codebook算法、pawcs算法、fuzzycho算法、fuzzysug算法、multicue算法、lobster算法、vibe算法以及subsense算法。

步骤3：针对n种不同的运动目标检测算法，对输入的图像序列进行检测，获得不同的前景图像观测值{f1,f2,…,fn}；

步骤4：根据ωi(x)和前景图像观测值{f1,f2,…,fn}估计真实的前景图像估计值

步骤4.1：计算第一次前景图像估计值

其中fi(x)表示第i种算法在像素点x处的观测值，fi(x)∈{0,1}，t1为第一次

前景估计的预定义阈值，且t1∈[0,1]；

步骤4.2：将n个前景图像观测值{f1,f2,…,fn}与第一次前景图像估计值进行比较，计算各算法的整体表现fmi；

请见图2，其中pr表示准确率、re表示召回率、tp(turepositive)表示被正确检测为前景的像素点个数、fn(falsenegative)表示被错误检测为背景的像素点个数、fp(falsenegative)表示被错误检测为前景的像素点个数、tn(truenegative)表示被正确检测为背景的像素点个数。

步骤4.3：计算结合算法整体得分fmi的各像素点权重γi(x)；

步骤4.4：根据γi(x)第二次估计前景图像估计值中前景像素点x满足：

其中t2为第二次前景估计的预定义阈值，且t2∈[0,1]；

步骤5：将前景图像估计值与{f1,f2,…,fn}进行比较，更新各算法在各像素点的权重ωi(x)；

1)ωi(x)的更新计算公式如下：

ωi,t(x)＝(1-α)ωi,t-1(x)+αmi,t；

其中ωi,t(x)为t时刻第i个算法模块在像素点x处的权重，α为模型的学习率，α∈[0,1]，mi,t为匹配因子，若fi(x)与匹配，mi,t＝1；否则，mi,t＝0。

步骤6：若当前图像为最后一帧，则结束算法，否则输入下一帧图像，重复步骤3-步骤5。

本实施例基于microsoftvisualstudio2013平台，利用opencv计算机视觉库进行开发。用于自适应的算法有10种，分别是dpzivgmm算法、lbadasom算法、codebook算法、pawcs算法、fuzzycho算法、fuzzysug算法、multicue算法、lobster算法、vibe算法以及subsense算法，自适应过程中阈值t1和t2均设置为0.4。

图3是本发明实施例中采集的源图像，图4是本发明实施例中源图像运动目标的真实标记，图5是本发明实施例中lbadasom算法的检测结果图像，图6是本发明实施例中lobster算法的检测结果图像，图7是本发明实施例中subsense算法的检测结果图像，图8是本发明实施例中dpzivgmm算法的检测结果图像，图9是本发明实施例中vibe算法的检测结果图像，图10是本发明实施例算法的检测结果图像。

其中lbadasom和dpzivgmm算法在检测图像序列1和3时，噪声严重。lobster在检测序列2和3时丢失了运动目标，漏检严重。subsense算法在检测序列3时同样丢失了运动目标，且在检测序列1时误检严重。vibe算法则在检测序列1和2时仍然存在一定的漏检问题。而实施例算法对3个图像序列的检测结果较为理想，在获得完整的运动目标的同时也能有效抑制噪声干扰。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭建明;梅浪奇;刘清;谢兆青;路萍萍
技术所有人：武汉理工大学
我是此专利的发明人

上一篇：一种视频中动态人脸识别方法与流程
上一篇：基于多特征融合的相关滤波跟踪方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。