智能视频人体识别方法

文档序号：6482975阅读：301来源：国知局

专利名称：智能视频人体识别方法
技术领域：
本发明属于计算机图形图像学技术领域，是一种智能视频人体识别方法。
背景技术：
智能视频分析是将计算机视觉方法引入到视频监控中，这一技术包括由视频图像序列自动地进行运动目标的检测、目标跟踪、目标分类和行为理解等方面的内容，目的是在图像及像描述之间建立映射关系，从而使计算机能够分析并理解视频画面中的内容。视频监控中所提到的智能视频技术主要指的是自动分析和抽取视频源中的关键信息，借助计算机强大的数据处理功能，对视频画面中的海量数据进行高速分析，过滤掉监控者不关心的信息，仅仅为监控者提供有用的关键信息。其中，人体的检测与识别是智能视频技术中最重要的一个部分。智能视频人体识别，需要具有较强的抗干扰能力，有效解决由于外界环境引起的摄像机抖动，光线和天气引起的噪声干扰等等。目前，几种常用的运动目标检测方法有帧间差法(Temporal Difference)，背景减除法(BackgroundSubtraction)和光流法(Optical Flow)。光流法的运动检测采用了动态目标随时间变化的光流特性，计算方法相当复杂，在视频实时处理的环境中被业界弃用。帧间差法又叫时间差分法，它充分利用了视频图像的特征，从连续得到的视频流中提取所需要的动态目标信息。在一般情况下采集的视频图像，若仔细对比相邻两巾贞，可以发现其中大部分的背景像素均保持不变，只有在有当前图像运动目标的部分相邻帧的像素差异比较大，时间差分方法就是利用相邻帧图像的相减来提取出当前图像运动目标的信息的。虽然时间差分运动检测方法对于动态环境具有较强的自适应性，但一般不能完全提取出所有相关的特征像素点，在运动实体内部容易产生空洞现象，只能够检测到目标的边缘。而且，当运动目标停止运动时，一般时间差分方法便失效。背景减除法是利用当前图像与背景图像的差分来检测出运动目标。它是目前运动检测中最常用的一种方法，一般能够提供相对来说比较全面的运动目标的特征数据，大部分的研究人员目前都致力于开发更加实用的背景模型，用于减少动态场景变化对于运动目标检测效果的影响。最简单的背景模型是时间平均图像，即利用同一场景在一个时段的平均图像作为该场景的背景模型。背景的建模是背景减除方法的技术关键。但是，由于该方法背景模型是固定的，一旦建立之后，对于该场景图像所发生的任何变化都比较敏感，比如阳光照射方向、影子、树叶随风摇动等。因此，本发明有必要提供一种新的方法来解决上述问题。

发明内容
为了克服上述传统方法的缺点，本发明提供一种智能视频人体识别方法，可以有效提高识别的精确性。本发明通过这样的技术方案解决上述的技术问题
一种智能视频人体识别方法，该方法包括如下步骤第一步，建立静态背景模型；第二步，利用帧间差法确定人体运动轮廓和背景减除法获得人体运动区域，并将人体运动区域填充到人体运动轮廓中；第三步，利用最大方差阈值分割方法将第二步所得填充结果进行二值化，同时分析分割的有效性；第四步，对于有效的分割，合并人体运动区域，并跟踪人体运动轨迹，更新静态背景模型，并返回第二步。作为本发明的一种改进，第一步中通过提取序列帧，并针对序列帧在时域上进行中值滤波后获得静态背景模型。作为本发明的一种改进，第三步中记t为人体运动区域与背景图像的分割阈值，当t使得值g = W0* (U0-U) 2+Wl* (U1-U)2最大时，t即为分割的最大方差阈值；其中，人体运动区域的像素点数占图像比例为W。，平均灰度为U。；背景图像像素点数占图像比例为wl，平均灰度为U1，则图像的总平均灰度为11 = Wfuc^du1。作为本发明的一种改进，如果方差g小于一个经验阈值，即人体运动区域和背景图像无法明显的区分，直接将人体运动区域和背景图像构成的待处理图像全部设置为0 ；其中经验阈值的取值范围为100至200之间。作为本发明的一种改进，所述方法包括如下步骤步骤11、从视频源提取序列帧；步骤12、将提取的序列帧转为灰度图像，并做平滑滤波；步骤13、对当前帧进行亮度标准化；步骤14、利用帧间差法确定人体运动轮廓和背景减除法获得人体运动区域；步骤15、将人体运动区域填充到人体运动轮廓中；步骤16、利用最大方差阈值分割方法将所得结果进行二值化；步骤17、判断分割是否有效，如果判断结果为是，则执行步骤18 ；步骤18、找到人体运动轮廓，合并人体运动区域；步骤19、跟踪并绘出人体运动轨迹；步骤20、更新静态背景模型；步骤21、判断是否最后一帧，如果不是，则返回步骤11，如果是，结束该识别。作为本发明的一种改进，判断步骤12中提取的序列帧是否为前25帧，如果判断结果为是，则执行如下步骤步骤121、将前25帧图片转为灰度图像，存入缓冲；步骤122、然后将前25帧图片在时域上进行中值滤波，作为静态背景模型，并返回步骤11。作为本发明的一种改进，步骤17中，如果判断结果为否，则将人体运动区域和背景图像构成的待处理图像全部设置为0，并返回步骤11。本发明与现有方法相比，其优点是，识别效果好、鲁棒性高、无需手动干预，此外，本方法抗干扰性强，可以准确的消除室内灯光突变等情况，也可以过滤树叶的摆动、空中飞行物的干扰、下雨、下雪、起雾及天气突变等常见室外环境，从而减少了行业内常见的误跟踪现象和误报警情况。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1为本发明智能视频人体识别方法的总体流程图。图2为本发明智能视频人体识别方法的详细流程图。
具体实施例方式下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。本发明提供一种智能视频人体识别方法。请参阅图1，所述方法包括如下步骤第一步，建立静态背景模型，首先通过对1秒钟大概25帧左右的序列帧在时域上进行中值滤波后获得静态背景模型，从而消除了单帧作为背景模型的不稳定性；第二步，利用帧间差法确定人体运动轮廓和背景减除法获得人体运动区域，并将人体运动区域填充到人体运动轮廓中；第三步，利用最大方差阈值分割将第二步所得填充结果进行二值化，同时分析分割的有效性；第四步，对于有效的分割，合并人体运动区域，并实现人体运动轨迹跟踪，更新静态背景模型，并返回第二步。以下分别对每个步骤的实施进行详细描述1.静态背景模型建立与更新静态背景模型的建立是背景减除法的技术关键，可以通过对1秒左右大概25帧的序列帧进行时域中值滤波获得。建立好的静态背景模型对于该场景图像所发生的任何变化都比较敏感，因此本发明利用跟踪后结果，利用公式B(X)更新静态背景模型，使其可以减少由于噪声引起的场景变化对于运动目标检测效果的影响。2.利用帧间差法确定人体运动轮廓和背景减除法获得人体运动区域，并将人体运动区域填充到人体运动轮廓中；利用帧间差法得到人体运动轮廓，然后用背景减除法来提取整个人体运动区域。对于摄像机采集的视频，今In(X)为像素位置X，时间t = η时的亮度值。三帧差分法首先是默认像素是合法的运动，如果一个像素的亮度值在当前帧和上一帧间以及当前帧和上上帧间变化很大，则判定该像素是运动的，即当In(X)-Ilri(X) I > Tn(X)且 In(x)-In_2(x) | > Tn(X)时，判断像素是运动的。这里，Tn(X)是一个描述像素χ处的有效亮度变化阈值，这个阈值是通过时域统计法得到的。帧间差法存在的主要问题是目标内部的亮度一样的像素没有被包括在“运动”的像素集中。背景减除法得到人体运动区域bn
权利要求
一种智能视频人体识别方法，其特征在于，该方法包括如下步骤第一步，建立静态背景模型；第二步，利用帧间差法确定人体运动轮廓和背景减除法获得人体运动区域，并将人体运动区域填充到人体运动轮廓中；第三步，利用最大方差阈值分割方法将第二步所得填充结果进行二值化，同时分析分割的有效性；第四步，对于有效的分割，合并人体运动区域，并跟踪人体运动轨迹，更新静态背景模型，并返回第二步。
2.根据权利要求1所述的智能视频人体识别方法，其特征在于，第一步中通过提取序列帧，并针对序列帧在时域上进行中值滤波后获得静态背景模型。
3.根据权利要求1所述的智能视频人体识别方法，其特征在于，第三步中记t为人体运动区域与背景图像的分割阈值，当t使得值g = Wtl*(Utl-U)2+Wl*(U1-U)2最大时，t即为分割的最大方差阈值；其中，人体运动区域的像素点数占图像比例为《0，平均灰度为U。；背景图像像素点数占图像比例为《1，平均灰度为U1，则图像的总平均灰度为u = Wq*Uq+Wi*Ui。
4.根据权利要求3所述的智能视频人体识别方法，其特征在于，如果方差g小于一个经验阈值，即人体运动区域和背景图像无法明显的区分，直接将人体运动区域和背景图像构成的待处理图像全部设置为0 ；其中经验阈值的取值范围为100至200之间。
5.根据权利要求1所述的智能视频人体识别方法，其特征在于，所述方法进一步包括如下步骤步骤11、从视频源提取序列帧；步骤12、将提取的序列帧转为灰度图像，并做平滑滤波；步骤13、对当前帧进行亮度标准化；步骤14、利用帧间差法确定人体运动轮廓和背景减除法获得人体运动区域；步骤15、将人体运动区域填充到人体运动轮廓中；步骤16、利用最大方差阈值分割方法将所得结果进行二值化；步骤17、判断分割是否有效，如果判断结果为是，则执行步骤18 ；步骤18、找到人体运动轮廓，合并人体运动区域；步骤19、跟踪并绘出人体运动轨迹；步骤20、更新静态背景模型；步骤21、判断是否是最后一帧，如果不是，则返回步骤11，如果是，结束该识别。
6.根据权利要求5所述的智能视频人体识别方法，其特征在于，判断步骤12中提取的序列帧是否为前25帧，如果判断结果为是，则执行如下步骤步骤121、将前25帧图片转为灰度图像，存入缓冲；步骤122、然后将前25帧图片在时域上进行中值滤波，作为静态背景模型，并返回步骤11。
7.根据权利要求5所述的智能视频人体识别方法，其特征在于，步骤17中，如果判断结果为否，则将人体运动区域和背景图像构成的待处理图像全部设置为0，并返回步骤11。
全文摘要
本发明属于计算机图形图像学技术领域，提供一种智能视频人体识别方法，该方法包括如下步骤第一步，建立静态背景模型；第二步，利用帧间差法确定人体运动轮廓和背景减除法获得人体运动区域，并将人体运动区域填充到人体运动轮廓中；第三步，利用最大方差阈值分割方法将第二步所得填充结果进行二值化，同时分析分割的有效性；第四步，对于有效的分割，合并人体运动区域，并跟踪人体运动轨迹，更新静态背景模型，并返回第二步。本发明识别效果好、鲁棒性高、无需手动干预，此外，本发明抗干扰性强，可以准确的消除室内灯光突变等情况，也可以过滤树叶的摆动、空中飞行物的干扰及天气突变等常见室外环境，减少了误跟踪现象和误报警情况。
文档编号G06T7/20GK101996307SQ20091005618
公开日2011年3月30日申请日期2009年8月10日优先权日2009年8月10日
发明者王正光, 黄波士申请人:上海理视微电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王正光;黄波士
技术所有人：上海理视微电子有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。