一种基于ELM的双路融合的人群人数统计方法与流程

文档序号：15272812发布日期：2018-08-28 22:38阅读：181来源：国知局

本发明属于视频监控技术领域，涉及一种基于ELM的双路融合的人群人数统计方法。

背景技术：

由于人群拥挤导致的群体性事件屡屡发生，于是人们提出了通过视频监控的方法对公共场所的人群人数进行智能化的统计与管理，以预防由人群拥挤带来的安全问题。

近年来关于人群人数统计方法的研究取得了一定的进展，然而在实际的大型场景下，存在着人群活动场景复杂、采集的视频图像光照变化影响等问题，造成人群人数的统计还存在着较大的误差。传统的人群人数估计方法在初期特征提取中主要考虑像素或纹理特征问题，没有充分考虑特征之间及特征本身的特性，从而没有充分的挖掘特征信息；在人群人数统计模型方面，现有的多元线性回归、支持向量回归、脊回归等模型，存在着模型预测准确性还不够高、训练时间较长等问题。本发明针对这些问题，发明了利用较少的人群特征和双路融合的ELM模型，达到准确、快速地统计出视频图像中的人群人数。

技术实现要素：

本发明的目的是提供一种基于ELM的双路融合的人群人数统计方法，解决了现有人群人数统计特征难以融合、人群人数统计模型精度不够高的问题。

本发明所采用的技术方案是，一种基于ELM的双路融合的人群人数统计方法，具体按以下步骤实施：

步骤1，建立基于ELM的双路融合的人群统计模型：

设计两路超限学习机ELM1和ELM2分别捕获人群人数的像素特征和纹理特征与人群人数的关系，并通过第三个超限学习机ELM3实现人群人数的融合；

步骤2，利用训练集图像分别训练步骤1建立的人群统计模型；

步骤3，采用经步骤2训练的人群统计模型对视频图像中的人群人数进行统计。

本发明的特点还在于，

步骤1中ELM1，有两个输入，分别为人群前景目标的周长和面积；一个输出，为由ELM1估计出的人群人数；一个隐层，节点数为50；

ELM2，有47个输入，包括32个韦伯特征WLD和15个灰度共生矩阵特征GLCM；一个输出，为由ELM2估计出的人群人数；一个隐层，节点数为4000；

ELM3，有两个输入，分别连接ELM1的输出和ELM2的输出；一个隐层，节点数为45；一个输出作为最后融合后统计出的人群人数。

步骤2中训练集图像，包括已采集的人群视频图像和视频图像中对应的人群人数。

步骤2具体为：

2.1对训练集图像，采用基于ViBe方法建立背景模型图像，运用背景减除法获得初步的人群前景目标；

2.2提取每幅图像的人群前景目标的像素特征，作为ELM1的输入，图像中的人群人数作为ELM1的输出，训练ELM1；提取每幅图像的纹理特征，作为ELM2的输入，图像中的人群人数作为ELM2的输出，训练ELM2；

2.3分别将训练集图像中人群前景目标的像素特征和纹理特征输入训练好的ELM1和ELM2中，将ELM1和ELM2的输出作为ELM3的输入，将图像中的人群人数作为ELM3的输出，训练ELM3。

步骤2.1中，初步获得人群前景目标需进行后处理，消除孔洞不完整和噪音干扰。

后处理具体为：采用形态学中的闭运算对初步获得的人群前景目标进行后处理，其中膨胀采用椭圆形结构元素，椭圆的短轴在水平方向、半径为2个像素；椭圆的长轴在垂直方向、半径为5个像素；腐蚀采用长方形的结构元素，其宽和高分别为2个像素和6个像素。

像素特征包括周长和面积；纹理特征，包括韦伯特征WLD和灰度共生矩阵特征GLCM。

统计过程具体为：获取需要估计人群人数的视频图像的人群前景目标，提取人群人数的像素特征和纹理特征，分别作为ELM1和ELM2的输入，并将ELM1和ELM2的输出作为ELM3的输入，经ELM3的融合输出，即可得到需要估计人群人数的视频图像中包含的人群人数。

本发明的有益效果是，本发明一种基于ELM的双路融合的人群人数统计方法，所设计的两路超限学习机模型可以分别捕获人群的像素特征和纹理特征与人群人数的关系，并通过第三个超限学习机模型实现人群人数的融合。采用本发明方法，可以实现人群的像素特征和纹理特征的有机融合，具有特征互补性强、融合自适应的特点，从而可以大大提高人群人数统计模型的准确性。

附图说明

图1是本发明一种基于ELM的双路融合的人群人数统计方法的流程图；

图2是本发明方法中基于ELM的双路融合的人群人数统计模型。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明提供了一种基于ELM的双路融合的人群人数统计方法，其流程如图1所示，具体按照以下步骤实施：

步骤1，建立训练集图像，具体包括采集人群视频图像，人工标定每幅图像中的人群人数，将所得到人群视频图像及其对应的人群人数作为训练集图像。

步骤2，建立基于ELM的双路融合的人群统计模型，如图2所示，由三部分组成：其中一路为ELM1，它有两个输入，分别为人群前景目标的周长和面积，一个输出，为由ELM1估计出的人群人数，一个隐层，节点数为50；另一路为ELM2，它有47个输入，包括32个韦伯特征WLD和15个灰度共生矩阵特征GLCM，一个输出，为由ELM2估计出的人群人数，一个隐层，节点数为4000；最后一部分为起融合作用的ELM3，它有两个输入，分别连接ELM1的输出和ELM2的输出，一个隐层，节点数为45，一个输出作为最后融合后统计出的人群人数。

步骤3，利用步骤1得到的训练集图像，训练步骤2所建立的基于ELM的双路融合的人群统计模型，具体步骤如下：

步骤3.1，对步骤1得到的训练集图像，采用基于ViBe方法建立背景模型图像，运用背景减除法获得初步的人群前景目标。

为消除初步获得的人群前景目标中存在的孔洞不完整和噪音干扰问题，本发明针对人体对象设计了两个独特的形态学结构元素，采用形态学中的闭运算对初步获得的人群前景目标进行后处理，其中膨胀采用椭圆形结构元素，椭圆的短轴在水平方向、半径为2个像素；椭圆的长轴在垂直方向、半径为5个像素。腐蚀采用长方形的结构元素，其宽和高分别为2个像素和6个像素；

步骤3.2，首先对步骤3.1中获得的训练集图像中每幅图像的人群前景目标，提取像素特征，包括周长和面积；然后将提取到的每幅图像人群前景目标的周长和面积作为第一个超限学习机ELM1的输入，每幅图像中标定的人群人数作为ELM1的输出，训练ELM1；

步骤3.3，首先提取训练集图像中每幅图像的纹理特征，包括韦伯特征WLD(Weber Local Descriptor)和灰度共生矩阵特征GLCM；然后将提取到的每幅图像的韦伯特征WLD(Weber Local Descriptor)和灰度共生矩阵特征GLCM作为第二个超限学习机ELM2的输入，每幅图像中标定的人群人数作为ELM2的输出，训练ELM2；

步骤3.4，使用训练集中的所有图像，训练第三个超限学习机ELM3，具体为：

首先提取训练集图像中所有图像的周长、面积、韦伯特征WLD和灰度共生矩阵特征GLCM；然后将周长、面积输入训练好的ELM1，求ELM1的输出，将其作为ELM3的第一个输入；再将韦伯特征WLD和灰度共生矩阵特征GLCM输入训练好的ELM2，求ELM2的输出，将其作为ELM3的第二个输入；最后，将各图像中标定的人群人数作为ELM3的输出，训练ELM3；

步骤4，对于需要估计人群人数的视频图像，首先利用步骤3.1中的方法获取人群前景目标，并求人群前景目标的周长、面积特征作为训练好的ELM1的输入；然后提取要估计人群人数的视频图像的韦伯特征WLD和灰度共生矩阵特征GLCM，作为ELM2的输入；最后利用步骤3训练好的基于ELM的双路融合的人群统计模型，即可求得需要估计人群人数的视频图像中包含的人群人数，即ELM3的输出。

现有的人群人数统计方法不能较好的融合人群的像素特征和纹理特征，人群人数统计不够精准，本发明一种基于ELM的双路融合的人群人数统计方法，所设计的两路超限学习机模型可以分别捕获人群的像素特征和纹理特征，并通过第三个超限学习机模型实现人群人数的融合。采用本发明方法，可以实现人群的像素特征和纹理特征的有机融合，具有特征互补性强、融合自适应的特点，从而可以大大提高人群人数统计模型的准确性。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张二虎;刘梦琨;段敬红
技术所有人：西安理工大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。