一种行人识别方法和装置与流程

文档序号：12123774阅读：440来源：国知局

本发明涉及图像处理技术领域，更具体地，涉及一种行人识别方法和装置。

背景技术：

近年来，基于人的图像识别分析技术取得了广泛的应用，例如年龄识别、公安安防和门禁系统等。图像中的行人体型判断，是对行人进行语义描述的一个重要属性，即检测一张行人图片或视频中行人的身高、胖瘦等体型特征。

体型的测量在日常生活中随处可见。传统的体型判断方法，大多需要接触式的通过尺度工具的直接测量，或者间接地根据参照物测量。这些判断方法虽然准确，但都需要人工的持续参与。当人数多时，如果逐一测量则速度相对较慢。当在人流量较大的场合，既需要估算体型，又需要达到一定的精度，并且对速度有一定要求时，传统的测量方法则不能满足要求。

目前基于摄像头行人图像用计算机判断行人体型的技术，正在逐步兴起，它通过非接触式的视觉信息来判断体型，但是面临着很多的挑战。其中之一就是行人视角的问题，不同视角下行人的姿态体型有很大的不同。如何训练出不同视角下的鲁棒的体型判断模型是一个相当有难度的问题。

基于摄像头行人图像判断行人体型的算法，通常首先使用行人检测模块检测出摄像头图像中的行人位置，分离出单独的行人图像。接着，提取行人图像的视觉特征，通常是行人区域的面积和宽高比。最后，通过这些特征拟合得到行人的体型。这些算法通常无法解决行人视角的问题，不同视角下行人的姿态有很大的不同，算法拟合得到的结果差距很大。

技术实现要素：

本发明提供一种克服上述问题或者至少部分地解决上述问题的行人识别方法和装置，相比现有技术，不需要人主动配合，具有复杂度低、鲁棒性强等优点。

根据本发明的一个方面，提供一种行人识别方法，该方法包括：

步骤1，根据图像中的行人位置，标明行人区域，分离单独的行人图像；

步骤2，根据行人区域和单独的行人图像，标定行人数据集，将行人图像对应于行人体型；

步骤3，根据行人图像，基于卷积神经网络分析获取行人的属性特征。

本发明提出的行人识别方法通过行人图像的体型判断，利用基于深度学习的多任务卷积神经网络，在离线训练过程中针对不同性别、不同的行人视角训练一个统一的体型判断模型，有效的解决行人视角的问题，大大提高了算法准确度。

根据本发明的另一个方面，提供一种行人识别装置，该装置包括行人检测模块、样本标定模块、离线训练模块和在线体型判断模块。

所述行人检测模块，用于根据图像中的行人位置，标明行人区域，分离单独的行人图像；

所述样本标定模块，用于根据行人区域和单独的行人图像，标定行人数据集，将行人图像对应于行人体型，标定为训练样本；

所述离线训练模块，用于根据收集得到的训练样本集，训练出基于深度学习的卷积神经网络；

所述在线体型判断模块，用于在线检测行人图像，并将检测数据输入卷积神经网络，判断行人体型的估计值。

其中，所述行人检测模块根据摄像头采集的视频序列，分离为单独图像，获取行人数据集；对样本集进行预处理并且归一化为统一尺度，生成数据文件。

其中，所述样本标定模块，将行人图像标定行人身份ID，设定数据属性，其中，所述数据属性包括视角、性别或者体型，其中，行人的视角划分为八个方向，分别为正前、左前、右前、左、右、左后、右后、正后，分别给予标号1～8；将行人性别划分为男性和女性两类，给予标号1，2；将行人体型分为偏瘦、健硕、适中、超重、肥胖五类，分别给予标号1～5。

其中，所述离线训练模块，构建具有五层卷积操作层、五层池化操作层、五层dropout层、两层全连接层、三层softmax分类器和三层逻辑回归对象层的卷积神经网络，其中三个softmax分类器分别对应三种行人属性：视角、性别、体型；各个神经元的激活函数采用ReLu(Rectified Linear Units)激活函数f(x)＝max(0,x)，该激活函数具有单侧抑制、相对宽阔的兴奋边界、稀疏激活性等特性，由于分段线性可以避免梯度消失问题；每一次迭代取一个数据batch，batch大小为64，即以64个样本为单位利用误差反向传播算法对卷积神经网络进行训练，基于权重矩阵计算各层误差及梯度方向，根据梯度下降法更新权值矩阵，循环执行，直到网络达到收敛。

其中，所述在线体型判断模块，用于对在线获得的监控图像进行行人检测，得到行人图像，再将行人图像输入卷积神经网络，神经网络最后一层全连接层被分为3个分支，分别使用softmax回归模型分类器对视角、性别、体型进行分类；根据三个softmax分类输出层结果来识别出行人视角、性别、体型信息。

本发明提出的行人识别装置对硬件要求低，算法清晰，将行人视角划分为八个方向可以更好的适应不同视角下的行人姿态，同时引入深度学习策略，从而使最终算法更好的适应数据和环境的变化。

附图说明

图1为本发明行人识别方法的流程图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

在根据本申请的一个实施例中，参考图1，提供一种行人识别方法，该方法包括：步骤1，根据图像中的行人位置，标定行人区域，分离单独的行人图像；步骤2，根据行人区域和单独的行人图像，标定行人数据集，将行人图像对应于行人体型；步骤3，根据行人图像，基于卷积神经网络分析获取行人的属性特征。

其中，步骤1中，进一步包括：步骤11，根据摄像头采集的视频序列，分离为单独图像，获取行人数据集；步骤12，对样本集进行预处理并且归一化为统一尺度，生成数据文件。

其中，步骤2中：将行人图像标定行人身份ID，设定数据属性其中，所述数据属性包括视角、性别或者体型，其中，行人的视角划分为八个方向，分别为正前、左前、右前、左、右、左后、右后、正后，分别给予标号1～8；将行人性别划分为男性和女性两类，给予标号1，2；将行人体型分为偏瘦、健硕、适中、超重、肥胖五类，分别给予标号1～5。

其中，步骤3中，进一步包括：步骤31，根据收集得到的训练样本集，训练出基于深度学习的卷积神经网络；步骤32，检测行人图像，并将检测数据输入卷积神经网络，判断行人体型的估计值。

其中，步骤11中，收集行业内公认数据集并且增加监控视频中的行人检测数据集，采用行人检测方法检测图像中的行人区域。

其中，步骤11进一步包括：步骤111，从摄像头采集拍摄到的视频序列；步骤112，将视频序列按照每10秒输出一张图像；步骤113，使用行人检测方法检测图像中的行人区域。

其中，步骤12中，所述统一的尺度可以是128*64，该数据文件用于卷积神经网络的训练。

其中，步骤31中，设计卷积神经网络的结构，并进行训练，获取网络收敛时的权重连接矩阵W，用于以后的分类过程。

其中，步骤31还进一步包括：步骤311，设计一个具有五层卷积操作层、五层池化操作层、五层dropout层、两层全连接层、三层softmax分类器和三层逻辑回归对象层的卷积神经网络，三个softmax分类器分别对应三种行人属性：视角、性别、体型；步骤312，各个神经元的激活函数采用ReLu(Rectified Linear Units)激活函数f(x)＝max(0,x)，该激活函数具有单侧抑制、相对宽阔的兴奋边界、稀疏激活性等特性，由于分段线性可以避免梯度消失问题；步骤313，每一次迭代取一个数据batch，batch大小为64，即以64个样本为单位利用误差反向传播算法对卷积神经网络进行训练，基于权重矩阵计算各层误差及梯度方向，根据梯度下降法更新权值矩阵，循环执行，直到网络达到收敛。

其中，步骤32中，对在线获得的监控图像进行行人检测，得到行人图像，再将行人图像输入卷积神经网络，神经网络最后一层全连接层被分为3个分支，分别使用softmax回归模型分类器对视角、性别、体型进行分类；根据三个softmax分类输出层结果来识别出行人视角、性别、体型信息。

其中，步骤32中，每个所述softmax回归模型分类器均采用函数

计算当前图像属于每一个类别的概率，选取概率最高的类别作为识别结果，即可得到待识别行人的视角、性别、体型特征。

根据本发明的另一个实施例，提供一种行人识别装置，该装置包括行人检测模块、样本标定模块、离线训练模块和在线体型判断模块。所述行人检测模块，用于根据图像中的行人位置，标明行人区域，分离单独的行人图像；所述样本标定模块，用于根据行人区域和单独的行人图像，标定行人数据集，将行人图像对应于行人体型，标定为训练样本；所述离线训练模块，用于根据收集得到的训练样本集，训练出基于深度学习的卷积神经网络；所述在线体型判断模块，用于在线检测行人图像，并将检测数据输入卷积神经网络，判断行人体型的估计值。

所述样本标定模块，将行人图像标定行人身份ID，设定数据属性，其中，所述数据属性包括视角、性别或者体型，其中，行人的视角划分为八个方向，分别为正前、左前、右前、左、右、左后、右后、正后，分别给予标号1～8；将行人性别划分为男性和女性两类，给予标号1，2；将行人体型分为偏瘦、健硕、适中、超重、肥胖五类，分别给予标号1～5。

所述离线训练模块，设计一个具有五层卷积操作层、五层池化操作层、五层dropout层、两层全连接层、三层softmax分类器和三层逻辑回归对象层的卷积神经网络，三个softmax分类器分别对应三种行人属性：视角、性别、体型；各个神经元的激活函数采用ReLu(Rectified Linear Units)激活函数f(x)＝max(0,x)，该激活函数具有单侧抑制、相对宽阔的兴奋边界、稀疏激活性等特性，由于分段线性可以避免梯度消失问题；每一次迭代取一个数据batch，batch大小为64，即以64个样本为单位利用误差反向传播算法对卷积神经网络进行训练，基于权重矩阵计算各层误差及梯度方向，根据梯度下降法更新权值矩阵，循环执行，直到网络达到收敛。

所述在线体型判断模块，用于对在线获得的监控图像进行行人检测，得到行人图像，再将行人图像输入卷积神经网络，神经网络最后一层全连接层被分为3个分支，分别使用softmax回归模型分类器对视角、性别、体型进行分类；根据三个softmax分类输出层结果来识别出行人视角、性别、体型信息。

最后，本申请的方法仅为较佳的实施方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王生进;田露;
技术所有人：清华大学;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。