一种基于深度学习的行人属性精细化识别方法与流程

文档序号:15273107发布日期:2018-08-28 22:40阅读:2645来源:国知局

本发明涉及模式识别技术领域,特别是涉及一种基于深度学习的行人属性精细化识别方法。



背景技术:

随着近些年来,平安城市的概念的提出。监控视频分布在城市的各个角落,维护着城市安全。如果发生了突发事故,要从海量的监控图像中寻找到有效信息,必然会耗费大量的人力物力。而行人作为主要的监控目标,如果能对行人属性进行有效的识别,会给监控视频检索工作带来很大的便利。行人属性识别在视频监控、智能商业视频、行人重识别、人脸识别识等领域有着广泛的应用前景,受到了越来越多的研究者的关注。行人属性识别的一种传统识别算法为人工神经网络,它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型。基于人工神经网络的训练算法为反向传播算法,它使得网络模型经过对大量训练样本进行学习的过程能够获得统计规律,从而对未知事件做出预测。人工神经网络优点在于具有较强的非线性映射能力、自学习和自适应能力、泛化能力和一定的容错能力,但存在以下缺点,在行人识别样本训练时收敛速度慢,且其训练过程为监督过程,而对训练样本的标注既费时又费力,并且视频行人识别涉及到大量数据的计算和分析,外加一些环境因素的干扰,传统行人属性识别算法无法提取到图像的优选特征,导致识别率有限。



技术实现要素:

本发明所要解决的技术问题是提供一种基于深度学习的行人属性精细化识别方法,能够提高识别精度和速度。

本发明解决其技术问题所采用的技术方案是:提供一种基于深度学习的行人属性精细化识别方法,包括以下步骤:

(1)对行人样本数据集进行属性标注,得到行人属性数据集;

(2)构建基于alexnet网络微调的卷积神经网络模型,并对该卷积神经网络模型进行训练;

(3)对训练完毕后的卷积神经网络模型输入行人测试图片,提取行人属性特征;

(4)将提取的行人属性特征输入到分类器中,训练人体属性分类器;

(5)通过行人属性数据集计算出属性xi的样本属于类别yj的比例,即表示的是拥有属性xi且属于类别yj的样本数量,表示的是拥有属性xi的样本数量,计算出每个属性相应的属性类别的数量关系;

(6)将行人测试样本zt输入到训练完毕的卷积神经网络模型,并提取特征;然后将提取的特征输入到所述人体属性分类器中,得到行人样本具有属性xi的后验概率p(xi|zt),通过行人属性与其对应的属性类别之间的数量关系,利用贝叶斯公式:计算出行人样本具有类别yj的后验概率,计算出来的类别yj的概率中的最大值相对应的类别就是行人样本的属性类别,其中,n行人属性的数量,。

所述所述步骤1中通过图片标注工具对行人图片标注能代表行人的42个属性;42个属性分为性别属性、头发长度属性、上身衣着类型属性、上身衣着颜色属性、下身衣着类型属性、下身衣着颜色属性、包类型属性和鞋类型属性,其中性别属性包括男和女,头发长度属性包括长发和短发,上身衣着类型属性包括t恤、衬衫、外套和羽绒服,上身衣着颜色属性包括黑、白、红、黄、蓝、绿、紫、棕、灰、橙和多色,下身衣着类型属性为长裤、短裤、长裙和短裙,下身衣着颜色属性包括黑、白、红、黄、蓝、绿、紫、棕、灰、橙和多色,包类型属性包括单肩包、双肩包、手拉箱和钱包,鞋类型包括皮鞋、运动鞋、凉鞋和靴子。

所述步骤(2)中基于alexnet网络模型的微调的卷积神经网络模型结构中微调的alexnet模型结构如下:第一层是卷积层,特征平面96个,卷积核大小11x11;第二层是卷积层,特征平面256个,卷积核大小5x5;第三层是卷积层,特征平面384个,卷积核大小3x3;第四层是卷积层,特征平面是384个,卷积核大小3x3;第五层是卷积层,特征平面是256个,卷积核大小3x3;第六层是全连接层,保持不变;第七层是全连接层,保持不变;第八层是全连接层,在这一层根据行人属性的数目,修改输出的节点。

所述步骤(2)中对该卷积神经网络模型进行训练具体包括以下子步骤:

(21)对alexnet卷积神经网络的每一层的输出进行反卷积操作,然后这一层的输入与反卷积输出的结果进行比较,得到误差e;

(22)通过梯度下降法不断调整模型的卷积核的权值大小,公式为:式中w*为更新的权值,w为原来的权值,η为设置的学习率,表示误差对权值的偏导;

(23)把训练样本输入到模型当中,进行20000次迭代训练,训练完毕后得到一个改进的卷积神经网络模型。

所述步骤(4)包括以下子步骤:

(41)先为每一个属性,设计独立的分类器;

(42)分类器选用支持向量机,支持向量机在训练过程中的核函数选用径向基函数,最小最大优化方法确定径向基参数σ的值为3.35;

(43)将提取的行人属性特征输入到所述步骤(42)配置的分类器中能够将识别精度提高到94%以上。

有益效果

由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:

本发明与传统的行人属性识别方法相比,采用深度学习的方法,提高了识别精度。卷积神经网络不仅能够提取较好的属性特征,而且在训练过程是无监督,降低了行人样本属性标注的成本。

本发明与传统的使用底层特征进行属性识别的方法相比,能够提取到高层的语义信息,在光照、视角等不可控因素下也能体现出更好的识别效果。

附图说明

图1是本发明实施例中的一种基于深度学习的行人属性识别方法的流程图。

具体实施方式

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

本发明的实施方式涉及一种基于深度学习的行人属性精细化识别方法,分为行人属性数据集的标注、深度学习模型的构建与训练、行人属性学习、行人属性类别映射关系学习和样本测试五个部分。将深度学习和行人属性学习相结合,可以提高行人属性识别的精确度,从而达到对行人属性精细化识别的目的。行人属性数据集的标注部分,通过图像标注工具,标注了能代表行人的42个属性。深度学习模型的构建与训练部分,分为两个阶段。深度学习模型的构建上,是基于alexnet卷积神经网络模型来微调的,微调的是全连接层部分,设置相关的参数,从而得到改进的alexnet网络模型。行人属性学习,将训练样本输入到改进的alexnet网络模型当中,提取行人属性特征。为每一个属性设计一个分类器。将提取的属性特征输入到每一个分类器中,对属性进行学习。在行人属性类别映射关系学习部分,首先通过训练样本计算出每个属性样本占属性类别的比例,从而得到属性类别映射关系图。在样本测试部分,将属性特征输入到训练好的属性分类器中,得到的行人样本属于该属性的后验概率,然后根据该后验概率和属性类别映射表,推断出行人图像类别的后验概率,选取最大的概率对应的类别作为样本的识别类别。

本发明的基本思路是:首先得到行人样本与行人属性之间的映射关系,然后结合通过计算得出的行人属性与属性类别之间的比例关系,从而可以推出行人样本与行人属性类别之间的关系。

下面通过一个具体实施例,进一步阐述本发明。

如图1所示,本发明所述的一种基于深度学习的行人属性精细化识别方法,包括如下的步骤:

(1)对行人样本数据集进行属性标注,得到行人属性数据集的步骤中,通过图片标注工具,对行人图片标注能代表行人的42个属性。这些属性包括性别(男,女),头发长度(长发,短发),上身衣着类型(t恤,衬衫,外套,羽绒服),上身衣着颜色(黑,白,红,黄,蓝,绿,紫,棕,灰,橙,多色),下身衣着类型(长裤,短裤,长裙,短裙),下身衣着颜色(黑,白,红,黄,蓝,绿,紫,棕,灰,橙,多色),包类型(单肩包,双肩包,手拉箱,钱包),鞋类型(皮鞋,运动鞋,凉鞋,靴子)。

(2)深度学习模型的构建与训练。深度学习模型框架是基于alexnet网络模型的微调改进的。alexnet模型的五层卷积层和前两层全连接层的结构参数保持不变,微调的是最后的全连接层的部分。根据标注的属性类别数目,修改输出的节点。将训练样本输入到构建好的卷积神经网络中,并通过对反卷积方法,利用逐层最小化重建误差法,调整网络的权重。其中改进的alexnet网络的结构如下:

第一层是卷积层,特征平面96个,卷积核大小11x11;

第二层是卷积层,特征平面256个,卷积核大小5x5;

第三层是卷积层,特征平面384个,卷积核大小3x3;

第四层是卷积层,特征平面是384个,卷积核大小3x3;

第五层是卷积层,特征平面是256个,卷积核大小3x3;

第六层是全连接层,保持不变;

第七层是全连接层,保持不变;

第八层是全连接层,在这一层根据行人属性的数目,修改输出的节点;

上述改进的alexnet网络模型的训练步骤如下:

1)对每一层的输出进行反卷积,将该层的输入与反卷积输出的结果进行比较,得到误差e

2)通过梯度下降法不断调整模型的卷积核的权值大小,公式为:式中w*为更新的权值,w为原来的权值,η为设置的学习率,表示误差对权值的偏导。

3)对训练样本进行20000迭代训练。训练完毕后,可以得到一个卷积神经网络模型;

(3)行人样本输入到第二步训练好的深度学习模型中,经过一系列的卷积操作,得到行人属性特征。其具体步骤为:

将行人测试样本输入到改进的alexnet网络模型;

1)行人图像特征经过第一层卷积层,通过11x11的卷积核的卷积操作,输出96个特征图;

2)行人图像特征经过第二层卷积层,通过5x5的卷积核的卷积操作,输出256个特征图;

3)行人图像特征经过第三层卷积层,通过3x3的卷积核的卷积操作,输出384个特征图;

4)行人图像特征经过第四层卷积层,通过3x3的卷积核的卷积操作,输出384个特征图;

5)行人图像特征经过第五层卷积层,通过3x3的卷积核的卷积操作,输出256个特征图;

6)经过三层全连接层,输出行人测试图像的特征。

(4)为每一个属性设计一个分类器,然后将第三步输出的行人测试图像的特征,输入到分类器中训练学习。分类器采用的是线性支持向量机。对拥有属性xi的样本标记为正样本,反之标记为负样本。同样将第三步提取到的正反特征输入到每一个独立的线性支持向量机中进行训练,得到每一个属性分类器。其中支持向量机选用径向基函数其中,x和x'分别表示两个样本,采用最小最大优化方法确定径向基参数σ值为3.35,可以让各个属性分类器平均识别精度达到94%以上。

(5)行人训练样本数据,通过行人属性数据集计算出属性xi的样本属于类别yj的比例,即表示的是拥有属性xi且属于类别yj的样本数量,表示的是拥有属性xi的样本数量,计算出每个属性相应的属性类别的数量关系。

(6)对行人测试样本进行测试,具体步骤如下:

1)行人测试样本zt输入到改进的alexnet网络,得到提取的特征;

2)然后将特征输入到属性分类器中,得到具有属性xi的后验概率p(xi|zt);

3)通过第五步得出来的属性类别数量关系,可以利用贝叶斯公式计算出行人样本具有类别yj的后验概率,其中,n行人属性的数量;

4)上一步计算出的最大的概率对应的类别就是行人样本对应的属性类别。

本发明通过改进深度学习模型框架,自动学习到行人属性特征,然后将属性特征输入到分类器中,训练一个个独立的行人属性分类器,这样可以得到行人样本具有属性的后验概率,然后通过计算行人训练样本中的属性与属性类别的比例关系,得到属性类别的后验概率,最后根据贝叶斯公式就可以得到行人样本的属性类别。本发明采用了深度学习技术,与传统行人属性识别算法相比,可以自动学习到较好的特征,避免了传统的人工设计特征提取的复杂。由于采取卷积神经网络提取特征,可以提取到更高层的语义信息,并且受光照、视角等不可控因素的影响较小,因此属性识别效果更具鲁棒性,识别精度也更高。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1