一种行人衣着颜色识别方法、电子设备及存储介质与流程

文档序号:14176605阅读:353来源:国知局
一种行人衣着颜色识别方法、电子设备及存储介质与流程

本发明涉及图像和颜色识别领域,尤其涉及一种行人衣着颜色识别方法、电子设备及存储介质。



背景技术:

颜色识别是一个传统的课题,基于颜色识别也催生出了许多重要应用,许多传统的颜色特征如rgb或hsv颜色直方图特征被广泛地应用在各行各业;比如车辆颜色的识别,传统的车牌识别中依靠颜色特征作为辅助条件进行车牌定位;在一些工业领域依靠颜色的识别来区分物体,比如彩色铅笔生产线的分拣系统,运用颜色特征进行不同颜色铅笔的分拣,一些背景简单的物体识别也有不少运用了颜色识别的方法;颜色识别在安防领域中也有着重要的应用,准确的颜色识别,大大提升找人效率,行人衣着颜色识别旨在识别视频或图像中行人的衣服和裤子颜色。

目前有很多行人衣着颜色识别是利用传统颜色特征表述,通过提取样本的颜色特征,再训练一个分类器的方式来实现,比如利用hsv空间颜色直方图统计的方法分别对行人的上衣和裤子进行识别:首先在rgb三个通道中运用sobel算子计算水平和垂直梯度投影从而得到上下半身的分割线,再通过人为限定分割线的位置区间来确定分割线,将hsv颜色空间划分为8个颜色区域,将图像颜色空间从rgb转换到hsv之后统计落在8个颜色区域的像素个数,从而得到衣着颜色。比如采用peta数据集:数据集中包含了各种行人属性,其中包括了上半身和下半身颜色属性,利用svm和马尔科夫随机场的方法识别行人属性,或者利用开源数据集peta进行网络训练和测试。两种方法都是利用了标注的上下半身颜色标注数据训练分类器,利用训练后的分类器进行属性识别。

传统的行人衣着颜色识别方法利用传统颜色直方图统计特征进行颜色识别,方法简单,应用广泛,在应用场景简单、背景单一、光照影响小的时候识别效果比较好,但是在场景复杂、光照影响较大的情况下识别效果很差。在监控场景中,复杂背景、遮挡、光线等问题的影响非常严重,这样的情况下直接使用传统颜色直方图等方法提取特征干扰较大,得到特征之后识别效果很差。



技术实现要素:

为了克服现有技术的不足,本发明的目的之一在于提供一种行人衣着颜色识别方法,以解决现有行人衣着颜色识别中识别效果差的问题。

本发明的目的之二在于提供一种电子设备,以解决现有行人衣着颜色识别中识别效果差的问题。

本发明的目的之一采用如下技术方案实现:

一种行人衣着颜色识别方法,包括:

获取原始行人图片;

采用背景分割模型对所述原始行人图片进行区域分割,其中,所述背景分割模型的训练基于深度神经网络;

根据所述区域分割的结果得到分割图片,所述分割图片包括上半身分割图片和下半身分割图片;

识别所述分割图片中的行人衣着颜色。

进一步地,所述采用背景分割模型对所述原始行人图片进行区域分割包括:

对所述原始图片进行卷积计算和归一化处理以提取原始图片特征;

将经过归一化的原始图片特征转换为背景分割特征;

根据所述背景分割特征得到区域分割信息。

进一步地,所述识别所述分割图片中的行人衣着颜色包括:

对所述分割图片进行卷积计算以提取分割图片特征;

对所述分割图片特征进行非线性变换;

对经过非线性变换的分割图片特征进行降维处理;

对经过降维处理的分割图片特征进行线性变换以得到颜色识别特征;

根据所述颜色识别特征识别出分割图片中的行人衣着颜色。

进一步地,所述根据所述颜色识别特征识别出分割图片中的行人衣着颜色包括:

判断所述分割图片中的行人衣着颜色是否为纯色;

若所述分割图片中的行人衣着颜色是为纯色,则识别出所述纯色的颜色类别。

进一步地,所述根据所述区域分割的结果得到分割图片包括:

根据所述区域分割的结果得到上半身轮廓和下半身轮廓;

根据所述上半身轮廓和所述下半身轮廓分别提取上半身分割图片和所述下半身分割图片。

进一步地,所述根据所述上半身轮廓和所述下半身轮廓分别提取上半身分割图片和所述下半身分割图片包括:

根据所述上半身轮廓和所述下半身轮廓计算上半身轮廓坐标和下半身轮廓坐标;

根据所述上半身轮廓坐标和所述下半身轮廓坐标分别提取所述上半身轮廓的外接矩形和所述下半身轮廓的外接矩形。

本发明的目的之二采用如下技术方案实现:

一种电子设备,包括:处理器;

存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行:

获取原始行人图片;

采用背景分割模型对所述原始行人图片进行区域分割,其中,所述背景分割模型的训练基于深度神经网络;

根据所述区域分割的结果得到分割图片,所述分割图片包括上半身分割图片和下半身分割图片;

识别所述分割图片中的行人衣着颜色。

进一步地,所述程序还用于执行:

对所述原始图片进行卷积计算和归一化处理以提取原始图片特征;

将经过归一化的原始图片特征转换为背景分割特征;

根据所述背景分割特征得到区域分割信息。

进一步地,所述程序还用于执行:

对所述分割图片进行卷积计算以提取分割图片特征;

对所述分割图片特征进行非线性变换;

对经过非线性变换的分割图片特征进行降维处理;

对经过降维处理的分割图片特征进行线性变换以得到颜色识别特征;

根据所述颜色识别特征识别出分割图片中的行人衣着颜色。

本发明还涉及一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行上述的方法。

相比现有技术,本发明的有益效果在于:对原始行人图片进行区域分割,根据区域分割的结果得到上半身分割图片和下半身分割图片,减少背景干扰;对上半身分割图片和下半身分割图片分别进行颜色识别,改善颜色识别效果。

附图说明

图1为本发明实施例提供的行人衣着颜色识别方法流程图;

图2为本发明实施例提供的电子设备的示意图。

具体实施方式

下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。

如图1所示,本发明实施例提供的行人衣着颜色识别方法,包括:

步骤s101:获取原始行人图片。

具体的,从视频中获取待识别的原始行人图片。

步骤s102:采用背景分割模型对所述原始行人图片进行区域分割,其中,所述背景分割模型的训练基于深度神经网络。

本发明实施例采用的背景分割模型的训练基于深度神经网络,训练背景分割模型的样本数据为行人图片,对待训练的行人图片分别标注上半身、下半身、背包、鞋子等像素区域,不同的像素区域使用不同的颜色进行标识,通过将行人的上半身,下半身,装备,鞋子,全身等作为单独的通道进行学习。例如:对上半身进行学习的时候,上半身的区域标签为1,其它区域均为0,深度神经网络对上半身通道只分割上半身区域,同理,对其它通道只学习分割对应区域。该深度神经网络结构包括卷积层、池化层、批归一化层、特征转换层以及反卷积层,其中卷积层对图片做卷积操作,提取图片特征;池化层对卷积得到的图片特征进行降维,批归一化层对图片特征进行归一化,从而简化了训练,加快了模型收敛;特征转换层将普通的全图特征经过映射运算转换成背景分割需要的特征,训练深度神经网络,得到背景分割模型。

该步骤包括:

步骤s1021:对所述原始图片进行卷积计算和归一化处理以提取原始图片特征;

具体的,将原始图片输入背景分割模型,卷积层对原始图片进行卷积计算以提取原始图片特征,池化层对原始图片特征进行降维处理,提取出原始图片特征的主要特征,每一个卷积层后面均有批归一化层,批归一化层对原始图片的主要特征进行归一化,以简化计算过程。

步骤s1022:将经过归一化的原始图片特征转换为背景分割特征。

具体的,将经过归一化的主要特征经过映射运算得到背景分割特征。

步骤s1023:根据所述背景分割特征得到区域分割信息。

具体的,根据背景分割特征对应的区域标签信息,确认区域分割信息,识别出原始图片中行人上半身、下半身、装备、鞋子等区域。

步骤s103:根据所述区域分割的结果得到分割图片,所述分割图片包括上半身分割图片和下半身分割图片。

该步骤包括:

步骤s1031:根据所述区域分割的结果得到上半身轮廓和下半身轮廓。

具体的,原始图片经过背景分割模型处理后,从得到的区域分割信息中得到原始图片中待识别颜色的上半身轮廓和下半身轮廓。也可以根据颜色识别要求识别出行人的装备轮廓或鞋子轮廓,本实施例中仅以识别上半身颜色和下半身颜色的问题进行说明。

步骤s1032:根据所述上半身轮廓和所述下半身轮廓分别提取上半身分割图片和所述下半身分割图片。

具体的,根据上半身轮廓和下半身轮廓计算上半身轮廓坐标和下半身轮廓坐标;确认上半身轮廓的最外侧坐标和下半身轮廓的最外侧坐标,分别提取上半身轮廓的外接矩形和下半身轮廓的外接矩形,输出有背景的图片。相对于黑色像素填充的图片,使用有背景的图片识别颜色效果更好。

步骤s104:识别所述分割图片中的行人衣着颜色。

其中,本发明实施例的分割图片中的颜色识别是基于深度神经网络的颜色识别模型,训练颜色识别模型的样本数据为经过区域分割的图片,颜色任务总共包括了12种颜色,分别是红、橙、黄、绿、青、蓝、紫、粉、灰、黑、白、棕,为了避免扩展性差的问题,将上半身和下半身相同的颜色数据作为相同类别训练颜色识别模型。该神经网络模型的结构由数据输入层,卷积层,批规范化层,非线性层,池化层,全连接层组成,最后加上softmax进行分类,输入数据输入层的为经过区域分割的图片,该层可以对图片进行预处理操作,比如镜像,随机剪裁等操作,从而增加训练样本数量。卷积层的数量为多个,将经过输入层处理过的区域分割图片输入第一个卷积层,提取出图像特征;后面的卷积层继续提取图片特征,所有卷积层的输出都带了批规范化层,批规范化层对卷积层输出的图片特征进行归一化,从而优化了训练,加快收敛速度。非线性层通过非线性函数,对经过卷积和归一化处理的图片特征进行非线性变换,使得其输出的特征有较强的表达能力。池化层对经过非线性变换的图片特征进行多对一的映射操作,进一步强化特征的非线性,经过池化层处理还可以减小输出特征的大小,从而降低网络参数。全连接层是对输入的图片特征做线性变换,将学习的特征映射到颜色识别需要的特征。最后经过多个softmax损耗层,计算预测类别和标签类别的误差,训练出颜色识别模型。

具体的,该步骤包括:

步骤s1041:对所述分割图片进行卷积计算以提取分割图片特征。

具体的,将分割图片输入颜色识别模型,首先通过卷积层的卷积计算和批规范化层的归一化处理,提取出分割图片特征。

步骤s1042:对所述分割图片特征进行非线性变换。

具体的,非线性变换层对分割图片特征进行非线性函数运算,使得其输出的图片特征有较强的表达能力。

步骤s1043:对经过非线性变换的分割图片特征进行降维处理。

具体的,池化层对经过非线性变化的图片特征进行多对一的映射操作,进一步强化分割图片特征的非线性,减小输出特征的大小,从而降低网络参数。

步骤s1044:对经过降维处理的分割图片特征进行线性变换以得到颜色识别特征。

具体的,全连接层对经过池化层处理的分割图片特征进行线性变换,将分割图片特征映射到颜色识别需要的特征。

步骤s1045:根据所述颜色识别特征识别出分割图片中的行人衣着颜色。

具体的,根据颜色识别特征对应的颜色确认分割图片中的行人衣着颜色。

作为优选的实施方式,将多色作为颜色的一个分支,在颜色识别模型训练过程中,先得到纯色、多色识别模型,再在纯色、多色识别模型上增加纯色模型分支。颜色识别过程中,颜色识别模型先判断分割图片中的行人衣着颜色是否为纯色;若识别出为行人衣着颜色为多色,则输出多色识别结果,不再对多色进行细分,从而减少对多色的误识别概率;若分割图片中的行人衣着颜色是为纯色,则识别出纯色的颜色类别。

本发明提供的行人衣着颜色识别方法基于深度神经网络对原始行人图片进行区域分割,根据区域分割的结果得到上半身分割图片和下半身分割图片,减少背景干扰;基于深度神经网络对上半身分割图片和下半身分割图片分别进行颜色识别,改善颜色识别效果。

如图2所示,本发明实施例提供的电子设备,包括:处理器11、存储器12以及程序,其中程序被存储在存储器12中,并且被配置成由处理器11执行,程序包括用于执行:

获取原始行人图片;

采用背景分割模型对所述原始行人图片进行区域分割,其中,所述背景分割模型的训练基于深度神经网络;

根据所述区域分割的结果得到分割图片,所述分割图片包括上半身分割图片和下半身分割图片;

识别所述分割图片中的行人衣着颜色。

进一步地,所述程序还用于执行:

对所述原始图片进行卷积计算和归一化处理以提取原始图片特征;

将经过归一化的原始图片特征转换为背景分割特征;

根据所述背景分割特征得到区域分割信息。

进一步地,所述程序还用于执行:

对所述分割图片进行预处理和卷积计算以得到分割图片特征;

对所述分割图片特征进行非线性变换;

对经过非线性变换的分割图片特征进行降维处理;

对经过降维处理的分割图片特征进行线性变换以得到颜色识别特征;

根据所述颜色识别特征识别出分割图片中的行人衣着颜色。

本实施例中的电子设备与前述实施例中的方法是基于同一发明构思下的两个方面,在前面已经对方法实施过程作了详细的描述,所以本领域技术人员可根据前述描述清楚地了解本实施例中的电子设备的实施过程,为了说明书的简洁,在此就不再赘述。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来。本发明还涉及一种计算机可读存储介质,如rom/ram、磁碟、光盘等,其上存储有计算机程序,计算机程序被处理器执行上述的方法。

本发明提供的行人衣着颜色识别方法、电子设备及存储介质对原始行人图片进行区域分割,根据区域分割的结果得到上半身分割图片和下半身分割图片,减少背景干扰;对上半身分割图片和下半身分割图片分别进行颜色识别,改善颜色识别效果。

上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1