行人重识别的处理方法、装置、计算机设备和存储介质与流程

文档序号:20841276发布日期:2020-05-22 17:32阅读:108来源:国知局
行人重识别的处理方法、装置、计算机设备和存储介质与流程

本申请涉及行人重识别技术领域,特别是涉及一种行人重识别的处理方法、装置、计算机设备和存储介质。



背景技术:

行人重识别(personre-identification)也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,广泛应用于智能视频监控、智能安保等领域。

目前,行人重识别已经对物体的外表颜色、外观等明显特征等有着较高的判别能力。但是,如果图像中行人被部分遮挡,那么可用于识别的图像区域就缩小了,增加了行人重识别的难度。例如,一个图像中行人骑非机动车,由于非机动车遮挡了行人的部分特征,则很难根据该图像查找出包含同一行人的其他图像。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够在目标对象被遮挡时降低识别难度的行人重识别的处理方法、装置、计算机设备和存储介质。

第一方面,本发明实施例提供了一种行人重识别的处理方法,该方法包括:

将待进行重识别的识别图像输入至预先训练的预测神经网络中,得到预测神经网络输出的识别图像的多个子特征,以及与识别图像的每个子特征对应的可见性置信度;其中,识别图像包含目标对象,识别图像的多个子特征对应目标对象的多个部分区域,目标对象的多个部分区域组成目标对象;可见性置信度用于指示识别图像的每个子特征对应的目标对象的部分区域未被遮挡的概率;

根据识别图像的多个子特征和与识别图像的每个子特征对应的可见性置信度,确定识别图像的特征;

根据识别图像的特征在预先设置的图像数据库中搜索出包含目标对象的目标图像。

在其中一个实施例中,在上述将待进行重识别的识别图像输入至预先训练的预测神经网络中之前,该方法还包括:

获取训练样本集;训练样本集中包括多个训练样本和各训练样本的可见性标注;训练样本包含训练对象,训练样本的多个子特征对应训练对象的多个部分区域,训练对象的多个部分区域组成训练对象,可见性标注用于指示训练样本的每个子特征对应训练对象的部分区域的可见性;

基于训练样本集进行神经网络的训练,得到预测神经网络。

在其中一个实施例中,上述获取训练样本集,包括:

获取多个训练样本;

根据像素值对各训练样本中的每个子特征进行标注,得到各训练样本的可见性标注。

在其中一个实施例中,上述根据像素值对各训练样本中的每个子特征进行标注,得到各训练样本的可见性标注,包括:

计算训练样本的平均像素值;

若训练样本的子特征对应的训练对象的部分区域的平均像素值大于训练样本的平均像素值,则将训练样本的子特征标注为可见;

若训练样本的子特征对应的训练对象的部分区域的平均像素值小于或等于训练样本的平均像素值,则将训练样本的子特征标注为不可见。

在其中一个实施例中,上述基于训练样本集进行神经网络的训练,得到预测神经网络,包括:

通过神经网络对训练样本进行特征提取,得到训练样本的特征,并将训练样本的特征分割成多个子特征;

对训练样本的子特征采用权值不共享的卷积层进行卷积,并通过全局平均池化层和一个全连接层获得训练样本的每个子特征对应的一维特征向量;

根据激活函数和训练样本的每个子特征对应的一维特征向量,得到训练样本的每个子特征对应的可见性置信度;

根据训练样本的可见性标注和训练样本的每个子特征对应的可见性置信度进行神经网络的训练,得到预测神经网络。

在其中一个实施例中,上述根据识别图像的多个子特征和与识别图像的每个子特征对应的可见性置信度,确定识别图像的特征,包括:

将识别图像的多个子特征与识别图像的每个子特征对应的可见性置信度进行加权计算,得到多个中间特征;

对多个中间特征进行求和计算,得到识别图像的特征。

在其中一个实施例中,上述根据识别图像的目标特征在预先设置的图像数据库中搜索出包含目标对象的目标图像,包括:

将图像数据库中的各候选图像进行特征提取,得到各候选图像的特征;

从各候选图像的特征中,查找出与识别图像的特征匹配的目标特征;

将目标特征对应的候选图像确定为目标图像。

在其中一个实施例中,识别图像的特征为行人的全身特征;识别图像的多个子特征包括行人的上半身特征和下半身特征。

第二方面,本发明实施例提供了一种行人重识别的处理装置,装置包括:

可见性预测模块,用于将待进行重识别的识别图像输入至预先训练的预测神经网络中,得到预测神经网络输出的识别图像的多个子特征,以及与识别图像的每个子特征对应的可见性置信度;其中,识别图像包含目标对象,识别图像的多个子特征对应目标对象的多个部分区域,目标对象的多个部分区域组成目标对象;可见性置信度用于指示识别图像的每个子特征对应的目标对象的部分区域未被遮挡的概率;

识别图像特征确定模块,用于根据识别图像的多个子特征和与识别图像的每个子特征对应的可见性置信度,确定识别图像的特征;

目标图像搜索模块,用于根据识别图像的特征在预先设置的图像数据库中搜索出包含目标对象的目标图像。

在其中一个实施例中,该装置还包括:

训练样本集获取模块,用于获取训练样本集;训练样本集中包括多个训练样本和各训练样本的可见性标注;训练样本包含训练对象,训练样本的多个子特征对应训练对象的多个部分区域,训练对象的多个部分区域组成训练对象,可见性标注用于指示训练样本的每个子特征对应训练对象的部分区域的可见性;

训练模块,用于基于训练样本集进行神经网络的训练,得到预测神经网络。

在其中一个实施例中,上述训练样本集获取模块,包括:

训练样本获取子模块,用于获取多个训练样本;

可见性标注获取子模块,用于根据像素值对各训练样本中的每个子特征进行标注,得到各训练样本的可见性标注。

在其中一个实施例中,上述可见性标注获取子模块,具体用于计算训练样本的平均像素值;若训练样本的子特征对应的训练对象的部分区域的平均像素值大于训练样本的平均像素值,则将训练样本的子特征标注为可见;若训练样本的子特征对应的训练对象的部分区域的平均像素值小于或等于训练样本的平均像素值,则将训练样本的子特征标注为不可见。

在其中一个实施例中,上述训练模块,具体用于通过神经网络对训练样本进行特征提取,得到训练样本的特征,并将训练样本的特征分割成多个子特征;对训练样本的子特征采用权值不共享的卷积层进行卷积,并通过全局平均池化和一个全连接层获得训练样本的每个子特征对应的一维特征向量;根据激活函数和训练样本的每个子特征对应的一维特征向量,得到训练样本的每个子特征对应的可见性置信度;根据训练样本的可见性标注和训练样本的每个子特征对应的可见性置信度进行神经网络的训练,得到预测神经网络。

在其中一个实施例中,识别图像特征确定模块,具体用于将识别图像的多个子特征与识别图像的每个子特征对应的可见性置信度进行加权计算,得到多个中间特征;对多个中间特征进行求和计算,得到识别图像的特征。

在其中一个实施例中,目标图像搜索模块,具体用于将图像数据库中的各候选图像进行特征提取,得到各候选图像的特征;从各候选图像的特征中,查找出与识别图像的特征匹配的目标特征;将目标特征对应的候选图像确定为目标图像。

在其中一个实施例中,识别图像的特征为行人的全身特征;识别图像的多个子特征包括行人的上半身特征和下半身特征。

第三方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现如上述方法中的步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述方法中的步骤。

上述行人重识别的处理方法、装置、计算机设备和存储介质,将待进行重识别的识别图像输入至预先训练的预测神经网络中,得到预测神经网络输出的识别图像的多个子特征,以及与识别图像的每个子特征对应的可见性置信度;根据识别图像的多个子特征和与识别图像的每个子特征对应的可见性置信度,确定识别图像的特征;根据识别图像的特征在预先设置的图像数据库中搜索出包含目标对象的目标图像。通过本发明实施例,预测神经网络对包含目标对象的识别图像进行特征提取,并对提取到的特征进行分割,然后对分割出的多个子特征进行可见性预测得到各子特征对应的目标对象的部分区域未被遮挡的概率,接着根据各子特征对应的目标对象的部分区域未被遮挡的概率确定识别图像的特征,最后根据识别图像的特征进行图像搜索。由于未被遮挡的子特征的可见性置信度较高,即在得到的识别图像的特征中,未被遮挡的部分区域对应的子特征占比较高,因此在后续进行图像搜索时,主要依据未被遮挡的部分区域对应的子特征进行搜索;但是,搜索时也考虑被遮挡的部分区域的子特征,因此提高了图像搜索的准确性,降低了图像搜索的难度。

附图说明

图1为一个实施例中行人重识别的处理方法的应用环境图;

图2为一个实施例中行人重识别的处理方法的流程示意图;

图3为一个实施例中训练预测神经网络步骤的流程示意图;

图4为另一个实施例中行人重识别的处理方法的流程示意图;

图5为一个实施例中行人重识别的处理装置的结构框图;

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的行人重识别的处理方法,可以应用于如图1所示的应用环境中。该应用环境包括终端102和服务器104,终端102通过网络与服务器104通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种行人重识别的处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

步骤201,将待进行重识别的识别图像输入至预先训练的预测神经网络中,得到预测神经网络输出的识别图像的多个子特征,以及与识别图像的每个子特征对应的可见性置信度。

本实施例中,识别图像包含目标对象,多个识别图像的子特征对应目标对象的多个部分区域;目标对象的多个部分区域组成目标对象;可见性置信度用于指示每个识别图像的子特征包含的目标对象的部分区域未被遮挡的概率。具体地,预先训练预测神经网络,将待进行重识别的识别图像输入到预测神经网络中。预测神经网络在接收到识别图像之后,对识别图像进行特征提取,并将提取到的特征分割为多个子特征,再分别对每个子特征对应的目标对象的部分区域是否被遮挡进行预测,得到每个子特征对应的可见性置信度。

例如,识别图像中包含的目标对象可以是行人、车辆等。本实施例以行人为例进行说明,则识别图像的每个子特征可以对应行人的部分区域,比如,识别图像的子特征对应行人的上半身或者下半身,或者是对应头部、胳膊、身体、腿部等。预测神经网络对识别图像进行特征提取后,将提取到的特征a分割为子特征b1和b2后,对子特征b1进行预测并输出可见性置信度为0.92,对子特征b2进行预测并输出可见性置信度为0.15。也就是说,子特征b1对应的目标对象的部分区域x1未被遮挡的概率为92%,子特征b2对应的目标对象的部分区域x2未被遮挡的概率为15%,即识别图像的子特征b1对应的目标对象的部分区域未被遮挡,识别图像的子特征b2对应的目标对象的部分区域被遮挡。

步骤202,根据识别图像的多个子特征和识别图像的每个子特征对应的可见性置信度,确定识别图像的特征。

本实施例中,根据识别图像的多个子特征以及各子特征对应的可见性置信度,可以计算出识别图像的特征。在其中一个实施例中,确定识别图像的特征具体可以包括如下步骤:将识别图像的每个子特征与其对应的可见性置信度进行加权计算,得到多个中间特征;对多个中间特征进行求和计算,得到识别图像的特征。

例如,将识别图像的子特征b1与可见性置信度0.92相乘得到中间特征b1,将识别图像的子特征b2与可见性置信度0.15相乘得到中间特征b2,最后将两个中间特征b1和b2相加得到识别图像的特征a。

可以理解地,未被遮挡的子特征的可见性置信度较高,被遮挡的子特征的可见性置信度较低,因此,在识别图像的特征中,未被遮挡的部分区域的子特征占比较高,在后续进行图像搜索时,主要依据未被遮挡的部分区域的子特征进行搜索,但同时也考虑到被遮挡的部分区域的子特征,而不是将被遮挡的部分区域的子特征裁剪掉减少识别图像的特征,因此提高了图像搜索的准确性。

步骤203,根据识别图像的特征在预先设置的图像数据库中搜索出包含目标对象的目标图像。

本实施例中,预先设置图像数据库,图像数据库中存储有大量的候选图像,对待搜索的候选图像进行特征提取,得到各候选图像的特征。其中,各候选图像的特征与识别图像的特征的维度相同。此时,将识别图像的特征与各候选图像的特征进行比较,当其中一个候选图像的特征与识别图像的特征匹配时,将该候选图像确定为目标图像。即目标图像与识别图像包含同一目标对象。

例如,对待搜索的候选图像c1、c2……c100进行特征提取,得到候选图像的特征c1、c2……c100;将识别图像的特征a与候选图像的特征c1、c2……c100一一进行比较。其中,候选图像的特征c15与识别图像的特征a的相似度大于预设相似度,则候选图像c15确定为目标图像。本发明对预设相似度的不作详细限定,可以根据实际情况进行设置。

上述行人重识别的处理方法中,预测神经网络对包含目标对象的识别图像进行特征提取并分割,对分割出的多个子特征进行可见性预测得到各子特征未被遮挡的概率,接着根据各子特征未被遮挡的概率确定识别图像的特征,根据识别图像的特征进行图像搜索。通过本发明实施例,识别图像的特征中未被遮挡的子特征的可见性置信度较高,即在得到的识别图像的特征中,未被遮挡的部分区域对应的子特征的占比较高,因此在后续进行图像搜索时,主要依据未被遮挡的部分区域对应的子特征进行搜索;但是,搜索时也考虑被遮挡的部分区域的子特征,因此提高了图像搜索的准确性,降低了图像搜索的难度。

在一个实施例中,识别图像的特征为行人的全身特征;识别图像的多个子特征包括行人的上半身特征和下半身特征。

例如,识别图像包含的目标对象为骑车的行人,预测神经网络对识别图像进行特征提取后,将提取到的特征平均分割为上下两个子特征,其中,上面的子特征对应行人的上半身特征,下面的子特征对应行人的下半身特征。针对识别图像,预测神经网络可以得到行人的上半身特征对应的可见性置信度以及下半身特征对应的可见性置信度,进而根据行人的上半身特征和其对应的可见性置信度以及下半身特征和其对应的可见性置信度得到行人的全身特征。由于行人的上半身未被车辆遮挡,因此行人的上半身特征对应的可见性置信度较高;而行人的下半身特征被车辆遮挡,因此行人的下半身特征对应的可见性置信度较低。在根据识别图像进行搜索时,主要依据行人的上半身特征进行搜索,但是也考虑行人的下半身特征,而不是将行人的下半身裁剪掉,因此可以提高图像搜索的准确性,降低图像搜索的难度。

在另一个实施例中,如图3所示,本实施例涉及的是训练预测神经网络的一种可选的过程。在上述图2所示实施例的基础上,上述步骤202具体可以包括以下步骤:

步骤301,获取训练样本集;训练样本集中包括多个训练样本和各训练样本的可见性标注;训练样本包含训练对象,训练样本的多个子特征对应训练对象的多个部分区域,训练对象的多个部分区域组成训练对象,可见性标注用于指示训练样本的每个子特征对应训练对象的部分区域的可见性。

本实施例中,步骤301包括:获取多个训练样本;根据像素值对各训练样本中的每个子特征进行标注,得到各训练样本的可见性标注。由于训练样本的像素值的大小反映了目标对象的部分区域的状态,因此可以根据像素值对训练样本中的每个子特征进行可见性标注。其中,训练对象可以是训练样本中包含的行人,训练样本的多个子特征可以包括行人的上半身特征和下半身特征。

在其中一个实施例中,根据像素值对各训练样本中的每个子特征进行标注,得到各训练样本的可见性标注,包括:计算训练样本的平均像素值;若训练样本的子特征对应的训练对象的部分区域的平均像素值大于训练样本的平均像素值,则将训练样本的子特征标注为可见;若训练样本的子特征对应训练对象的部分区域的平均像素值小于或等于训练样本的平均像素值,则将训练样本的子特征标注为不可见。

例如,获取到训练样本m中各像素的像素值,然后计算出平均像素值为150,如果训练样本的子特征对应训练对象的部分区域的平均像素值大于平均像素值150,则将训练样本的子特征标注为可见;如果训练样本的子特征对应训练对象的部分区域的平均像素值小于平均像素值150,则将训练样本的子特征标注为不可见。

步骤302,基于训练样本集进行神经网络的训练,得到预测神经网络。

本实施例中,在获取到训练样本集后,根据训练样本集中的多个训练样本和各训练样本的可见性标注进行神经网络的训练,得到预测神经网络。

在其中一个实施例中,训练过程具体可以包括如下步骤:通过神经网络对训练样本进行特征提取,得到训练样本的特征,并将训练样本的特征分割成多个子特征;对训练样本的子特征采用权值不共享的卷积层进行卷积,并通过全局平均池化层和一个全连接层获得训练样本的每个子特征对应的一维特征向量;根据激活函数和训练样本的每个子特征对应的一维特征向量,得到训练样本的每个子特征对应的可见性置信度;根据训练样本的可见性标注和训练样本的每个子特征对应的可见性置信度进行神经网络的训练,得到预测神经网络。

例如,将训练样本m输入到神经网络中,神经网络对训练样本m进行特征提取,将提取到的特征分割为上下两个子特征n1和n2。接着,神经网络对子特征n1和子特征n2采用权值不共享的卷积层进行卷积处理。然后,通过全局平均池化层和全连接层对子特征n1和n2进行降维,得到一维特征向量。最后,通过激活函数得到训练样本的子特征n1对应的可见性置信度和训练样本的子特征n2对应的可见性置信度。通过损失函数计算神经网络输出的训练样本的子特征的可见性置信度与可见性标注之间的差值;根据差值对神经网络进行优化。当损失函数趋于收敛时,训练结束,得到本发明实施例所采用的预测神经网络。

上述训练预测神经网络的步骤中,获取训练样本集;基于训练样本集进行神经网络的训练,得到预测神经网络。通过本发明实施例训练出的预测神经网络,可以对一个完整图像中的多个部分进行可见性预测,从而输出各部分未被遮挡的概率,进而可以应用到图像检索中,避免完整图像中被遮挡的部分被裁减掉,较难进行行人重识别的问题。

在另一个实施例中,如图4所示,本实施例涉及的是图像搜索的一种可选的过程。在上述图2所示实施例的基础上,具体可以包括以下步骤:

步骤401,对原始图像进行裁剪,得到包括目标对象的识别图像。

本实施例中,如果待搜索的原始图像中目标对象不在图像中心,可以对原始图像进行裁剪得到识别图像,使目标对象位于识别图像的中心。

例如,原始图像d中人像x位于图像下半部分,则对原始图像的进行裁剪得到识别图像a,使人像x位于识别图像a的中心。

步骤402,获取多个训练样本;根据像素值对各训练样本中的每个子特征进行标注,得到各训练样本的可见性标注;训练样本包含训练对象,训练样本的多个子特征对应训练对象的多个部分区域,训练对象的多个部分区域组成训练对象,可见性标注用于指示训练样本的每个子特征对应训练对象的部分区域的可见性。

在其中一个实施例中,计算训练样本的平均像素值;若训练样本的子特征对应训练对象的部分区域的平均像素值大于训练样本的平均像素值,则将训练样本的子特征标注为可见;若训练样本的子特征对应训练对象的部分区域的平均像素值小于或等于训练样本的平均像素值,则将训练样本的子特征标注为不可见。

步骤403,基于训练样本集进行神经网络的训练,得到预测神经网络。

在其中一个实施例中,通过神经网络对训练样本进行特征提取,得到训练样本的特征,并将训练样本的特征分割成多个子特征;对训练样本的子特征采用权值不共享的卷积层进行卷积,并通过全局平均池化和一个全连接层获得训练样本的每个子特征对应的一维特征向量;根据激活函数和训练样本的每个子特征对应的一维特征向量,得到训练样本的每个子特征对应的可见性置信度;根据训练样本的可见性标注和训练样本的每个子特征对应的可见性置信度进行神经网络的训练,得到预测神经网络。

步骤404,将待进行重识别的识别图像输入至预先训练的预测神经网络中,得到预测神经网络输出的识别图像的多个子特征,以及与识别图像的每个子特征对应的可见性置信度。

其中,识别图像包含目标对象,识别图像的每个子特征对应目标对象的部分区域;可见性置信度用于指示识别图像的每个子特征对应的目标对象的部分区域未被遮挡的概率。

步骤405,根据识别图像的多个子特征和与识别图像的每个子特征对应的可见性置信度,确定识别图像的特征。

在其中一个实施例中,识别图像的特征为行人的全身特征;识别图像的多个子特征包括行人的上半身特征和下半身特征。

步骤406,将图像数据库中的各候选图像进行特征提取,得到各候选图像的特征;从各候选图像的特征中,查找出与识别图像的特征匹配的目标特征;将目标特征对应的候选图像确定为目标图像。

本实施例中,对待搜索的候选特征进行特征提取,得到各候选图像的特征;然后,可以计算识别图像的特征与各候选图像的特征之间的差异值,当差异值小于预设差异值时,则查找到与识别图像的特征匹配的目标特征。

例如,分别计算识别图像的特征a与候选图像的特征c1、c2……c100之间的差异值。其中,识别图像的特征a与候选图像的特征c15之间的差异值小于预设差异值,确定候选图像的特征c15为目标特征,候选图像c15为目标图像。其中,目标图像c15与识别图像包含同一目标对象。本发明实施例对预设差异值不作详细限定,可以根据实际情况进行设置。

也可以计算两个特征之间的欧氏距离,当欧氏距离小于预设距离时,确定两个特征匹配。本发明实施例对匹配方式不作详细限定,可以根据实际情况进行设置。

上述行人重识别的处理方法中,对原始图像进行裁剪,得到包括目标对象的识别图像;将待进行重识别的识别图像输入至预先训练的预测神经网络中,得到预测神经网络输出的识别图像的多个子特征,以及与识别图像的每个子特征对应的可见性置信度;然后,根据识别图像的多个子特征和与识别图像的每个子特征对应的可见性置信度,确定识别图像的特征,从而根据识别图像的特征进行搜索得到目标图像。通过本发明实施例,在后续进行图像搜索时,主要依据未被遮挡的部分区域的子特征进行搜索;但是,搜索时也考虑被遮挡的部分区域的子特征,因此提高了图像搜索的准确性,降低了图像搜索的难度。

应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图5所示,提供了一种行人重识别的处理装置,包括:

可见性预测模块501,用于将待进行重识别的识别图像输入至预先训练的预测神经网络中,得到预测神经网络输出的识别图像的多个子特征,以及与识别图像的每个子特征对应的可见性置信度;其中,识别图像包含目标对象,识别图像的多个子特征对应目标对象的多个部分区域,目标对象的多个部分区域组成目标对象;可见性置信度用于指示识别图像的每个子特征对应的目标对象的部分区域未被遮挡的概率;

识别图像特征确定模块502,用于根据识别图像的多个子特征和与识别图像的每个子特征对应的可见性置信度,确定识别图像的特征;

目标图像搜索模块503,用于根据识别图像的特征在预先设置的图像数据库中搜索出包含目标对象的目标图像。

在其中一个实施例中,该装置还包括:

训练样本集获取模块,用于获取训练样本集;训练样本集中包括多个训练样本和各训练样本的可见性标注;训练样本包含训练对象,训练样本的多个子特征对应训练对象的多个部分区域,训练对象的多个部分区域组成训练对象,可见性标注用于指示训练样本的每个子特征对应训练对象的部分区域的可见性;

训练模块,用于基于训练样本集进行神经网络的训练,得到预测神经网络。

在其中一个实施例中,上述训练样本集获取模块,包括:

训练样本获取子模块,用于获取多个训练样本;

可见性标注获取子模块,用于根据像素值对各训练样本中的每个子特征进行标注,得到各训练样本的可见性标注。

在其中一个实施例中,上述可见性标注获取子模块,具体用于计算训练样本的平均像素值;若训练样本的子特征对应的训练对象的部分区域的平均像素值大于训练样本的平均像素值,则将训练样本的子特征标注为可见;若训练样本的子特征对应的训练对象的部分区域的平均像素值小于或等于训练样本的平均像素值,则将训练样本的子特征标注为不可见。

在其中一个实施例中,上述训练模块,具体用于通过神经网络对训练样本进行特征提取,得到训练样本的特征,并将训练样本的特征分割成多个子特征;对训练样本的子特征采用权值不共享的卷积层进行卷积,并通过全局平均池化层和一个全连接层获得训练样本的每个子特征对应的一维特征向量;根据激活函数和训练样本的每个子特征对应的一维特征向量,得到训练样本的每个子特征对应的可见性置信度;根据训练样本的可见性标注和训练样本的每个子特征对应的可见性置信度进行神经网络的训练,得到预测神经网络。

在其中一个实施例中,识别图像特征确定模块,具体用于将识别图像的多个子特征与识别图像的每个子特征对应的可见性置信度进行加权计算,得到多个中间特征;对多个中间特征进行求和计算,得到识别图像的特征。

在其中一个实施例中,目标图像搜索模块,具体用于将图像数据库中的各候选图像进行特征提取,得到各候选图像的特征;从各候选图像的特征中,查找出与识别图像的特征匹配的目标特征;将目标特征对应的候选图像确定为目标图像。

在其中一个实施例中,识别图像的特征为行人的全身特征;识别图像的多个子特征包括行人的上半身特征和下半身特征。

关于行人重识别的处理装置的具体限定可以参见上文中对于行人重识别的处理方法的限定,在此不再赘述。上述行人重识别的处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储行人重识别的处理数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种行人重识别的处理方法。

本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

将待进行重识别的识别图像输入至预先训练的预测神经网络中,得到预测神经网络输出的识别图像的多个子特征,以及与识别图像的每个子特征对应的可见性置信度;其中,识别图像包含目标对象,识别图像的多个子特征对应目标对象的多个部分区域,目标对象的多个部分区域组成目标对象;可见性置信度用于指示识别图像的每个子特征对应的目标对象的部分区域未被遮挡的概率;

根据识别图像的多个子特征和与识别图像的每个子特征对应的可见性置信度,确定识别图像的特征;

根据识别图像的特征在预先设置的图像数据库中搜索出包含目标对象的目标图像。

在一个实施例中,处理器执行计算机程序时实现以下步骤:

获取训练样本集;训练样本集中包括多个训练样本和各训练样本的可见性标注;训练样本包含训练对象,训练样本的多个子特征对应训练对象的多个部分区域,训练对象的多个部分区域组成训练对象,可见性标注用于指示训练样本的每个子特征对应训练对象的部分区域的可见性;

基于训练样本集进行神经网络的训练,得到预测神经网络。

在一个实施例中,处理器执行计算机程序时实现以下步骤:

获取多个训练样本;

根据像素值对各训练样本中的每个子特征进行标注,得到各训练样本的可见性标注。

在一个实施例中,处理器执行计算机程序时实现以下步骤:

计算训练样本的平均像素值;

若训练样本的子特征对应的训练对象的部分区域的平均像素值大于训练样本的平均像素值,则将训练样本的子特征标注为可见;

若训练样本的子特征对应的训练对象的部分区域的平均像素值小于或等于训练样本的平均像素值,则将训练样本的子特征标注为不可见。

在一个实施例中,处理器执行计算机程序时实现以下步骤:

通过神经网络对训练样本进行特征提取,得到训练样本的特征,并将训练样本的特征分割成多个子特征;

对训练样本的子特征采用权值不共享的卷积层进行卷积,并通过全局平均池化层和一个全连接层获得训练样本的每个子特征对应的一维特征向量;

根据激活函数和训练样本的每个子特征对应的一维特征向量,得到训练样本的每个子特征对应的可见性置信度;

根据训练样本的可见性标注和训练样本的每个子特征对应的可见性置信度进行神经网络的训练,得到预测神经网络。

在一个实施例中,处理器执行计算机程序时实现以下步骤:

将识别图像的多个子特征与识别图像的每个子特征对应的可见性置信度进行加权计算,得到多个中间特征;

对多个中间特征进行求和计算,得到识别图像的特征。

在一个实施例中,处理器执行计算机程序时实现以下步骤:

将图像数据库中的各候选图像进行特征提取,得到各候选图像的特征;

从各候选图像的特征中,查找出与识别图像的特征匹配的目标特征;

将目标特征对应的候选图像确定为目标图像。

在一个实施例中,别图像的多个子特征包括行人的上半身特征和下半身特征。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

将待进行重识别的识别图像输入至预先训练的预测神经网络中,得到预测神经网络输出的识别图像的多个子特征,以及与识别图像的每个子特征对应的可见性置信度;其中,识别图像包含目标对象,识别图像的多个子特征对应目标对象的多个部分区域,目标对象的多个部分区域组成目标对象;可见性置信度用于指示识别图像的每个子特征对应的目标对象的部分区域未被遮挡的概率;

根据识别图像的多个子特征和与识别图像的每个子特征对应的可见性置信度,确定识别图像的特征;

根据识别图像的特征在预先设置的图像数据库中搜索出包含目标对象的目标图像。

在一个实施例中,计算机程序被处理器执行时实现以下步骤:

获取训练样本集;训练样本集中包括多个训练样本和各训练样本的可见性标注;训练样本包含训练对象,训练样本的多个子特征对应训练对象的多个部分区域,训练对象的多个部分区域组成训练对象,可见性标注用于指示训练样本的每个子特征对应训练对象的部分区域的可见性;

基于训练样本集进行神经网络的训练,得到预测神经网络。

在一个实施例中,计算机程序被处理器执行时实现以下步骤:

获取多个训练样本;

根据像素值对各训练样本中的每个子特征进行标注,得到各训练样本的可见性标注。

在一个实施例中,计算机程序被处理器执行时实现以下步骤:

计算训练样本的平均像素值;

若训练样本的子特征对应的训练对象的部分区域的平均像素值大于训练样本的平均像素值,则将训练样本的子特征标注为可见;

若训练样本的子特征对应的训练对象的部分区域的平均像素值小于或等于训练样本的平均像素值,则将训练样本的子特征标注为不可见。

在一个实施例中,计算机程序被处理器执行时实现以下步骤:

通过神经网络对训练样本进行特征提取,得到训练样本的特征,并将训练样本的特征分割成多个子特征;

对训练样本的子特征采用权值不共享的卷积层进行卷积,并通过全局平均池化层和一个全连接层获得训练样本的每个子特征对应的一维特征向量;

根据激活函数和训练样本的每个子特征对应的一维特征向量,得到训练样本的每个子特征对应的可见性置信度;

根据训练样本的可见性标注和训练样本的每个子特征对应的可见性置信度进行神经网络的训练,得到预测神经网络。

在一个实施例中,计算机程序被处理器执行时实现以下步骤:

将识别图像的多个子特征与识别图像的每个子特征对应的可见性置信度进行加权计算,得到多个中间特征;

对多个中间特征进行求和计算,得到识别图像的特征。

在一个实施例中,计算机程序被处理器执行时实现以下步骤:

将图像数据库中的各候选图像进行特征提取,得到各候选图像的特征;

从各候选图像的特征中,查找出与识别图像的特征匹配的目标特征;

将目标特征对应的候选图像确定为目标图像。

在一个实施例中,识别图像的特征为行人的全身特征;识别图像的多个子特征包括行人的上半身特征和下半身特征。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1