行人重识别方法、装置、电子设备及存储介质与流程

文档序号:29701692发布日期:2022-04-16 14:39阅读:240来源:国知局
行人重识别方法、装置、电子设备及存储介质与流程

1.本发明涉及人工智能技术领域,具体涉及一种行人重识别方法、装置、电子设备及存储介质。


背景技术:

2.行人重识别(person re-identification)也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,广泛被认为是一个图像检索的子问题,现有技术通过对视频中的姿态估计采用的是对每一帧进行姿态估计后进行行人重识别。
3.然而,由于人体动作的复杂、光照的变化、背景干扰等原因,现有技术对每一帧进行姿态处理时,无法很好的处理遮挡问题,导致行人重识别准确率低。
4.因此,有必要提出一种可以快速准确的进行行人重识别的方法。


技术实现要素:

5.鉴于以上内容,有必要提出一种行人重识别方法、装置、电子设备及存储介质,通过将待识别行人划分为多个身体部位,并对每个身体部位进行单独计算,提高了行人重识别的准确率。
6.本发明的第一方面提供一种行人重识别方法,所述方法包括:
7.获取待识别行人的第一图像序列,将所述第一图像序列输入至预设的姿态识别网络中,得到所述待识别行人的每个身体部位的第一局部特征;
8.将所述第一图像序列输入至预设的多层卷积神经网络中,得到所述待识别行人的第一全局特征;
9.对所述待识别行人的每个所述身体部位的第一局部特征与第一全局特征进行第一次融合,得到所述待识别行人的每个所述身体部位的第二局部特征;
10.将所述待识别行人的每个所述身体部位的第二局部特征输入至预先训练好的行人重识别模型中,并接收所述行人重识别模型输出的行人重识别结果,其中,所述行人重识别模型中包含有多个通道注意力模块和多个位置注意力模块。
11.可选地,所述将所述第一图像序列输入至预设的姿态识别网络中,得到所述待识别行人的每个身体部位的第一局部特征包括:
12.将所述第一图像序列输入至预设的姿态识别网络中,在所述预设的姿态识别网络中检测所述第一图像序列中的每张图像进行所述待识别行人的身体部位提取;
13.获取所述待识别行人的每个身体部位的第一位置坐标和第一置信度;
14.对所述待识别行人的每个身体部位的第一位置坐标和第一置信度进行向量转换,得到所述待识别行人的对应身体部位的第一局部特征。
15.可选地,所述对所述待识别行人的每个所述身体部位的第一局部特征与第一全局特征进行第一次融合,得到所述待识别行人的每个所述身体部位的第二局部特征包括:
16.计算所述待识别行人的多个身体部位中的每个身体部位的第一局部特征与所述待识别行人的第一全局特征之间的乘积,得到所述待识别行人的对应身体部位的第二局部特征。
17.可选地,在所述将所述待识别行人的每个所述身体部位的第二局部特征输入至预先训练好的行人重识别模型中之前,所述方法还包括:
18.获取每个行人样本的第二图像序列,其中,每个行人样本包含有多个身体部位;
19.将每个行人样本的第二图像序列输入至预设的姿态识别网络中,得到每个行人样本的多个身体部位的第二位置坐标和第二置信度;
20.根据每个行人样本的每个身体部位的第二位置坐标和第二置信度,获取对应身体部位的第三局部特征;
21.将每个行人样本的第二图像序列输入至预设的多层卷积神经网络中,得到每个行人样本的第二全局特征;
22.对每个行人样本的每个所述身体部位的第三局部特征与第一全局特征进行第一次融合,得到每个行人样本的每个所述身体部位的第四局部特征;
23.将所述每个行人样本的多个身体部位的第四局部特征作为第一样本数据集;
24.将所述第一样本数据集分别输入至所述通道注意力模块和所述位置注意力模块中进行处理,得到每个行人样本的目标通道注意力结果和目标位置注意力结果;
25.对每个行人样本的目标通道注意力结果、目标位置注意力结果和第二全局特征进行第二次融合,得到每个行人样本的第三全局特征;
26.将所述多个行人样本的多个第三全局特征作为第二样本数据集;
27.从所述第二样本数据集划分出训练集和测试集;
28.将所述训练集输入预设神经网络中进行训练,得到行人重识别模型;
29.将所述测试集输入至所述行人重识别模型中进行测试,并计算测试通过率;
30.若所述测试通过率大于或者等于预设通过率阈值,则确定所述行人重识别模型的训练结束;若所述测试通过率小于所述预设通过率阈值,则更新所述第二样本数据,以获取新的训练集,并将所述新的训练集输入预设神经网络中重新进行所述行人重识别模型的训练。
31.可选地,所述将所述第一样本数据集分别输入至所述通道注意力模块和所述位置注意力模块中进行处理,得到每个行人样本的目标通道注意力结果和目标位置注意力结果包括:
32.从所述第一样本数据集中获取每个行人样本的每个身体部位的第四局部特征,其中,每个身体部位对应一个通道注意力模块和一个位置注意力模块;
33.将每个行人样本的多个身体部位的多个第四局部特征分别输入至对应的通道注意力模块和对应的位置注意力模块中进行加权处理,得到每个行人样本的每个身体部位的通道注意力结果和位置注意力结果;
34.对每个行人样本的多个身体部位的多个通道注意力结果求第一平均值,将所述第一平均值确定为对应行人的目标通道注意力结果,及对每个行人样本的多个身体部位的多个位置注意力结果求第二平均值,将所述第二平均值确定为对应行人的目标位置注意力结果。
35.可选地,所述对每个行人样本的目标通道注意力结果、目标位置注意力结果和第二全局特征进行第二次融合,得到每个行人样本的第三全局特征包括:
36.计算每个行人样本的目标通道注意力结果、目标位置注意力结果和第二全局特征之间的乘积,得到每个行人样本的第三全局特征。
37.可选地,所述将所述第一图像序列输入至预设的多层卷积神经网络中,得到所述待识别行人的第一全局特征包括:
38.将所述第一图像序列输入至预设的深度残差网络resnet50中进行人体检测,得到所述待识别行人的第一全局特征。
39.本发明的第二方面提供一种行人重识别装置,所述装置包括:
40.获取模块,用于获取待识别行人的第一图像序列,将所述第一图像序列输入至预设的姿态识别网络中,得到所述待识别行人的每个身体部位的第一局部特征;
41.第一输入模块,用于将所述第一图像序列输入至预设的多层卷积神经网络中,得到所述待识别行人的第一全局特征;
42.融合模块,用于对所述待识别行人的每个所述身体部位的第一局部特征与第一全局特征进行第一次融合,得到所述待识别行人的每个所述身体部位的第二局部特征;
43.第二输入模块,用于将所述待识别行人的每个所述身体部位的第二局部特征输入至预先训练好的行人重识别模型中,并接收所述行人重识别模型输出的行人重识别结果,其中,所述行人重识别模型中包含有多个通道注意力模块和多个位置注意力模块。
44.本发明的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的行人重识别方法。
45.本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的行人重识别方法。
46.综上所述,本发明所述的行人重识别方法、装置、电子设备及存储介质,一方面,通过获取待识别行人的第一图像序列,将所述第一图像序列输入至预设的姿态识别网络中,得到所述待识别行人的每个身体部位的第一局部特征,避免了由于所述待识别行人的某个身体部位被遮挡,而将遮挡物的特征作为所述待识别行人的特征的情况,确保了提取到的待识别行人的每个身体部位的第一局部特征的准确率;另一方面,对所述待识别行人的每个所述身体部位的第一局部特征与第一全局特征进行第一次融合,得到所述待识别行人的每个所述身体部位的第二局部特征,使得每个身体部位的第一局部特征更加的精确;最后,由于所述行人重识别模型中包含有多个通道注意力模块和多个位置注意力模块,通过将每个行人样本的每个身体部位的第四局部特征分别输入至通道注意力模块和位置注意力模块中,根据每个身体部位的姿态权重进行加权处理,使得每个身体部位对应的通道注意力结果和位置注意力结果更加的精确,进而提高了行人重识别的准确率。
附图说明
47.图1是本发明实施例一提供的行人重识别方法的流程图。
48.图2是本发明实施例二提供的行人重识别装置的结构图。
49.图3是本发明实施例三提供的电子设备的结构示意图。
具体实施方式
50.为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
51.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
52.实施例一
53.图1是本发明实施例一提供的行人重识别方法的流程图。
54.在本实施例中,所述行人重识别方法可以应用于电子设备中,对于需要进行行人重识别的电子设备,可以直接在电子设备上集成本发明的方法所提供的行人重识别的功能,或者以软件开发工具包(software development kit,sdk)的形式运行在电子设备中。
55.如图1所示,所述行人重识别方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
56.s11,获取待识别行人的第一图像序列,将所述第一图像序列输入至预设的姿态识别网络中,得到所述待识别行人的每个身体部位的第一局部特征,其中,所述待识别行人包含有多个身体部位。
57.本实施例中,第一图像序列指的是从拍摄的待识别行人的视频中提取到的多张连续帧图像。
58.本实施例中,可以预先设置姿态识别网络,其中,所述姿态识别网络可以为alphapose模型,所述alphapose模型采用rmpe框架,由对称空间变换器网络sstn、参数姿势非最大抑制pnms、姿势引导建议发生器pgpg组成,所述alphapose模型为现有技术,本实施例在此不做详述。
59.在一个可选的实施例中,所述将所述第一图像序列输入至预设的姿态识别网络中,得到所述待识别行人的每个身体部位的第一局部特征包括:
60.将所述第一图像序列输入至预设的姿态识别网络中,在所述预设的姿态识别网络中检测所述第一图像序列中的每张图像进行所述待识别行人的身体部位提取;
61.获取所述待识别行人的每个身体部位的第一位置坐标和第一置信度;
62.对所述待识别行人的每个身体部位的第一位置坐标和第一置信度进行向量转换,得到所述待识别行人的对应身体部位的第一局部特征。
63.本实施例中,在进行待识别行人的身体部位的第一局部特征提取时,可以预先设置18个身体部位,例如,所述身体部位可以包括:鼻子、右眼、左眼、右耳、左耳、右肩、左肩、右肘、左肘、右腕、左腕、右髋、左髋、右膝、左膝、右脚踝、左脚踝、颈部,对所述待识别行人的每个身体部位进行单独计算,提取出每个身体部位对应的第一局部特征。
64.本实施例中,通过对所述待识别行人进行身体部位的划分,并提取出每个身体部位的姿态特征,避免了由于所述待识别行人的某个身体部位被遮挡,而将遮挡物的特征作为所述待识别行人的特征的情况,确保了提取到的待识别行人的每个身体部位的第一局部特征的准确率,在后续进行行人重识别的过程中,考虑了所述待识别行人的每个身体部位的第一局部特征,进而提高了行人重识别的准确率。
65.s12,将所述第一图像序列输入至预设的多层卷积神经网络中,得到所述待识别行人的第一全局特征。
66.本实施例中,可以预先设置多层卷积神经网络,通过所述预设的多层卷积神经网络对所述待识别行人的第一图像序列中的每张图像进行特征提取,进而得到所述待识别行人的第一全局特征。
67.在一个可选的实施例中,所述将所述第一图像序列输入至预设的多层卷积神经网络中,得到所述待识别行人的第一全局特征包括:
68.将所述第一图像序列输入至预设的深度残差网络resnet50中进行人体检测,得到所述待识别行人的第一全局特征。
69.本实施例中,通过深度残差网络resnet50中的卷积层对所述第一图像序列中的每张图片进行残差学习,残差网路更容易优化,同时可以通过深度来提高准确率,所述深度残差网络可以解决由于增加深度带来的深度网络的退化问题,解决了,可以通过增加网络的深度来提高网络的性能,进而提高了获取的第一全局特征的准确率。
70.s13,对所述待识别行人的每个所述身体部位的第一局部特征与第一全局特征进行第一次融合,得到所述待识别行人的每个所述身体部位的第二局部特征。
71.本实施例中,通过将所述待识别行人的第一全局特征与每个身体部位的第一局部特征进行融合,使得每个身体部位的第一局部特征更加的精确。
72.在一个可选的实施例中,所述对所述待识别行人的每个所述身体部位的第一局部特征与第一全局特征进行第一次融合,得到所述待识别行人的每个所述身体部位的第二局部特征包括:
73.计算所述待识别行人的多个身体部位中的每个身体部位的第一局部特征与所述待识别行人的第一全局特征之间的乘积,得到所述待识别行人的对应身体部位的第二局部特征。
74.s14,将所述待识别行人的每个所述身体部位的第二局部特征输入至预先训练好的行人重识别模型中,并接收所述行人重识别模型输出的行人重识别结果,其中,所述行人重识别模型中包含有多个通道注意力模块和多个位置注意力模块。
75.本实施例中,可以预先训练行人重识别模型,在得到所述待识别行人的多个身体部位的第二局部特征之后,将第二局部特征输入至所述预先训练好的行人重识别模型中,得到行人重识别结果,其中,所述行人重识别结果包括:所述第一图像序列中的所述待识别行人是同一个行人,或者,所述第一图像序列中的所述待识别行人不是同一个行人。
76.具体地,所述行人重识别模型的预先训练过程包括:
77.获取每个行人样本的第二图像序列,其中,每个行人样本包含有多个身体部位;
78.将每个行人样本的第二图像序列输入至预设的姿态识别网络中,得到每个行人样本的多个身体部位的第二位置坐标和第二置信度;
79.根据每个行人样本的每个身体部位的第二位置坐标和第二置信度,获取对应身体部位的第三局部特征;
80.将每个行人样本的第二图像序列输入至预设的多层卷积神经网络中,得到每个行人样本的第二全局特征;
81.对每个行人样本的每个所述身体部位的第三局部特征与第一全局特征进行第一
次融合,得到每个行人样本的每个所述身体部位的第四局部特征;
82.将所述每个行人样本的多个身体部位的第四局部特征作为第一样本数据集;
83.将所述第一样本数据集分别输入至所述通道注意力模块和所述位置注意力模块中进行处理,得到每个行人样本的目标通道注意力结果和目标位置注意力结果;
84.对每个行人样本的目标通道注意力结果、目标位置注意力结果和第二全局特征进行第二次融合,得到每个行人样本的第三全局特征;
85.将所述多个行人样本的多个第三全局特征作为第二样本数据集;
86.从所述第二样本数据集划分出训练集和测试集;
87.将所述训练集输入预设神经网络中进行训练,得到行人重识别模型;
88.将所述测试集输入至所述行人重识别模型中进行测试,并计算测试通过率;
89.若所述测试通过率大于或者等于预设通过率阈值,则确定所述行人重识别模型的训练结束;若所述测试通过率小于所述预设通过率阈值,则更新所述第二样本数据,以获取新的训练集,并将所述新的训练集输入预设神经网络中重新进行所述行人重识别模型的训练。
90.本实施例中,可以预先获取每个行人样本的第二图像序列,其中,多数第二图像序列中包含有多张连续帧图像,根据多个行人样本的多个第二图像序列训练行人重识别模型。
91.本实施例中,所述第一样本数据集是指每个行人样本的多个身体部位的第三局部特征与第一全局特征进行第一次融合后得到的,确保了输入至通道注意力模块和位置注意力模块中的样本图像的有效性。
92.本实施例中,所述第二样本数据集是指将每个行人样本的目标通道注意力结果、目标位置注意力结果和第二全局特征进行第二次融合得到的。
93.本实施例中,从所述第二样本数据集划分出训练集和测试集,可以预先设置划分规则,例如,训练集占第二样本数据集的70%,测试集占第二样本数据集的30%。
94.本实施例中,可以预先设置通过率阈值,例如,通过率阈值可以设置为98%,当测试通过率大于或者等于98%时,确定行人重识别模型训练通过,结束训练;当测试通过率小于98%时,更新所述第二样本数据集,以增加训练集中第二图像序列的数量,得到新的训练集,并将所述新的训练集输入至预设神经网络中进行训练,重复执行上述步骤,直至测试通过利率大于或者等于98%。
95.进一步地,所述将所述第一样本数据集分别输入至所述通道注意力模块和所述位置注意力模块中进行处理,得到每个行人样本的目标通道注意力结果和目标位置注意力结果包括:
96.从所述第一样本数据集中获取每个行人样本的每个身体部位的第四局部特征,其中,每个身体部位对应一个通道注意力模块和一个位置注意力模块;
97.将每个行人样本的多个身体部位的多个第四局部特征分别输入至对应的通道注意力模块和对应的位置注意力模块中进行加权处理,得到每个行人样本的每个身体部位的通道注意力结果和位置注意力结果;
98.对每个行人样本的多个身体部位的多个通道注意力结果求第一平均值,将所述第一平均值确定为对应行人的目标通道注意力结果,及对每个行人样本的多个身体部位的多
个位置注意力结果求第二平均值,将所述第二平均值确定为对应行人的目标位置注意力结果。
99.本实施例中,所述通道注意力模块和位置注意力模块用于关注每个行人样本的每个身体部位的第四局部特征中有意义的特征,其中,所述通道注意力模块可以采用全局平均池化和最大池化两种方式得到每个行人样本的每个身体部位中的有意义的第四局部特征;所述位置注意力模块可以采用最大池化和平均池化进行处理,并将最大池化和平均池化结果进行拼接后输入卷积层,基于sigmoid激活函数得到权重系数后,确定每个行人样本的每个身体部位中的有意义的第四局部特征。
100.本实施例中,在行人重识别模型的训练过程中,在得到每个行人样本的每个身体部位的第四局部特征时,针对每个行人样本的每个身体部位的第四局部特征,分别输入至通道注意力模块和位置注意力模块中,根据每个身体部位的姿态权重进行加权处理,使得每个身体部位对应的通道注意力结果和位置注意力结果更加的精确,进而确保了每个行人样本的目标通道注意力结果和目标位置注意力结果的准确性。
101.本实施例中,所述第一平均值是通过对每个行人样本的多个身体部位的多个通道注意力结果求平均值得到的;所述第二平均值是通过对每个行人样本的多个身体部位的多个位置注意力结果求平均值得到的。
102.进一步地,所述对每个行人样本的目标通道注意力结果、目标位置注意力结果和第二全局特征进行第二次融合,得到每个行人样本的第三全局特征包括:
103.计算每个行人样本的目标通道注意力结果、目标位置注意力结果和第二全局特征之间的乘积,得到每个行人样本的第三全局特征。
104.本实施例中,所述第二次融合是指将每个行人样本的目标通道注意力结果与目标位置注意力结果进行联合后与每个行人样本的第二全局特征进行相乘,获得经过身体部位双重注意力强调的新的特征,即每个行人样本的第三全局特征。
105.本实施例中,所述行人重识别模型的训练过程所采用的第二样本数据集中,采用了经过身体部位双重注意力强调的第三全局特征,确保了训练集中的特征的精确性,使得训练得到的行人重识别模型更加优化,进而提高了行人重识别的准确率。
106.本实施例中,在行人重识别模型创建过程中,将每个行人样本计算了每个行人样本的每个身体部位的第三局部特征,通过单独计算每个行人样本的每个身体部位,可以减少类间距较小的困难样本,即可以很好的区分外表较相似的不同行人,进而提高了行人重识别的准确率,同时,对于某些部位被遮挡的待识别行人,通过对所述待识别行人的每个身体部位进行计算可以避免这些遮挡物加入整体的计算中,减少了遮挡物的影响,进而提高了后续行人重识别准确率。
107.本实施例中,对于所述待识别行人的第一图像序列,经过姿态识别网络获取所述待识别行人的每个身体部位的第一位置坐标和第一置信度,根据每个身体部位的第一位置坐标和第一置信度获取每个身体部位的第一局部特征,再经过预设的多层卷积神经网络获取所述待识别行人的第一全局特征,将每个身体部位的第一局部特征与所述待识别行人的第一全局特征进行相乘,获取每个身体部位的第二局部特征,对于每个身体部位的第一局部特征分别输入至通道注意力模块和位置注意力模块中,得到所述待识别行人的目标通道注意力结果和目标位置注意力结果,并将所述待识别行人的目标通道注意力结果和目标位
置注意力结果进行联合后与每个行人样本的第一全局特征进行相乘,获得了经过身体部位双重注意力强调的待识别行人的全局特征。
108.综上所述,本实施例所述的行人重识别方法,一方面,通过获取待识别行人的第一图像序列,将所述第一图像序列输入至预设的姿态识别网络中,得到所述待识别行人的每个身体部位的第一局部特征,避免了由于所述待识别行人的某个身体部位被遮挡,而将遮挡物的特征作为所述待识别行人的特征的情况,确保了提取到的待识别行人的每个身体部位的第一局部特征的准确率;另一方面,对所述待识别行人的每个所述身体部位的第一局部特征与第一全局特征进行第一次融合,得到所述待识别行人的每个所述身体部位的第二局部特征,使得每个身体部位的第一局部特征更加的精确;最后,将所述待识别行人的多个身体部位的第二局部特征输入至预先训练好的行人重识别模型中,由于所述行人重识别模型中包含有多个通道注意力模块和多个位置注意力模块,通过将每个行人样本的每个身体部位的第四局部特征分别输入至通道注意力模块和位置注意力模块中,根据每个身体部位的姿态权重进行加权处理,使得每个身体部位对应的通道注意力结果和位置注意力结果更加的精确,进而提高了行人重识别的准确率。
109.实施例二
110.图2是本发明实施例二提供的行人重识别装置的结构图。
111.在一些实施例中,所述行人重识别装置20可以包括多个由程序代码段所组成的功能模块。所述行人重识别装置20中的各个程序段的程序代码可以存储于电子设备的存储器中,并由所述至少一个处理器所执行,以执行(详见图1描述)行人重识别的功能。
112.本实施例中,所述行人重识别装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:获取模块201、第一输入模块202、融合模块203及第二输入模块204。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
113.获取模块201,用于获取待识别行人的第一图像序列,将所述第一图像序列输入至预设的姿态识别网络中,得到所述待识别行人的每个身体部位的第一局部特征,其中,所述待识别行人包含有多个身体部位。
114.本实施例中,第一图像序列指的是从拍摄的待识别行人的视频中提取到的多张连续帧图像。
115.本实施例中,可以预先设置姿态识别网络,其中,所述姿态识别网络可以为alphapose模型,所述alphapose模型采用rmpe框架,由对称空间变换器网络sstn、参数姿势非最大抑制pnms、姿势引导建议发生器pgpg组成,所述alphapose模型为现有技术,本实施例在此不做详述。
116.在一个可选的实施例中,所述获取模块201将所述第一图像序列输入至预设的姿态识别网络中,得到所述待识别行人的每个身体部位的第一局部特征包括:
117.将所述第一图像序列输入至预设的姿态识别网络中,在所述预设的姿态识别网络中检测所述第一图像序列中的每张图像进行所述待识别行人的身体部位提取;
118.获取所述待识别行人的每个身体部位的第一位置坐标和第一置信度;
119.对所述待识别行人的每个身体部位的第一位置坐标和第一置信度进行向量转换,
得到所述待识别行人的对应身体部位的第一局部特征。
120.本实施例中,在进行待识别行人的身体部位的第一局部特征提取时,可以预先设置18个身体部位,例如,所述身体部位可以包括:鼻子、右眼、左眼、右耳、左耳、右肩、左肩、右肘、左肘、右腕、左腕、右髋、左髋、右膝、左膝、右脚踝、左脚踝、颈部,对所述待识别行人的每个身体部位进行单独计算,提取出每个身体部位对应的第一局部特征。
121.本实施例中,通过对所述待识别行人进行身体部位的划分,并提取出每个身体部位的姿态特征,避免了由于所述待识别行人的某个身体部位被遮挡,而将遮挡物的特征作为所述待识别行人的特征的情况,确保了提取到的待识别行人的每个身体部位的第一局部特征的准确率,在后续进行行人重识别的过程中,考虑了所述待识别行人的每个身体部位的第一局部特征,进而提高了行人重识别的准确率。
122.第一输入模块202,用于将所述第一图像序列输入至预设的多层卷积神经网络中,得到所述待识别行人的第一全局特征。
123.本实施例中,可以预先设置多层卷积神经网络,通过所述预设的多层卷积神经网络对所述待识别行人的第一图像序列中的每张图像进行特征提取,进而得到所述待识别行人的第一全局特征。
124.在一个可选的实施例中,所述第一输入模块202将所述第一图像序列输入至预设的多层卷积神经网络中,得到所述待识别行人的第一全局特征包括:
125.将所述第一图像序列输入至预设的深度残差网络resnet50中进行人体检测,得到所述待识别行人的第一全局特征。
126.本实施例中,通过深度残差网络resnet50中的卷积层对所述第一图像序列中的每张图片进行残差学习,残差网路更容易优化,同时可以通过深度来提高准确率,所述深度残差网络可以解决由于增加深度带来的深度网络的退化问题,解决了,可以通过增加网络的深度来提高网络的性能,进而提高了获取的第一全局特征的准确率。
127.融合模块203,用于对所述待识别行人的每个所述身体部位的第一局部特征与第一全局特征进行第一次融合,得到所述待识别行人的每个所述身体部位的第二局部特征。
128.本实施例中,通过将所述待识别行人的第一全局特征与每个身体部位的第一局部特征进行融合,使得每个身体部位的第一局部特征更加的精确。
129.在一个可选的实施例中,所述融合模块203对所述待识别行人的每个所述身体部位的第一局部特征与第一全局特征进行第一次融合,得到所述待识别行人的每个所述身体部位的第二局部特征包括:
130.计算所述待识别行人的多个身体部位中的每个身体部位的第一局部特征与所述待识别行人的第一全局特征之间的乘积,得到所述待识别行人的对应身体部位的第二局部特征。
131.第二输入模块204,用于将所述待识别行人的每个所述身体部位的第二局部特征输入至预先训练好的行人重识别模型中,并接收所述行人重识别模型输出的行人重识别结果,其中,所述行人重识别模型中包含有多个通道注意力模块和多个位置注意力模块。
132.本实施例中,可以预先训练行人重识别模型,在得到所述待识别行人的多个身体部位的第二局部特征之后,将第二局部特征输入至所述预先训练好的行人重识别模型中,得到行人重识别结果,其中,所述行人重识别结果包括:所述第一图像序列中的所述待识别
行人是同一个行人,或者,所述第一图像序列中的所述待识别行人不是同一个行人。
133.具体地,所述行人重识别模型的预先训练过程包括:
134.获取每个行人样本的第二图像序列,其中,每个行人样本包含有多个身体部位;
135.将每个行人样本的第二图像序列输入至预设的姿态识别网络中,得到每个行人样本的多个身体部位的第二位置坐标和第二置信度;
136.根据每个行人样本的每个身体部位的第二位置坐标和第二置信度,获取对应身体部位的第三局部特征;
137.将每个行人样本的第二图像序列输入至预设的多层卷积神经网络中,得到每个行人样本的第二全局特征;
138.对每个行人样本的每个所述身体部位的第三局部特征与第一全局特征进行第一次融合,得到每个行人样本的每个所述身体部位的第四局部特征;
139.将所述每个行人样本的多个身体部位的第四局部特征作为第一样本数据集;
140.将所述第一样本数据集分别输入至所述通道注意力模块和所述位置注意力模块中进行处理,得到每个行人样本的目标通道注意力结果和目标位置注意力结果;
141.对每个行人样本的目标通道注意力结果、目标位置注意力结果和第二全局特征进行第二次融合,得到每个行人样本的第三全局特征;
142.将所述多个行人样本的多个第三全局特征作为第二样本数据集;
143.从所述第二样本数据集划分出训练集和测试集;
144.将所述训练集输入预设神经网络中进行训练,得到行人重识别模型;
145.将所述测试集输入至所述行人重识别模型中进行测试,并计算测试通过率;
146.若所述测试通过率大于或者等于预设通过率阈值,则确定所述行人重识别模型的训练结束;若所述测试通过率小于所述预设通过率阈值,则更新所述第二样本数据,以获取新的训练集,并将所述新的训练集输入预设神经网络中重新进行所述行人重识别模型的训练。
147.本实施例中,可以预先获取多个行人样本及每个行人样本的第二图像序列,其中,多数第二图像序列中包含有多张连续帧图像,根据多个行人样本的多个第二图像序列训练行人重识别模型。
148.本实施例中,所述第一样本数据集是指每个行人样本的多个身体部位的第三局部特征与第一全局特征进行第一次融合后得到的,确保了输入至通道注意力模块和位置注意力模块中的样本图像的有效性。
149.本实施例中,所述第二样本数据集是指将每个行人样本的目标通道注意力结果、目标位置注意力结果和第二全局特征进行第二次融合得到的。
150.本实施例中,从所述第二样本数据集划分出训练集和测试集,可以预先设置划分规则,例如,训练集占第二样本数据集的70%,测试集占第二样本数据集的30%。
151.本实施例中,可以预先设置通过率阈值,例如,通过率阈值可以设置为98%,当测试通过率大于或者等于98%时,确定行人重识别模型训练通过,结束训练;当测试通过率小于98%时,更新所述第二样本数据集,以增加训练集中第二图像序列的数量,得到新的训练集,并将所述新的训练集输入至预设神经网络中进行训练,重复执行上述步骤,直至测试通过利率大于或者等于98%。
152.进一步地,所述将所述第一样本数据集分别输入至所述通道注意力模块和所述位置注意力模块中进行处理,得到每个行人样本的目标通道注意力结果和目标位置注意力结果包括:
153.从所述第一样本数据集中获取每个行人样本的每个身体部位的第四局部特征,其中,每个身体部位对应一个通道注意力模块和一个位置注意力模块;
154.将每个行人样本的多个身体部位的多个第四局部特征分别输入至对应的通道注意力模块和对应的位置注意力模块中进行加权处理,得到每个行人样本的每个身体部位的通道注意力结果和位置注意力结果;
155.对每个行人样本的多个身体部位的多个通道注意力结果求第一平均值,将所述第一平均值确定为对应行人的目标通道注意力结果,及对每个行人样本的多个身体部位的多个位置注意力结果求第二平均值,将所述第二平均值确定为对应行人的目标位置注意力结果。
156.本实施例中,所述通道注意力模块和位置注意力模块用于关注每个行人样本的每个身体部位的第四局部特征中有意义的特征,其中,所述通道注意力模块可以采用全局平均池化和最大池化两种方式得到每个行人样本的每个身体部位中的有意义的第四局部特征;所述位置注意力模块可以采用最大池化和平均池化进行处理,并将最大池化和平均池化结果进行拼接后输入卷积层,基于sigmoid激活函数得到权重系数后,确定每个行人样本的每个身体部位中的有意义的第四局部特征。
157.本实施例中,在行人重识别模型的训练过程中,在得到每个行人样本的每个身体部位的第四局部特征时,针对每个行人样本的每个身体部位的第四局部特征,分别输入至通道注意力模块和位置注意力模块中,根据每个身体部位的姿态权重进行加权处理,使得每个身体部位对应的通道注意力结果和位置注意力结果更加的精确,进而确保了每个行人样本的目标通道注意力结果和目标位置注意力结果的准确性。
158.本实施例中,所述第一平均值是通过对每个行人样本的多个身体部位的多个通道注意力结果求平均值得到的;所述第二平均值是通过对每个行人样本的多个身体部位的多个位置注意力结果求平均值得到的。
159.进一步地,所述对每个行人样本的目标通道注意力结果、目标位置注意力结果和第二全局特征进行第二次融合,得到每个行人样本的第三全局特征包括:
160.计算每个行人样本的目标通道注意力结果、目标位置注意力结果和第二全局特征之间的乘积,得到每个行人样本的第三全局特征。
161.本实施例中,所述第二次融合是指将每个行人样本的目标通道注意力结果与目标位置注意力结果进行联合后与每个行人样本的第二全局特征进行相乘,获得经过身体部位双重注意力强调的新的特征,即每个行人样本的第三全局特征。
162.本实施例中,所述行人重识别模型的训练过程所采用的第二样本数据集中,采用了经过身体部位双重注意力强调的第三全局特征,确保了训练集中的特征的精确性,使得训练得到的行人重识别模型更加优化,进而提高了行人重识别的准确率。
163.本实施例中,在行人重识别模型创建过程中,将每个行人样本计算了每个行人样本的每个身体部位的第三局部特征,通过单独计算每个行人样本的每个身体部位,可以减少类间距较小的困难样本,即可以很好的区分外表较相似的不同行人,进而提高了行人重
识别的准确率,同时,对于某些部位被遮挡的待识别行人,通过对所述待识别行人的每个身体部位进行计算可以避免这些遮挡物加入整体的计算中,减少了遮挡物的影响,进而提高了后续行人重识别准确率。
164.本实施例中,对于所述待识别行人的第一图像序列,经过姿态识别网络获取所述待识别行人的每个身体部位的第一位置坐标和第一置信度,根据每个身体部位的第一位置坐标和第一置信度获取每个身体部位的第一局部特征,再经过预设的多层卷积神经网络获取所述待识别行人的第一全局特征,将每个身体部位的第一局部特征与所述待识别行人的第一全局特征进行相乘,获取每个身体部位的第二局部特征,对于每个身体部位的第一局部特征分别输入至通道注意力模块和位置注意力模块中,得到所述待识别行人的目标通道注意力结果和目标位置注意力结果,并将所述待识别行人的目标通道注意力结果和目标位置注意力结果进行联合后与每个行人样本的第一全局特征进行相乘,获得了经过身体部位双重注意力强调的待识别行人的全局特征。
165.综上所述,本实施例所述的行人重识别装置,一方面,通过获取待识别行人的第一图像序列,将所述第一图像序列输入至预设的姿态识别网络中,得到所述待识别行人的每个身体部位的第一局部特征,避免了由于所述待识别行人的某个身体部位被遮挡,而将遮挡物的特征作为所述待识别行人的特征的情况,确保了提取到的待识别行人的每个身体部位的第一局部特征的准确率;另一方面,对所述待识别行人的每个所述身体部位的第一局部特征与第一全局特征进行第一次融合,得到所述待识别行人的每个所述身体部位的第二局部特征,使得每个身体部位的第一局部特征更加的精确;最后,将所述待识别行人的多个身体部位的第二局部特征输入至预先训练好的行人重识别模型中,由于所述行人重识别模型中包含有多个通道注意力模块和多个位置注意力模块,通过将每个行人样本的每个身体部位的第四局部特征分别输入至通道注意力模块和位置注意力模块中,根据每个身体部位的姿态权重进行加权处理,使得每个身体部位对应的通道注意力结果和位置注意力结果更加的精确,进而提高了行人重识别的准确率。
166.实施例三
167.参阅图3所示,为本发明实施例三提供的电子设备的结构示意图。在本发明较佳实施例中,所述电子设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
168.本领域技术人员应该了解,图3示出的电子设备的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
169.在一些实施例中,所述电子设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
170.需要说明的是,所述电子设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
171.在一些实施例中,所述存储器31用于存储计算机程序和各种数据,例如安装在所
述电子设备3中的行人重识别装置20,并在电子设备3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括只读存储器(read-only memory,rom)、可编程只读存储器(programmable read-only memory,prom)、可擦除可编程只读存储器(erasable programmable read-only memory,eprom)、一次可编程只读存储器(one-time programmable read-only memory,otprom)、电子擦除式可复写只读存储器(electrically-erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
172.在一些实施例中,所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述电子设备3的控制核心(control unit),利用各种接口和线路连接整个电子设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行电子设备3的各种功能和处理数据。
173.在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
174.在一些实施例中,收发器34是信号转换的一种装置,用以接收和发送信号的器件。
175.尽管未示出,所述电子设备3还可以包括给各个部件供电的电源(比如电池),可选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
176.应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
177.上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
178.在进一步的实施例中,结合图2,所述至少一个处理器32可执行所述电子设备3的操作装置以及安装的各类应用程序(如所述的行人重识别装置20)、程序代码等,例如,上述的各个模块。
179.所述存储器31中存储有程序代码,且所述至少一个处理器32可调用所述存储器31中存储的程序代码以执行相关的功能。例如,图2中所述的各个模块是存储在所述存储器31中的程序代码,并由所述至少一个处理器32所执行,从而实现所述各个模块的功能以达到行人重识别的目的。
180.示例性的,所述程序代码可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述处理器32执行,以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述程序代码在所述电子设备3中的执行过程。例如,所述程序代码可以被分割成获取模块
201、第一输入模块202、融合模块203及第二输入模块204。
181.在本发明的一个实施例中,所述存储器31存储多个计算机可读指令,所述多个计算机可读指令被所述至少一个处理器32所执行以实现行人重识别的功能。
182.具体地,所述至少一个处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
183.在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
184.所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
185.另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
186.对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。本发明中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
187.最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1