行人重识别方法、装置、计算机设备及存储介质与流程

文档序号:23616558发布日期:2021-01-12 10:26阅读:104来源:国知局
行人重识别方法、装置、计算机设备及存储介质与流程

本申请涉及机器学习技术领域,特别是涉及一种行人重识别方法、装置、计算机设备及存储介质。



背景技术:

近年来,随着人工智能技术的快速发展,行人重识别技术(英文:personre-identification,简称:re-id)受到越来越多的关注。行人重识别是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。

现有技术中,行人重识别方法一般是:通过行人重识别模型提取待测图像中的待测人物的人物特征,然后将待测人物的人物特征与目标人物的人物特征进行比对,以确定待测人物的人物特征与目标人物的人物特征的相似度,基于该相似度确定待测人物是否为目标人物。

然而,上述方法中,行人重识别方法的精度不高。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提高行人重识别精度的行人重识别方法、装置、计算机设备和存储介质。

一种行人重识别方法,该方法包括:

对目标人物图像中目标人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第一特征图;

对待测人物图像中待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图;

基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人。

在其中一个实施例中,对待测人物图像中待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图,包括:

获取待测视频,对待测视频的每个图像帧中的待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图;

对每个图像帧中对应同一人体部位的候选特征图进行特征融合处理,得到与各个不同人体部位分别对应的第二特征图。

在其中一个实施例中,获取待测视频,包括:

获取原始视频,并基于目标检测算法确定原始视频的每个视频帧中的待测人物;

从视频帧中截取待测人物所在的区域,得到目标图像,并对截取的各目标图像按照时序进行拼接,得到待测视频。

在其中一个实施例中,对每个图像帧中对应同一人体部位的候选特征图进行特征融合处理,包括:

将每个图像帧中对应同一人体部位的候选特征图按位相加。

在其中一个实施例中,基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人,包括:

根据各第一特征图和各第二特征图对应的不同人体部位,确定多个特征组,特征组中包括对应同一人体部位的第一特征图和第二特征图;

对于各特征组,根据特征组中包括的对应同一人体部位的第一特征图和第二特征图之间的损失值确定特征组对应的损失值;

根据各特征组对应的损失值确定待测人物与目标人物是否为同一个人。

在其中一个实施例中,对待测视频的每个图像帧中的待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图,包括:

对于各图像帧,通过语义分割的方式获取图像帧中的待测人物的不同人体部位的位置信息;

根据不同人体部位的位置信息从图像帧中提取待测人物的不同人体部位;

分别对待测人物的不同人体部位进行特征提取,以获取图像帧中的与各个不同人体部位分别对应的候选特征图。

在其中一个实施例中,对待测视频的每个图像帧中的待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图,包括:

对于待测视频的每个图像帧,通过语义分割的方式获取图像帧中的待测人物的位置信息;

根据待测人物的位置信息从图像帧中提取待测人物的图像;

基于待测人物的图像,对待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图。

一种行人重识别装置,该装置包括:

第一特征提取模块,用于对目标人物图像中目标人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第一特征图;

第二特征提取模块,用于对待测人物图像中待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图;

重识别模块,用于基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人。

一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:

对目标人物图像中目标人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第一特征图;

对待测人物图像中待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图;

基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人。

一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

对目标人物图像中目标人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第一特征图;

对待测人物图像中待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图;

基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人。

上述行人重识别方法、装置、计算机设备及存储介质,通过对目标视频中目标人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第一特征图;对待测视频中待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图;基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人。本申请实施例中,获取待测人物的不同人体部位分别对应的第二特征图,然后基于不同的人体部位进行特征对比,提高了行人重识别结果的精度。

附图说明

图1为一个实施例中行人重识别方法的流程示意图;

图2为一个实施例中获取与各个不同人体部位分别对应的第二特征图的步骤的流程图;

图3为一个实施例中确定待测人物与目标人物是否为同一个人的步骤的流程图;

图4为一个实施例中得到每个图像帧的与各个不同人体部位分别对应的候选特征图的步骤的流程图;

图5为一个实施例中行人重识别装置的结构框图;

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

近年来,行人重识别技术(英文:personre-identification,简称:re-id)受到越来越多的关注。行人重识别是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。

其中,视频re-id是图像re-id的一个衍生任务,在现实生活中更符合实际的场景需求。在视频re-id中,针对的是一段目标视频或者多个视频帧组成的图像序列。这些视频序列中包含同一个目标人物或者车辆。视频re-id的目的在于:给定目标人物或者目标车辆的视频序列,在待检索的视频序列中,匹配到在其他摄像头中出现的包含目标人物或者包含目标车辆的视频序列。

在实际应用场景中,随着我国公共场所的监控设备的部署不断完善,获取的视频资源也更加丰富,通过视频序列可以获取目标人物更加丰富的特征。所以,相较于传统的图像re-id,视频re-id更加符合应用需求。

相较于单张图像re-id,视频re-id中包括的图像数量更多,目标人物的特征更丰富,但视频中包含的噪声相比于单张图像也更多,噪声对行人重识别结果的干扰性也更强。

为了解决视频re-id对行人重识别结果的影响,现有技术提出了采用注意力机制过滤干扰的方式,然而,该种注意力机制是基于网络结构层次的调整,过程较为繁琐,且效果不好。

本申请实施例,提出了一种新型的注意力机制,该注意力机制采用人体语义分割的方式,对图像中的人物进行特征属性的分类,从而实现对关键区域的特征提取。

在一个实施例中,如图1所示,提供了一种行人重识别方法,本实施例以该方法应用于计算机设备进行举例说明,该计算机设备可以是服务器、电脑等。本实施例中,该方法包括以下步骤:

步骤101,计算机设备对目标人物图像中目标人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第一特征图。

本申请实施例中,目标人物图像可以为单张图像,可选的,目标人物图像可以为多张图像组成的视频。目标人物图像中仅包括一个人物,即目标人物。

目标人物的各个不同人体部位可以包括但不限于:头部、手臂、腿、身体、脚等。

可选的,本申请实施例中,计算机设备对目标人物图像中目标人物的各个不同人体部位分别进行特征提取的过程包括:计算机设备可以获取已经训练好的人体语义分割模型,人体语义分割模型可以识别人体的头部、手臂、腿、身体、脚等不同的人体部位。计算机设备可以将目标人物图像输入到人体语义分割模型中,得到目标人物的不同人体部位的图像,例如头部图像、手臂图像、腿部图像、身体图像以及脚部图像。然后,计算机设备可以获取对应不同人体部位的特征提取模型,例如,头部特征提取模型、手臂特征提取模型、腿部特征提取模型、身体特征提取模型以及脚步特征提取模型,并将不同人体部位的图像分别输入到对应的模型中,从而获取各个人体部位的第一特征图(英文:featuremap)。

步骤102,计算机设备对待测人物图像中待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图。

其中,待测人物图像可以为单张图像,可选的,待测人物图像可以为多张图像组成的视频。待测人物图像中仅包括一个人物,即待测人物。

待测人物的各个不同人体部位与目标人物的各个不同人体部位相同。

计算机设备可以采用步骤101中的人体语义分割模型以及对应不同人体部位的特征提取模型对待测人物图像中的待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位对应的第二特征图。

步骤103,计算机设备基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人。

本申请实施例中,计算机设备可以基于各个人体部位分别对应的第一特征图和第二特征图进行对比,并根据各个人体部位的比较结果确定待测人物与目标人物是否为同一个人。

可选的,本申请实施例中,计算机设备可以将多个第一特征图按照预设的顺序进行特征拼接,得到拼接好的目标人物特征。同时,计算机设备可以将多个第二特征图按照多个第一特征图的拼接顺序进行特征拼接,得到拼接好的待测人物特征。然后计算机设备可以将拼接好的目标人物特征和拼接好的待测人物特征进行比对以确定待测人物与目标人物是否为同一个人。

本申请实施例提供的行人重识别方法中,通过对目标视频中目标人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第一特征图;对待测视频中待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图;基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人。本申请实施例中,获取待测人物的不同人体部位分别对应的第一特征图,然后基于不同的人体部位进行特征对比,提高了行人重识别结果的精度。

在一个实施例中,如图2所示,计算机设备对待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图的过程包括:

步骤201,计算机设备获取待测视频,对待测视频的每个图像帧中的待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图。

待测视频可以是一段视频或者多个视频帧组成的图像序列。本申请实施例中,待测视频中仅包含一个人物,即待测人物。

可选的,计算机设备获取待测视频的过程可以包括以下内容:

步骤a1,计算机设备获取原始视频,并基于目标检测算法确定原始视频的每个视频帧中的待测人物。

原始视频是指监控设备拍摄得到的视频。原始视频中可能同时存在多个人物。

本申请实施例中,计算机设备基于目标检测算法确定原始视频的每个视频帧中的待测人物的过程可以包括以下内容:

计算机设备可以从原始视频中获取多个视频帧,每个视频帧中可能包括多个人物,计算机设备可以利用目标检测算法对每个视频帧进行目标识别,以确定出每个视频帧中的每个人物的边界框。

然后计算机设备可以从第一张视频帧中任意选择一个人物作为待测人物,并获取选定的待测人物在第一长视频帧中的边界框a,将根据边界框a在第一长视频帧中的位置,在第二张视频帧中生成边界框a’,然后从第二张视频帧中的多个人物边界框中查找与边界框a’相关联的边界框,该相关联的边界框与边界框a表示的是同一个人物。也就是说,在第二张视频帧中找到了该待测人物。基于相同的原理,可以根据第二张视频帧中的该相关联的边界框在第三张视频帧中查找到该待测人物。以此类推,直至在每个视频帧中查找到该待测人物的边界框。

步骤a2,计算机设备从视频帧中截取待测人物所在的区域,得到目标图像,并对截取的各目标图像按照时序进行拼接,得到待测视频。

本申请实施例中,计算机设备可以从每个视频帧中根据待测人物的边界框进行图像截图,得到目标图像,目标图像中包括待测人物以及背景图案,然后按照每个视频帧在原始视频中的先后顺序将截取出来的目标图像进行拼接,得到待测视频。

本申请实施例中,通过上述方法获取待测视频,可以保证待测视频中只包含一个人物,即待测人物。这样在对待测人物的各个不同人体部位分别进行特征提取的过程中可以有效减少其他人物的存在造成的噪声干扰。

可选的,本申请实施例中,计算机设备对待测视频的每个图像帧中的待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图的过程可以包括以下内容:

步骤b1,对于各图像帧,计算机设备通过语义分割的方式获取图像帧中的待测人物的不同人体部位的位置信息。

本申请实施例中,计算机设备可以获取训练好的人体语义分割模型,人体语义分割模型可以识别人体的头部、手臂、腿、身体、脚等不同的人体部位。对于将待测视频中的每个图像帧,计算机设备可以将图像帧分别输入到人体语义分割模型中,为便于叙述,下文将输入到语义分割模型中的图像帧称为目标图像帧。人体语义分割模型可以输出多个掩码矩阵,每个掩码矩阵对应目标图像帧中待测人物的一个人体部位,例如对应头部的头部掩码矩阵,对应腿部的腿部掩码矩阵,对应手臂的手臂掩码矩阵,对应身体的身体掩码矩阵,对应脚部的脚部掩码矩阵。

其中,掩码矩阵为二值矩阵,且掩码矩阵的行列与目标图像帧中的像素点的行列数相对应,掩码矩阵的矩阵元素与目标图像帧中的像素点对应。以头部掩码矩阵为例,头部掩码矩阵中矩阵元素为1的部分表示待测人物的头部所在区域,矩阵元素为0的部分为头部之外的区域。通过头部掩码矩阵可以指示出头部在目标图像帧中的位置信息。相应的,腿部掩码矩阵可以指示出腿部在目标图像帧中的位置信息,……。

步骤b2,计算机设备根据不同人体部位的位置信息从图像帧中提取待测人物的不同人体部位。

本申请实施例中,计算机设备可以将头部掩码矩阵与目标图像帧进行合并,从而从目标图像帧中提取出待测人物的头部的图像。

相应的,计算机设备可以获取待测人物的腿部图像、脚部图像、手臂图像等。

步骤b3,计算机设备分别对待测人物的不同人体部位进行特征提取,以获取图像帧中的与各个不同人体部位分别对应的候选特征图。

本申请实施例中,计算机设备可以获取多个特征提取模型,不同的特征提取模型可以用于提取不同的人体部位的特征图。

计算机设备可以将头部图像输入到与头部对应的特征提取模型中,得到头部对应的候选特征图。基于相同的原理,可以得到腿部对应的候选特征图、脚部对应的候选特征图,手臂对应的候选特征图,身体对应的候选特征图等。

基于步骤b1到步骤b3公开的内容,可以得到待测视频中的每个图像帧中待测人物的不同人体部位分别对应的候选特征图。

步骤202,计算机设备对每个图像帧中对应同一人体部位的候选特征图进行特征融合处理,得到与各个不同人体部位分别对应的第二特征图。

举例而言,例如待测视频包括20个图像帧,基于步骤201公开的内容可知,计算机设备可以获取每个图像帧中待测人物的不同人体部位的候选特征图。

而对于同一人体部位,以头部为例,计算机设备可以对20个图像帧中每个图像帧的头部对应的候选特征图进行特征融合处理,以得到头部对应的第二特征图。

本申请实施例中,计算机设备对每个图像帧中对应同一人体部位的候选特征图进行特征融合处理的过程可以包括以下内容:计算机设备可以将每个图像帧中对应同一人体部位的候选特征图按位相加。

具体的,承接上文举例,计算机设备可以将20个图像帧中每个图像帧的头部对应的候选特征图进行按位相加,相加得到的结果即为特征融合处理后的头部对应的第二特征图。

基于相同的原理,计算机设备可以获取腿部的第二特征图,脚部的第二特征图,手臂的第二特征图和身体的第二特征图。

本申请实施例中,待测人物的各个人体部位分别对应的第二特征图是由多个图像帧的同一人体部位的候选特征图融合后得来的,因此,第二特征图中包含的人体部位的特征更加丰富,更有利于进行人体部位的识别。

在一个实施例中,如图3所示,计算机设备基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人的过程包括:

步骤301,计算机设备根据各第一特征图和各第二特征图对应的不同人体部位,确定多个特征组。

其中,特征组中包括对应同一人体部位的第一特征图和第二特征图。

本申请实施例中,计算机设备将对应同一人体部位的第一特征图和第二特征图划分为一个特征组,每个特征组对应一个人体部位。

例如,多个第一特征图分别包括头部第一特征图、腿部第一特征图、脚部第一特征图、手臂第一特征图和身体第一特征图。多个第二特征图分别包括头部第二特征图、腿部第二特征图、脚部第二特征图、手臂第二特征图和身体第二特征图。

将头部第一特征图和头部第二特征图划分为一个特征组,将腿部第一特征图和腿部第二特征图划分为一个特征组,……。

步骤302,对于各特征组,计算机设备根据特征组中包括的对应同一人体部位的第一特征图和第二特征图之间的损失值确定特征组对应的损失值。

承接上文举例,本申请实施例中,计算机设备可以计算头部第一特征图和头部第二特征图之间的损失值,并将该损失值确定为该特征组对应的损失值。

可选的,本申请实施例中,计算机设备可以根据预设的损失函数计算头部第一特征图和头部第二特征图之间的损失值。

基于相同的原理,计算机设备可以对应不同人体部位的各个特征组的损失值。

步骤303,计算机设备根据各特征组对应的损失值确定待测人物与目标人物是否为同一个人。

计算机设备可以获取对应头部的特征组的损失值、对应手臂的特征组的损失值,对应身体的特征组的损失值、对应腿部的特征组的损失值以及对应脚部的特征组的损失值。

计算机设备根据各特征组对应的损失值确定待测人物与目标人物是否为同一个人的过程可以包括:若各特征组对应的损失值均小于等于损失阈值,那么确定待测人物与目标人物为同一个人。若各特征组对应的损失值中存在大于损失阈值特征组,那么确定待测人物与目标人物不是同一个人。

可选的,计算机设备根据各特征组对应的损失值确定待测人物与目标人物是否为同一个人的过程可以包括:计算机设备可以获取各个人体部位的预设权重,根据各个人体部位的预设权重与各个人体部位对应的特征组对应的损失值进行加权运算,得到的运算结果小于等于损失阈值,那么确定待测人物与目标人物为同一个人。若得到的运算结果大于损失阈值,那么确定待测人物与目标人物不是同一个人。

本申请实施例中,基于不同的人体部位进行特征对比,提高了行人重识别结果的精度。

在一个实施例中,结合上述实施例中的步骤a1和步骤a2公开的内容可知,由于待测视频中的每个图像帧是基于待测人物的边界框截取得到的,这样就会导致,每个图像帧中不仅包括待测人物还包括背景图案,而背景图案会对得到的不同人体部位分别对应的第一特征图造成干扰。为了降低干扰,本申请实施例中,如图4所示,计算机设备对待测视频的每个图像帧中的待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图的过程还可以包括以下内容::

步骤401,计算机设备对于各图像帧,通过语义分割的方式获取图像帧中的待测人物的位置信息。

本申请实施例中,计算机设备可以获取训练好的语义分割模型,语义分割模型可以输出图像帧中待测人物的掩码矩阵,其中,待测人物的掩码矩阵为二值矩阵,掩码矩阵中对应待测人物的矩阵元素表示为1,待测人物之外的区域的矩阵元素表示为2。根据待测人物的掩码矩阵可以确定出待测人物在图像帧中的位置信息。

步骤402,计算机设备根据待测人物的位置信息从图像帧中提取待测人物的图像。

本申请实施例中,计算机设备可以将待测人物的掩码矩阵与图像帧进行合并,从而从图像帧中提取出待测人物的图像。该待测人物的图像中,待测人物之外的区域均为白色背景。

步骤403,计算机设备对基于待测人物的图像,对待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图。

本申请实施例中,计算机设备可以针对只包含待测人物,不包含背景图案的待测人物进行特征提取,以获取待测人物的不同人体部位分别对应的候选特征图。

本申请实施例中,通过剔除背景图案对待测人物的干扰,确保获取的待测人物的不同人体部位的候选特征图更加准确,从而提高行人重识别的精度。

应该理解的是,虽然图1-图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-图4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图5所示,提供了一种行人重识别装置,包括:第一特征提取模块501、第二特征提取模块502和重识别模块503,其中:

第一特征提取模块501,用于对目标人物图像中目标人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第一特征图;

第二特征提取模块502,用于对待测人物图像中待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图;

重识别模块503,用于基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人。

在本申请的一个实施例中,第二特征提取模块502还用于获取待测视频,对待测视频的每个图像帧中的待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图;对每个图像帧中对应同一人体部位的候选特征图进行特征融合处理,得到与各个不同人体部位分别对应的第二特征图。

在本申请的一个实施例中,第二特征提取模块502还用于获取原始视频,并基于目标检测算法确定原始视频的每个视频帧中的待测人物;从视频帧中截取待测人物所在的区域,得到目标图像,并对截取的各目标图像按照时序进行拼接,得到待测视频。

在本申请的一个实施例中,第二特征提取模块502还用于将每个图像帧中对应同一人体部位的候选特征图按位相加。

在本申请的一个实施例中,重识别模块503还用于根据各第一特征图和各第二特征图对应的不同人体部位,确定多个特征组,特征组中包括对应同一人体部位的第一特征图和第二特征图;对于各特征组,根据特征组中包括的对应同一人体部位的第一特征图和第二特征图之间的损失值确定特征组对应的损失值;根据各特征组对应的损失值确定待测人物与目标人物是否为同一个人。

在本申请的一个实施例中,第二特征提取模块502还用于对于各图像帧,通过语义分割的方式获取图像帧中的待测人物的不同人体部位的位置信息;根据不同人体部位的位置信息从图像帧中提取待测人物的不同人体部位;分别对待测人物的不同人体部位进行特征提取,以获取图像帧中的与各个不同人体部位分别对应的候选特征图。

在本申请的一个实施例中,第二特征提取模块502还用于对于待测视频的每个图像帧,通过语义分割的方式获取图像帧中的待测人物的位置信息;根据待测人物的位置信息从图像帧中提取待测人物的图像;基于待测人物的图像,对待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图。

关于行人重识别装置的具体限定可以参见上文中对于行人重识别方法的限定,在此不再赘述。上述行人重识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于多个语义分析模型和特征提取模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种行人重识别方法。

本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

对目标人物图像中目标人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第一特征图;对待测人物图像中待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图;基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取待测视频,对待测视频的每个图像帧中的待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图;对每个图像帧中对应同一人体部位的候选特征图进行特征融合处理,得到与各个不同人体部位分别对应的第二特征图。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取原始视频,并基于目标检测算法确定原始视频的每个视频帧中的待测人物;从视频帧中截取待测人物所在的区域,得到目标图像,并对截取的各目标图像按照时序进行拼接,得到待测视频。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:将每个图像帧中对应同一人体部位的候选特征图按位相加。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据各第一特征图和各第二特征图对应的不同人体部位,确定多个特征组,特征组中包括对应同一人体部位的第一特征图和第二特征图;对于各特征组,根据特征组中包括的对应同一人体部位的第一特征图和第二特征图之间的损失值确定特征组对应的损失值;根据各特征组对应的损失值确定待测人物与目标人物是否为同一个人。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:对于各图像帧,通过语义分割的方式获取图像帧中的待测人物的不同人体部位的位置信息;根据不同人体部位的位置信息从图像帧中提取待测人物的不同人体部位;分别对待测人物的不同人体部位进行特征提取,以获取图像帧中的与各个不同人体部位分别对应的候选特征图。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:对于待测视频的每个图像帧,通过语义分割的方式获取图像帧中的待测人物的位置信息;根据待测人物的位置信息从图像帧中提取待测人物的图像;基于待测人物的图像,对待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图。

本申请实施例提供的计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

对目标人物图像中目标人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第一特征图;对待测人物图像中待测人物的各个不同人体部位分别进行特征提取,得到与各个不同人体部位分别对应的第二特征图;基于各第一特征图和各第二特征图确定待测人物与目标人物是否为同一个人。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取待测视频,对待测视频的每个图像帧中的待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图;对每个图像帧中对应同一人体部位的候选特征图进行特征融合处理,得到与各个不同人体部位分别对应的第二特征图。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取原始视频,并基于目标检测算法确定原始视频的每个视频帧中的待测人物;从视频帧中截取待测人物所在的区域,得到目标图像,并对截取的各目标图像按照时序进行拼接,得到待测视频。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将每个图像帧中对应同一人体部位的候选特征图按位相加。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据各第一特征图和各第二特征图对应的不同人体部位,确定多个特征组,特征组中包括对应同一人体部位的第一特征图和第二特征图;对于各特征组,根据特征组中包括的对应同一人体部位的第一特征图和第二特征图之间的损失值确定特征组对应的损失值;根据各特征组对应的损失值确定待测人物与目标人物是否为同一个人。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对于各图像帧,通过语义分割的方式获取图像帧中的待测人物的不同人体部位的位置信息;根据不同人体部位的位置信息从图像帧中提取待测人物的不同人体部位;分别对待测人物的不同人体部位进行特征提取,以获取图像帧中的与各个不同人体部位分别对应的候选特征图。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对于待测视频的每个图像帧,通过语义分割的方式获取图像帧中的待测人物的位置信息;根据待测人物的位置信息从图像帧中提取待测人物的图像;基于待测人物的图像,对待测人物的各个不同人体部位分别进行特征提取,得到每个图像帧的与各个不同人体部位分别对应的候选特征图。

本申请实施例提供的计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-onlymemory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(randomaccessmemory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(staticrandomaccessmemory,sram)或动态随机存取存储器(dynamicrandomaccessmemory,dram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1