基于注意力机制的孪生网络解决换装行人重识别的方法

文档序号：26007751发布日期：2021-07-23 21:26阅读：来源：国知局

技术特征：

1.基于注意力机制的孪生网络解决换装行人重识别的方法，其特征在于，包括由视觉流和轮廓流组成的双流孪生网络结构，所述方法包括以下步骤：

s1分别输入原始图和轮廓图；

s2分别对原始图和轮廓图采用resnet-50作为骨干网络提取特征；

s3将提取到的特征分别送入注意力分支和全局分支进行处理；

s4将两个经过处理后的流的总输出进行特征融合，获得最后的输出。

其中，整个过程受损失函数模块引导和约束。

2.根据权利要求1所述的基于注意力机制的孪生网络解决换装行人重识别的方法，其特征在于，所述原始图的特征包括对象的其他身体部位，面部和头发等的颜色信息特征；所述轮廓图的特征包括行人轮廓的身体形状特征。

3.根据权利要求1所述的基于注意力机制的孪生网络解决换装行人重识别的方法，其特征在于，所述注意力分支由位置注意力模块和通道注意力模块组成，将把resnet-50的第五层输出经过一个还原层的结果作为输入，分别送进位置注意力模块和通道注意力模块；最后把位置注意力模块和通道注意力模块的输出与输入进行特征融合作为整个注意力分支的总输出。

4.根据权利要求3所述的基于注意力机制的孪生网络解决换装行人重识别的方法，其特征在于，所述还原层由线性层，batchnormalization层，relu激活层和dropout层构成。

5.根据权利要求4所述的基于注意力机制的孪生网络解决换装行人重识别的方法，其特征在于，所述位置注意力模块包括：对提取特征后的原始输入特征图a，经过由batchnormalization层和relu激活层组成卷积层得到特征图b,特征图c,特征图d。分别对特征图b,特征图c,特征图d进行重组，然后对特征图b进行转置；再将特征图b和特征图c进行一次矩阵乘法后，经过softmax运算得到位置注意力图s，将注意力图s与特征图d进行一次矩阵乘法得到基于注意力的权重图，将权重图与原始输入进行逐元素求和运算得到最终的输出特征图e。

6.根据权利要求4所述的基于注意力机制的孪生网络解决换装行人重识别的方法，其特征在于，所述通道注意力模块包括：对提取特征后的原始输入特征图a进行重组，然后对重组特征图a以及重组转置特征图a进行一次矩阵乘法，经过softmax运算得到注意力图x；将注意力图x与特征图a进行一次矩阵乘法得到基于注意力的权重图，将权重图与原始输入进行逐元素求和运算得到最终的输出特征图e1。

7.根据权利要求1所述的基于注意力机制的孪生网络解决换装行人重识别的方法，其特征在于，所述损失函数模块包括交叉熵损失，换装一致性约束以及权重的正则化损失；其中，交叉熵损失与标签平滑处理结合起来作为一个损失函数，与引导网络学习更具区分性的特征。

8.根据权利要求7所述的基于注意力机制的孪生网络解决换装行人重识别的方法，其特征在于，所述换装一致性约束为缩小换衣服时从同一行人提取的特征之间的距离；其中，换装一致性约束计算如下：

其中，采用余弦约束来缩小跨衣服差异并学习跨衣服不变表示；f代表着行人i在穿着不同衣服a,衣服b时的特征；n代表的是类的总数。

9.根据权利要求1所述的基于注意力机制的孪生网络解决换装行人重识别的方法，其特征在于，还包括在整个网络对权重进行正交正则化，以减少跨不同层的特征相关性并增强深度网络的表达能力；整个网络的总损失函数由交叉熵损失，换装一致性约束损失和权重正则化损失组成，表示如下：

l＝αlxent+βlo.w+γlccic

其中，α，β，γ在公式中作为超参数调整每个损失函数的权重和影响。

技术总结
本发明公开了一种基于注意力机制的孪生网络解决换装行人重识别的方法，包括由视觉流和轮廓流组成的双流孪生网络结构，所述方法包括以下步骤：分别输入原始图和轮廓图；分别对原始图和轮廓图采用ResNet‑50作为骨干网络提取特征；将提取到的特征分别送入注意力分支和全局分支进行处理；将两个经过处理后的流的总输出进行特征融合，获得最后的输出。其中，整个过程受损失函数模块引导和约束。本发明优势在于整个网络架构是一个双流体系结构，同时利用视觉特征和轮廓特征，并利用视觉特征和轮廓特征相结合，去学习既具有区别性又鲁棒稳定的特征，在换装行人重识别领域中非常有价值。

技术研发人员：赖剑煌;黄思恩;冯展祥
受保护的技术使用者：中山大学
技术研发日：2021.01.28
技术公布日：2021.07.23

完整全部详细技术资料下载

当前第2页1 2