基于多尺度信息交互网络的文本-图像行人重识别方法

文档序号:37363624发布日期:2024-03-22 10:16阅读:来源:国知局

技术特征:

1.一种基于多尺度信息交互网络的文本-图像行人重识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多尺度信息交互网络的文本-图像行人重识别方法,其特征在于,所述前景增强判别器模块由空间引导定位模块和通道去噪模块组成;

3.根据权利要求2所述的基于多尺度信息交互网络的文本-图像行人重识别方法,其特征在于,所述步骤2.3包括:

4.根据权利要求3所述的基于多尺度信息交互网络的文本-图像行人重识别方法,其特征在于,所述步骤3中的总的损失函数ltotal是按如下步骤得到:

5.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1-4中任一所述文本-图像行人重识别方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

6.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1-4中任一所述文本-图像行人重识别方法的步骤。


技术总结
本发明公开一种基于多尺度信息交互网络的文本‑图像行人重识别方法,其步骤包括:1、收集成对的文本描述和行人图像并进行统一的预处理,获取跨模态行人重识别数据集;2、构建多尺度信息交互网络包括:双路径图像‑文本特征提取网络,基于注意力的隐式多尺度特征更新网络,基于多元注意力交互机制的跨模态特征联合网络;3、采用联合跨模态投影匹配损失、身份损失和多样性损失来训练优化网络模型,得到最优多尺度信息交互模型,用于对输入的待检测的文本进行图像匹配,并输出对应的目标行人图像。本发明充分利用两种模态的细粒度信息,缩小模态之间的差距,提高文本‑图像行人重识别的准确率。

技术研发人员:孙锐,杜云,陈龙,黄国熙,王学斌,张旭东
受保护的技术使用者:合肥工业大学
技术研发日:
技术公布日:2024/3/21
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1