基于多尺度信息交互网络的文本-图像行人重识别方法

文档序号：37363624发布日期：2024-03-22 10:16阅读：来源：国知局

技术特征：

1.一种基于多尺度信息交互网络的文本-图像行人重识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于多尺度信息交互网络的文本-图像行人重识别方法，其特征在于，所述前景增强判别器模块由空间引导定位模块和通道去噪模块组成；

3.根据权利要求2所述的基于多尺度信息交互网络的文本-图像行人重识别方法，其特征在于，所述步骤2.3包括：

4.根据权利要求3所述的基于多尺度信息交互网络的文本-图像行人重识别方法，其特征在于，所述步骤3中的总的损失函数ltotal是按如下步骤得到：

5.一种电子设备，包括存储器以及处理器，其特征在于，所述存储器用于存储支持处理器执行权利要求1-4中任一所述文本-图像行人重识别方法的程序，所述处理器被配置为用于执行所述存储器中存储的程序。

6.一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行权利要求1-4中任一所述文本-图像行人重识别方法的步骤。

技术总结
本发明公开一种基于多尺度信息交互网络的文本‑图像行人重识别方法，其步骤包括：1、收集成对的文本描述和行人图像并进行统一的预处理，获取跨模态行人重识别数据集；2、构建多尺度信息交互网络包括：双路径图像‑文本特征提取网络，基于注意力的隐式多尺度特征更新网络，基于多元注意力交互机制的跨模态特征联合网络；3、采用联合跨模态投影匹配损失、身份损失和多样性损失来训练优化网络模型，得到最优多尺度信息交互模型，用于对输入的待检测的文本进行图像匹配，并输出对应的目标行人图像。本发明充分利用两种模态的细粒度信息，缩小模态之间的差距，提高文本‑图像行人重识别的准确率。

技术研发人员：孙锐,杜云,陈龙,黄国熙,王学斌,张旭东
受保护的技术使用者：合肥工业大学
技术研发日：
技术公布日：2024/3/21

完整全部详细技术资料下载

当前第2页1 2