目标检测方法、装置、电子设备、介质和程序产品与流程

文档序号:34391069发布日期:2023-06-08 09:58阅读:26来源:国知局
目标检测方法、装置、电子设备、介质和程序产品与流程

本公开涉及计算机和金融领域,更具体地涉及一种目标检测方法、装置、设备、介质和程序产品。


背景技术:

1、图像目标检测算法是深度学习的一个重要研究方向,在深度学习之前,根据标注的特征,找出图像或视频帧中的目标,通过选择性搜索生成候选框,随后进行分类和回归。

2、目前,目标检测的方法通过卷积网络可以提取出大部分的特征然后进行目标检测工作,但检测准确度不高。


技术实现思路

1、鉴于上述问题,本公开实施例提供了一种提高目标检测准确度的目标检测方法、装置、设备、介质和程序产品,用于至少部分解决上述技术问题。

2、根据本公开实施例的第一个方面,提供了一种目标检测方法,包括:获取待检测的目标图像;对目标图像进行特征提取,得到预处理特征图;基于transformer模块,沿第一方向对预处理特征图进行拆分,得到第一特征图,沿第二方向对第一特征图进行拆分,得到第二特征图;将第一特征图和第二特征图进行特征融合,得到融合特征图;以及对融合特征图进行检测,得到针对目标对象的检测结果。

3、根据本公开的实施例,其中,沿第一方向对预处理特征图进行拆分,得到第一特征图包括:沿预处理特征图的宽度方向对预处理特征图进行拆分,得到多个单位宽度的第一子特征图,其中,第一子特征图的大小为预处理特征图的维度乘以预处理特征图的长度;

4、将多个单位宽度的第一子特征图与预处理特征图进行融合,得到第一特征图。

5、根据本公开的实施例,其中,将多个单位宽度的第一子特征图与预处理特征图进行融合,得到第一特征图包括:根据transformer模块,获取第一子特征图的查询矩阵、键矩阵和值矩阵;将第一子特征图分别与第一子特征图的查询矩阵、键矩阵和值矩阵相乘,分别得到第一查询向量、第一键向量和第一值向量;对第一查询向量、第一键向量和第一值向量进行归一化处理,得到第二子特征图;将多个第二子特征图在宽度方向上进行拼接,得到第三子特征图;基于预处理特征图和第三子特征图,得到第一特征图。

6、根据本公开的实施例,其中,对第一查询向量、第一键向量和第一值向量进行归一化处理,得到第二子特征图包括:对第一键向量进行转置计算,得到第一转置结果;将第一转置结果进行归一化计算,得到第一归一化结果;将第一转置结果、第一归一化结果、第一查询向量和第一值向量通过激活函数计算,得到第二子特征图。

7、根据本公开的实施例,其中,基于预处理特征图和第三子特征图,得到第一特征图包括:将预处理特征图和第三子特征图进行相加,得到第一特征图。

8、根据本公开的实施例,其中,沿第二方向对第一特征图进行拆分,得到第二特征图包括:沿第一特征图的长度方向对第一特征图进行拆分,得到多个单位长度的第四子特征图,其中,第四子特征图的大小为预处理特征图的维度乘以预处理特征图的宽度;将多个单位长度的第四子特征图进行融合,得到第二特征图。

9、根据本公开的实施例,其中,将多个单位长度的第四子特征图进行融合,得到第二特征图包括:根据transformer模块,获取第四子特征图的查询矩阵、键矩阵和值矩阵;

10、将第四子特征图分别与第四子特征图的查询矩阵、键矩阵和值矩阵相乘,分别得到第二查询向量、第二键向量和第二值向量;对第二查询向量、第二键向量和第二值向量进行归一化处理,得到第五子特征图;将多个第五子特征图在长度方向上进行拼接,得到第二特征图。

11、根据本公开的实施例,其中,将第一特征图和第二特征图进行特征融合,得到融合特征图包括:将第一特征图和第二特征图进行相加得到第三特征图;基于transformer模块,将第三特征图输入transformer模块,得到融合特征图。

12、根据本公开的实施例,其中,获取待检测的目标图像包括:获取多种类型的目标图像和目标图像中的目标区域信息;其中,多种类型的目标图像中至少一种类型包含检测目标。

13、根据本公开的实施例,其中,对目标图像进行特征提取,得到预处理特征图包括:将目标图像输入轻量级卷积网络mobilenet中进行特征提取,得到预处理特征图。

14、本公开实施例的第二方面提供了一种目标检测装置,包括:获取模块,用于获取待检测的目标图像;transformer模块,用于从第一方向对预处理特征图进行拆分,得到第一特征图,从第二方向对第一特征图进行拆分,得到第二特征图;融合模块,用于将第一特征图和第二特征图进行特征融合,得到融合特征图;以及分类检测模块,用于对融合特征图进行检测,得到针对目标对象的检测结果。

15、本公开实施例的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述目标检测方法。

16、本公开实施例的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述目标检测方法。

17、本公开实施例的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述目标检测方法。



技术特征:

1.一种目标检测方法,包括:

2.根据权利要求1所述的方法,其中,所述沿第一方向对所述预处理特征图进行拆分,得到第一特征图包括:

3.根据权利要求2所述的方法,其中,所述将所述多个单位宽度的第一子特征图与所述预处理特征图进行融合,得到所述第一特征图包括:

4.根据权利要求3所述的方法,其中,所述对所述第一查询向量、第一键向量和第一值向量进行归一化处理,得到第二子特征图包括:

5.根据权利要求3所述的方法,其中,所述基于所述预处理特征图和所述第三子特征图,得到所述第一特征图包括:

6.根据权利要求1所述的方法,其中,所述沿第二方向对所述第一特征图进行拆分,得到第二特征图包括:

7.根据权利要求6所述的方法,其中,所述将所述多个单位长度的第四子特征图进行融合,得到所述第二特征图包括:

8.根据权利要求7所述的方法,其中,所述将所述第一特征图和所述第二特征图进行特征融合,得到融合特征图包括:

9.根据权利要求1所述的方法,其中,所述获取待检测的目标图像包括:

10.根据权利要求1所述的方法,其中,所述对所述目标图像进行特征提取,得到预处理特征图包括:

11.一种目标检测装置,包括:

12.一种电子设备,包括:

13.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~10中任一项所述的方法。

14.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~10中任一项所述的方法。


技术总结
本公开提供了一种目标检测方法、装置、电子设备、介质和程序产品,可以应用于计算机和金融技术领域。该目标检测方法包括:获取待检测的目标图像;对所述目标图像进行特征提取,得到预处理特征图;基于Transformer模块,沿第一方向对所述预处理特征图进行拆分,得到第一特征图,沿第二方向对所述第一特征图进行拆分,得到第二特征图;将所述第一特征图和所述第二特征图进行特征融合,得到融合特征图;以及对所述融合特征图进行检测,得到针对目标对象的检测结果。

技术研发人员:唐月标,王鹏培,孙才婵,叶泽锐
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1