图像检测方法、装置、设备、存储介质及计算机程序产品与流程

文档序号:36250122发布日期:2023-12-02 20:18阅读:38来源:国知局
图像检测方法与流程

本申请实施例涉及互联网领域,涉及但不限于一种图像检测方法、装置、设备、存储介质及计算机程序产品。


背景技术:

1、在图像检测领域中,为了识别待检测图像中的待检测目标,通常是将待检测图像和文本描述输入至指向性检测模型,模型的输出是待检测图像中与文本输入相关的坐标位置。

2、但是,相关技术中的指向性检测模型,当输入的待检测图像中不存在输入的文本中所对应的文本描述对象时,指向性检测模型也会以高置信度输出一个坐标,即,相关技术中的指向性检测方法无法判断输入的待检测图像中是否存在文本描述对应的区域,只能在待检测图像中存在文本描述对应的区域的情况下较为准确的框出该区域的坐标。

3、由此可见,相关技术中的指向性检测方法会产生非常多的误识,从而存在检测的准确率较低的问题。


技术实现思路

1、本申请实施例提供一种图像检测方法、装置、设备、存储介质及计算机程序产品,至少能够应用于图像识别领域和指向性检测领域中,通过混合待检测图像和竞争图像进行指向性检测,从而能够提高针对待检测图像中的待检测对象的检测准确率,减少指向性检测过程中的误识。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种图像检测方法,包括:获取待检测图像、竞争图像和指向性描述文本;所述指向性描述文本用于描述所述待检测图像和所述竞争图像中的待检测对象的属性信息;所述竞争图像中包括所述指向性描述文本所描述的待检测对象;对所述待检测图像和所述竞争图像进行图像拼接处理,得到拼接图像;基于所述指向性描述文本,对所述拼接图像进行目标检测,得到至少一个待检测对象的位置信息;基于所述至少一个待检测对象的位置信息确定所述待检测图像的图像检测结果。

4、本申请实施例提供一种图像检测装置,所述装置包括:获取模块,用于获取待检测图像、竞争图像和指向性描述文本;所述指向性描述文本用于描述所述待检测图像和所述竞争图像中的待检测对象的属性信息;所述竞争图像中包括所述指向性描述文本所描述的待检测对象;图像拼接模块,用于对所述待检测图像和所述竞争图像进行图像拼接处理,得到拼接图像;目标检测模块,用于基于所述指向性描述文本,对所述拼接图像进行目标检测,得到至少一个待检测对象的位置信息;检测结果确定模块,用于基于所述至少一个待检测对象的位置信息确定所述待检测图像的图像检测结果。

5、在一些实施例中,所述图像拼接模块还用于:对所述竞争图像进行预设缩放比例的尺寸缩放处理,得到缩放处理后的竞争图像;所述预设缩放比例为0到1之间的任意值;对所述待检测图像与所述缩放处理后的竞争图像进行图像横向拼接处理,得到所述拼接图像。

6、在一些实施例中,所述装置还包括:缩放比例确定模块,用于获取所述待检测图像的宽度和高度,以及,所述竞争图像的宽度和高度;基于所述待检测图像的宽度和高度,确定所述待检测图像的宽高比;基于所述竞争图像的宽度和高度,确定所述竞争图像的宽高比;基于所述待检测图像的宽高比和所述竞争图像的宽高比,确定所述预设缩放比例。

7、在一些实施例中,所述图像拼接模块还用于:基于预设透明度比例,对所述竞争图像进行透明化处理,得到透明化竞争图像;所述预设透明度比例为0到1之间的任意值;对所述待检测图像与所述透明化竞争图像进行图像横向拼接处理,得到所述拼接图像。

8、在一些实施例中,所述检测结果确定模块还用于:如果所述待检测对象的位置信息包括位于所述竞争图像中的一个位置坐标框,确定所述待检测图像的图像检测结果为所述待检测图像中不存在所述指向性描述文本所描述的待检测对象;如果所述待检测对象的位置信息包括位于所述待检测图像中的一个位置坐标框,确定所述待检测图像的图像检测结果为所述待检测图像中存在所述指向性描述文本所描述的待检测对象,且所述待检测对象位于所述位置坐标框对应的位置。

9、在一些实施例中,所述检测结果确定模块还用于:如果所述待检测对象的位置信息包括位于所述待检测图像中的n个位置坐标框,确定所述待检测图像的图像检测结果为所述待检测图像中存在所述指向性描述文本所描述的待检测对象,且所述待检测对象为n个,每个待检测对象位于一个所述位置坐标框对应的位置;n为大于1的整数;如果所述待检测对象的位置信息包括位于所述待检测图像和所述竞争图像中的m个位置坐标框,确定所述待检测图像的图像检测结果为所述待检测图像中存在所述指向性描述文本所描述的待检测对象,且所述待检测对象为m-1个,每个待检测对象位于一个所述位置坐标框对应的位置;m为大于1的整数。

10、在一些实施例中,所述检测结果确定模块还用于:确定所述待检测对象的位置信息中的位置坐标框的数量;如果所述位置坐标框的数量大于1,确定所述待检测图像的图像检测结果为所述待检测图像中存在所述指向性描述文本所描述的待检测对象。

11、在一些实施例中,所述指向性描述文本包括多条子文本;每一所述子文本用于描述一种类型的待检测对象的属性信息;所述目标检测模块还用于:基于每一所述子文本,对所述拼接图像进行目标检测,得到每一种类型的待检测对象的位置信息。

12、在一些实施例中,所述目标检测模块还用于:将所述指向性描述文本和所述拼接图像输入至预先训练的指向性检测模型中;通过所述指向性检测模型的文本编码模块,对所述指向性描述文本进行文本编码处理,得到文本特征;通过所述指向性检测模型的图像编码模块,对所述拼接图像进行图像编码处理,得到图像编码特征;通过所述指向性检测模型的指向性解码模块,对所述文本特征和所述图像编码特征进行特征解码,得到所述至少一个待检测对象的位置信息;其中,每一所述待检测对象的位置信息包括一个位置坐标框的四个位置坐标值。

13、本申请实施例提供一种电子设备,包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现上述的图像检测方法。

14、本申请实施例提供一种计算机程序产品,该计算机程序产品包括可执行指令,可执行指令存储在计算机可读存储介质中;其中,电子设备的处理器从计算机可读存储介质中读取可执行指令,并执行可执行指令时,实现上述的图像检测方法。

15、本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行所述可执行指令时,实现上述的图像检测方法。

16、本申请实施例具有以下有益效果:通过获取待检测图像、竞争图像和指向性描述文本;指向性描述文本用于描述待检测图像和竞争图像中的待检测对象的属性信息;竞争图像中包括指向性描述文本所描述的待检测对象;并对待检测图像和所述竞争图像进行图像拼接处理,得到拼接图像;然后,基于指向性描述文本,对拼接图像进行目标检测,得到至少一个待检测对象的位置信息;最后,基于至少一个待检测对象的位置信息确定待检测图像的图像检测结果。如此,通过混合待检测图像和竞争图像进行指向性检测,从而能够提高针对待检测图像中的待检测对象的检测准确率,减少指向性检测过程中的误识。



技术特征:

1.一种图像检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述待检测图像和所述竞争图像进行图像拼接处理,得到拼接图像,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述待检测图像和所述竞争图像进行图像拼接处理,得到拼接图像,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个待检测对象的位置信息确定所述待检测图像的图像检测结果,包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个待检测对象的位置信息确定所述待检测图像的图像检测结果,包括:

7.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个待检测对象的位置信息确定所述待检测图像的图像检测结果,包括:

8.根据权利要求1所述的方法,其特征在于,所述指向性描述文本包括多条子文本;每一所述子文本用于描述一种类型的待检测对象的属性信息;

9.根据权利要求1至8任一项所述的方法,其特征在于,所述基于所述指向性描述文本,对所述拼接图像进行目标检测,得到至少一个待检测对象的位置信息,包括:

10.一种图像检测装置,其特征在于,所述装置包括:

11.一种电子设备,其特征在于,包括:

12.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于引起处理器执行所述可执行指令时,实现权利要求1至9任一项所述的图像检测方法。

13.一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括可执行指令,所述可执行指令存储在计算机可读存储介质中;


技术总结
本申请实施例提供一种图像检测方法、装置、设备、存储介质及计算机程序产品,至少应用于图像识别领域和指向性检测领域,其中,方法包括:获取待检测图像、竞争图像和指向性描述文本;指向性描述文本用于描述待检测图像和竞争图像中的待检测对象的属性信息;竞争图像中包括指向性描述文本所描述的待检测对象;对待检测图像和竞争图像进行图像拼接处理,得到拼接图像;基于指向性描述文本,对拼接图像进行目标检测,得到至少一个待检测对象的位置信息;基于至少一个待检测对象的位置信息确定待检测图像的图像检测结果。通过本申请,能够提高待检测图像中的待检测对象的检测准确率,减少指向性检测过程中的误识。

技术研发人员:傅朝友,杨金瑞,沈云航,张梦丹,秦玉磊,陈珮娴,李珂,孙星
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1