目标检测方法、目标检测模型的训练方法、装置和设备与流程

文档序号：33561581发布日期：2023-03-22 14:44阅读：来源：国知局

技术特征：
1.一种目标检测方法，包括：将待检测图像分片，获得n个分片图像，其中每个分片图像包括所述待检测图像的部分区域，n大于或等于2；对所述n个分片图像提取特征，获得n个分片图像特征；将所述n个分片图像特征输入至n个transformer模型，其中每个transformer模型用于建立其对应输入的分片图像特征与其余至少一个分片图像特征之间的关联关系；根据所述n个transformer模型的输出获得所述待检测图像中的至少一个目标。2.根据权利要求1所述的方法，其中，第一分片图像特征为所述n个分片图像特征中任一个，第一transformer模型为所述n个transformer模型中任一个，所述将所述n个分片图像特征输入至n个transformer模型包括：将所述第一分片图像特征和其余至少一个分片图像特征输入至所述第一transformer模型的编码器；利用所述第一transformer模型的编码器建立所述第一分片图像特征和其余至少一个分片图像特征之间的关联关系。3.根据权利要求2所述的方法，其中，所述利用所述第一transformer模型的编码器建立所述第一分片图像特征和其余至少一个分片图像特征之间的关联关系包括：根据所述第一分片图像特征和第一权重得到第一向量；根据所述第一分片图像特征和其余至少一个分片图像特征，通过第二权重得到第二向量；根据所述第一分片图像特征和其余至少一个分片图像特征，通过第三权重得到第三向量；根据所述第一向量、第二向量和所述第三向量建立所述关联关系。4.根据权利要求2或3所述的方法，其中，所述第一transformer模型的编码器与其余至少一个transformer模型的编码器之间的编码器权重相同或不同，所述编码器权重包括第一权重、第二权重和第三权重中至少一个。5.根据权利要求3所述的方法，其中，所述通过第二权重得到第二向量，及通过第三权重得到第三向量包括：对所述第一分片图像特征和其余至少一个分片图像特征进行拼接，得到第二分片图像特征；根据所述第二分片图像特征和所述第二权重得到所述第二向量；根据所述第二分片图像特征和所述第三权重得到所述第三向量。6.根据权利要求2所述的方法，其中，所述根据所述n个transformer模型的输出获得所述待检测图像中的至少一个目标包括：将所述第一transformer模型的编码器输出输入至所述第一transformer模型的解码器，所述编码器输出包括所述第一分片图像特征和其余至少一个分片图像特征之间的关联关系；将所述第一transformer模型的解码器输出输入至分类检测模型，获得所述待检测图像中的至少一个目标。7.根据权利要求1所述的方法，其中，在将所述n个分片图像特征输入至n个
transformer模型之前，还包括：根据预设顺序设置所述n个分片图像与所述n个transformer模型之间的对应关系，其中，所述n个分片图像按照所述预设顺序对所述待检测图像进行分片获得。8.一种目标检测模型的训练方法，包括：对训练样本图像分片，获得m个分片图像，其中每个分片图像包括所述训练样本图像的部分区域，m大于或等于2；对所述m个分片图像提取特征，获得m个分片图像特征；将所述m个分片图像特征输入至m个transformer模型，其中每个transformer模型用于建立其对应输入的分片图像特征与其余至少一个分片图像特征之间的关联关系；根据所述m个transformer模型的输出获得所述训练样本图像中的至少一个预测目标；根据所述至少一个预测目标与所述训练样本图像对应的目标标签之间的损失函数值，更新所述目标检测模型的参数。9.一种目标检测装置，包括：第一分片模块，用于将待检测图像分片，获得n个分片图像，其中每个分片图像包括所述待检测图像的部分区域，n大于或等于2；第一提取模块，用于对所述n个分片图像提取特征，获得n个分片图像特征；第一输入模块，用于将所述n个分片图像特征输入至n个transformer模型，其中每个transformer模型用于建立其对应输入的分片图像特征与其余至少一个分片图像特征之间的关联关系；第一目标模块，用于根据所述n个transformer模型的输出获得所述待检测图像中的至少一个目标。10.一种目标检测模型的训练装置，包括：第二分片模块，用于对训练样本图像分片，获得m个分片图像，其中每个分片图像包括所述训练样本图像的部分区域，m大于或等于2：第二提取模块，用于对所述m个分片图像提取特征，获得m个分片图像特征；第二输入模块，用于将所述m个分片图像特征输入至m个transformer模型，其中每个transformer模型用于建立其对应输入的分片图像特征与其余至少一个分片图像特征之间的关联关系；第二目标模块，用于根据所述m个transformer模型的输出获得所述训练样本图像中的至少一个预测目标；模型训练模块，用于根据所述至少一个预测目标与所述训练样本图像对应的目标标签之间的损失函数值，更新所述目标检测模型的参数。11.一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器执行根据权利要求1～7中任一项所述的方法。12.一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器执行根据权利要求1～7中任一项所述的方法。
13.一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现根据权利要求1～7中任一项所述的方法。

技术总结
本公开提供了一种目标检测方法、目标检测模型的训练方法、装置、设备、介质和程序产品，涉及人工智能领域。上述目标检测方法包括：将待检测图像分片，获得N个分片图像；对所述N个分片图像提取特征，获得N个分片图像特征；将所述N个分片图像特征输入至N个Transformer模型，其中每个Transformer模型用于建立其对应输入的分片图像特征与其余至少一个分片图像特征之间的关联关系；根据所述N个Transformer模型的输出获得所述待检测图像中的至少一个目标。本公开实施例通过每个Transformer模型建立其对应输入的分片图像特征与其余至少一个分片图像特征之间的关联关系，从而提取待检测图像中像素间的关联关系结构特征，更准确的检测出目标区域。检测出目标区域。检测出目标区域。

技术研发人员：唐月标王鹏培孙才婵叶泽锐
受保护的技术使用者：中国工商银行股份有限公司
技术研发日：2022.11.22
技术公布日：2023/3/21

完整全部详细技术资料下载

当前第2页1 2