一种基于双阶段损失函数的目标检测模型训练方法与流程

文档序号：33724733发布日期：2023-04-06 00:02阅读：42来源：国知局

本发明涉及目标检测，尤其涉及一种基于双阶段损失函数的目标检测模型训练方法。

背景技术：

1、计算机视觉是计算机科学领域重要的任务，最近几年随着深度学习的蓬勃发展而取得众多突破。在智慧工厂，安防领域，ai健身，游戏互动领域，智能驾驶领域，2d和3d目标检测是一项重要的任务，是计算机视觉未来发展的重要方向。

2、在深度学习检测领域，算法模型需要根据损失函数，对大量标注的数据进行不断训练，迭代。在训练集上随着损失函数的降低，网络参数不断优化改进，最后收敛出最优的权重参数，保存为模型，用于测试。

3、在目标检测模型训练领域中，iou(intersection over union，两框的交集区域与并集区域的比值)是衡量二个方框位置的重要参数，因此iou系列损失函数在深度学习检测领域作为重要的损失函数被广泛应用。在神经网络里，对检测模型收敛速度和最终精度有很高的要求，提高网络收敛速度和网络最终精度是极其核心的任务。但随着深度学习网络的不断增大，网络参数量和计算量大大增大；同时网络需要大量的数据进行训练以保证精度，因此网络需要训练很久，时间周期太久。

4、现有的iou系列损失函数研究很少，未对候选框与目标框的具体参数进行分析，对于复杂的场景，神经网络收敛速度很慢，进而导致训练周期太久，尤其包含有transformer模块的网络结构，计算量极其大，网络训练周期太久；且最终模型的精度有待进一步提高。

技术实现思路

1、本发明主要解决现有技术的iou损失函数，未对候选框与目标框之的具体参数进行分析，无法提高网络的收敛速度和最终精度等技术问题，提出一种基于双阶段损失函数的目标检测模型训练方法，损失函数可以根据iou值是否为零自动选择损失函数，使神经网络参数优化更有针对性，以提高网络的收敛速度和最终的模型检测精度。

2、本发明提供了一种基于双阶段损失函数的目标检测模型训练方法，包括以下过程：

3、步骤100，获取检测图片训练集中的训练图片，根据训练图片的标注信息，提取目标框的位置；

4、步骤200，将训练图片输入到神经网络模型进行训练，输出多个候选框；

5、步骤300，依次计算每个候选框与目标框之间的iou值，并根据候选框与目标框的iou值，确定候选框与目标框的iou损失函数；

6、当候选框与目标框的iou值为0时，损失函数为：

7、

8、当候选框与目标框的iou值大于零时，损失函数为：

9、

10、其中，

11、其中，

12、式中，iou表示候选框与目标框的面积的交集与面积并集之比，p表示候选框与目标框之间的中心点距离的欧氏距离，c表示包含候选框与目标框的最小封闭矩形区域的对角线的欧氏距离，w表示候选框的宽度，h表示候选框的高度；wgt表示目标框的宽度，hgt表示目标框的高度，m是惩罚因子；

13、步骤400，根据确定的损失函数，优化神经网络模型，使神经网络模型快速收敛；

14、步骤500，按照步骤100至步骤400的方法，依次利用检测图片训练集中的每一张训练图片，进行训练，得到目标检测模型。

15、优选的，所述目标框携带有中心点位置、高度值、宽度值、目标框物体类别信息。

16、优选的，所述神经网络模型采用yolov7网络。

17、本发明提供的一种基于双阶段损失函数的目标检测模型训练方法，通过提出双阶段的损失函数，对于距离很远，候选框与目标框的iou值是0时，神经网络最核心的任务是快速拉近二个方框的中心点位置，此时采用第一阶段损失函数；当iou大于0的时候，采用第二阶段损失函数。针对候选框与目标框不同位置，损失函数会自动调整，进而提高网络收敛速度和模型精度。

18、本发明根据候选框与目标框的具体位置，为神经网络提供更有针对性的损失函数，神经网络的参数优化更明确、更有针对性，训练过程更加高效，进而进一步提升检测模型的准确度和性能。充分考虑候选框与目标框的位置信息，长宽比值信息，中心点距离信息，可以提高检测模型的模型精度。

19、对于候选框和真实框距离差别较大的场景，双阶段损失函数有巨大优势快速提高模型收敛速度。对于使用iou的领域，如3d物体检测领域，re-id(行人重识别领域)，物体跟踪，均可以使用本发明的改进点以提高模型训练速度和最终精度。

技术特征：

1.一种基于双阶段损失函数的目标检测模型训练方法，其特征在于，包括以下过程：

2.根据权利要求1所述的基于双阶段损失函数的目标检测模型训练方法，其特征在于，所述目标框携带有中心点位置、高度值、宽度值、目标框物体类别信息。

3.根据权利要求1所述的基于双阶段损失函数的目标检测模型训练方法，其特征在于，所述神经网络模型采用yolov7网络。

技术总结
本发明涉及目标检测技术领域，提供一种基于双阶段损失函数的目标检测模型训练方法，包括：获取检测图片训练集中的训练图片，根据训练图片的标注信息，提取目标框的位置；将训练图片输入到神经网络模型进行训练，输出多个候选框；依次计算每个候选框与目标框之间的iou值，并根据候选框与目标框的iou值，确定候选框与目标框的iou损失函数；根据确定的损失函数，优化神经网络模型；依次利用检测图片训练集中的每一张训练图片，进行训练，得到目标检测模型。本发明损失函数可以根据iou值是否为零自动选择损失函数，提高网络的收敛速度和最终的模型检测精度。

技术研发人员：李翔,韩潼瑜,黄玉阔
受保护的技术使用者：功夫链（上海）体育文化发展有限公司
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李翔韩潼瑜黄玉阔
技术所有人：功夫链（上海）体育文化发展有限公司
我是此专利的发明人

上一篇：一种转台吸盘治具的制作方法
上一篇：TTR重组蛋白在制备防治威廉姆斯征综合征药物中的应用

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。