一种基于双阶段损失函数的目标检测模型训练方法与流程

文档序号:33724733发布日期:2023-04-06 00:02阅读:42来源:国知局
一种基于双阶段损失函数的目标检测模型训练方法与流程

本发明涉及目标检测,尤其涉及一种基于双阶段损失函数的目标检测模型训练方法。


背景技术:

1、计算机视觉是计算机科学领域重要的任务,最近几年随着深度学习的蓬勃发展而取得众多突破。在智慧工厂,安防领域,ai健身,游戏互动领域,智能驾驶领域,2d和3d目标检测是一项重要的任务,是计算机视觉未来发展的重要方向。

2、在深度学习检测领域,算法模型需要根据损失函数,对大量标注的数据进行不断训练,迭代。在训练集上随着损失函数的降低,网络参数不断优化改进,最后收敛出最优的权重参数,保存为模型,用于测试。

3、在目标检测模型训练领域中,iou(intersection over union,两框的交集区域与并集区域的比值)是衡量二个方框位置的重要参数,因此iou系列损失函数在深度学习检测领域作为重要的损失函数被广泛应用。在神经网络里,对检测模型收敛速度和最终精度有很高的要求,提高网络收敛速度和网络最终精度是极其核心的任务。但随着深度学习网络的不断增大,网络参数量和计算量大大增大;同时网络需要大量的数据进行训练以保证精度,因此网络需要训练很久,时间周期太久。

4、现有的iou系列损失函数研究很少,未对候选框与目标框的具体参数进行分析,对于复杂的场景,神经网络收敛速度很慢,进而导致训练周期太久,尤其包含有transformer模块的网络结构,计算量极其大,网络训练周期太久;且最终模型的精度有待进一步提高。


技术实现思路

1、本发明主要解决现有技术的iou损失函数,未对候选框与目标框之的具体参数进行分析,无法提高网络的收敛速度和最终精度等技术问题,提出一种基于双阶段损失函数的目标检测模型训练方法,损失函数可以根据iou值是否为零自动选择损失函数,使神经网络参数优化更有针对性,以提高网络的收敛速度和最终的模型检测精度。

2、本发明提供了一种基于双阶段损失函数的目标检测模型训练方法,包括以下过程:

3、步骤100,获取检测图片训练集中的训练图片,根据训练图片的标注信息,提取目标框的位置;

4、步骤200,将训练图片输入到神经网络模型进行训练,输出多个候选框;

5、步骤300,依次计算每个候选框与目标框之间的iou值,并根据候选框与目标框的iou值,确定候选框与目标框的iou损失函数;

6、当候选框与目标框的iou值为0时,损失函数为:

7、

8、当候选框与目标框的iou值大于零时,损失函数为:

9、

10、其中,

11、其中,

12、式中,iou表示候选框与目标框的面积的交集与面积并集之比,p表示候选框与目标框之间的中心点距离的欧氏距离,c表示包含候选框与目标框的最小封闭矩形区域的对角线的欧氏距离,w表示候选框的宽度,h表示候选框的高度;wgt表示目标框的宽度,hgt表示目标框的高度,m是惩罚因子;

13、步骤400,根据确定的损失函数,优化神经网络模型,使神经网络模型快速收敛;

14、步骤500,按照步骤100至步骤400的方法,依次利用检测图片训练集中的每一张训练图片,进行训练,得到目标检测模型。

15、优选的,所述目标框携带有中心点位置、高度值、宽度值、目标框物体类别信息。

16、优选的,所述神经网络模型采用yolov7网络。

17、本发明提供的一种基于双阶段损失函数的目标检测模型训练方法,通过提出双阶段的损失函数,对于距离很远,候选框与目标框的iou值是0时,神经网络最核心的任务是快速拉近二个方框的中心点位置,此时采用第一阶段损失函数;当iou大于0的时候,采用第二阶段损失函数。针对候选框与目标框不同位置,损失函数会自动调整,进而提高网络收敛速度和模型精度。

18、本发明根据候选框与目标框的具体位置,为神经网络提供更有针对性的损失函数,神经网络的参数优化更明确、更有针对性,训练过程更加高效,进而进一步提升检测模型的准确度和性能。充分考虑候选框与目标框的位置信息,长宽比值信息,中心点距离信息,可以提高检测模型的模型精度。

19、对于候选框和真实框距离差别较大的场景,双阶段损失函数有巨大优势快速提高模型收敛速度。对于使用iou的领域,如3d物体检测领域,re-id(行人重识别领域),物体跟踪,均可以使用本发明的改进点以提高模型训练速度和最终精度。



技术特征:

1.一种基于双阶段损失函数的目标检测模型训练方法,其特征在于,包括以下过程:

2.根据权利要求1所述的基于双阶段损失函数的目标检测模型训练方法,其特征在于,所述目标框携带有中心点位置、高度值、宽度值、目标框物体类别信息。

3.根据权利要求1所述的基于双阶段损失函数的目标检测模型训练方法,其特征在于,所述神经网络模型采用yolov7网络。


技术总结
本发明涉及目标检测技术领域,提供一种基于双阶段损失函数的目标检测模型训练方法,包括:获取检测图片训练集中的训练图片,根据训练图片的标注信息,提取目标框的位置;将训练图片输入到神经网络模型进行训练,输出多个候选框;依次计算每个候选框与目标框之间的iou值,并根据候选框与目标框的iou值,确定候选框与目标框的iou损失函数;根据确定的损失函数,优化神经网络模型;依次利用检测图片训练集中的每一张训练图片,进行训练,得到目标检测模型。本发明损失函数可以根据iou值是否为零自动选择损失函数,提高网络的收敛速度和最终的模型检测精度。

技术研发人员:李翔,韩潼瑜,黄玉阔
受保护的技术使用者:功夫链(上海)体育文化发展有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1