一种目标检测模型的训练方法、训练装置及存储介质与流程

文档序号:36655403发布日期:2024-01-06 23:42阅读:23来源:国知局
一种目标检测模型的训练方法、训练装置及存储介质与流程

本技术涉及图像检测,特别是涉及一种目标检测模型的训练方法、训练装置及存储介质。


背景技术:

1、目标检测作为计算机视觉领域的的核心研究方向,被广泛应用在智能安防、工业检测、医学诊断等等众多领域。

2、通常,基于卷积神经网络(convolution neural network,cnn)的检测方法检测可以大致分为两阶段检测器和一个阶段检测器。两阶段检测器往往是先使用区域候选网络生产候选框,随后在下一阶段对候选框位置进行修正得到最终的预测结果。由于这种方法的多阶段性质,这些检测器检测效率始终不高。相反,一阶段检测器直接预测目标类别并在卷积特征图上回归边界框,由于整个网络被简化,因此,一阶段检测器通常比两阶段检测器具有更快地推理速度,但是其模型大小和推理效率在某些嵌入式设备和边缘移动平台上仍然难以接受。为此设计模型,部署于嵌入式设备和边缘移动平台上一直是一项研究难点。


技术实现思路

1、为解决上述问题,本技术公开了一种目标检测模型的训练方法、训练装置及存储介质,能够聚集局部特征的提取,同时也能够降低模型参数量,从而保证模型的高精度以及达到高效推理速度,且可以在嵌入式设备以及移动端设备上进行部署。

2、本技术采用的一个技术方案是:提供一种目标检测模型的训练方法。其中,该目标检测模型的训练方法包括:构建初始模型;其中,初始模型包括依次连接的骨干网络、颈部网络和头部网络,骨干网络包括特征提取模块,特征提取模块包括重参数通道混洗单元,重参数通道混洗单元包括通道分离模块、第一阶段处理模块、第二阶段处理模块、第三阶段处理模块、全连接模块和通道混洗模块依次连接形成的分支,其中,第一阶段处理模块和第三阶段处理模块均包括卷积分支和批量归一化分支,第二阶段处理模块包括两路卷积分支;将样本数据输入至初始模型进行训练,得到中间模型;对中间模型的第一阶段处理模块、第二阶段处理模块和第三阶段处理模块中的两路分支调整为单路分支,以得到目标检测模型。

3、其中,第一阶段处理模块和第三阶段处理模块均包括一个1×1基础卷积卷积分支和一个批量归一化分支,第二阶段处理模块包括两个3×3逐通道卷积分支。

4、其中,对中间模型的第一阶段处理模块、第二阶段处理模块和第三阶段处理模块中的两路分支调整为单路分支,包括:将第一阶段处理模块和第三阶段处理模块中的一个1×1基础卷积卷积分支和一个批量归一化分支合并为一个1×1卷积分支;以及将第二阶段处理模块中的两个3×3逐通道卷积分支合并为一个3×3卷积分支。

5、其中,骨干网络包括依次连接的第一特征提取模块、第二特征提取模块、第三特征提取模块和第四特征提取模块,其中,第二特征提取模块、第三特征提取模块和第四特征提取模块包括重参数通道混洗单元。

6、其中,第一特征提取模块为stem模块。

7、其中,第二特征提取模块包括一个步幅为1的第一重参数通道混洗单元和三个步幅为2的第二重参数通道混洗单元,第三特征提取模块包括一个第一重参数通道混洗单元和七个第二重参数通道混洗单元,第四特征提取模块包括一个第一重参数通道混洗单元和一个第二重参数通道混洗单元。

8、其中,第一重参数通道混洗单元包括通道分离模块、全连接模块和通道混洗模块依次连接形成的第一分支,通道分离模块、第一阶段处理模块、第二阶段处理模块、第三阶段处理模块、全连接模块和通道混洗模块依次连接形成的第二分支;第二重参数通道混洗单元包括通道分离模块、第一阶段处理模块、第二阶段处理模块、全连接模块和通道混洗模块依次连接形成的第一分支,通道分离模块、第一阶段处理模块、第二阶段处理模块、第三阶段处理模块、全连接模块和通道混洗模块依次连接形成的第二分支。

9、其中,颈部网络包括依次连接的第一卷积模块、转置卷积级联模块和逐通道卷积级联模块。

10、其中,第一卷积模块包括第一卷积单元、第二卷积单元和第三卷积单元,第一卷积单元连接第二特征提取模块,第二卷积单元连接第三特征提取模块,第三卷积单元连接第四特征提取模块;转置卷积级联模块包括第一转置卷积级联模块和第二转置卷积级联模块,第一转置卷积级联模块连接第二卷积单元和第三卷积单元,用于将第二卷积单元输出的第二特征映射和第三卷积单元输出的第三特征映射转化为第四特征映射,第二转置卷积级联模块连接第一卷积单元和第一转置卷积级联模块,用于将第一卷积单元输出的第一特征映射和第四特征映射转化为第五特征映射;逐通道卷积级联模块包括第一逐通道卷积级联模块和第二逐通道卷积级联模块,第一逐通道卷积级联模块连接第一转置卷积级联模块和第二转置卷积级联模块,用于将第五特征映射转化为第一特征图以及用于将第四特征映射和第五特征映射转化为第二特征图,第二逐通道卷积级联模块连接第一逐通道卷积级联模块和第三卷积单元,用于将第三特征映射转化为第三特征图。

11、其中,头部网络包括第一预测单元、第二预测单元和第三预测单元;第一预测单元包括依次连接的第二卷积模块、第一紧凑型卷积模块、第二紧凑型卷积模块、第三卷积模块和类别检测模块;第二预测单元包括依次连接的第二卷积模块、第三紧凑型卷积模块、第四紧凑型卷积模块、第四卷积模块和回归检测模块;第三预测单元包括依次连接的第二卷积模块、第三紧凑型卷积模块、第四紧凑型卷积模块、第五卷积模块和置信度检测模块。

12、其中,将样本数据输入至初始模型进行训练,包括:获取样本数据;将样本数据按照设定比例划分为训练集、验证集和测试集;对训练集进行预处理;将预处理之后的训练集输入至初始模型进行训练。

13、本技术采用的另一个技术方案是:提供一种目标检测模型的训练装置,该训练装置包括处理器和存储器,存储器用于存储程序数据,处理器用于执行程序数据以实现上述的目标检测模型的训练方法。

14、本技术采用的另一个技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质中存储有程序数据,程序数据在被处理器执行时实现上述的目标检测模型的训练方法。

15、本技术提供一种目标检测模型的训练方法、训练装置及存储介质。其中,该目标检测模型的训练方法包括:构建初始模型;其中,初始模型包括依次连接的骨干网络、颈部网络和头部网络,骨干网络包括特征提取模块,特征提取模块包括重参数通道混洗单元,重参数通道混洗单元包括通道分离模块、第一阶段处理模块、第二阶段处理模块、第三阶段处理模块、全连接模块和通道混洗模块依次连接形成的分支,其中,第一阶段处理模块和第三阶段处理模块均包括卷积分支和批量归一化分支,第二阶段处理模块包括两路卷积分支;将样本数据输入至初始模型进行训练,得到中间模型;对中间模型的第一阶段处理模块、第二阶段处理模块和第三阶段处理模块中的两路分支调整为单路分支,以得到目标检测模型。通过上述方式,重参数通道混洗单元最大程度上保留了原始的网络轻量化结构的同时,横向拓展其结构,使得网络在训练时可以更关注局部特征的提取,且利用结构重参数化方式,在推理阶段时将多分路结构转换为单路结构,有效保证了模型特征提取能力和高精度,并降低了模型参数量和运行模型所需的内存资源以及计算资源,达到了更高效推理速度,从而可以在嵌入式设备以及移动端设备上进行部署。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1