一种基于少样本学习的铁路场景目标检测方法

文档序号:37257863发布日期:2024-03-12 20:34阅读:13来源:国知局
一种基于少样本学习的铁路场景目标检测方法

本发明涉及少样本目标检测,尤其涉及一种基于少样本学习的铁路场景目标检测方法。


背景技术:

1、随着铁路的大规模提速与运营里程的不断增加,保障行车安全成为铁路系统的重中之重。异物入侵是威胁铁路运营安全的重要因素之一,由于列车行驶速度快、制动距离长,一旦在行车过程中遇到异物侵入限界,将严重影响正常运行甚至造成惨痛的生命财产损失。

2、铁路目标检测是解决异物入侵问题的关键步骤,相较于传统依赖大量人力的人工巡检方法,基于计算机视觉的目标检测方法具有低成本、高效率等特点。通过实时监控与及时预警,有效避免因异物入侵导致的行车事故,进一步保障铁路运输秩序与旅客出行安全。

3、近些年来,随着计算机视觉的飞速发展,铁路目标检测技术已逐渐成熟,对于人、车、大石头等常见的目标类别,已经达到了较高的检测水平。然而,现有基于深度学习的铁路目标检测技术多建立在对大量样本学习的基础之上,而对于风筝、气球、鸟巢等数量稀缺的铁路少样本目标检测的研究甚少。

4、目前,现有技术中的一种少样本的铁路场景目标检测方法包括:从网络结构入手,使用更加复杂的结构在稀缺的样本资源中提取特征。该方法的缺点包括:占用计算机资源过多、检测速度慢、效率低,不能满足铁路场景下需要实时检测与及时预警的目标需求。


技术实现思路

1、本发明的实施例提供了一种基于少样本学习的铁路场景目标检测方法,以实现有效地对铁路场景图像进行目标检测。

2、为了实现上述目的,本发明采取了如下技术方案。

3、一种基于少样本学习的铁路场景目标检测方法,包括:

4、获取铁路场景图像样本,构建基础数据集、生成数据集和微调数据集;

5、构建用于铁路场景目标检测的卷积神经网络模型,依次使用所述基础数据集、生成数据集和微调数据集训练所述卷积神经网络模型,得到训练好的卷积神经网络模型;

6、将待识别的铁路场景图像输入到所述训练好的卷积神经网络预测模型中,所述训练好的卷积神经网络预测模型输出所述待识别的铁路场景图像的目标识别结果。

7、优选地,所述的获取铁路场景图像样本,构建基础数据集、生成数据集和微调数据集,包括:

8、获取包含一定数量的铁路场景图像样本的公开数据集,将所述公开数据集作为基础数据集;

9、使用样本生成方法和图像风格迁移方法处理铁路场景图像得到生成数据集,由所述基础数据集中的部分数据和所述生成数据组成生成数据集,所述样本生成方法指在无目标的铁路场景图像中添加一个少样本目标,所述图像风格迁移指对图像进行天气迁移和季节迁移处理,通过对图像加雨、雾、雪生成恶劣天气下的铁路场景图像,通过对图像转换季节,生成不同季节下的铁路场景图像;

10、由所述基础数据集中的少量数据和真实铁路少样本目标数据组成微调数据集。

11、优选地,所述公开数据集为包含20种类别样本的voc2007数据集,所述生成数据包含风筝、鸟巢、气球和地膜4种类别,生成数据和部分voc2007数据共同组成生成数据集,收集真实铁路场景包含风筝、鸟巢、气球、地膜4种类别的少样本目标数据,与部分voc2007数据集中的少量数据共同构成微调数据集。

12、优选地,所述的构建用于铁路场景目标检测的卷积神经网络模型,包括:

13、构建用于铁路场景目标检测的卷积神经网络模型,该卷积神经网络模型为fasterr-cnn模型,所述faster r-cnn网络模型由特征提取网络、区域候选网络rpn、兴趣区域池化层、全连接层四部分构成,训练流程为:通过特征提取网络对输入图像特征进行提取得到特征图,使用区域候选网络生成多个感兴趣区域,再通过兴趣区域池化层将区域候选网络输出的兴趣区域和特征提取网络输出的特征图综合得到固定大小的区域特征图,最后通过全连接层进行分类和回归。

14、优选地,所述的依次使用所述基础数据集、生成数据集和微调数据集训练所述卷积神经网络模型,得到训练好的卷积神经网络模型,包括:

15、使用所述基础数据集训练卷积神经网络模型得到基础训练权重,使得卷积神经网络模型能够学习到铁路场景图像样本的泛化的特征表示,所述基础训练权重预测头对应的类别数量为m;

16、修改基础训练权重预测头对应的类别数量为m+n,其中n为生成数据对应的少样本类别,所述基础数据对应的m类权重参数保持不变,生成数据对应的n类权重参数进行随机初始化生成,使用包含m+n类数据的生成数据集训练卷积神经网络模型,得到生成训练权重;

17、使用所述微调数据集训练卷积神经网络预测模型,冻结生成训练权重的卷积神经网络模型的骨干网络参数,调整卷积神经网络预测模型的头部分参数,得到适用于铁路少样本目标检测的微调训练权重结果,将训练后的卷积神经网络预测模型的头部分参数和骨干网络参数进行组合,得到训练好的卷积神经网络预测模型。

18、由上述本发明的实施例提供的技术方案可以看出,本发明的实施例的基于少样本学习的铁路场景目标检测方法,提出了结合样本生成与图像风格迁移进行二次微调的训练框架,从数据增强和迁移学习的角度提高了铁路少样本目标检测的准确率。本方法没有通过构建复杂网络的方法来提高少样本目标检测准确率,可在轻量网络的基础上提升效果,避免了复杂模型占用计算机资源多的情况,具有运行内存小、检测速度快等优点。

19、本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。



技术特征:

1.一种基于少样本学习的铁路场景目标检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述的获取铁路场景图像样本,构建基础数据集、生成数据集和微调数据集,包括:

3.根据权利要求2所述的方法,其特征在于,所述公开数据集为包含20种类别样本的voc2007数据集,所述生成数据包含风筝、鸟巢、气球和地膜4种类别,生成数据和部分voc2007数据共同组成生成数据集,收集真实铁路场景包含风筝、鸟巢、气球、地膜4种类别的少样本目标数据,与部分voc2007数据集中的少量数据共同构成微调数据集。

4.根据权利要求1或者2或者3所述的方法,其特征在于,所述的构建用于铁路场景目标检测的卷积神经网络模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述的依次使用所述基础数据集、生成数据集和微调数据集训练所述卷积神经网络模型,得到训练好的卷积神经网络模型,包括:


技术总结
本发明提供了一种基于少样本学习的铁路场景目标检测方法。该方法包括:获取铁路场景图像样本,构建基础数据集、生成数据集和微调数据集;构建用于铁路场景目标检测的卷积神经网络模型,依次使用基础数据集、生成数据集和微调数据集训练卷积神经网络模型,得到训练好的卷积神经网络模型;将待识别的铁路场景图像输入到训练好的卷积神经网络预测模型中,训练好的卷积神经网络预测模型输出所述待识别的铁路场景图像的目标识别结果。本发明提出了结合样本生成与图像风格迁移进行二次微调的训练框架,从数据增强和迁移学习的角度提高了铁路少样本目标检测的准确率。避免了复杂模型占用计算机资源多的情况,具有运行内存小、检测速度快等优点。

技术研发人员:秦勇,于杭,曹志威,连丽容,白婕,戈轩宇,李威,柳青红,高阳,关吉瑞
受保护的技术使用者:北京交通大学
技术研发日:
技术公布日:2024/3/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1