面向自动驾驶环境的语义分割自动化方法、系统及介质

文档序号:36096122发布日期:2023-11-20 21:39阅读:57来源:国知局
面向自动驾驶环境的语义分割自动化方法

本发明涉及图像语义分割,具体涉及面向自动驾驶环境的语义分割自动化方法、系统及介质。


背景技术:

1、目前自动驾驶避障主要依靠各种图像识别算法,而语义分割正是最重要的一种环境理解手段。它能够实现像素级别的图像分类,对于自动驾驶系统精确把握周围环境信息尤其重要。但是语义分割的训练繁琐且需要大量的人力投入,不适宜模型的快速迁移部署,因此亟需一种能够自动化训练语义分割模型的方法。

2、近年来,自动化机器学习(automl)兴起。automl泛指在机器学习各阶段流程中有一个或多个阶段采取自动化而无需人工参与的实现方案。automl的目的是使人从这些机器学习应用程序中解放出来,摆脱上述繁琐的模型设计与优化等过程,实现真正意义上的机器学习。automl的完整流程由数据准备、特征工程、模型选择、参数优化与模型评估这些过程组成。对于上述五个过程,已经涌现出了不少的算法,甚至是全流程自动化的系统,它们在语音、视频、搜索等领域应用广泛,但是在自动驾驶领域,缺少特异化自动化机器学习方法。

3、语义分割自动化学习已取得不少成果。文件1指出手动设计调整语义分割网络参数需要大量专家工作,同时很难在速度与性能之间找到平衡点,难以达到某些实时应用如自动驾驶的要求。因此他提出了一种可定制的架构搜索方法来自动生成具有特定约束的轻量级网络。这是首次在语义分割自动生成网络架构方向的尝试。文件2指出由于手动设计网络乏味且难以处理,因此对于特定任务的神经网络结构自动化设计是一条非常有前途的途径。他针对语义分割设计使用rnn控制器循环输出网络结构和各层operations,并对紧凑语义分割进行专门修改并加入辅助单元以加速搜索和训练。文件3提出一个包含许多流行设计的网络级搜索空间,并开发了一个允许基于梯度的架构搜索的公式。文件4将nasnet(一种automl强化学习算法)应用于deep u-net网络以提高图像语义分割性能。文件5提出了一种解耦的、细粒度的延迟正则化方法,解决了使用nas自动设计语义分割模型崩溃的问题,更好的实现高精度与低延迟之间的平衡。文件6等人将自动化语义分割引入医学领域,提出了一种用于密集标记的复合结构,其中定制的三维全卷积网络探索初始标记的空间强度并发性,而多向递归神经网络(rnn)编码空间顺序性,以对抗边界模糊性,从而显著细化,可以同时分割多个具有强烈临床意义的解剖结构,包括胎儿、妊娠囊和胎盘。由此可见,语义分割自动化学习正在成为一个非常重要和具有现实意义的研究方向。

4、当前语义分割方法存在以下缺点:

5、(1)在实际应用中,探索未知场景是无法避免的,这也对选取数据的典型性和通用性提出了更高的要求。人工训练语义分割网络需要大量已标注的数据,而数据的采集与标注是一件繁琐的任务。为了提升数据集的质量,不得不认真研究数据的分布,剔除遮挡重叠等不符数据。每一步都需要相当多的人力投入,同时过少的数据容易使网络进入过拟合状态,因此对数据量也提出了要求。

6、(2)在每个阶段训练完成后,需要研究人员评价语义分割学习效果,之后手动调整合适的参数进行二次训练,缺乏自我更新机制,同时调参的过程更是极度依赖研究者的经验判断,具有很强的主观性。

7、[1]zhang,y.,qiu,z.,liu,j.,yao,t.,liu,d.,&mei,t.(2019).customizablearchitecture search for semantic segmentation.in proceedings of the ieeeconference on computer vision and pattern recognition(pp.11641-11650).

8、[2]nekrasov,v.,chen,h.,shen,c.,&reid,i.(2019).fast neuralarchitecture search of compact semantic segmentation models via auxiliarycells.in proceedings of the ieee conference on computer vision andpatternrecognition(pp.9126-9135).

9、[3]liu,c.,chen,l.c.,schroff,f.,adam,h.,hua,w.,yuille,a.l.,&fei-fei,l.

10、(2019).auto-deeplab:hierarchical neural architecture search forsemantic imagesegmentation.in proceedings of the ieee conference on computervision andpattern recognition(pp.82-92)

11、[4]kim,hyoung seok,kee-younyoo,and lae hyun kim."improvedperformanceof image semantic segmentation using nasnet."koreanchemicalengineering research 57.2(2019):274-282.

12、[5]chen,wuyang,et al."fasterseg:searching for faster real-timesemanticsegmentation."arxiv preprint arxiv:1912.10917(2019).

13、[6]yang,xin,et al."towards automated semantic segmentation inprenatalvolumetric ultrasound."ieee transactions on medical imaging 38.1(2018):180-193.


技术实现思路

1、本发明是为了解决语义分割训练数据获取困难与模型训练依赖人工的问题,提供一种面向自动驾驶环境的语义分割自动化方法、系统及介质,考虑到铁路无人驾驶环境的特点,对原始语义分割模型进行优化,挖掘超参数的内在联系,以提高语义分割模型的收敛速度与检测精度。

2、为了解决上述技术问题,本发明实施例提供一种面向自动驾驶环境的语义分割自动化方法,该方法包括以下步骤:

3、步骤s1:获取车前可见光图像数据,对所述车前可见光图像数据进行数据清洗,得到车前可见光图像数据集,将所述车前可见光图像数据集划分为训练数据集和测试数据集;所述车前可见光图像数据包括:不同照明和天气条件下直线、弯道和岔道的轨道图像;

4、步骤s2:将所述训练数据集输入到语义分割模型中进行训练,得到分割图像,对所述分割图像进行评分,得到数据评分;

5、步骤s3:将所述分割图像的数据评分作为轨道状态输入到强化学习模型中进行训练,得到筛选后的分割图像;

6、步骤s4:汇总所述筛选后的分割图像,检索到其原始数据,输入到所述语义分割模型进行二次训练,得到权重参数,将所述权重参数加载到所述语义分割模型中,针对待检测的图像,运行所述语义分割模型得到检测结果。

7、在本发明的一个实施例中,步骤s3中,将所述分割图像的数据评分作为轨道状态输入到强化学习模型中进行训练的具体步骤为:

8、步骤s31:定义动作空间a=<a1,a2,...,an>,s为状态空间,包含n维数据,其中1~n-1维表示之前处理后的数据,第n维表示正在处理的候选数据,状态st∈s表示智能体在t时刻的状态,初始化状态s0、经验回放池d、目标q网络以及当前q网络;

9、步骤s32:智能体根据当前状态st,利用ε-greedy方法选择动作at执行,以1-ε的概率根据当前q网络输出的q值选择动作同时以ε的概率从其他动作中随机选择一个动作at作为当前的动作,执行动作at后,获得奖励rt,同时智能体转移到新状态st+1;

10、步骤s33:智能体将交互经验et=(st,at,rt,st+1)存放到经验回放池dt={e1,...,et}中,同时从dt中随机选择一批经验{e1,...,ej},计算目标值yj和损失函数l(θ),并采用梯度下降法更新当前q网络的参数θ;

11、步骤s34:循环运行步骤s32-s33直到达到设置的最大迭代次数或者网络收敛为止;

12、其中,所述强化学习模型为dqn模型,dqn模型包括智能体与外界环境,智能体与外界环境的交互使用马尔科夫决策过程进行建模。

13、在本发明的一个实施例中,步骤s33中,所述目标值yj的计算公式为:

14、

15、其中,γ∈[0,1]为折扣因子,s′表示更新的状态,a′为根据状态s′,智能体执行最大q值的动作,θ-为目标q网络的参数集合,为目标q网络在第j条经验时输出的q值;

16、所述损失函数l(θ)的计算公式为:

17、

18、其中,q(s,a;θ)表示经过当前q网络输出的q值,θ表示当前q网络更新的参数集合,为目标q网络每隔一段时间更新的目标值,表示方差期望。

19、在本发明的一个实施例中,所述奖励r的计算公式如下:

20、

21、其中,scoren表示状态st第n维数据的评分,即正在处理的候选数据评分,scorei表示被当前候选数据替换的原数据评分。

22、在本发明的一个实施例中,所述当前q网络为n个卷积层和n个全连接层的神经网络结构,所述目标q网络的结构与所述当前q网络的结构一致。

23、在本发明的一个实施例中,所述当前q网络的输入层有n个节点,对应状态空间s的n维数据评分;所述全连接层输出最终保持在终态的n维图像。

24、在本发明的一个实施例中,步骤s2中,所述数据评分的评分等级划为1~100,对于分割效果越差的图像,数据评分越高。

25、在本发明的一个实施例中,步骤s2中,所述语义分割模型为bisenet模型。

26、基于同一发明构思,本发明还公开一种面向自动驾驶环境的语义分割自动化系统,该系统包括:

27、数据集构建模块,获取车前可见光图像数据,对所述车前可见光图像数据进行数据清洗,得到车前可见光图像数据集,将所述车前可见光图像数据集划分为训练数据集和测试数据集;所述车前可见光图像数据包括:不同照明和天气条件下直线、弯道和岔道的轨道图像;

28、获取分割图像模块,用于将所述训练数据集输入到语义分割模型中进行训练,得到分割图像,对所述分割图像进行评分,得到数据评分;

29、图像筛选模块,用于将所述分割图像的数据评分作为轨道状态输入到强化学习模型中进行训练,得到筛选后的分割图像;

30、检测结果获取模块,用于汇总所述筛选后的分割图像,检索到其原始数据,输入到所述语义分割模型进行二次训练,得到权重参数,将所述权重参数加载到所述语义分割模型中,针对待检测的图像,运行所述语义分割模型得到检测结果。

31、本发明还公开一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述面向自动驾驶环境的语义分割自动化方法的步骤。

32、从以上技术方案可以看出,本发明所述的面向自动驾驶环境的语义分割自动化方法采用强化学习机制实现数据选择,性能良好,在训练过程中,强化学习模型的智能体不断优化选择策略,最终达到对数据的准确选择;还通过训练智能体实现数据选择及指导语义分割自动化训练,相比传统的语义分割方法,采用该方法训练语义分割模型收敛速度更快,模型精度更高,有效地解决了语义分割模型训练数据获取困难以及模型训练过程依赖人工的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1