基于可分裂卷积大尺度选择性注意力的可行驶区域分割方法及装置

文档序号:37678006发布日期:2024-04-18 20:50阅读:16来源:国知局
基于可分裂卷积大尺度选择性注意力的可行驶区域分割方法及装置

本发明涉及自动驾驶领域,具体涉及一种基于可分裂卷积大尺度选择性注意力的可行驶区域分割方法及装置。


背景技术:

1、自动驾驶技术中的可行驶区域分割技术是指通过对车辆周围环境进行感知和分析,将道路和周围场景划分为可行驶和不可行驶区域的技术。该技术利用传感器、摄像头、激光雷达等设备获取实时的路面信息和障碍物位置,并结合地图数据进行处理和分析,以确定车辆可以安全行驶的区域。可行驶区域分割技术在自动驾驶系统中起到了关键作用,能够提高车辆的感知能力、决策能力和行驶安全性,为实现高度自动化驾驶提供了重要支持。当前主流方法主要采用深度学习语义分割模型对传感器获取的道路图片进行分割,得到可行驶区域和不可行驶区域,但是这些方法在实际应用中存在着一些不足之处。由于道路上的情况复杂多变,且不同环境之间存在较大差异性,上述方法在处理图像的过程中容易造成错误判断,从而对自动驾驶的安全性造成严重影响。因此,设计一种能够提高模型对输入数据的表达能力,从而更好地学习到数据的复杂特征,能够应对复杂的道路环境,提高模型性能并实现分割精度提升的方法具有重大意义。


技术实现思路

1、针对上述提到的技术问题。本技术的实施例的目的在于提出了一种基于可分裂卷积大尺度选择性注意力的可行驶区域分割方法及装置,来解决以上背景技术部分提到的技术问题。

2、第一方面,本发明提供了一种基于可分裂卷积大尺度选择性注意力的可行驶区域分割方法,包括以下步骤:

3、获取道路的实时图像;

4、构建基于改进deeplabv3+网络的可行驶区域分割模型并训练,得到经训练的可行驶区域分割模型,基于改进deeplabv3+网络的可行驶区域分割模型在传统deeplabv3+网络的编码器中的骨干网络和aspp模块之间设置一个可分裂卷积大尺度选择性注意力模块,可分裂卷积大尺度选择性注意力模块包括一系列大尺度卷积核序列、一个空间核选择单元和一个第一卷积层,一系列大尺度卷积核序列包括2~n个可分裂卷积;

5、将实时图像输入经训练的可行驶区域分割模型,实时图像输入骨干网络,得到特征向量,特征向量输入可分裂卷积大尺度选择性注意力模块中,特征向量经过一系列大尺度卷积核序列,得到一系列大尺度卷积核序列中的每个可分裂卷积的输出特征,将一系列大尺度卷积核序列中的每个可分裂卷积的输出特征进行级联,得到级联特征,将级联特征输入空间核选择单元,得到分解后的大核序列特征,分解后的大核序列特征分别与每个可分裂卷积的输出特征相乘,得到每个相乘的结果,将每个相乘的结果相加后输入第一卷积层,得到注意力特征,注意力特征与特征向量相乘,得到可分裂卷积大尺度选择性注意力模块的输出特征,可分裂卷积大尺度选择性注意力模块的输出特征输入aspp模块,再经过解码器进行解码,得到分割结果。

6、作为优选,一系列大尺度卷积核序列中的第n个可分裂卷积的卷积核大小为k,扩张率为d,感受野为r,则其具有如下定义:

7、kn-1≤kn;d1=1,dn-1<dn≤rn-1;

8、r1=k1,rn=dn(kn-1)+rn-1。

9、作为优选,一系列大尺度卷积核序列中的第n个可分裂卷积的计算过程如下:

10、z0=x,

11、其中,zn表示第n个可分裂卷积的输出特征,表示卷积核大小为kn、扩张率为dn、卷积层类型为d的可分裂卷积,x表示特征向量。

12、作为优选,骨干网络为resnet-101,空间核选择单元包括平均池化层、最大池化层、第二卷积层和sigmoid激活函数层。

13、作为优选,将级联特征输入空间核选择单元,得到分解后的大核序列特征,具体包括:

14、分别将级联特征输入平均池化层和最大池化层,得到平均池化特征和最大池化特征,如下式所示:

15、saavg=pavg(z),samax=pmax(z);

16、其中,saavg和samax分别表示平均池化特征和最大池化特征,pavg和pmax分别表示平均池化层和最大池化层,z表示级联特征;

17、将平均池化特征和最大池化特征串联,得到池化特征,池化特征依次经过第二卷积层和sigmoid激活函数层,得到分解后的大核序列特征,如下式所示:

18、

19、

20、其中,f2→n表示第二卷积层,s表示sigmoid激活函数层,[saavg,samax]表示池化特征,sa表示分解后的大核序列特征。

21、作为优选,可分裂卷积包括若干个基组和分裂注意力模块,分裂注意力模块包括全局平均池化层、第三卷积层、批归一化层、relu激活函数层和r-softmax函数层。

22、作为优选,设基组的总数为q,将输入可分裂卷积的输入张量分别输入每个基组,得到每个基组的输出,其中,第a个基组的输出如下式所示:

23、t=fa(x’);

24、其中,a∈{1,2,...,q},x’表示输入可分裂卷积的输入张量,fa表示卷积核大小为ka,扩张率为da的卷积操作;

25、将每个基组的输出通过跨元素求和进行融合,得到基组组合,如下式所示:

26、

27、其中,表示基组组合;

28、基组组合输入全局平均池化层,得到全局背景信息,如下式所示:

29、

30、其中,h表示全局背景信息,h和w表示基组组合的高和宽,i和j表示基组组合上沿x轴和y轴方向上的坐标;

31、全局背景信息依次经过第三卷积层、批归一化层和relu激活函数层,得到特征张量,将特征张量经r-softmax函数层后,分别与每个基组的输出进行像素级的点乘,再进行像素级的相加,得到可分裂卷积的输出特征。

32、第二方面,本发明提供了一种基于可分裂卷积大尺度选择性注意力的可行驶区域分割装置,包括:

33、图像获取模块,被配置为获取道路的实时图像;

34、模型构建模块,被配置为构建基于改进deeplabv3+网络的可行驶区域分割模型并训练,得到经训练的可行驶区域分割模型,基于改进deeplabv3+网络的可行驶区域分割模型在传统deeplabv3+网络的编码器中的骨干网络和aspp模块之间设置一个可分裂卷积大尺度选择性注意力模块,可分裂卷积大尺度选择性注意力模块包括一系列大尺度卷积核序列、一个空间核选择单元和一个第一卷积层,一系列大尺度卷积核序列包括2~n个可分裂卷积;

35、分割模块,被配置为将实时图像输入经训练的可行驶区域分割模型,实时图像输入骨干网络,得到特征向量,特征向量输入可分裂卷积大尺度选择性注意力模块中,特征向量经过一系列大尺度卷积核序列,得到一系列大尺度卷积核序列中的每个可分裂卷积的输出特征,将一系列大尺度卷积核序列中的每个可分裂卷积的输出特征进行级联,得到级联特征,将级联特征输入空间核选择单元,得到分解后的大核序列特征,分解后的大核序列特征分别与每个可分裂卷积的输出特征相乘,得到每个相乘的结果,将每个相乘的结果相加后输入第一卷积层,得到注意力特征,注意力特征与特征向量相乘,得到可分裂卷积大尺度选择性注意力模块的输出特征,可分裂卷积大尺度选择性注意力模块的输出特征输入aspp模块,再经过解码器进行解码,得到分割结果。

36、第三方面,本发明提供了一种电子设备,包括一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。

37、第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。

38、相比于现有技术,本发明具有以下有益效果:

39、(1)本发明提出的基于可分裂卷积大尺度选择性注意力的可行驶区域分割方法中的可行驶区域分割模型以deeplabv3+网络作为基准,在骨干网络后添加了可分裂卷积大尺度选择性注意力模块,对输入特征向量进行优化改进,提高网络模型对于输入数据的表达能力,能够根据不同的场景选择合适的参数值,并利用可分裂卷积提高特征张量目标区域的表示,从而实现对输入信息的高效利用,提高整体检测精度和边缘分割精度。最后由解码器将优化后的特征向量还原为与输入尺寸相同的图像进行输出,得到检测结果。

40、(2)本发明提出的基于可分裂卷积大尺度选择性注意力的可行驶区域分割方法中的可行驶区域分割模型包括一系列大尺度卷积核序列、一个空间核选择单元和一个第一卷积层,大尺度核卷积序列有效提高了神经网络模型的感受野,使得模型从不同范围得到可利用的上下文信息,减少输入信息损失,提高利用效率;空间核选择单元能够根据实际面对场景选择最合适的卷积核,从而提高对当前场景的分割精度。

41、(3)本发明提出的基于可分裂卷积大尺度选择性注意力的可行驶区域分割方法中一系列大尺度卷积核序列包含2~n个可分裂卷积,可分裂卷积将输入张量建立为若干个基组,对其进行跨元素融合再与每个基组的输出相乘,增强目标区域对应像素点的权重大小,从而提高神经网络模型的边缘分割精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1