一种基于安全轨迹树网络的运动规划方法

文档序号:36173263发布日期:2023-11-24 16:45阅读:75来源:国知局
一种基于安全轨迹树网络的运动规划方法

本发明属于神经网络及路径规划领域,具体涉及一种基于安全轨迹树网络的运动规划方法。


背景技术:

1、自动驾驶汽车技术具有减少交通事故、提高交通效率、降低环境污染并为残疾人提供移动能力的优势。经过近十年的快速发展,该技术已经开始融入到人们的日常生活中。当前自动驾驶汽车在不同的交通场景下执行点对点的导航任务时,整体框架仍然遵循移动机器人系统“感知-规划-控制”的基础设计。在确定全局路线后,运动规划部分负责生成车辆实时运行所需的短期无碰撞轨迹。运动规划常常和行为决策耦合后在整个框架中发挥着关键性的作用。解决运动规划问题需要同时考虑多种约束,主要包括车辆动力学方面的可行性约束,周围动态环境的实时交互约束,红绿灯等交通规则约束以及完成任务所需的时间效率约束等。这些不同约束条件的叠加使运动规划任务变得非常复杂,也使自动驾驶汽车做出合理的决策变得困难。因此,运动规划任务目前仍然存在许多开放性的挑战需要解决。

2、此外,基于模仿学习的运动规划方法仍然无法解决“惯性问题”,即自动驾驶汽车在复杂场景中保持长期静止不动的现象。


技术实现思路

1、本发明重点关注规划模块安全性以及自动驾驶整体任务的完成性,提供了一种基于安全轨迹树网络的运动规划方法,利用安全轨迹树网络(safe trajectory treenetwork,ttnet)解决上述问题。

2、本发明采用如下技术方案来实现的:

3、一种基于安全轨迹树网络的运动规划方法,该方法通过轨迹树和神经网络的组合来完成自动驾驶汽车的规划任务以及周围交通参与者的多模态轨迹预测任务,具体包括以下步骤:

4、1)自动驾驶汽车和周围交通参与者的轨迹树集合在离线数据处理阶段通过ttnet网络被生成出来;该轨迹树集合能够表示所有交通参与者的离散化可行空间,自动驾驶汽车的轨迹树由多层感知器mlp编码得到轨迹树的深度特征编码;

5、2)将这些深度特征编码之间经过级联后送入ttnet网络的transformer编码器中,自车、周围交通参与者和局部参考线三种类型信息之间在空间transformer编码器经过充分的特征融合后,输出整体交互编码;

6、3)ttnet网络应用了两个辅助任务以增强网络对于相关信息的处理能力;第一个辅助任务是多模态轨迹预测任务,第二个辅助任务是利用mlp将自车融合后深度特征编码输入映射成自车的当前速度。

7、本发明进一步的改进在于,步骤1)中,通过ttnet网络表示所有交通参与者的离散化可行空间,ttnet网络选择离散化表征方式,该表征由5个部分组成的:a)智能体观测特征集合,b)交通信号灯状态,c)目标点,d)局部参考线,e)轨迹树。

8、本发明进一步的改进在于,步骤1)中,通过ttnet表示轨迹树集合,轨迹树的生成过程分为两阶段,即扩展阶段和精炼阶段,整个过程是在训练阶段前离线完成的。

9、本发明进一步的改进在于,拓展阶段中,ttnet网络利用了多时间间隔,在实践中,ttnet网络使用两个时间步长作为间隔,随后,每个中间节点采用相同过程进行拓展,直至得到最终的叶节点,由此得到初步的简化轨迹树。

10、本发明进一步的改进在于,精炼阶段即在拓展过程结束后,ttnet网络引入标准欧拉螺旋线来优化轨迹树结构,提高轨迹树质量。

11、本发明进一步的改进在于,步骤2)中,通过transformer编码器将深度特征编码输出为整体交互编码,空间transformer编码器用于提取自车和周围交通参与者之间的空间交互特征,还用于提取局部参考线orf和智能体观测特征集合oob之间的空间交互特征。

12、本发明进一步的改进在于,空间transformer编码器由8组相同的网络层组成,每层网络分成两个网络子层,第一个网络子层是多头注意力子层,第二个网络子层是多层前馈网络子层,每个网络子层之间都顺序经过残差连接和层标准化。

13、本发明进一步的改进在于,步骤3)中,ttnet网络采用轨迹测量操作,计算轨迹树中所有叶轨迹和未来轨迹真值之间的l2距离;计算完成后,最接近未来真实轨迹的叶轨迹索引号被设置为q,并用其对得分向量p进行监督学习;同时ttnet网络将焦点损失函数引入训练过程中:

14、

15、式中:k表示叶轨迹的索引;αk用于调整不同标签的损失权重;γ=2用于平衡标签的分布。

16、与现有技术相比,本发明至少具有如下有益的技术效果:

17、本发明提供的一种基于安全轨迹树网络的运动规划方法,ttnet网络的关键模块是预定义的轨迹树。具体而言,ttnet网络将传统运动规划方法中的可解释性输入表达方式引入基于学习的运动规划方法框架中。可解释性输入表达包括感知结果的边界框以及从全局路线获得的局部参考线。这种表达方式可以很容易地从端到端方法的辅助任务获得,也可以从传统自动驾驶整体框架的感知模块中获得。因此,ttnet网络可以作为端到端方法的一部分或者传统运动规划方法的替代方案,被无缝衔接到自动驾驶整体框架中。轨迹树不仅能够满足车辆运动学约束并显式表达自动驾驶汽车不同的行为意图,而且能够同时作用于核心的运动规划任务以及轨迹预测辅助任务,从而使ttnet网络具备了探索轨迹预测与运动规划之间交互的能力。

18、进一步,本发明提出了基于模仿学习的多任务规划框架,利用基于transformer的主干网络来精准捕捉不同交通参与者以及自动驾驶汽车局部参考线之间的交互信息。

19、进一步,构造了具有曲率连续性和运动学可行性的轨迹树,不仅可以作为规划输出,而且可以用于轨迹预测,从而形成预测规划多任务框架。

20、进一步,引入了可解释性的输入表达,从而使ttnet网络很容易地接入到自动驾驶整体任务中。同时设计了一种焦点损失函数,有效增强了ttnet网络处理复杂场景的能力。



技术特征:

1.一种基于安全轨迹树网络的运动规划方法,其特征在于,该方法通过轨迹树和神经网络的组合来完成自动驾驶汽车的规划任务以及周围交通参与者的多模态轨迹预测任务,具体包括以下步骤:

2.根据权利要求1所述的一种基于安全轨迹树网络的运动规划方法,其特征在于,步骤1)中,通过ttnet网络表示所有交通参与者的离散化可行空间,ttnet网络选择离散化表征方式,该表征由5个部分组成的:a)智能体观测特征集合,b)交通信号灯状态,c)目标点,d)局部参考线,e)轨迹树。

3.根据权利要求1所述的一种基于安全轨迹树网络的运动规划方法,其特征在于,步骤1)中,通过ttnet表示轨迹树集合,轨迹树的生成过程分为两阶段,即扩展阶段和精炼阶段,整个过程是在训练阶段前离线完成的。

4.根据权利要求3所述的一种基于安全轨迹树网络的运动规划方法,其特征在于,拓展阶段中,ttnet网络利用了多时间间隔,在实践中,ttnet网络使用两个时间步长作为间隔,随后,每个中间节点采用相同过程进行拓展,直至得到最终的叶节点,由此得到初步的简化轨迹树。

5.根据权利要求3所述的一种基于安全轨迹树网络的运动规划方法,其特征在于,精炼阶段即在拓展过程结束后,ttnet网络引入标准欧拉螺旋线来优化轨迹树结构,提高轨迹树质量。

6.根据权利要求1所述的一种基于安全轨迹树网络的运动规划方法,其特征在于,步骤2)中,通过transformer编码器将深度特征编码输出为整体交互编码,空间transformer编码器用于提取自车和周围交通参与者之间的空间交互特征,还用于提取局部参考线orf和智能体观测特征集合oob之间的空间交互特征。

7.根据权利要求6所述的一种基于安全轨迹树网络的运动规划方法,其特征在于,空间transformer编码器由8组相同的网络层组成,每层网络分成两个网络子层,第一个网络子层是多头注意力子层,第二个网络子层是多层前馈网络子层,每个网络子层之间都顺序经过残差连接和层标准化。

8.根据权利要求1所述的一种基于安全轨迹树网络的运动规划方法,其特征在于,步骤3)中,ttnet网络采用轨迹测量操作,计算轨迹树中所有叶轨迹和未来轨迹真值之间的l2距离;计算完成后,最接近未来真实轨迹的叶轨迹索引号被设置为q,并用其对得分向量p进行监督学习;同时ttnet网络将焦点损失函数引入训练过程中:


技术总结
本发明公开了一种基于安全轨迹树网络的运动规划方法,包括:通过TTNET网络生成能够表示所有交通参与者的离散化可行空间的轨迹树;通过多层感知器MLP编码得到深度特征编码,自动驾驶汽车及其周围交通参与者的边界框特征和局部参考线的深度特征编码;这些深度特征编码之间经过级联后被送入空间Transformer编码器中,经过充分的特征融合,输出整体交互编码;将整体交互编码输入轨迹预测辅助与安全轨迹树网络模型,输出最终的运动规划轨迹。相较于现有方法,TTNET网络在CARLA Town05闭环测试基准上的驾驶分数提高了8.3%,路线完成度上提高了39.2%;在CARLA Longest6基准上,TTNET网络的遵守交通规则的分数提高了10.6%。同时,TTNET网络还具有至少28赫兹的推理速度,比最好的方法快了1.5倍。

技术研发人员:孙宏滨,陈黎明,陈炜煌,冀皓煊,杨彦龙,张敬敏
受保护的技术使用者:西安交通大学
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1