一种行驶轨迹规划方法、装置及存储介质与流程

文档序号:37236855发布日期:2024-03-06 16:58阅读:14来源:国知局
一种行驶轨迹规划方法、装置及存储介质与流程

本公开涉及计算机,尤其涉及自动驾驶、机器学习等人工智能。


背景技术:

1、在路口场景中一般通过简单的规则,评估自动驾驶车辆是否可以通行。例如通过识别在红灯亮起前车辆是否能通过红绿灯停止线,来确定车辆是否应该继续通行。但通过简单规则确定的自动驾驶车辆的通行策略,可能和驾驶员行为相差较大。


技术实现思路

1、本公开提供了一种行驶轨迹规划方法、装置及存储介质。

2、根据本公开的一方面,提供了一种行驶轨迹规划方法,包括:

3、基于同一路口场景的历史行驶轨迹对应的第一回报函数和最优行驶策略对应的第二回报函数,构建该路口场景的目标函数;其中,该第一回报函数和该第二回报函数基于与该路口场景相关的一个或多个状态函数确定,且该第一回报函数的关联参数的值已知,该第二回报函数的关联参数的值未知;

4、基于该目标函数,得到该第二回报函数的状态函数的关联参数的值,以对车辆在该路口场景对应路口的行驶轨迹进行规划。

5、根据本公开的另一方面,提供了一种行驶轨迹规划装置,包括:

6、构建模块,用于基于同一路口场景的历史行驶轨迹对应的第一回报函数和最优行驶策略对应的第二回报函数,构建该路口场景的目标函数;其中,该第一回报函数和该第二回报函数基于与该路口场景相关的一个或多个状态函数确定,且该第一回报函数的关联参数的值已知,该第二回报函数的关联参数的值未知;

7、第一处理模块,用于基于该目标函数,得到该第二回报函数的状态函数的关联参数的值,以对车辆在该路口场景对应路口的行驶轨迹进行规划。

8、根据本公开的另一方面,提供了一种电子设备,包括:

9、至少一个处理器;以及

10、与该至少一个处理器通信连接的存储器;其中,

11、该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开实施例中任一的方法。

12、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。

13、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。

14、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种行驶轨迹规划方法,包括:

2.根据权利要求1所述的方法,基于所述目标函数,得到所述第二回报函数的状态函数的关联参数的值,以对车辆在所述路口场景对应路口的行驶轨迹进行规划,包括:

3.根据权利要求1或2所述的方法,其中,与所述路口场景相关的一个或多个状态函数包括:通行函数、安全函数、行驶特征函数、路口特征函数的至少之一。

4.根据权利要求3所述的方法,其中,所述通行函数包括车辆在路口的通行效率函数,所述通行效率函数基于车辆的速度门限和轨迹中的速度确定;或者

5.根据权利要求1至4中任一项所述的方法,其中,所述目标函数是基于所述第一回报函数的均值和所述第二回报函数的均值确定的;或者

6.根据权利要求1至4中任一项所述的方法,其中,所述目标函数中的求解条件包括所述第二回报函数的均值与所述第一回报函数的均值的差值大于目标值。

7.根据权利要求1至4中任一项所述的方法,其中,所述基于所述目标函数,得到所述第二回报函数中的状态函数的关联参数的值,包括:

8.一种行驶轨迹规划装置,包括:

9.根据权利要求8所述的装置,还包括:

10.根据权利要求8或9所述的装置,其中,与所述路口场景相关的一个或多个状态函数包括:通行函数、安全函数、行驶特征函数、路口特征函数的至少之一。

11.根据权利要求10所述的装置,其中,所述通行函数包括车辆在路口的通行效率函数,所述通行效率函数基于车辆的速度门限和轨迹中的速度确定;或者

12.根据权利要求8至11任一项所述的装置,其中,所述目标函数是基于所述第一回报函数的均值和所述第二回报函数的均值确定的;或者

13.根据权利要求8至11任一项所述的装置,其中,所述目标函数的求解条件包括所述第二回报函数的均值与所述第一回报函数的均值的差值大于目标值。

14.根据权利要求8至11任一项所述的装置,其中,所述第一处理模块用于基于所述目标函数,采用内点法求解得到所述第二回报函数中各个状态函数的权重;

15.一种电子设备,包括:

16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。

17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。


技术总结
本公开提供了一种行驶轨迹规划方法,涉及计算机技术领域,尤其涉及自动驾驶、机器学习等人工智能技术领域。具体实现方案为:基于同一路口场景的历史行驶轨迹对应的第一回报函数和最优行驶策略对应的第二回报函数,构建该路口场景的目标函数;该第一回报函数和该第二回报函数基于与该路口场景相关的一个或多个状态函数确定,且该第一回报函数的关联参数的值已知,该第二回报函数的关联参数的值未知;基于该目标函数,得到该第二回报函数的状态函数的关联参数的值,以对车辆在该路口场景对应路口的行驶轨迹进行规划。本公开实施例通过逆强化学习得到的最优行驶策略的第二回报函数更准确且与路口场景的特征更相关,有利于提高行驶轨迹规划的准确性。

技术研发人员:赵昊玮,汤森基,王浚宇,李俊玲,柳长春
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:
技术公布日:2024/3/5
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1