一种自动驾驶系统的任务调度策略生成方法及装置

文档序号:36078233发布日期:2023-11-18 00:44阅读:34来源:国知局
一种自动驾驶系统的任务调度策略生成方法及装置

本发明涉及自动控制,具体涉及一种自动驾驶系统的任务调度策略生成方法、任务调度方法及装置。


背景技术:

1、自动驾驶系统(autonomous driving system,简称ads)包括多种传感器,能够基于传感器采集的数据执行相关的计算任务,以实现感知、运动规划与控制。

2、自动驾驶系统的任务调度应以最小化车辆的驾驶决策生成时间与真实环境之间的差距为目标。虽然大量研究提出了模型与优化算法,以缩短执行时间并提升精度。自动驾驶任务的调度属于实时流处理的任务调度的范畴,其中计算任务的相互依赖性由有向无环图(directed acyclic graph,简称dag)来描述。传统的dag调度,即对多核的依赖任务调度已经研究多年,但是大部分研究考虑的性能指标是响应时间和计算吞吐量,这些指标与驾驶安全并非直接相关,对保障驾驶安全性的影响有限。


技术实现思路

1、针对现有技术中的问题,本发明实施例提供一种自动驾驶系统的任务调度策略生成方法、任务调度方法及装置,能够至少部分地解决现有技术中存在的问题。

2、第一方面,本发明提出一种自动驾驶系统的任务调度策略生成方法,包括:

3、获取训练配置数据;其中,所述配置数据包括任务调度周期、核数、调度任务集、训练参数、调度约束条件和调度优化目标函数;

4、根据所述训练参数对应的训练数据、所述任务调度周期、所述核数、所述调度任务集、调度约束条件和调度优化目标函数以及调度任务的马尔科夫决策模型进行强化学习训练,获得所述任务调度策略;其中,所述调度任务的马尔科夫决策模型是预设的。

5、第二方面,本发明提供一种基于上述任一实施例所述的自动驾驶系统的任务调度策略生成方法生成的任务调度策略的自动驾驶系统的任务调度方法,包括:

6、获取各个传感器周期性采集的传感器数据;

7、基于任务调度策略,在每个任务调度周期内获取对应的传感器数据执行各个计算任务生成对应的控制指令;其中,每个调度任务与传感器数据的对应关系是预设的。

8、再一方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述的自动驾驶系统的任务调度策略生成方法或者自动驾驶系统的任务调度方法。

9、又一方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施例所述的自动驾驶系统的任务调度策略生成方法或者自动驾驶系统的任务调度方法。

10、本发明实施例提供的自动驾驶系统的任务调度策略生成方法、任务调度方法及装置,能够获取训练配置数据;其中,配置数据包括任务调度周期、核数、调度任务集、训练参数、调度约束条件和调度优化目标函数;根据训练参数对应的训练数据、任务调度周期、核数、调度任务集、调度约束条件和调度优化目标函数以及调度任务的马尔科夫决策模型进行强化学习训练,获得任务调度策略,能够应用于自动驾驶系统的任务调度,优化车载计算资源的利用,提高自动驾驶的安全性。



技术特征:

1.一种自动驾驶系统的任务调度策略生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述训练参数包括传感器相关特性参数、计算任务相关特征参数和核相关特性参数,其中:

3.根据权利要求1所述的方法,其特征在于,所述任务调度周期为所有传感器的采集周期的公倍数。

4.根据权利要求1所述的方法,其特征在于,所述调度任务的马尔科夫决策模型包括决策过程,其中:

5.根据权利要求4所述的方法,其特征在于,控制命令的信息年龄为计算任务生成控制命令的时间戳与上一轮用于生成控制命令的传感器数据的最小时间戳的时间差。

6.根据权利要求1所述的方法,其特征在于,所述调度优化目标函数表示为:其中,cnk为第k轮生成控制命令的时间戳,sk-1为第k-1轮调度的第n个计算任务使用的传感器数据的最小时间戳,n为调度任务集包括的第k-1轮计算任务的总数量,第n个计算任务即生成控制命令的计算任务,k为正整数。

7.根据权利要求6所述的方法,其特征在于,所述调度约束条件包括:

8.一种基于权利要求1至7任一项所述的自动驾驶系统的任务调度策略生成方法生成的任务调度策略的自动驾驶系统的任务调度方法,其特征在于,包括:

9.一种自动驾驶系统的任务调度策略生成装置,其特征在于,包括:

10.一种基于权利要求9所述的自动驾驶系统的任务调度策略生成装置生成的任务调度策略的自动驾驶系统的任务调度装置,其特征在于,包括:

11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的方法,或者权利要求8所述的方法。

12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法,或者权利要求8所述的方法。


技术总结
本发明提供一种自动驾驶系统的任务调度策略生成方法、任务调度方法及装置,所述方法包括:获取训练配置数据;其中,所述配置数据包括任务调度周期、核数、调度任务集、训练参数、调度约束条件和调度优化目标函数;根据所述训练参数对应的训练数据、所述任务调度周期、所述核数、所述调度任务集、调度约束条件和调度优化目标函数以及调度任务的马尔科夫决策模型进行强化学习训练,获得所述任务调度策略;其中,所述调度任务的马尔科夫决策模型是预设的。所述装置用于执行上述方法。本发明实施例提供的自动驾驶系统的任务调度策略生成方法、任务调度方法及装置,提高自动驾驶的安全性。

技术研发人员:徐倩,徐程远,汪建平
受保护的技术使用者:香港城市大学深圳研究院
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1