本发明涉及针对至少部分自动化行驶的车辆的驾驶机动动作的规划。
背景技术:
1、至少部分自动化行驶的车辆会持续地检测其所处的情况,以便使对不久的将来的驾驶机动动作的规划适配于这种情况的变化。车辆必须对其做出反应的情况的变化例如可以通过如下方式引起:车辆以不同条件而运动到不同位置。但是,其他对象(例如其他道路使用者)的运动也可能会明显改变所述情况并需要作出反应。de 10 2018 210 280 a1公开了一种可以用于预测外来对象的轨迹以相应适配自己车辆的轨迹的方法。
2、在机动动作级别上,行为规划器基于车辆所处情况的表示而决定要执行的驾驶机动动作、例如变换车道或超车机动动作。然后将所做出的决定传递给运动规划器。该运动规划器的任务是为车辆找到合适的轨迹,并通过作用于执行器使车辆行驶该轨迹。
技术实现思路
1、在本发明的范畴内开发了一种用于训练针对至少部分自动化的车辆的行为规划器的方法。该方法使用在以测试车辆进行的至少一次测试行驶期间所记录的运动学和/或动力学的观察数据。
2、为了与所述测试车辆进行区分,在下文中所述至少部分自动化的车辆被称为“目标车辆”。通常,测试行驶是在人类驾驶员的掌控下完成的。于是,所述测试车辆必须是被设计用于由人类驾驶员控制的车辆。尤其是全自动化行驶的车辆大多并非设计为,选择性地以自动化的方式来控制或由人类驾驶员来控制。
3、从观察数据中标识至少一个将测试车辆从初始状态转换到最终状态的驾驶机动动作。此外,确定机动动作终止时间点,在所述机动动作终止时间点所述测试车辆达到最终状态。为此可以使用任何现有的手段。
4、从目标车辆的动力学模型中调用目标车辆为了执行所标识的驾驶机动动作所需的机动动作持续时间。特别地,目标车辆的行驶物理学体现在所述动力学模型中,所述行驶物理学决定了目标车辆可以多快地根据相应要求而改变其运动学。
5、以所标识的驾驶机动动作来标记来自如下时间间隔的观察数据,所述时间间隔的结束由机动动作终止时间点给出并且其开始比机动动作终止时间点要早出所述机动动作持续时间那么长。这意味着如果目标车辆要以所标识的驾驶机动动作在确定的机动动作终止时间点达到由观察数据给出的最终状态,则该目标车辆必须在该时间间隔内执行所标识的驾驶机动动作。
6、用经标记的观察数据鉴于如下方面对行为规划器进行训练:将指示目标车辆的状态的观察数据映射到要执行的至少一个驾驶机动动作。在此,目标车辆的这种状态不必限于关于目标车辆的运动学和/或动力学的信息,而是还可以包含关于目标车辆所处情况的进一步信息。
7、例如,观察数据可能表明:测试车辆正从后方接近前方行驶的另一辆速度较慢的车辆。在特定时间点,测试车辆的驾驶员为了超过前方行驶的车辆而变换了车道。现在鉴于如下方面来训练行为规划器:在相同情况下在如下时间点开始超车机动动作,在该时间点这基于目标车辆的行驶物理学是必要的或适当的。
8、已认识到:目标车辆的动力学通常与测试车辆的动力学存在显著差异。这尤其是由于:自动化行驶的车辆在设计上构造得与由人类驾驶员控制的测试车辆不同。同时,自动化行驶运行在很多方面都受到特殊的监管附加条件的限制。例如,加速和减速在数值上受到限制,而且车道变换也必须比人类驾驶员更缓地进行。通过使用动力学模型,可以将测试车辆所收集的观察数据“转化”为目标车辆的状况。因此,可以鉴于如下方面训练行为规划器:使得在这些新状况下也实现所期望的成果,即:在给定的机动动作终止时间点完成所确定的驾驶机动动作。
9、同时,动力学模型使测试行驶消除了由人类测试驾驶员的个人驾驶风格引起的主观成分。这种驾驶风格的不同之处主要在于动力,例如,执行超车过程时所采用的动力。另一方面,测试车辆所遵循的单纯路径或多或少是预给定的,并且仅能在极小范围内通过个别驾驶风格而发生改变。
10、借助动力学模型,如果目标车辆的行驶物理学事后发生改变,则可以进一步地再训练或重新训练所述行为规划器。例如,如果拖车连接到目标车辆,则不仅目标车辆的质量惯性而且其空气阻力都会发生变化。此外,方向的突然改变受到额外的限制,以便使拖车不会扯断或翻倒。为了使行为规划器适配于以拖车进行的行驶而仅需要一个新的动力学模型。可以使用此动力学模型和已经现有的观察数据对行为规划器相应进行训练。不需要使用带拖车的测试车辆“熟悉(einfahren)”额外的观察数据。
11、这种再训练或重新训练也可以例如在开发自动化行驶的目标车辆期间变得必要。例如,如果一方面对自动化行驶功能而另一方面对车身并行进行开发,则可能的是:在自动化行驶功能已经大部分被训练的时间点时仍然需要对车辆进行设计更改。如果目标车辆例如是以电池电驱动的,则可能期望的是:提供略微修改的车辆模型,在所述车辆模型中第二驱动电池确保明显更大的续航里程。所述第二驱动电池在特定部位处对目标车辆增加了显著的重量。该重量改变了目标车辆的质量惯性和转动惯量。目标车辆的重心也可能发生偏移。这种变化会影响目标车辆的行驶物理学。
12、最后,还可以更容易地鉴于特定的不利天气条件、例如极端光滑的冰面来训练行为规划器。这种条件比较少见,因此很难在这种条件下重复进行大规模定额的测试行驶。相反,针对随后可用于“转换”现有的观察数据的这些条件的新动力学模型则可以通过明显更少的测试行驶而获得。
13、如果目标车辆的动力学与测试车辆的动力学虽然相同,但所规划的行为基本上延迟地被实施,那么此处描述的自动化标记也是进一步有利的。例如,基于时间点t的环境数据所规划的行为能够以延迟a、即在时间点t+a才被传达给执行机构。然后,可能会出现进一步的延迟b,从而使所规划的行为在时间点t+a+b时才在实际行驶出的轨迹中变得可见。文献中经常使用的近似,即行为或机动动作可以从直接接连的观察中导出并被正确标记,于是不再有效。
14、在一个特别有利的设计方案中,使用经过训练的分类器模型来标识驾驶机动动作。该分类器模型将观察数据的时间序列映射到与该时间序列一致的至少一个驾驶机动动作。这种分类器模型基本上与具体车辆的状况无关,因为所执行的驾驶机动动作主要由纯运动学来确定。例如,分类器模型可以是机器学习模型。然而,这不是强制性必要的。
15、在进一步有利的设计方案中,选择目标车辆的动力学模型,该动力学模型被设计成,将由目标车辆的初始状态和驾驶机动动作说明构成的组合映射到机动动作持续时间。许多驾驶机动动作可以基于许多初始状态而开始,其中,所需的机动动作持续时间取决于初始状态。例如,速度从100km/h到200km/h的变化比从0km/h到100km/h的初始加速花费的时间更长,因为最初引入的动能又增加了三倍,并且空气阻力也随着速度而二次方地增加。
16、由动力学模型映射到机动动作持续时间的组合还可以附加地包含目标车辆的行为规划器的至少一个可调参数。例如,用于电池电动车辆的行为规划器可能有一个具有快速加速度和最大速度的运动模式,以及一个具有更缓的加速度和速度但续航里程更大的节能模式。此外,每个单独的驾驶机动动作本身也可以参数化。
17、例如,至少一个驾驶机动动作可以包括:
18、·变换车道至相邻车道;和/或
19、·行驶速度改变预给定量;和/或
20、·将车辆停在所限定的位置;和/或
21、·在其他车辆后方驾驶;和/或
22、·车辆紧急制动。
23、行驶速度的变化或紧急制动可以分别利用最大可能的加速度或减速来参数化。例如,在其他车辆后方驾驶可以利用与所述其他车辆的时间或空间上的目标距离来参数化。
24、通过训练行为规划器而最终追求的目标是:至少部分自动化的车辆在尽可能多的不同情况下展示出适合相应情况并且对其余交通而言不会过度意外的行为。因此,本发明还涉及一种具有直至对车辆的操控为止的完整效果链的方法。
25、该方法开始于:使用上述方法训练针对至少部分自动化的车辆的行为规划器。然后用该车辆的至少一个传感器检测车辆的运动学和/或动力学的观察数据。附加地,所述观察数据还可以包含:例如来自车辆周围环境的信息和/或基于车辆的当前位置从数字地图调用的信息。因此,许多驾驶机动动作只有在交通状况允许并且例如车辆应驶入的交通空间部分是空着的情况下才有可能。
26、使用行为规划器将观察数据映射到要执行的至少一个驾驶机动动作。至少一个作用于车辆的行驶动力学的执行器然后以这样的方式被操控,使得车辆执行所述驾驶机动动作。
27、本发明还涉及用于训练目标车辆的动力学模型以用于训练行为规划器的另一种方法。
28、动力学模型尤其理解为机器学习模型。机器学习模型体现了以可适配的参数而参数化的函数,其具有很强的泛化能力。在训练机器学习模型时,可以特别是如此适配参数,使得在将学习输入输入到模型时,与所述学习输入相关联的、先前已知的目标输出尽可能好地得以再现。特别地,所述机器学习模型可以包含人工神经网络、即knn,和/或可以是knn。
29、在所述方法的范畴内提供学习初始状态和学习驾驶机动动作。基于学习初始状态,对目标车辆和/或目标车辆的仿真模型执行所述学习驾驶机动动作。在此情况下,为了执行所述学习驾驶机动动作分别所需的持续时间被检测。所述持续时间被设定为学习机动动作持续时间,并因此形成了针对动力学模型训练的“地面真值”。
30、对于实际训练,学习初始状态和学习驾驶机动动作被提供给动力学模型并且被动力学模型分别映射到机动动作持续时间。使用预给定的成本函数评估在此情况下获得的机动动作持续时间与属于相应的学习初始状态和学习驾驶机动动作的学习机动动作持续时间的一致性。以如下目标来优化表征动力学模型行为的参数:对学习初始状态和学习驾驶机动动作的进一步处理导致通过成本函数得出的更好评估。
31、总体上可用的驾驶机动动作的目录或多或少是预先设定的。完全未见过的驾驶机动动作将不会在目标车辆的之后的行驶运行中出现。另一方面,与在训练期间使用的学习初始状态相比,在之后的行驶运行中会出现的初始状态要多得多。因此,可以利用该动力学模型的泛化能力,以便也针对迄今为止未见过的初始状态而预测适用的机动动作持续时间。