一种自动驾驶决策方法及系统与流程

文档序号:14777821发布日期:2018-06-26 07:37阅读:409来源:国知局

本发明涉及自动驾驶领域,具体地,涉及一种自动驾驶决策方法及系统。



背景技术:

近年来,无人驾驶相关技术得到了广泛关注,其中,在无人车行驶过程中,如何根据周围障碍物信息和道路信息对无人车驾驶行为进行决策是十分重要的。

现有的无人车的决策算法通常使用基于有限状态机的决策方法,即基于车辆行驶经验得到无人车决策规则,根据道路信息、周围障碍物信息等作为状态机输入,得到期望的驾驶行为。

然而,本申请发明人在实现本发明的过程中发现,基于状态机的决策方法需要提前给出决策规则,对于缺乏决策规则的情况无法处理,并且,对于决策规则进行扩展通常是十分复杂的,该方法无法适应复杂多变的交通场景。同时,基于机器学习的决策方法被应用于辅助驾驶系统,但辅助驾驶系统更多依赖驾驶员行为给出最终的决策结果,无法直接应用于无人驾驶汽车的决策系统。



技术实现要素:

本发明实施例的目的是提供一种自动驾驶决策方法及系统,该方法和系统采集用于决策模块的相关信息,并利用该相关信息对决策模型进行训练,然后在被训练过的决策模型的基础上进行驾驶决策,使决策模型能够适应复杂多变的驾驶环境,从而实现了能够直接应于无人车驾驶的自动驾驶。

为了实现上述目的,本发明提供一种自动驾驶决策方法,该自动驾驶决策方法包括:采集车辆驾驶系统的决策模型的输入数据和输出数据;根据所述决策模型的输入数据和输出数据对所述决策模型进行训练;以及使经过训练的决策模型根据其输入数据输出关于驾驶行为的决策行为。

其中,所述自动驾驶决策方法还可以包括:根据强制约束信息对所述决策算法模块输出的决策行为进行约束。

其中,所述根据所述决策模型的输入数据和输出数据对所述决策模型进行训练可以包括:利用支持向量机对所述决策模型进行训练。

其中,所述决策模型的输入数据可以包括:车辆状态信息、障碍物信息、车道线信息以及交通标示信息。

其中,所述强制约束信息可以包括道路限速、碰撞检测。

根据本发明的另一方面,还提供一种自动驾驶决策系统,该自动驾驶决策系统包括:数据采集模块,用于采集车辆驾驶系统的决策模型的输入数据和输出数据;决策模型训练模块,根据所述决策模型的输入数据和输出数据对所述决策模型进行训练;以及决策算法模块,用于使经过训练的决策模型根据其输入数据输出关于驾驶行为的决策行为。

其中,所述自动驾驶决策系统还可以包括:物理约束模块,用于根据强制约束信息对所述决策算法模块输出的决策行为进行约束。

其中,所述决策模块训练模块可以利用支持向量机对所述决策模型进行训练。

其中,所述决策模型的输入数据可以包括:车辆状态信息、障碍物信息、车道线信息以及交通标示信息。

其中,所述强制约束信息可以包括道路限速、碰撞检测。

通过上述技术方案,利用车辆行驶过程中采集到的各种与驾驶场景相关的信息对决策模型进行不断的训练,使决策模型不断地适应可能遇到的复杂路况,从使决策模型能够最终做出安全适当的的驾驶决策,进而达到不需要人为操作的介入即可自动驾驶的目的。

本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:

图1是根据本发明的实施例一的自动驾驶决策方法的流程图;

图2是根据本发明的实施例二的自动驾驶决策方法的流程图;

图3是根据本发明的实施例三的自动驾驶决策系统的结构图;以及

图4是根据本发明的实施例四的自动驾驶决策系统的结构图;

附图标记说明

100:数据采集模块 200:决策模型训练模块

210:支持向量机模块 300:决策算法模块

400:物理约束模块

具体实施方式

以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。

图1是根据本发明的实施例一的自动驾驶决策方法的流程图。如图1所示,所述自动驾驶决策方法包括以下步骤:

在步骤S100中,采集车辆驾驶系统的决策模型的输入数据和输出数据。决策模型能够根据定位信息和感知信息等(即决策模型的输入数据),判断未来一段时间车辆的决策行为(车道保持、变道、超车、跟车、紧急停车等)。

在步骤S200中,根据所述决策模型的输入数据和输出数据对所述决策模型进行训练。

所述决策模型的输入数据可以包括:车辆状态信息、障碍物信息、车道线信息以及交通标示信息。决策模型的输入数据可以是GPS定位系统的定位信息、雷达系统检测到的行人或车辆等障碍物信息,或拍摄装置对行车周围的环境进行拍照后的场景分割结果信息等,场景分割的结果中可以识别红绿灯、道路线、行人等信息。

在步骤S300中,使经过训练的决策模型根据其输入数据输出关于驾驶行为的决策行为。将车辆行驶过程中车辆本身的状态信息、周围的环境信息、车道线信息、交通标示信息等信息输入经过训练后的决策模型,从而可以得到适应各种复杂路况的驾驶决策行为。决策模型在经过训练后更能够适应行车过程中不断出现的新的复杂的路况,因此,经过训练后的决策模型能够准确为本车做出驾驶决策,从而能够实现无需人为操作介入的自动驾驶。

图2是根据本发明的实施例二的自动驾驶决策方法的流程图。如图2所示,上述步骤S200可以优选地包括步骤S210,在步骤S210中,可以利用支持向量机(support vector machine,SVM)对所述决策模型进行训练。

在图2中,所述自动驾驶决策系统还可以包括步骤S400,在该步骤中,可以根据强制约束信息对所述决策算法模块输出的决策行为进行约束。例如,可以根据道路限速、碰撞检测等强制约束信息,对决策算法模块输出的决策行为进行约束,从而得到最终的车辆驾驶行为。例如可以根据当前路况的限速限制决策模型最终决策的行驶速度的范围,从而能够防止驾驶超速发生,也可以通过本车与周围的障碍物车辆的碰撞检测信息来限制本车在行驶过程中应该与障碍物车辆保持的车距。

图3是根据本发明的实施例三的自动驾驶决策系统的结构图。如图3所示,自动驾驶决策系统,该自动驾驶决策系统包括:数据采集模块100,用于采集车辆驾驶系统的决策模型的输入数据和输出数据;决策模型训练模块200,根据所述决策模型的输入数据和输出数据对所述决策模型进行训练;以及决策算法模块300,用于使经过训练的决策模型根据其输入数据输出关于驾驶行为的决策行为。

图4是根据本发明的实施例四的自动驾驶决策系统的结构图。在图4中,所述决策模型训练模块200可以包括支持向量机模块210,用于利用支持向量机对所述决策模型进行训练。支持向量机(SVM)是基于统计学习理论的一种机器学习方法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。

如图4所示,实施例四还可以优选地包括物理约束模块400,用于根据强制约束信息对所述决策算法模块输出的决策行为进行约束。所述强制约束信息可以包括道路限速、碰撞检测等信息。

其中,所述决策模型的输入数据可以包括:车辆状态信息、障碍物信息、车道线信息以及交通标示信息,这些信息可以由随车雷达扫描的结果,或随车相机拍摄到的场景,或定位系统的定位信息等中获取。

以上结合附图详细描述了本发明例的可选实施方式,但是,本发明实施例并不限于上述实施方式中的具体细节,在本发明实施例的技术构思范围内,可以对本发明实施例的技术方案进行多种简单变型,这些简单变型均属于本发明实施例的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施例对各种可能的组合方式不再另行说明。

本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1