驾驶方法及系统的制作方法

文档序号:9389080阅读:414来源:国知局
驾驶方法及系统的制作方法
【技术领域】
[0001] 本发明涉及车辆安全技术领域,特别涉及一种驾驶方法及系统。
【背景技术】
[0002] 随着电子技术的快速发展,车辆等车辆已经成为生活中必不可少的交通工具。而 伴随着车辆的普及,道路上的车辆越来越密集,行车安全也越来越重要。
[0003] 通常,驾驶员在驾驶车辆行驶的过程中,可能会发生一些诸如插车、障碍物阻挡等 突发事件,此时,驾驶员可以手动操作方向盘,油门,刹车等以避免车辆与障碍物发生碰撞, 但是由于在发生突发事件时,驾驶员通常处于紧张状态,驾驶员对方向盘,油门、刹车等操 作的准确性较低。为此,相关技术提供了一种驾驶系统,该驾驶系统包括:环境感知模块和 避撞控制模块,避撞控制模块中存储有驾驶员根据驾驶车辆过程中的避撞经验设置的环境 状态量与决策动作的对应关系,其中,环境状态量可以为障碍物的位置,环境感知模块可以 在车辆的行驶环境中存在由障碍物引发的突发事件时获取车辆当前的环境状态量,避撞控 制模块可以根据车辆当前的环境状态量从环境状态量与决策动作的对应关系中确定与车 辆当前的环境状态量对应的目标决策动作,然后根据该目标决策动作控制车辆行驶,从而 避免车辆与障碍物发生碰撞。
[0004] 在实现本发明的过程中,发明人发现相关技术至少存在以下问题:
[0005] 相关技术中的驾驶系统是以驾驶员的避撞经验为依据控制车辆行驶的,受驾驶员 经验的限制,驾驶系统具有一定的局限性,且由于是以驾驶员的避撞经验为依据控制车辆 行驶的,因此,驾驶系统的稳定性较低,灵活性较差。

【发明内容】

[0006] 为了解决相关技术中驾驶系统具有局限性,稳定性较低,灵活性较差的问题,本发 明提供一种驾驶方法及系统。所述技术方案如下:
[0007] 第一方面,提供一种驾驶系统,所述驾驶系统包括:环境感知模块和避撞控制模 块,
[0008] 所述环境感知模块用于在车辆行驶过程中监测所述车辆的行驶环境;预测所述车 辆的行驶环境中是否会发生由障碍物引发的突发事件;在所述车辆的行驶环境中会发生由 障碍物引发的突发事件时,获取所述障碍物的位置;
[0009] 所述避撞控制模块用于根据所述障碍物的位置,采用机器学习算法确定目标决策 动作;根据所述目标决策动作控制所述车辆行驶。
[0010] 可选地,所述避撞控制模块用于:
[0011] 从经验存储库中确定与所述障碍物的位置对应的目标可执行动作,所述经验存储 库中记录了预先通过机器学习算法确定的障碍物的位置与可执行动作的对应关系,每个障 碍物的位置对应至少一个可执行动作,每个可执行动作包括决策动作和与所述决策动作 一一对应的增强信号,所述增强信号用于指示与所述增强信号一一对应的决策动作在执行 时的立即回报;
[0012] 计算所述目标可执行动作中的每个决策动作的未来无穷回报累加和;
[0013] 将所述未来无穷回报累加和最大的决策动作作为所述目标决策动作。
[0014] 可选地,所述避撞控制模块用于获取驾驶员的决策动作;
[0015] 所述环境感知模块用于获取执行所述驾驶员的决策动作之后所述障碍物的第一 位置;
[0016] 所述避撞控制模块用于从经验存储库中确定与所述障碍物的第一位置对应的目 标可执行动作,所述经验存储库中记录了预先通过机器学习算法确定的障碍物的位置与可 执行动作的对应关系,每个障碍物的位置对应至少一个可执行动作,每个可执行动作包括 决策动作和与所述决策动作一一对应的增强信号,所述增强信号用于指示与所述增强信号 一一对应的决策动作在执行时的立即回报;
[0017] 所述避撞控制模块用于计算所述目标可执行动作中的每个决策动作的未来无穷 回报累加和;将所述未来无穷回报累加和最大的决策动作作为所述目标决策动作。
[0018] 可选地,所述避撞控制模块用于:
[0019] 计算所述驾驶员的决策动作对应的未来n个状态的增强信号,得到n个增强信号, 所述n为大于或者等于1的整数;
[0020] 判断所述n个增强信号中是否存在符合预设条件的增强信号;
[0021] 在所述n个增强信号中存在符合预设条件的增强信号时,触发所述环境感知模块 获取执行所述驾驶员的决策动作之后所述障碍物的第一位置;
[0022] 其中,在执行所述符合预设条件的增强信号对应的决策动作时,所述车辆与所述 车辆的行驶环境中的障碍物会发生碰撞。
[0023] 可选地,所述环境感知模块用于:
[0024] 判断所述车辆的行驶环境中是否存在障碍物;
[0025] 在所述车辆的行驶环境中存在障碍物时,判断所述障碍物是否处于预设范围内;
[0026] 在所述障碍物处于所述预设范围时,确定所述车辆的行驶环境中会发生由所述障 碍物引发的突发事件。
[0027] 第二方面,提供一种驾驶方法,所述方法包括:
[0028] 在车辆行驶过程中监测所述车辆的行驶环境;
[0029] 预测所述车辆的行驶环境中是否会发生由障碍物引发的突发事件;
[0030] 若所述车辆的行驶环境中会发生由障碍物引发的突发事件,则获取所述障碍物的 位置;
[0031] 根据所述障碍物的位置,采用机器学习算法确定目标决策动作;
[0032] 根据所述目标决策动作控制所述车辆行驶。
[0033] 可选地,所述根据所述障碍物的位置,采用机器学习算法确定目标决策动作,包 括:
[0034] 从经验存储库中确定与所述障碍物的位置对应的目标可执行动作,所述经验存储 库中记录了预先通过机器学习算法确定的障碍物的位置与可执行动作的对应关系,每个障 碍物的位置对应至少一个可执行动作,每个可执行动作包括决策动作和与所述决策动作 一一对应的增强信号,所述增强信号用于指示与所述增强信号一一对应的决策动作在执行 时的立即回报;
[0035] 计算所述目标可执行动作中的每个决策动作的未来无穷回报累加和;
[0036] 将所述未来无穷回报累加和最大的决策动作作为所述目标决策动作。
[0037] 可选地,所述根据所述障碍物的位置,采用机器学习算法确定目标决策动作,包 括:
[0038] 获取驾驶员的决策动作;
[0039] 获取执行所述驾驶员的决策动作之后所述障碍物的第一位置;
[0040] 从经验存储库中确定与所述障碍物的第一位置对应的目标可执行动作,所述经验 存储库中记录了预先通过机器学习算法确定的障碍物的位置与可执行动作的对应关系,每 个障碍物的位置对应至少一个可执行动作,每个可执行动作包括决策动作和与所述决策动 作一一对应的增强信号,所述增强信号用于指示与所述增强信号一一对应的决策动作在执 行时的立即回报;
[0041] 计算所述目标可执行动作中的每个决策动作的未来无穷回报累加和;
[0042] 将所述未来无穷回报累加和最大的决策动作作为所述目标决策动作。
[0043] 可选地,所述获取执行所述驾驶员的决策动作之后所述障碍物的第一位置,包 括:
[0044] 计算所述驾驶员的决策动作对应的未来n个状态的增强信号,得到n个增强信号, 所述n为大于或者等于1的整数;
[0045] 判断所述n个增强信号中是否存在符合预设条件的增强信号;
[0046] 若所述n个增强信号中存在符合预设条件的增强信号,则获取执行所述驾驶员的 决策动作之后所述障碍物的第一位置;
[0047] 其中,在执行所述符合预设条件的增强信号对应的决策动作时,所述车辆与所述 车辆的行驶环境中的障碍物会发生碰撞。
[0048] 可选地,所述预测所述车辆的行驶环境中是否会发生由障碍物引发的突发事件, 包括:
[0049] 判断所述车辆的行驶环境中是否存在障碍物;
[0050] 若所述车辆的行驶环境中存在障碍物,则判断所述障碍物是否处于预设范围内;
[0051] 若所述障碍物处于所述预设范围内,则确定所述车辆的行驶环境中会发生由所述 障碍物引发的突发事件。
[0052] 本发明提供的技术方案带来的有益效果是:
[0053] 本发明实施例提供的驾驶方法及系统,驾驶系统包括:环境感知模块和避撞控制 模块,环境感知模块用于在车辆行驶过程中监测车辆的行驶环境;预测车辆的行驶环境中 是否会发生由障碍物引发的突发事件;在车辆的行驶环境中会发生由障碍物引发的突发事 件时,获取障碍物的位置;避撞控制模块用于根据障碍物的位置,采用机器学习算法确定目 标决策动作;根据目标决策动作控制车辆行驶。由于本发明采用机器学习算法确定目标决 策动作,目标决策动作的确定不受驾驶员的经验的限制,解决了相关技术中的驾驶系统具 有局限性,稳定性较低,灵活性较差的问题,达到了扩大驾驶系统的应用范围,提高驾驶系 统的稳定性和灵活性的有益效果。
[0054] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本 发明。
【附图说明】
[0055] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。
[0056] 图1是本发明各个实施例提供的驾驶方法所涉及的一种实施环境的结构示意图;
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1