驾驶方法及系统的制作方法_2

文档序号:9389080阅读:来源:国知局
>[0057] 图2是本发明一个实施例提供的驾驶系统的框图;
[0058] 图3是本发明一个实施例提供的一种驾驶方法的方法流程图;
[0059] 图4是本发明另一个实施例提供的一种驾驶方法的方法流程图;
[0060] 图5是图4所示实施例提供的一种预测车辆的行驶环境中是否会发生由障碍物引 发的突发事件的方法流程图;
[0061] 图6是图4所示实施例提供的一种确定障碍物是否位于预设范围内的示意图;
[0062] 图7是图4所示实施例提供的一种根据障碍物的位置采用机器学习算法确定目标 决策动作的方法流程图;
[0063] 图8是图4所示实施例提供的一种根据通过机器学习算法确定障碍物的位置与可 执行动作的对应关系的示意图;
[0064] 图9是图4所示实施例提供的另一种根据障碍物的位置采用机器学习算法确定目 标决策动作的方法流程图;
[0065] 图10是图4所示实施例提供的一种获取执行驾驶员的决策动作之后障碍物的第 一位置的方法流程图。
[0066] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施 例,并与说明书一起用于解释本发明的原理。
[0067] 实施方式
[0068] 为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进 一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施 例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的 所有其它实施例,都属于本发明保护的范围。
[0069] 请参考图1,其示出了本发明各个实施例提供的驾驶方法所涉及的一种实施环境 的结构示意图,参见图1,道路S包括三个车道,分别为车道Sl、车道S2和车道S3,车辆Cl 行驶于车道Sl上,车辆C2行驶于车道S2上,车辆C3行驶于车道S3上,且车辆CU车辆C2 和车辆C3的行驶方向相同。在车辆Cl和车辆C2行驶的过程中,车辆C3突然从车辆C2的 前方变道至车道S2上行驶(插车),此时,车辆C3对于车辆C2来说可以称为障碍物,该障 碍物出现时,车辆C2的驾驶员条件反射的旋转车辆C2的方向盘以避免车辆C2与车辆C3 发生碰撞,车辆C2的驾驶员旋转车辆C2的方向盘的角度和方向不同,可以使得车辆C2按 照不同的路径行驶,示例地,车辆C2可以按照图1所示的路径LU路径L2和路径L3中的任 一路径行驶,参见图1可知,该3条路径对应的方向盘的旋转方向均是向车辆C2的驾驶员 的左侧旋转,且路径L2对应的旋转角度小于路径Ll对应的旋转角度,路径Ll对应的旋转 角度小于路径L3对应的旋转角度。
[0070] 通常情况下,车辆C3的突然插车会导致车辆C2的驾驶员处于精神紧张状态而无 法精确把握方向盘的旋转角度,若车辆C2的方向盘的旋转角度过小,车辆C2可能会按照路 径L2行驶,导致车辆C2与车辆C3发生刮擦甚至碰撞,进而引发交通事故;若车辆C2的方 向盘的旋转角度过大,车辆C2可能会按照路径L3行驶,导致车辆C2与车辆Cl发生刮擦甚 至碰撞,进而引发交通事故。
[0071] 在本实施环境中,在车辆C3插车时,车辆C2的理想行驶路径为路径Ll,本发明实 施例提供的驾驶系统可以安装在车辆C2上,使得在车辆C3插车时,车辆C2按照路径Ll行 驶,避免车辆C2与车辆C3、车辆Cl发生碰撞,从而避免交通事故的发生。
[0072] 请参考图2,其示出了本发明一个实施例提供的驾驶系统200的框图,该驾驶系统 200可以用于车辆驾驶,该驾驶系统200能够在车辆的行驶环境中存在由障碍物引发的突 发事件时,避免车辆与障碍物发生碰撞。参见图2,该驾驶系统200可以包括但不限于:环 境感知模块210和避撞控制模块220。
[0073] 环境感知模块210用于在车辆行驶过程中监测车辆的行驶环境;预测车辆的行驶 环境中是否会发生由障碍物引发的突发事件;在车辆的行驶环境中会发生由障碍物引发的 突发事件时,获取障碍物的位置。
[0074] 避撞控制模块220用于根据障碍物的位置,采用机器学习算法确定目标决策动 作;根据目标决策动作控制车辆行驶。
[0075] 可选地,避撞控制模块220用于:
[0076] 从经验存储库中确定与障碍物的位置对应的目标可执行动作,经验存储库中记录 了预先通过机器学习算法确定的障碍物的位置与可执行动作的对应关系,每个障碍物的位 置对应至少一个可执行动作,每个可执行动作包括决策动作和与决策动作--对应的增强 信号,增强信号用于指示与增强信号一一对应的决策动作在执行时的立即回报;
[0077] 计算目标可执行动作中的每个决策动作的未来无穷回报累加和;
[0078] 将未来无穷回报累加和最大的决策动作作为目标决策动作。
[0079] 可选地,避撞控制模块220用于获取驾驶员的决策动作;
[0080] 环境感知模块210用于获取执行驾驶员的决策动作之后障碍物的第一位置;
[0081] 避撞控制模块220用于从经验存储库中确定与障碍物的第一位置对应的目标可 执行动作,经验存储库中记录了预先通过机器学习算法确定的障碍物的位置与可执行动作 的对应关系,每个障碍物的位置对应至少一个可执行动作,每个可执行动作包括决策动作 和与决策动作一一对应的增强信号,增强信号用于指示与增强信号一一对应的决策动作在 执行时的立即回报;
[0082] 避撞控制模块220用于计算目标可执行动作中的每个决策动作的未来无穷回报 累加和;将未来无穷回报累加和最大的决策动作作为目标决策动作。
[0083] 可选地,避撞控制模块220用于:
[0084] 计算驾驶员的决策动作对应的未来n个状态的增强信号,得到n个增强信号,n为 大于或者等于1的整数;
[0085] 判断n个增强信号中是否存在符合预设条件的增强信号;
[0086] 在n个增强信号中存在符合预设条件的增强信号时,触发环境感知模块210获取 执行驾驶员的决策动作之后障碍物的第一位置;
[0087] 其中,在执行符合预设条件的增强信号对应的决策动作时,车辆与车辆的行驶环 境中的障碍物会发生碰撞。
[0088] 可选地,环境感知模块210用于:
[0089] 判断车辆的行驶环境中是否存在障碍物;
[0090] 在车辆的行驶环境中存在障碍物时,判断障碍物是否处于预设范围内;
[0091] 在障碍物处于预设范围时,确定车辆的行驶环境中会发生由障碍物引发的突发事 件。
[0092] 综上所述,本发明实施例提供的驾驶系统包括:环境感知模块和避撞控制模块,环 境感知模块用于在车辆行驶过程中监测车辆的行驶环境;预测车辆的行驶环境中是否会发 生由障碍物引发的突发事件;在车辆的行驶环境中会发生由障碍物引发的突发事件时,获 取障碍物的位置;避撞控制模块用于根据障碍物的位置,采用机器学习算法确定目标决策 动作;根据目标决策动作控制车辆行驶。由于本发明采用机器学习算法确定目标决策动作, 目标决策动作的确定不受驾驶员的经验的限制,解决了相关技术中的驾驶系统具有局限 性,稳定性较低,灵活性较差的问题,达到了扩大驾驶系统的应用范围,提高驾驶系统的稳 定性和灵活性的有益效果。
[0093] 本发明实施例提供的驾驶系统可以应用于下文的方法,本发明实施例中驾驶方法 可以参见下文各实施例中的描述。
[0094] 请参考图3,其示出了本发明一个实施例提供的驾驶方法的方法流程图,该驾驶方 法可以由图2所示的驾驶系统来执行,参见图3,该方法流程可以包括如下几个步骤:
[0095] 在步骤301中,在车辆行驶过程中监测车辆的行驶环境。
[0096] 在步骤302中,预测车辆的行驶环境中是否会发生由障碍物引发的突发事件。
[0097] 在步骤303中,若车辆的行驶环境中会发生由障碍物引发的突发事件,则获取障 碍物的位置。
[0098] 在步骤304中,根据障碍物的位置,采用机器学习算法确定目标决策动作。
[0099] 在步骤305中,根据目标决策动作控制车辆行驶。
[0100] 综上所述,本发明实施例提供的驾驶方法,通过在车辆行驶过程中监测车辆的行 驶环境;预测车辆的行驶环境中是否会发生由障碍物引发的突发事件;在车辆的行驶环境 中会发生由障碍物引发的突发事件时,获取障碍物的位置;根据障碍物的位置,采用机器学 习算法确定目标决策动作;根据目标决策动作控制车辆行驶。由于本发明采用机器学习 算法确定目标决策动作,目标决策动作的确定不受驾驶员的经验的限制,解决了相关技术 中的驾驶方法具有局限性,稳定性较低,灵活性较差的问题,达到了扩大驾驶方法的应用范 围,提高驾驶方法的稳定性和灵活性的有益效果。
[0101] 可选地,步骤304可以包括:
[0102] 从经验存储库中确定与障碍物的位置对应的目标可执行动作,经验存储库中记录 了预先通过机器学习算法确定的障碍物的位置与可执行动作的对应关系,每个障碍物的位 置对应至少一个可执行动作,每个可执行动作包括决策动作和与决策动作--对应的增强 信号,增强信号用于指示与增强信号一一对应的决策动作在执行时的立即回报;
[0103] 计算目标可执行动作中的每个决策动作的未来无穷回报累加和;
[0104] 将未来无穷回报累加和最大的决策动作作为目标决策动作。
[0105] 可选地,步骤304可以包括:
[0106] 获取驾驶员的决策动作;
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1