一种驾驶方法及系统的制作方法_2

文档序号：9389082阅读：来源：国知局

预设代价的决策动作；
[0071] 将所述执行时需要付出的代价小于预设代价的决策动作作为所述目标决策动作。
[0072] 可选地，所述获取执行所述驾驶员的决策动作之后所述障碍物的第一位置，包括：
[0073] 采用汽车动力学方程计算执行所述驾驶员的决策动作后所述车辆的行驶轨迹；
[0074] 判断所述车辆的行驶轨迹是否为符合预设条件的行驶轨迹；
[0075] 若所述车辆的行驶轨迹为符合预设条件的行驶轨迹，则获取执行所述驾驶员的决策动作之后所述障碍物的第一位置；
[0076] 其中，所述车辆在按照所述符合预设条件的行驶轨迹行驶时，所述车辆与所述车辆的行驶环境中的障碍物会发生碰撞。
[0077] 可选地，所述预测所述车辆的行驶环境中是否会发生由障碍物引发的突发事件，包括：
[0078] 判断所述车辆的行驶环境中是否存在障碍物；
[0079] 若所述车辆的行驶环境中存在障碍物，则判断所述障碍物是否处于预设范围内；
[0080] 若所述障碍物处于所述预设范围内，则确定所述车辆的行驶环境中会发生由所述障碍物引发的突发事件。
[0081] 本发明提供的技术方案带来的有益效果是：
[0082] 本发明实施例提供的驾驶方法及系统，驾驶系统包括：环境感知模块和避撞控制模块，环境感知模块用于在车辆行驶过程中监测车辆的行驶环境；预测车辆的行驶环境中是否会发生由障碍物引发的突发事件；在车辆的行驶环境中会发生由障碍物引发的突发事件时，获取障碍物的当前位置；避撞控制模块用于根据障碍物的当前位置，采用自适应学习算法确定目标决策动作；根据目标决策动作控制车辆行驶。由于本发明采用自适应学习算法确定目标决策动作，目标决策动作的确定不受驾驶员的经验的限制，解决了相关技术中的驾驶系统具有局限性，稳定性较低，灵活性较差的问题，达到了扩大驾驶系统的应用范围，提高驾驶系统的稳定性和灵活性的有益效果。
[0083] 应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本发明。
【附图说明】
[0084] 为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0085] 图1是本发明各个实施例提供的驾驶方法所涉及的一种实施环境的结构示意图；
[0086] 图2是本发明一个实施例提供的驾驶系统的框图；
[0087] 图3是本发明一个实施例提供的一种驾驶方法的方法流程图；
[0088] 图4是本发明另一个实施例提供的一种驾驶方法的方法流程图；
[0089] 图5是图4所示实施例提供的一种预测车辆的行驶环境中是否会发生由障碍物引发的突发事件的方法流程图；
[0090] 图6是图4所示实施例提供的一种确定障碍物是否位于预设范围内的示意图；
[0091] 图7是图4所示实施例提供的一种根据障碍物的位置采用自适应学习算法确定目标决策动作的方法流程图；
[0092] 图8是图4所示实施例提供的一种根据通过自适应学习算法确定障碍物的位置与可执彳丁动作的对应关系的不意图；
[0093] 图9是图4所示实施例提供的另一种根据障碍物的位置采用自适应学习算法确定目标决策动作的方法流程图；
[0094] 图10是图4所示实施例提供的一种获取执行驾驶员的决策动作之后障碍物的第一位置的方法流程图。
[0095] 此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。
【具体实施方式】
[0096] 为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部份实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
[0097] 请参考图1，其示出了本发明各个实施例提供的驾驶方法所涉及的一种实施环境的结构示意图，参见图1，道路S包括三个车道，分别为车道Sl、车道S2和车道S3,车辆Cl 行驶于车道Sl上，车辆C2行驶于车道S2上，车辆C3行驶于车道S3上，且车辆CU车辆C2 和车辆C3的行驶方向相同。在车辆Cl和车辆C2行驶的过程中，车辆C3突然从车辆C2的前方变道至车道S2上行驶（插车），此时，车辆C3对于车辆C2来说可以称为障碍物，该障碍物出现时，车辆C2的驾驶员条件反射的旋转车辆C2的方向盘以避免车辆C2与车辆C3 发生碰撞，车辆C2的驾驶员旋转车辆C2的方向盘的角度和方向不同，可以使得车辆C2按照不同的路径行驶，示例地，车辆C2可以按照图1所示的路径LU路径L2和路径L3中的任一路径行驶，参见图1可知，该3条路径对应的方向盘的旋转方向均是向车辆C2的驾驶员的左侧旋转，且路径L2对应的旋转角度小于路径Ll对应的旋转角度，路径Ll对应的旋转角度小于路径L3对应的旋转角度。
[0098] 通常情况下，车辆C3的突然插车会导致车辆C2的驾驶员处于精神紧张状态而无法精确把握方向盘的旋转角度，若车辆C2的方向盘的旋转角度过小，车辆C2可能会按照路径L2行驶，导致车辆C2与车辆C3发生刮擦甚至碰撞，进而引发交通事故；若车辆C2的方向盘的旋转角度过大，车辆C2可能会按照路径L3行驶，导致车辆C2与车辆Cl发生刮擦甚至碰撞，进而引发交通事故。
[0099] 在本实施环境中，在车辆C3插车时，车辆C2的理想行驶路径为路径Ll，本发明实施例提供的驾驶系统可以安装在车辆C2上，使得在车辆C3插车时，车辆C2按照路径Ll行驶，避免车辆C2与车辆C3、车辆Cl发生碰撞，从而避免交通事故的发生。
[0100] 请参考图2,其示出了本发明一个实施例提供的驾驶系统200的框图，该驾驶系统 200可以用于车辆驾驶，该驾驶系统200能够在车辆的行驶环境中存在由障碍物引发的突发事件时，避免车辆与障碍物发生碰撞。参见图2,该驾驶系统200可以包括但不限于：环境感知模块210和避撞控制模块220。
[0101] 环境感知模块210用于在车辆行驶过程中监测车辆的行驶环境；预测车辆的行驶环境中是否会发生由障碍物引发的突发事件；在车辆的行驶环境中会发生由障碍物引发的突发事件时，获取障碍物的当前位置；
[0102] 避撞控制模块220用于根据障碍物的当前位置，采用自适应学习算法确定目标决策动作；根据目标决策动作控制车辆行驶。
[0103] 可选地，避撞控制模块220用于：
[0104] 从经验存储库中确定与障碍物的当前位置对应的目标可执行动作，经验存储库中记录了预先通过自适应学习算法确定的障碍物的位置与可执行动作的对应关系，每个障碍物的位置对应至少一个可执行动作，每个可执行动作包括决策动作和与决策动作--对应的增强信号，增强信号用于指示与增强信号一一对应的决策动作在执行时的立即回报；
[0105] 计算目标可执行动作中的每个决策动作的未来无穷回报累加和；
[0106] 确定未来无穷回报累加和最大的第一决策动作；
[0107] 根据障碍物的当前位置和第一决策动作，确定第一决策动作在执行时需要付出的第一代价；
[0108] 根据第一代价和最大的未来回报累加和确定评价误差；
[0109] 根据第一代价和预设的效用期望确定动作误差；
[0110] 根据评价误差和动作误差对第一决策动作进行调节得到第二决策动作，第二决策动作在执行时需要付出的代价为第二代价，第二代价小于第一代价；
[0111] 将第二决策动作对应的障碍物的位置确定为障碍物的当前位置；
[0112] 重复执行上述步骤，直至得到执行时需要付出的代价小于预设代价的决策动作；
[0113] 将执行时需要付出的代价小于预设代价的决策动作作为目标决策动作。
[0114] 可选地，避撞控制模块220用于获取驾驶员的决策动作；
[0115] 环境感知模块210用于获取执行驾驶员的决策动作之后障碍物的第一位置；
[0116] 避撞控制模块220用于从经验存储库中确定与障碍物的第一位置对应的目标可执行动作，经验存储库中记录了预先通过自适应学习算法确定的障碍物的位置与可执行动作的对应关系，每个障碍物的位置对应至少一个可执行动作，每个可执行动作包括决策动作和与决策动作一一对应的增强信号，增强信号用于指示与增强信号一一对应的决策动作在执行时的立即回报；
[0117] 计算目标可执行动作中的每个决策动作的未来无穷回报累加和；
[0118] 确定未来无穷回报累加和最大的第一决策动作；
[0119] 根据障碍物的当前位置和第一决策动作，确定第一决策动作在执行时需要付出的第一代价；
[0120] 根据第一代价和最大的未来回报累加和确定评价误差；
[0121] 根据第一代价和预设的效用期望确定动作误差；
[0122] 根据评价误差和动作误差对第一决策动作进行调节得到第二决策动作，第二决策动作在执行时需要付出的代价为第二代价，第二代价小于第一代价；
[0123] 将第二决策动作对应的障碍物的位置确定为障碍物的第一位置；
[0124] 重复执行从经验存储库中确定与障碍物的第一位置对应的目标可执行动作至将第二决策动作对应的障碍物的位置确定为障碍物的第一位置的步骤，直至得到执行时需要付出的代价小于预设代价的决策动作；
[0125] 将执行时需要付出的代价小于预设代价的决策动作作为目标决策动作。
[0126] 可选地，环境感知模块210用于：
[0127] 采用汽车动力学方程计算执行驾驶员的决策动作后车辆的行驶轨迹；
[0128] 判断车辆的行驶轨迹是否为符合预设条件的行驶轨迹；
[0129] 在车辆的行驶轨迹为符合预设条件的行驶轨迹时，触发环境感知模块210获取执行驾驶员的决策动作之后障碍物的第一位置；
[0130] 其中，车辆在按照符合预设条件的行驶轨迹行驶时，车辆与车辆的行驶环境中的障碍物会发生碰撞。
[0131] 可选地，环境感知模块210用于：
[0132] 判断车辆的行驶环境中是否存在障碍物；
[0133] 在车辆的

完整全部详细技术资料下载

当前第2页1 2 3 4 5 6