通过机器学习的车辆控制的制作方法_4

文档序号：9679077阅读：来源：国知局

动路线是否已经改变。如果确定活动路线已经改变，则系统10确定车辆20的新的活动路线，并且选择与新的活动路线相对应的能量单元控制值的新的组。
[0051]应当指出，系统并不限于能量单元，而相反地，可以包括根据本公开内容的其它方面的可控制的单元。
【主权项】
1.一种用于管理车辆(20)中的规则或策略的方法(100)，所述车辆(20)包括至少一个可控制的单元(21)，所述方法(100)包括以下步骤: -在开始行驶时确定(101)所述车辆的活动路线， -从控制值的多个所存储的组中选择(102)控制值的组，控制值的所述多个组基于先前已行驶路线的组，其中，控制值的所选择的组与所确定的活动路线相对应，其中，控制值的所述组中的一个控制值与所确定的活动路线的一个预先确定的间隔相对应， -基于控制值的所选择的组来控制(103)所述至少一个可控制的单元， -在所述车辆的当前行驶期间对控制结果值的组进行记录(104)，其中，一个控制结果值与所述车辆已经行驶的所确定的活动路线的预先确定的间隔相对应，并且其中，所述控制结果值指示在所述预先确定的间隔期间的所述控制的结果， -在所述行驶结束时，基于控制结果值的所述组来确定(107)实际已行驶路线的控制值的更新的组， -存储(109)控制值的所述更新的组。2.根据权利要求1所述的方法，所述方法还包括以下步骤: -向远程数据单元发送(106)控制结果值的所述组， -从所述远程数据单元接收(108)所述更新的控制值，并且其中，在所述远程数据单元处执行基于控制结果值的所述组来确定(107)所述实际已行驶路线的控制值的更新的组的所述步骤。3.根据前述权利要求中的任一项所述的方法，其中，所述车辆的所述至少一个可控制的单元(21)是能量单元(21)，并且其中，所述规则和所述策略与管理所述能量单元(21)的能量使用有关，并且其中，所述控制值和控制值的所述组分别是与对所述车辆的所述能量单元进行控制有关的能量单元控制值和能量单元控制值的组，并且其中，控制结果值的所述组是指示在所述预先确定的间隔期间的所述能量使用的能量单元控制结果值，并且其中，控制值的所述更新的组是能量单元控制值的更新的组。4.根据权利要求3所述的方法，其中，所述车辆(20)是混合动力电动车辆(HEV)，并且其中，所述车辆(20)还包括电力推进单元(24)，以及适合于为所述电力推进单元(24)供电的电池组(23)，并且所述至少一个能量单元(21)是被布置为对所述电池组进行充电的内燃机(21)，其中，基于能量单元控制值的所述组来控制(103)所述至少一个能量单元(21)的所述步骤包括通过向所述内燃机(21)发送发动发动机或关闭发动机的请求来控制所述内燃机(21)，所述发动发动机或关闭发动机的请求与能量单元控制值的所选择的组中的值相对应。5.根据前述权利要求中的任一项所述的方法，其中，控制结果值的所述组还包括以下各项中的至少一项:驱动功率请求水平、推进能量需求、GPS位置、速度水平或时间戳。6.根据前述权利要求中的任一项所述的方法，其中，控制值的所述组与控制模型(200)相对应，所述控制模型(200)为以下各项中的至少一项:马尔可夫决策过程、连续时间马尔可夫过程、转移率矩阵。7.根据权利要求5所述的方法，其中，控制(103)所述至少一个可控制的单元(21)的所述步骤与所述控制模型(200)中的转移(201A、202A、203A、205A、206A、201B、202B、203B、205B)相对应。8.根据前述权利要求中的任一项所述的方法，其中，对控制结果值的组进行记录(104)的所述步骤与所述控制模型(200)中的转移(201A、202A、203A、205A、206A、201B、202B、203B、205B)相对应。9.根据前述权利要求中的任一项所述的方法，其中，基于控制结果值的所述组来确定(107)所述实际已行驶路线的控制值的更新的组的所述步骤包括使用以下各项中的至少一项:动态规划、策略迭代、值迭代、Q-学习、即时差分学习或者状态-动作-奖赏-状态-动作(SARSA)算法。10.—种用于管理车辆(20)中的规则和策略的系统(10)，其中，所述车辆(20)包括: 至少一个可控制的单元(21)，其中，所述系统(10)包括: 管理单元(11)，以及存储单元(12)，所述存储单元(12)与所述管理单元(11)相关联，其中，所述系统(10)被布置为: 在开始行驶所述车辆(20)时确定所述车辆(20)的活动路线，从控制值的多个组中选择控制值的组，控制值的所述多个组基于先前已行驶路线的组并且存储在与所述管理单元(11)相关联的所述存储单元(12)中，其中，控制值的所述组中的一个控制值与所确定的活动路线的一个预先确定的间隔相对应，基于控制值的所述组来控制所述至少一个可控制的单元(21)，以预先确定的间隔将与所述车辆的当前行驶相关的控制结果值的组记录在与所述管理单元(11)相关联的所述存储单元(12)中，其中，一个控制结果值与所述车辆(20)已经行驶的所确定的活动路线的预先确定的间隔相对应，在行驶结束时基于控制值的所记录的组来确定实际已行驶路线的控制值的更新的组，并且将所述更新的控制值存储在与所述管理单元(11)相关联的所述存储单元(12)中。11.根据权利要求10所述的系统(10)，其中，所述系统(10)被布置为与远程数据单元(13)进行通信，所述系统(10)还包括: 发射机(14)，所述发射机(14)被布置为向所述远程数据单元(13)发送控制结果值的所述组，以及接收机(15)，所述接收机(15)被布置为从所述远程数据单元(13)接收控制值的所述更新的组，并且其中，在所述远程数据单元(13)处执行在所述行驶结束时基于控制结果值的所记录的组对所述实际已行驶路线的控制值的所述更新的组的所述确定。12.根据权利要求10或11中的任一项所述的系统(10)，其中，所述至少一个可控制的单元(21)是所述车辆的能量单元(21)，并且其中，所述管理单元(11)是能量管理单元(11)，并且，所述控制值和控制值的所述组分别是与对所述车辆的所述能量单元进行控制有关的能量单元控制值和能量单元控制值的组，并且其中，控制结果值的所述组是指示在所述预先确定的间隔期间的能量使用的能量单元控制结果值，并且其中，控制值的所述更新的组是能量单元控制值的更新的组。13.根据权利要求12所述的系统(10)，其中，所述车辆(20)是混合动力电动车辆(HEV)，并且其中，所述车辆(20)还包括电力推进单元，以及适合于为所述电力推进单元供电的电池组，并且所述至少一个能量单元(21)是被布置为对所述电池组进行充电的内燃机，并且其中，所述能量管理单元(11)被布置为基于能量单元控制值的所选择的组来控制所述内燃机。14.根据权利要求10至13中的任一项所述的系统(10)，其中，所述车辆(20)还包括GPS(22)单元，所述GPS (22)单元被布置为接收GPS位置，并且其中，所述系统(10)被布置为基于由所述GPS单元(22)接收到的所述GPS位置来确定所述活动路线已经改变，因此，所述系统(10)确定所述车辆的新的活动路线。15.—种车辆(20)，所述车辆(20)包括根据权利要求10至14中的任一项所述的系统(10)。
【专利摘要】本发明涉及通过机器学习的车辆控制。一种用于管理车辆(20)中的规则或策略的方法(100)，所述车辆(20)包括至少一个可控制的单元(21)，所述方法(100)包括以下步骤：在开始行驶时确定(101)所述车辆的活动路线，从控制值的多个所存储的组中选择(102)控制值的组，其中，控制值的所述组中的一个控制值与所确定的活动路线的一个预先确定的间隔相对应，并且基于控制值的所选择的组来控制(103)所述至少一个可控制的单元。所述方法还包括：在所述车辆的当前行驶期间对控制结果值的组进行记录(104)，其中，一个控制结果值与所述车辆已经行驶的所确定的活动路线的预先确定的间隔相对应，并且所述控制结果值指示在所述预先确定的间隔期间的所述控制的结果。所述方法还包括：在所述行驶结束时，基于控制结果值的所述组来确定(107)实际已行驶路线的控制值的更新的组，并且存储(109)控制值的所述更新的组。
【IPC分类】B60W20/11, B60W40/00
【公开号】CN105438168
【申请号】CN201510570422
【发明人】R·阿维德松, N·阿克布卢姆
【申请人】沃尔沃汽车公司
【公开日】2016年3月30日
【申请日】2015年9月9日
【公告号】EP2998178A1, US20160075341

完整全部详细技术资料下载

当前第4页1 2 3 4