一种基于大数据融合的电动汽车能耗预测方法及系统与流程

文档序号:17291083发布日期:2019-04-03 03:58阅读:220来源:国知局
一种基于大数据融合的电动汽车能耗预测方法及系统与流程
本发明涉及电动汽车能耗预测
技术领域
,特别是涉及一种基于大数据融合的电动汽车能耗预测方法及系统。
背景技术
:近年来,世界范围内的能源和环境问题逐渐加剧,在交通领域,电动汽车因其具有的能源经济性和环境友好性而成为节能减排的重要工具。然而,由于动力电池技术发展水平的限制,目前电动汽车仍存在着续驶里程不足和充电时间较长的缺陷,此外电动汽车的剩余行驶里程难以准确估计,容易导致驾驶员和乘客产生“里程焦虑”,而电动汽车能耗的精准预测是剩余行驶里程准确估计的重要基础。目前,针对电动汽车能耗预测的研究多集中在实验室环境和仿真环境下,利用车辆行驶阻力公式,结合车辆静态参数以及速度和加速度等动态参数计算能耗。车辆行驶阻力公式为:其中,f为车辆行驶阻力;m为车辆装备质量;g为重力加速度;f为滚动阻力系数;θ为坡度;cd为风阻系数;ρair为空气密度;a车辆迎风面积;v为车速;δ为车辆传动系统的旋转惯量系数;a为车辆加速度。基于实验室仿真环境和车辆行驶阻力公式的能耗计算方法没有考虑实际行驶过程中复杂的行驶工况和行驶环境参数的影响,导致预测结果准确度低;并且在预测电动汽车能耗时,需要获取车辆的详细静态参数,在计算不同车辆的能耗水平时需要手动修改参数,因此工作量较大,不易实现自动化且不具有普适性。技术实现要素:本发明的目的是提供一种基于大数据融合的电动汽车能耗预测方法及系统,以解决电动汽车能耗预测过程中所需参数不易获取、且现有能耗预测方法准确度低的问题。为实现上述目的,本发明提供了如下方案:一种基于大数据融合的电动汽车能耗预测方法,所述电动汽车能耗预测方法包括:获取车辆运行的历史数据;所述历史数据包括多个历史数据矩阵;所述历史数据矩阵由车辆运行的日期、时间、速度、里程、经度、纬度、总电压、总电流、荷电状态和行驶状态组成;对所述历史数据进行数据清洗和数据插补处理,生成处理后车辆运行数据;根据所述处理后车辆运行数据划分车辆的运行状态;所述运行状态包括暂时停车状态、行驶状态和充电状态;根据所述车辆的运行状态将所述历史数据划分为行驶状态数据和充电状态数据;获取与所述行驶状态数据对应的环境信息数据;所述环境信息数据包括道路类型数据、海拔数据和温度数据;将所述环境信息数据与所述行驶状态数据进行数据融合,生成能耗水平预测参数集;对所述能耗水平预测参数集进行行驶片段划分和片段汇总,形成车辆行驶片段集排列矩阵;对所述车辆行驶片段集排列矩阵中的每个行驶片段进行特征提取,并汇总为车辆行驶片段特征矩阵;基于所述车辆行驶片段特征矩阵构建基于机器学习的电动汽车能耗水平预测模型;根据所述车辆行驶片段特征矩阵计算车辆历史的能耗数据;根据所述车辆行驶片段特征矩阵和所述能耗数据对所述电动汽车能耗水平预测模型进行训练,生成训练好的电动汽车能耗水平预测模型;采用所述训练好的电动汽车能耗水平预测模型预测电动汽车的能耗水平。可选的,所述对所述历史数据进行数据清洗和数据插补处理,生成处理后车辆运行数据,具体包括:对于所述历史数据中的每个所述历史数据矩阵,判断所述历史数据矩阵中是否存在数据缺失,获得第一判断结果;若所述第一判断结果为所述历史数据矩阵中存在数据缺失,判断所述历史矩阵中的数据缺失比例是否超过数据缺失阈值,获得第二判断结果;若所述第二判断结果为所述历史数据矩阵中的数据缺失比例超过数据缺失阈值,删除所述历史数据矩阵;若所述第一判断结果为所述历史数据矩阵中存在数据缺失,且所述第二判断结果为所述历史数据矩阵中的数据缺失比例不超过数据缺失阈值,采用插补法填充所述历史数据矩阵中的缺失数据,生成数据插补后的历史数据矩阵;对所述数据插补后的历史数据矩阵中的错误数据进行替换,生成数据替换后的历史数据矩阵。可选的,所述对所述数据插补后的历史数据矩阵中的错误数据进行替换,生成数据替换后的历史数据矩阵,具体包括:获取所述历史数据矩阵中每项数据的数值允许范围;对于所述数据插补后的历史数据矩阵中的每项所述数据,判断所述数据的值是否在所述数值允许范围内,获得第三判断结果;若所述第三判断结果为所述数据的值不在所述数值允许范围内,将所述数据的值替换为与所述数据相邻的数据的值,生成所述数据替换后的历史数据矩阵;多个所述数据替换后的数据矩阵构成所述处理后车辆运行数据。可选的,所述根据所述处理后车辆运行数据划分车辆的运行状态,具体包括:判断所述处理后车辆运行数据的180s时间窗口内是否存在速度大于零的数据帧,获得第四判断结果;若所述第四判断结果为所述处理后车辆运行数据的180s时间窗口内存在速度大于零的数据帧,则确定所述时间窗口内车辆均处在行驶状态;若所述第四判断结果为所述处理后车辆运行数据的180s时间窗口内不存在速度大于零的数据帧,则确定所述时间窗口内车辆处在暂时停车状态;判断所述处理后车辆运行数据的连续10帧数据窗口是否满足速度小于0.5km/h且总电流小于0a,获得第五判断结果;若所述第五判断结果为所述处理后车辆运行数据的连续10帧数据窗口满足速度小于0.5km/h且总电流小于0a,则确定所述连续10帧数据窗口内车辆处在充电状态。可选的,所述对所述能耗水平预测参数集进行行驶片段划分和片段汇总,形成车辆行驶片段集排列矩阵,具体包括:对所述能耗水平预测参数集进行行驶片段划分,将所述能耗水平预测参数集划分为多段行驶片段;将多段所述行驶片段按日汇总,形成多个车辆日行驶片段矩阵;将多个所述车辆日行驶片段矩阵按月进行汇总,形成所述车辆行驶片段集排列矩阵。可选的,所述对所述车辆行驶片段集排列矩阵中的每个行驶片段进行特征提取,并汇总为车辆行驶片段特征矩阵,具体包括:对所述车辆行驶片段集排列矩阵中的每个行驶片段进行特征提取,获得每个所述行驶片段的特征数据项;将多个所述特征数据项按日汇总,形成多个车辆日行驶片段特征矩阵;将多个所述车辆日行驶片段特征矩阵按月进行汇总,形成车辆行驶片段特征矩阵。一种基于大数据融合的电动汽车能耗预测系统,所述电动汽车能耗预测系统包括:车辆运行历史数据获取模块,用于获取车辆运行的历史数据;所述历史数据包括多个历史数据矩阵;所述历史数据矩阵由车辆运行的日期、时间、速度、里程、经度、纬度、总电压、总电流、荷电状态和行驶状态组成;数据预处理模块,用于对所述历史数据进行数据清洗和数据插补处理,生成处理后车辆运行数据;运行状态划分模块,用于根据所述处理后车辆运行数据划分车辆的运行状态;所述运行状态包括暂时停车状态、行驶状态和充电状态;历史数据划分模块,用于根据所述车辆的运行状态将所述历史数据划分为行驶状态数据和充电状态数据;环境信息数据获取模块,用于获取与所述行驶状态数据对应的环境信息数据;所述环境信息数据包括道路类型数据、海拔数据和温度数据;数据融合模块,用于将所述环境信息数据与所述行驶状态数据进行数据融合,生成能耗水平预测参数集;行驶片段划分模块,用于对所述能耗水平预测参数集进行行驶片段划分和片段汇总,形成车辆行驶片段集排列矩阵;特征值提取模块,用于对所述车辆行驶片段集排列矩阵中的每个行驶片段进行特征提取,并汇总为车辆行驶片段特征矩阵;模型构建模块,用于基于所述车辆行驶片段特征矩阵构建基于机器学习的电动汽车能耗水平预测模型;能耗数据计算模块,用于根据所述车辆行驶片段特征矩阵计算车辆历史的能耗数据;模型训练模块,用于根据所述车辆行驶片段特征矩阵和所述能耗数据对所述电动汽车能耗水平预测模型进行训练,生成训练好的电动汽车能耗水平预测模型;能耗预测模块,用于采用所述训练好的电动汽车能耗水平预测模型预测电动汽车的能耗水平。可选的,所述数据预处理模块具体包括:缺失数据判断单元,用于对于所述历史数据中的每个所述历史数据矩阵,判断所述历史数据矩阵中是否存在数据缺失,获得第一判断结果;数据缺失比例判断单元,用于若所述第一判断结果为所述历史数据矩阵中存在数据缺失,判断所述历史矩阵中的数据缺失比例是否超过数据缺失阈值,获得第二判断结果;数据删除单元,用于若所述第二判断结果为所述历史数据矩阵中的数据缺失比例超过数据缺失阈值,删除所述历史数据矩阵;数据插补单元,用于若所述第一判断结果为所述历史数据矩阵中存在数据缺失,且所述第二判断结果为所述历史数据矩阵中的数据缺失比例不超过数据缺失阈值,采用插补法填充所述历史数据矩阵中的缺失数据,生成数据插补后的历史数据矩阵;错误数据替换单元,用于对所述数据插补后的历史数据矩阵中的错误数据进行替换,生成数据替换后的历史数据矩阵。可选的,所述错误数据替换单元具体包括:数值允许范围获取子单元,用于获取所述历史数据矩阵中每项数据的数值允许范围;数值判断子单元,用于对于所述数据插补后的历史数据矩阵中的每项所述数据,判断所述数据的值是否在所述数值允许范围内,获得第三判断结果;错误数据替换子单元,用于若所述第三判断结果为所述数据的值不在所述数值允许范围内,将所述数据的值替换为与所述数据相邻的数据的值,生成所述数据替换后的历史数据矩阵;多个所述数据替换后的数据矩阵构成所述处理后车辆运行数据。可选的,所述运行状态划分模块具体包括:行驶状态判断单元,用于判断所述处理后车辆运行数据的180s时间窗口内是否存在速度大于零的数据帧,获得第四判断结果;行驶状态确定单元,用于若所述第四判断结果为所述处理后车辆运行数据的180s时间窗口内存在速度大于零的数据帧,则确定所述时间窗口内车辆均处在行驶状态;暂时停车状态确定单元,用于若所述第四判断结果为所述处理后车辆运行数据的180s时间窗口内不存在速度大于零的数据帧,则确定所述时间窗口内车辆处在暂时停车状态;充电状态判断单元,用于判断所述处理后车辆运行数据的连续10帧数据窗口是否满足速度小于0.5km/h且总电流小于0a,获得第五判断结果;充电状态确定单元,用于若所述第五判断结果为所述处理后车辆运行数据的连续10帧数据窗口满足速度小于0.5km/h且总电流小于0a,则确定所述连续10帧数据窗口内车辆处在充电状态。根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供一种基于大数据融合的电动汽车能耗预测方法及系统,首先对车辆运行历史数据进行解码、清洗、插补处理,再将处理后车辆运行数据划分为行驶状态数据和充电状态数据,将所述行驶状态数据与对应的环境信息数据进行数据融合,从而得到模型训练和能耗预测过程所需的能耗水平预测参数集,解决了电动汽车能耗预测过程中所需参数不易获取的问题。并且所述能耗水平预测参数集中包含了车辆实际行驶过程中复杂的行驶工况和行驶环境参数,将其用于训练电动汽车能耗水平预测模型,得到的训练好的电动汽车能耗水平预测模型能够更加准确的预测电动汽车的能耗水平。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据本发明提供的附图获得其他的附图。图1为本发明提供的基于大数据融合的电动汽车能耗预测方法的方法流程图;图2为本发明提供的基于大数据融合的电动汽车能耗预测方法的实施过程示意图;图3为本发明提供的历史数据矩阵的结构示意图。图4为本发明提供的基于大数据融合的电动汽车能耗预测系统的系统结构图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明的目的是提供一种基于大数据融合的电动汽车能耗预测方法及系统,以解决电动汽车能耗预测过程中所需参数不易获取、且现有能耗预测方法准确度低的问题。为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。图1为本发明提供的基于大数据融合的电动汽车能耗预测方法的方法流程图。参见图1,本发明提供的电动汽车能耗预测方法包括:步骤101:获取车辆运行的历史数据。图2为本发明提供的基于大数据融合的电动汽车能耗预测方法的实施过程示意图。参见图2,本发明首先从新能源汽车国家监测与管理平台中获取某一待研究车型的历史数据,然后对导出的历史数据进行数据处理,数据处理过程主要包括数据解码与清洗、车辆状态划分、行驶环境信息数据融合、行驶片段划分和特征值提取五部分,处理过程如图2所示。本发明从平台中下载的车辆运行的历史数据的格式为车辆按照gb/t32960标准要求上传的报文格式,这种报文格式无法直接读取和处理,并且车辆上传的一些数据项是无符号整型数据,如车速、里程、总电压和总电流等,因此需要对历史数据中的这些数据项还原真实值。首先对从平台中下载的车辆运行的历史数据进行解码,经过解码后的所述历史数据包括多个历史数据矩阵,所述历史数据矩阵的结构如图3所示,所述历史数据矩阵由车辆运行的日期、时间、速度、里程、经度、纬度、总电压、总电流、荷电状态(stateofcharge,soc)和行驶状态组成;所述历史数据矩阵中每一行代表车辆上传的一帧数据。步骤102:对所述历史数据进行数据清洗和数据插补处理,生成处理后车辆运行数据。由于车辆运行工况复杂,数据传输过程存在着各种干扰和不确定性因素,因此平台采集的历史数据中常常存在一些数据错误和数据缺失的问题,针对所述历史数据矩阵中的数据缺失问题,如果数据缺失的形式为整行缺失或某一属性列缺失,或数据缺失比例较高(高于数据缺失阈值),可以采用删除法将该历史数据矩阵删除。如果是历史数据矩阵中某属性列的数据小部分缺失(数据缺失比例不高于数据缺失阈值),则可采用数据插补填充缺失的数据。优选的,所述数据缺失阈值为5%,数据缺失比例超过5%的历史数据矩阵采用删除法进行处理,低于5%的采用插补法补全数据。对所述历史数据进行数据清洗和数据插补处理的过程如下:对于所述历史数据中的每个所述历史数据矩阵进行如下处理:判断所述历史数据矩阵中是否存在数据缺失,获得第一判断结果;若所述第一判断结果为所述历史数据矩阵中存在数据缺失,判断所述历史矩阵中的数据缺失比例是否超过数据缺失阈值,获得第二判断结果;若所述第二判断结果为所述历史数据矩阵中的数据缺失比例超过数据缺失阈值,删除所述历史数据矩阵;若所述第一判断结果为所述历史数据矩阵中存在数据缺失,且所述第二判断结果为所述历史数据矩阵中的数据缺失比例不超过数据缺失阈值,采用插补法填充所述历史数据矩阵中的缺失数据,生成数据插补后的历史数据矩阵。针对所述历史数据矩阵中的错误数据,可以针对数据项设定阈值,判断所述历史数据矩阵中的各项数据是否存在明显错误。部分车辆运行历史数据的数值允许范围如表1所示:表1部分车辆运行历史数据的数值允许范围参数数值范围车速[0,220)里程[上线开始里程,上线结束里程]总电压(0,1000]总电流[-1000,1000]soc[0,100]经度(73,135)纬度(4,53)由表1可以看出,所述车速的数值允许范围为[0,220),即在[0,220)范围内的车速数据属于正常情况,在[0,220)范围以外的车速数据为错误数据,需要用相邻的值进行替换。对所述数据插补后的历史数据矩阵中的错误数据进行替换的过程如下:获取所述历史数据矩阵中每项数据的数值允许范围;对于所述数据插补后的历史数据矩阵中的每项所述数据,判断所述数据的值是否在所述数值允许范围内,获得第三判断结果;若所述第三判断结果为所述数据的值不在所述数值允许范围内,将所述数据的值替换为与所述数据相邻的数据的值,生成数据替换后的历史数据矩阵;多个所述数据替换后的数据矩阵构成所述处理后车辆运行数据。若所述第三判断结果为所述数据的值在所述数值允许范围内,则保留原数据。步骤103:根据所述处理后车辆运行数据划分车辆的运行状态。车辆上传的历史数据包括暂时停车状态、行驶状态和充电状态下的数据,在本发明中主要研究的是行驶状态下的能耗水平,因此需要对车辆运行数据进行运行状态判断并提取行驶状态下的数据。在gb/t32960的数据标准中,电流从动力电池流出的方向规定为正,流入动力电池的方向规定为负,因此可以通过电流的正负来粗略判断充电和行驶状态,但是由于电动汽车在制动时同样会有电流流入动力电池,因此需要结合速度和时间综合判断,以提高判别精度。所述步骤103根据所述处理后车辆运行数据划分车辆的运行状态,具体包括:1)车辆行驶状态判断:所述处理后车辆运行数据的180s(三分钟)时间窗口内若存在速度大于零的数据帧,则判断此时间窗口内车辆均处在行驶状态,针对不同数据采集频率具体判断标准如下表2所示:表2不同采集频率的行驶状态判断标准时间间隔(s)数据频率(hz)数据间隔(s)数据帧数180111801800.110181800.03306国家平台中目前收集的车辆上传的历史数据分为三个主流频率,分别为1hz、0.1hz和0.03hz,本发明针对这三类数据分别设定不同的数据帧数判别标准,时间间隔均为180s。设定180s时间阈值的理由为,车辆在行驶过程中可能会出现暂时停车的情况,如路口红灯、拥堵暂时停车(小于3分钟),为保证行驶片段不过于零散,一般将此种状态归为行驶状态,将大于180s连续速度为零的状态认为是暂时停车状态,将其作为不同行驶片段的分割片段。2)车辆充电状态判断:所述处理后车辆运行数据中的连续10帧数据窗口若满足表3所示的判断标准:表3车辆充电状态判断标准则认为该数据帧窗口内车辆均为充电状态。设定速度小于0.5km/h的判断标准的理由为,车辆制动能量回收过程中也有可能满足总电流连续小于零的条件,但是此时车辆速度一般大于0km/h,考虑车辆在停驶充电过程中由于数据传输干扰等原因依然可能存在一定的数据漂移,因此综合考虑将速度阈值定为0.5km/h。步骤104:根据所述车辆的运行状态将所述处理后车辆运行数据划分为行驶状态数据和充电状态数据。根据所述车辆的运行状态设置车辆运行状态判断标志,并将所述车辆运行状态判断标志加入车辆运行历史数据中,形成能够支撑能耗研究的完整车辆原始数据集。例如类似用0/1作为所述车辆运行状态判断标志,分别表示车辆行驶状态或充电状态,并将其加入所述替换后的历史数据矩阵中。并根据所述车辆运行状态判断标志对所述处理后车辆运行数据进行行驶片段和充电片段的划分,将所述处理后车辆运行数据划分为行驶状态数据和充电状态数据。首先将所述处理后车辆运行数据按照日期分割,第i月的运行数据形成一个月行驶数据矩阵dmi,将一辆车的所有处理后车辆运行数据视为按月划分的数据矩阵的集合dz=[dm1,...,dmi,...,dmn],将第i月的月行驶数据矩阵dmi视为按天划分的日行驶数据矩阵的集合dmi=[dd1,...,ddj,...,ddl]t,对车辆每天的运行数据进行处理。其中dmi表示第i个月的月行驶数据矩阵,1≤i≤n,n为月行驶数据矩阵的数量。dz为月行驶数据矩阵的集合,即所述处理后车辆运行数据。ddj表示第j天的日行驶数据矩阵,1≤j≤l,l为dmi中日行驶数据矩阵的数量。根据行驶状态和充电状态的车辆运行状态判断标志将所述处理后车辆运行数据划分为两类片段,行驶片段和充电片段,并按照时间顺序在两类片段中对片段进行排序,分别构成所述行驶状态数据和所述充电状态数据。所述行驶状态数据中包括多个行驶状态数据矩阵。步骤105:获取与所述行驶状态数据对应的环境信息数据。所述环境信息数据包括道路类型数据、海拔数据和温度数据。基于所述行驶状态数据的明细数据,利用数据采集时间和车辆经纬度坐标信息,通过调用地理信息系统和网络api(applicationprogramminginterface,应用程序接口),包括温度api和海拔api,获取与所述行驶状态数据对应的车辆行驶环境信息数据,所述环境信息数据包括道路类型、道路坡度、温度等。步骤106:将所述环境信息数据与所述行驶状态数据进行数据融合,生成能耗水平预测参数集。根据时间和gps位置索引将所述车辆行驶的环境信息数据与车辆的行驶状态数据进行对应融合,即将车辆行驶的所述环境信息数据加入所述行驶状态数据矩阵中,共同形成能耗水平预测参数集,丰富车辆行驶过程中的能耗水平影响参数。融合后的能耗水平预测参数集仍以矩阵形式进行存储。步骤107:对所述能耗水平预测参数集进行行驶片段划分和片段汇总,形成车辆行驶片段集排列矩阵。对所述能耗水平预测参数集进行行驶片段划分和片段汇总的过程如下:1)添加行驶片段划分间隔标志以前后两帧数据时间间隔超过180s和速度连续为零的数据帧数超过180帧这两种数据特征作为片段分割的标志,对所述能耗水平预测参数集中的数据进行特征判断后将行驶片段划分间隔标志添加到所述行驶状态数据中。2)片段划分根据所述行驶状态数据中的片段划分标志对行驶状态数据进行划分,如果出现这两种数据特征就以这两种数据特征为分割点将该段数据划分为前后两段,用di矩阵储存第i段行驶片段数据。3)片段汇总切片后,将划分好的行驶片段di形成按日汇总的行驶片段集,以某日为例:drivingd=[d1,...,di,...,dm]t其中,drivingd为某日的车辆日行驶片段集,m为drivingd中行驶片段的数量。其中的行驶片段按照时间顺序依次编号。对drivingd按月进行汇总:drivingm=[drivingd1,...,drivingdi,...,drivingd_end]t如此就形成了按车辆状态划分的融合了行驶环境信息数据的车辆运行片段集按时间顺序依次排列的车辆行驶片段集排列矩阵drivingm,其中drivingdi为第i日的车辆日行驶片段集,d_end为drivingm中日行驶片段集的数量。步骤108:对所述车辆行驶片段集排列矩阵中的每个行驶片段进行特征提取,并汇总为车辆行驶片段特征矩阵。对所述车辆行驶片段集排列矩阵drivingm中的每个行驶片段di进行特征值提取,对该矩阵drivingm中的每一行提取的部分特征数据项如表4所示:表4车辆运行状态部分特征数据项本发明对划分后的行驶片段分别提取了行驶微观参数和环境参数的特征值,包括:1.行驶片段特征,具体包括:起始时间,结束时间,起始里程,结束里程,起始soc,结束soc;2.温度特征,具体包括:温度;3.速度特征,具体包括:平均速度(含0),平均速度(不含0),速度标准差(含0),速度标准差(不含0),最高速度,速度5%分位点(不含0),速度中位数(不含0),速度95%分位点(不含0),速度众数(不含0);4.速度分布特征,具体包括:0-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100公里/时(km/h)速度区间的占比分布情况;5.行驶状态特征,具体包括:怠速占比,匀速占比,加速占比,减速占比;6.加速度特征,具体包括:加速度标准差,加速度5%分位数,加速度95%分位数,平均加速度,平均减速度;7.加速度分布特征,具体包括;a<-2,-2<=a<-1.5,1.5<=a<-1,1<=a<-0.5,-0.5<=a<0,0<=a<0.5,0.5<=a<1,1<=a<1.5,1.5<=a<2,2<=a加速度区间的分布情况;a表示加速度,单位为m/s2。8.坡度特征,具体包括:上坡比例,下坡比例,平直比例,平均坡度,坡度标准差,上坡坡度均值,上坡坡度5%分位数,上坡坡度95%分位数,下坡坡度均值,下坡坡度5%分位数,下坡坡度95%分位数;9.坡度分布特征,具体包括:slo<-9,-9<=slo<-7,7<=slo<-5,-5<=slo<-3,-3<=slo<-1,-1<=slo<1,1<=slo<3,3<=slo<5,5<=slo<7,7<=slo<9,9<=slo坡度区间分布情况;slo表示坡度。10.能耗特征,具体包括:能耗(kwh),能量回收(kwh),每公里能耗(kwh/km)。将每个行驶片段di提取的特征矩阵按时间顺序排列,汇总为日片段特征矩阵:td_d=[td1,...,tdi,...,tdm]t按月汇总为所述车辆行驶片段特征矩阵:tm=[td1,...,tdi,...,td_end]t如此就形成了车辆运行片段特征数据按时间顺序排列的特征值矩阵,数据预处理至此结束。其中tdi为行驶片段di的特征矩阵,td_d为日片段特征矩阵。tdi为第i日的日片段特征矩阵,tm为所述车辆行驶片段特征矩阵。所述车辆行驶片段特征矩阵是针对每一个划分后的行驶片段提取的微观行驶参数和行驶环境数据特征的集合,本发明中研究这些特征值与能耗的相关关系,并选取对能耗具有明显影响的特征值作为能耗预测的输入值。步骤109:基于所述车辆行驶片段特征矩阵构建基于机器学习的电动汽车能耗水平预测模型。基于所述车辆行驶片段特征矩阵中的车辆行驶微观参数和行驶环境参数特征值构建基于机器学习的电动汽车能耗水平预测模型。步骤110:根据所述车辆行驶片段特征矩阵计算车辆历史的能耗数据。步骤111:根据所述车辆行驶片段特征矩阵和所述能耗数据对所述电动汽车能耗水平预测模型进行训练,生成训练好的电动汽车能耗水平预测模型。采用所述车辆行驶片段特征矩阵和所述能耗数据构造训练样本,对所述电动汽车能耗水平预测模型进行训练。将行驶片段的微观行驶特征参数和环境特征参数作为所述电动汽车能耗水平预测模型的输入参数,将行驶片段的能耗数据作为所述电动汽车能耗水平预测模型的输出参数,输入机器学习模型中进行有监督的学习,生成训练好的电动汽车能耗水平预测模型。步骤112:采用所述训练好的电动汽车能耗水平预测模型预测电动汽车的能耗水平。将车辆历史的特征数据以及能耗数据输入预测模型中进行训练,训练完成后用该训练好的电动汽车能耗水平预测模型进行能耗水平的预测。模型输入量为车辆的微观行驶参数和行驶环境数据的特征值,输出量为车辆在一段行驶片段中的能耗值。以往的研究多是在实验室环境下采集车辆的行驶参数,进而研究车辆的能耗,但是车辆的实际使用工况较为复杂,车辆的能耗也受到温度、道路情况等多种因素的影响,本发明综合考虑车辆的行驶参数和环境参数能耗,将更加全面的影响因素考虑进来,能够提高预测模型在实际环境下的适用性和准确性。本发明将车辆的行驶微观参数特征值和行驶环境参数特征值以及片段能耗值作为训练样本输入到机器学习算法中,一方面综合考虑了行驶环境等复杂因素的影响,另外一方面利用机器学习算法解决了能耗影响因素与能耗之间的复杂非线性关系,从而实现了电动汽车能耗的高精度预测。本发明根据所述基于大数据融合的电动汽车能耗预测方法,还提供一种基于大数据融合的电动汽车能耗预测系统。图4为本发明提供的基于大数据融合的电动汽车能耗预测系统的系统结构图。所述电动汽车能耗预测系统包括:车辆运行历史数据获取模块401,用于获取车辆运行的历史数据;所述历史数据包括多个历史数据矩阵;所述历史数据矩阵由车辆运行的日期、时间、速度、里程、经度、纬度、总电压、总电流、荷电状态和行驶状态组成;数据预处理模块402,用于对所述历史数据进行数据清洗和数据插补处理,生成处理后车辆运行数据;运行状态划分模块403,用于根据所述处理后车辆运行数据划分车辆的运行状态;所述运行状态包括暂时停车状态、行驶状态和充电状态;历史数据划分模块404,用于根据所述车辆的运行状态将所述历史数据划分为行驶状态数据和充电状态数据;环境信息数据获取模块405,用于获取与所述行驶状态数据对应的环境信息数据;所述环境信息数据包括道路类型数据、海拔数据和温度数据;数据融合模块406,用于将所述环境信息数据与所述行驶状态数据进行数据融合,生成能耗水平预测参数集;行驶片段划分模块407,用于对所述能耗水平预测参数集进行行驶片段划分和片段汇总,形成车辆行驶片段集排列矩阵;特征值提取模块408,用于对所述车辆行驶片段集排列矩阵中的每个行驶片段进行特征提取,并汇总为车辆行驶片段特征矩阵;模型构建模块409,用于基于所述车辆行驶片段特征矩阵构建基于机器学习的电动汽车能耗水平预测模型;能耗数据计算模块410,用于根据所述车辆行驶片段特征矩阵计算车辆历史的能耗数据;模型训练模块411,用于根据所述车辆行驶片段特征矩阵和所述能耗数据对所述电动汽车能耗水平预测模型进行训练,生成训练好的电动汽车能耗水平预测模型;能耗预测模块412,用于采用所述训练好的电动汽车能耗水平预测模型预测电动汽车的能耗水平。可选的,所述数据预处理模块402具体包括:缺失数据判断单元,用于对于所述历史数据中的每个所述历史数据矩阵,判断所述历史数据矩阵中是否存在数据缺失,获得第一判断结果;数据缺失比例判断单元,用于若所述第一判断结果为所述历史数据矩阵中存在数据缺失,判断所述历史矩阵中的数据缺失比例是否超过数据缺失阈值,获得第二判断结果;数据删除单元,用于若所述第二判断结果为所述历史数据矩阵中的数据缺失比例超过数据缺失阈值,删除所述历史数据矩阵;数据插补单元,用于若所述第一判断结果为所述历史数据矩阵中存在数据缺失,且所述第二判断结果为所述历史数据矩阵中的数据缺失比例不超过数据缺失阈值,采用插补法填充所述历史数据矩阵中的缺失数据,生成数据插补后的历史数据矩阵;错误数据替换单元,用于对所述数据插补后的历史数据矩阵中的错误数据进行替换,生成数据替换后的历史数据矩阵。所述错误数据替换单元具体包括:数值允许范围获取子单元,用于获取所述历史数据矩阵中每项数据的数值允许范围;数值判断子单元,用于对于所述数据插补后的历史数据矩阵中的每项所述数据,判断所述数据的值是否在所述数值允许范围内,获得第三判断结果;错误数据替换子单元,用于若所述第三判断结果为所述数据的值不在所述数值允许范围内,将所述数据的值替换为与所述数据相邻的数据的值,生成所述数据替换后的历史数据矩阵;多个所述数据替换后的数据矩阵构成所述处理后车辆运行数据。所述运行状态划分模块403具体包括:行驶状态判断单元,用于判断所述处理后车辆运行数据的180s时间窗口内是否存在速度大于零的数据帧,获得第四判断结果;行驶状态确定单元,用于若所述第四判断结果为所述处理后车辆运行数据的180s时间窗口内存在速度大于零的数据帧,则确定所述时间窗口内车辆均处在行驶状态;暂时停车状态确定单元,用于若所述第四判断结果为所述处理后车辆运行数据的180s时间窗口内不存在速度大于零的数据帧,则确定所述时间窗口内车辆处在暂时停车状态;充电状态判断单元,用于判断所述处理后车辆运行数据的连续10帧数据窗口是否满足速度小于0.5km/h且总电流小于0a,获得第五判断结果;充电状态确定单元,用于若所述第五判断结果为所述处理后车辆运行数据的连续10帧数据窗口满足速度小于0.5km/h且总电流小于0a,则确定所述连续10帧数据窗口内车辆处在充电状态。所述行驶片段划分模块407,具体包括:行驶片段划分单元,用于对所述能耗水平预测参数集进行行驶片段划分,将所述能耗水平预测参数集划分为多段行驶片段;行驶片段日汇总单元,用于将多段所述行驶片段按日汇总,形成多个车辆日行驶片段矩阵;行驶片段月汇总单元,用于将多个所述车辆日行驶片段矩阵按月进行汇总,形成所述车辆行驶片段集排列矩阵。所述特征值提取模块408具体包括:行驶片段特征提取单元,用于对所述车辆行驶片段集排列矩阵中的每个行驶片段进行特征提取,获得每个所述行驶片段的特征数据项;特征日汇总单元,用于将多个所述特征数据项按日汇总,形成多个车辆日行驶片段特征矩阵;特征月汇总单元,用于将多个所述车辆日行驶片段特征矩阵按月进行汇总,形成车辆行驶片段特征矩阵。本发明针对现有方法的缺陷,提出基于实际行驶车辆微观动力参数和行驶环境数据融合的电动汽车能耗研究和预测方法,通过数据驱动解决物理模型的输入参数不易获取的问题,达到了在实际运行工况下准确预测电动汽车能耗水平的目的。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1