本发明属于交通技术领域,主要应用于通过预测未来行驶工况能耗估算电动汽车续航里程的方法,具体涉及一种基于gru网络模型预测未来行驶过程能耗的方法。
背景技术:
电动汽车以电能作为动力来源,电能具有高效、快捷、来源广泛、清洁无污染的特点,使得电动汽车已经是汽车行业发展的最新趋势。由于电动汽车的能量仅由电池提供,而电池的能量又不充足,这样导致在车辆行驶过程中易使驾驶者产生里程焦虑问题,即驾驶电动汽车时因担心突然没电引起的精神痛苦或忧虑,所以行驶里程短这一限制严重制约了电动汽车的推广普及。
目前关于电动汽车续航里程的研究中,未来能耗估计方法十分简单,认为车辆未来行驶条件与过去基本相同,能耗始终保持不变。而在实际道路上运行时,电动汽车电流、电压、温度、速度、驾驶习惯等各种环境因素都在变化,如何结合电动汽车行驶过程中的工况特性,借助现有的预测模型进行分析,从而保障驾驶员每一次出行的通行能力,是每一个交通人最为关心的问题。主要工作体现在借助电动汽车的电池管理系统中的历史流量数据对未来行驶过程中的电动汽车能耗进行预测。
现有技术中,综合分析主要分为两大类:1、基于过去一段时间的平均能耗估计未来行驶的平均能耗。影响电动汽车的能耗因素有很多,主要包括道路类型、坡度、车速、交通状况、环境温度、驾驶习惯等。当未来的交通状况发生改变的时候,电动汽车的能耗就会发生很大的改变,产生较大的预测误差。2、利用具体能耗模型结合gps信息具体计算出未来的行驶能耗需求。这种方法需要采集并处理大量的数据信息,而且要根据车辆工作原理建立复杂车辆能耗估计模型,这是一个很繁琐的过程,并且车辆的大部分能耗影响因子的影响又很难量化,能耗计算过程相对复杂。
技术实现要素:
针对上述现有技术仅从模型的改善来预测电池的电荷状态无法从实质情况提升预测精度的问题,本发明于提出一种gru网络模型预测未来行驶过程中能耗的方法。该方法的具体技术方案如下:
一种基于gru神经网络模型预测电动汽车未来行驶平均能耗值的方法,所述方法包括:
s1、构建数据集,从城市公交大数据平台数据库中将纯电动公交车辆历史行驶数据导入至hadoop大数据集群下的hbase数据库中,通过spark计算框架对电动公交数据进行预处理;
s2、将处理后的数据特征进行标准化处理,分析每个特征的影响因子,筛选出有效特征;
s3、建立模型,基于gru神经网络构建以交叉验证的方式对输入的数据集和输出数据划分为训练集和测试集,通过训练gru神经网络模型,结合设定的初始网络参数,建立预测电动车未来行驶能耗的gru神经网络模型,并跟踪损失函数调整参数,获得最优的gru神经网络模型;
s4、输入新特征数据样本至所述gru神经网络模型,输出车辆运行过程中未来的平均能耗,从而计算出新能源公交车的剩余续航里程。
进一步的,所述步骤s1中通过spark计算框架对电动汽车行驶数据进行预处理,包括以下步骤:
步骤1-1)从hbase数据库中根据车辆状态参数筛选出行驶数据,对数据进行预处理,包括异常值、空缺值剔除,数据修复;
步骤1-2)以行驶里程一公里为度量,计算车辆平均速度、平均电压、平均电流,最高温度、最低温度;
步骤1-3)纯电动公交每次运营过程,某一位置的未来平均能耗为:
式中,e(xi)为当前位置时的剩余能量值,e(xend)为车辆运营到终点时的剩余能量值,d(xi,xend)为当前位置到终点位置时的距离;
步骤1-4)构建驾驶员驾驶风格识别参数,分为普通、节能、耗能,建立驾驶风格识别dx(i):
dx(i)=ω1d1(i)+ω2d2(i)+ω3d3(i)+ω4d4(i)+ω5d5(i)
式中,dx(i)分别为该驾驶员实际行驶过程中的平均能耗率eave、平均车速vm、最大车速vmax、平均加速度aam和平均减速度abm,ω1-ω5为权系数,
根据历史运行数据,计算每次新能源公交车运营的dx(i),并通过聚类分析算法,得出驾驶风格参数。
进一步的,所述步骤s2中,对于驾驶风格参数数据进行zero-mean标准化处理,
式中,x*代表标准化后的数据,x代表原始特征数据,μ代表该特征样本均值,σ代表样本标准差;
对于其他数据项利用离差标准化,
yi代表标准化操作后输出数据,xi代表原始特征数据,min代表该特征样本中最小值,max代表该特征样本中最大值;
使用lasso回归算法对原始数据所有变量的权重进行判断,根据权重大小选择最重要的特征;
式中xij为第i组j个变量,行向量
进一步的,步骤s3中,所述参数包括节点数、学习率和迭代次数,所述损失函数包含以下l2正则项:
式中,ω代表权重参数,λ代表权重参数的重要性,x代表输入值,y(x)代表未来平均能耗的真实值,a代表输入x得到的相应输出值即预测值,n代表一次训练的总数据量。
进一步的,步骤s4中,输入特征数据,预测得出车辆运行过程中未来的平均能耗,从而计算出新能源公交车的剩余续航里程:
式中,h为剩余续航里程,
有益效果:本发明的一种gru网络模型预测未来行驶过程中能耗的方法,该方法利用电动汽车电池管理系统中的历史数据,在深度学习网络的框架下,基于深度学习网络构建神经网络模型,实现对未来行驶工况过程中的能耗预测;与现有技术相比,本发明的方法能够省去繁琐的数学建模,减小预测的误差,提升预测精度,从而能够准确估算续航里程,大大提高驾驶员的每次出行自信。
附图说明
图1为本发明实施例中所述一种gru网络模型预测未来行驶过程中能耗的方法流程图示意;
图2为本发明实施例中新能源汽车行驶数据处理流程示意;
图3为本发明实施例中对原始数据进行特征提取的流程图示意;
图4为本发明实施例中所属gru网络模型图;
图5为本发明实施例中所述gru网络模型随训练次数增加的损失值变化趋势图示意;
图6使用gru模型进行电动汽车未来行驶过程能耗预测值与实际值的对比结果图示意;
图7大数据平台实时估算续驶里程效果。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
参阅图1,在本发明实施例中,提供了一种gru网络模型预测未来行驶过程中能耗的方法,方法具体包括步骤如下:
步骤1)参照gb/t32960《电动汽车远程服务与管理系统技术规范》的电动汽车上传数据规范,选取车牌号为“鲁faz055”电动乘用车从2019年4月16日到2019年5月16日之间的数据。采样数据共有159788条数据,包括192个特征。选取有效特征,包括车牌号、报文时间、车辆编号、总电压、总电流、soc、最高单体电压、最低单体电压、最高温度、最低温度、行驶速度、行驶里程、剩余能量。
表1电动汽车数据主要字段
将车辆历史数据导入至hadoop大数据集群下的hbase数据库,通过spark内存计算框架对存入的数据集进行数据预处理,消除历史数据中数据紊乱、数据缺失和数据错误构建数据集。
通过spark计算框架筛选出新能源公交每一次的运营行驶数据,根据电池的充电状态,首先剔除掉电池的充电数据。在此基础上截取汽车行驶过程的数据。通过判断10分钟内车辆速度或者电流是否变化,若变化则判断车辆里程是否增加,若行驶里程增加则存为一段行驶过程。
以行驶里程为1公里作为度量,对汽车运行速度、电压、电流数据进行平均化处理。
表2原始数据表
表3平均处理后的放电数据表
在spark平台计算公交车每次运营过程,在某一位置的未来平均能耗为:
式中,e(xi)为当前位置时的剩余能量值,e(xend)为车辆运营到终点时的剩余能量值,d(xi,xend)为当前位置到终点位置时的距离。
构建驾驶员驾驶风格识别参数,分为普通、节能、耗能,建立驾驶风格识别dx(i):
dx(i)=ω1d1(i)+ω2d2(i)+ω3d3(i)+ω4d4(i)+ω5d5(i)
式中,dx(i)分别为该驾驶员实际行驶过程中的平均能耗率eave、平均车速vm、最大车速vmax、平均加速度aam和平均减速度abm,ω1-ω5为权系数,
根据历史运行数据,计算每次新能源公交车运营的dx(i),并通过聚类分析算法,得出驾驶风格参数。
计算每次公交运营过程中的数据,部分不同工况情况下的驾驶风格识别参数如表4所示。
表4不同工况下的驾驶风格指标
步骤2)使用lasso算法对因变量特征进行判断,分析其影响因子系数,并对特征进行筛选。将筛选出的系数高的特征输入至所述gru网络中,将输出数据集设定为下一阶段的能耗值;
在多元回归算法中,自变量特征数量往往较多,将所有自变量特征引入模型中,不仅模型会显得过于复杂,更重要是若存在较多无意义的变量特征,会造成模型训练速度慢、拟合效果差等问题。通过变量筛选方法,使得因变量贡献效果较大的自变量被选入预测模型,对与其他自变量有密切线性关系或贡献小的自变量特征尽可能地进行剔除。
通过使用lasso算法对因变量特征进行判断,分析其影响因子系数,并对特征进行筛选,公式定义如下:
其中xij为第i组j个变量,行向量
根据lasso特征计算的结果,主要选择权重比较大的特征,最后选择mileage、soc、voltage、current、speed、weather、weekday、drivingstyle作为模型的输入,将未来平均能耗作为模型输出。
步骤3)建立模型,基于gru神经网络构建以交叉验证的方式对输入的数据集和输出数据划分为训练集和测试集,通过训练和测试gru网络模型,结合设定的初始网络参数,建立预测电动车未来行驶能耗的gru模型,通过跟踪损失函数调整参数,获得最优的gru模型;
门限控制单元gru全称为gatedrecurentunit,是一种改进后的lstm深度神经网络模型。lstm网络模型通过其三重门控,解决了神经网络中数据长期依赖不稳定等的问题,但其复杂的网络模型,对系统运行时间及稳定性提出了较高的要求。为了解决lstm网络中的一些问题,gru对其进行了深度改进。通过更新门(updategate)、重置门(resetgate)对结构进行了优化。
首先,在时间步第t步时,更新门通过以下公式对经过数据进行计算。
zt=σ(w(z)xt+u(z)ht-1)
式中,xt代表输入值x第t个分量,w(z)代表权重矩阵,ht-1保存了前一个时间步的信息,经过权重矩阵u(z)进行线性变换。
更新门的作用是将其相加,并通过sigmoid函数对结果进行转换,将激活结果压缩到0至1之间。更新门决定了将历史数据的多少传递给未来,减小梯度消失的风险。
接下来,重置门决定了数据的遗忘流程,可以用以公式表示:
rt=σ(w(r)xt+u(r)ht-1)
式中,xt代表输入值x第t个分量,w(r)代表权重矩阵,ht-1保存了前一个时间步的信息,经过权重矩阵u(r)进行线性变换。
与更新门类似的,重置门将输入序列的分量和前一步所保存的信息进行线性变换,最后通过sigmoid激活函数进行变换输出。
模型选取第106次至128的放电数据共计3991条作为训练样本,将129至134次的放电数据共计1022条作为测试样本。
其中,基于gru网络模型的训练步骤如下:
模型参数选取,初始学习率为0.001,隐藏层单元数为10,训练数据集的batch_size为80,迭代次数为1000次,time_steps为10。
由图5可知,当迭代超过一千次后,损失率变化趋向于零,该模型训练效果良好。
步骤4)验证基于gru网络的电池能耗预测模型,输入测试样本至所述电动汽车未来工况行驶平均能耗预测模型,输出预测结果。
通过训练集训练时间序列的预测模型,然后预测结果如下图6所示,其中虚线为预测能耗值,实线为实测能耗值;从中可以看出预测值与实际值趋势相同,且差距不大。
为了更加直观的展现算法的拟合度,通过r平方(r-square)来衡量预测值与实际值的拟合度,r平方通过公式
均方根误差(rmse),是指是观测值与真实值偏差的平方和观测次数n比值的平方根,可由公式
最后根据预测得出车辆运行过程中未来的平均能耗,根据以下公式计算出新能源公交车的剩余续驶里程,如表5所示。并依托hadoop平台将实时预测的续驶里程展现在终端显示,如下图7所示。
式中,h为剩余续航里程,
表5续驶里程计算
综上可知,本发明的gru网络模型预测未来行驶过程中能耗,该方法在深度学习网络的框架下,基于深度学习网络构建gru记忆网络,根据gru网络构建电动汽车行驶过程能耗预测模型,与现有技术相比,本发明的方法能够减小行驶过程中能耗预测的误差,提升预测精度。
以上仅为本发明的较佳实施例,但并不限制本发明的专利范围,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本发明说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本发明专利保护范围之内。