基于充电片段数据和LightGBM模型的电池容量评估方法与流程

文档序号：32312328发布日期：2022-11-23 12:10阅读：197来源：国知局

基于充电片段数据和lightgbm模型的电池容量评估方法
技术领域
1.本发明属于电动汽车汽车电池状态评估领域，具体涉及基于充电片段数据和lightgbm算法的动力电池容量预测模型和电池容量评估方法。

背景技术：

2.随着全球能源短缺，以及电动汽车相关技术的突破，人们对于电动汽车的需求量持续增高。电动汽车的发展依赖于电池的循环性能和安全性。为了确保电动汽车电池的各方面性能的可靠性，电池的性能参数需要被有效监测。其中，电池管理系统(bms)是重要且使用的监测手段。电池管理系统的主要目的就是保证电池系统的设计性能，从安全性、耐久性、动力性三个方面提供作用。安全性方面，即bms管理系统能保护电池单体或电池组免受损坏，防止出现安全事故。耐久性方面，即使电池工作在可靠的安全区域内，延长电池的使用寿命。动力性方面，即要将电池的工作状态在维持在满足车辆要求的情况下。
3.具体地，bms通过分析电池参数来监管电池状态，实时监控电池的充电状态(soc)、健康状态(soh)和剩余寿命(rul)。bms实时显示精确的soc信息能充分缓解“续航里程焦虑”问题，也能避免电池处于深度放电状态。对车主、电池厂商、换电运营商、保险公司及交通部门而言，可以解决各方痛点问题。对剩余寿命(rul)进行准确预测能使电池在更换或回收前得到充分利用。对废旧电池的剩余寿命进行评估，也能够使其部署在要求较低的应用中，如固定的电网存储。此外，在bms上传数据时，会存在一定比例错误的soc数值，需要进行数据矫正，以防止对其余需要使用soc数据的算法产生影响。这能够为目标系统提供预防性维修和维护的决策参考，降低维护成本并减小致命故障的几率。因此准确预测动力电池当前和未来状态对电池的制造、使用和优化有重要的意义。
4.在车载电池的实际使用中，充电情况多为片段充电，即充电时间往往较短且充电周期不固定。例如，动力电池在实际的使用过程中，充电情况一般是类似soc从20%到80%或者soc从50%到100%，由此得到片段充电数据。因此，无法从每次充电情况判断电池可用容量。进而，每次使用短暂的充电数据进行预测较为困难。因此，便需要一种以大量实车的原始充电片段数据为数据来源，能高精度、实时性测量当前soc的方法。
5.为了得到准确有效的soc预测结果，同时考虑到现实生活中海量的电池充电片段数据。lightgbm模型是轻度梯度提升机，本发明提出基于该模型的预测方法，其优点在于，得到的训练模型具有良好的泛化性，且能有效避免过拟合等问题。此外，lightgbm支持高效率的并行训练，具有更快的训练速度、更低的内存消耗、更好的准确率、支持海量数据等特点。

技术实现要素：

6.为了解决现有的动力电池状态预测方法不能用于真实车辆测量、无法同步精准反应当前电池soc、不易预测和校准以及在实用性方面的欠缺，本发明提供一种以大量实车的原始充电片段数据为数据来源，适用于现实工况环境、快速准确地进行电池状态监控、便于
实时预估和矫正当前电池soc的电池容量评估方法。
7.本发明解决其技术问题所采用的技术方案如下：基于充电片段数据和lightgbm模型的电池容量评估方法，主要包括如下实现步骤：s1：建立电池荷电状态soc模型，根据电池的不同状态分别计算电池soc，将安时积分法与开路电压法联合使用，并针对常用的恒直流充电模式建立soc计算方法。
8.s2：充电片段数据库的建立，电池片段数据以实际行驶汽车为数据输入源，通过对车辆bms获取时间序列、总电压、soc、车辆充电状态、车辆行驶状态等片段数据，其中片段数据可位于充电曲线周期内的任意位置。
9.s3：数据挖掘：具体包括数据预处理、数据探索、处理soc异常数据三个实现步骤，如下：s31：数据预处理：对与电动汽车电池soc相关的原始数据及车辆行驶状态记录数据进行数据清洗，并对电池总电压数据进行相应矫正，并将上述处理后的数据进行数据整合；所述原始数据包括时间戳、车辆的充电模式、车辆的运行模式、电池的荷电状态等；所述数据整合包括将预处理后的数据保存成pickle文件，后续分析和建模将直接从此数据上进行操作；s32：数据探索，该步骤主要对经过预处理后的数据进行有效值检验，检验内容包括：数据字段、数据精度、数据质量；所述数据字段是指容量提取和建模过程需要的所有特征字段原始、数据中都存在，数据字段要符合要求；所述数据精度，除了soc的精度偏低，其它的数据字段的精度都符合要求；所述数据质量，在时间数据质量良好，重复时间数据很少，10秒间隔基本稳定；s33：处理soc异常数据情况一：soc跳变为0，部分原始数据，在时间序列没有发生截断的情况下，soc数值发生了大幅度的跳变情况；情况二：soc大幅跳变，这种情况是因为时间重复，在数据预处理阶段进行删除异常数据操作；情况三：soc跳变到异常值，超出0-100范围内，时间正常这种情况是因为soc本身数值的异常上传，可以直接用上一时刻的soc值代替，如果充电过程或者放电过程中，正好异常值的上一时刻和下一时刻的soc相差1，那么上一时刻和下一时刻的soc值都可以作为代替值。
10.s4：特征数据提取，将原始数据特征通过预处理过后得到的数据进行总结和抽取，获取影响电机超速故障的衍生特征因素；所述原始数据特征包括：(1)具体总电压(2)单体最低电压(3)单体最高电压(4)单体电压均值(5)单体电压标准差(6)测温点最高温度(7)测温点最低温度(8)测温点温度均值(9)测温点温度标准差(10)累计行驶里程；所述衍生特征因素包括：(1)充电soc跨度(2)静置时间(3)放电soc跨度。
11.s5：建立模型，对于已提取的特征建立电池soc与对应特征变量的对应关系数据集，选取基于lightgbm算法的模型对数据进行基于梯度的单面采样和互斥特征合并；所述基于梯度的单面采样是保留那些具有较大梯度的数据即对计算信息增益的贡献比较大的、更加需要训练的实例；所述互斥特征合并是将高维的互斥稀疏特征合并，大大减少特征数量来提高训练速度。
12.s6：样本测试，在上述建立的模型的基础上对测试集数据进行验证，确定模型的校验准确率。
13.本发明有益效果是本发明所述预测模型通过采集大量真实车辆数据作为数据来源，从(1)总电压(2)单体最低电压(3)单体最高电压(4)单体电压均值(5)单体电压标准差测温点温度标准差(6)充电soc跨度、放电soc跨度等指标参数中提取特征，结合正负样本测试结果，能够针对新能源电动汽车电池soc进行精准的矫正。
14.针对动态非线性电化学系统的特性，本发明所涉及模型预测精度较高且适应实际工况下的电池相关数据的特征提取。
15.使用基于lightgbm算法的模型，在实车电池soc校准的应用场景中实践，从与电池相关的数据中提取特征数据，所取得的结果较为精准且符合实际情况，具有较强的理论意义和应用价值。
附图说明
16.图1为本发明技术流程图。
17.图2为电动汽车电池的监控数据变量描述。
18.图3为步骤s3流程图。
19.图4为数据的精度要求。
20.图5为数据的质量说明。
21.图6为soc大幅跳变(时间正常、车辆状态改变)。
22.图7为soc大幅跳变(时间重复)。
23.图8为soc跳变到异常值(超出0-100范围内，时间正常)。
24.图9为特征数据图。
25.图10为时间域较宽时原始充放电soc数据。
26.图11为soc校准模型预测的soc数据。
27.图12为时间域较窄时原始数据中的soc数据。
28.图13为其soc校准算法预测的soc数据。
具体实施方式
29.下面结合实施例对本发明的具体实施方式进行详细说明，需要指出的是，该具体实施方式仅仅是对本发明优选技术方案的举例，并不能理解为对本发明保护范围的限制。
30.实施例1结合图1说明本实施例，本发明所涉及的基于lightgmb算法和日常充电片段数据
的电池整体容量实时评估的技术方案，包含以下步骤：s1：建立bms内部电池荷电状态soc联合计算模型，衡量电池的剩余电量，即根据电池充电、放电和静置3种不同使用状态采用联合的估算方法。将安时积分法与开路电压法联合使用，并针对常用的恒直流充电模式建立soc计算方法。
31.其中，电池剩余容量模型如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)实际应用中，soc取值范围定义为0%至100%。
32.当电池处于日常常用的恒流充电模式时，soc计算方法如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)式(2)中，为初始soc，为电池的充电电流，为进行一次片段充电所需时间。
33.当电池处于长时间静止状态时，开路电压与soc间存在相对固定的函数关系。使用开路电压来估算soc。
34.当锂电池放电时，可根据安时积分法求得t时刻的soc：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)式(3)中，为电池的额定容量。
35.s2：充电片段数据库的建立。
36.电池片段数据以同一车型的45辆测试车辆为数据输入源。电动汽车电池的数据为电动汽车监控数据，监控数据包括正常使用状况下与电池相关的电池自身数据以及汽车状态数据。图2为电动汽车电池的监控数据变量描述。
37.历时18个月，通过对车辆bms获取时间序列、总电压、soc、车辆充电状态、车辆行驶状态等数据。采集规则为每10秒采集一次，该数据在电动汽车的不同整车状态中，如行驶、充电过程中都会产生。使用数据均是基于时间序列的流式数据。
38.一次充电始末为充电片段数据，片段数据可位于充电曲线周期内的任意位置，如从soc为50%至80%。
39.s3：数据挖掘：数据探索和数据预处理。
40.结合图3，具体步骤如下：s31：数据预处理。对所述与电动汽车电池soc相关的原始数据及车辆行驶状态记录数据进行数据清洗。
41.主要的预处理过程包括空值、重复值、异常数据处理和字段数值矫正。
42.其中，对数据进行去重，每辆车只要有完全重复的数据多条，都会保留其中一条，其余条数据删除。
43.其中，时间戳异常值处理，主要针对年、月、日、时、分、秒设定各自的取值范围，比如月的取值范围是1-12，日的取值范围是1-31等，超出范围的数据会整条被删除。
44.其中，电池总电压矫正，原始数据中总电压的数据不是真实的总电压，需要除以10得到真实的总电压数据。
45.将数据保存为pickle文件。原始数据中包含了很多的字段，使得文件读入较慢、且读入后占据很大的内存，将后续需要的字段经过数据预处理后，保存为pickle文件，以便在后续步骤种可以直接使用pickle文件进行特征工程等处理，比起用原始数据可以节省很多的处理时间和内存。
46.s32：数据探索。该步骤主要对经过预处理后的数据进行有效值检验。
47.数据字段：字段符合要求(是指容量提取和建模过程需要的所有特征字段原始、数据中都存在)。
48.数据精度：图4为原始数据的具体精度要求。除了soc的精度偏低，其它的数据字段的精度都符合要求。
49.数据质量：时间数据质量良好，重复时间数据很少，10秒间隔基本稳定。图5为在不同时间间隔情况下对数据质量的评估。
50.s33：处理异常soc数据。soc数据异常跳变有三种情况：跳变为0、大幅跳变和超出正常范围。结果如图6至图8所示。处理方法如下：情况一、soc跳变为0，此情况一般是bms上传的错误，部分原始数据可如图6所示，可以明显发现，在时间序列没有发生截断的情况下，soc数值发生了大幅度的跳变情况。
51.情况二、soc大幅跳变(时间重复)。这种情况是因为时间重复，并且后续时间也都正常，soc的跳变是因为异常的那一条数据造成，如图7所示。因此在数据预处理阶段进行删除异常数据操作。
52.情况三、soc跳变到异常值(超出0-100范围内，时间正常)。这种情况是因为soc本身数值的异常上传，其实本身应该还是上一时刻的soc值，可以直接用上一时刻的soc值代替，如果正好异常值的上一时刻和下一时刻的soc相差1(充电过程或者放电过程)，那么上一时刻和下一时刻的soc值都可以作为代替值。具体情况如图8所示。
53.s4：特征数据提取。将通过预处理过后得到的数据进行总结和抽取，获取特征因素。选取特征由两部分组成，分别是原始数据特征和衍生特征。
54.s41：选择原始特征：soc和电压的相关性较高，并且不同温度下的soc存在差异，所以电压和温度数据均可作为建模原始特征。这里考虑到所有单体电压和测温点温度的数值太多，存在大量重复值，所以用最大、最小、均值、标准差等代替。并且soc会受到电池的衰减影响，也就是soh。soh的其中一个影响因子是累计行驶里程，因此将里程也作为一个原始特征。
55.选择的原始特征如下：(1)总电压(2)单体最低电压(3)单体最高电压(4)单体电压均值(5)单体电压标准差(6)测温点最高温度(7)测温点最低温度(8)测温点温度均值(9)测温点温度标准差(10)累计行驶里程。
56.s42：设置衍生特征：衍生特征是指用原始数据进行特征学习得到新的特征。由于锂离子电池在充电过程中存在欧姆极化，随着充入电量的不断增加，欧姆极化也越严重。设置衍生特征消除对校准精度的影响。
57.其中，欧姆极化现象主要体现在正常情况下的soc对应的电压逐渐变大，所以为了考虑欧姆极化对soc校准的影响，设定了充电soc跨度特征消除此影响。如从soc = 20 充电到 soc = 80，那么此时的特征值就是60。
58.其中，在车辆刚充完电后的静置阶段，电压会逐渐恢复到正常水平，因此静置时间也作为一个特征。
59.其中，在车辆充完电的行驶过程中，也会逐渐抵消欧姆极化现象，因此放电soc跨度(和充电soc跨度的逻辑相同)也作为一个特征。
60.由此得到了三个衍生特征变量，分别是：充电soc跨度、静置时间和放电soc跨度。
61.最终可得13个特征数据，包含10个原始特征数据和3个衍生特征数据集。所有的特征数据如图9所示。
62.s5：基于特征提取后的数据建立电动汽车soc校准模型。
63.选择基于lightgbm(决策树算法为弱学习器的分布式梯度提升框架)的模型用于电机超速故障的预测。
64.本步骤首先需进行数据提取。将特征提取部分提取的正负样本进行合并构成模型训练的全部样本，将提取的样本按照3：1划分为训练集和验证集。
65.在数据提取后还需进行数据划分，将提取的样本划分为训练集和验证集，比例为训练集：验证集 = 3：1。
66.在数据划分后构建模型：gbdt(梯度提升树)使用多轮迭代提升学习性能，在gbdt迭代中，设前一轮所得到的学习机为，损失函数，则本轮的目标是找到一个弱学习机，使本轮损失函数最小。本轮损失函数表示为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)计算损失函数的负梯度，来拟合本轮损失函数近似值，损失函数近似值表示为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)使用平方差近似拟合使用平方差近似拟合
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)最终得到了本轮的强学习机：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)基于lightgbm的模型是在梯度提升树(gbdt)的基础上进行升级，即能保持较高的准确率又提升了效率。
67.基于梯度的单边采样(goss)和互补特征压缩(efb)。得到l算法。采用直方图算法进行互斥特征的合并。其解决办法为：将连续的属性值离散为 m 个整数，离散化的同时构造一个直方图，其宽度为 m，当进行数据的遍历时，就可以将离散化之后的值作为索引在直方图中累计统计量，然后可以根据直方图的离散值进行遍历来找到最优的切分点。
68.由于本次的训练数据非常庞大，所以我们选择使用gpu版本的lightgbm进行模型训练和调优。我们使用greadsearch进行5折交叉验证调参，参数选择包括：(1)max_depth：树的最大深度。(2)num_leaves：叶子的最大数目。(3)reg_alpha：l1正则化系数。(4)reg_lambda：l2正则化系数。
69.s6：对于最终的算法模型，通过训练集训练模型，验证集验证模型效果，实时更新。由于本次的数据集庞大，所以训练的迭代次数过多，得到的收敛模型比较大，因为此时的模型内部的树结构很多。获取收敛模型后，我们使用了一辆车的部分充放电数据进行验证，效
果如图10和图11所示，图10为是原始充放电soc数据，图11为soc校准模型预测的soc数据。可见，soc校准模型预测的soc和原始数据中的soc基本吻合，即此模型在时间域较宽时对电池soc的校准效果还是比较准确的，这样我们就可以用soc校准模型对一些虚高、偏低、误差较大的soc数据进行校准s7：选取具有异常soc数据的实车进行对比测试，测试结果具体如图12和图13所示，其中图12为时间域较窄时的原始数据中的soc数据，图13为其soc校准算法预测的soc数据。从原始数据中我们可以明确得到原始数据中的一段soc直接从100直接下降到91(图中横坐标600附近)，这是不合理的，但是我们通过soc校准算法预测的soc，在此处并没有和原始数据一样从100直接下降到91，而是略有下降后，维持一段时间后，呈阶梯式下降。这才是此时soc正在的下降表现。
70.故无论从时间域较宽还是时间域较窄时的情形，此模型都能有比较准确且符合实际的校准预测表现。
71.本发明利用实时的电动汽车电池充电片段数据，可以快速、准确地预测电动汽车的电池容量。此外，通过lightgbm模型，能够在内存有限、数据海量的情况下，高效、并行地预测电池容量。因此，本发明具有良好的实际意义。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：廖初航李斌斌
技术所有人：上海褒科智能科技有限公司
我是此专利的发明人

上一篇：定点送粉装置、选区激光熔化成型设备及方法
上一篇：一种用于会计档案保管的会计票据装订打孔装置

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。