基于自编码器和集成学习储能电池热失控预警方法

文档序号:30582784发布日期:2022-06-29 13:21阅读:98来源:国知局
基于自编码器和集成学习储能电池热失控预警方法

1.本发明涉及储能电池安全预警领域,具体是基于自编码器和集成学习储能电池热失控预警方法。


背景技术:

2.2030碳达峰、2060碳中和是我国重大发展战略,而储能产业是实现用能变革的关键。目前,储能电池主要被运用于电动汽车与储能电站中。随着电动汽车和储能电站的大规模推广,储能电池热失控所引发的燃烧和爆炸事故屡见不鲜。当前,能源系统中的储能电池安全性不足给国民经济和生命安全带来重大隐患。中华人民共和国国家标准与美国能源部国家能源实验室均将储能电池热失控预警视为国民生命财产安全的重要保障。故攻破储能电池安全预警技术壁垒的任务刻不容缓。
3.储能电池热失控问题的成因分为三类:机械故障、电气故障和热故障。其共性环节为内短路。内短路发展时间尺度达几百小时,且初期阶段现象不明显,而末期会在短时间内引发燃烧爆炸,故而热失控防控预警问题具有重要意义。为解决热失控的防控预警问题,学界主流方法分为三类:基于实验的方法、基于模型的方法、基于数据驱动的方法。基于实验的方法能够得出电池温度安全边界进而指导电池系统设计。但实验方法的准确性依赖于大量实验次数,进而存在安全隐患和经济成本高的问题,难以推广运用。基于模型的方法主要通过估计电池的温升、电压变化或温度分布来间接预警热失控。其优点为物理意义明晰,但现有模型方法所针对工况较为单一,难以适用于真实工况。
4.基于数据驱动的方法是该领域新兴研究热点之一,通过使用历史数据,可以建立储能电池电压、温度、soc等参数与其热失控关系的数据模型,其优点是可以反映电池真实工况并且避免对于储能电池内部复杂电化学机理的研究。目前,基于数据驱动的方法多为有监督方法,其研究思路是通过实验方法获得特定工况下热失控储能电池数据,将其作为标签来训练神经网络模型,进而对储能电池的热失控情况进行判别。但上述有监督方法存在下述问题:虽然储能电池运行数据规模庞大,但热失控电池数据占比少,存在小样本问题,进而导致模型精度不高,故而有监督方法在该问题上存在局限性。而无监督方法可对没有标签标注的数据集进行学习,对于不平衡数据不敏感,该方法适用于含有大量正常样本的储能电池判异问题。但处于热失控前中期的储能电池和正常电池数据差异性微弱,仅用简单距离计算方法进行无监督聚类(例如kmeans方法)难以分辨出热失控储能电池。


技术实现要素:

5.本发明的目的是提供基于自编码器和集成学习储能电池热失控预警方法,包括以下步骤:
6.1)基于不同训练样本数据,建立若干基于自编码器的储能电池热失控预警基础模型;
7.所述训练样本数据包括储能电池运行状态数据;
8.所述储能电池运行状态数据包括电压、电流、荷电状态、温度、统计变量m
t
;所述统计变量包括储能电池单体电压方差、电压均值、电压最大值、电压最小值、所有单体温度方差、温度最大值、温度最小值。
9.所述训练样本数据经过了标准化处理;
10.标准化处理后的数据x
*
如下所示:
[0011][0012]
式中,x
μ
为样本均值;x
σ
为样本标准差,x为标准化前的数据。
[0013]
所述基于自编码器的储能电池热失控预警基础模型的编码器和解码器分别如下所示:
[0014]
y=h(x
in
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0015][0016]
式中,y为模型输出;h(*)、f(*)表示编解码函数;x
in
=[v
t
,i
t
,soc
t
,t
t
,m
t
]代表t时刻的输入数据;v
t
、i
t
、soc
t
、t
t
、m
t
分别为电池组t时刻总电压、总电流、电池组荷电状态、电池组温度、统计变量;代表编码器t时刻的输出数据;分别表示电池组t时刻总电压、总电流、电池组荷电状态、电池组温度、统计变量的重构数据;
[0017]
所述基于自编码器的储能电池热失控预警基础模型的优化目标如下所示:
[0018][0019]
式中,m为x
in
和维度;x
in,i,t
为x
in
中第i维度t时刻特征向量值;x
out,i,t
为中第i维度t时刻特征向量值。t为总时刻数。
[0020]
储能电池热失控预警基础模型输出的储能电池热失控状态判断结果y如下所示:
[0021][0022]
式中,k为设定的阈值;y=1表示储能电池热失控;y=0表示储能电池运行正常。
[0023]
2)对若干基于自编码器的储能电池热失控预警基础模型进行集成训练,得到储能电池热失控预警模型;
[0024]
所述储能电池热失控预警模型如下所示:
[0025][0026]
式中,p是储能电池被判断为热失控的概率;yk为第k个基础模型对该储能电池的判断结果;n为基础模型总数。
[0027]
3)获取储能电池实时运行数据,并分别输入到每个储能电池热失控预警基础模型中,得到每个储能电池热失控预警基础模型输出的储能电池热失控状态判断结果;
[0028]
4)将所有储能电池热失控状态判断结果输入到储能电池热失控预警模型中,计算储能电池热失控概率。
[0029]
值得说明的是,本发明通过自编码器计算储能电池时序数据的重构误差以定义电池间差异程度,利用正常数据重构误差小,异常数据重构误差大的思想构建重构误差基础模型。然后提出基于集成学习的电化学储能电池热失控预警框架,以量化储能电池热失控概率,增强模型稳定性,使得基础模型在不同的验证集中均能较为精准地选出热失控储能电池。最后,通过电动车储能电池的真实运行数据,对比了传统kmeans方法和本发明所提方法在多种指标下的有效性。
[0030]
本发明的技术效果是毋庸置疑的,本发明通过建立端到端的数据模型以实现对潜在热失控储能电池的提前预警,弥补了该领域实验方法和机理模型方法的缺陷。本发明提出数据驱动的储能电池热失控预警框架,利用储能电池数据的重构误差来定义电池间的差异程度,形成判异基础模型,并将基础模型选为自编码器,能有效提取热失控过程中储能电池电压、温度、soc等参数的时变特性。本发明进一步提出基于集成学习的储能电池热失控预警技术,量化了储能电池热失控概率,通过与基础模型对比,算例说明,本发明在保证模型精度的情况下降低了模型的方差,提高了模型稳定性。
附图说明
[0031]
图1为重构误差基础模型图;
[0032]
图2为基于集成学习的电化学储能电池热失控预警框架;
[0033]
图3为基于自编码器和集成学习的储能电池热失控预警方法流程图。
具体实施方式
[0034]
下面结合实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。
[0035]
实施例1:
[0036]
参见图1至图3,基于自编码器和集成学习储能电池热失控预警方法,包括以下步骤:
[0037]
1)基于不同训练样本数据,建立若干基于自编码器的储能电池热失控预警基础模型;
[0038]
所述训练样本数据包括储能电池运行状态数据;
[0039]
所述储能电池运行状态数据包括电压、电流、荷电状态、温度、统计变量m
t
;所述统计变量包括储能电池单体电压方差、电压均值、电压最大值、电压最小值、所有单体温度方差、温度最大值、温度最小值。
[0040]
所述训练样本数据经过了标准化处理;
[0041]
标准化处理后的数据x
*
如下所示:
[0042][0043]
式中,x
μ
为样本均值;x
σ
为样本标准差,x为标准化前的数据。
[0044]
所述基于自编码器的储能电池热失控预警基础模型的编码器和解码器分别如下所示:
[0045]
y=h(x
in
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
[0046][0047]
式中,y为模型输出;h(*)、f(*)表示编解码函数;x
in
=[v
t
,i
t
,soc
t
,t
t
,m
t
]代表t时刻的输入数据;v
t
、i
t
、soc
t
、t
t
、m
t
分别为电池组t时刻总电压、总电流、电池组荷电状态、电池组温度、统计变量;代表编码器t时刻的输出数据;分别表示电池组t时刻总电压、总电流、电池组荷电状态、电池组温度、统计变量的重构数据;
[0048]
所述基于自编码器的储能电池热失控预警基础模型的优化目标如下所示:
[0049][0050]
式中,m为x
in
和维度;x
in,i,t
为x
in
中第i维度t时刻特征向量值;x
out,i,t
为中第i维度t时刻特征向量值。t为总时刻数。
[0051]
储能电池热失控预警基础模型输出的储能电池热失控状态判断结果y如下所示:
[0052][0053]
式中,k为设定的阈值;y=1表示储能电池热失控;y=0表示储能电池运行正常。
[0054]
2)对若干基于自编码器的储能电池热失控预警基础模型进行集成训练,得到储能电池热失控预警模型;
[0055]
所述储能电池热失控预警模型如下所示:
[0056][0057]
式中,p是储能电池被判断为热失控的概率;yk为第k个基础模型对该储能电池的判断结果;n为基础模型总数。
[0058]
3)获取储能电池实时运行数据,并分别输入到每个储能电池热失控预警基础模型中,得到每个储能电池热失控预警基础模型输出的储能电池热失控状态判断结果;
[0059]
4)将所有储能电池热失控状态判断结果输入到储能电池热失控预警模型中,计算储能电池热失控概率。
[0060]
实施例2:
[0061]
基于自编码器和集成学习储能电池热失控预警方法,包括以下步骤:
[0062]
1、基于自编码器的储能电池热失控预警基础模型
[0063]
本发明利用储能电池数据的重构误差来衡量储能电池热失控风险,其思路如下:首先,利用正常电池的运行数据训练基础重构模型;随后,通过衡量待判别数据的重构误差来判别电池运行状态。在异常检测领域中正常数据充足,故而基于正常数据的基础模型不
存在小样本问题。对于正常电池数据而言,由于先前训练的基础重构模型已学习到相应特征,其重构误差较小。而对于热失控电池数据而言,由于先前训练的基础模型未学习热失控电池数据,而热失控数据与正常数据存在差异,故而其重构误差较大,因此可以将其作为判别依据,具体过程如下。储能电池运行状态可由其电压(v)、电流(i)、荷电状态(soc)、温度(t)等变量进行描述。上述变量能够通过电池管理系统(battery management system,bms)实时监控得到。由于这些变量具有不同的量纲且数值上具有较大的差别,直接利用原数据训练基础模型将出现数值问题,不利于基础重构模型的训练。为此,应首先对储能电池样本进行数据标准化处理。储能电池样本中存在一些偏离样本均值的极端数据,上述数据通常并非故障而是因电池物理状态变化而导致。而z-score方法是利用样本整体信息,受极端数据影响较小,故本发明选用z-score标准化方法。z-score标准化方法是常见的数据标准化方法,其利用样本均值和标准差来进行数据预处理,如式(1)所示。
[0064][0065]
式中:x
μ
为样本均值;x
σ
为样本标准差。
[0066]
将标准化后的变量作为基础模型输入特征变量,如图1所示。模型输入记作x
in,t
=[v
t
,i
t
,soc
t
,t
t
,m
t
],其中,x
in,t
代表t时刻的输入数据,包含电池组t时刻总电压v
t
、总电流i
t
、电池组荷电状态soc
t
、电池组温度t
t
以及统计变量m
t
。本发明通过统计方法对m
t
进行构建,一组储能电池数据含有96个电池单体的电压、温度数据,m
t
则包含一组电池数据中t时刻所有单体电压的方差、均值、最大值、最小值和所有单体温度的方差、最大值、最小值等统计变量。输出即为输入特征的重构数据,记作输入输出的变量维数相等。
[0067]
本发明基础模型选择自编码器,搭建一个自动编码器需要完成下面三样工作:搭建编码器,搭建解码器,设定一个优化目标,用以衡量由于压缩而损失掉的信息。编码器和解码器的参数可以通过最小化损失函数而优化,本发明选用adam优化器。
[0068]
编码器和解码器构建如下:
[0069]
y=h(x
in
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)
[0070][0071]
设数据总时长为t,则累计重构误差由用均方差函数进行描述,并将其作为优化目标,如式(4)所示。
[0072][0073]
式中:x
in
代表t时段内的输入数据,代表t时段内的输出数据。m为x
in
和维度,x
in,i,t
为x
in
中第i维度t时刻特征向量值,即v
t
、i
t
等变量。x
out,i,t
为中第i维度t时刻特征向量值。
[0074]
上述基于自编码器的基础模型训练好后,即可用于储能电池热失控的判断,如图1所示,待判断储能电池经过基础模型计算后得到重构误差,需要对重构误差设定阈值作为电池热失控的判别标准。本发明通过训练不同正常电池样本得到对应重构误差集,对该集
进行平均值和标准差的计算,选取恰好大于平均值二个标准差处的重构误差值作为阈值,记作k,判别具体规则如式(5)所示:
[0075][0076]
式中:y表示基础模型对该待判断的储能电池的判断结果。若其重构误差大于等于设定的阈值k,则该储能电池被判断为热失控,赋值为1;若其重构误差小于设定的阈值k,则该储能电池被判断为正常,赋值为0。综上,基础模型通过衡量待判断电池数据的重构误差能够进行热失控判断。
[0077]
2、基于集成学习的电化学储能电池热失控预警框架
[0078]
储能电池热失控预警基础模型稳定性定义为模型在不同的测试数据集中是否均能较为精准地选出热失控电池。由于基础模型参数受输入样本集影响大,难以保证基础模型的稳定性。而基础模型在储能电池热失控预警中会被多次运用,若其稳定性不足,则会增大某些预警过程中的误判和漏判概率。集成学习通过综合多个基础模型的判定结果来进行热失控评判,可以达到增强模型稳定性的目的。因此,为保证基础模型的稳定性,本发明进一步提出了基于集成学习思想的热失控预警框架,如图2所示。通过综合多个由不同的正常储能电池样本集训练得到的基础模型判别结果,可得到热失控概率p,如式(6)所示:
[0079][0080]
式中:p是储能电池被判断为热失控的概率;yk为第k个基础模型对该储能电池的判断结果,可由公式(5)计算得到;n为基础模型总数。图2所示集成模型中各基础模型的架构均相同,各基础模型的训练样本集分别取自不同的正常储能电池数据。
[0081]
本发明所提及的基础模型稳定性可以用集成模型计算出的概率方差进行描述。则集成模型的方差如式(25)所示:
[0082][0083]
根据式(25)可知,集成模型判别结果的方差与n呈负相关关系,n越大,方差越小,模型稳定性越高。实际运用中,由于样本数据有限,本发明n的取值视样本集实际情况确定。
[0084]
3、基于自编码器和集成学习的储能电池热失控预警方法
[0085]
本发明提出一种数据驱动的储能电池热失控预警方法,总体流程图如图3所示,具体阐述如下:
[0086]
步骤1:数据预处理。首先,为排除电池热失控爆发阶段数据异常对模型判别的影响,将爆发阶段数据删除。为了消除计算重构误差时各特征量纲的影响,利用式(1)对将量纲不同特征进行归一化处理。
[0087]
步骤2:特征选择。利用总电压v
t
、总电流i
t
、电池组荷电状态soc
t
、电池组温度t
t
以及统计变量m
t
等时序变量共同组成多维时序特征。
[0088]
步骤3:基础重构模型训练。基于正常电池构成的训练样本集,训练重构误差基础模型,基础模型为自编码器。
[0089]
步骤4:集成模型训练。通过选择不同的训练样本,重复步骤3多次,形成多个基础
模型,进而形成集成模型。
[0090]
步骤5:待判断样本计算。输入某待判断的储能电池样本,使用集成模型对该样本进行重构误差计算,给定重构误差阈值,判断子模型输出y(0/1),最后利用(6)式进行预警概率计算。
[0091]
实施例3:
[0092]
基于自编码器和集成学习储能电池热失控预警方法的验证实验,内容如下:
[0093]
1样本获取与数据预处理
[0094]
本发明收集了国内某公司的实际储能电池数据,共涉及48组电池,包括每组电池的电压、电流、荷电状态、温度等参数,其时间跨度均为半年,采样频率均为10s/组。其中有2组储能电池因热失控引发了燃烧和爆炸。下面对上述数据进行预处理,步骤如下:
[0095]
首先,热失控爆发阶段时间极短,且储能电池各参数变化明显,为排除电池热失控爆发阶段数据异常对模型判别的影响,将爆发阶段数据删除。然后,由于储能电池非充电状态涉及的工况过多,模型可能将处于不同工况的储能电池误判为异常。而储能电池在充电过程工况单一,数据特征相对稳定,故而选取其充电部分数据。最后,为了消除计算重构误差时各特征量纲的影响,对将量纲不同特征按照式(1)进行归一化处理。
[0096]
2模型设置
[0097]
本发明算例将对比以下方法(m0-m2),设置目的如表2所示,其中,m1、m2为本发明所提方法。
[0098]
m0:无监督聚类方法(kmeans方法)。
[0099]
m1:基于无监督学习的储能电池热失控判断模型(图2),模型选用自编码器神经网络。隐含层数为4层,分为编码层和解码层。编码层第一层神经元数目为30,第二层神经元数目为15;解码层第1层神经元数目为15,第二层神经元数目为30。输入输出层神经元数目一致。初始学习率选为0.001,优化器选用自适应学习率的改进训练算法。
[0100]
m2:在m1的基础上,进一步采用集成学习框架。
[0101]
表1方法对比设置及目的
[0102][0103]
3指标设置
[0104]
为评估本发明所提算法性能,作以下说明:储能电池热失控预警本质上是个二元分类问题,即将所有的待判别电池分为两类:正常电池和热失控电池。混淆矩阵是评估二元
分类器可信度的基本工具。表1所示的混淆矩阵显示了分类器所有可能的分类结果,其中tp表示真实类别和模型判定类别均为正常,tn表示真实类别为异常模型判别为正常,fp表示真实值为异常模型判别为正常,fn表示真实值为正常模型判别为异常。
[0105]
表2混淆矩阵
[0106][0107]
在混淆矩阵的基础上可以得到二元分类器的多个评价指标:分别为准确率、精确率、召回率、综合指标如(8)-(11)。
[0108]
ac=(tp+tn)/(tp+tn+fp+fn)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0109]
pr=tp/(tp+fp)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)
[0110]
re=tp/(tp+tn)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0111]
f1=2
×
pr
×
re/(pr+re)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0112]
工业界对于上述指标要求较高,例如,若召回率re达不到要求,则表示热失控电池漏判数量多,严重危害国民生命安全。除上述指标外,对于真实热失控车辆的预警概率也能够表征集成模型的有效性。上述指标均为值越大,模型分类性能越好。另外,本发明针对热失控电池设置预警排序指标,通过计算同一测试集中所有电池的重构误差大小而得到从高到低的排序,记录两组热失控电池的序号,该值越低表明模型性能越好。
[0113]
4本发明基础模型与基于距离计算的无监督聚类方法效果对比
[0114]
m1在48组电池数据中随机选择20组正常储能电池样本作为训练集,测试集数据为剩余28组储能电池数据(含两组热失控电池),m0的测试集数据值与m1设置一致,m0直接对测试集聚类分析,结果如表3所示。m0方法在所设置算例无法寻找出热失控车辆,其分类准确率、分类精确率、分类召回率分别仅为78.6%、0%、0%;而m1方法上述指标均显著高于m0,其分类准确率、分类精确率、分类召回率分别可达92.9%、50%、100%。并且预警排序显示,m1能有效找出热失控车辆。上述结果表明处于热失控前中期的储能电池和正常电池数据差异性微弱,仅用简单距离计算方法进行无监督聚类难以分辨出热失控储能电池,现有无监督聚类方法无法有效预警储能电池热失控,并验证了本发明提出的重构基础模型m1的有效性。
[0115]
表3 m0与m1预警结果指标对比
[0116][0117]
5本发明集成模型与基础模型的稳定性对比
[0118]
集成模型能够提高基础模型的稳定性,为了对集成模型的稳定性能进行说明,设置如下算例进行说明:m1在48组电池数据中随机选择20组正常储能电池样本作为训练集,剩余28组储能电池样本(含2组热失控电池数据)作为测试集。m2的训练集和测试集与m1相同,区别在于m2分别采用每组正常电池数据来训练一个基础模型,共包括20个基础模型。对m1、m2分别进行3次测试,3次测试分别随机选用不同的20组正常电池作为训练集,剩余28组
电池(含两组热失控电池)作为测试集。m2在每次测试中训练集和测试集与m1均保持一致。测试结果如表4所示,对于m1,评估指标在3次测试中的波动较大,其中,第1、3次评估精度较低,而第2次评估精度较高。相比之下,m2在3次测试中的评估指标均较高,且除热失控电池预警排序指标稍有波动外,其他指标均未变化。上述结果表明:储能电池热失控预警集成模型相比较于基础模型有较高的稳定性。另外,虽然m2的训练测试总时长显著多于m1,但相比于电池热失控提前预警的时间,m2多花的时间可以忽略不计。
[0119]
表4 m1与m2预警结果指标对比
[0120][0121]
为解决储能电池热失控难以有效预警的问题,本发明提出一种数据驱动的储能电池热失控预警方法,通过电动车储能电池的真实运行数据,验证了所提方法的有效性:首先,本发明提出基于自编码器的储能电池热失控预警基础模型,利用储能电池数据的重构误差来定义电池间的差异程度,形成判异基础模型,通过对比本发明基础模型与kmeans聚类方法说明了重构基础模型的效果。进一步提出基于集成学习的储能电池热失控预警技术,量化了储能电池热失控概率,通过与基础模型对比,算例说明,在保证模型精度的情况下降低了模型的方差,提高了模型稳定性。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1