基于AI数据重构和整数优化的退役电池热失控预警方法

文档序号:37427610发布日期:2024-03-25 19:16阅读:17来源:国知局
基于AI数据重构和整数优化的退役电池热失控预警方法

本发明属于退役电池安全预警领域,涉及基于ai数据重构和整数优化的退役电池热失控预警方法。


背景技术:

1、目前,退役电池热失控问题的成因可以归纳为机械故障、电气故障和热故障三个方面。这些问题的共同特点是内部短路。内部短路的演变过程通常需要几百小时的时间,而初期阶段的异常现象并不明显,但在后期会迅速引发燃烧和爆炸,因此热失控的预警与防控问题具有重要的意义。为了解决热失控的预警与防控问题,学术界主要采用三类主流方法,包括基于实验的方法、基于模型的方法和基于数据驱动的方法。基于实验的方法可以推导出退役电池的温度安全边界,进而指导退役电池系统的设计。然而,实验方法的准确性受到大量实验次数的限制,存在安全隐患和高昂的经济成本,因此难以广泛应用。基于模型的方法主要通过估计退役电池的温升、电压变化或温度分布等参数来间接预警热失控。其优点在于具备清晰的物理意义。然而,现有的模型方法通常只针对特定工况,难以适用于真实的复杂工况场景。

2、基于数据驱动的方法是当前该领域的新兴研究热点之一。通过利用历史数据,可以建立退役电池的电压、温度、soc等参数与其热失控之间的关系数据模型。该方法的优点在于能够反映退役电池的真实工况,并且避免对退役电池内部复杂电化学机理的深入研究。目前,基于数据驱动的方法主要是有监督学习方法。其研究思路是通过实验手段获取特定工况下热失控退役电池的数据,并将其作为标签来训练神经网络模型,从而对退役电池的热失控情况进行判别。然而,上述有监督学习方法存在以下问题:尽管退役电池的运行数据规模庞大,但热失控退役电池的数据占比较少,导致存在小样本问题,进而影响模型的准确度。因此,有监督学习方法在该问题上存在一定的局限性。相比之下,无监督学习方法可以对没有标签标注的数据集进行学习,并且对于不平衡数据具有一定的鲁棒性。该方法适用于包含大量正常样本的退役电池异常判别问题。然而,处于热失控前中期的退役电池数据与正常退役电池数据之间的差异微弱,仅通过简单的距离计算方法(例如kmeans方法)进行无监督聚类难以有效区分热失控退役电池。综上所述,能够有效捕捉退役电池热失控与正常退役电池数据差异的无监督学习方法在电化学退役电池热失控预警方面具有巨大的应用潜力。


技术实现思路

1、本发明的目的在于针对现有的精准预警退役电池热失控技术瓶颈的问题,提出基于ai数据重构和整数优化退役电池热失控预警方法,以实现高效退役电池热失控提前预警。

2、为达到上述目的,本发明提供如下技术方案:

3、基于ai数据重构和整数优化的退役电池热失控预警方法,该方法包括以下步骤:

4、s1:对正常退役电池进行数据预处理,包括删除爆炸阶段的数据以及将量纲不同特征进行归一化;

5、s2:退役电池管理系统从所述s1预处理后的数据中实时监控得到影响退役电池运行状态的时序变量特征,将所述得到的时序变量特征共同组成多维时序特征;

6、s3:将基于正常退役电池构成的训练样本集得到的多维时序特征中的时序变量标准化后作为基础模型输入的特征变量,训练重构误差基础模型;

7、s4:选择若干组不同正常退役电池训练样本,将每组训练样本重复所述s1-s3,形成若干个重构误差基础模型,即形成初步集成模型,对所述集成模型进行整数优化;

8、s5:将待判断的退役电池样本输入所述s4整数优化的集成模型中,计算所述退役电池样本的重构误差,给定重构误差阈值,判断各基础模型输出y(0/1),根据各基础模型的输出结果计算预警概率。

9、进一步的,所述s2中的时序变量特征包括:总电压vt、总电流it、退役电池组荷电状态soct、退役电池组温度tt以及统计变量mt。

10、进一步的,在所述s3中,将基于正常退役电池构成的训练样本集得到的多维时序特征中的时序变量标准化后作为基础模型输入的特征变量,具体包括:基础模型的输入记作:

11、xin,t=[vt,it,soct,tt,mt] (1)

12、其中,xin,t代表t时刻的输入数据,包含退役电池组t时刻总电压vt、总电流it、退役电池组荷电状态soct、退役电池组温度tt以及统计变量mt;

13、采用统计方法对mt进行构建,一组退役电池数据含有96个退役电池单体的电压、温度数据,mt则包含一组退役电池数据中t时刻所有单体电压的方差、均值、最大值、最小值和所有单体温度的方差、最大值、最小值统计变量;

14、基础模型的输出为输入特征的重构数据,记作:

15、

16、进一步的,所述s3中训练重构误差基础模型,具体包括:

17、基础模型选择变分神经网络数据重构,搭建一个自动编码器,搭建所述自动编码器包括:搭建编译码、搭建解码器以及设定一个优化目标;

18、编码器和解码器构建如下:

19、y=h(xin) (3)

20、

21、其中,f为隐函数,h一种广义的映射关系;

22、适用于退役电池热失控预警的变分编码器是针对xin构建其联合概率分布p(xin),p(xin)目标函数的构建过程包括:极大似然估计、隐变量模型、蒙特卡洛采样和变分推断。

23、进一步的,目标函数的构建过程中所述极大似然估计,通过统计建模方法,假设p(xin)服从高斯分布μ表示数据的均值,σ2表示数据的方差,当p(xin)的分布确定后,概率分布估计问题转化为参数估计问题,极大似然估计假设训练数据采样服从独立同分布,则联合概率分布分解为似然函数,表示为:

24、

25、其中,xi表示第i个样本数据;

26、极大似然估计准则是最大化似然函数,这等同于最小化负对数似然函数,对公式(5)取对数,将连乘化为连加,优化的参数组表示为:

27、

28、优化的过程中求解关于参数θ的梯度,表示为:

29、

30、按照极大似然估计求出优化后参数组θ,得到概率分布,即可采样完概率分布;

31、采用所述隐变量模型对极大似然估计过程进行扩展,具体包括:

32、假设xin中存在z个重要隐变量,根据隐变量生成新的概率分布过程,表示为:

33、p(xin)=∫p(xin|z,θ)p(z)dz (8)

34、隐变量模型,即任何一个概率分布经过一个足够复杂的函数后能映射到任意概率分布;故延续极大似然函数思想优化隐变量z,则隐变量模型的负对数似然函数表示为:

35、

36、根据式(9)中的梯度就能优化参数,带入优化参数后,得到隐变量模型;

37、采用所述蒙特卡洛采样,代替变量模型计算负对数似然函数的过程中积分过程,具体包括:将变量模型计算负对数似然函数的过程中的积分写成期望形式,表示为:

38、∫p(xi|z,θ)p(z)dz=ez~p(z)[p(x|z,θ)] (10)

39、利用期望法求积分,从p(z)中采样多次z1,z2,…zm,根据p(x|z,θ)计算x1,x2,…xm,求x的均值来表示期望如下:

40、

41、通过对z的多次采样,得到▽θl(θ,xin)的近似值;

42、对蒙特卡罗采样存在采样次数m需求大的问题,采用所述变分推断来缩小m,降低计算难度,具体包括:

43、变分推断用kl散度来度量两个概率分布的相似程度,即p(z|x)与qθ(z|x)之间的距离如下:

44、

45、整理上式得:

46、

47、式(13)即为设定一个优化目标;

48、对优化目标kl(qθ(z|x)||p(z))具体表达为:

49、

50、设电池数据维度为d,表示为:

51、

52、设数据总时长为t,则累计重构误差,表示为:

53、

54、总体目标函数,表示为:

55、

56、进一步的,所述s4中,对集成模型进行整数优化,具体包括:

57、确定组成最佳集成模型,明确基础模型准确率、基础模型多样性与集成模型准确率的关系;

58、误差-分歧理论给出了集成模型准确率与基础模型的关系,即最佳集成模型,具体描述如为:使用n个基础模型h1,...,hi,...,hn以形成集成模型,利用此集成模型时,通过加权平均以获得输出,表示为:

59、

60、其中,wi为基础模型hi的权重,且由wi≥0与约束;

61、给定样本x,则第i个基础模型的分歧定义为:

62、a(hi|x)=(hi(x)-h(x))2 (19)

63、其中,h(x)表示集成模型的输出;

64、集成模型的分歧定义为基础模型分歧的加权平均:

65、

66、采用均方差度量基础模型的误差,假设样本x的真实判别结果为f(x),则基础模型hi(x)与集成模型h(x)的误差分别表示为:

67、e(hi|x)=(f(x)-hi(x))2 (21)

68、e(h|x)=(f(x)-h(x))2 (22)

69、全体基础模型在整体样本的加权平均误差表示为:

70、

71、对式(20)(23)进行变形得:

72、

73、结合式(23)(18)-式(22)(22)以及约束对式(24)(24)继续变形可得:

74、

75、由式(25)(26)得到,集成模型的误差由全体基础模型在整体样本的加权平均误差和基础模型分歧的加权平均所决定;且等式右边第二项为正且从第一项中减去,保证了集成后的误差一定比基础模型的加权平均误差更低,且各个基础模型的准确率越高、其间的差异性越大,集成后的模型准确率越高;

76、基于式(25)得到的结果,采用集成模型优化方法,给定m个基础模型和m个待判别退役电池样本,将判别结果记录在矩阵p中,p中第i行第j列的元素pij,表示为:

77、

78、令u=ptp,则u的对角元uii代表基础模型hi判断错误的次数,体现了全体基础模型在整体样本的加权平均误差,非对角元uij,i≠j则表示基础模型hi与hj同时出错的次数,体现了集成模型的分歧;故u中既包含了各个基础模型的误差,也包含了其分歧,即可有效衡量集成模型的误差;

79、用公式(27)(28)对u中元素进行归一化处理;按照公式(25)(26)的集成模型误差定义,则表示为:

80、

81、其中,m为被判别样本个数;

82、当每个元素都最小时,集成模型的效果最好;则将集成模型优化问题转化为二次整数规划问题,表示为:

83、

84、

85、xi={0,1} (30)

86、其中,xt代表是否需要选择第i个基础模型是否被选入集成模型中,的0-1变量矩阵转置,

87、二值标量xi表示第i个基础模型是否被选入集成模型中,参数s为优化后的集成模型规模。

88、进一步的,所述s5中重构误差阈值是根据优化集成模型中的各个基础模型通过训练不同正常退役电池样本得到对应的重构误差,将得到的重构误差构成重构误差集,将所述重构误差集进行平均值和标准差的计算,选取恰好大于平均值两个标准差处的重构误差值作为阈值,记为k。

89、进一步的,所述s5中,判断各子模型输出y(0/1),表示为:

90、

91、其中,y表示基础模型对待判断的退役电池的判断结果;若其重构误差大于等于设定的阈值k,则该退役电池被判断为热失控,赋值为1;若其重构误差小于设定的阈值k,则该退役电池被判断为正常,赋值为0。

92、进一步的,所述s5中根据各基础模型的输出结果计算预警概率,表示为:

93、

94、其中,p是退役电池被判断为热失控的概率;yk为第k个基础模型对该退役电池的判断结果,可由公式(31)计算得到;n为基础模型总数。

95、本发明的有益效果在于:

96、第一,本发明提出的基于变分神经网络数据重构在退役电池预测中能够提供更好的数据理解、数据扩充、异常检测和降维等功能,对退役电池编码器和解码器中的隐藏映射f的设计具有显著优势。

97、第二,本发明提出的基于变分神经网络数据重构计算退役电池时序数据的重构误差以定义退役电池间差异程度,利用正常数据重构误差小,异常数据重构误差大的思想构建变分神经网络数据重构误差基础模型,可初步识别退役电池中的热失控电池。

98、第三,本发明提出基于整数优化的退役电池热失控预警框架,量化退役电池热失控概率,增强模型稳定性,进一步对集成模型进行优化,使得集成模型在更少的基础模型组合规模的前提下,达到更高的退役电池热失控预警精度。

99、第四,本发明不仅能有效区分电池的正常和异常状态,降低误报率和漏报率,而且优化了集成模型,实现了更高效的预警。这有助于及时发现和处理退役电池的安全隐患,延长电池使用寿命,提高利用率,并推动退役电池的再利用,对于促进循环经济的发展具有重要意义。

100、本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1