一种基于关联规则的电动汽车动力电池监控数据分析方法与流程

文档序号:20354051发布日期:2020-04-10 23:13阅读:188来源:国知局
一种基于关联规则的电动汽车动力电池监控数据分析方法与流程

本发明涉及动力电池安全技术领域,具体涉及一种基于关联规则的电动汽车动力电池监控数据分析方法。



背景技术:

当前,由于电动汽车的广泛推广和应用,动力电池的安全问题也逐渐显露,诸如自燃、爆炸、热失控等事故频频发生。根据统计资料,电动汽车众多事故均由多种不同的车载动力电池故障并发所引起的。因此,研究清楚动力电池的多种故障之间的联系,对于提高电动汽车的安全性与可靠性具有十分重要的意义。

在众多的电池故障并发形式当中,互相之间的联系不便于用确定性的关系表达式来描述。因为电池使用过程中电池内部化学机理迅速变化,同时由于电动车运行中的振动刹车等操作也会对动力电池产生不可预估的影响。因此,准确诊断电池各种故障的联系情况进而对下一阶段电池可能发生的故障进行预测,是安全管理系统中的重要内容。同时如何追查出故障电池全生命周期中相关属性参数对电池质量的影响是一个函需解决的问题。



技术实现要素:

本发明提出的一种基于关联规则的电动汽车动力电池监控数据分析方法,可解决有助于查出故障电池全生命周期中相关属性参数对电池质量的影响的问题。

为实现上述目的,本发明采用了以下技术方案:

一种基于关联规则的电动汽车动力电池监控数据分析方法,包括以下步骤:

s100、先建立一个报警故障记录的数据库;

s200、然后将每一条报警记录作为一个候选项集,引入apriori算法计算出不同项数的频繁项集;

s300、由各频繁项集产生相应的强关联规则,并计算出各强关联规则的置信度大小;

s400、通过各强关联规则的置信度大小,将这些频繁项集进行排序推荐给维修人员。

进一步的,所述s100先建立一个报警故障记录的数据库;具体为首先从故障发生的历史数据中提取各种故障记录数据,并且分月的统计在该段时间内发生的次数类型信息,每一辆车发生故障的记录数据结合在该月内的发生存量用一个事务来表示;

一个月中所有报警记录列表作为一个事务t,所有事务的集合为事务集d。

进一步的,所述s200然后将每一条报警记录作为一个候选项集,具体为;

将步骤s100中得到故障数据集对应的事务集,针对每一事务建立其对应的一条或多条关联规则,得到一个关联规则集合;

这时将远程监控数据库中记录的报警信息细化分解,按照一个自然月为一个周期,将等待训练的数据集存入储备数据文件中,并将所有报警类别数据信息,按照关联规则训练需要的数据集形式排布,也构成关联规则中的每一项;

然后对历史记录中数据进行清洗,去除一些无意义和噪声数据。

进一步的,所述步骤s200中引入apriori算法计算出不同项数的频繁项集;

具体包括:

引入apriori算法,每跳报警记录作为一个候选1项集c1,所有c1的集合为c1;

设定一个最小支持度阈值min_sup=50%,当c1的支持度计数support_count(c1)大于等于min_sup时,则c1成为频繁1项集l1,所有l1的集合为l1,通过将l1与自身相连接产生候选2项集c2,所有c2的集合为c2,如果c2中第i个候选2项集c2(i)的某个子集为第x个候选1项集c1(x),且它不是l1的元素时,则将c2(i)从c2中删除;

满足min_sup的c2作为频繁2项集l2,其集合为l2;

依次循环类推,得到不同频繁项集l2、l3、……lk-1、lk的集合l2、l3……lk-1、lk,其中lk-1、lk分别代表频繁k-1项集和频繁k项集,lk-1、lk则为它们各自的集合。

进一步的,所述s300由各频繁项集产生相应的强关联规则,并计算出各强关联规则的置信度大小;

包括:

1)提取频繁项集

对于关联规则:类型x→类型y即由x出现可推导出y,其支持度是指事务中含类型y项事务的百分比;

计算公式为count(类型∪y)/n,其中count(类型∪y)为事务集中出现类型∪y项的数量;

对于支持度大于及等于给定最小支持度的项集称为频繁项集;利用重复迭代的方法,从1项集开始,根据给定支持度阈值获得频繁1项集l1;

由频繁1项集组合生成2项集,根据给定的支持度阈值对候选的2项集进行剪枝,获得频繁2项集,依次类推,直到产生最多项的频繁项集ls为止;

2)计算关联规则置信度

对于关联规则中,置信度是指事物集中出现类型∪y数量占类型项数量的百分比,计算公式为(类型∪y)count/(类型)count,其中(类型)count为事务集中出现类型项的次数;

对于频繁项集lk,其中对于任意项i,计算关联规则(lk-i)→i置信度;对于置信度大于及等于给定最小置信度的关联规则,称为强关联规则,否则为弱关联规则,采用不断迭代的方法计算频繁项集中关联规则的置信度值,并由置信度值对规则进行排序;

将关联规则中支持度大于最小支持度阈值,且置信度大于最小置信度阈值的关联规则作为强规则。

进一步的,所述s300由各频繁项集产生相应的强关联规则,并计算出各强关联规则的置信度大小;

具体包括:

设置一个最小置信度阈值min_conf;

每个频繁项集l所产生的每个非空子集为s,若子集(l-s)与s的支持度计数之比大于等于最小置信度阈值min_conf,则输出强关联规则‘s→(s-1)'该强规则的置信度大小为l与s的支持度计数之比的值comdlence(s→(s-l))。

进一步的,步骤s400通过各强关联规则的置信度大小,将这些频繁项集进行排序推荐给维修人员;包括:

将所计算出来的所有强关联规则按照其置信度confidence的大小进行排序,当输入一条报警记录时,通过关联规则得出与该报警记录相关联的其他报警记录。

由上述技术方案可知,本发明的基于关联规则的电动汽车动力电池监控数据分析方法,通过调取电动汽车动力电池运行参数,同时收集采样时间段内的故障类型数据。进而分析各电学参数与报警类型之间的关联度。基于设定不同的关联度阈值,在该故障诊断算法下得到不同关联度阈值下的诊断准确率。之后,根据故障诊断准确率随阈值变化的拐点以及准确率的大小共同确定最佳关联度阈值。至此,即可以做到对动力电池的未发生故障进行预判和已发生的故障进行原因分析。同时,该系统可以为售后维护人员提供有针对性的维修提示并且预测电池下一步的变化趋势。

附图说明

图1是本发明的方法流程图;

图2是本发明的动力电池外部短路故障诊断及温升预测系统图;

图3是本发明的动力电池故障诊断及预测方法流程图;

图4为本发明的确定关联规则的训练数据中得到高满足支持度阈值的高提升度对应关系计算方法示意图,其中项目代号就是items,支持度就是数据集合itemset中对应的值计算得到。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。

如图1所示,本实施例所述的基于关联规则的电动汽车动力电池监控数据分析方法,包括:

s100、先建立一个报警故障记录的数据库;

s200、然后将每一条报警记录作为一个候选项集,引入apriori算法计算出不同项数的频繁项集;

s300、由各频繁项集产生相应的强关联规则,并计算出各强关联规则的置信度大小;

s400、通过各强关联规则的置信度大小,将这些频繁项集进行排序推荐给维修人员。

以下具体说明:

在执行s100之前首先要初始化相关考察参数,即选取动力电池bms系统实际运行过程中监测到的报警类别,分别记为:类型1:电池温差过大;类型2:高温;类型3:电池总压过高;类型4:soc过低;类型5:高压;类型6:低压;类型7:soc过高;类型8:soc跳变;类型9:压差过频;类型10:绝缘故障;类型11:温控故障;类型12:制动系统故障;类型13:驱动电机温控故障;同时标记出考察动力电池的控制系统类型、服役年限、生产流程中各环节操作员的名称。即可以追溯到该种动力电池的全生命周期的属性名称值。

上述报警类型是指远程监控数据库中对应电池监控警报类型的定义编号,其方式依据企业具体标准,具有唯一性。

其中步骤s100-s400的具体过程可如下解释:

首先从故障发生的历史数据中提取各种故障记录数据,并且分月的统计在该段时间内发生的次数类型等信息,每一辆车发生故障的记录数据结合在该月内的发生存量用一个事务来表示。得到故障数据集对应的事务集,针对每一事务建立其对应的一条或多条关联规则,得到一个关联规则集合。这时就可以将远程监控数据库中记录的报警信息细化分解,按照一个自然月为一个周期,将等待训练的数据集存入储备数据文件中。并将所有报警类别数据信息,按照关联规则训练需要的数据集形式排布。也构成关联规则中的每一项;

然后对历史记录中数据进行清洗,去除一些无意义和噪声数据;譬如经过人为判断明显有别于常识的错误信息,高温报警和低温报警出现在同一时刻内。其中,所述的“无意义和噪声数据”,是指历史记录数据中仅包含标bms系统能监测到的明显高于设定温度或电压电流等正常工况标准的数据,而对于bms监测的模棱两可或受到噪声干扰的检测数据将予以剔除。

其中步骤s200引入apriori算法计算出不同项数的频繁项集;具体过程如下:

1)提取频繁项集

对于关联规则:类型x(频次累计)→类型y即由x出现可推导出y,其支持度是指事务中含类型y项事务的百分比。计算公式为count(类型∪y)/n,其中count(类型∪y)为事务集中出现类型∪y项的数量;对于支持度大于及等于给定最小支持度的项集称为频繁项集;利用重复迭代的方法,从1项集开始,根据给定支持度阈值获得频繁1项集l1;由频繁1项集组合生成2项集,根据给定的支持度阈值对候选的2项集进行剪枝,获得频繁2项集,依次类推,直到产生最多项的频繁项集ls为止;

2)计算关联规则置信度

对于关联规则中,置信度是指事物集中出现类型∪y数量占类型项数量的百分比,计算公式为(类型∪y)count/(类型)count,其中(类型)count为事务集中出现类型项的次数;对于频繁项集lk,其中对于任意项i,计算关联规则(lk-i)→i置信度;对于置信度大于及等于给定最小置信度的关联规则,称为强关联规则,否则为弱关联规则,采用不断迭代的方法计算频繁项集中关联规则的置信度值,并由置信度值对规则进行排序;

将关联规则中支持度大于最小支持度阈值(>50%),且置信度大于最小置信度阈值的关联规则作为强规则。

然后将获得所有频繁项集导入事先准备好的频繁项集数据库中,之后再把关联关系及其置信度值输入关系数据库中,便于后续数据集完整性分析调用;

再以待检数据集中最长频繁项集为规则头,分别以数据集其他项为规则尾,查询该规则的置信度并排序,设定关联强度值,给出低于设定关联强度值项,即关联数据集中包含冗余项;

最后在计算过的有效阈值下,针对再次出现的报警信号首先根据关联规则计算的结果进行原因查找,其次同样根据计算的规则,计算接下来一段时间内可能即将出现的故障,通过系统分析计算后将预测信息内容提前预警车辆维修操作人员还未排查出或者还未发生但即将发生的故障类型。并且可以根据找到的强提升度(即电池属性值对应的故障类型提升度大于1)的追溯原因。

本发明实施例的具体执行步骤如下:

step1建立报警故障记录的数据库,每条报警类型的信息作为标识符tid,一个月中所有报警记录列表作为一个事务t,所有事务的集合为事务集d;

step2引入apriori算法,每跳报警记录作为一个候选1项集c1,所有c1的集合为c1,我们设定一个最小支持度阈值min_sup=50%,当c1的支持度计数support_count(c1)大于等于min_sup时,则c1成为频繁1项集l1,所有l1的集合为l1,通过将l1与自身相连接产生候选2项集c2,所有c2的集合为c2,如果c2中第i个候选2项集c2(i)的某个子集为第x个候选1项集c1(x),且它不是l1的元素时,则将c2(i)从c2中删除;满足min_sup的c2作为频繁2项集l2,其集合为l2;依次循环类推,得到不同频繁项集l2、l3、……lk-1、lk的集合l2、l3……lk-1、lk,其中lk-1、lk分别代表频繁k-1项集和频繁k项集,lk-1、lk则为它们各自的集合;

step3设置一个最小置信度阈值min_conf;每个频繁项集l所产生的每个非空子集为s,若子集(l-s)与s的支持度计数之比大于等于最小置信度阈值min_conf,则输出强关联规则‘s→(s-l)’该强规则的置信度大小为l与s的支持度计数之比的值comdience(s→(s-i))

step4将所计算出来的所有强关联规则按照其置信度confidence的大小进行排序,当输入一条报警记录时,通过关联规则得出与该报警记录相关联的其他报警记录。

进一步地,所述步骤step1中,报警记录借阅记录数据库具有所有报警记录借阅记录数据信息,数据字段包括读者名字段与所借阅的报警记录名字段。

进一步地,所述步骤step2中,为得到频繁k项集的集合lk,通过将频繁k-1项集的集合lk-1与自身相连接产生候选k项集的集合ck。此处为方便说明,假设k=3,且l2含有两个频繁2项集l1、l2,其中l1={i1,i2}、l2={i3,i4}

则l2的自连接即l1与l2连接的结果项集为c3=l2<>l2={{i1,i2,i3},{i1,i3,i4},{i2,i3i,i4},{i1,i2,i4}}。

其中:式中,min_conf为最小置信度阈值;l为频繁项集,l所产生的每个非空子集为s;support_count(l)、support_count(s)、support_count(l-s)分别为括号内字母的支持度计数,为强关联规则。

进一步地,所述步骤step4中的推荐方式,假设有如下几个强关联规则且其置信度已给出:i1→i2,confidence=50%;i1→i3∩i5,confidence=80%;i1∩i2→i3∩i5,confidence=50%;i1∩i2→i4,confidence=80%;当读者借阅图书i1时,系统则按前后顺序依次推荐出{i3,i5}、i2的图书选项;当故障警报组合{i1,i2}在考察期内出现时,系统则按前后顺序依次推荐出i4、{i3,i5}的故障警报选项。

本发明实施例涉及到的“关联规则算法”,是指寻找描述数据库中数据项之间潜在的关联关系算法,从而找出工程项目注释项之间的未知依赖关系。“频繁项集”,是指支持度大于最小支持度阈值的项集;所述的“最小支持度”,是指由候选集生成频繁项集的阈值,是由人工指定的一个常量;所述的“最小置信度”,是指由判断该规则是否为强规则的阈值,是由人工指定的一个常量。“强关联项集”,是指任意两项间关联规则为强关联规则频繁项集,用于作为一个数据集的核心,并作为数据集完整性判断的规则头,进而判断其他项与“强关联项集”关联关系来判断待训练数据集的完整性。

“规则头”是指对于关联规则类型x→y的规则前部,即类型所表示的内容;所述的“规则尾”是指对于关联规则类型x→y的规则前部,即y所表示的内容。“关联强度”,是指中用户输入的属性值,利用公式计算出的联规则中最小置信度,a是用户输入的关联强度值;用户通过输入一个事务集中的参量,转换为关联规则置信度阈值,进而显示出在当前置信度阈值条件下,数据集已包含的项中中哪些是“不可信”,主要用于分析数据集中冗余项。设定关联规则的最小支持度和最小可信度为supmin和confmin。规则r的支持度和可信度均不小于supmin和confmin,则称为强关联规则。关联规则挖掘的目的就是找出强关联规则,从而指导商家的决策。

上述叙述包含了关联规则相关的几个重要基本概念,关联规则挖掘主要有两个问题:

找出交易数据库中所有大于或等于用户指定的最小支持度的频繁项集。

利用频繁项集生成所需要的关联规则,根据用户设定的最小可信度筛选出强关联规则。

目前研究主要针对第一个问题进行研究,找出频繁集是比较困难的,而有了频繁集再生成强关联规则就相对容易了。

这里举例说明,基于样本数据的分析小结与关联规则警报预测系统的应用。对出现的报警类型进行统计之后,发现“1号警报”即温差过大的报警类型出现的频次最高,那么基于这个统计情况,我们可以用1号报警类型作为始发类型,得到结果如上表:

从上面基于关联规则的报警类型数据挖掘来看,在考察的10个月期限中的样本里,如果电池出现1号类型报警(即温差过大)次数超过200次。那么接下来,温差过大会引起2号至11号类型警报的一系列可能。换句话说,当温差过大和温度过高两种警报在几日内反复出现后,则有有理由在相应的概率下判断推测出接下的一个月内会有其他类型的警报出现。进而可以判断出,由警报类型推导出可能的事故。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1