一种基于机器学习算法的蓄电池馈电风险识别方法与流程

文档序号:26496810发布日期:2021-09-04 00:22阅读:175来源:国知局
一种基于机器学习算法的蓄电池馈电风险识别方法与流程

1.本发明属于汽车安全技术领域,更具体涉及蓄电池健康状态识别预测技术。


背景技术:

2.汽车是人们常用的交通工具,在长期使用过程中会产生故障。由于汽车本身结构的复杂性,以及汽车故障的不确定性和模糊性,给汽车故障诊断与维修带来很大困难。蓄电池是电源系的心脏,对蓄电池的耗电状态进行监测并对故障状态进行分析,给出蓄电池故障现象及馈电风险预测,对于车用蓄电池的寿命预估,提供车主合理化用电建议,以及蓄电池维修更换提醒来说有着重要的意义。
3.目前来说,对于燃油车蓄电池馈电风险或电池健康状态监测预警等领域成果较为匮乏,但由于蓄电池馈电导致车辆无法出行的问题在日常用车过程中尤为重要,因此行业内也在积极探索。
4.传统电池健康状态的研究主要基于蓄电池物理参数通过测算蓄电池内阻相对于健康度为100%时内阻的变化率,计算出蓄电池的健康度,由于蓄电池的老化体现在蓄电池内阻的变化上,例如cn201910119993.7提出了一种基于内阻变化率的蓄电池健康度的高精度在线实时方法,该方法主要存在以下弊端:通过物理参数构建评估模型固然准确,但对于各参数的测定和设置有着很高的要求,而且参数配置较为复杂。由于汽车本身结构较为复杂,蓄电池物理参数难以测定,因此很难满足高精确度的要求。同时,物理参数的采集需增加额外硬件成本,不利于效益最大化。
5.另一种方法,通过数据驱动法不需要复杂的物理参数测定和计算,只需提取能够与电池健康状态相关的外部参数便可以实时有效的对电池健康状态进行评估,因此受到了越来越广泛的探索应用。例如cn202010005272.6 一种确定车辆电池健康状态的方法及装置,其实基于电池状态信息及里程采用加权方式判定电池健康状态,该方法主要存在以下弊端:仍需要采集诸多电池状态信息,同时判断可靠性依赖于运行时期,如前期电池状态信息少、里程数少,则会影响识别准确率,同时需配置权重,需要业务专家提供更多的专业知识,探索深度有限。
6.因此,如果能在云端,通过现有的车辆上传数据,同时依靠本身连网车辆数较大的大数据优势,实现对蓄电池馈电风险的预测,这样既不增加硬件成本,无需额外的物理参数测定和计算,又能实时的给车主发出馈电风险预警,在减少了用户因馈电导致无法出行产生抱怨的同时,在一定程度上也对蓄电池寿命预测及维修建议方面提供了指导。
7.随机孤立森林即孤立森林,是一种机器学习算法,主要针对的是连续性结构化数据中的异常点检测,其算法基础有两点:异常数据占总样本量的比例很小、异常点的特征值与正常点的差异很大。因其精准度较高,在处理大数据时速度快,所以目前在工业界的应用范围比较广,常见场景包括:网络安全中的攻击检测、金融交易欺诈检测、噪声数据过滤等。


技术实现要素:

8.本发明针对现有技术存在的问题,提出一种基于机器学习算法的蓄电池馈电风险识别方法,在不增加硬件的情况下,利用云端采集的蓄电池数据,基于孤立森林算法建立和优化模型,预测蓄电池馈电风险,并可以进一步根据预测结果,主动向车主发出实时蓄电池馈电风险预警信息。
9.本发明的技术方案如下:一种蓄电池馈电风险识别方法,包括以下步骤:(1)获取蓄电池异常耗电的样本数据,构造特征变量,得出特征数据训练集;(2)基于孤立森林构建异常识别算法模型;(3)对算法模型进行调优,进行蓄电池风险实时预测,并给出预警结果信息。
10.所述步骤(1)中,获取蓄电池异常耗电的样本数据包括:(1.1)数据采集:采集云端足够多辆车,t

1日的车辆蓄电池相关网络数据,数据包括异常事件、开始时刻、结束时刻、单次故障时间等。
11.(1.2)数据清洗:对数据进行清洗,去除因格式或采集错误产生的错误数据,建立异常数据表。
12.所述步骤(1)中构造特征变量,得出特征数据训练集包括:(1.3) 构造特征变量:基于异常数据表,计算单车单天累计故障次数,以及单车单天累计异常时间。
13.(1.4)特征数据训练集构造:将特征变量数据进行随机抽样,得到目标特征数据集训练集。
14.所述步骤(2)中,基于孤立森林构建异常识别算法模型的过程包括:(2.1)模型构建:对每个抽样的数据集建立一棵树模型,即用抽样的数据集传入bulid_tree方法(即建立一个node节点类用来保存树中的每个节点,对经过节点的样本取值进行随机分割,将每个节点类使用递归的方式连接起来)构建一棵树模型,重复上述过程建立n棵树结构,并输出平均路径长度集。
15.(2.2)聚类分析:根据不同蓄电池异常特征输出的平均路径长,通过聚类模型,筛选识别出蓄电池正常耗电车辆、蓄电池馈电低风险车辆以及蓄电池馈电高风险车辆。
16.进一步还有包括,(2.3)数据验证:根据筛选出的预测馈电风险车辆,进行电话回访,验证车主最近实际馈电无法启动的情况;同时针对售后反馈的历史已馈电车辆,通过对已馈电车辆发生馈电时刻之前历史数据进行预测,比对预测结果及实际馈电情况,进行准确率验证。
17.所述步骤(3)中,对算法模型进行调优是通过积累样本数据,使模型不断学习从而参数调优。
18.所述步骤(3)中,当监控到有新的蓄电池相关网络数据上传时,使用该模型进行预测,得到蓄电池馈电风险预测结果,如果馈电风险发生,则向车主推送车辆馈电预警信息,提前告知车主馈电风险。
19.本发明的优点如下:本发明在不增加硬件的情况下,利用云端采集上传的蓄电池相关网络信号数据,进行数据探索挖掘,特征变量构造,然后通过机器学习算法进行训练,得出较完善的馈电风
险预测模型,利用训练好的模型,当云端监测到有实时蓄电池相关数据上传时,即可输出蓄电池馈电风险预测结果,及时对车主进行馈电风险预警提醒。后续随着蓄电池故障样本数据不断累积,特征变量以及算法参数能够不断优化,预测模型的准确性也逐步提高。
附图说明
20.图1 特征变量构造过程图;图2 模型构建流程图;图3 馈电风险预测流程图。
具体实施方式
21.以下结合附图,对本发明进行进一步描述:本发明所述的一种蓄电池馈电风险识别方法,是基于云端采集的蓄电池故障时刻,故障类型,故障次数,故障时长等数据,采用随机孤立森林方法构建并优化预测模型,预测蓄电池馈电风险,并根据预测结果,主动向车主发出实时蓄电池馈电风险预警信息。
22.具体实施步骤如下:1、首先挖掘出蓄电池异常耗电的样本数据,构造特征变量,得出特征数据训练集,参见图1,具体包括以下步骤:(1.1)数据采集:采集云端1000辆车,t

1日的车辆蓄电池相关网络数据,这些数据包括但不限于异常事件、开始时刻、结束时刻、单次故障时间、车辆id、时间戳等,其中车辆id作为区分不同车辆的标志符。
23.(1.2)数据清洗:根据数据的有效性规则,对读取的数据进行数据清洗,从而去除因格式、采集错误或网络错误等产生的无效数据,减少无效分散数据对模型结果的影响,构建出异常数据表。
24.(1.3)特征变量构造:基于异常数据表,计算单车单天累计异常耗电次数,以及单车单天累计异常耗电时间,其中单天累计异常耗电次数为异常事件行数累计值,单天累计异常耗电时间为sum(n次异常结束时刻

n次异常开始时刻)。
25.(1.4)特征数据初步分析:根据对单车单天累计异常耗电次数、以及单车单天累计异常耗电时长进行正态分布分析,理论上异常次数越多,异常耗电时长越长越容易出现馈电风险。单车单天累计异常耗电次数、以及单车单天累计异常耗电时长为后续构建特征数据集的数据基础。此处的正态分布仅供单一数据维度初步统计分析,仅作为数据处理阶段数据有效性的验证手段之一,可以与后续建模结果相互佐证。
26.2、然后通过构造特征数据训练集,进行异常识别模型构建,参见图2,具体包括以下步骤:(2.1)特征数据训练集构造:首先将特征变量做归一化处理,为保证算法模型差异性,将特征变量数据进行随机抽样,得到目标特征数据集训练集,从而增强数据识别结果的准确性。
27.(2.2)模型构建:对每个抽样的数据集建立一个树模型,即用采样的数据集传入bulid_tree方法构建一棵树模型,在树模型中每个结点node对数据的取值进行随机划分,重复上述过程建立n棵树结构。
28.假设m表示特征数据的样本总量,则树的平均路径长度为c(m)=2ln(m

1)+ξ

2(m

1/m),ξ为欧拉常数,即c(m)为给定样本数m时,路径长度的平均值,用来标准化样本x的路径长度h(x),样本点x的路径长度h(x)为从树的根节点到叶子节点所经过的边的数量。
29.上述异常概率即树模型中各个样本点距离根节点的距离h(x),因为在树模型中各个结点是随机分割的,密度越低的样本被分割的次数就会越少,对应的距离根节点的距离就越近,它是异常点的概率就越大。
[0030] (2.3)聚类分析:根据不同蓄电池异常特征输出的平均路径长,通过聚类模型进行分析,寻找出各状态类别中心,并输出对应聚类结果,即筛选识别出蓄电池正常耗电车辆、蓄电池馈电低风险车辆、以及蓄电池馈电高风险车辆。
[0031] (2.4)数据验证:根据筛选出的预测馈电风险车辆,针对这些车辆车主进行电话回访,验证车主最近实际馈电无法启动的情况;同时针对售后反馈的历史已馈电车辆,通过已馈电车辆发生馈电时刻之前历史数据进行预测,比对预测结果及实际馈电情况,进行准确率验证。此验证过程可通过简单的数据分析完成。
[0032]
3、最终通过参数调优得到最优模型参数,进行模型部署上线,预测,参见图3,具体预测流程步骤如下:(3.1)模型调优:通过积累样本数据,模型不断学习从而参数调优,得到较完善、满意度较高的模型。
[0033]
(3.2)实时预测:系统实时监测新上传到云端的蓄电池相关网络数据,对数据进行预处理,把处理好的特征数据,传入模型中,得到预测结果,若连续n次,该车均出现蓄电池馈电风险,则推送预警信息给车主和hu。
[0034]
即是,当监控到有新的蓄电池相关网络数据上传时,使用该模型进行预测,得到蓄电池馈电风险预测结果,如果馈电风险发生,则向车主推送车辆馈电预警信息,提前告知车主馈电风险,车主可进一步采取远程启动等方式,防止馈电发生,为出行造成困扰。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1