汽车故障数据的自适应聚合处理方法及系统与流程

文档序号：31225724发布日期：2022-08-23 19:18阅读：84来源：国知局

1.本发明属于数据处理技术领域，具体涉及一种汽车故障数据的自适应聚合处理方法及系统。

背景技术：

2.汽车运行状态数据可通过can（controller area network，控制器局域网络）总线实时获取或者按照一定采样频率从外接传感器获取，具体包括油门踏板位置、刹车踏板位置、发动机扭矩模式等n种汽车运行状态数据，汽车故障状态数据也来源于此。随着人工智能技术的发展，汽车故障诊断也越来越智能化，方向也变得更加多元,如何利用机器学习方法，更好地对汽车进行故障诊断成为新的发展方向。在使用人工智能方法预测汽车故障的流程如下：第一步、采集汽车运行状态数据，传感器通过一定的频率将采集到的信号通过can网络传输至车载终端；第二步、由车载终端将运行数据上传至云端服务器；第三步、从云端拉取汽车运行状态数据并进行数据处理；第四步、将处理后的数据送入模型进行训练。其中汽车运行数据以毫秒为单位上传至云端服务器，其数据量巨大，特征信号较多，不利于分析；而云端传输过程也容易收到网络信号覆盖不佳等不利影响，导致特征信号的缺失值和异常值较多，噪声非常大，导致数据的辨识度很低，可用属性不明显；汽车的特征信号常与单次行车阶段关联性较强，但一般的数据聚合是以固定窗口大小为单位聚合，存在跨天数据被割裂和窗口大小难以确定的问题，导致划分的数据代表性不佳。上述问题为模型训练带来了很大的困难，导致模型识别效果不佳。
3.因此，有必要开发一种新的汽车故障数据的自适应聚合处理方法及系统。

技术实现要素：

4.本发明的目的在于提供一种汽车故障数据的自适应聚合处理方法及系统，能有效降低数据量，能有效解决以时间间隔划分数据时跨天数据被割裂的情况。
5.本发明所述的一种汽车故障数据的自适应聚合处理方法，包括以下步骤：包括以下步骤：s1：确定需要用到的车辆传感器信号；根据售后维修记录卡显示的故障类型、故障发生时间和维修时间，从云端服务器提取汽车故障历史数据；s2：对提取的汽车故障历史数据进行数据清洗处理和归一化处理；s3：针对每个车辆的具体数据，根据车辆启停时间段对其进行划分，对每个时间段的数据进行自适应聚合；s4：根据维修记录卡的故障发生时间或维修时间，将聚合处理后的特征数据划分为故障前和故障后两个状态，并进行标签化处理；s5：筛选标签化处理后的数据进行特征组合，与标签化处理后未组合的数据共同组成数据特征集合，用于机器学习算法的输入；s6：在训练阶段利用控制变量法压缩特征大小，剔除影响因子较小的特征，提取影
响因子较大的特征，不断更新机器学习模型，输出更好的故障诊断结果。
6.可选地，所述s1包括：s1.1：根据铅酸蓄电池故障原因、铅酸蓄电池故障机理，并结合云端服务器可提取的信号集合，确定需要提取的车辆传感器信号集；s1.2：根据蓄电池故障原因和售后维修记录卡定位发生蓄电池故障的车辆车架号；s1.3：依据车架号和确定的车辆传感器信号集，从云端服务器提取车辆相应的蓄电池故障发生时间或维修时间前后的车辆传感器特征信号历史数据和对应的时间数据。
7.可选地，所述s2包括：s2.1：检查数据是否存在重复项，若重复项存在，则除保留第一条重复数据外，其他数据组删除；s2.2：检查数据是否存在空缺值，若空缺值存在且数据条数小于第一预设条数，则采用第一预设规则进行填充，若空缺值存在且数据条数大于等于第一预设条数，则删除该时间段内的所有数据；s2.3：检查数据是否存在异常值，若异常值存在且数据条数小于第二预设条数，则删除该时间点的所有数据，若异常值存在且数据条数大于等于第二预设条数，则将该信号和该信号的历史数据列为重点关注数据；s2.4：为每个信号确定一个阈值，检查数据是否超出阈值，若数据超过阈值且条数小于第三预设条数，则删除该时间点的所有数据，若数据超出阈值且数据条数大于等于第三预设条数，则将该信号和该信号的历史数据列为重点关注数据；s2.5：筛选出需要归一化处理的数据项，并对其进行归一化处理。
8.可选地，所述s3包括：s3.1：选取某一车辆，对其不同采集时间的数据进行合并处理，并设置一定的时间长度作为汽车是否停用的时间阈值，根据时间阈值将数据划分为m个汽车启停时间段；s3.2：对汽车每次启停时间段内的数据进行聚合处理，将一次启停时间段内的数据聚合成一条新数据。
9.可选地，所述s3.1中：设置前后两条时间数据的时间差为hi时，i=1,2,
…
,n，其中n表示以时间间隔n分钟为时间间隔，将前后数据划分为两次行驶数据，并将数据划分为m个启停时间段。
10.可选地，所述s3.2中，假设合并后的第一条数据为车辆的第一条启动数据began j，j=1,2,3,
…
m，以时间维度对数据正序排列，将该行驶阶段的最后一条数据为结束数据end j，j=1,2,3,
…
,m，其中m表示该辆车的数据中有m个汽车启停时间段，将began j和end j之间的所有数据聚合，生成一条新数据，将多条新数据生成一个数据集，聚合后的新数据项包括该段时间内每个原数据项的平均值、最大值、最小值、峰度和偏度。
11.可选地，所述s4具体为：以维修记录卡的蓄电池故障发生时间或维修时间为时间点，将蓄电池故障发生之前15天的数据划分为故障状态，将其每条特征项数据标注为1；将维修之后30天的数据划分为非故障状态，将其每条特征项数据标注为0。
12.可选地，所述s5中：
筛选出可进行特征组合的数据项，通过将单独特征进行相乘或笛卡尔求积组合，形成特征组合数据项，将特征组合数据项数据与标签化后的特征项数据共同组成数据集；其中，特征组合的数据项是蓄电池传感器电压信号、蓄电池传感器温度信号与soc采用笛卡尔求积法进行组合，形成soc_3特征组合项。
13.可选地，所述s6中，训练阶段采用控制变量法，每次抑制一个特征的贡献度，对soc_3特征组合项和空调挡位特征数据项进行判断，根据训练结果来计算该特征的影响因子，不断更新机器学习模型。
14.第二方面，本发明所述的一种汽车故障数据的自适应聚合处理系统，包括存储器和控制器，所述存储器内存储有计算机可读程序，该计算机可读程序被控制器调用时能执行如本发明所述的汽车故障数据的自适应聚合处理方法的步骤。
15.本发明具有以下优点：（1）本发明针对数据量大的问题，提出了一种自适应数据聚合策略，考虑到汽车行驶数据的特性，以每次汽车启停划分为若干个行驶阶段，将每个行驶阶段的大量数据项数据聚合成一条新的数据项数据，不仅有效地降低了数据量，以每次汽车启停划分有效解决了以时间间隔划分数据时跨天数据被割裂的情况，而且对于某些特征量如统计一次行车时间长度时，以每次汽车启停划分更有利于特征量的提取与分析。
16.（2）本发明针对数据存在的噪声问题，对其噪声类型进行了分类：重复值、空缺值、异常值，并以噪声数据条数对其进行了分别处理，降低了噪声的影响，提高了数据的辨识度。
附图说明
17.图1 为本实施例的流程图。
具体实施方式
18.以下将结合附图对本发明进行详细的说明。
19.如图1所示，本实施例中，一种汽车故障数据的自适应聚合处理方法，包括以下步骤：s1：确定需要用到的车辆传感器信号；根据售后维修记录卡显示的故障类型、故障发生时间和维修时间，从云端服务器提取汽车故障历史数据；具体包括：s1.1：根据铅酸蓄电池故障原因、铅酸蓄电池故障机理，并结合云端服务器可提取的信号集合，确定需要提取的车辆传感器信号集。此步骤中，还可以结合蓄电池专家的经验来确定需要提取的车辆传感器信号集。
20.某一实例中，确定了包括蓄电池电流、蓄电池电压、蓄电池soc、车速、发动机速度、空调挡位等43个特征信号。
21.s1.2：根据蓄电池故障原因（比如：蓄电池馈电、蓄电池不存电、蓄电池无法充电）和售后维修记录卡定位发生蓄电池故障的车辆车架号；s1.3：依据车架号和确定的车辆传感器信号集，从云端服务器提取车辆相应的蓄电池故障发生时间或维修时间前后的车辆传感器特征信号历史数据和对应的时间数据。
22.某一实例中，提取了700辆蓄电池发生故障的车辆，以及故障发生前两个月和维修
后两个月的特征信号的历史数据及其对应的时间数据。
23.s2：对提取的汽车故障历史数据进行数据清洗处理和归一化处理，以提升数据的置信度和可靠性；具体为：s2.1：检查数据是否存在重复项，若重复项存在，则除保留第一条重复数据外，其他数据组删除；s2.2：检查数据是否存在空缺值，若空缺值存在且数据条数第一预设条数，则进行或默认值或0值或均值或k最邻近法填充，若空缺值存在且数据条数大于等于第一预设条数，则删除该时间段内的所有数据；s2.3：检查数据是否存在异常值，若异常值存在且数据条数小于第二预设条数，则进行删除该时间点的所有数据，若异常值存在且数据条数大于等于第二预设条数，则将该信号和该信号的历史数据列为重点关注数据；s2.4：为每个信号确定一个阈值（比如：可以根据专家的经验为每个信号确定一个阈值），检查数据是否超出阈值，若数据超过阈值且条数小于第三预设条数，则删除该时间点的所有数据，若数据超出阈值且数据条数大于等于第三预设条数，则将该信号和该信号的历史数据列为重点关注数据；s2.5：筛选出需要归一化处理的数据项，并通过自定义归一化方法或min-max标准化或z-score标准化方法对其进行归一化处理。
24.本实施例中，需要归一化处理的数据项包括所有的离散特征数据，归一化方法采用自定义方法，具体公式是wt=(t0*0+t1*1+
···
+tn*n)/t，其中wt代表归一化的结果，0到n代表负载挡位，t0到tn代表各负载挡位的使用时间，t代表负载使用的总时间。
25.s3：针对每个车辆的具体数据，根据车辆启停时间段对其进行划分，对每个时间段的数据进行自适应聚合；具体为：s3.1：选取某一车辆，对其不同采集时间的数据进行合并处理，并设置一定的时间长度作为汽车是否停用的时间阈值，根据时间阈值将数据划分为m个汽车启停时间段；设置前后两条时间数据的时间差为hi（i=1,2,
…
,n）时，其中n表示以时间间隔n分钟为时间间隔，将前后数据划分为两次行驶数据，并将数据划分为m个启停时间段。
26.s3.2：对汽车每次启停时间段内的数据进行聚合处理，将一次启停时间段内的数据聚合成一条新数据。
27.假设合并后的第一条数据为车辆的第一条启动数据began j(j=1,2,3,
…
m)，以时间维度对数据正序排列，将该行驶阶段的最后一条数据为结束数据end j(j=1,2,3,
…
,m)，其中m表示该辆车的数据中有m个汽车启停时间段，将began j和end j之间的所有数据聚合，生成一条新数据，将多条新数据生成一个数据集，聚合后的新数据项包括该段时间内每个原数据项的平均值、最大值、最小值、峰度、偏度等参数。
28.本实施例中，将43个特征信号分为连续特征数据和离散特征数据两个组，其中连续特征数据组聚合后的特征数据项包括均值、标准差、最大值、最小值、峰度、偏度等，离散数据组全部都是状态量，包括各种用电器等的使用状态，只聚合为一个特征数据项：负载开启的持续时间。
29.本实例中，平均将20000条数据聚合成一条新数据。
30.s4：根据维修记录卡的蓄电池故障发生时间或维修时间，将聚合处理后的特征数
据划分为蓄电池故障前和蓄电池故障后两个状态，并进行标签化处理；具体为：以维修记录卡的蓄电池故障发生时间或维修时间为时间点，将蓄电池故障发生之前15天的数据划分为故障状态，将其每条特征项数据标注为1；将维修之后30天的数据划分为非故障状态，将其每条特征项数据标注为0。
31.s5：筛选标签化处理后的数据进行特征组合，与标签化处理后未组合的数据共同组成数据特征集合，用于机器学习算法的输入；本实施例中，根据领域专家的建议，筛选出可进行特征组合的数据项，通过将单独特征进行相乘或笛卡尔求积组合，形成特征组合数据项，将特征组合数据项数据与s5标签化后的特征项数据共同组成数据集。
32.本实施例中，特征组合的数据项是蓄电池传感器电压信号、蓄电池传感器温度信号与soc采用笛卡尔求积法进行组合，形成soc_3特征组合项。
33.s6：训练阶段利用控制变量法压缩特征大小，剔除影响因子较小的特征，提取影响因子较大的特征，不断更新机器学习模型，输出更好的故障诊断结果。
34.本实施例中，训练阶段采用控制变量法，每次抑制一个特征的贡献度，对soc_3特征组合项和空调挡位等特征数据项进行判断，根据训练结果来计算该特征的影响因子，不断更新机器学习模型。
35.本实施例中，一种汽车故障数据的自适应聚合处理系统，包括存储器和控制器，所述存储器内存储有计算机可读程序，该计算机可读程序被控制器调用时能执行如本实施例中所述的汽车故障数据的自适应聚合处理方法的步骤。
36.上述实施例为本发明方法较佳的实施方式，但本发明方法的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：施暄宣张国杰刘巍李昌
技术所有人：重庆长安汽车股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、邢老师：1.机械设计及理论 2.生物医学材料及器械 3.声发射检测技术。
2、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
3、王老师：1.机器人 2.嵌入式控制系统开发
4、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。