改善故障代码设定和隔离故障的事件驱动的数据挖掘方法

文档序号:6328780阅读:171来源:国知局
专利名称:改善故障代码设定和隔离故障的事件驱动的数据挖掘方法
技术领域
实施例总体上涉及识别服务修复数据中的故障和异常的检测。
背景技术
服务提供商例如经销商处的服务部门借助于利用诊断软件算法的服务诊断工具来诊断车辆电子器件中的问题。诊断故障码(DTC)基于诊断软件算法设置在车辆中。服务诊断工具从车辆处理器存储器检索DTC,并用于确定车辆中的故障。车辆中的每个处理器包括当车辆经历故障并被检测时存储DTC的存储器。维修技术人员可以检查任何DTC的当前或历史记录,以确定车辆中的根源。DTC是用于识别在车辆内的各种部件中出现的故障的字母数字码。这样的DTC与包括、但不限于发动机运行、排放、制动、动力系、安全性和转向的各种电动车辆功能有关。每个子系统可以具有其自己的车载处理器,以监测该子系统运行的故障,或者处理器可以负责监测多个子系统的故障。当子系统处理器检测到故障时,产生一个或多个DTC。DTC帮助维修技术人员查明所关注的区域。DTC由维修技术人员借助于扫描工具来检索。虽然DTC在查明所关心的区域方面向技术人员提供帮助,但是DTC不提供与是什么确切地导致问题有关的明确信息。通常,DTC指示特定部件中、将部件连接至控制模块的电路中或控制模块自身中的故障。现在,仍然由技术人员通过执行进一步的电路测试、利用分析推理、先前经验或最佳猜测来识别根源。因此,DTC仅在一定程度上提供诊断,另外的诊断决定仅可以通过执行另外的现场测试并从车辆收集另外的操作参数数据来获得。有时, 产生DTC的算法会具有错误输入,并向技术人员提供不正确的诊断。另外,由于缺少DTC设置操作条件,所以DTC会展现出难以由技术人员固定的间歇行为。故障的间歇行为是当故障被触发并被记录时的那些情况;然而,在服务修理中心不能重复该故障情形。扫描工具还可以检索车载诊断运行参数标识符(PID),以确定由传感器或类似装置输出的特定信息。PID码是由扫描工具记录的通过从车辆的通信总线进行读取所传输的部件的运行参数。通信总线上的设备之一识别其负责的PID码,并发回与PID码有关的信息,其进一步的细节与感测与检测的故障相关的数据的一个或多个设备有关。然而,与DTC 有关的PID的数量可能相当多,并且随机地分析PID码的服务人员是耗时的以及繁重的。

发明内容
实施例的优点在于利用运行参数标识符(PID)数据来检测诊断软件算法中的错误。另外,在没有在运行参数标识符中检测到任何异常的情况下,可以利用PID确定故障是否与当前正在测试和维修的标识电路有关。这里描述的技术可以分析可用的PID,将PID分类为信息型或非信息型类别,根据类别检测故障条件,确定错误是否存在于诊断算法中,确定负责表征间歇的DTC的关键PID,并确定故障是否与测试的所标识电路有关。实施例构思一种基于参数识别的故障隔离技术。执行用于识别诊断故障码的诊断软件程序,所述诊断故障码用于检测当前所维修车辆的电路中的故障。所述诊断软件程序检索与所识别出具有所检测故障的电路有关的参数识别数据。在计算机上获取先前所维修车辆的参数识别数据。从所述先前所维修车辆检索所述参数识别数据,所述先前所维修车辆包括在与当前所维修车辆基本类似的运行条件下具有与当前所维修车辆相同的车辆规范的车辆。基于彼此的相互依赖性,将所述先前所维修车辆的所述参数识别数据分组为多个聚类。将联合概率分布确定为所述先前所维修车辆的所述参数识别数据的相互依赖性的函数。选择与来自所述先前所维修车辆的所述参数识别数据具有一致性的当前所维修车辆的参数识别数据。将所述当前所维修车辆的所述参数识别数据的相互依赖性投射到相应的联合概率分布上。响应于参数识别数据的概率分布处于预定方差之外,在所述当前所维修车辆的所述参数识别数据中检测到异常。检测到的异常表示所述诊断软件程序中的错误或者相应的诊断故障码的间歇发生中的至少一者。修改所述诊断软件程序的或者与所述相应的诊断故障码的间歇发生相关联的比较中的至少一者,以纠正所述错误。本发明还提供如下方案
1. 一种基于参数识别的故障隔离方法,所述方法包括步骤
执行用于识别诊断故障码的诊断软件程序,所述诊断故障码用于检测当前所维修车辆的电路中的故障,所述诊断软件程序还检索与所识别出的具有所检测故障的电路有关的参数识别数据;
在计算机上获取先前所维修车辆的参数识别数据,从所述先前所维修车辆检索所述参数识别数据,所述先前所维修车辆包括在与所述当前所维修车辆基本类似的运行条件下具有与所述当前所维修车辆相同的车辆规范的车辆;
基于彼此的相互依赖性,将所述先前所维修车辆的所述参数识别数据分组为多个聚
类;
将联合概率分布确定为所述先前所维修车辆的所述参数识别数据的相互依赖性的函
数;
选择与来自所述先前所维修车辆的所述参数识别数据具有一致性的所述当前所维修车辆的参数识别数据;
将所述当前所维修车辆的所述参数识别数据的相互依赖性投射到相应的联合概率分布上;以及
响应于参数识别数据的概率分布处于预定方差之外,在所述当前所维修车辆的所述参数识别数据中检测到异常,其中,检测到的异常表示所述诊断软件程序中的错误或者相应的诊断故障码的间歇发生中的至少一者;以及
修改所述诊断软件程序或者与所述相应的诊断故障码的间歇发生相关联的成分中的至少一者,以纠正所述错误。2.根据方案1所述的方法,所述方法还包括步骤
响应于检测到异常,去除含有导致所述概率分布处于所述预定方差之外的参数识别数据的聚类;
选择所述当前所维修车辆的下一个参数识别数据;
将所述当前所维修车辆的所述下一个参数识别数据的相互依赖性投射到相应的联合概率分布;以及
响应于处于预定方差之外的所述下一个参数识别数据的概率分布,在所述当前所维修车辆的所述下一个参数识别数据中检测到异常。3.根据方案1所述的方法,所述方法还包括步骤响应于在所述当前所维修车辆的所述参数识别数据中未检测到异常,确定故障是否与所述电路有关。4.根据方案3所述的方法,其中,确定所述故障是否与所述电路有关还包括步骤
确定所述当前所维修车辆的选定的参数识别数据和所述先前所维修车辆的选定的参数识别数据之间的散度;
确定所述散度是否大于预定阈值;以及
响应于所述散度大于所述预定阈值,确定出所述故障在所述电路中。5.根据方案4所述的方法,其中,响应于所述散度大于所述预定阈值,确定出故障隔离不是所述电路的结果。6.根据方案5所述的方法,其中,使用多个信息组中的一个来确定用于识别散度的所述选定的参数识别数据,其中,利用来自每个聚类的参数识别数据来形成多个信息组, 每个信息组由从每个聚类中随机地选择的参数识别数据组成。7.根据方案6所述的方法,其中,从所述多个信息组选择的信息组不具有检测到的异常。8.根据方案7所述的方法,其中,从所述多个信息组选择的所述信息组在所述信息组内具有最大程度的联合熵。9.根据方案1所述的方法,其中,获取先前所维修车辆的参数识别数据还包括 执行冗余检查,以减少所述参数识别数据中的冗余。10.根据方案9所述的方法,其中,使用主成分分析方法来应用冗余检查。11.根据方案10所述的方法,其中,还使用独立成分分析来应用冗余检查。12.根据方案1所述的方法,其中,基于彼此的相互依赖性将所述多个聚类进行分组利用基于Euclidean距离的测量方法。13.根据方案1所述的方法,其中,基于彼此的相互依赖性将所述多个聚类进行分组利用基于相互信息的测量方法。14.根据方案1所述的方法,其中,所述检测到的异常表示所述当前所维修车辆的电路中的间歇的故障,其中,修改由所述诊断软件程序生成的所述诊断故障码,以识别所述间歇的故障。15.根据方案14所述的方法,其中,响应于在没有维修所述车辆的情况下诊断故障码被激活和失活,车外分析工具将诊断故障码标记为是间歇的。16.根据方案14所述的方法,其中,将所述当前所维修车辆的所述参数识别数据的相互依赖性投射到相应的联合概率分布包括仅将与识别出的间歇的诊断码相关联的参数识别数据投射在相应的联合概率分布上。17.根据方案16所述的方法,其中,在所述当前所维修车辆的所述参数识别数据中检测到异常是响应于与识别出的间歇的诊断码相关联的参数识别数据的概率分布处于所述预定方差之外。18.根据方案1所述的方法,其中,修改与所述间歇发生相关联的成分包括修改与所述参数识别数据相关联的相应成分,以防止异常的参数识别值重新出现。


图1是诊断修复报告系统的框图。图2是异常和故障分类技术的方法的流程图。图3是用于识别在聚类和散度分析中使用的主成分的碎石图(scree plot)。图(图4中从左到右)是用于识别适当地成组的聚类的轮廓图(silhouette plot)。图5是PID训练数据集的分布密度图。图6是指示数据集之间的一致性的PID测试数据的示例性分布密度图。图7是指示数据集之间的非一致性的PID测试数据的示例性分布密度图。图8是示出高KL散度的示例性条形图。图9是示出低KL散度的示例性条形图。
具体实施例方式在图1中示出了诊断修复报告系统10。诊断修复报告系统10包括用于报告从维修车辆获得的诊断故障码(DTC)的多个维护中心12。为了确定对于特定的服务维修是否已经出现误诊断,从维修店检索修复数据。原始设备制造商例如汽车公司维护在线维修报告系统。在该示例中,将车辆带到维修店,例如经销商的服务部门。技术人员将使用与车辆中的一个或多个处理器(例如,发动机控制模块)通信的扫描工具14对车辆进行诊断检查。车辆中的每个处理器包括存储器或利用远程存储器,以存储当车辆经历问题并且错误代码被记录时的DTC 16。在车辆处理器存储器中存储DTC 16减轻了维修技术人员试图再经历车辆的问题,特别是在车辆当前未显示出问题症状时;而是,维修技术人员可以检查已经存储在车辆的存储器中的任何DTC的当前或过去历史,以确定当发生问题时车辆存在什么问题。DTC 16是用于识别在车辆中的各种部件中发生的问题的字母数字码。这样的DTC 16可以与包括、但不限于发动机运行、排放、制动、动力系和转向的各种车辆功能有关。每个子系统可以具有其自己的车载处理器,以监测该子系统运行的故障,或者处理器可以负责监测多个子系统的故障。当子系统处理器检测到故障时,产生一个或多个DTC 16。DTC 16存储在处理器的存储器中,并且随后当测试时由维修技术人员检索。DTC 16有助于维修技术人员查明所关心的区域。为了检索DTC 16, 维修技术人员进入扫描工具14上的模式,以请求检索针对当前或过去行驶循环所存储的 DTC 16。然而,DTC 16的数量在车辆中受到限制,并且如果同时触发若干个DTC 16,则查找根源变得非常困难。扫描工具16还可以用于检索在DTC被触发且由车载处理器记录时所记录的运行参数标识符(PID) 18。子系统的健康状况通常通过由使用包含在车载处理器中的各种传感器和诊断软件程序连续收集的多个(例如,数千个)运行PID 18来监测。从冻结帧数据来收集PID 18,冻结帧数据是当DTC发生时一组数量有限的实例。PID 18中的信息可以包括与其运行条件有关的数据(例如,提供空气-燃料混合物的比值,从而可以确定该比值是否在最小值和最大值内)。收集DTC 16和PID 18,并存储在多个存储设备20中,从而可以被检索以用于随后分析。分析工具22与存储设备20通信,以检索含有先前所维修车辆的DTC 16和PID 18的全部或一部分维修数据,从而有助于识别当前所维修车辆的根源。分析工具22可以包括计算机、膝上型电脑、手持无线处理设备或存储数据并执行如这里描述的诊断程序的类似设备。这里描述的方法提供了系统地分析PID且在没有任何异常的情况下将汽车系统内的故障进行分类的数据驱动技术。即,确定由测试数据描述的故障是否属于在稍后将详细描述的利用历史数据的在训练数据分析中描述的故障。将在变化方面显示出类似的趋势的PID被描述为一致性。因此,在训练阶段中在PID之间识别出一致性之后,利用一致性的 PID来形成聚类。在形成聚类之后,现在可以使用在训练数据和测试数据之间属于相同聚类的PID的行为的比较分析进行异常检测。因为对于故障的相应特定实例,系统故障由跨全部聚类的所有PID来描述,所以可以使用PID的联合概率分布来表征被分类的故障的组。 因此,所执行的技术包括利用历史维修数据的训练阶段和利用当前维修数据和历史维修数据来检测故障的测试阶段。图2示出了故障检测技术的训练阶段部分和测试部分的总体概述的流程图。在步骤30中,从先前维修车辆检索PID数据的若干个模式。如这里描述的模式是用于特定车辆和特定DTC的一组PID值。例如,如果特定车辆具有被触发的特定DTC,则在DTC被触发时的时刻,车载处理器记录相应的传感器值(PID),例如车辆速度、节气门角度、发动机冷却剂温度、环境温度。检索的训练数据来自于与当前所维修车辆具有相同车辆规范的车辆。被确定为间歇的DTC优选地被识别,并由车外诊断工具标记为间歇的DTC。可以在诊断工具中建立一组启发式准则,以识别间歇的DTC何时发生,随后将识别出的间歇的DTC 标记或标示为间歇的DTC,以备将来分析。在步骤31中,将PID数据进行预处理,以将PID数据进行分类,并使用汽车领域知识消除不相关的和常值的PID。在步骤32中,使用利用相关性和信息理论测量的数据缩减技术跨各种PID值来分析数据的一致性。这里描述的数据缩减技术中的关键假设是在PID之间存在一致性。一致性提供了用于形成一致性的PID的聚类的理由,使得相同聚类中的PID由于其相应的一致性而具有类似的变化。可以使用主成分分析(PCA)和独立成分分析(ICA)来应用数据缩减, 以缩减数据尺寸并查找PID值之间的一致性。PCA标识最佳地描述数据集中的可变性的变量的线性组合。通过PID数据的协方差矩阵的特征向量分解来计算变量的线性组合。使用描述了多数可变性(例如,数据集中的总方差的90%)的变量的线性组合作为用于将数据转变为新的缩减维度空间的基本向量。关于数据集中的冗余,提取信息。此外,PCA仅在数据具有高斯分布的假设下才是有效的,高斯分布对于汽车系统来说可能不成立,因为存在可产生非高斯数据的若干个非线性过程。ICA是用于在统计上从数据矩阵估计独立成分的非线性技术。ICA用于非高斯数据的线性表示,使得成分在统计上是独立的,或者尽可能地独立的。ICA在数据更可能是非高斯的高度非线性的系统中最为有效。因为已经利用PCA缩减了数据缩减,所以将ICA应用于PCA数据输出,以检查是否可以进行任何进一步的缩减。由PCA和ICA确定的冗余显示出在PID之间存在的一致性,其可以在两个处理中用于故障检测。第一处理缩减PID的数量,并形成在数据尺寸上具有若干倍缩减的数据集, 然后将PID数据分为与在统计上独立的成分的数量一样多的聚类。两个成分之间的统计独立性暗示了一个成分的值不依赖于另一成分的值。第二处理通过利用下面在步骤32中描述的其期望的聚类检查其统计偏差来帮助我们识别异常的PID。
排放系统将在这里被描述为车辆系统的示例,其利用在该应用中解释的构思来检测诊断算法中的异常,并执行故障隔离。应当理解的是,如下描述的排放系统仅是可以利用故障隔离技术的各种车辆系统的一个示例。车辆系统包括H02S加热器控制组。H02S加热器性能组和H02S加热器电阻电路组包括1376个模式。对于该两个组,得到的数据集具有尺度1376X253,其中,尺度253表示由二进制和实数值的PID组成的PID的数量。由此, 使用领域知识选择42个PID,如在步骤30中所讨论的。得到的数据集具有1376X42的尺度。接下来针对于冗余,使用所讨论的PCA和ICA方法来检查得到的数据集。在PCA 中,识别沿最大变化的正交方向。图3示出了用于识别主成分的碎石图,主成分将被选择以便聚类。图示利用y轴上的方差值和χ轴上的主成分的索引。观察到在第9个主成分处出现显著的拐点。最初的9个成分被确定为占数据集中的总方差的基本上90%。这暗示了来自PID的数据显示出沿9个正交方向的主要变化。利用在PCA中具有较大相关方差的主成分表示目标结构以及具有较小变化的主成分表示噪声的假设,可以推断出数据中的一致性。使用ICA进一步处理在PCA下识别的成分,并估计所确定的每个潜在的独立成分的熵。根据ICA分析,发现9个成分中的7个成分是显著的。9个成分到7个成分的缩减表明在PID数据中存在冗余,其可以经由聚类来分析。在步骤33中,执行聚类,以查找聚类的实际数量及其一致性,以表示原始数据。聚类包括在某一特征空间中基于其接近性将未标记的PID数据集分类为有限隐藏的数据结构的无监督的技术。这里,因为故障在分析之前是未知的,所以PID数据未被标记。聚类包括区分来自一组候选者的特征然后将它们进行转变以由原始特征生成新特征的选择(例如,接近性测量)。然后在转变的特征空间中根据选择的样品的接近性使它们聚类。一旦选择了接近性测量,聚类准则函数的构建使得聚类的划分成为最优化问题。聚类过程的最优性可以通过测量聚类中的PID的轮廓宽度的轮廓图来检验。图4a4c示出了基于PID之间的相互信息的各个聚类(例如, 聚类1-5)的轮廓图的数据集。图表中的每个相应的条的水平宽度
从作为良好聚类的1变化至作为差聚类的-1。可以基于距离测量或相互信息测量来执
行聚类。基于距离的聚类可以利用Euclidean距离或Mindowski距离。Euclidean距离是 Minkowski距离的特例。Minkowski距离的缺陷在于,最大规模的特征趋于支配其它特征。 因此,数据在聚类之前需要标准化。数据聚类的句法和统计测量之间的比较建议后者优于前者。基于相互(共同)信息的聚类是如何形成PID的聚类的另一示例。关于两个PID之
间的相互依赖性,如果两个PID具有高的相互信息值,则假设这两个PID在它们之间具有高
程度的依赖性。具有高程度的相互信息的PID被称作是一致的,且成组在一起。关于间歇的
DTC的确定,间歇的DTC可初始地成组为一类,并且非间歇的DTC可成组为另一类。类之间
的相互信息可然后被分析并且聚类以确定将间歇的DTC与非间歇的DTC区分开的关键PID。
聚类中的PID的相似度的分布提供了领域知识。存在与聚类一样多的分布。当从新的车辆
获得一系列PID时,根据从先前所维修车辆获得的知识在聚类中测试PID。在相应的聚类中
的这些PID之间计算相互信息,并将相互信息值投射到先前估计的跨每个聚类的距离分布上。如果相对于特定聚类中的特定PID存在相当大的偏差,则PID被视为是异常的,并且在用于确定故障的评估过程中不被使用。再参照图^_4c,示出了基于PID之间的相互信息的相应的聚类(例如,聚类1-5) 的轮廓图的数据集。每个水平条对应于PID,每个相邻组的条表示沿y轴的聚类。将聚类沿 y轴分组为1-5。χ轴表示轮廓值(Silhouette value)。如之前描述的,每个水平条的长度
(-轮廓宽度)是相应的PID趋于属于其所在的聚类的测量值。因此,具有正的轮廓值
的水平条表示适当地分组的聚类,而具有负的轮廓值的聚类表示较差地分组的聚类。记得聚类中的PID是一致的。这暗示了由一个聚类中的PID指示的参数在变化方面具有类似的趋势。如果PID不是错误的,则一个参数的任何改变应当伴随着所有其它参数的类似变化。 因此,在PID中没有任何异常的情况下,PID之间的相互信息应当在历史训练数据集和测试数据集两者中具有类似的分布。测量相互信息,以表征PID之间的一致性。通过绘制每个聚类的分布密度函数和相互信息来进一步表征一致性的分布。在图5中示出了训练数据集的相应聚类的图示的示例。χ轴表示使用相互信息的相似度值,而y轴表示相应聚类的分布函数。在步骤34中,生成信息组。通过从一个聚类中随机地选择一个PID来生成信息组。 另外,可以将任何单个PID (即,不属于聚类的单个PID)添加到信息组。信息组的信息含量是用于确定每个相应的信息组内的PID的联合熵的可测量的量。信息组用于确定PID的散度,稍后将详细地加以讨论。PID的散度用于确定故障分类。在步骤35中,开始利用当前车辆测试数据集的异常和故障检测过程。首先确定异常的存在,然后确定故障分类。通过将联合概率分布应用于全部PID来表征故障。系统在故障下的状态由PID的值来描述,因此是跨所有聚类的全部PID的函数。作为用于故障分类的初步步骤,在训练阶段中确定全部PID的独立成分的联合概率分布。可以通过确定训练集PID中的独立成分的联合概率与测试集中的PID的联合概率之间的Kulback-Leibler散度(KL散度)来执行故障分类。KL散度将两个概率分布函数之间的接近性量化。在步骤36中,从当前所维修车辆检索PID数据的若干个模式。在步骤37中,识别来自当前所维修车辆的相应的测试PID。通过应用异常检测技术来分析来自当前所维修车辆的相应的PID,以检测是否存在异常。为了检测异常,确定历史数据(即,先前所维修车辆)的PID数据和当前维修车辆的测试数据之间的相互信息的分布。如果相互信息分布是类似的,则确定出PID不是异常的。类似地,如果测试数据和训练数据之间的KL散度为低,则低散度表明故障属于所建模的类。相互信息分布之间的不同表明存在异常的PID,高散度值表明故障不属于目标故障类。通过估计从当前所维修车辆观察到的PID的联合概率分布与先前所维修车辆的PID的联合概率分布之间的散度来执行故障检测。在车辆运行期间触发的指示出现可能故障的DTC的示例中,因为基于遵循预定逻辑或硬判决的诊断程序生成DTC,所以DTC的产生可能不总是指示故障的根源。然而,可以通过分析先前在训练阶段中形成的聚类中的PID来检测异常。因为PID是一致的,所以在正常条件下,一个参数的任何变化应当伴随着所有其它一致参数的类似变化。这些PID之间的距离和相互信息应当对于任何随后的故障实例保持相同。如果PID中的任何PID是异常的,则相应的PID将与其聚类中的其它PID不再保持一致,因为该PID相对于相同聚类中的其它PID的距离将不同于其先前估计的值。因此,在确定故障是否属于目标类之前首先确定在数据中是否存在异常。将所测试用于异常的PID相对于训练数据集的相关联的聚类中的其它PID的相互信息投射到训练数据集的已经计算的分布密度函数上。例如,记录当前所维修车辆的质量空气流量(MAF)传感器的PID值。将MAF传感器的PID值分组在具有12个不同的PID的聚类-1中。第一步骤是计算MAF输出PID值相对于11个其它PID值的相互信息,然后将它们中的每个进行投射,从而获得MAF聚类-1的分布函数。通过每次选择随机集的50个模式来重复该过程。图6示出了用于当前所维修车辆的所估计的分布函数与该PID相对于其它PID的相互信息的图示。在图6中示出的图示与图5中的MAF传感器图示类似,因此,散度低。测试数据图示(图6)和训练数据图示(图5)之间的相似性表明与聚类-1中的其它PID存在一致性,从而相应的PID不是异常的。必须对测试数据集中的全部PID重复这一过程。图7示出了测试数据集的所估计概率分布函数未显示出与训练数据集相似的图示的示例。这种不同表明所测试的相应的PID是异常的。因此,这种不同表明在诊断软件算法中存在错误。如上所述的异常可以包括具有错误值的PID,或者可以包括与间歇的DTC 相关联的PID,如上所述。为了确定与间歇的DTC相关联的异常,将保持在聚类的数据集中的被识别为间歇的DTC投射到训练数据集的已经计算出的分布密度函数。按照与上述相同的方式,进行比较,以确定散度为低,还是散度为高。与间歇的DTC相关联的PID和与非间歇的DTC相关联的PID之间的低散度表明了一致性,从而将相应的PID识别为是正常的,而高散度表明PID聚类是异常的。应当理解的是,概率密度图示可以包括线曲线图、条形图或散布图。在识别出异常的PID聚类之后,将它们的值与诊断软件程序中的特定值比较。设计工程师在诊断软件程序中做出改变,或者在与PID相关联的成分中进行适当的修改,使得异常值不再重新出现。在步骤38中,确定投射值中的任何值是否为高(即,基本上与训练数据集的所绘出的概率分布函数类似)。如果确定出投射值为高,则在步骤39中确定出在PID数据中不存在异常。然后,程序前进至步骤42,以确定是否更多的PID需要分析。如果在步骤38中确定出投射值为低,则在步骤40中确定出在PID数据中存在异常。在步骤41中从列表中去除含有相应的PID的所有信息组。此外,在存在异常的情况下, 可以确定出在诊断算法中存在错误。在步骤42中,确定是否更多的PID需要测试。如果更多的PID需要测试,则返回至步骤37,以开始测试另外的PID。如果没有另外的PID需要测试,则对于没有异常存在的那些PID来说,程序前进至步骤43。在步骤43中,开始故障分类技术。使用在步骤34中生成的信息组来确定测试数据和训练数据之间的散度。在测试阶段期间,相应故障的任何集的PID值应当具有它们的独立成分的相似的联合概率分布函数。因此,确定所建模故障和测试数据的联合概率分布之间的KL散度。如果确定出KL散度为低,则将故障分类为待测试的电路。如果确定出KL 散度为高,则故障不归因于待测试的电路。在步骤43中,选择不具有异常的PID且具有最高的信息含量的信息组。在步骤44 中,针对训练数据集和测试数据集之间的所选择的信息组的PID,确定KL散度。
在步骤45中,确定KL散度是否为高。图8示出了显示出高KL散度的图示。高KL 散度表明故障不在测试的电路中,技术人员应当查看其它电路以进行测试。图9示出了显示出低KL散度的图示。KL散度由χ轴表示,频率计数由y轴表示。低KL散度表明故障在测试的电路中,技术人员应当继续在该电路中测试故障。如果在步骤45中确定出KL散度为高,则在步骤46中确定出故障不属于所测试的电路。如果在步骤45中确定出KL散度为低,则在步骤47中确定出故障属于所测试的电路。在步骤48中,程序停止。应当理解的是,这里描述的实施例可以应用于对包括但不限于重型设备、航空器和宇宙飞船的系统进行维修诊断的行业。虽然已经详细地描述了本发明的某些实施例,但是本发明所属领域的普通技术人员将认识到用于实施如由随附权利要求书限定的本发明的各种替代设计和实施例。
权利要求
1.一种基于参数识别的故障隔离方法,所述方法包括步骤执行用于识别诊断故障码的诊断软件程序,所述诊断故障码用于检测当前所维修车辆的电路中的故障,所述诊断软件程序还检索与所识别出的具有所检测故障的电路有关的参数识别数据;在计算机上获取先前所维修车辆的参数识别数据,所述参数识别数据检索自所述先前所维修车辆,所述先前所维修车辆包括在与所述当前所维修车辆基本类似的运行条件下具有与所述当前所维修车辆相同的车辆规范的车辆;基于彼此的相互依赖性,将所述先前所维修车辆的所述参数识别数据分组为多个聚类;将联合概率分布确定为所述先前所维修车辆的所述参数识别数据的相互依赖性的函数;选择与来自所述先前所维修车辆的所述参数识别数据具有一致性的所述当前所维修车辆的参数识别数据;将所述当前所维修车辆的所述参数识别数据的相互依赖性投射到相应的联合概率分布上;以及响应于参数识别数据的概率分布处于预定方差之外,在所述当前所维修车辆的所述参数识别数据中检测到异常,其中,检测到的异常表示所述诊断软件程序中的错误或者相应的诊断故障码的间歇发生中的至少一者;以及修改所述诊断软件程序或者与所述相应的诊断故障码的间歇发生相关联的成分中的至少一者,以纠正所述错误。
2.根据权利要求1所述的方法,所述方法还包括步骤响应于检测到异常,去除含有导致所述概率分布处于所述预定方差之外的参数识别数据的聚类;选择所述当前所维修车辆的下一个参数识别数据;将所述当前所维修车辆的所述下一个参数识别数据的相互依赖性投射到相应的联合概率分布;以及响应于处于预定方差之外的所述下一个参数识别数据的概率分布,在所述当前所维修车辆的所述下一个参数识别数据中检测到异常。
3.根据权利要求1所述的方法,所述方法还包括步骤响应于在所述当前所维修车辆的所述参数识别数据中未检测到异常,确定故障是否与所述电路有关。
4.根据权利要求3所述的方法,其中,确定所述故障是否与所述电路有关还包括步骤 确定所述当前所维修车辆的选定的参数识别数据和所述先前所维修车辆的选定的参数识别数据之间的散度;确定所述散度是否大于预定阈值;以及响应于所述散度大于所述预定阈值,确定出所述故障在所述电路中。
5.根据权利要求4所述的方法,其中,响应于所述散度大于所述预定阈值,确定出故障隔离不是所述电路的结果。
6.根据权利要求5所述的方法,其中,使用多个信息组中的一个来确定用于识别散度的所述选定的参数识别数据,其中,利用来自每个聚类的参数识别数据来形成多个信息组,每个信息组由从每个聚类中随机地选择的参数识别数据组成。
7.根据权利要求6所述的方法,其中,从所述多个信息组选择的信息组不具有检测到的异常。
8.根据权利要求7所述的方法,其中,从所述多个信息组选择的所述信息组在所述信息组内具有最大程度的联合熵。
9.根据权利要求1所述的方法,其中,获取先前所维修车辆的参数识别数据还包括执行冗余检查,以减少所述参数识别数据中的冗余。
10.根据权利要求9所述的方法,其中,使用主成分分析方法来应用冗余检查。
全文摘要
本发明涉及改善故障代码设定和隔离故障的事件驱动的数据挖掘方法,具体地,提供了一种用于改善故障代码设定和隔离故障的基于参数识别的故障隔离技术。从当前所维修车辆检索DTC和PID。从在与当前所维修车辆基本类似的运行条件下与当前所维修车辆具有相同的车辆规范的先前所维修车辆获取PID数据。利用彼此的相互依赖性,使用先前所维修车辆的PID数据形成多个聚类。联合概率分布被确定为PID数据的相互依赖性的函数。选择与先前所维修车辆的PID具有一致性的当前所维修车辆的PID数据。将当前所维修车辆的PID数据的相互依赖性投射到相应的联合概率分布上。响应于参数识别数据的概率分布处于预定方差之外,在当前所维修车辆的PID数据中检测到异常。
文档编号G05B23/02GK102375452SQ20111022229
公开日2012年3月14日 申请日期2011年8月4日 优先权日2010年8月4日
发明者拉加古鲁 A., 鲁特雷 A., 辛赫 S. 申请人:通用汽车环球科技运作有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1