基于维修决策树/词向量的故障远程诊断系统和方法

文档序号:10686942阅读:251来源:国知局
基于维修决策树/词向量的故障远程诊断系统和方法
【专利摘要】本发明涉及故障远程诊断技术领域,尤其涉及基于维修决策树/词向量的故障远程诊断系统和方法。本发明的一种故障远程诊断方法,包括:创建语言模型,建立细胞词库;在所述细胞词库中切词检索细胞词,并排列所述细胞词;利用决策树模型的决策分类,给出维修解决方案。本发明的有益效果为:可以远程并快速地识别设备的故障,准确的给出有效维修解决方案。检测标准统一,避免由于人工判断带来的误差。并且节省了大量人力物力。
【专利说明】
基于维修决策树/词向量的故障远程诊断系统和方法
技术领域
[0001] 本发明涉及故障远程诊断技术领域,尤其涉及基于维修决策树/词向量的故障远 程诊断系统和方法。
【背景技术】
[0002] 传统的设备维修行业的故障诊断使用的是"望、闻、问、切"的经验方式。
[0003] 通常的诊断流程是:
[0004] 1.设备故障灯亮起或用户感觉到设备有问题,比如有异响、有异味、抖动等,8卩"发 现问题进店"。
[0005] 2.在维修点通过专业的故障诊断仪检测出故障码和故障描述,8卩"检测问题"。
[0006] 3.维修技师通过看故障码和故障描述,结合多年的维修经验,进行现场诊断并提 出解决方案,即"解决方案判断"。
[0007] 4.备件人员开单给出具体备件号、备件名称和备件价格,8卩"备件开单"。
[0008] 5.服务顾问开单给出工项号、工项名称、工时和工时费,8卩"工项开单"。
[0009] 在现有技术下,用户要针对设备故障进行诊断很多时候需要凭借自身经验发现问 题。在确认确实存在需要通过维修解决的问题后,用户需要将设备运送到维修点去检测故 障,费时费力。故障检测时,维修技师结合自身经验得出维修方案,并且给出备件号、备件名 称和备件价格,这个过程主观性很强,缺乏统一标准。然后再由被检人员和服务顾问分别给 出不同单据,费时费力。

【发明内容】

[0010] 本发明的目的在于克服现有技术的不足,提供一种故障诊断方法,构建一个从故 障描述到词向量分解,建立维修细胞词库;通过故障描述在细胞词库的切词检索,依据细胞 词权重建立的句法规则,实现从决策过程到决策建议再到维修解决方案的维修决策树,最 终实现故障远程诊断,并对工时费和备件费进行估价。
[0011] 本发明解决其技术问题是采取以下技术方案实现的:
[0012] -种故障远程诊断方法,包括:S1.创建语言模型,建立细胞词库;S2.在所述细胞 词库中切词检索细胞词,并排列所述细胞词;S3.利用决策树模型的决策分类,给出维修解 决方案。
[0013] 优选方式下,所述S1包含步骤:S1.1采集专业故障描述语言;S1.2对所述专业故障 描述语言进行词向量分解。所述语言模型的创建基于第n个所述细胞词的出现只与前面n-1 个所述细胞词相关的假设;所述一故障描述语句T出现权重的计算公式为:
[0014] P(T) =P(W1,W2,W3, ??? ,Wn)
[0015] =P(Wl) XP(W2 I Wl) XP(W3 I Wl,W2) X …XP(Wn| Wl,W2,…,Wn-1)
[0016] ~P(Wl) XP(W2 I Wl) XP(W3 I W2)…P(Wn I Wn-1);
[0017]其中,P⑴为所述故障描述语句T的权重,P(Wn IW1,W2,…,H)为第n个词向量的权 重。
[0018] 进一步地,所述S2包含步骤:S2.1针对所述一故障描述语句T在所述细胞词库中进 行切词检索;S2.2若检索到所述细胞词,计算所述细胞词的权重;S2.3按照所述细胞词权重 的大小排列所述细胞词。所述步骤S3包含:S3.1结合元器件测量值给出维修解决方案。
[0019] 更进一步地,所述S2包含步骤:S2.4若没有检索到所述细胞词,则将此次未检索到 的所述细胞词存入新增细胞词库。
[0020] 更进一步地,所述S2.2步骤中所述细胞词权重的计算方法为:S2.2.1计算每个所 述细胞词的卡方统计量;S2.2.2取所述卡方统计量分值最高的第i个细胞词,计算所述第i 个细胞词在第j个故障描述中出现的次数。所述S2.2.1步骤所述卡方统计量分值的计算方 法为:
[0021 ] weight = round( 10 X(l+lg(tfij))/(l+lg(lj)));
[0022]其中tfij为第i个细胞词在第j个故障描述中出现的次数,lj为第j个故障描述的长 度。
[0023] 本发明还保护一种用于如权利要求1-8中任一权利要求所述的方法的故障远程诊 断系统,包括:故障信息接收单元,用于接收所述一故障描述语句T;故障信息分析单元,用 于在所述细胞词库中切词检索所述细胞词,并排列所述细胞词;故障信息解决单元,用于通 过决策树模型的决策分类,给出维修解决方案。
[0024] 进一步地,所述故障信息分析单元包含故障描述语句分解单元,检索单元,计算单 元以及排列单元;
[0025] 所述语句分解单元用于对所述一故障描述语句T在所述细胞词库中进行切词;
[0026] 所述检索单元用于在所述细胞词库中检索;
[0027] 所述计算单元用于计算每个所述细胞词的权重;
[0028] 所述排列单元用于按所述句法规则排列所述细胞词。
[0029] 本发明的优点和积极效果是:可以远程并快速地识别设备的故障,准确的给出有 效维修解决方案。检测标准统一,避免由于人工判断带来的误差。并且节省了大量人力物 力。
【附图说明】
[0030] 图1为本发明的构建句法规则图;
[0031] 图2为决策树分析法分类模型1;
[0032]图3为决策树分析法分类模型2。
【具体实施方式】
[0033]下面结合附图、通过具体实施例对本发明作进一步详述。以下实施例只是描述性 的,不是限定性的,不能以此限定本发明的保护范围。
[0034]本发明通过将自然语言数字化达成将自然语言理解的问题转化为机器自学习的 问题。
[0035] (1)构建基础语料库
[0036]创建基础语料库的方法为给定一个字符串,它的自然语言的概率是P(wl,w2, w3, ???,wn),wl到wn依次是这句话的各个细胞词。
[0037] 模型基于这样一种假设,第n个词的出现只与前面n-1个词相关,而与其它任何词 都不相关,整句的概率就是各个分词出现概率的乘积。
[0038] 对于一个故障描述T,它的概率计算公式为:
[0039] P(T) =P(wi,W2,W3, ,Wn)
[0040] =P(W1) XP(W2 I Wl) XP(W3 I W1,W2) X …XP(Wn| W1,W2,…,Wn-1)
[0041 ]~P(W1) XP(W2 I Wl) XP(W3 I W2)…P(Wn I Wn-1)
[0042] (2)词向量分解:词向量为切分成若干个细胞词后的语句。每个故障描述T都可表 示成n维的词向量,T=(W1,W2, . . .,wn),其中wi到wn为各个词向量中包含的各个细胞词。 [0043]以汽车故障为例:
[0045] 以词向量表示上述故障描述语句,上述故障描述语句可以用词向量(wi,W2,w3,…, Wn)。其中,W1为凸轮轴,W2为位置,W3为气缸,W4为正时,W5为过度。选取各个细胞词作为特征 项,其中Wi表示第i个特征项。
[0046] 算出各个细胞词的卡方统计量,然后在训练集中取分值最高的第i个细胞词作为 代表词,从而找出与词向量(¥1,'\¥2,'?3,一,'?〇相关性最小的细胞词。
[0047] Wi的权重的计算公式为:
[0048] weight = round( (10 X (l+lg(tfij))/(l+lg(lj))),3);
[0049] 其中tfij为第i个词向量在第j个故障描述中出现的次数,lj为第j个故障描述的长 度。Round函数四舍五入到指定的小数位,在上式中为小数点后第三位。
[0050] 计算权重之后的故障描述词向量的特征表述为:
[0052] 实施例1
[0053] (1)检索排列细胞词:
[0054] 如图1所示,当用户输入故障描述T后,首先对故障描述T进行词向量分解将完整语 句切分成多个细胞词的组合。然后针对各个细胞词,在细胞词库中进行切词检索。如果检索 到了,则计算该细胞词的权重;如果没有检索到,则将此次未检索到的细胞词存入新增行业 细胞词库,再针对剩余细胞词进行检索,计算其概率。
[0055] 根据在细胞词库中检索到的各个细胞词并计算权重,按照权重从大到小排列细胞 。
[0056] (2)分析结果:
[0057]以汽车故障为例:
[0059]在细胞词库中检索到的各个细胞词并计算权重,按照权重从大到小排列细胞词:
[0061] 使用判别分析法:
[0062] 故障描述T的词向量序列为T=(wl,w2,w3, . . .,wn),故障描述T中每个细胞词计算 权重后的序列为3=(81,82, 83,...,811)。词向量分类匹配最大概率的计算公式为:¥ = argmaxP(S|T)〇
[0063] 按照词向量分类匹配最大概率从高到低排列的句法规则进行分级:
[0065] (4)决策树分析
[0066] 根据上述句法规则针对细胞词分级的结果建立决策树。
[0067] 分类模型1
[0068] 如图2所示,凸轮轴为一级,位置、转换、调节为二级,传感器、促动器、响应、正时、 排气为三级。相对应的解决方案分别是:传感器对应凸轮轴位置传感器、发动机线束和发动 机控制单元,促动器对应发动机线束、发动机控制单元和凸轮轴调节器,正时对应发动机线 束、发动机控制单元、凸轮轴调节器、凸轮轴张紧器和正时链条,以此类推。粗箭头指向的解 决方案表示需要更换此配件的概率远大于更换其他细箭头指向的配件的概率,此概率为根 据大量维修数据而预先设定入决策树模型中的。因此,通过对故障描述"凸轮轴位置(气缸 列2)-正时过度超前"进行词向量分解并在细胞词库中进行检索,得到凸轮轴、位置和正时 三个细胞词,经计算细胞词权重并根据句法规则对细胞词进行排列得出凸轮轴位于一级, 位置位于二级,正时位于三级。经过决策树模型的决策分类,得出最有可能的维修解决方案 为更换或维修凸轮轴张紧器。
[0069] 分类模型2
[0070] 如图3所示,对故障描述语句"凸轮轴位置传感器= > 传感器不可信信号"进行词向 量分解并在细胞词库中检索,得到凸轮轴、位置、传感器三个细胞词。针对三个细胞词计算 细胞词权重并根据句法规则对细胞词进行排列得出凸轮轴位于一级,位置位于二级,传感 器位于三级。再结合元器件测量值,判断需要更换的配件。首先检查电线插头有无接触不 良,针头弯曲。如果是,则需要更换电线插头。如果否,则进入下一级决策树,检查凸轮轴传 感器电压供应是否在4.5-5.5V之间。如果是则检查发动机控制单元的信号电压,是否在 4.5-5.5V之间。如果否则需要更换发动机线束。以此类推,经过决策树模型的决策分类结合 元器件测量值,给出维修解决方案。
【主权项】
1. 一种故障远程诊断方法,其特征在于,包括:51. 创建语言模型,建立细胞词库;52. 在所述细胞词库中切词检索细胞词,并排列所述细胞词;53. 利用决策树模型的决策分类,给出维修解决方案。2. 根据权利要求1所述的一种故障远程诊断方法,其特征在于,所述S1包含步骤: S1.1采集专业故障描述语言; S1.2对所述专业故障描述语言进行词向量分解。3. 根据权利要求1或2所述的一种故障远程诊断方法,其特征在于:所述语言模型的创 建基于第η个所述细胞词的出现只与前面n-1个所述细胞词相关的假设;所述一故障描述语 句T出现权重的计算公式为: P(T)=P(wi,W2,W3,··· ,Wn) = P(W1) XP(W2 I Wl) XP(W3 I W1,W2) X …XP(Wn I W1,W2,…,Wn-1) ~P(W1) XP(W2 I Wl) XP(W3 I W2)…P(Wn| Wn-1); 其中,P ( T )为所述故障描述语句T的权重,P ( Wn I Wl,W2,···,Wn-1 )为第n个所述细胞词的权 重。4. 根据权利要求1所述的一种故障远程诊断方法,其特征在于,所述S2包含步骤: S2.1针对所述一故障描述语句T在所述细胞词库中进行切词检索; S2.2若检索到所述细胞词,计算所述细胞词的权重; S2.3按照所述细胞词权重的大小排列所述细胞词。5. 根据权利要求4所述的一种故障远程诊断方法,其特征在于,所述S2包含步骤: S2.4若没有检索到所述细胞词,则将此次未检索到的所述细胞词存入新增细胞词库。6. 根据权利要求4所述的一种故障远程诊断方法,其特征在于,所述S2.2步骤中所述细 胞词权重的计算方法为: S2.2.1计算每个所述细胞词的卡方统计量; S2.2.2取所述卡方统计量分值最高的第i个细胞词,计算所述第i个细胞词在第j个故 障描述中出现的次数。7. 根据权利要求6所述的一种故障远程诊断方法,其特征在于,所述S2.2.1步骤所述卡 方统计量分值的计算方法为: weight = round( (10 X (l+lg(tfij))/(l+lg( lj))) ,η); 其中tfij为第i个细胞词在第j个故障描述中出现的次数,lj为第j个故障描述的长度,η 为3-6的整数。8. 根据权利要求1所述的一种故障远程诊断方法,其特征在于,所述步骤S3包含: S3.1结合元器件测量值给出维修解决方案。9. 一种用于如权利要求1-8中任一权利要求所述的方法的故障远程诊断系统,其特征 在于,包括: 故障信息接收单元,用于接收所述一故障描述语句Τ; 故障信息分析单元,用于在所述细胞词库中切词检索所述细胞词,并排列所述细胞词; 故障信息解决单元,用于通过决策树模型的决策分类,给出维修解决方案。10. 根据权利要求9所述的一种故障远程诊断系统,其特征在于:所述故障信息分析单 元包含故障描述语句分解单元,检索单元,计算单元以及排列单元; 所述语句分解单元用于对所述一故障描述语句T在所述细胞词库中进行切词; 所述检索单元用于在所述细胞词库中检索; 所述计算单元用于计算每个所述细胞词的权重; 所述排列单元用于按所述句法规则排列所述细胞词。
【文档编号】G06F11/22GK106055439SQ201610364254
【公开日】2016年10月26日
【申请日】2016年5月27日
【发明人】田雨农, 张祥
【申请人】大连楼兰科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1