基于FP?Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法

文档序号:10687688阅读:320来源:国知局
基于FP?Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法
【专利摘要】基于FP?Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法,属于信息检索领域,技术要点是:对故障码识别和分类;根据事务数据库,通过FP?Tree算法创建故障码和更换备件对应关系的频繁项集;利用备件位置和故障所在的ECU位置之间的拓扑关系,进行拓扑搜索,遴选频繁项集;构建备件与维修工项的对应关系,形成故障码对应工项的诊断数据库;将诊断数据库与诊断知识库关联,并建立主键;效果是:可在获取故障码后,快速找到常见故障的解决方案和对应备件、工项。
【专利说明】
基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与 备件检索的方法
技术领域
[0001] 本发明属于信息检索领域,涉及一种用于车辆远程诊断与备件检索的方法
【背景技术】
[0002] 目前我国汽车维修行业已经从完全依靠检查者的感觉和实践经验进行诊断的阶 段,发展到了利用专门设备进行综合检测诊断阶段,但是在传统汽车维修行业中普遍存在 着很多问题,比如维修工人技术老化,经常无法快速、经济地利用各方面的技术力量解决故 障;随着汽车保有量的日益增多,汽车后市场各项服务如雨后春笋般大量涌现。那么从车主 角度,如何才能更好更全面的了解车况,发生故障时,如何快速获取爱车待解决方案及所需 工时及备件相关信息,精准的汽车可穿戴设备对满足车主实时需求是完全必要的。一般的 OBD车载设备,只能读取到相关车辆故障信息,不能对故障做出详细解决方案及相关维修人 工费、备件费,从而造成车主盲目进店,盲目消费。

【发明内容】

[0003] 为了解决车主车辆出现故障时,能够准确和快速匹配该故障码所对应的工项与备 件,本发明提出如下技术方案:一种基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊 断与备件检索的方法,包括
[0004] 步骤一.采集车辆信息数据;
[0005] 步骤二.对故障码识别和分类;
[0006]步骤三.解析车辆VIN码得到变量,所述变量包括由VIN码解析得到的发动机排量、 车身类型、发动机变速箱类型;
[0007] 步骤四.对变量所对应的备件代码做决策树分析,完成变量数据归类形成备件信 息,并建立索引,形成诊断知识库;
[0008] 步骤五.根据事务数据库,通过FP-Tree算法创建故障码和更换备件对应关系的频 繁项集;利用备件位置和故障所在的ECU位置之间的拓扑关系,进行拓扑搜索,遴选频繁项 集;构建备件与维修工项的对应关系,形成故障码对应工项的诊断数据库;
[0009] 步骤六.将诊断数据库与诊断知识库关联,并建立主键;
[0010]步骤七.对车辆故障生成的故障码识别,并通过关键字解析车辆VIN码得到的变量 以进行分类检索,得到工项及备件信息。
[0011]有意效果:本发明可以在获取故障码后,快速找到常见故障的解决方案和对应备 件、工项。有效解决技师和备件员的经验局限性问题,从大数据出发,获得故障的解决方案。 本发明其具有对故障码识别和分类的步骤,可以在不同车型间的故障码出现差异时,判断 其一致性;且,本发明通过频繁项集算法FP-Tree和序列模式挖掘寻找对应关系。采用两算 法融合使用,提供了能基于大数据,获知准确度高的故障码和更换备件的对应关系,适用于 除了单一故障还有多故障并行解决的可能性,远程估算车辆的故障码判断需要维修的备件 和工项,提供完整解决方案,为车辆的维修提供参考和借鉴。
【附图说明】
[0012] 图1为本发明用于车辆远程诊断与备件检索的方法的流程图;
[0013] 图2为底盘号为LFV5A14B8Y3000001的车辆的VIN号码翻译示意图;
[0014]图3为本发明实施例插入第一条故障码和备件对应关系的FP-Tree结构示意图; [0015]图4为本发明实施例插入第二条故障码和备件对应关系的FP-Tree结构示意图; [0016]图5为本发明实施例插入第三条故障码和备件对应关系的FP-Tree结构示意图; [00 17]图6为本发明实施例生成的故障码和备件对应关系的FP-Tree结构示意图;
[0018] 图7为本发明备件位置和车辆故障所在的ECU位置之间的拓扑关系图。
【具体实施方式】
[0019] 实施例1: 一种基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检 索的方法,包括
[0020] 步骤一.采集车辆信息数据;
[0021 ]步骤二.对故障码识别和分类;
[0022]步骤三.解析车辆VIN码得到变量,所述变量包括由VIN码解析得到的发动机排量、 车身类型、发动机变速箱类型;
[0023]步骤四.对变量所对应的备件代码做决策树分析,完成变量数据归类形成备件信 息,并建立索引,形成诊断知识库;
[0024] 步骤五.根据事务数据库,通过FP-Tree算法创建故障码和更换备件对应关系的频 繁项集;利用备件位置和故障所在的ECU位置之间的拓扑关系,进行拓扑搜索,遴选频繁项 集;构建备件与维修工项的对应关系,形成故障码对应工项的诊断数据库;
[0025] 步骤六.将诊断数据库与诊断知识库关联,并建立主键;
[0026] 步骤七.对车辆故障生成的故障码识别,并通过关键字解析车辆VIN码得到的变量 以进行分类检索,得到工项及备件信息。
[0027] 实施例2:具有与实施例1相同的技术方案,更为具体的,对于实施例1的步骤四来 说,
[0028] 所述步骤四中以维修备件表的历史记录为数据基础,通过决策树模型对备件做分 类,维修备件表样例如表一所不:
[0029] 表一
[0031] 决策树模型的基本原理如下:
[0032] 首先:确定每一维度备件不同分类的熵,以VIM为例,熵定义为
[0033] E = sum(_p(I)*log(p(I)))
[0034] 其中I = I:N(N类结果,如本例1种,即该备件属于此车型,故概率P( I) = I)
[0035] 则E(5) =-(1/1 )Log2( 1/1 )-(0/1 )Log2(0/l )=0+0 = 0
[0036] E(3) =-( 1/1 )Log2( 1/1 )-(0/1 )Log2(0/l )=0+0 = 0
[0037] E(4) =-( 1/1 )Log2( 1/1 )-(0/1 )Log2(0/l )=0+0 = 0
[0038] 如果熵为0,则表明区分度越高;熵为I,则表明没有区分度;
[0039] 故这三个不同的备件代码可以通过VIM做区分。
[0040]确定完每个维度如何分类后,不同维度之间的优先级别通过信息增益区分 [0041 ] Gain(SamplejAction)=E(sample)-sum(|Sample(v)|/Sample*E(Sample(v)))
[0042] 贝 IjGain(VIM) =E(S)-(1/3)*E(5)-(1/3)*E(3)-(1/3)*E(4) = 1-0 = I
[0043] Gain(VIN6) =E(S)-( 1/3)*E( I )-(2/3)*E(2) = 1-0-2/3 = 1/3
[0044] Gain(VIN78)=E(S)-(l/3)*E(4B)-(l/3)*E(8K)-(l/3)*E(4F) = 1-0 = 1
[0045] 如果信息增益越大,则表明分类优先级越高;反之,优先级越低。
[0046]所以,底盘号第4位(VIN4)和底盘号78位(VIN78)的分类优先级相同,其次是底盘 号第6位(VIN6)。
[0047] 通过以上关键步骤,可将备件代码按照底盘号第4位(VIN4)、底盘号第6位(VIN6) 和底盘号78位(VIN78)区分。
[0048] 综上所述,备件检索方法的基本步骤是:
[0049] 将维修备件表同一维度按信息熵做区分;
[0050] 将维修备件表不同维度按信息增益划分优先级;
[0051] 按照1、2步划分的优先级和区分程度画出决策树;
[0052] 输入一个规则的底盘号,系统根据¥預123、¥1财、¥預6、¥預78以及得出的决策树输 出该车型下的备件代码。
[0053] 该备件代码通过关联备件价格表,得到备件的中文名称、价格和现在使用状态以 及备件的适用车型信息。
[0054] 上述技术方案的获得,是在将不同车型、不同排量、不同发动机变速箱类型所对应 的备件代码逐一归类进行分析对比后,发现在相同主组号前提下,车型排量等信息不同,所 对应的备件代码也不尽相同,为了找寻其中规律,使用了上述方法,以形成较完备且全面的 理论知识信息库。
[0055] 实施例3:具有与实施例1或2相同的技术方案,更为具体的,对于实施例1的步骤五 来说,
[0056]所述步骤五中,根据事务数据库,通过FP-Tree算法创建故障码和更换备件对应关 系的频繁项集的步骤,包含
[0057] SI. 1输入事务数据库和最小支持度阈值min〇,扫描事务数据库,删除频数小于最 小支持度的项目,得到全部频繁项集Fl,对Fl中的频繁项按其支持度降序排列得到L;
[0058] Sl. 2创建FP-Tree的根节点,以"null"标记,再次扫描事务数据库,把事务数据库 中的每一条记录按照L中的顺序排列,生成FP-Tree;
[0059] Sl. 3从FP-Tree中找到所有的频繁模式。
[0060]所述步骤五中,利用备件位置和故障所在的ECU位置之间的拓扑关系,进行拓扑搜 索,遴选频繁项集的步骤包括:
[0061 ] S2.1根据备件码的构造规则将备件进行分类;
[0062] S2.2对备件和故障所在的ECU位置构建拓扑关系,并将所述拓扑关系进行标识,得 到备件和ECU位置的对应关系。
[0063] 所述步骤五中,构建备件与维修工项的对应关系,形成故障码对应工项的诊断数 据库的步骤包括:
[0064] S3.1扫描备件与维修工项的数据库,获得备件与维修工项的频繁项集F2;对F2中 的频繁项按其支持度降序排列得到L' ;
[0065] S3.2创建FP-Tree的根节点,以"null"标记,再次数据库,把数据库中的每一条记 录按照L'中的顺序排列,生成FP-Tree;
[0066] S3.3从FP-Tree中找到所有的频繁模式,构建备件与维修工项的对应关系。
[0067] 按照SI. 1或S3.1排序后的频繁项表为[p|P],其中p是第一个频繁项,而P是剩余的 频繁项的列表。调用insert_tree( [p |P],T),insert_tree([p |P],T)过程执行情况如下:如 果T有子节点N使Ν. item_name = p. item_name,则N的计数增加1;否则创建一个新节点Ν,将 其计数设置为1,链接到它的父节点T,并且通过node_link将其链接到具有相同名称item_ name的节点;如果P非空,递归调用insert_tree(P,N)。8、对于FP-Tree是单枝的情况,直接 输出整条路径上所有节点的组合+PostModel。
[0068] 所述的备件分别按照附件、娱乐信息,发动机,燃油、排气、空调,变速箱,前轴、转 向装置,后轴,车轮、制动器,踏板机构,车身,电子设备进行〇~9分类。
[0069] 实施例4:具有与实施例1或2或3相同的技术方案,更为具体的,对于实施例1的步 骤二来说,
[0070] 所述对故障码识别和分类的方法,包括:
[0071] 首先利用训练数据集构建朴素贝叶斯分类器,具体步骤为:
[0072] SI:对训练集中的故障码进行人工分类,人工分类后的类别集为c:
[0073] C= {ci,C2,…,Ci,…,cn};
[0074] S2:将每个类别中的故障码进行分词并计算每个词的TF-IDF权重值;
[0075]
[0076] TF1S特征词i的词频;^为特征词i在所有故障码中出现的次数,表示故障码 中所有特征词的出现次数总和;
[0077]
[0078] IDFi为特征词i的逆向文件频率;E为语料库中故障码的总数,{k:Wi e 表示包含 特征词i的故障码数;
[0079] TF-IDF权重值为:TF-IDF = TF X IDF,也就是是词频与逆向文件频率的乘积;
[0080] S3:根据TF-IDF权重值筛选出特征词并建立特征词库,将故障码e定义成若干个特 征词的集合:
[0081] e = {wi,W2,…,wn}
[0082] S4:分别计算每个类别中特征词在该类别条件下的条件概率,依据贝叶斯定理计 算出某个故障码e属于C1类故障的概率,具体公式如下:
[0083] P(Ci|e) = [P(e|ci)P(ci)]/P(e)
[0084] 其中,P(e)为从故障码空间中随机抽取一个故障码e的概率;P(C1)为一个故障码 类别C1在故障码空间所占比率;P(e Ic1)为对于给定的故障码类别(^中故障码e的出现概率;
[0085] 对于每个故障码类别而言,从故障码空间中随机抽取一个故障码的概率都是一样 的,因此P(e)可以忽略不予计算,这样公式(1)就可以写成如下形式:
[0086] P(ci I e) °cP(e I Ci)P(Ci)
[0087] 计算某个故障码在每个分类中概率,取拥有最大概率值的类别为该故障码的分类 结果,具体为:
[0088] G(e) =argmax{P(e | Ci)P(ci)} 〇
[0089] S5:构建朴素贝叶斯分类器。
[0090] 然后对新故障码进行具体分类,具体为:
[0091] 更具体的,对新故障码进行具体分类,设在类别i中的故障码为ei,同时还有个待 匹配的故障码e new,它们的分词情况如下:
[0092] ei= {W1,W2,W3,W4}
[0093] enew= {w2,W3,W5}
[0094] 步骤I:由这两组的特征词集合构成一个向量空间:
[0095]
[0096] 步骤2:结合向量空间,分别得到两个故障码的词向量值:
[0097:
[0098:
[0099] 步骤3:利用余弦相似度计算两个故障码近似情况,具体公式如下:
[0100]
[0101]步骤4:如果所计算的相似度值大于80%,则可以判断这两个故障码是相同的;如 果所计算的相似度值小于阈值,则继续与已知故障码库中的其他类别故障码进行余弦相似 度计算。
[0102] 采用以上技术方法,能够取得如下的技术效果:准确地自动分类不同车型的故障 码,将数以亿级的故障码进行收敛,实现不同车厂车型间故障问题、解决方案的探索。能节 省大量的劳动力,缩短工作周期,降低成本。
[0103] 实施例5:具有与实施例3相同的技术方案,作为实施例3的补充,还具有如下技术 方案:
[0104] 一、FP-Tree 算法
[0105]利用FP-Tree,紧缩的数据结构来存储查找频繁项集,挖掘关联规则,根据置信度、 支持度等提取出故障和备件的可能项集。
[0106]输入:事务数据库D(故障码和更换备件的连接关系)和最小支持度阈值mino;
[0107]输出:事务数据库D所对应的FP-tree。
[0108] FP-tree是按以下步骤构造的:
[0109] 1、扫描事务数据库D,获得事务数据库D中所包含的全部频繁项集Fl,及它们各自 的支持度。对Fl中的频繁项按其支持度降序排序得到L。
[0110] 2、创建FP-tree的根节点T,以"null"标记,再次扫描事务数据库D,对于事务数据 库D中每个事务,将其中的频繁项选出并按L中的次序排序。设排序后的频繁项表为[p|P], 其中P是第一个频繁项,而P是剩余的频繁项。调用insert_tree([p IP],T)。insert_tree([p |P],T)过程执行情况如下:如果T有子节点N使Ν· item_name = p. item_name,则N的计数增加 1;否则创建一个新节点N,将其计数设置为1,链接到它的父节点T,并且通过node_link将其 链接到具有相同item_name的节点。如果P非空,递归地调用insert_tree(P,N) AP-tree是 一个高度压缩的结构,它存储了用于挖掘频繁项集的全部信息。
[0111] 对于FP-Tree已经是单枝的情况,就没有必要再递归调用FPGrowth了,直接输出整 条路径上所有节点的各种组合+PostModel就可了。
[0112] 事务数据库如下,每一行代表一次故障码和更换备件的可能关系:
[0114]~~目的:找出一种总是相伴出现的组合,比如故障B和备件D总一起出现,则[故障B, 备件D]是一条频繁模式。通过FP-Tree得到一部分粗略的关系,然后通过拓扑搜索细化,剔 除不满足拓扑关系的组合。
[0115] (1)扫描数据库,每项按频数递减排序,并删除频数小于最小支持度MinSup的项 目。
[0116] 故障A :7
[0117] 故障B :8
[0118] 备件C :7
[0119] 备件D:7
[0120]
[0121] 备件F :5
[0122] 备科^
[0123] * 本次扫描{Minsup = 3}
[0124] 则故障B、备件C、备件D、故障A、备件F为频繁1项集,计为Fl。
[0125] (2)对于每一条故障码和更换备件的可能关系,按照Fl中的顺序重新排序。
[0127] (3)把第(2)步骤中得到的各条记录插入到FP-Tree中。初始后缀模式为空,最终生 成FP-Tree如图1~4所示。
[0128] 图4中最左边的一侧叫做表头项,树中相同名称的节点要链接起来,链表的第一个 元素就是表头项里的元素。如果FP-Tree为空(只含一个虚的root节点),则FP-Growth函数 返回。此时输出表头项的每一项+pos tMode 1,支持度为表头项中对应项的计数。
[0129] (4)表头项中的每一项(我们拿"故障A:7"为例),对于各项都执行以下①到⑤的操 作:
[0130] ①从FP-Tree中找到所有的"故障A"节点,向上遍历它的祖先节点,得到4条路径:

[0134]③因为每一项末尾都是故障A,可以把故障A去掉,得到条件模式基(Conditional Pattern Base,CPB),此时的后缀模式是:(故障A)。
[0136] ④把上面的结果当作原始的事务数据库,返回到第3步,递归迭代运行。
[0137] ⑤最终得到的频繁项集为(去除只有备件或者只有故障的关系集)
[0140] 二、拓扑搜索
[0141] 对关联算法得出的故障和备件(项目)的可能项集进行进一步收缩,利用车辆构 造,限制备件位置和车辆故障所在的ECU位置之间的拓扑关系,在有限范围内遴选频繁项 集。
[0142] 根据备件码的构造规则,进行备件分类,具体如下:
[0143] 1(发动机):发动机总成、缸体、缸盖、活塞、连杆、连接部件、发动机托架、支架急紧 固件,燃油喷射如进气管、空气流量计等;
[0144] 2(燃油、排气、空调冷却):燃油箱、排气管、空调制冷系统等;
[0145] 3(变速箱):变速箱总成及内部部件;
[0146] 4(前轴、转向装置):前轮驱动差速器、转向系统(转向机)、前减震器等;
[0147] 5(后轴):后轴、后轮驱动差速器,后减震器,如后桥、后轮轴承等;
[0148] 6(车轮、制动器):车轮、车轮装饰盖、刹车系统;
[0149] 7(踏板机构):手脚制动系统;
[0150] 8(车身):车身及装饰件,空调壳体,前后保险杠,如车身总成、空调通风系统等;
[0151] 9 (电子设备):电器,如发动机、起动机、控制器、灯具、线束等;
[0152] 0(附件、信息娱乐):附件(千斤顶,天线,收音机,发动机底护板)及油漆材料等。
[0153] 采用FP-Free频繁项集算法构建备件与维修项目(工项)之间的对应关系,从而获 得故障码对应备件和工项的完整解决方案。
[0154] 2、备件号码分类对应车辆ECU名称拓扑关系







[0165] 通过上述方法结合找到故障与备件的对应关系,获得故障码对应备件和工项的完 整解决方案。
[0166] 以上所述,仅为本发明创造较佳的【具体实施方式】,但本发明创造的保护范围并不 局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明 创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之 内。
【主权项】
1. 一种基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法, 其特征在于,包括 步骤一.采集车辆信息数据; 步骤二.对故障码识别和分类; 步骤三.解析车辆VIN码得到变量,所述变量包括由VIN码解析得到的发动机排量、车身 类型、发动机变速箱类型; 步骤四.对变量所对应的备件代码做决策树分析,完成变量数据归类形成备件信息,并 建立索引,形成诊断知识库; 步骤五.根据事务数据库,通过FP-Tree算法创建故障码和更换备件对应关系的频繁项 集;利用备件位置和故障所在的ECU位置之间的拓扑关系,进行拓扑搜索,遴选频繁项集;构 建备件与维修工项的对应关系,形成故障码对应工项的诊断数据库; 步骤六.将诊断数据库与诊断知识库关联,并建立主键; 步骤七.对车辆故障生成的故障码识别,并通过关键字解析车辆VIN码得到的变量以进 行分类检索,得到工项及备件信息。2. 如权利要求1所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备 件检索的方法,其特征在于,所述步骤四中以维修备件表的历史记录为数据基础,通过决策 树模型对备件做分类; 备件检索方法的步骤是: (1) 将维修备件表同一维度按信息熵做区分; (2) 将维修备件表不同维度按信息增益划分优先级; (3) 按照步骤(1)、(2)划分的优先级和区分程度画出决策树; (4) 输入一个规则的VIN码,根据VIN码以及得出的决策树输出该车型下的备件代码。3. 如权利要求2所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备 件检索的方法,其特征在于,所述备件代码关联备件的价格表,所述备件信息包括备件的中 文名称、价格和现在使用状态以及备件的适用车型信息。4. 如权利要求1所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备 件检索的方法,其特征在于,所述步骤五中,根据事务数据库,通过FP-Tree算法创建故障码 和更换备件对应关系的频繁项集的步骤,包含 SI. 1输入事务数据库和最小支持度阈值η?ησ,扫描事务数据库,删除频数小于最小支 持度的项目,得到全部频繁项集F1,对F1中的频繁项按其支持度降序排列得到L; S1.2创建FP-Tree的根节点,以"nulΓ标记,再次扫描事务数据库,把事务数据库中的 每一条记录按照L中的顺序排列,生成FP-Tree; S1.3从FP-Tree中找到所有的频繁模式。5. 如权利要求1所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备 件检索的方法,其特征在于,所述步骤五中,利用备件位置和故障所在的ECU位置之间的拓 扑关系,进行拓扑搜索,遴选频繁项集的步骤包括: S2.1根据备件码的构造规则将备件进行分类; S2.2对备件和故障所在的ECU位置构建拓扑关系,并将所述拓扑关系进行标识,得到备 件和ECU位置的对应关系。6. 如权利要求1所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备 件检索的方法,其特征在于,所述步骤五中,构建备件与维修工项的对应关系,形成故障码 对应工项的诊断数据库的步骤包括: S3.1扫描备件与维修工项的数据库,获得备件与维修工项的频繁项集F2;对F2中的频 繁项按其支持度降序排列得到L' ; S3.2创建FP-Tree的根节点,以"nulΓ标记,再次数据库,把数据库中的每一条记录按 照L'中的顺序排列,生成FP-Tree; S3.3从FP-Tree中找到所有的频繁模式,构建备件与维修工项的对应关系。7. 如权利要求4或5或6所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊 断与备件检索的方法,其特征在于,按照S1.1或S3.1排序后的频繁项表为[p|P],其中p是第 一个频繁项,而P是剩余的频繁项的列表,调用insert_tree([p |p],T),insert_tree([p P],T)过程执行情况如下:如果T有子节点N使N. item_name = p. item_name,贝ijN的计数增加 1;否则创建一个新节点N,将其计数设置为1,链接到它的父节点T,并且通过node_link将其 链接到具有相同名称item_name的节点;如果P非空,递归调用insert_tree(P,N)。8. 如权利要求1所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备 件检索的方法,其特征在于,所述对故障码识别和分类的方法,包括: 首先利用训练数据集构建朴素贝叶斯分类器; 然后对新故障码进行具体分类; 构建朴素贝叶斯分类器的步骤为: S1:对训练集中的故障码进行人工分类; S2:将每个类别中的故障码进行分词并计算每个词的TF-IDF权重值; S3:根据TF-IDF权重值筛选出特征词并建立特征词库; S4:分别计算每个类别中特征词在该类别条件下的条件概率; S5:构建朴素贝叶斯分类器。9. 如权利要求8所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备 件检索的方法,其特征在于,步骤S2中的为特征词i的词频;Wi为特征词i在 所有故障码中出现的次数,表示故障码中所有特征词的出现次数总和;为特征词i的逆向文件频率;Ε为语料 库中故障码的总数,表示包含特征词i的故障码数; 步骤S2中的TF-IDF权重值为: TF-IDF = TFXIDF TF-IDF权重值是词频与逆向文件频率的乘积。10. 如权利要求8所述的基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备 件检索的方法,其特征在于,对新故障码进行具体分类,设在类别i中的故障码为 ei,同时还 有个待匹配的故障码enew: 步骤1:由这两组的特征词集合构成一个向量空间: 步骤2:结合向量空间,分别得到两个故障码的词向量值: 步骤3:利用余弦相似度计算两个故障码近似情况; 步骤4:如果所计算的相似度值大于阈值,则可以判断这两个故障码是相同的;如果所 计算的相似度值小于阈值,则继续与已知故障码库中的其他类别故障码进行余弦相似度计 算;步骤S3中判断两个故障码近似情况,具体公式如下:
【文档编号】G06Q10/00GK106056221SQ201610363507
【公开日】2016年10月26日
【申请日】2016年5月27日
【发明人】田雨农, 刘亮
【申请人】大连楼兰科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1