车辆诊断记录映射的制作方法

文档序号:6082861阅读:282来源:国知局
专利名称:车辆诊断记录映射的制作方法
背景技术
本公开一般涉及车辆诊断记录映射,并且特别涉及一种映射半结构化车辆诊断记录到结构化目标记录的方法,所述结构化记录可以用来协助车辆的诊断。
许多汽车修理厂,包括汽车代理商(dealership)和独立的修理厂,拥有为车辆诊断和维修所保存的某一形式的计算机化记录。包含用来解释车辆被带来进行维修的原因的数据的记录、所得到的诊断和为了给车辆进行维修所采取的行动(action)通常被输入到计算机系统中。此信息可以被用来在客户发票上打印详细的维修信息,也可以使维修技术人员察看一个特定车辆的详细维修记录。此外,所述维修记录信息也可以被修理厂内其他在别的车辆上进行相似维修的维修技术人员使用。在很多情况下,在收集可重复使用的数据和使数据输入对维修技术人员来说尽可能容易之间存在一个平衡。为了收集可重复使用的数据,计算机系统可以迫使维修技术人员输入或从菜单中选择特定项来描述车辆、征兆(symptom)和采取的行动。此数据可以随后以结构化目标记录的格式被保存在车辆诊断信息的数据库中。然而,维修技术人员可能更喜欢输入自由文本数据。用这种方式,所述维修技术人员可以描述他所看到的问题,并且不必担心试图使用预定义词汇来使每条信息适合于特定的类别。文本挖掘软件可以被用于在一个自由文本文档中寻找特定词汇和短语,并且基于搜索的结果来执行特定的行动。包括特定的词汇和短语的规则可以被预先定义,并且文本挖掘软件能够被指导去基于上下文在一个词汇的若干意思中进行选择。可选地,所述将自由文本数据转换成结构化目标记录格式的处理可以由熟悉车辆诊断和标准词汇的专家进行。
这两种方法都有缺陷。例如,由于维修技术人员可能找不到一个恰好符合他所获得的信息的种类,所以迫使使用-个受控的词汇和仅仅在结构化属性中的数据输入可能导致丢失诊断过程中有价值的观察。此外,计算机系统可能需要频繁地升级以说明新的车辆样式和新的维修趋势。由于数据输入可能很难并且太结构化,所以维修技术人员可能根本就不能将数据输入到系统中,或者维修技术人员可能输入了不完整或不精确的数据。利用文本挖掘工具从自由文本数据中提取信息可使分组和重新使用数据变得困难,因为缺少能够基于其进行搜索和分组的标准术语。此外,依靠所述维修技术人员输入数据,不同的信息分类可以被输入,这又使得合并不同记录中的数据变得困难。当来自多于一个修理设备的记录被包含在结构化维修记录的数据库中时,这些不一致和不完整数据的问题可能会被扩大。
发明简述本发明的一个方面是一种用于车辆诊断记录映射的方法。在一个示例性的实施例中,所述方法包括接收一个车辆维修记录。响应于接收所述车辆维修记录来生成一个目标记录。所述目标记录包括一个目标记录号属性、一组车辆描述属性、一组簿记(bookkeeping)属性、一组系统属性、一组征兆属性和一组行动属性。响应于在所述车辆维修记录中对所述车辆描述数据的定位,将该车辆描述数据映射到所述组的车辆描述属性。响应于在所述车辆维修记录中对所述簿记数据的定位,将该簿记数据映射到所述组的簿记属性。响应于在所述车辆维修记录中对所述系统数据的定位,将该车辆系统数据映射到所述组的系统属性。响应于在所述车辆维修记录中对所述征兆数据的定位,将该征兆数据映射到所述组的征兆属性。响应于在所述车辆维修记录中对所述行动数据的定位,将该行动数据映射到所述组的行动属性。
在另一个方面,一种用于车辆诊断记录映射的系统包括一个网络和一个与所述网络通信的主机系统。所述主机系统包括应用软件以执行一种用于接收一个车辆维修记录的方法。响应于接收所述车辆维修记录来生成一个目标记录。所述目标记录包括一个目标记录号属性、一组车辆描述属性、一组簿记属性、一组系统属性、一组征兆属性和一组行动属性。响应于在所述车辆维修记录中对所述车辆描述数据的定位,将车辆描述数据映射到所述组的车辆描述属性。响应于在所述车辆维修记录中对所述簿记数据的定位,将簿记数据映射到所述组的簿记属性。响应于在所述车辆维修记录中对所述系统数据的定位,将车辆系统数据映射到所述组的系统属性。响应于在所述车辆维修记录中对所述征兆数据的定位,将征兆数据映射到所述组的征兆属性。响应于在所述车辆维修记录中对所述行动数据的定位,将行动数据映射到所述组的行动属性。
在又一个方面,一种用于车辆诊断记录映射的计算机程序产品包括一个处理电路可读的存储介质和由所述处理电路执行的存储指令,以用于执行一种包括接收一个车辆维修记录的方法。响应于接收所述车辆诊断记录来生成一个目标记录。所述目标记录包括一个目标记录号属性、一组车辆描述属性、一组簿记属性、一组系统属性、一组征兆属性和一组行动属性。响应于在所述车辆维修记录中对所述车辆描述数据的定位,将车辆描述数据映射到所述组的车辆描述属性。响应于在所述车辆维修记录中对所述簿记数据的定位,将簿记数据映射到所述组的簿记属性。响应于在所述车辆维修记录中对所述系统数据的定位,将车辆系统数据映射到所述组的系统属性。响应于在所述车辆维修记录中对所述征兆数据的定位,将征兆数据映射到所述组的征兆属性。响应于在所述车辆维修记录中对所述行动数据的定位,将行动数据映射到所述组的行动属性。
附图简述参考示例性的附图,其中相同的单元在几个图中采用相同的编号

图1是用于进行车辆诊断记录映射的示例性系统的框图;图2是示例性目标记录格式;图3是一个示例性车辆诊断记录映射过程的流程图;图4是来自于技术帮助中心(TAC)的示例性半结构化的车辆维修记录;以及图5是一个示例性目标记录,所述目标记录是利用本发明的一个示例性实施例来映射图4中描述的所述半结构化车辆维修记录的结果。
发明详述提出了一种车辆诊断记录映射的方法。由本发明一个示例性实施例创建的目标记录可被技师用于协助车辆故障的诊断。具有定义的结构(例如结构化记录)的目标记录从问题-解决记录来生成,所述问题-解决记录由技师保存以记录他们的工作。这些问题-解决记录通常是非结构化或者半结构化的记录(例如自由文本或者用一些关键短语索引的自由文本)。本发明的一个示例性实施例包括一个映射过程,该映射过程将非结构化或半结构化记录映射到一个可以被本领域技师访问的结构化目标记录的数据库。非结构化或半结构化数据可能包括诸如技术帮助中心(TAC)电话日志、技师反馈记录(即由评价现有的结构化记录的质量的技师所作的反馈)之类的项和保修信息记录。一组映射规则被用于确定非结构化或半结构化记录将怎样填入结构化目标记录的属性中。所述映射规则可以从文本中截取并推断诊断知识。如果一个本体(ontology)是可以获得的,所述规则就可以由所述本体和结构化记录的结构所指导。本发明的一个实施例特指一个车辆诊断辅助应用。同样地,映射规则包括发展它的维修专家的专业技术知识。映射的结果可能需要被人类专家核实,但是本发明的一个实施例提供了比纯手工方法在速度和一致性上的显著改善。
在图1总体示出了一个用于执行车辆诊断记录映射的示例性系统的框图。所述系统包括一个或多个用户系统102,通过该用户系统,在一个或多个地理位置的用户可以联系主机系统104以初始化映射过程的执行,以核实映射过程的结果并且如果需要的话编辑映射过程的结果。在一个示例性的实施例中,主机系统104执行车辆诊断记录映射应用程序,并且用户系统102通过网络106连接到主机系统104上。每一个用户系统102可以利用一个通用计算机来实现,所述通用计算机执行一个计算机程序,以实现一个在此所述的过程。用户系统102可以是一台个人计算机(例如膝上型电脑、个人数字助理)或者一个连接到主机上的终端。如果用户系统102是一台个人计算机,那么此处所述的处理可被用户系统102和主机系统104(例如,通过向用户系统102提供一个小程序(applet))分担。
网络106可以是任何类型的已知网络,包括但不限于广域网(WAN)、局域网(LAN)、全球网(例如因特网)、虚拟专用网(VPN)和企业网。网络106可以使用无线网络或任何类型的本领域已知的物理网络设备来实现。用户系统102可以通过多种网络(例如企业网和因特网)连接到主机系统,使得用户系统102不必全部通过相同的网络连接到主机系统104。一个或多个用户系统102和主机系统104可以通过无线的方式连接到网络106上。在一个示例性实施例中,用户系统102被直接(即不通过网络106)连接到主机系统104上,所述主机系统执行车辆诊断记录映射软件。
存储设备108可以利用多种用来存储电子信息的设备来实现。可以理解,存储设备108可以利用在主机系统104中包含的存储器来实现,或者它可以是一个独立的物理设备。作为在包括网络106的分布式环境中统一的数据资源,存储设备108是逻辑可寻址的。根据应用程序和访问需求,所述物理数据可以被定位在多个地理位置。在存储设备108中存储的信息可以通过主机系统104被检索和处理。存储设备108包括一个目标记录的数据库和一个或多个非结构化或半结构化维修记录的数据库。所述存储设备108也可以包括其他类型的数据,例如关于维修记录到目标记录的映射的信息(例如用户标识符、日期和映射时间)。在一个示例性实施例中,主机系统104作为数据库服务器工作,并且调整对包括在存储设备108中存储的数据的应用数据的访问。
图1中描述的所述主机系统104可以利用一个或多个服务器来实现,所述服务器响应于存储在可由服务器访问的存储介质中的计算机程序而工作。主机系统104可以作为网络服务器(例如万维网服务器)工作,以与用户系统102相通信。所述主机系统104处理向所述用户系统102发送信息和从所述用户系统102接收信息,并且能够执行相关任务。所述主机系统104也可以包括一个防火墙,以防止对主机系统104的未授权的访问并且加强对授权访问的任何限制。例如,管理员可以访问整个系统并且拥有改变系统的部分的权限。防火墙可以使用如现有技术已知的传统的硬件和/或软件来实现。
主机系统104也可以作为应用程序服务器工作。主机系统104执行一个或多个计算机程序以执行车辆诊断记录映射功能。所述车辆诊断记录映射软件包括可由商业产品提供的文本挖掘功能。在本发明的一个示例性实施例中,一个商用文本挖掘软件工具被以无缝的方式与由车辆诊断记录映射软件提供的其余功能集成。处理可以通过提供应用程序(例如java小程序)给用户系统102而被用户系统102和主机系统104分担。可选地,所述用户系统102可以包括一个为了执行此处描述的处理的一部分或全部的独立软件应用程序。如前所述,可以理解的是可以使用分开的服务器来实现网络服务器功能和应用服务器功能。可选地,网络服务器、防火墙和应用服务器可以通过一个单个服务器实现,所述单个服务器执行计算机程序以完成所需的功能。
图2是一个示例性的目标记录格式。所述示例性目标记录格式包括一个目标记录号属性210。在目标记录格式中还包括一组车辆描述属性220。如图2中描述的,车辆描述属性220包括VIN(车辆标识号);VEH年份(车辆年份);VEH生产线(line)(车辆生产线,例如平台),用于小车和S/T卡车(2WD和4WD小型卡车和运动用途车辆);VIN样式(例如名称);VIN制造(例如分部(Division));VIN系列(series)(例如限制的、定制的);VIN车体(例如两门轿车、四门通用车辆);VIN发动机(编码排量、配置和燃油系统;例如4.0公升V8顺序式燃油喷射、1.8公升直列4缸顺序式燃油喷射);VIN年份(车辆年份代码);VIN工厂(生产车辆的工厂);VIN序列(车辆的序列号);以及英里里程。
图2中描述的目标记录格式还包括一组簿记属性230。所述簿记属性230包括关于谁输入维修记录数据和结构化记录的状态的信息。所述簿记属性230包括写作(AUTHORED)日期;编辑日期;作者/编辑者;公告(BULLETIN)(与结构记录相关的公告);记录号(用于生成此结构化记录的源记录的序列号);目标记录状态(例如目标记录是发布的还是未发布的);发布授权者(authorizer);以及语言(例如英语、德语)。一个示例性的目标记录格式还包括一组系统属性240。所述系统属性240包括关于在目标记录格式中描述的维修的分类的信息。所述系统属性240包括维修种类类型(可应用的维修手工区(manual section),例如变速器(transmission));维修种类(可应用的维修手工子区,例如自动、手工);以及维修子种类(识别维修种类的附加描述,例如发动机或变速器号,比如4T65-E,4L80-E,NV3500,ZF56-650)。
在图2中还描述一组征兆属性250。在图2中的第一个征兆属性250是主征兆组。所述主征兆组属性包括维修技术人员的征兆分类(例如漏气、异常运行、与液体有关、指示器失灵、指示器开、失灵、噪声、气味、不想要的运行或振动)。所述征兆组属性可以包括更具体反映征兆(例如气囊指示器开、发动机燃烧发出气味)的数据。附加的征兆属性250包括征兆(征兆或用户的抱怨);征兆细节(加入到征兆描述中,例如如果征兆是噪声,那么征兆细节可能描述噪声的类型);功能部件/系统(车辆的哪个部分正经历/引起由主征兆组描述的情形);功能部件/系统细节(关于功能部件/系统的附加信息);频度(frequency)(问题被观察到或经历的频度;例如间歇、瞬间);环境状况(描述在征兆被观察时的环境状况;例如下雨、华氏95度);以及车辆状况(描述在征兆被观察时车辆的运行状况;例如刚刚启动后、在负荷下)。另外的征兆属性250可以包括车辆区域(zone)(加入到已经提供的有关征兆的信息中的特定信息,例如顶部、底部、右手侧);DTC(诊断故障码,由车辆的电子设备自动生成);DTC限定词(QUALIFIER)(描述DTC的状态,例如当前、历史、空、当前和历史);以及附加征兆注解(comment)。
图2中所描述的目标记录格式还包括一组行动属性260。所述行动属性260包括关于响应于维修请求或生成源记录的征兆来执行什么样的维修的信息。所述行动属性260包括采取的行动(为了解决问题所采取的行动);部件名称;部件位置(被采取行动的部件的位置);部件段(piece)(定义被采取行动的部件段的自由文构;部件细节(详细定义被采取行动的部件的自由文本);工人操作码(工人操作(labor operation)代码);以及附加行动注解。
图3是一个示例性的车辆诊断记录映射过程的流程图,所述过程可以被应用以将一个半结构化维修记录(在这种情况下为一个TAC维修记录)转换成一个结构化目标记录。所述过程在步骤302开始,这时一个半结构化车辆维修记录被接收。在步骤304,为新的目标记录生成一个目标记录号210。在步骤306,所述车辆诊断记录映射应用程序试图在该半结构化维修记录中定位车辆描述数据。如果车辆描述数据被定位,如在步骤306所确定的一样,则步骤308被执行,否则在步骤310继续处理。在步骤306,车辆描述属性220在目标记录中被生成。在一个示例性实施例中,其中所述半结构化维修记录是一个TAC维修记录,目标记录的所述车辆描述属性220被直接从TAC维修记录的相应字段中进行映射。在维修记录字段中包含的所有车辆描述数据被输入到相应的目标记录属性中。一个例外可能是VIN制造属性,它可以通过拷贝VIN字段的前三个数字而生成。一旦步骤308完成,则处理继续到步骤310。在此例子中,所述TAC维修记录中的数据字段一对一地映射到目标记录的相应属性。然而,这不是唯一的情况,并且其他的映射也是可能的。例如,所有的车辆描述220属性可以从VIN中推导出,英里里程除外。做这些所需要的附加信息可从独立软件应用程序中得到(例如VIN解码器)。
在步骤310,车辆诊断记录映射应用程序试图在TAC维修记录中定位簿记数据。如果簿记数据被定位,那么步骤312被执行以映射簿记数据到目标记录格式中的簿记属性230,否则处理继续到步骤314。在一个示例性的实施例中,所述写作日期、作者/编辑者和记录号这些字段源自TAC维修记录中的相应字段。所述公告字段可以利用文本挖掘的能力而被填充。执行文本挖掘包括为了标准术语或为了文本中的线索而利用文本挖掘软件工具去检查自由文本和TAC维修记录的关键字标题字段部分,以便在目标记录中寻源一个属性。在输入一个TAC维修记录时使用包括标准术语和短语的受控词汇(本体)能够加速这一过程,但是这并不需要执行本发明的一个实施例。所述公告字段可以从被标记为“公告号”或“关键字限定词”或“非关键字限定词”的TAC记录标题字段生成,或可选地从TAC记录的文本部分生成。所述TAC记录“公告号”标题字段首先被搜索,并且如果发现一个匹配,则将被用于填充所述公告字段。否则,文本挖掘将被使用以试图从文本或关键字标题字段(例如关键字限定词、非关键字限定词)来填充公告字段。
文本挖掘软件可以被指导在文本和关键字标题字段中查找xxxxxx、xx-xx-xx、xxxxxxxx、xx-xx-xx-xx、xxxxxxxxx、xx-xx-xx-xxx、yxxxxxx或yxxxxxxy形式的公告号,其中y是一个字母,并且x是一个整数。此外,公告号前面可以是“TSB”(技术维修公告)、“PSB”(被公开的维修公告)、“SB”(维修公告)、“PI”(初步信息)、“SMU”(维修手册升级)、“公告”或“Bull.”。注意,一般规则意味着任何6、8或9位数可以表示一个公告。如果此为真,那么这将与其他属性(例如部件号可能是8位数)发生冲突,并且文本挖掘工具将不得不从文本的上下文中确定合适的选择。更特定的规则可以为车辆中的特定系统或部件而生成。例如,对一个防抱死刹车系统(ABS)来说,下面的规则可以被应用以识别公告如果第三个字母是“-”,那么所述字符串表示一个公告;而如果前两个字符是“A0”,那么所述字符串表示一个公告。剩余的所述组的簿记属性230可以包含默认值。例如,编辑日期可以默认为空之后被更新,如果所述记录被编辑的话;目标记录状态可以默认为“未发布”;发布授权者可以默认为空,随后被更新成公布所述状况的维修工程师的名字;以及语言可以默认为英语。一旦所述组的簿记属性230为目标记录格式,则步骤312就完成,并且处理继续到步骤314。
在步骤314,所述车辆诊断记录映射应用程序试图在TAC维修记录中定位系统数据。如果系统数据被定位,那么执行步骤316以映射系统数据到目标记录格式的系统属性240中,否则处理继续到步骤318。在一个示例性实施例中,所述维修种类类型源自TAC维修记录的“维修手工区”标题字段,以及所述维修种类属性源自“子区”标题字段。所述维修子种类属性可以源自TAC维修记录中的“部件类型”标题字段、“关键字限定词”标题字段、“非关键字限定词”标题字段或源自文本数据。所述维修子种类属性识别有关所述维修种类的附加信息。所述文本挖掘软件可以被指示以定位这一附加信息,其可能包括诸如发动机和变速器号之类的数据。
在步骤318,所述车辆诊断记录映射应用程序试图定位在TAC维修记录中的征兆数据。如果征兆数据被定位,那么步骤318被执行以映射征兆数据到目标记录的所述组的征兆属性250,否则处理继续到步骤322。在一个示例性的实施例中,所述主征兆组属性源自TAC维修记录的标题字段。这一数据可以包括短语,例如漏气、异常运行、与液体有关、指示器失灵、指示器开、失灵、噪声、气味、不想要的运行和振动。所述征兆属性可能源自TAC记录的关键字标题字段或源自TAC文本数据。如果系统是一个ABS,那么所述文本挖掘软件能够被指示以定位的短语包括点火、灯、指示器、LED、密耳(mil)、搏动(pulsate)、脉动(pulsation)、不想要的启动、抛锚(stall)以及车辆将不超过xxx mph。所述征兆细节字段可以源自TAC维修记录的标题字段或者利用文本挖掘能力从TAC文本数据中寻源。此信息被添加到征兆描述中。例如,如果征兆是噪声,那么征兆细节将描述噪声的类型。例如,在一个ABS系统,所述文本挖掘软件可以被指示去定位下列短语嗡嗡声、啁啾声、钟声、咔嗒声、咔嗒-啁啾声、咔嗒-嘀嗒声、铿锵声、咆哮声、吱吱声、尖叫声和嘎嘎声。所述文本挖掘软件也将定位拼写的变化和前面短语列表的错误拼写。
在一个示例性实施例中,所述目标记录的功能部件/系统属性指出车辆的哪一部分正在经历/引起在主征兆组中描述的情形。例如,如果主征兆组包含“指示器开”的值,那么所述文本挖掘软件将搜索以定位所涉及的特定指示器。在这个例子中,所述文本挖掘软件可以搜索包括下述的术语防抱死刹车系统、ABS、增强的牵引控制、ETC、牵引控制系统、TCS、低牵引、低牵引(low trac)、尽快维修发动机、SES、尽快维修车辆、SVS、低轮胎压力监控器、LTPM、低轮胎压力报警系统、LTPWS、刹车、ABS启动和牵引断开。在文本和关键字标题字段中的其它短语可以被指定以根据多种因素进行搜索,所述因素比如是指示器是否是仪表组、驾驶员信息中心、辅助信息中心或导航/无线电显示器的一部分。如在前面例子中所示的那样,本发明的一个实施例允许所述文本挖掘软件在TAC维修记录文本和关键字标题字段中基于包含在一个或多个目标记录字段中的数据值来搜索不同的短语。
在目标记录的所述组的征兆属性250中的功能部件/系统细节属性源自TAC维修记录文本或关键字标题字段,并且进一步包含有关功能部件/系统的信息。所述频度属性描述问题被观察或被经历的频度。它可以源自TAC记录中的关键字标题字段或源自TAC文本数据。所述文本挖掘软件被指示以定位的短语包括总是、间歇、瞬间和闪现(flicker)。所述车辆诊断记录映射软件可以被指示以识别单词间歇的各种拼写和缩写;可以响应于对文本中的术语总是、经常地或者经常的定位而被引导把单词“总是”输入到频度字段中;以及被指示去识别短语的变形例如“仅1次”、“2天”(两天)和不确定(erratic)。所述环境状况属性描述了征兆被观察时的环境状况。此属性可以利用文本挖掘能力从TAC记录中的关键字标题字段或TAC文本数据中生成。所述环境状况可以利用诸如热、冷、下雨、洗车和路面之类的术语来定义。例如,HVAC情形可以包括这样一种情形,即其中征兆是来自门把手的冷风,并且所述环境状况属性可以包括数据字符串“强风”。所述车辆状况属性描述了征兆被观察时车辆的运行状况。状况可以包括热、冷、在负荷下、加速、减速、刚刚启动后、停车操作和高速公路速度。注意此上下文中的热和冷指车辆的状况而不是周围的空气温度。所述车辆状况属性可以利用TAC维修记录中的关键字标题字段被寻源或者通过利用TAC维修记录中的文本字段被寻源。所述文本挖掘软件可以被指示以识别下述的变形停止、启动、转弯、加速、指示征兆出现速度的MPH或KM/H、撞击、转向、高速、低速、正常刹车和点火开关位置。
在目标记录的所述组的征兆属性250中的车辆区域属性源自TAC维修记录关键字标题字段或文本,并且包含被加入到已经提供的有关征兆的信息中的特定信息。所述文本挖掘软件可搜寻的值包括顶部、底部、右手侧和左手侧。在所述组的征兆属性250中还可能包括与记录相关的DTC(诊断故障码)。在一个示例性系统中,使用一个ABS系统作为例子,所述DTC字段可以采用形式yxxxx,其中y是B、C、P或U,并且x是任一整数。在一个示例性实施例中,单词“没有代码”和“没有dtc”将被识别并被用于将短语“没有DTC”填充所述DTC字段,使得可以认识到,实际上不存在DTC,而不仅仅是没有记录的DTC。在示例性的ABS系统的情况中,若干规则可被应用到文本挖掘软件中,以便从关键字标题字段或文本中提取DTC数据。用于DTC数据提取的ABS规则可以包括如果字符串的长度是5,以及第一个字符是“C”且第二个字符是一个数字(0-9),那么所述字符串相应于一个DTC;以及如果一个字符串的长度是7,以及第一个字符是“C”且第二个字符是一个数字且第6个字符是“E”或“M”,那么所述字符串相应于一个DTC。同样参考示例性的ABS规则,有时第一个字母数字并不包含在文本中。为了适应这种情况,如果字符串的长度是4且第一个字符是一个数字,那么所述字符串相应于一个DTC。所述车辆诊断记录映射软件将随后通过加入一个“C”到四个数字的字符串的开头以生成一个5个数字的DTC来处理来自于TAC维修记录的数据。其它用于ABS系统的文本挖掘规则可以包括如果前两个字符是“P0”、“P1”、“U0”或“U1”那么所述字符串表示一个DTC;如果字符串以“DTC”开头,那么它表示一个DTC并且以没有“DT”前缀的形式被存储(例如DTC1226在结构化记录中被存储为C1226);以及一些两个数字的字符串表示DTC,但是两个数字的字符串可以表示其它信息(例如车辆速度、样式年份),并且因此分配到DTC的两个数字的字符串需要在上下文中被评估(例如,在所述字段的MPH的存在例如将表示所述数字代表车辆速度并且可能属于车辆状况种类)。
在所述组的征兆属性250中的DTC限定词属性依照其是否表示了一个激活的错误代码或者过去生成的错误代码来描述DTC的状态。所述DTC限定词的值可以包括“当前”、“历史”、“空”或“当前与历史”。这一属性将利用文本挖掘能力从TAC维修记录的关键词标题字段或文本中而被填充。同样,所述字段“征兆附加注解”将利用文本挖掘能力而被填充,如果识别出与征兆的附加注解相关的话。
在步骤322,所述车辆诊断记录映射应用程序试图定位在TAC维修记录中关于校正或修理行动的数据。如果这样的数据被定位,那么步骤324被执行以映射行动数据到目标记录格式中的所述组的行动属性260,否则处理继续到步骤326。在一个示例性实施例中,所述采取的行动、部件名称、部件位置和部件段属性将源自TAC维修记录中的关键字标题字段或文本数据。文本挖掘能力将被应用以根据对这些属性的每一个的许可的短语列表来对这些属性确定合适的输入。所述部件细节属性将利用自由文本而被填充,所述自由文本详细定义将被采取行动的部件。此属性将被利用文本挖掘能力从TAC维修记录的文本数据中生成。在一个示例性的实施例中,其中TAC维修记录必须与一个ABS相关,下列规则能够被文本挖掘函数采用以定位和操作所述数据如果第一个字符是“#”,那么所述字符串表示一个部件号,并且为了统一而去掉所述“#”;如果前三个字符是“p/n”,那么所述字符串表示一个部件号;如果前两个字符是“pn”,那么所述字符串表示一个部件号;如果字符串的长度是8并且第一个字符是数字,那么所述字符串相应于一个部件号,如果其在上下文有意义的话;以及如果第8个字符是“R”并且字符串有17个字符或更少,那么所述字符串是一个条形码类型的部件号。所述工人操作码字段可以源自标记为“工人代码”的TAC标题字段。最后,所述行动附加注解属性将利用文本挖掘能力通过在TAC维修记录的文本数据中搜索与行动属性260相关的附加注解而被填充。
在步骤326,所述车辆诊断记录映射是完整的,并且处理结束。参考图2和3描述的所述示例性实施例是一个其中半结构化TAC维修记录被映射到目标记录格式的实施例。不同于图2所描述的目标记录格式可以被本发明的一个实施例采用;基于用户的需求,可以添加其它的属性和属性组,或者可以清除现有的属性和属性组。同样,用于映射的源可以是一个TAC维修记录,也可以是任何其他包括保修信息记录和字段反馈记录的半结构化或非结构化维修文档。每一组目标记录可以源自一个或多个类型的半结构化或非结构化车辆维修记录(例如TAC和保修)。每一个类型的车辆维修记录可以具有一个相应组的映射和文本挖掘软件规则,所述规则符合局部规范,并且导致数据被映射到一个通用的目标记录格式中。此外,当车辆诊断记录映射处理完成时,不必让目标记录中的所有属性都被数据值填充。根据源记录的类型,一些属性可能不会被跟踪,并且根据在源记录中包含的数据,数据也不可能为目标记录中的每一个条目而存在。所述文本挖掘能力可以根据源记录的类型和目标记录的结构而被不同地设置。此外,所述文本挖掘功能可以根据映射结果的精确性以及响应于术语、技术和维修技术人员的实践的变化而被更新和微调。
图4是来自一个技术帮助中心(TAC)的半结构化车辆维修记录的示例性子集。它包括一个标题信息字段410、一个文本字段420和一个解决文本概要(summary)字段430。文本字段420和解决文本概要字段430包含可利用文本挖掘能力而被搜索的自由文本。图5是目标记录的示例性子集,所述子集是图4中描述的利用本发明示例性实施例来映射半结构化维修诊断记录的结果。如图4和5中所示,所述标题信息字段410被直接映射到目标记录中的相应属性。参考图5,利用直接来自图4中描述的源记录中的相应字段的数据填充下述属性所有的车辆描述属性520、所有的簿记属性530、所有的系统属性540(此处有一些名称变化维修手工区到维修种类类型,子区到维修种类,以及部件类型到维修子种类)和所述组的征兆属性550中的主征兆组属性。此外,所述目标记录号属性510作为目标记录创作和维持过程的一部分而被生成(并且与图4中描述的半结构化维修诊断记录的任何数据都不相关)。
在图5中描述的目标记录中的其它属性由图4中示出的TAC维修记录的文本字段420和解决文本概要字段430部分填充。这是通过使用上述的文本挖掘能力完成的。例如,因为维修手工区是“限制(restraint)”,所以所述文本挖掘功能搜索那些相关于输入到征兆和征兆细节属性的限制的数据。所述短语“先生(SIR),灯闪7次并保持为开”被改变为在目标记录的征兆字段中所约定的标准短语“气囊灯开”。对所述数据的操作能够提供对征兆描述的一致性,并且允许搜索和分组相似的征兆。每一种实施可以利用不同组的标准短语,这取决于在描述车辆诊断数据时所利用或所推荐的标准语言。同样,所述功能部件/系统属性利用从征兆的特性中导出的“气囊,”来填充。功能部件/系统细节利用“左前/驾驶员,”来填充,所述“左前/驾驶员,”从TAC维修记录的文本字段420部分的驾驶员中导出,并且从文件中用于这种类型征兆的标准短语中提取。换句话说,因为征兆是“气囊”,所以涉及气囊问题的一个特定子集的短语可以被车辆诊断记录映射应用程序的文本挖掘功能所扫描。所述结果是“代码24”变成“DTC(诊断故障码)-24”;所述DTC限定词被缺省设置为“当前”。在图5的所述组的征兆属性550中的频度属性被词汇“总是,”填充,这是基于在图4的文本字段420中找到了词语“保持为开”。所述附加征兆注解从文本中进行搜集,从而集中于与名词短语相关的诊断和维修动词,正如由文本挖掘逻辑所指导的那样。
在图5的所述组的行动属性560中列出的属性依据对包含在图4的解决文本概要字段430中的数据应用文本挖掘能力的结果而被填充。在图5的所述组的行动属性560中的采取的行动属性中的所得数据包括“维修,更换”(从“已维修和已更换”中导出)。同样,图5中的所述“部件名称-布线线束电路347,检测与诊断模块(SDM)”从“CKT 347与SDM”中导出,以及“部件位置-左前地板销(FLOOR STUD)”从图4的解决文本概要430字段中“在驾驶员地板处的销”中导出。
本发明的实施例映射半结构化和非结构化的车辆维修记录到目标记录格式。这可能导致通过提供分组以及在相似维修记录中消除冗余并对在目标记录属性中包含的关键字进行分类和搜索的能力而使自由文本信息更加有用。所述数据可以随后作为被学习的经验数据库被提供给技师以用于诊断和维修车辆,以及被提供给产品开发人员以用于开发新产品或产品升级。此外,本发明的一个实施例通过将在自由文本中找到的短语翻译成被输入到目标记录中的标准语言短语来促进对标准词汇的应用。当与手工进行转化相比时,将非结构化的维修数据自动转换成结构化的目标记录的能力可以导致成本节约。此外,自动化所述过程可以导致目标记录中更一致的数据。所述采用仅仅以非结构化文本形式记录的先前已解决的问题并将其转换成结构化目标记录格式的能力允许先前解决的问题在将来的车辆诊断维修中被利用。这可能导致提高改善的维修和改善的诊断质量。
如上所述,本发明的实施例可以以计算机执行的过程和用于实现所述过程的装置的形式来实现。本发明的实施例也可以以包含指令的计算机程序代码的形式来实现,所述指令被包含在诸如软盘、CD-ROM、硬盘驱动器或任何其它计算机可读存储介质之类的有形介质(tangible media)中,其中,当计算机程序代码被载入计算机中并由其执行时,所述计算机成为实现本发明的一个装置。本发明的一个实施例也可以以计算机程序代码的形式来实现,该计算机程序代码例如无论是存储在存储介质中、被载入计算机中和/或由其执行,还是通过某一传输介质被传输,例如通过电线或电缆、通过光纤或通过电磁辐射,其中,当计算机程序代码被载入计算机中并由其执行时,所述计算机成为实现本发明的一个装置。当在通用微处理器上执行时,所述计算机程序代码段配置所述微处理器以生成特定的逻辑电路。
虽然参考示例性实施例已经描述了本发明,但本领域技术人员将会理解,可以做出多种变化,并且可以用等同物替换其元素,而不背离本发明的范围。.此外,可以作出多种修改以使得特定形式或者材料适合本发明的教导而不脱离本发明的基本范围。因此,本发明并不限于作为执行本发明的所想到的最佳模式而公开的特定实施例,本发明而是将包括所有落入所附权利要求书范围中的实施例。而且,对术语第一、第二等的使用不表示任何顺序或重要性,术语第一、第二等而是用于将一个元素与另一个元素区分开来。
权利要求
1.一种用于车辆诊断记录映射的方法,所述方法包括接收一个车辆维修记录;响应于所述接收生成一个目标记录,其中所述目标记录包括一个目标记录号属性、一组车辆描述属性、一组簿记属性、一组系统属性、一组征兆属性和一组行动属性;响应于在所述车辆维修记录中对所述车辆描述数据的定位,将车辆描述数据映射到所述组的车辆描述属性;响应于在所述车辆维修记录中对所述簿记数据的定位,将簿记数据映射到所述组的簿记属性;响应于在所述车辆维修记录中对所述系统数据的定位,将系统数据映射到所述组的系统属性;响应于在所述车辆维修记录中对所述征兆数据的定位,将征兆数据映射到所述组的征兆属性;以及响应于在所述车辆维修记录中对所述行动数据的定位,将行动数据映射到所述组的行动属性。
2.如权利要求1所述的方法,其中所述定位利用文本挖掘来进行。
3.如权利要求1所述的方法,其中所述定位通过将在所述车辆维修记录中的数据字段与所述目标记录中的所述属性之一相匹配来进行。
4.如权利要求1所述的方法,其中所述定位通过将来自所述车辆维修记录的数据处理成所述目标记录中的所述属性之一来进行。
5.如权利要求1所述的方法,其中所述车辆维修记录包括非结构化格式的数据。
6.如权利要求1所述的方法,其中所述车辆维修记录包括半结构化格式的数据。
7.如权利要求1所述的方法,其中所述车辆维修记录包括自由文本格式的数据。
8.如权利要求1所述的方法,其中所述组的车辆描述属性包括一个车辆标识号属性、一个车辆年份属性、一个车辆生产线属性、一个车辆标识号样式属性、一个车辆标识号制造属性、一个车辆标识号系列属性、一个车辆标识号车体属性、一个车辆标识号发动机属性、一个车辆标识号年份属性、一个车辆标识号工厂属性、一个车辆标识号序列属性和一个英里里程属性。
9.如权利要求1所述的方法,其中所述组的车辆描述属性包括一个车辆标识号属性和一个英里里程属性;或一个可从所述车辆标识号属性和所述英里里程属性中导出的属性。
10.如权利要求1所述的方法,其中所述组的簿记属性包括一个写作日期属性、一个编辑日期属性、一个作者/编辑者属性、一个公告属性、一个记录号属性、一个目标记录状态属性、一个发布授权者属性和一个语言属性。
11.如权利要求1所述的方法,其中所述组的簿记属性包括下列中的至少一个一个写作日期属性、一个编辑日期属性、一个作者/编辑者属性、一个公告属性、一个记录号属性、一个目标记录状态属性、一个发布授权者属性和一个语言属性。
12.如权利要求1所述的方法,其中所述组的系统属性包括一个维修种类类型属性;或所述维修种类类型属性和一个维修种类属性;或所述维修种类类型属性、所述维修种类属性和一个维修子种类属性。
13.如权利要求1所述的方法,其中所述组的征兆属性包括一个主征兆组属性、一个征兆属性、一个征兆细节属性、一个功能部件/系统属性、一个功能部件/系统细节属性、一个频度属性、一个环境状况属性、一个车辆状况属性、一个车辆区域属性、一个诊断故障码属性、一个诊断故障码限定词属性和一个附加征兆注解属性。
14.如权利要求1所述的方法,其中所述组的征兆属性包括一个主征兆组属性、一个功能部件/系统属性和一个诊断故障码属性。
15.如权利要求14所述的方法,其中所述组的征兆属性进一步包括下列中的至少一个一个征兆属性、一个频度属性、一个环境状况属性和一个车辆状况属性。
16.如权利要求1所述的方法,其中所述组的行动属性包括一个采取的行动属性、一个部件名称属性、一个部件位置属性、一个部件段属性、一个部件细节属性、一个工人操作属性和一个附加行动注解属性。
17.如权利要求1所述的方法,其中所述组的行动属性包括一个采取的行动的属性和一个部件名称属性。
18.一种用于车辆诊断记录映射的系统,所述系统包括一个网络,以及一个与所述网络通信的主机系统,所述主机系统包括应用软件以执行一个包括下述的方法通过所述网络接收一个车辆维修记录;响应于所述接收生成一个目标记录,其中所述目标记录包括一个目标记录号属性、一组车辆描述属性、一组簿记属性、一组系统属性、一组征兆属性和一组行动属性;响应于在所述车辆维修记录中对所述车辆描述数据的定位,将车辆描述数据映射到所述组的车辆描述属性;响应于在所述车辆维修记录中对所述簿记数据的定位,将簿记数据映射到所述组的簿记属性;响应于在所述车辆维修记录中对所述系统数据的定位,将系统数据映射到所述组的系统属性;响应于在所述车辆维修记录中对所述征兆数据的定位,将征兆数据映射到所述组的征兆属性;以及响应于在所述车辆维修记录中对所述行动数据的定位,将行动数据映射到所述组的行动属性。
19.一种用于车辆诊断记录映射的计算机程序产品,所述计算机程序产品包括一个可由处理电路读取并存储指令的存储介质,所述指令由所述处理电路执行以用于执行一种包括下述的方法接收一个车辆维修记录;响应于所述接收生成一个目标记录,其中所述目标记录包括一个目标记录号属性、一组车辆描述属性、一组簿记属性、一组系统属性、一组征兆属性和一组行动属性;响应于在所述车辆维修记录中对所述车辆描述数据的定位,将车辆描述数据映射到所述组的车辆描述属性;响应于在所述车辆维修记录中对所述簿记数据的定位,将簿记数据映射到所述组的簿记属性;响应于在所述车辆维修记录中对所述系统数据的定位,将系统数据映射到所述组的系统属性;响应于在所述车辆维修记录中对所述征兆数据的定位,将征兆数据映射到所述组的征兆属性;以及响应于在所述车辆维修记录中对所述行动数据的定位,将行动数据映射到所述组的行动属性。
全文摘要
一种用于车辆诊断记录映射的方法包括接收一个车辆维修记录。响应于接收所述车辆维修记录来生成一个目标记录。所述目标记录包括一个目标记录号属性、一组车辆描述属性、一组簿记属性、一组系统属性、一组征兆属性和一组行动属性。响应于在所述车辆维修记录中对所述车辆描述数据的定位,将车辆描述数据映射到所述组的车辆描述属性。响应于在所述车辆维修记录中对所述簿记数据的定位,将簿记数据映射到所述组的簿记属性。响应于在所述车辆维修记录中对所述系统数据的定位,将系统数据映射到所述组的系统属性。响应于在所述车辆维修记录中对所述征兆数据的定位,将征兆数据映射到所述组的征兆属性。响应于在所述车辆维修记录中对所述行动数据的定位,将行动数据映射到所述组的行动属性。
文档编号G01M17/00GK1768343SQ200480008947
公开日2006年5月3日 申请日期2004年3月17日 优先权日2003年4月7日
发明者A·P·莫干, L·M·奎恩, G·森格, D·I·吉布邦斯, M·A·索瓦, S·L·发科, F·J·冯德拉克, T·W·罗姆梅 申请人:通用汽车公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1