一种基于知识图谱的任务型汽车故障智能问答系统的制作方法

文档序号:30614905发布日期:2022-07-02 00:42阅读:408来源:国知局
一种基于知识图谱的任务型汽车故障智能问答系统的制作方法

1.本发明属于汽车故障诊断技术领域,尤其涉及一种基于知识图谱的任务型汽车故障智能问答系统。


背景技术:

2.知识图谱,本质上,是一种揭示实体之间关系的语义网络。知识图谱在逻辑结构上可分为模式层与数据层两个层次,数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储。存储方式通常以三元组方式存储(实体1,关系,实体2)或者(实体、属性,属性值),存储方式一般为图数据库。
3.随着大数据人工智能的崛起,知识图谱的出现将以前的图论理论得到了延伸,同时加速了会话式智能问答系统的发展。首先在电商,金融,移动互联网;然后随着国家开始振兴智能制造领域,移动互联网在汽车制造行业开始得到应用,与汽车相关的智能问答系统的需求也开始出现了。
4.智能问答系统是将积累的无序语料信息,进行有序和科学的整理,并建立基于知识的分类模型;这些分类模型可以指导新增加的语料咨询和服务信息,节约人力资源,提高信息处理的自动性,降低网站运行成本。
5.目前汽车行业,关于汽车故障维修咨询的技术领域,还主要处于人工服务阶段,咨询、故障诊断、售后服务消耗大量的人力资源和时间成本,不能提高办事效率,而且服务质量对咨询服务人员的技术专业水平十分依赖,限制了整体服务质量的提高。因此急需一种具有汽车故障智能诊断、智能问答功能的任务型汽车故障智能问答系统。


技术实现要素:

6.为克服上述现有技术存在的不足,本发明之目的在于提供一种基于知识图谱的任务型汽车故障智能问答系统。本发明采用任务型智能问答系统,依托知识图谱,精确的定位车主关于汽车维修的问题,然后给出解决方案,解决了汽车故障的维修咨询智能化,提高了咨询中汽车故障问题的定位能力,使售后咨询节省人力,大大缩短了售后服务时间,提升了行业服务质量。
7.为实现上述目的,本发明实施例提供如下技术方案。
8.一种基于知识图谱的任务型汽车故障智能问答系统,包括:
9.用户交互单元,分别与故障维修查询单元和智能问答单元连接,用于收集用户故障维修查询信息和售后问答信息,向用户展示系统反馈结果;
10.图谱知识库,用于存储汽车故障维修知识图谱和在线问答知识图谱;
11.所述故障维修查询单元,与所述图谱知识库连接,基于来自用户交互单元的故障维修查询信息,从所述图谱知识库内容构建出维修方案和维修案例,并将方案和/或案例反馈给所述用户交互单元进行显示;
12.所述智能问答单元,与所述图谱知识库连接,对来自用户交互单元的售后问答文
本进行分析,基于所述图谱知识库内容通过智能算法推算出最佳答案,将最佳答案反馈给所述用户交互单元进行展示。
13.进一步地,还包括依次连接的标准维修数据单元、结构化单元和故障维修图谱构建单元;其中,所述故障维修图谱构建单元与所述图谱知识库连接;
14.其中,所述标准维修数据单元,还包括:维修保养手册库和售后维修记录库;
15.所述结构化单元,用于来自标准维修数据单元的数据进行结构化处理、数据清洗和关系抽取,获得实体信息和目标关系集,以及结构化故障维修数据;
16.所述故障维修图谱构建单元,基于所述实体信息和目标关系集,以及结构化故障维修数据,构建维修方案和/或维修案例,将所述维修方案和/或维修案例存储于所述图谱知识库。
17.进一步地,所述结构化单元,还包括依次连接的数据清洗模块和关系抽取模块;所述结构化单元,将所述维修保养手册库和售后维修记录库的数据进行结构化处理,通过所述数据清洗模块对所述维修保养手册库和售后维修记录库的数据进行数据清洗,通过所述关系抽取模块对清洗后的数据根据数据关系进行关系抽取,获得所述实体信息和目标关系集,以及所述结构化故障维修数据。
18.进一步地,所述故障维修查询单元,还包括:
19.维修方案构建模块,用于从所述图谱知识库内容构建出符合用户当前需求的维修方案;
20.维修案例构建模块,用于从所述图谱知识库内容构建出符合用户当前需求的维修案例。
21.进一步地,还包括:图谱知识库查询单元,用于提供对所述图谱知识库的查询界面和功能。
22.进一步地,所述智能问答单元,还包括:
23.快速文本分类模块,用于对来自所述用户交互单元的售后问答文本进行快速文本分类,获得分类结果。
24.进一步地,所述智能问答单元,还包括:模型训练模块,用于基于所述分类结果进行模型训练,判断模型训练结果,如果准确率大于90%,则给售后问答文本数据打上标签结构化,整合进所述图谱知识库中。
25.进一步地,所述智能问答单元,还包括:
26.模型测试模块,用于对模型训练模块和所述图谱知识库进行准确性测试。
27.进一步地,所述智能问答单元,还包括:
28.智能检索模块,用于基于所述分类结果进行在所述图谱知识库中进行检索,获得智能检索结果,反馈给所述用户交互单元。
29.本发明的另一目的在于提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于知识图谱的任务型汽车故障智能问答系统的功能。
30.与现有技术相比,本发明的有益效果是:
31.本发明提供了一种基于知识图谱的任务型汽车故障智能问答系统,相对现有技术,能够降低汽车故障售后维修时候的沟通成本,在短时间内定位到汽车故障的相关问题,
节省了售后维修的时间。通过结合自然语言处理技术,实现了汽车维修故障原因的自动发现,并且取代了客服人员,彻底实现了自动化。在和问答系统的提问和回答中,该发明还能将无法回答提问者的问题收集进行分析,重新定位并且搜索正确的结果,同时加入到现有知识库中,实现了自我进化。本发明首次将智能问答和知识图谱相结合,通过前后端通信的方式,将后台查询结果返回到用户,实现自动化回答客户问题,缩短售后人力沟通成本。
附图说明
32.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
33.图1为可选的基于知识图谱的任务型汽车故障智能问答系统结构示意图;
34.图2为结构化单元结构示意图;
35.图3为智能问答单元结构示意图;
36.图4为智能问答系统的知识图谱关系示意图。
具体实施方式
37.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
38.在本发明提供的一个优选实施方式中,一种基于知识图谱的任务型汽车故障智能问答系统,包括:用户交互单元、图谱知识库、故障维修查询单元和智能问答单元;其中,所述用户交互单元分别与所述故障维修查询单元和智能问答单元连接;所述故障维修查询单元和智能问答单元分别与所述图谱知识库连接。见图1所示的一种可选的一种基于知识图谱的任务型汽车故障智能问答系统结构示意图。
39.其中,所述用户交互单元,用于收集用户故障维修查询信息和售后问答信息,向用户展示系统反馈结果。
40.所述故障维修查询单元,基于来自用户交互单元的故障维修查询信息,从所述图谱知识库内容构建出维修方案和维修案例,并将方案和/或案例反馈给所述用户交互单元进行显示。
41.所述智能问答单元,对来自用户交互单元的售后问答文本进行分析,基于所述图谱知识库内容通过智能算法推算出最佳答案,将最佳答案反馈给所述用户交互单元进行展示。
42.所述图谱知识库,用于存储汽车故障维修知识图谱和在线问答知识图谱。
43.所述基于知识图谱的任务型汽车故障智能问答系统,还包括依次连接的标准维修数据单元、结构化单元和故障维修图谱构建单元;其中,所述故障维修图谱构建单元与所述图谱知识库连接。
44.所述标准维修数据单元,还包括:维修保养手册库和售后维修记录库。
45.所述结构化单元,还包括依次连接的数据清洗模块和关系抽取模块。见图2 所示。
46.所述结构化单元,用于将所述维修保养手册库和售后维修记录库的数据进行结构
化处理,通过所述数据清洗模块对所述维修保养手册库和售后维修记录库的数据进行数据清洗,通过所述关系抽取模块对清洗后的数据根据数据关系进行关系抽取,获得实体信息和目标关系集,以及结构化故障维修数据。
47.所述故障维修图谱构建单元,基于所述实体信息和目标关系集,以及结构化故障维修数据,构建维修方案和/或维修案例,将所述维修方案和/或维修案例存储于所述图谱知识库。
48.所述故障维修查询单元,还包括:维修方案构建模块和维修案例构建模块。
49.所述维修方案构建模块,用于从所述图谱知识库内容构建出符合用户当前需求的维修方案。
50.所述维修案例构建模块,用于从所述图谱知识库内容构建出符合用户当前需求的维修案例。
51.所述基于知识图谱的任务型汽车故障智能问答系统,还包括图谱知识库查询单元。所述图谱知识库查询单元,提供对所述图谱知识库的查询界面和功能。
52.所述智能问答单元,还包括:依次连接的快速文本分类模块、模型训练模块、模型测试模块和智能检索模块。见图3所示。
53.所述快速文本分类模块,用于对来自所述用户交互单元的售后问答文本进行快速文本分类,获得分类结果。
54.所述模型训练模块,用于基于所述分类结果进行模型训练,判断模型训练结果,如果准确率大于90%,则给在线数据打上标签结构化,整合进所述图谱知识库中。
55.所述模型测试模块,用于对模型训练模块和所述图谱知识库进行准确性测试。
56.所述智能检索模块,用于基于所述分类结果进行在所述图谱知识库中进行检索,获得智能检索结果,反馈给所述用户交互单元。
57.本发明数据集由离线和在线两部分构成,离线部分主要用于构建售后知识图谱,数据基本是售后维修手册、售后维修记录、4s店的维修记录,分别存储于维修保养手册库和售后维修记录库中,通过结构化单元数据清洗模块进行数据清洗后,根据数据的关系,通过结构化单元关系抽取模块进行关系抽取。
58.关系抽取模块,在实体识别的基础上,从非结构化文本中抽取出预先定义的实体关系。实体对的关系可被形式化描述为关系三元组《e1,r,e2》,其中,e1和 e2是实体,r属于目标关系集r{r1,r2,r3,...,ri}。关系抽取模块从自然语言文本中抽取出关系三元组《e1,r,e2》,从而提取文本信息。
59.本发明中,实体信息和目标关系集如表1和表2所示:
60.表1实体信息
[0061][0062]
表2目标关系集
[0063][0064]
确定好实体信息和目标关系集之后,通过结构化单元处理的结构化故障维修数据就可以用于故障维修图谱构建单元构建知识图谱了。
[0065]
故障维修图谱构建单元,涉及的故障维修图谱内容由维修保养手册内容及售后维修记录内容两部分组成。每一款车型都有售后维修保养服务手册,根据售后维修的经验,每一款车车型都有易发生故障、一般发生故障、偶发故障、特殊故障这几类,针对这些类,建立准确的维修方案;在准确的维修方案的基础上,增加完整的维修案例,让业主维修时进行参考。智能问答系统的知识图谱关系示意图见图4。
[0066]
较佳地,故障维修图谱构建单元,将结构化故障维修数据按照附图1的形式进行知识图谱构建,然后写入图谱知识库。
[0067]
较佳地,所述图谱知识库,可采用neo4j数据库。neo4j是一个高性能的, nosql图形数据库,它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的java持久化引擎,但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的
所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。知识图谱的三元组存储的方式有很多种,除了neo4j,还有flockdb、allegrograp、graphdb、 infinitegraph、titan、orientdb。本发明使用neo4j作为存储载体,容易部署而且免费,具有嵌入式、高性能、轻量级等优势。
[0068]
较佳地,所述图谱知识库,还包括图谱知识库查询单元。所述图谱知识库查询单元,提供查询界面和功能。
[0069]
较佳地,所述图谱知识库查询单元的查询页面可视化使用shiny框架实现。
[0070]
shiny是r语言中的一种web开发框架,使得r的使用者不必太了解css、 js只需要了解一些html的知识就可以快速完成web开发,且shiny包集成了 bootstrap、jquery、ajax等特性,极大解放了作为统计语言的r的生产力。使得非传统程序员的r使用者不必依赖于前端、后端工程师就可以自己依照业务完成一些简单的数据可视化工作,快速验证想法的可靠性。由于shiny由以上的优点,所以知识库的查询页面使用shiny框架实现,并且支持两轮查询。知识库的设计除了用shiny,还可以使用传统的前端web框架,或者django。shiny的优势是前后端不分离,开发周期较短。
[0071]
如果有问题查询都得不到解决,即所述故障维修查询单元,基于来自用户交互单元的故障维修查询需求,不能从所述图谱知识库内容构建出维修方案和维修案例,则可直接从智能问答单元获取最佳答案,或者直接通过智能问答单元,对来自用户交互单元的售后问答文本进行分析,基于所述图谱知识库内容通过智能算法推算出最佳答案,将最佳答案反馈给所述用户交互单元进行显示。
[0072]
智能问答单元具有快速文本分类模块,用于对来自所述用户交互单元的售后问答文本进行快速文本分类,获得分类结果。
[0073]
较佳地,快速文本分类模块,采用使用fasttext算法进行快速文本分类。
[0074]
fasttext是facebook ai research最近推出的文本分类和词训练工具,其源码已经托管在github上。fasttext最大的特点是模型简单,只有一层的隐层以及输出层,因此训练速度非常快,在普通的cpu上可以实现分钟级别的训练,比深度模型的训练要快几个数量级。同时,在多个标准的测试数据集上,fasttext 在文本分类的准确率上,和现有的一些深度学习的方法效果相当或接近。
[0075]
fasttext主要有两个功能,一个是训练词向量,另一个是文本分类。词向量的训练,fasttext在传统的word2vec改良了word2vec的ngram算法的模式——引入了char-level,比如单词”hello”,长度至少为3的char-level的ngram有
”ꢀ
hel”,”ell”,”llo”,”hell”,”ello”以及本身”hello”。组成的词向量为:(
”ꢀ
hel”,”ell”,”llo”,”hell”,”ello”,”hello”)。而传统的word2vec的ngram 算法的模式是word-level:比如“i have an apple”,组成长度至少为3的词向量为:(“《start》i have”,“i have an”,“have an apple”,“an apple《end》”)(“start 和end表示一句话的开头和结束”)。两者的本质区别就是前者是字符维度的,后者是单词维度的。字符维度的优势就是不需要分词也不需要去停用词,这两步在计算的时候会损耗大量的内存。所以使用fasttext会大大降低内存损耗,提升计算速度。
[0076]
使用fasttext进行快速文本分类之后,采用所述模型训练模块,用于基于所述分
类结果进行模型训练,判断模型训练结果,如果准确率大于90%,则给在线数据打上标签结构化,整合进所述图谱知识库中。同时把打上标签结构化的在线数据与已有的离线数据整合,作为新的训练数据,为下一次训练做准备。
[0077]
原始模型训练需要离线数据进行计算整合,然后根据机器学习可以得出一个训练的准确率,原则上准确率如果能达到90%,那模型就可以使用,然后使用快速文本分类模块,增加了语料和标签——这个标签是fasttext算法打的,不一定对,然后加入进离线数据重新计算模型的准确率,如果依然在90%以上,那这些在线数据就是可用的,就认为它们的标签是正确的。
[0078]
优选地,所述模型训练模块,模型训练使用知识表示学习类算法中最新的 transd算法,transd算法是trans家族算法中最新的一种,trans系列算法全称是:知识图谱向量化表示,就是把头实体,关系,尾实体看成空间中的向量,通过向量化表示,进行一系列的计算,最早也是最基础的trans系列算法是 transe。
[0079]
transe算法的原理简述如下:
[0080]
1把头实体,关系,尾实体放到一个空间中,分别用向量表示。
[0081]
2根据头实体,关系,尾实体中三者已知的两者,寻找与之最接近的剩下的那个。
[0082]
3计算损失函数,获得相关的概率——这个概率就是表示结果与实际的匹配度或者准确度。
[0083]
transe的算法有个假设前提,就是实体和关系之间,必须存在于同一个空间中,而现实中这一点假设很难做到,于是数学家们提出了transr算法,采用向量空间投影的方法,将不同空间中的实体和关系信息,投影到了同一个空间中。而transd的出现,又对其进行了改进,使得相同的实体,根据关系的不同可以对应不同的映射——这样我们在提问的时候,就会出现很多不同的答案,然后就可以在其中选一个最可能的答案了,然后根据提问者的实际情况选择一个最可靠的,这样就增加了回答的不确定性,更符合人性了。
[0084]
使用transd算法通过三元组中头实体,关系,尾实体元素中的任意两个,推算出剩下一个元素的结果,并且给出相关的概率。
[0085]
优选地,所述智能检索模块,使用elasticsearch数据库进行后台查询:
[0086]
使用elasticsearch搜索查询的两个优点是:1.他的查询搜索模式是分片搜索的,就是将内存分区,然后几个区同时查询数据。这个与mysql不同,mysql是对数据进行分区查找。2.特有的倒排索引模式,以关键词查找数据整体,而不是类似mysql的精确搜索,因为这个原理,elasticsearch自带了搜索相似度得分指数——因为输入的需求是五花八门的,必须跟数据库中的问题进行匹配,获得精准定位,如果要精准定位问题如果使用mysql搜索,要把先做搜索查询,然后把结果遍历一遍分别计算相似度。而使用elasticsearch,可以直接搜索出最相似的结果。大大简化的步骤,提高了查询时间。
[0087]
考虑到后期数据量会很大,所以使用elasticsearch架构分布式存储,然后使用它进行问题搜索,给到模型做测试,然后返回结果,由所述用户交互单元进行前端展示。
[0088]
elasticsearch的作用是将neo4j中的图谱数据存储起来,因为elasticsearch 天生分布式,查询速度要比图谱数据库要快,并且能返回查询的相似度,支持模糊查询。neo4j只是用来展示图谱数据,但是数据量太大的话,neo4j的查询速度会下降;而智能问答的时候,客户需要的是需求的快速反馈,所以使用 elasticsearch用来在大数据的情况下提高
查询效率,并且能返回查询的相似度,而原来的neo4j还需要对查询结果进行相似度计算,而用elasticsearch就不需要了,自动出结果。
[0089]
示例性地,所述用户交互单元,具有socketio即时通信架构。socketio是一个基于node.js的实时应用程序框架,在即时通讯、通知与消息推送,实时分析等场景中有较为广泛的应用。socketio支持websocket、polling两种数据传输方式以兼容浏览器不支持websocket场景下的通信需求,本发明使用websocket 方式。websocket的产生源于web开发中日益增长的实时通信需求,对比基于 http的轮询方式,它大大节省了网络带宽,同时也降低了服务器的性能消耗。
[0090]
本发明的另一个实施例,在前述的基于知识图谱的任务型汽车故障智能问答系统的基础上,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述的基于知识图谱的任务型汽车故障智能问答系统的功能。
[0091]
本领域普通技术人员可以理解实现上述实施例中的全部或部分流程及模块,是可以通过计算机和手机程序、硬件及其组合来实现。所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可实现包括如上述各模块实施例的功能。
[0092]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0093]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1