一种基于知识图谱的问答方法及系统与流程

文档序号:29165425发布日期:2022-03-09 02:20阅读:449来源:国知局
一种基于知识图谱的问答方法及系统与流程

1.本发明涉及人工智能技术领域,特别涉及一种基于知识图谱的问答方法及系统。


背景技术:

2.目前,随着人工智能的发展,自动问答系统逐渐成为人和机器沟通的新模式,它可以在理解用户输入的问句后,针对用户意图返回精准的问句答案。
3.目前版本的faq智能问答系统已经趋于完善,可以完成机器人的智能问答,实现与用户的智能交互。但是对于偏知识型、数据型、以及百科类的事实性知识,带有比较级、最高级、及综合条件查询等形式的问句,基于知识图谱的智能问答能更好的存储数据信息和答案的查询,快速返回符合要求的问题答案。但是,对于一些仍存有争议的问题,当人们通过问答系统进行提问时现有的基于知识图谱的问答系统也只是给出构建知识图谱的数据中的答案,往往对人们形成误导。


技术实现要素:

4.本发明目的之一在于提供了一种基于知识图谱的问答方法,在返回用户答案时,通过标识对答案性质进行说明,实现在具有争议的问题的回答时,不对用户进行误导,提高知识图谱的准确性的表现。
5.本发明实施例提供的一种基于知识图谱的问答方法,包括:接收用户输入的问题;解析问题,确定实体和/或属性和/或关系;基于实体和/或属性和/或关系,从知识图谱中获取问题的答案;将答案返回给用户;获取知识图谱中与答案对应的数据所关联的标识数据;基于标识数据,生成标识并在将答案返回给用户时同步返回;将标识与答案同步呈现给用户。
6.优选的,标识数据通过如下步骤生成:获取构建答案对应在知识图谱内的数据的原始数据;将原始数据与预设的公理数据库中的第一数据进行匹配,当存在匹配符合项时,生成表示公理的标识数据;和/或,将原始数据与预设的定理数据库中的第二数据进行匹配,当存在匹配符合项时,生成表示定理的标识数据;和/或,将原始数据与预设的推理数据库中的第三数据进行匹配,当存在匹配符合项时,生成表示推理的标识数据。
7.优选的,标识数据还通过如下步骤生成:
获取构建答案对应在知识图谱内的数据的原始数据;当原始数据在定理数据库和公理数据库中都不存在匹配符合项时,基于原始数据,构建意见采集问询并将意见采集问询发送至大数据平台;在预设的时间段内接收大数据平台上各个用户对于原始数据是否正确的反馈数据;解析反馈数据,确定认同度和不认同度;当认同度与不认同度的差值在预设的差值范围内时,生成表示争议的标识数据;当不认同度小于认同度且认同度与不认同度的差值在预设的差值范围内时,生成表示公众认同的标识数据;当认同度小于不认同度且认同度与不认同度的差值在预设的差值范围内时,将原始数据和原始数据对应的知识图谱中的数据删除。
8.优选的,解析反馈数据,确定认同度和不认同度,包括:获取反馈数据对应的用户的权威值集合;确定原始数据对应的领域;基于领域从权威值集合中提取用户在领域的权威值;基于权威值的从大到小的顺序,对用户进行排序,形成排序表;当最大的权威值大于预设的阈值时,提取排序表中的前预设个数的用户的权威值作为认同度和不认同度的计算数据并基于提取的权威值计算认同度和不认同度,计算公式如下:;其中,表示认同度;表示不认同度;表示反馈数据为认同的第个用户的权威值;表示反馈数据为不认同的第个用户的权威值;为反馈数据为认同的用户的总数;为反馈数据为不认同的用户的总数。
9.优选的,当意见采集问询发送至大数据平台后,未达到预设的时间段时,生成表示决议中的标识数据;当达到预设的时间后删除表示决议中的标识数据。
10.本发明还提供一种基于知识图谱的问答系统,包括:问题接收模块,用于接收用户输入的问题;解析模块,用于解析问题,确定实体和/或属性和/或关系;提取模块,用于基于实体和/或属性和/或关系,从知识图谱中获取问题的答案;返回模块,用于将答案返回给用户;获取模块,用于获取知识图谱中与答案对应的数据所关联的标识数据;返回模块,还用于基于标识数据,生成标识并在将答案返回给用户时同步返回;呈现模块,用于将标识与答案同步呈现给用户。
11.优选的,标识数据通过如下步骤生成:获取构建答案对应在知识图谱内的数据的原始数据;
将原始数据与预设的公理数据库中的第一数据进行匹配,当存在匹配符合项时,生成表示公理的标识数据;和/或,将原始数据与预设的定理数据库中的第二数据进行匹配,当存在匹配符合项时,生成表示定理的标识数据;和/或,将原始数据与预设的推理数据库中的第三数据进行匹配,当存在匹配符合项时,生成表示推理的标识数据。
12.优选的,标识数据还通过如下步骤生成:获取构建答案对应在知识图谱内的数据的原始数据;当原始数据在定理数据库和公理数据库中都不存在匹配符合项时,基于原始数据,构建意见采集问询并将意见采集问询发送至大数据平台;在预设的时间段内接收大数据平台上各个用户对于原始数据是否正确的反馈数据;解析反馈数据,确定认同度和不认同度;当认同度与不认同度的差值在预设的差值范围内时,生成表示争议的标识数据;当不认同度小于认同度且认同度与不认同度的差值在预设的差值范围内时,生成表示公众认同的标识数据;当认同度小于不认同度且认同度与不认同度的差值在预设的差值范围内时,将原始数据和原始数据对应的知识图谱中的数据删除。
13.优选的,解析反馈数据,确定认同度和不认同度,包括:获取反馈数据对应的用户的权威值集合;确定原始数据对应的领域;基于领域从权威值集合中提取用户在领域的权威值;基于权威值的从大到小的顺序,对用户进行排序,形成排序表;当最大的权威值大于预设的阈值时,提取排序表中的前预设个数的用户的权威值作为认同度和不认同度的计算数据并基于提取的权威值计算认同度和不认同度,计算公式如下:;其中,表示认同度;表示不认同度;表示反馈数据为认同的第个用户的权威值;表示反馈数据为不认同的第个用户的权威值;为反馈数据为认同的用户的总数;为反馈数据为不认同的用户的总数。
14.优选的,当意见采集问询发送至大数据平台后,未达到预设的时间段时,生成表示决议中的标识数据;当达到预设的时间后删除表示决议中的标识数据。
15.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
16.下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
17.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:图1为本发明实施例中一种基于知识图谱的问答方法的示意图;图2为本发明实施例中一种基于知识图谱的问答系统的示意图。
具体实施方式
18.以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
19.本发明实施例提供了一种基于知识图谱的问答方法,如图1所示,包括:步骤s1:接收用户输入的问题;步骤s2:解析问题,确定实体和/或属性和/或关系;步骤s3:基于实体和/或属性和/或关系,从知识图谱中获取问题的答案;步骤s4:将答案返回给用户;步骤s5:获取知识图谱中与答案对应的数据所关联的标识数据;步骤s6:基于标识数据,生成标识并在将答案返回给用户时同步返回;步骤s7:将标识与答案同步呈现给用户。
20.上述技术方案的工作原理及有益效果为:本发明的主要目的是充分利用知识图谱技术,基于知识图谱的智能问答,对问句进行句法分析,实体、数值等关系进行抽取,利用知识图谱存储数据,使其能够回答综合条件查询等复杂句式,从而给与客户更好的交互体验。知识图谱构建页面。利用springboot和vue来完成平台的开发,采用前后端分离设计,将系统进行分模块化开发,方便用户完成实体、关系、实体类型等三元组的添加。知识图谱的导入导出。支持构建完成的知识图谱以excel格式导入导出。知识图谱的动态展示。支持构建完成的知识图谱以图型绘制的形式展示出来,更加直观展示三元组的关系。回答术语的个性化配置。用户可以自定义多种答案话术配置,给与更加人性化的答案。支持多种类型问句回答,具体包括:属性的正查,关系的正查;通过属性反查,通过关系反查;综合属性条件查询(查实体),通过范围查询;最高级查询,异同值判断查询,比较级查询;多重属性值反查,多重属性值和关系并列的反查,多重关系反查,综合查询(查属性)。相比于传统知识中非结构化表达的形式,知识图谱以结构化的方式表达知识,将事物的属性以及事物之间的语义关系显式地表示出来;相比于结构化表达的形式,知识图谱中事物的属性以及事物之间的联系以三元组的形式刻画,更加简洁直观、灵活丰富。对用户友好的知识图谱构建界面,灵活的配置界面,初级交付人员只需要掌握简单的知识图谱概念,能够通过短期培训,快速掌握使用构建知识图谱平台的能力,支持知识图谱的一键导入导出功能,基于同一专业领域构建的知识图谱,可以实现一次构建,多
次复用,现有的faq需要对每个用户意图配置对应的问题答案,而基于知识图谱的智能问答,只要将相关事实知识数据一次构建完成,可以支持多角度的用户提问,灵活多变。支持单挑和多跳问题,基于知识图谱的智能问答能够回答比较级、最高级、范围查询、综合查询查实体、综合查询查属性以及多重属性值关系并列正反查等问题类型,扩展了回答问题的类型,缩短了用户获取价值信息的时间,满足多样化的用户需求,改善了用户体验,能够最大程度满足用户对智能化的期待。
21.在返回用户答案时,将知识图谱中对应答案的数据的标识数据进行同步呈现,以保证用户对答案的有效、来源具有直观的了解;标识包括:定理、公理、推理、争议;不同的标识采用不同的颜色边框设置在答案周围,并且配以不同的文字上标,实现不影响用户对答案的获取的情况下,对标识的展示。例如:对于公理的标识,采用绿色的边框,右上角的文字为“公”。
22.在一个实施例中,标识数据通过如下步骤生成:获取构建答案对应在知识图谱内的数据的原始数据;将原始数据与预设的公理数据库中的第一数据进行匹配,当存在匹配符合项时,生成表示公理的标识数据;和/或,将原始数据与预设的定理数据库中的第二数据进行匹配,当存在匹配符合项时,生成表示定理的标识数据;和/或,将原始数据与预设的推理数据库中的第三数据进行匹配,当存在匹配符合项时,生成表示推理的标识数据。
23.上述技术方案的工作原理及有益效果为:通过预设的公理、定理以及推理库,确定原始数据是否是公理、定理以及推理;进而形成标识数据。
24.在一个实施例中,标识数据还通过如下步骤生成:获取构建答案对应在知识图谱内的数据的原始数据;当原始数据在定理数据库和公理数据库中都不存在匹配符合项时,基于原始数据,构建意见采集问询并将意见采集问询发送至大数据平台;公理和定理是基本原理,具有不可诋毁的公信力,因此无需进行公众认同步骤;在预设的时间段内接收大数据平台上各个用户对于原始数据是否正确的反馈数据;解析反馈数据,确定认同度和不认同度;认同度与不认同度的和值为一;当认同度与不认同度的差值在预设的差值范围内时,生成表示争议的标识数据;通过设置差值范围,确定该原始数据的正确存在争议,即存在一部分人认同原始数据为正确的,一部分人不认同原始数据为正确的;例如差值范围的最小值为0,最大值为0.85;当不认同度小于认同度且认同度与不认同度的差值在预设的差值范围内时,生成表示公众认同的标识数据;当认同度小于不认同度且认同度与不认同度的差值在预设的差值范围内时,将原始数据和原始数据对应的知识图谱中的数据删除,以优化知识图谱的准确性。
25.在一个实施例中,解析反馈数据,确定认同度和不认同度,包括:获取反馈数据对应的用户的权威值集合;权威值集合中的各个权威值对应用户在各个不同领域的权威性;例如当用户为经济学教授或专家时,权威值为100,而在计算机方面的权威值为10;确定原始数据对应的领域;基于领域从权威值集合中提取用户在领域的权威值;基于权威值的从大到小的顺序,对用户进行排序,形成排序表;当最大的权威值大于预设的阈值(例如:90)时,提取排序表中的前预设个数(例如:1000)的用户的权威值作为认同度和不认同度的计算数据并基于提取的权威值计算认同度和不认同度,计算公式如下:;其中,表示认同度;表示不认同度;表示反馈数据为认同的第个用户的权威值;表示反馈数据为不认同的第个用户的权威值;为反馈数据为认同的用户的总数;为反馈数据为不认同的用户的总数。为预设个数。
26.为了便于用户对答案的公信是否处于公众认知征集阶段的获知;在一个实施例中,当意见采集问询发送至大数据平台后,未达到预设的时间段时,生成表示决议中的标识数据;当达到预设的时间后删除表示决议中的标识数据。
27.本发明还提供一种基于知识图谱的问答系统,如图2所示,包括:问题接收模块1,用于接收用户输入的问题;解析模块2,用于解析问题,确定实体和/或属性和/或关系;提取模块3,用于基于实体和/或属性和/或关系,从知识图谱中获取问题的答案;返回模块4,用于将答案返回给用户;获取模块5,用于获取知识图谱中与答案对应的数据所关联的标识数据;返回模块4,还用于基于标识数据,生成标识并在将答案返回给用户时同步返回;呈现模块6,用于将标识与答案同步呈现给用户。
28.优选的,标识数据通过如下步骤生成:获取构建答案对应在知识图谱内的数据的原始数据;将原始数据与预设的公理数据库中的第一数据进行匹配,当存在匹配符合项时,生成表示公理的标识数据;和/或,将原始数据与预设的定理数据库中的第二数据进行匹配,当存在匹配符合项时,生成表示定理的标识数据;和/或,将原始数据与预设的推理数据库中的第三数据进行匹配,当存在匹配符合项时,
生成表示推理的标识数据。
29.优选的,标识数据还通过如下步骤生成:获取构建答案对应在知识图谱内的数据的原始数据;当原始数据在定理数据库和公理数据库中都不存在匹配符合项时,基于原始数据,构建意见采集问询并将意见采集问询发送至大数据平台;在预设的时间段内接收大数据平台上各个用户对于原始数据是否正确的反馈数据;解析反馈数据,确定认同度和不认同度;当认同度与不认同度的差值在预设的差值范围内时,生成表示争议的标识数据;当不认同度小于认同度且认同度与不认同度的差值在预设的差值范围内时,生成表示公众认同的标识数据;当认同度小于不认同度且认同度与不认同度的差值在预设的差值范围内时,将原始数据和原始数据对应的知识图谱中的数据删除。
30.优选的,解析反馈数据,确定认同度和不认同度,包括:获取反馈数据对应的用户的权威值集合;确定原始数据对应的领域;基于领域从权威值集合中提取用户在领域的权威值;基于权威值的从大到小的顺序,对用户进行排序,形成排序表;当最大的权威值大于预设的阈值时,提取排序表中的前预设个数的用户的权威值作为认同度和不认同度的计算数据并基于提取的权威值计算认同度和不认同度,计算公式如下:;其中,表示认同度;表示不认同度;表示反馈数据为认同的第个用户的权威值;表示反馈数据为不认同的第个用户的权威值;为反馈数据为认同的用户的总数;为反馈数据为不认同的用户的总数。
31.优选的,当意见采集问询发送至大数据平台后,未达到预设的时间段时,生成表示决议中的标识数据;当达到预设的时间后删除表示决议中的标识数据。
32.显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1