一种基于电网设备知识图谱的智能问答系统的制作方法

文档序号:32655352发布日期:2022-12-23 21:23阅读:30来源:国知局
一种基于电网设备知识图谱的智能问答系统的制作方法

1.本发明涉及知识图谱技术领域,具体是一种基于电网设备知识图谱的智能问答系统。


背景技术:

2.随着互联网上信息的爆炸式增长,人们对信息检索的需求越来越大,如何快速、精确、可靠地从大量的、模态多样化的信息中搜索到用户需要的信息,成为一个热门的迫切需要解决的课题;近几年来,知识图谱技术引起了学者们的广泛关注,将知识图谱应用到实际应用中,如智能搜索,问答系统,推荐系统等,可以将互联网的信息,更加准确、高效地传达给人类,其中构建一个垂直领域的知识图谱智能问答系统,可以将该领域内零零散散的知识充分合理地整理到一起,形成一张大的语义网,可以让人更加直观、全面、准确地了解到该领域内的知识。
3.现有的问答系统语义分析功能较差,无法实现对用户输入的自然语言的准备识别,从而导致语义分析结果不准确,与用户需求答案相距较大,答案的错误率很高。且一般答案的排序方式都是按照上传时间排序,导致不能及时为用户提供综合排序较好的内容,问题解答效率较低;基于以上不足,本发明提出一种基于电网设备知识图谱的智能问答系统。


技术实现要素:

4.本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种基于电网设备知识图谱的智能问答系统。
5.为实现上述目的,根据本发明的第一方面的实施例提出一种基于电网设备知识图谱的智能问答系统,包括知识图谱建立模块、问句输入模块、答案检索模块以及问答评估模块;
6.所述知识图谱建立模块用于爬取互联网上各个网络平台中关于电网设备的数据源,建立针对电网设备的知识图谱,并将所述知识图谱存储在数据库中;所述问句输入模块用于接收用户输入的问题语句,并对问题语句进行分词,提取得到所述问题语句中的一个或多个关键词;
7.所述答案检索模块用于根据所述关键词从知识图谱中进行检索,生成多项检索结果,并将所述多项检索结果进行相关性排序,将信联系数tg排序前五的检索结果推送至语义处理模块;
8.所述语义处理模块用于对接收到的检索结果进行自然语义处理,并将自然语义处理后的检索结果作为答案输出至显示模块,供用户查阅;
9.所述问答评估模块用于对预设间隔时间内的答案检索记录做指定处理,得到所述答案检索模块的解答估值,并将解答估值jg经服务器传输至显示模块进行实时显示,供相关人员直观了解。
10.进一步地,其中,所述答案检索模块的具体工作步骤为:
11.获取多项检索结果;对检索结果进行关键词提取,然后将检索结果的关键词与分词提取得到的关键词进行匹配,获取得到关键词重合度ch;
12.统计检索结果的平台分布数量为l1;采集检索结果的查阅记录,所述查阅记录包括查阅时刻以及是否共享;共享包括分享、收藏、转发等行为特征;
13.根据查阅记录对检索结果的共享吸引系数cf进行评估;
14.将关键词重合度、平台分布数量以及共享吸引系数进行归一化处理并取其数值,利用公式tg=ch
×
g1+l1
×
g2+cf
×
g3计算得到对应检索结果的信联系数tg,其中g1、g2、g3均为系数因子。
15.进一步地,其中,共享吸引系数cf的具体评估过程为:
16.针对某个检索结果,在预设时间段内,统计该检索结果的共享次数为xb;截取相邻两次共享之间的时间段为共享缓冲时段,将每个共享缓冲时段内该检索结果的查阅次数标记为共享缓冲频次xpi;
17.将共享缓冲频次xpi与缓冲阈值相比较;统计xpi小于缓冲阈值的次数为p1,将对应xpi与缓冲阈值的差值进行求和得到差缓总值pt;利用公式cz=p1
×
g4+pt
×
g5计算得到差缓系数cz,其中g4、g5为系数因子;
18.利用公式计算得到对应检索结果的共享吸引系数cf,其中b1、b2为系数因子。
19.进一步地,其中,分词采用字典匹配法或词频统计法,提取得到所述问题语句中的一个或多个关键词,并根据关键词在问题语句中出现的频率对所述关键词进行排序,将关键词按照排序依次输入至答案检索模块。
20.进一步地,还包括评价模块,所述评价模块用于用户对问答服务进行评价,并将评价系数和对应的解决信号或未解决信号发送至服务器;所述服务器用于将答案检索模块的检索时长、评价系数以及对应的信号融合形成答案检索记录并进行存储,其中所述评价系数的规则为:对显示的检索结果进行评分,满分为10分。
21.进一步地,所述问答评估模块的具体处理步骤如下:
22.在预设间隔时间内,统计答案检索模块的检索总次数为z1;将每个答案检索记录中的检索时长标记为ti,评价系数标记为pi,利用公式jsi=(pi
×
a1)/(ti
×
a2)计算得到检索值jsi,其中a1、a2均为系数因子;
23.将检索值jsi与预设检索阈值相比较;统计jsi大于预设检索阈值的次数占比为zb,当jsi大于预设检索阈值时,获取jsi与预设检索阈值的差值进行求和得到超检总值cj,利用公式jy=zb
×
a3+cj
×
a4计算得到检优系数jy,其中a3、a4均为系数因子;
24.获取答案检索记录中的解决信号和未解决信号,统计未解决占比为wb;利用公式jg=(z1
×
k1+jy
×
k2)/(wb
×
k3)计算得到答案检索模块的解答估值jg,其中k1、k2、k3均为权重因子,且k1+k2+k3=1。
25.进一步地,所述显示模块包括选中单元,用户查阅过显示模块显示的检索结果后,通过选中单元选中检索结果作为答案反馈至答案检索模块;所述答案检索模块用于将反馈的答案存储到数据库中,对所述知识图谱进行更新。
26.进一步地,所述问句输入模块还用于用户向服务器上传问题语句及其对应的答案,服务器用于将问题语句及其对应的答案存储至数据库中。
27.与现有技术相比,本发明的有益效果是:
28.1、本发明中所述问句输入模块用于接收用户输入的问题语句,并对问题语句进行分词,提取得到所述问题语句中的一个或多个关键词;并根据关键词在问题语句中出现的频率对所述关键词进行排序,将关键词按照排序依次输入至答案检索模块,提高检索效率;所述答案检索模块用于根据所述关键词从知识图谱中进行检索,生成相应的检索结果,并将所述多项检索结果进行相关性排序,将信联系数tg排序前五的检索结果经语义处理模块进行自然语义处理后作为答案输出至显示模块,供用户查阅,提高解答效率和准确率;
29.2、本发明中所述评价模块用于用户对问答服务进行评价,并将评价系数和对应的解决信号或未解决信号发送至服务器;所述服务器用于将答案检索模块的检索时长、评价系数以及对应的信号融合形成答案检索记录;所述问答评估模块用于对预设间隔时间内的答案检索记录做指定处理,结合检索总次数、检优系数以及未解决占比,计算得到答案检索模块的解答估值jg,并将解答估值jg经服务器传输至显示模块进行实时显示,供相关人员直观了解所述问答系统的解答服务水平,同时方便管理人员对所述问答系统的检索机制进行优化,提高问答系统的解答效率和准确率。
附图说明
30.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
31.图1为本发明一种基于电网设备知识图谱的智能问答系统的系统框图。
具体实施方式
32.下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
33.如图1所示,一种基于电网设备知识图谱的智能问答系统,包括知识图谱建立模块、数据库、问句输入模块、答案检索模块、语义处理模块、显示模块、评价模块、服务器以及问答评估模块;
34.知识图谱建立模块用于爬取互联网上各个网络平台中关于电网设备的数据源,建立针对电网设备的知识图谱,并将知识图谱存储在数据库中;
35.问句输入模块用于接收用户输入的问题语句,并对问题语句进行分词,提取得到问题语句中的一个或多个关键词;
36.其中,分词采用字典匹配法或词频统计法,提取得到问题语句中的一个或多个关键词,并根据关键词在问题语句中出现的频率对关键词进行排序,将关键词按照排序依次输入至答案检索模块;
37.答案检索模块用于根据关键词从知识图谱中进行检索,生成相应的检索结果,并将多项检索结果进行相关性排序,将排序前五的检索结果推送至语义处理模块;
38.其中,答案检索模块的具体工作步骤为:
39.获取多项检索结果;对检索结果进行关键词提取,然后将检索结果的关键词与分词提取得到的关键词进行匹配,获取得到关键词重合度ch;例如:检索结果的关键词为“a,b,c”;分词提取得到的关键词为“b,c,d”,其中有两个关键词与分词提取得到的关键词一致,则ch=2/3=66.67%;
40.统计检索结果的平台分布数量为l1;采集检索结果的查阅记录,查阅记录包括查阅时刻以及是否共享;共享包括分享、收藏、转发等行为特征;
41.根据查阅记录对检索结果的共享吸引系数cf进行评估;
42.将关键词重合度、平台分布数量以及共享吸引系数进行归一化处理并取其数值,利用公式tg=ch
×
g1+l1
×
g2+cf
×
g3计算得到对应检索结果的信联系数tg,其中g1、g2、g3均为系数因子;
43.将多项检索结果按照信联系数tg大小进行排序;将排序前五的检索结果推送至语义处理模块;
44.其中,共享吸引系数cf的具体评估过程为:
45.针对某个检索结果,在预设时间段内,统计该检索结果的共享次数为xb;截取相邻两次共享之间的时间段为共享缓冲时段,将每个共享缓冲时段内该检索结果的查阅次数标记为共享缓冲频次xpi;
46.将共享缓冲频次xpi与缓冲阈值相比较;统计xpi小于缓冲阈值的次数为p1,将对应xpi与缓冲阈值的差值进行求和得到差缓总值pt;利用公式cz=p1
×
g4+pt
×
g5计算得到差缓系数cz,其中g4、g5为系数因子;
47.利用公式计算得到对应检索结果的共享吸引系数cf,其中b1、b2为系数因子;
48.语义处理模块用于对接收到的检索结果进行自然语义处理,并将自然语义处理后的检索结果作为答案输出至显示模块,供用户查阅;
49.评价模块用于用户对问答服务进行评价,并将评价系数发送至服务器;评价系数的规则为:对显示的检索结果进行评分,满分为10分;
50.评价模块还用于用户发送解决信号或未解决信号至服务器;服务器用于将答案检索模块的检索时长、评价系数以及对应的信号融合形成答案检索记录并进行存储;
51.问答评估模块与服务器相连接,用于对预设间隔时间内的答案检索记录做指定处理,得到答案检索模块的解答估值,具体处理步骤如下:
52.在预设间隔时间内,统计答案检索模块的检索总次数为z1;将每个答案检索记录中的检索时长标记为ti,评价系数标记为pi,利用公式jsi=(pi
×
a1)/(ti
×
a2)计算得到检索值jsi,其中a1、a2均为系数因子;
53.将检索值jsi与预设检索阈值相比较;统计jsi大于预设检索阈值的次数占比为zb,当jsi大于预设检索阈值时,获取jsi与预设检索阈值的差值进行求和得到超检总值cj,利用公式jy=zb
×
a3+cj
×
a4计算得到检优系数jy,其中a3、a4均为系数因子;
54.获取答案检索记录中的解决信号和未解决信号,统计未解决占比为wb;将检索总次数、检优系数以及未解决占比进行归一化处理并取其数值,利用公式jg=(z1
×
k1+jy
×
k2)/(wb
×
k3)计算得到答案检索模块的解答估值jg,其中k1、k2、k3均为权重因子,且k1+k2+k3=1;
55.问答评估模块用于将解答估值jg经服务器传输至显示模块进行实时显示,供相关人员直观了解问答系统的解答服务水平,同时方便管理人员对问答系统的检索机制进行优化;
56.显示模块包括选中单元,用户查阅过显示模块显示的检索结果后,通过选中单元选中检索结果作为答案反馈至答案检索模块;答案检索模块用于将反馈的答案存储到数据库中,对知识图谱进行更新;
57.问句输入模块还用于用户向服务器上传问题语句及其对应的答案,服务器用于将问题语句及其对应的答案存储至数据库中,进一步对知识图谱进行更新,提高问答系统的解答效率和准确率。
58.上述公式均是去除量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最接近真实情况的一个公式,公式中的预设参数和预设阈值由本领域的技术人员根据实际情况设定或者大量数据模拟获得。
59.本发明的工作原理:
60.一种基于电网设备知识图谱的智能问答系统,在工作时,问句输入模块用于接收用户输入的问题语句,并对问题语句进行分词,提取得到问题语句中的一个或多个关键词;并根据关键词在问题语句中出现的频率对关键词进行排序,将关键词按照排序依次输入至答案检索模块,提高检索效率;答案检索模块用于根据关键词从知识图谱中进行检索,生成相应的检索结果,并将多项检索结果进行相关性排序,将信联系数tg排序前五的检索结果经语义处理模块进行自然语义处理后作为答案输出至显示模块,供用户查阅,提高解答效率和准确率;
61.评价模块用于用户对问答服务进行评价,并将评价系数和对应的解决信号或未解决信号发送至服务器;服务器用于将答案检索模块的检索时长、评价系数以及对应的信号融合形成答案检索记录;问答评估模块用于对预设间隔时间内的答案检索记录做指定处理,结合检索总次数、检优系数以及未解决占比,计算得到答案检索模块的解答估值jg,并将解答估值jg经服务器传输至显示模块进行实时显示,供相关人员直观了解问答系统的解答服务水平,同时方便管理人员对问答系统的检索机制进行优化,提高问答系统的解答效率和准确率。
62.在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
63.以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原
理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1