一种基于领域知识图谱的电网智能问答系统

文档序号:37482224发布日期:2024-04-01 13:51阅读:7来源:国知局
一种基于领域知识图谱的电网智能问答系统

本发明涉及智能电网,更具体地说,它涉及一种基于领域知识图谱的电网智能问答系统。


背景技术:

1、随着互联网上信息的爆炸式增长,人们对信息检索的需求越来越大,如何快速、精确、可靠地从大量的、模态多样化的信息中搜索到用户需要的信息,成为一个热门的迫切需要解决的课题;近几年来,知识图谱技术引起了学者们的广泛关注,将知识图谱应用到实际应用中,如智能搜索,问答系统,推荐系统等,可以将互联网的信息,更加准确、高效地传达给人类,其中构建一个垂直领域的知识图谱智能问答系统,可以将该领域内零零散散的知识充分合理地整理到一起,形成一张大的语义网,可以让人更加直观、全面、准确地了解到该领域内的知识。

2、现有的电网智能问答系统是使用模板匹配或规则匹配的方式获取答案,如果对某个问题没有事前定义好可匹配的模板,就无法获取到相应的答案;此外,现有的电网智能问答系统相较于构建电力领域知识图谱时数据源中的文本,用户输入的自然语言问句往往更加简短,可以参考的上下文信息有限,前后向的文本特征提取比较困难。

3、基于上述问题,申请人发明了一种基于领域知识图谱的电网智能问答系统。


技术实现思路

1、本发明的目的是提供一种基于领域知识图谱的电网智能问答系统,该系统解决了背景技术中提到的技术问题。

2、本发明的上述技术目的是通过以下技术方案得以实现的:一种基于领域知识图谱的电网智能问答系统,包括前端展示模块、后端问答逻辑处理模块和数据存储模块;

3、所述前端展示模块用于输入用户自然语言问题,同时将对应的回答结果进行展示;

4、所述后端问答逻辑处理模块用于将用户自然语言进行预处理,并调取数据存储模块中对应的电力领域知识图谱中的信息;所述后端问答逻辑处理模块内嵌设有bert-bilstm-crf实体识别模型和bert-cnn-dssm实体链接模型;所述bert模型为基于关键词模板的改进bert模型;

5、所述bert-bilstm-crf实体识别模型首先将输入的自然语言问题进行预处理得到输入序列的特征表示,然后经过bilstm模型处理得到预测标签,最后输入crf层添加约束,输出最优的预测标签序列,得到实体标注结果;

6、所述bert-cnn-dssm实体链接模型在实体识别任务完成后,将预处理后的低维词向量作为cnn的输入,获得文本特征再输入到dssm层最终获得高度非线性的文本特征;

7、所述数据存储模块内存储有电力领域知识图谱。

8、本发明进一步设置为:所述前端展示模块包括实体查询单元、关系查询单元和智能问答单元;

9、所述实体查询单元用于输入要查询的实体名称,返回在知识图谱中查询到的实体结点以及到该结点距离唯一的结点,以及结点间的关系;

10、所述关系查询单元用于查询关系名称,同时指定关系双方的实体类型,返回在知识图谱中查询到的满足查询条件的实体关系以及关系双方的节点;

11、所述智能问答单元用于输入要提的问题并搜索。

12、本发明进一步设置为:所述数据存储模块中知识图谱的构建方法是:

13、s1:用tf-idf算法抽取关键词;

14、s2:对数据类型定义,完成实体和关系的划分;

15、s3:采用d2r映射法和选用bilstm-crf模型进行实体识别实现对知识抽取;

16、s4:对重复的实体和属性做知识融合。

17、综上所述,本发明具有以下有益效果:

18、1、将改进bert预训练模型与bilstm-crf模型相结合,使用bert-bilstm-crf模型完成实体识别任务在电力领域问答中取得了更好的识别效果;将改进bert预训练模型与cnn-dssm模型结合用于将问句中识别出的实体链接到知识库中的真实实体,相较于目前主流的实体链接方法在电力领域问答情境下更加优越;

19、2、改进bert模型,使用知识建模过程中针对电力领域数据抽取的关键词构建关键词模板,优化bert模型的输入数据处理过程,使用电力领域关键词对输入的自然语言问句进行二次划分,有效改进bert在电力领域的短文本问句实体识别任务中效果不佳的问题;

20、3、使用tf-idf算法结合ecim中的电网本体信息模型进行知识建模,并对其他数据源中的半结构化或非结构化的数据,使用tf-idf算法抽取其中的高频关键词,获得候选的实体、关系和属性类型,经筛选后添加到待抽取的类型中去,完成了对领域本体模型的扩充和对候选实体、关系和属性的清晰划分,提高了后续知识图谱构建环节的质量;

21、4、使用d2r映射与bilstm-crf实体识别模型相结合的知识抽取方法,将关系型数据库中存储的数据映射成rdf三元组,选用bilstm-crf模型进行实体识别,最后通过计算实体的语义相似度进行知识融合,实现了从多源异构数据中构建领域图谱。



技术特征:

1.一种基于领域知识图谱的电网智能问答系统,其特征是:包括前端展示模块、后端问答逻辑处理模块和数据存储模块;

2.根据权利要求1所述的一种基于领域知识图谱的电网智能问答系统,其特征是:所述前端展示模块包括实体查询单元、关系查询单元和智能问答单元;

3.根据权利要求1所述的一种基于领域知识图谱的电网智能问答系统,其特征是:所述数据存储模块中知识图谱的构建方法是:


技术总结
本发明公开了一种基于领域知识图谱的电网智能问答系统,涉及智能电网技术领域,其技术方案要点是:包括前端展示模块、后端问答逻辑处理模块和数据存储模块;所述前端展示模块用于输入用户自然语言问题,同时将对应的回答结果进行展示;所述后端问答逻辑处理模块用于将用户自然语言进行预处理,并调取数据存储模块中对应的电力领域知识图谱中的信息;所述后端问答逻辑处理模块内嵌设有BERT‑BiLSTM‑CRF实体识别模型和BERT‑CNN‑DSSM实体链接模型;所述BERT模型为基于关键词模板的改进BERT模型。将改进BERT预训练模型与BiLSTM‑CRF模型相结合,相较于目前主流的实体链接方法在电力领域问答情境下更加优越。

技术研发人员:王景文,张亶,王鑫,杨漾,周旺,任昊文,宋端正,戴飞豪,李世奇,韩蕾,李彦,龚卿,张晓菡
受保护的技术使用者:浙江大学
技术研发日:
技术公布日:2024/3/31
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1