一种基于自学习的电网知识图谱构建方法与流程

文档序号:33988776发布日期:2023-04-29 14:28阅读:52来源:国知局
一种基于自学习的电网知识图谱构建方法与流程

本发明涉及电网知识图谱领域,尤其涉及一种基于自学习的电网知识图谱构建方法。


背景技术:

1、现有技术中电网领域数据集面临知识稀疏、知识分散等问题;具备深度知识的行业知识图谱快速工业化能力严重不足、人员投入成本不可控等问题。


技术实现思路

1、鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种基于自学习的电网知识图谱构建方法。

2、根据本发明的一个方面,提供了一种基于自学习的电网知识图谱构建方法,所述构建方法包括:

3、采用bootstrapping句法模板以及远监督的方案来构建样本;

4、基于所述样本采用pipeline的方式来进行开放知识挖掘;

5、采用多维度低资源信息的抽取,获得抽取信息;

6、对所述抽取信息进行融合,获得融合信息;

7、根据所述融合信息构建电网知识图谱。

8、可选的,所述基于所述样本采用pipeline的方式来进行开放知识挖掘具体包括:先做关系分类判定,再对确定的关系类型进行序列标注subject及object。

9、可选的,所述采用多维度低资源信息的抽取,获得抽取信息具体包括:

10、综合运用基于电力行业适配语料的持续预训练技术、行业词汇增强技术、标签翻转主动学习技术、positive-unlabeled半监督学习技术及少次学习技术记性资源信息抽取。

11、可选的,所述对所述抽取信息进行融合,获得融合信息具体包括:

12、采用融合深度学习语义匹配模型、基于电力词林的术语成分分析及基于mobilenet电力多模态信息匹配的消歧技术,对所述抽取信息融合。

13、可选的,所述多模态信息匹配具体包括:

14、多模态数据特征表示;

15、多模态数据语义关系计算。

16、可选的,所述多模态数据特征表示具体包括:

17、在对多模态数据进行关系计算前,首行需要提取多模态数据的特征表示;根据各类数据情况,采取相应的特征表示方法。

18、可选的,所述多模态数据语义关系计算具体包括:采用了基于多模态类型数据的细粒度上下文信息,同时实现至少3种以上不同模态数据类型之间的语义对齐和分布对齐。

19、本发明提供的一种基于自学习的电网知识图谱构建方法,所述构建方法包括:采用bootstrapping句法模板以及远监督的方案来构建样本;基于所述样本采用pipeline的方式来进行开放知识挖掘;采用多维度低资源信息的抽取,获得抽取信息;对所述抽取信息进行融合,获得融合信息;根据所述融合信息构建电网知识图谱。解决数据+学习的自组织难题,实现知识体系构建从人工编辑到半自动构建的跨越,实现了电力知识体系的深度沉淀和自动迭代更新。

20、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。



技术特征:

1.一种基于自学习的电网知识图谱构建方法,其特征在于,所述构建方法包括:

2.根据权利要求1所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述基于所述样本采用pipeline的方式来进行开放知识挖掘具体包括:先做关系分类判定,再对确定的关系类型进行序列标注subject及object。

3.根据权利要求1所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述采用多维度低资源信息的抽取,获得抽取信息具体包括:

4.根据权利要求1所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述对所述抽取信息进行融合,获得融合信息具体包括:

5.根据权利要求4所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述多模态信息匹配具体包括:

6.根据权利要求5所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述多模态数据特征表示具体包括:

7.根据权利要求5所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述多模态数据语义关系计算具体包括:采用了基于多模态类型数据的细粒度上下文信息,同时实现至少3种以上不同模态数据类型之间的语义对齐和分布对齐。


技术总结
本发明提供的一种基于自学习的电网知识图谱构建方法,所述构建方法包括:采用bootstrapping句法模板以及远监督的方案来构建样本;基于所述样本采用pipeline的方式来进行开放知识挖掘;采用多维度低资源信息的抽取,获得抽取信息;对所述抽取信息进行融合,获得融合信息;根据所述融合信息构建电网知识图谱。解决数据+学习的自组织难题,实现知识体系构建从人工编辑到半自动构建的跨越,实现了电力知识体系的深度沉淀和自动迭代更新。

技术研发人员:邵晶晶,王尧,宋云奎,沈宇红,柴雁欣,甘莹,郭彤彤,符飞虎
受保护的技术使用者:南方电网数字电网研究院有限公司
技术研发日:
技术公布日:2024/1/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1