一种面向智能运维的电力变压器知识图谱构建方法

文档序号:34137418发布日期:2023-05-12 19:06阅读:143来源:国知局
一种面向智能运维的电力变压器知识图谱构建方法

本发明涉及知识图谱构建,具体涉及一种面向智能运维的电力变压器知识图谱构建方法。


背景技术:

1、当前变压器运维主要依赖传统经验,导致运维措施可解释性较弱,且运维人员对故障变化反应较慢,无法及时对故障进行快速准确处理。同时变压器故障时常发生,电力变压器结构复杂,不同类型的变压器运维方式存在差异,变压器运维对运维人员技术能力要求较高,难度较大。电力系统积累了大量的故障处理案例,主要为结构化与半结构化的文本,如何从海量的数据中快速、准确地提取出有价值的信息,使用数据驱动的方式进行变压器智能运维,是目前电力领域迫切需要解决的问题。

2、知识图谱的概念在2012年由谷歌正式提出,其本质上是实体关系的语义网络,目前被用来泛指大规模的数据库。目前在其他领域智能决策、设备运维中知识图谱的研究开展较早,应用较为广泛。当前,在电力系统设备运维领域鲜有知识图谱参与,故将知识图谱与电力变压器智能运维相结合具有较为广阔的应用前景与使用价值。

3、目前,知识图谱的实体抽取方法主要有基于模板和词典、基于传统机器学习和基于深度学习等方法。知识图谱关系抽取旨在抽取句子中已经识别的实体之间的实体类别,关系抽取的结果多使用三元组<实体1,实体关系,实体2>的形式来进行存储。知识图谱的构建在其他领域中已经有了一定的研究进展,在电力领域尚属起步阶段。

4、当前,电力领域知识抽取技术多使用基于规则匹配以及传统的机器学习方法,灵活度较低,难以处理海量的、快速变化的电力领域运维数据。深度学习在自然语言处理(nlp)领域中的迅速发展,使得命名实体识别、关系抽取等任务处理的效率显著提升,故可将深度学习算法与知识图谱构建紧密结合,应用于电力变压器运维领域。目前研究的基于条件随机场(crf)模型和双向长短期记忆网络(bilstm)模型对电力实体抽取的效果,得出条件随机场模型能够更好的识别电力领域实体的结论,但此技术并未对电力领域知识图谱的构建方法做出进一步研究。


技术实现思路

1、为解决上述问题,本发明提出了一种面向智能运维的电力变压器知识图谱构建方法,尝试将知识图谱首次应用于电力变压器智能运维领域,且应用深度学习算法可解决知识图谱构建效率较低的问题。

2、为实现上述目的,本发明提供了一种面向智能运维的电力变压器知识图谱构建方法,包括以下步骤:

3、获取电力变压器语料信息并对所述电力变压器语料信息进行预处理;

4、基于bilstm-crf深度学习算法从预处理后的所述电力变压器语料信息中抽取电力变压器运维实体;

5、采用融合albert预训练模型的albert-bilstm-attention算法抽取所述电力变压器运维实体之间的关系,获得变压器运维实体三元组;

6、利用neo4j图数据库进行所述变压器运维实体三元组的存储以及可视化展示,实现了电力变压器运维知识图谱的构建。

7、优选的,所述电力变压器语料信息包括:变压器运维非结构化文本和变压器运维半结构化文本;其中,所述变压器运维非结构化文本包括:变压器运维文献和互联网爬取文档;所述变压器运维半结构化文本包括:变压器事故处理报告和变压器异常分析报告。

8、优选的,对所述电力变压器语料信息进行预处理的方法包括:

9、对所述电力变压器语料信息进行数据清洗,并对数据清洗后的所述电力变压器语料信息进行标注;

10、基于正则匹配算法,对所述电力变压器语料信息进行样本生成及数据增强。

11、优选的,基于正则匹配算法,对所述电力变压器语料信息进行样本生成及数据增强的方法包括:

12、准备电力变压器运维词典,其中,所述电力变压器运维词典为电力变压器运维领域专业信息;

13、基于正则表达式匹配的方法,对所述变压器运维文献、所述互联网爬取文档、所述变压器事故处理报告以及所述变压器异常分析报告中的所述电力变压器运维词典进行匹配转换,生成数据增强的样本。

14、优选的,基于bilstm-crf深度学习算法从预处理后的所述电力变压器语料信息中抽取5545个电力变压器运维实体。

15、优选的,在抽取所述电力变压器运维实体之间的关系时,融合albert预训练模型,在bilstm的基础上引入attention注意力机制,所述attention注意力机制对于关系分类起重要作用的字赋予一个权重。

16、优选的,基于albert-bilstm-attention算法抽取3529个所述电力变压器运维实体之间的关系。

17、优选的,所述方法还包括:通过f1分数分别对实体抽取和关系抽取的结果进行评价。

18、优选的,利用neo4j图数据库将所述变压器运维实体三元组存储为csv文件格式。

19、与现有技术相比,本发明具有如下优点和技术效果:

20、(1)基于网络爬取文档以及变压器运维报告等预料信息,提出了电力变压器运维知识图谱构建思路,构建出知识图谱本体层,包含变压器型号、部件、缺陷、属性、试验方法、保护措施等6类本体。

21、(2)对电力变压器语料进行预处理以及样本生成,基于bilstm-crf的深度学习算法抽取出了变压器运维实体,实体抽取准确率可达97.33%,并通过对比试验验证了此算法的优越性。

22、(3)采用融合albert预训练模型的albert-bilstm-attention算法抽取了变压器运维实体关系,并与其他两个深度学习关系抽取算法进行对比实验,此算法f1分数达到95.1%,较好地实现了电力变压器运维领域实体间关系抽取任务。

23、(4)将5545个实体及3529个实体关系存储至neo4j数据库构建出了变压器运维知识图谱并实现可视化,同时阐述了电力变压器运维知识图谱应用前景。

24、(5)本申请提出了电力变压器运维知识图谱的构建方法并首次实现了面向智能运维的电力变压器图谱的构建工作,是知识图谱在该领域的初次探索与创新。



技术特征:

1.一种面向智能运维的电力变压器知识图谱构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的面向智能运维的电力变压器知识图谱构建方法,其特征在于,所述电力变压器语料信息包括:变压器运维非结构化文本和变压器运维半结构化文本;其中,所述变压器运维非结构化文本包括:变压器运维文献和互联网爬取文档;所述变压器运维半结构化文本包括:变压器事故处理报告和变压器异常分析报告。

3.根据权利要求2所述的面向智能运维的电力变压器知识图谱构建方法,其特征在于,对所述电力变压器语料信息进行预处理的方法包括:

4.根据权利要求3所述的面向智能运维的电力变压器知识图谱构建方法,其特征在于,基于正则匹配算法,对所述电力变压器语料信息进行样本生成及数据增强的方法包括:

5.根据权利要求1所述的面向智能运维的电力变压器知识图谱构建方法,其特征在于,基于bilstm-crf深度学习算法从预处理后的所述电力变压器语料信息中抽取5545个电力变压器运维实体。

6.根据权利要求1所述的面向智能运维的电力变压器知识图谱构建方法,其特征在于,

7.根据权利要求1所述的面向智能运维的电力变压器知识图谱构建方法,其特征在于,基于albert-bilstm-attention算法抽取3529个所述电力变压器运维实体之间的关系。

8.根据权利要求1所述的面向智能运维的电力变压器知识图谱构建方法,其特征在于,所述方法还包括:通过f1分数分别对实体抽取和关系抽取的结果进行评价。

9.根据权利要求1所述的面向智能运维的电力变压器知识图谱构建方法,其特征在于,利用neo4j图数据库将所述变压器运维实体三元组存储为csv文件格式。


技术总结
本发明提供了一种面向智能运维的电力变压器知识图谱构建方法,包括以下步骤:获取电力变压器语料信息并对所述电力变压器语料信息进行预处理;基于BiLSTM‑CRF深度学习算法从预处理后的所述电力变压器语料信息中抽取电力变压器运维实体;采用融合Albert预训练模型的Albert‑BiLSTM‑Attention算法抽取所述电力变压器运维实体之间的关系,获得变压器运维实体三元组;利用Neo4j图数据库进行所述变压器运维实体三元组的存储以及可视化展示,实现了电力变压器运维知识图谱的构建。本发明尝试将知识图谱首次应用于电力变压器智能运维领域,且应用深度学习算法可解决知识图谱构建效率较低的问题。

技术研发人员:谢庆,王春鑫,蔡扬,谢军,张雨桐,段祺君,李靖航,徐之康
受保护的技术使用者:华北电力大学
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1