基于GNN的电网知识图谱多跳推理方法与系统

文档序号:37795170发布日期:2024-04-30 17:05阅读:7来源:国知局
基于GNN的电网知识图谱多跳推理方法与系统

本发明属于电网知识图谱领域,具体涉及基于gnn的电网知识图谱多跳推理方法与系统。


背景技术:

1、传统的电网运维中,大部分工作需要靠人力来完成,工作效率低、管理不方便、运维水平参差不齐,同时运维人员难以主动发现问题,大部分问题由用户发现,由于用户的不专业对故障的描述存在偏差,用户的描述和现场发现的问题不一致,从而严重影响对故障问题抢修的时间。一种可能解决上述问题的方法是采用kg(knowledge graph,知识图谱)实现智能运维。

2、kg(knowledge graph,知识图谱)被广泛应用于智能应用中,为各种下游自然语言处理任务提供了坚实的基础,如语言建模、问答和机器阅读理解。然而,阻碍其使用的一个主要瓶颈是人工标注和提取知识的不完整性和知识的迭代性,因此知识推理对于知识图谱来说意义重大。

3、知识推理的目的是利用已有的知识推断出新的知识,从而丰富知识图谱。知识图谱通常使用三元组(头实体,关系,尾实体)进行知识表示,然后通过知识推理就可以利用已有的三元组推理出新的三元组。然而,现有的电网it运维领域的知识图谱中的三元组数量不足,使用传统的方法和匮乏的知识不足以对电网it运维领域的知识图谱进行推理。因此在电网it运维领域需要更加全面、准确、高效的知识推理。


技术实现思路

1、为解决现有技术中存在的不足,本发明提出了一种基于gnn(graphneuralnetwork,图神经网络)的电网知识图谱多跳推理方法和系统,能够实现对知识图谱的补全,且不需要进行路径的预训练,使用gnn对多跳邻居进行聚合,减轻噪声带来的影响。

2、本发明采用如下的技术方案。

3、本发明提供一种基于gnn的电网知识图谱多跳推理方法。该方法包括以下步骤:

4、步骤1,获取用于电网运维的知识图谱,将所述知识图谱中已有的三元组作为训练集;其中,所述三元组包括源实体、查询关系和目标实体;

5、步骤2,基于所述训练集中各三元组的所述源实体和所述查询关系进行路径搜索;所述路径搜索包括:根据当前实体的状态,通过策略网络确定下一实体;所述当前实体的状态由当前实体、所述查询关系、所述源实体到当前实体的历史路径信息、当前实体的基于gnn的多跳邻域聚合信息来表征;

6、步骤3,根据各三元组的路径搜索结果和对应目标实体之间的差异,对所述策略网络进行训练;

7、步骤4,用训练的策略网络对包含未知目标实体的查询三元组进行知识推理,得到新三元组并添加到当前知识图谱中。

8、在一个实施例中,步骤1中:

9、所述源实体包括营销系统、数据库、系统运行状态、运维人员中的一者或多者;

10、所述查询关系包括执行、位于、职位、发生故障中的一者或多者;

11、所述目标实体包括宕机、系统离线、系统崩溃、重启服务器中的一者或多者。

12、在一个实施例中,步骤2中,当前实体的基于gnn的多跳邻域聚合信息通过以下步骤得到:

13、步骤21,确定gnn中的当前层,基于当前实体的目标邻居实体在当前层的隐藏表示和当前实体在当前层的隐藏表示分别建立查询和键;

14、步骤22,将目标邻居实体在当前层的隐藏表示和由目标邻居实体到当前实体的查询关系进行拼接操作,得到注意力值;

15、步骤23,使用所述查询值、键值和注意力值确定目标邻居实体在当前层的注意力权重;

16、步骤24,对各目标邻居实体在当前层的注意力权重进行聚合,得到当前实体在gnn的下一层的隐藏表示;

17、步骤25,将当前实体在gnn的最后一层的隐藏表示作为当前实体的多跳邻域聚合信息。

18、在一个实施例中,步骤2中,所述源实体到当前实体的历史路径信息通过以下公式确定:

19、

20、式中,ht表示所述源实体到当前实体的历史路径信息,ht-1表示所述源实体到当前实体的上一实体的历史路径信息,表示当前实体的上一实体的动作的嵌入,其中rt和et分别为当前查询关系的基于嵌入的向量表示和当前实体的基于嵌入的向量表示。

21、在一个实施例中,步骤2中,所述路径搜索还包括:当下一实体为所述目标实体或所述路径搜索经过的实体数目达到预定值时停止所述路径搜索。

22、在一个实施例中,步骤3包括如下步骤:

23、步骤31,根据各三元组的路径搜索结果和对应目标实体之间的差异计算各三元组进行路径搜索的奖励值;

24、步骤32,以各三元组的预期累计奖励值最大化为目标,实现对所述策略网络的训练。

25、在一个实施例中,步骤31中所述奖励值通过如下公式确定:

26、

27、式中,t为当前时刻,es表示源实体,rq表示查询关系,et表示当前时刻所到达的当前实体,eo表示所述目标实体;f(es,rq,et)为用于根据et和eo的差异确定奖励值的三元组评分函数。

28、本发明还提供一种基于gnn的电网知识图谱多跳推理方法系统。所述系统包括:

29、获取模块,用于获取用于电网运维的知识图谱,并将所述知识图谱中已有的三元组作为训练集;其中,所述三元组包括源实体、查询关系和目标实体;

30、搜索模块,用于用于基于所述训练集中各三元组的所述源实体和所述查询关系进行路径搜索;所述路径搜索包括:根据当前实体的状态,通过策略网络确定下一实体;所述当前实体的状态由当前实体、所述查询关系、所述源实体到当前实体的历史路径信息、当前实体的基于gnn的多跳邻域聚合信息来表征;

31、训练模块,用于根据各三元组的路径搜索结果和对应目标实体之间的差异,对所述策略网络进行训练;

32、补全模块,用于用训练的策略网络对包含未知目标实体的查询三元组进行知识推理,得到新三元组并添加到当前知识图谱中。

33、本发明还提供一种终端。所述终端包括处理器及存储介质;所述存储介质用于存储指令;所述处理器用于根据所述指令进行操作以执行如下步骤:

34、步骤1,获取用于电网运维的知识图谱,将所述知识图谱中已有的三元组作为训练集;其中,所述三元组包括源实体、查询关系和目标实体;

35、步骤2,基于所述训练集中各三元组的所述源实体和所述查询关系进行路径搜索;所述路径搜索包括:根据当前实体的状态,通过策略网络确定下一实体;所述当前实体的状态由当前实体、所述查询关系、所述源实体到当前实体的历史路径信息、当前实体的基于gnn的多跳邻域聚合信息来表征;

36、步骤3,根据各三元组的路径搜索结果和对应目标实体之间的差异,对所述策略网络进行训练;

37、步骤4,用训练的策略网络对包含未知目标实体的查询三元组进行知识推理,得到新三元组并添加到当前知识图谱中。

38、本发明还提供一种计算机可读存储介质。所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现以下步骤:

39、步骤1,获取用于电网运维的知识图谱,将所述知识图谱中已有的三元组作为训练集;其中,所述三元组包括源实体、查询关系和目标实体;

40、步骤2,基于所述训练集中各三元组的所述源实体和所述查询关系进行路径搜索;所述路径搜索包括:根据当前实体的状态,通过策略网络确定下一实体;所述当前实体的状态由当前实体、所述查询关系、所述源实体到当前实体的历史路径信息、当前实体的基于gnn的多跳邻域聚合信息来表征;

41、步骤3,根据各三元组的路径搜索结果和对应目标实体之间的差异,对所述策略网络进行训练;

42、步骤4,用训练的策略网络对包含未知目标实体的查询三元组进行知识推理,得到新三元组并添加到当前知识图谱中。

43、本发明的有益效果在于,与现有技术相比,

44、1.在推理过程中引入了gnn对当前实体节点来实现多跳邻居聚合,从而增强模型的表达能力。进一步地,引入注意力机制,通过学习邻居节点的权重,可以实现对不同关系邻居的加权聚合,排除多余的噪声信息。因此,gnn不仅可以依据多跳上下文信息有效表达实体和关系,并且根据关系的不同可以区分邻居节点的影响,对于噪声邻居也有较强的鲁棒性。

45、2.使用基于深度强化学习的多跳知识推理方法,并使用lstm(long short-termmemory,长短期记忆网络)编码历史路径,可以有效地利用知识图谱的路径信息,其相比知识嵌入模型更具有可解释性,又能解决传统路径推理模型需要预训练的影响。

46、3.可大幅增强电网it运维工作的智能化进程,有利于完成电网it运维领域的人工智能自然语言处理算法和知识图谱技术从零到有的技术突破,掌握依据海量异构电网知识源,抽取运维知识并建立运维知识图谱进行突发故障快速诊断的关键技术。通过将故障分析定位交给智能运维知识图谱,减少人工运维经验依赖,极大提升了突发故障和非工作时段故障的根因定位即时性和准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1