本发明涉及业务图谱,具体涉及一种电力通信接入网业务的图谱构建方法。
背景技术:
1、随着电网向用户侧不断发展,特别是配网自动化和农网的建设,电力通信接入网应运而生,其主要组成包括olt(光线路终端)、onu(光网络单元)和接入网光缆。
2、随着我国电力行业的不断发展,电力通信接入网的建设规模也在逐渐扩大,大量的电力通信接入网业务数据接入到数据中心,这些数据来源分散、数量巨大、缺乏关联关系,同样的数据可能来源多个业务系统,同一份数据可能分布在多个业务系统中,数据情况非常复杂。然而,现有针对电力通信接入网业务的数据处理方法缺少有效的数据梳理、关联、清洗和聚合,造成数据可用性较差。
技术实现思路
1、(一)解决的技术问题
2、针对现有技术所存在的上述缺点,本发明提供了一种电力通信接入网业务的图谱构建方法,能够有效克服现有技术所存在的无法对数量巨大的电力通信接入网业务数据进行有效管理的缺陷。
3、(二)技术方案
4、为实现以上目的,本发明通过以下技术方案予以实现:
5、一种电力通信接入网业务的图谱构建方法,包括以下步骤:
6、s1、获取电力通信接入网的基础业务数据;
7、s2、根据基础业务数据,确定业务数据信息、业务节点信息和节点关系信息;
8、s3、根据业务节点信息和节点关系信息构建关系图谱;
9、s4、基于关系图谱结合业务数据信息构建电力通信接入网的业务图谱;
10、s5、获取电力通信接入网的实时业务数据,利用实时业务数据对电力通信接入网的业务图谱进行更新。
11、优选地,s2中根据基础业务数据,确定业务数据信息、业务节点信息和节点关系信息,包括:
12、确定基础业务数据中的至少一个目标数据模型,并从目标数据模型中提取业务数据信息;
13、根据目标数据模型中的业务节点数据和不同业务节点数据之间的数据关系,确定业务节点信息和节点关系信息。
14、优选地,所述确定基础业务数据中的至少一个目标数据模型,包括:
15、利用模型识别算法确定基础业务数据中的多个数据模型,并确定各数据模型内的关系数量;
16、若数据模型内的关系数量大于预设阈值,则该数据模型为目标数据模型;
17、其中,数据模型内的关系数量用于表示数据模型内不同数据之间数据关系的总数量。
18、优选地,s2中根据基础业务数据,确定业务数据信息、业务节点信息和节点关系信息,包括:
19、提取基础业务数据中的业务数据信息和业务节点信息,并进行节点关系信息的抽取,得到包括业务节点信息和节点关系信息的实体三元组。
20、优选地,所述基础业务数据包括结构化数据和非结构化数据,所述结构化数据得到实体三元组的方法,包括:
21、提取结构化数据中的实体,以实体名称作为图谱标签进行存储,建立实体关系,包括从属关系、检修关系、缺陷关系、拓扑关系,得到表征结构化数据的实体三元组;
22、所述非结构化数据得到实体三元组的方法,包括:
23、通过事件知识学习,抽取非结构化数据中的实体及实体关系信息,得到表征非结构化数据的实体三元组。
24、优选地,s3中根据业务节点信息和节点关系信息构建关系图谱,包括:
25、根据业务节点信息确定对应的图谱节点,并根据节点关系信息确定各图谱节点之间的节点关系和属性关系;
26、根据图谱节点和图谱节点之间的节点关系、属性关系构建关系图谱。
27、优选地,所述关系图谱采用p1=(p11,p12,...,p1m)表示图谱节点1的集合,p1m表示第m个图谱节点1,m表示图谱节点1的数量;
28、所述关系图谱采用p2=(p21,p22,...,p2n)表示图谱节点2的集合,p2n表示第n个图谱节点2,n表示图谱节点2的数量;
29、所述关系图谱采用e=(e1,e2,...,es)表示节点关系的集合,es表示第s个节点关系,s表示节点关系的数量。
30、优选地,s4中基于关系图谱结合业务数据信息构建电力通信接入网的业务图谱,包括:
31、对业务数据信息与业务节点信息进行匹配,确定业务数据信息与关系图谱中对应的图谱节点;
32、将业务数据信息加载至关系图谱中对应的图谱节点,以构建电力通信接入网的业务图谱。
33、优选地,s5中获取电力通信接入网的实时业务数据,利用实时业务数据对电力通信接入网的业务图谱进行更新,包括:
34、获取电力通信接入网的实时业务数据,利用杰卡德系数计算实时业务数据与业务图谱中各图谱节点的业务数据信息之间的相似度;
35、若存在相似度大于相似度阈值,则将实时业务数据加载至相似度最高的图谱节点,否则进入s2,对电力通信接入网的业务图谱进行补充,以对电力通信接入网的业务图谱进行更新。
36、优选地,所述利用杰卡德系数计算实时业务数据与业务图谱中各图谱节点的业务数据信息之间的相似度,包括:
37、采用下式计算实时业务数据与业务图谱中图谱节点的业务数据信息之间的杰卡德系数:
38、
39、其中,jaccard(m,n)表示实时业务数据m与业务图谱中图谱节点的业务数据信息n之间的杰卡德系数,相似度阈值为0.98。
40、(三)有益效果
41、与现有技术相比,本发明所提供的一种电力通信接入网业务的图谱构建方法,具有以下有益效果:
42、1)获取电力通信接入网的基础业务数据,根据基础业务数据,确定业务数据信息、业务节点信息和节点关系信息,根据业务节点信息和节点关系信息构建关系图谱,基于关系图谱结合业务数据信息构建电力通信接入网的业务图谱,通过构建电力通信接入网的业务图谱能够对电力通信接入网业务数据进行有效的数据梳理和关联,实现对电力通信接入网业务数据的有效管理,提升数据可用性;
43、2)获取电力通信接入网的实时业务数据,利用杰卡德系数计算实时业务数据与业务图谱中各图谱节点的业务数据信息之间的相似度,若存在相似度大于相似度阈值,则将实时业务数据加载至相似度最高的图谱节点,否则对电力通信接入网的业务图谱进行补充,以对电力通信接入网的业务图谱进行更新,从而能够对电力通信接入网业务数据进行有效的数据清洗和聚合,进一步提升数据可用性。
1.一种电力通信接入网业务的图谱构建方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的电力通信接入网业务的图谱构建方法,其特征在于:s2中根据基础业务数据,确定业务数据信息、业务节点信息和节点关系信息,包括:
3.根据权利要求2所述的电力通信接入网业务的图谱构建方法,其特征在于:所述确定基础业务数据中的至少一个目标数据模型,包括:
4.根据权利要求1所述的电力通信接入网业务的图谱构建方法,其特征在于:s2中根据基础业务数据,确定业务数据信息、业务节点信息和节点关系信息,包括:
5.根据权利要求4所述的电力通信接入网业务的图谱构建方法,其特征在于:所述基础业务数据包括结构化数据和非结构化数据,所述结构化数据得到实体三元组的方法,包括:
6.根据权利要求2或4所述的电力通信接入网业务的图谱构建方法,其特征在于:s3中根据业务节点信息和节点关系信息构建关系图谱,包括:
7.根据权利要求6所述的电力通信接入网业务的图谱构建方法,其特征在于:所述关系图谱采用p1=(p11,p12,...,p1m)表示图谱节点1的集合,p1m表示第m个图谱节点1,m表示图谱节点1的数量;
8.根据权利要求6所述的电力通信接入网业务的图谱构建方法,其特征在于:s4中基于关系图谱结合业务数据信息构建电力通信接入网的业务图谱,包括:
9.根据权利要求8所述的电力通信接入网业务的图谱构建方法,其特征在于:s5中获取电力通信接入网的实时业务数据,利用实时业务数据对电力通信接入网的业务图谱进行更新,包括:
10.根据权利要求9所述的电力通信接入网业务的图谱构建方法,其特征在于:所述利用杰卡德系数计算实时业务数据与业务图谱中各图谱节点的业务数据信息之间的相似度,包括: