基于电力营销数据的知识图谱实体及链接提取方法与流程

文档序号:25800710发布日期:2021-07-09 12:28阅读:203来源:国知局
基于电力营销数据的知识图谱实体及链接提取方法与流程

1.本申请涉及电力营销领域,具体而言,涉及一种基于电力营销数据的知识图谱实体及链接提取方法、装置、计算机可读存储介质和处理器。


背景技术:

2.知识图谱以结构化的形式描述客观世界中概念、实体及实体之间的关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱给互联网语义搜索带来了活力,已经成为互联网知识驱动的智能应用的基础设施。知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。
3.知识图谱技术是知识图谱建立和应用的技术,是语义web、自然语言处理和机器学习等的交叉学科。我们将知识图谱技术分为三个部分:知识图谱构建技术、知识图谱查询和推理技术,以及知识图谱应用。在大数据环境下,从互联网开放环境的大数据中获得知识,用这些知识提供智能服务互联网/行业,同时通过互联网可以获得更多的知识。这是一个迭代的相互增强过程,可以实现从互联网信息服务到智能知识服务的跃迁。
4.目前大部分知识图谱的提取是基于互联网大数据全业务的实体及链接提取、存储,并不能对部分的传统业务进行充分提取、存储实体。具体地,现有技术中缺乏一种基于电力营销数据的知识图谱实体及链接提取、存储方法。


技术实现要素:

5.本申请的主要目的在于提供一种基于电力营销数据的知识图谱实体及链接提取方法、装置、计算机可读存储介质和处理器,以解决现有技术中缺乏一种基于电力营销数据的知识图谱实体及链接提取方法的问题。
6.为了实现上述目的,根据本申请的一个方面,提供了一种基于电力营销数据的知识图谱实体及链接提取方法,包括:获取电力营销数据库名;获取电力营销数据表名;获取电力营销数据字段名;获取电力营销数据内容;基于所述电力营销数据库名、所述电力营销数据表名、所述电力营销数据字段名和所述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,所述链接包括电力营销数据库与电力营销数据表之间的关系和所述电力营销数据表与电力营销数据字段之间的关系。
7.进一步地,从电力营销数据中提取出实体,包括:根据所述电力营销数据库名的业务含义,提取所述实体。
8.进一步地,从电力营销数据中提取出实体,包括:根据所述电力营销数据表名的业务含义,提取出所述实体;结合所述实体和所述电力营销数据库名的业务含义,提取出隐含实体。
9.进一步地,从电力营销数据中提取出实体,包括:根据所述电力营销数据字段名,提取出所述实体;结合所述实体、所述电力营销数据表名的业务含义和所述电力营销数据
库名的业务含义,提取出隐含实体。
10.进一步地,从电力营销数据中提取出实体,包括:根据所述电力营销数据内容,提取出所述实体;结合所述实体、所述电力营销数据字段名、所述电力营销数据表名的业务含义和所述电力营销数据库名的业务含义,提取出隐含实体。
11.进一步地,从电力营销数据中提取出链接,包括:提取出具有从属关系的所述电力营销数据库和所述电力营销数据表之间的关系;提取出具有从属关系的所述电力营销数据表和所述电力营销数据字段之间的关系;提取出不具有从属关系的所述电力营销数据表和所述电力营销数据字段之间的关系。
12.进一步地,在从电力营销数据中提取出实体和链接之后,所述方法还包括:构建实体表,所述实体表用于存储提取出的所述实体;构建实体链接表,所述实体链接表用于存储所述链接;构建实体主题表,所述实体主题表用于存储不同的主题以区分所述实体表和所述实体链接表。
13.根据本申请的一个方面,提供了一种基于电力营销数据的知识图谱实体及链接提取装置,包括:第一获取单元,用于获取电力营销数据库名;第二获取单元,用于获取电力营销数据表名;第三获取单元,用于获取电力营销数据字段名;第四获取单元,用于获取电力营销数据内容;提取单元,用于基于所述电力营销数据库名、所述电力营销数据表名、所述电力营销数据字段名和所述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,所述链接包括电力营销数据库与电力营销数据表之间的关系和所述电力营销数据表与电力营销数据字段之间的关系。
14.根据本申请的另一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行任意一种所述的基于电力营销数据的知识图谱实体及链接提取方法。
15.根据本申请的一个方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任意一种所述的基于电力营销数据的知识图谱实体及链接提取方法。
16.应用本申请的技术方案,通过获取电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容,再根据电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接。本方案实现了将知识图谱技术应用于电力营销数据领域,实现了基于电力营销数据的知识图谱实体及链接的提取。
附图说明
17.构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
18.图1示出了根据本申请的实施例的基于电力营销数据的知识图谱实体及链接提取方法流程图;
19.图2示出了根据本申请的实施例的基于电力营销数据的知识图谱实体及链接提取装置示意图。
具体实施方式
20.需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
21.为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
22.需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
23.应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,在说明书以及权利要求书中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
24.正如背景技术中所介绍的,现有技术中缺乏一种基于电力营销数据的知识图谱实体及链接提取方法,为解决如上现有技术中缺乏一种基于电力营销数据的知识图谱实体及链接提取方法的问题,本申请的实施例提供了一种基于电力营销数据的知识图谱实体及链接提取方法、装置、计算机可读存储介质和处理器。
25.根据本申请的实施例,提供了一种基于电力营销数据的知识图谱实体及链接提取方法。
26.图1是根据本申请实施例的基于电力营销数据的知识图谱实体及链接提取方法的流程图。如图1所示,该方法包括以下步骤:
27.步骤s101,获取电力营销数据库名;
28.步骤s102,获取电力营销数据表名;
29.步骤s103,获取电力营销数据字段名;
30.步骤s104,获取电力营销数据内容;
31.步骤s105,基于上述电力营销数据库名、上述电力营销数据表名、上述电力营销数据字段名和上述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,上述链接包括电力营销数据库与电力营销数据表之间的关系和上述电力营销数据表与电力营销数据字段之间的关系。
32.具体地,电力营销数据内容包括分词、词频、词义。
33.具体地,在基于电力营销数据的知识图谱提取实体及链接之前,建立电力营销数据库、电力营销数据表、电力营销数据字段和电力营销数据内容。
34.上述方案中,通过获取电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容,再根据电力营销数据库名、电力营销数据表名、电力营销数据字段
名和电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接。本方案实现了将知识图谱技术应用于电力营销数据领域,实现了基于电力营销数据的知识图谱实体及链接的提取。且提取出的实体更有效和实用。推动了电力相关实体及链接的发掘进程。从业务梳理方面来说,加快了业务整理、关联的步伐。
35.需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
36.本申请的一种实施例中,从电力营销数据中提取出实体,包括:根据上述电力营销数据库名的业务含义,提取上述实体。即可以仅仅根据电力营销数据库名的业务含义,提取出对应的实体,该实体是一个相对较上位的概念。
37.本申请的一种实施例中,从电力营销数据中提取出实体,包括:根据上述电力营销数据表名的业务含义,提取出上述实体;结合上述实体和上述电力营销数据库名的业务含义,提取出隐含实体。即可以先根据数据表名的业务含义,提取出实体,然后再结合数据库名的业务含义,将提取出的实体的隐含含义提出出来,即提取出隐含实体。例如,根据数据表名提出的实体为“用户用电量”,将“用户用电量”放在“小区用电量”这一数据库中可以得到“该用户在本小区的用电量排名”,将“用户用电量”放在“城市用电量”这一数据库中可以得到“该用户在本市的用电量排名”,其中,“该用户在本小区的用电量排名”和“该用户在本市的用电量排名”即为隐含实体。
38.本申请的一种实施例中,从电力营销数据中提取出实体,包括:根据上述电力营销数据字段名,提取出上述实体;结合上述实体、上述电力营销数据表名的业务含义和上述电力营销数据库名的业务含义,提取出隐含实体。即先根据电力营销数据字段名提取出实体,再结合电力营销数据表名的业务含义和上述电力营销数据库名的业务含义提取出实体的隐藏的含义。
39.本申请的一种实施例中,从电力营销数据中提取出实体,包括:根据上述电力营销数据内容,提取出上述实体;结合上述实体、上述电力营销数据字段名、上述电力营销数据表名的业务含义和上述电力营销数据库名的业务含义,提取出隐含实体。
40.本申请的一种实施例中,从电力营销数据中提取出链接,包括:提取出具有从属关系的上述电力营销数据库和上述电力营销数据表之间的关系;提取出具有从属关系的上述电力营销数据表和上述电力营销数据字段之间的关系;提取出不具有从属关系的上述电力营销数据表和上述电力营销数据字段之间的关系。由于实体基于电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容得到的,所以得到电力营销数据库和上述电力营销数据表之间的关系、电力营销数据表和上述电力营销数据字段之间的关系自然就可以得到提取出的不同的实体之间的关系。例如,第一实体是从第一电力营销数据库中提取得到的,第二实体是从第一电力营销数据表中提取得到的,由于第一电力营销数据表隶属于第一电力营销数据库,显然第二实体隶属于第一实体。
41.具体地,数据表一般包含自己拥有的所有字段,所以可以直接提取具有从属关系的数据表与字段的关系;有的数据表可以包括其他数据表的字段,所以也可以提取其他数据表的字段与本数据表的关系。当然,由于相同的字段可以位于不同的数据表中,也可以提取出位于不同的数据表中的相同的字段之间的关系。
parent_id父id theme_code主题编码 theme_name主题名称 theme_desc主题描述 theme_path节点路径 leafed是否为子节点(1是,0否)sort_num排序 52.本申请实施例还提供了一种基于电力营销数据的知识图谱实体及链接提取装置,需要说明的是,本申请实施例的基于电力营销数据的知识图谱实体及链接提取装置可以用于执行本申请实施例所提供的用于基于电力营销数据的知识图谱实体及链接提取方法。以下对本申请实施例提供的基于电力营销数据的知识图谱实体及链接提取装置进行介绍。
53.图2是根据本申请实施例的基于电力营销数据的知识图谱实体及链接提取装置的示意图。如图2所示,该装置包括:
54.第一获取单元10,用于获取电力营销数据库名;
55.第二获取单元20,用于获取电力营销数据表名;
56.第三获取单元30,用于获取电力营销数据字段名;
57.第四获取单元40,用于获取电力营销数据内容;
58.提取单元50,用于基于上述电力营销数据库名、上述电力营销数据表名、上述电力营销数据字段名和上述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,上述链接包括电力营销数据库与电力营销数据表之间的关系和上述电力营销数据表与电力营销数据字段之间的关系。
59.具体地,电力营销数据内容包括分词、词频、词义。
60.具体地,在基于电力营销数据的知识图谱提取实体及链接之前,建立电力营销数据库、电力营销数据表、电力营销数据字段和电力营销数据内容。
61.上述方案中,第一获取单元获取电力营销数据库名、第二获取单元获取电力营销数据表名、第三获取单元获取电力营销数据字段名和第四获取单元获取电力营销数据内容,提取单元根据电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接。本方案实现了将知识图谱技术应用于电力营销数据领域,实现了基于电力营销数据的知识图谱实体及链接的提取。且提取出的实体更有效和实用。推动了电力相关实体及链接的发掘进程。从业务梳理方面来说,加快了业务整理、关联的步伐。
62.本申请的一种实施例中,提取单元还用于根据上述电力营销数据库名的业务含义,提取上述实体。即可以仅仅根据电力营销数据库名的业务含义,提取出对应的实体,该实体是一个相对较上位的概念。
63.本申请的一种实施例中,提取单元包括第一提取模块和第二提取模块,第一提取模块用于根据上述电力营销数据表名的业务含义,提取出上述实体;第二提取模块用于结合上述实体和上述电力营销数据库名的业务含义,提取出隐含实体。即可以先根据数据表名的业务含义,提取出实体,然后再结合数据库名的业务含义,将提取出的实体的隐含含义提出出来,即提取出隐含实体。例如,根据数据表名提出的实体为“用户用电量”,将“用户用
电量”放在“小区用电量”这一数据库中可以得到“该用户在本小区的用电量排名”,将“用户用电量”放在“城市用电量”这一数据库中可以得到“该用户在本市的用电量排名”,其中,“该用户在本小区的用电量排名”和“该用户在本市的用电量排名”即为隐含实体。
64.本申请的一种实施例中,提取单元包括第三提取模块和第四提取模块,第三提取模块用于根据上述电力营销数据字段名,提取出上述实体;第四提取模块用于结合上述实体、上述电力营销数据表名的业务含义和上述电力营销数据库名的业务含义,提取出隐含实体。即先根据电力营销数据字段名提取出实体,再结合电力营销数据表名的业务含义和上述电力营销数据库名的业务含义提取出实体的隐藏的含义。
65.本申请的一种实施例中,提取单元包括第五提取模块和第六提取模块,第五提取模块用于根据上述电力营销数据内容,提取出上述实体;第六提取模块用于结合上述实体、上述电力营销数据字段名、上述电力营销数据表名的业务含义和上述电力营销数据库名的业务含义,提取出隐含实体。
66.本申请的一种实施例中,提取单元包括第七提取模块、第八提取模块和第九提取模块,第七提取模块用于提取出具有从属关系的上述电力营销数据库和上述电力营销数据表之间的关系;第八提取模块用于提取出具有从属关系的上述电力营销数据表和上述电力营销数据字段之间的关系;第九提取模块用于提取出不具有从属关系的上述电力营销数据表和上述电力营销数据字段之间的关系。由于实体基于电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容得到的,所以得到电力营销数据库和上述电力营销数据表之间的关系、电力营销数据表和上述电力营销数据字段之间的关系自然就可以得到提取出的不同的实体之间的关系。例如,第一实体是从第一电力营销数据库中提取得到的,第二实体是从第一电力营销数据表中提取得到的,由于第一电力营销数据表隶属于第一电力营销数据库,显然第二实体隶属于第一实体。
67.本申请的一种实施例中,上述装置还包括第一构建单元、第二构建单元和第三构建单元,第一构建单元用于在从电力营销数据中提取出实体和链接之后,构建实体表,上述实体表用于存储提取出的上述实体;第二构建单元用于在从电力营销数据中提取出实体和链接之后,构建实体链接表,上述实体链接表用于存储上述链接;第三构建单元用于在从电力营销数据中提取出实体和链接之后,构建实体主题表,上述实体主题表用于存储不同的主题以区分上述实体表和上述实体链接表。实现了对电力营销数据的专业存储,更有针对性,构建的业务关联更加准确。
68.所述基于电力营销数据的知识图谱实体及链接提取装置包括处理器和存储器,上述第一获取单元、第二获取单元、第三获取单元、第四获取单元和提取单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
69.处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现基于电力营销数据的知识图谱实体及链接的提取。
70.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。
71.本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行所述基于
电力营销数据的知识图谱实体及链接提取方法。
72.本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述基于电力营销数据的知识图谱实体及链接提取方法。
73.本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现至少以下步骤:
74.步骤s101,获取电力营销数据库名;
75.步骤s102,获取电力营销数据表名;
76.步骤s103,获取电力营销数据字段名;
77.步骤s104,获取电力营销数据内容;
78.步骤s105,基于上述电力营销数据库名、上述电力营销数据表名、上述电力营销数据字段名和上述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,上述链接包括电力营销数据库与电力营销数据表之间的关系和上述电力营销数据表与电力营销数据字段之间的关系。
79.本文中的设备可以是服务器、pc、pad、手机等。
80.本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有至少如下方法步骤的程序:
81.步骤s101,获取电力营销数据库名;
82.步骤s102,获取电力营销数据表名;
83.步骤s103,获取电力营销数据字段名;
84.步骤s104,获取电力营销数据内容;
85.步骤s105,基于上述电力营销数据库名、上述电力营销数据表名、上述电力营销数据字段名和上述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,上述链接包括电力营销数据库与电力营销数据表之间的关系和上述电力营销数据表与电力营销数据字段之间的关系。
86.本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
87.本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
88.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
89.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
90.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
91.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
92.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd

rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
93.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
94.从以上的描述中,可以看出,本申请上述的实施例实现了如下技术效果:
95.1)、本申请的基于电力营销数据的知识图谱实体及链接提取方法,通过获取电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容,再根据电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接。本方案实现了将知识图谱技术应用于电力营销数据领域,实现了基于电力营销数据的知识图谱实体及链接的提取。
96.2)、本申请的基于电力营销数据的知识图谱实体及链接提取装置,第一获取单元获取电力营销数据库名、第二获取单元获取电力营销数据表名、第三获取单元获取电力营销数据字段名和第四获取单元获取电力营销数据内容,提取单元根据电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接。本方案实现了将知识图谱技术应用于电力营销数据领域,实现了基于电力营销数据的知识图谱实体及链接的提取。
97.以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1