一种基于数据血缘和基因比对的电网数据融合方法与流程

文档序号:12825821阅读:361来源:国知局
一种基于数据血缘和基因比对的电网数据融合方法与流程

本发明涉及电网运营监测管理领域,具体是一种基于数据血缘和基因比对的电网数据融合方法。



背景技术:

数据以定性和定量的方式地描述事物的特征和状况,随着对客观事物认识的不断深入,不断形成新的描述数据和活动数据,而其信息主体则是稳定的,因此貌似松散无序的描述信息主体的数据之间存在一种牢固的血缘数据关系。数据起源、进化和血缘分析等相关科学为基因比对技术提供了理论基础,但缺乏实用的数据融合方法。

目前,大规模、多区域微电网的模型管理工作中,存在如下问题:

电网业务系统建设缺乏统一规划和管理,由于电网企业业务系统的建设缺乏统一规划,实际数据模型与公共数据模型标准存在差异,专业条块化管理使各系统的数据编码、命名规则不统一,业务管理颗粒度和数据模型不一致,跨部门数据无法关联,数据融合困难,成为数据资产价值挖掘需要突破的瓶颈。



技术实现要素:

本发明提供一种基于数据血缘和基因比对的电网数据融合方法,可以优化电网企业的数据管理和数据融合,突破业务系统建设的限制,实现跨系统、业务管理颗粒度的数据关联和数据治理,为实现基于数据融合的电网业务数据统一深度挖掘、开展大数据分析和应用奠定基础。

本发明采用的技术解决方案是:

一种基于数据血缘和基因比对的电网数据融合方法,包括以下步骤:

步骤一、生成数据血缘关系;

步骤二、进行数据比对,输出数据比对结果;

所述步骤一中生成数据血缘关系,包含以下步骤:

(1)、构建描述设备属性的设备基因层,包含多个设备基因,每个基因对应着公共数据模型标准中规定一个设备属性;

(2)、构建描述基本设备类型的设备类型层,包含至少一个电网设备类型,设备类型层中每个设备对应设备基因层中的至少一个设备基因;

(3)、构建描述设备组合关系的聚合设备层,包含至少一个由多种设备类型聚合而成的聚合设备类型;

(4)、构建描述业务数据实际存储的业务系统层,每个业务系统对应一个或者多个聚合设备层;

(5)、将每个设备基因和设备类型、聚合设备类型标记对应的业务系统;

(6)、遍历设备基因层中设备基因,找出各业务系统独有的设备基因和多个业务系统共有的设备基因,对独有设备基因进行分别编码,对共有设备基因进行统一编码;

(7)、遍历聚合设备层,找出各业务系统独有的聚合设备类型和多个业务系统共有的聚合设备类型,对独有的聚合设备类型进行分别编码,对共有的聚合设备类型进行统一编码;

所述步骤二中数据比对,输出数据比对结果包含以下步骤:

(1)、获取待比对的业务数据;

(2)、获取各自业务数据对应的设备集合,按照共有区域统一编码规则对业务数据相同设备对应的设备基因进行数据比对,找出共有设备基因中不一致的地方;

(3)、获取业务数据对应的聚合设备集合,对多个业务系统共有的聚合设备,直接进行业务数据比对;

(4)、对于各业务系统独有的聚合设备,获取对应的设备类型和设备基因,对共有部分的设备基因进行业务数据比对;

(5)、输出设备集合和聚合设备集合基因比对结果:对于设备集合和聚合设备集合中的设备,依次输出各设备在各个系统中一致的基因数据和不一致的基因数据。

本发明构建基于数据血缘的数据关联关系,根据数据血缘关系把不同部门的业务单元进行基因对比和关联,有效解决多个电网多个业务系统数据之间的关联关系缺乏统一规划和管理、业务数据颗粒度维度不统一、数据治理困难、数据融合困难的实际问题,从而实现对电网业务数据的优化管理,提高数据资产质量。

附图说明

图1是本发明基于数据血缘和基因比对的电网数据融合方法其中一个实施例的流程示意图;

图2是本发明中步骤一的流程示意图;

图3是本发明中步骤二的流程示意图。

具体实施方式

下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述。

图1所示为本发明基于数据血缘和基因比对的电网数据融合方法其中一个实施例的流程示意图,所述方法包括以下步骤:

步骤一、生成数据血缘关系;

步骤二、数据比对,输出数据比对结果。

所述步骤一中生成数据血缘关系,包含以下步骤(如图2所示):

(1)、构建描述设备属性的设备基因层,包含多个设备基因,每个基因对应着公共数据模型标准中规定一个设备属性;

每个设备基因对应一个设备属性,以变电站为例,变电站名称、运维单位、电压等级、地市编码等均为设备基因。

(2)、构建描述基本设备类型的设备类型层,包含至少一个电网设备类型,设备类型层中每个设备类型对应设备基因层中的至少一个设备基因;

设备类型包括负荷、发电机、线路、开关、变压器、变电站等,每个设备类型对应一系列设备基因,即对应的设备属性。

(3)、构建描述设备组合关系的聚合设备层,包含至少一个由多种设备类型聚合而成的聚合设备类型;

聚合设备是根据业务需要对设备进行聚合而形成的设备集合。在营销系统中,线损考核线路由至少一条线路聚合而成;而在pms系统中,1条10kv线路由主干线、分支线,还有互供开关等设备聚合而成。

(4)、构建描述业务数据实际存储的业务系统层,每个业务系统对应一个或者多个设备聚合层;

(5)、将每个设备基因(例如变电站名称、运维单位、电压等级、地市编码)和设备类型(例如变电站)标记对应的业务系统;

根据业务系统对设备基因进行标记,比如变电站设备基因可以分别标记为pms系统和营销系统。

(6)、遍历设备基因层中设备基因标记结果,找出各业务系统独有的设备基因和多个业务系统共有的设备基因,对独有设备基因进行分别编码,对共有设备基因进行统一编码;

根据标记结果,变电站设备在pms系统中独有65个属性,在营销系统中独有6个属性,在两个系统中5个共同属性。

(7)、遍历聚合设备层,找出各业务系统独有的聚合设备类型和多个业务系统共有的聚合设备类型,对独有的聚合设备类型进行分别编码,对共有的聚合设备类型进行统一编码;

对营销系统中的线损考核线路、pms系统中的10kv馈线分别进行编码。

所述步骤二中数据比对,输出数据比对结果包含以下步骤(如图3所示):

(1)、获取待比对的业务数据;

在实际工作中,分别获取pms和营销系统中的档案数据。

(2)、获取各自业务数据对应的设备集合,按照共有区域统一编码规则对业务数据相同设备对应的设备基因进行数据比对,找出共有设备基因中不一致的地方;比如同一个变电站,在生产管理系统(pms)中有70个设备基因,即70个设备属性,营销系统中的变电站共有11个设备基因。通过基因比对,有5个共同设备基因,但相同属性的编码不一样。

(3)、获取业务数据对应的聚合设备集合,对多个业务系统共有的聚合设备,直接进行业务数据比对;

若分别记录了2个相同的线损考核线路,由相同的线路聚合而成,在校验的时候,比较线路档案是否相同。

(4)、对于各业务系统独有的聚合设备,获取对应的设备类型和设备基因,对共有部分的设备基因进行比对。

若比较营销系统中的线损考核线路和pms系统中的馈线线路,则获取线损考核线路和馈线线路对应的基本线路、互供开关等,进行设备基因比对。

(5)、输出设备集合和聚合设备集合比对结果:对于设备集合和聚合设备集合中的设备,依次输出各设备在各个系统中一致的基因数据和不一致的基因数据。设备集合中比对结果包含每个设备在各个系统中的独有设备基因,在多个系统中的共有设备基因以及共有设备基因是否相同;聚合设备集合中的设备,比对结果包含设备集合中的设备数量是否一致,每个具体设备的基因比对结果。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何属于本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1