一种电力设备疑似重复数据识别方法

文档序号:6552238阅读:170来源:国知局
一种电力设备疑似重复数据识别方法
【专利摘要】本发明涉及一种电力设备疑似重复数据识别方法,属于电力工程及电力调度信息化建设领域。该方法通过词组拆分、词组判定、生成匹配结果、电力调度命名规则等技术或功能的组合,实现了电力企业疑似重复电力设备数据的抽取、识别、对应,建立统一的电网设备台账信息;拆分词组,用于把电力设备名称的长句拆分为有意义的词组;词组选择,根据调度命名规则、电网公共模型及设备类别判断出疑似重复的设备;生成匹配结果,根据前两步判断结果,程序可自动生成以厂站为单位的匹配列表;电力调度命名规则,根据电力调度规程,实现电力调度命名规则的结构化,支持词组判定。
【专利说明】一种电力设备疑似重复数据识别方法
【技术领域】
[0001]本发明属于电力工程及电力调度信息化建设领域,涉及一种关于电力设备疑似重复数据的识别方法。本方法主要是实现了调度控制中心在运行管理中,获得不同的系统设备数据后完成重复数据的匹配,为进一步利用设备数据奠定基础。
【背景技术】
[0002]现今的电力工程及电力调度信息化建设处于一个高速建设的过程中,但每个部门需求不同导致建设的系统中对设备台账的信息侧重点不同,由于建设的时间、建设厂家也是不同的,所以在业务需要以横向协同时,不同的设备数据难以在各个部门之间流转。换而言之,就算是同一台设备,由于系统最对应设备的命名不同,各个系统之间难以识别和对应其他系统发送过来的设备信息是本系统中哪一个设备。设备台账不统一,难以整合和利用,是如今电力企业在信息化建设过程中的一大难题。
[0003]目前,电力设备数据在电力企业,尤其在电网公司中,典型存在于电力调度自动化系统、电力调度运行管理系统、电网安全生产管理系统,这些系统中的电力设备其编码、命名均存在差异,设备数据资源具有以下特点:
1)电力调度系统的电网模型面向电网网络分析和计算,符合“模型互操作”的技术要求,严格遵循CIM模型标准,数据准确度较高,但数据模型主要为一次设备模型,仅包含一些保护设备模型,不能完整反应二次设备信息;
2)电力调度运行管理系统内部的设备台账主要为发电资源信息,如编制发电计划所需的耗水率曲线、震动区和水头等信息,此外还有小水电、小火电等信息;编制检修计划或申请所需的检修设备库;
3)电网安全生产管理系统的设备台账面向电网资产管理,几乎包含了变电站内所有的一次设备、二次设备以及辅助设备,线路设备上还包含了杆塔、金具等信息,总体来看,设备信息较为全面,但一般不包含发电厂信息。由于该系统的设备台账面向电网资产管理,其数据建模视角与电力调度管理需要存在一定的差异,例如其设备数据分为功能位置码和物理设备两类,这些概念与调度需要有所差异。
[0004]由于每个系统的设备台账信息的主要内容不同,设备编码、命名均寻在差异,设备台账的不完整、质量不高已成阻碍电网运行管理类系统提升功能的问题,一次设备和保护设备设备台账的完整性,设备台账的存量和增量的管理思路都是现存在的难以解决的问题。本发明是识别疑似重复数据的一套方法,主要是用于完成现有不同系统间重复设备的匹配。

【发明内容】

[0005]本发明为了解决上述难题,提出了一种电力设备疑似重复数据识别方法。通过该方法能够快速识别同一系统或不同系统的电力设备,既解决了同一部门或不同部门间电力设备信息不一致问题,为电力调度提供准确的基础信息;又能为跨部门的数据共享与交互提供统一的电力设备基础信息,保证了数据能够有效集成。该发明既提高了电力调度的安全性,又减少了因电力设备信息不一致增加的电网运营成本。
[0006]本发明采用的技术方案如下:
一种电力设备疑似重复数据识别方法,包括电力行业词组拆分模块、电力行业词组判定模块、生成匹配结果模块、电力调度命名规则模块、电力行业专有名词库模块;其中以电力调度命名规则模块为核心,由电力调度命名规则模块分别连接电力行业词组拆分模块、电力行业词组判定模块,电力行业词组拆分模块分别连接电力行业词组判定模块、电力行业专有名词库模块,词电力行业组判定模块分别连接电力行业专有名词库模块、生成匹配结果模块;电力调度命名规则模块根据“电力调度规程”进行命名规则的维护和管理;电力设备数据识别以电力调度命名规则库为基准依据,进行电力设备名称的词组拆分、词组判定、生成匹配结果;其中:
电力调度命名规则模块通过关系型数据库进行存储,实现规则的电子化、结构化;该模块对关键词的确认:根据调度的命名规则,程序识别出拆分的词组中调度命名的数字组,并对数字组进行比对,还能够根据电网公共模型,搜索上级厂站或线路,确认是否属于同一线路或厂站,以及再次确认设备是否属于同一类别,最终确认出重复数据,在完成对电力设备命名的拆分、判定后,自动生成匹配的对应关系列表;
电力行业专有名词库模块采用语义分析功能,使每一次对设备命名的拆分都做到拆分成词;
电力行业词组拆分模块通过对电力调度中词组或语句的分析进行拆分,并通过电力行业专有名词库进行校验;本模块中的程序以自动智能的分解调度设备命名字段,将字段分解为有意义的词组,该拆分技术依赖于智能的语义分析以及电网行业词库的支持;(词组拆分:选定需要拆分的数据范围后,该方法实现的软件系统自动根据电力命名规则、电力调度语义逻辑和电力专有名词,对电力设备清单中指定列的内容进行词组拆分,形成单词和词组的混合词语库;)
判断疑似数据是否是同一个数据的方法是:完成词组判定,采用设备类别、调度命名规贝U、电网模型规则三步;第一步根据调度命名规则,找出词组中代表调度命名的数字组,判断疑似重复设备的调度命名是否相同,如果相同则进入下一规则判断;第二步根据两个系统中设备的基础信息,对设备的类别做初步判断,判断是否是同一个类别设备;第三步利用电网模型关系,追溯疑似重复设备的上级线路或上级厂站容器,判断是否属于同一线路或厂站。
[0007]本发明的有益效果是,通过该方法能够快速识别同一系统或不同系统的电力设备,既解决了同一部门或不同部门间电力设备信息不一致问题,为电力调度提供准确的基础信息;又能为跨部门的数据共享与交互提供统一的电力设备基础信息,保证了数据能够有效集成。该发明既提高了电力调度的安全性,又减少了因电力设备信息不一致增加的电网运营成本。
【专利附图】

【附图说明】
[0008]图1为本发明中电力设备疑似重复数据识别的框架和逻辑图。【具体实施方式】
[0009]如图1所示,一种电力设备疑似重复数据识别方法,包括电力行业词组拆分模块、电力行业词组判定模块、生成匹配结果模块、电力调度命名规则模块、电力行业专有名词库模块;其中以电力调度命名规则模块为核心,由电力调度命名规则模块分别连接电力行业词组拆分模块、电力行业词组判定模块,电力行业词组拆分模块分别连接电力行业词组判定模块、电力行业专有名词库模块,词电力行业组判定模块分别连接电力行业专有名词库模块、生成匹配结果模块;电力调度命名规则模块根据“电力调度规程”进行命名规则的维护和管理;电力设备数据识别以电力调度命名规则库为基准依据,进行电力设备名称的词组拆分、词组判定、生成匹配结果;其中:
电力调度命名规则模块通过关系型数据库进行存储,实现规则的电子化、结构化;该模块对关键词的确认:根据调度的命名规则,程序识别出拆分的词组中调度命名的数字组,并对数字组进行比对,还能够根据电网公共模型,搜索上级厂站或线路,确认是否属于同一线路或厂站,以及再次确认设备是否属于同一类别,最终确认出重复数据,在完成对电力设备命名的拆分、判定后,自动生成匹配的对应关系列表;
电力行业专有名词库模块采用语义分析功能,使每一次对设备命名的拆分都做到拆分成词;
电力行业词组拆分模块通过对电力调度中词组或语句的分析进行拆分,并通过电力行业专有名词库进行校验;本模块中的程序以自动智能的分解调度设备命名字段,将字段分解为有意义的词组,该拆分技术依赖于智能的语义分析以及电网行业词库的支持;(词组拆分:选定需要拆分的数据范围后,该方法实现的软件系统自动根据电力命名规则、电力调度语义逻辑和电力专有名词,对电力设备清单中指定列的内容进行词组拆分,形成单词和词组的混合词语库;)
判断疑似数据是否是同一个数据的方法是:完成词组判定,采用设备类别、调度命名规贝U、电网模型规则三步;第一步根据调度命名规则,找出词组中代表调度命名的数字组,判断疑似重复设备的调度命名是否相同,如果相同则进入下一规则判断;第二步根据两个系统中设备的基础信息,对设备的类别做初步判断,判断是否是同一个类别设备;第三步利用电网模型关系,追溯疑似重复设备的上级线路或上级厂站容器,判断是否属于同一线路或厂站。
[0010]本发明中的其余模块均与电力调度命名规则和电力专有名词库模块链接;实现步骤如下:
第一步,建立基础信息。通过电力调度命名规则和电力专有名词库,实现企业中电力调度命名规则和电力行业及企业制定的专有名词的维护;
第二步,准备待识别的电力设备清单。若待别的电力设备位于不同信息系统的存储介质,可通过系统接口或文件导入两种方式,经电力设备清单导入到该方法实现的软件系统中。其中系统接口方式,实现了按钮操作,即只需点击数据导入按钮就实现数据导入;第三步,词组拆分,选定需要拆分的数据范围后,该方法实现的软件系统自动根据电力命名规则、电力调度语义逻辑和电力专有名词,对电力设备清单中指定列的内容进行词组拆分,形成单词和词组的混合词语库;
第四步,词组判定,按照电力调度命名规则、语义逻辑、专有名词库、电网模型结构等对拆分后的词组进行判定,可录入词组判定说明内容;
第五步,生成匹配结果,根据词组判定结果自动生成判定结果。
[0011]以电网企业中电力调度自动化系统、电力调度运行管理系统、电网安全生产管理系统等三大系统中的电力设备数据识别为例,构建电网公司统一的电力设备台账库,其【具体实施方式】如下:
设备台账来源主要有以下途径,其中每个系统所包含的数据存在重复数据需要匹配:
1)来源于电力调度自动化系统的电网模型,其中包含一次设备模型、保护设备模型;
2)来源于PMS系统的电网设备台账,其中包含一次设备台账数据、二次设备台账数据;
3)来源于电力调度运行管理系统的发电资源信息和检修设备数据,如发电厂、水库、小电厂等信息;
以上三个系统数据源各有特点,均有其利用价值,OMS系统设备台账可按照全景建模的技术思路,对三类数据资源进行整合,形成较为完备和准确的电网设备台账,方能较为全面地支持调度业务管理工作,对数据整合的基础就是完成重复数据的匹配工作。首先,电力调度自动化系统电网模型的数据准确高,一次设备也较为全面,可以该系统电网模型为基础,生成电网设备台账库,作为设备台账库的基础资源;其次进一步完成电力调度自动化系统与电力调度运行管理系统、电网安全生产管理系统的设备台账数据的匹配。由于电力调度自动化系统与电网安全生产管理系统的设备编码和命名存在一定的差异,利用本方法,实现两系统间编码的映射、匹配,以便于电力调度自动化系统与、电力调度运行管理系统、电网安全生产管理系统进行数据交换时,做相应的数据转换。
【权利要求】
1.一种电力设备疑似重复数据识别方法,其特征在于:包括电力行业词组拆分模块、电力行业词组判定模块、生成匹配结果模块、电力调度命名规则模块、电力行业专有名词库模块;其中以电力调度命名规则模块为核心,由电力调度命名规则模块分别连接电力行业词组拆分模块、电力行业词组判定模块,电力行业词组拆分模块分别连接电力行业词组判定模块、电力行业专有名词库模块,词电力行业组判定模块分别连接电力行业专有名词库模块、生成匹配结果模块;电力调度命名规则模块根据“电力调度规程”进行命名规则的维护和管理;电力设备数据识别以电力调度命名规则库为基准依据,进行电力设备名称的词组拆分、词组判定、生成匹配结果;其中: 电力调度命名规则模块通过关系型数据库进行存储,实现规则的电子化、结构化;该模块对关键词的确认:根据调度的命名规则,程序识别出拆分的词组中调度命名的数字组,并对数字组进行比对,还能够根据电网公共模型,搜索上级厂站或线路,确认是否属于同一线路或厂站,以及再次确认设备是否属于同一类别,最终确认出重复数据,在完成对电力设备命名的拆分、判定后,自动生成匹配的对应关系列表; 电力行业词组拆分模块通过对电力调度中词组或语句的分析进行拆分,并通过电力行业专有名词库进行校验;本模块中的程序以自动智能的分解调度设备命名字段,将字段分解为有意义的词组,该拆分技术依赖于智能的语义分析以及电网行业词库的支持; 判断疑似数据是否是同一个数据的方法是:完成词组判定,采用设备类别、调度命名规贝U、电网模型规则三步;第一步根据调度命名规则,找出词组中代表调度命名的数字组,判断疑似重复设备的调度命名是否相同,如果相同则进入下一规则判断;第二步根据两个系统中设备的基础信息,对设备的类别做初步判断,判断是否是同一个类别设备;第三步利用电网模型关系,追溯疑似重复设备的上级线路或上级厂站容器,判断是否属于同一线路或厂站。
【文档编号】G06Q10/06GK104036372SQ201410316351
【公开日】2014年9月10日 申请日期:2014年7月4日 优先权日:2014年7月4日
【发明者】陈飞, 蒋亚坤, 赵川, 赵莹, 罗洪, 何文洪, 张荣奎 申请人:云南电力调度控制中心, 云南云电同方科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1