一种评价智能终端与电能表的表码数据同步状态的方法及其系统的制作方法

文档序号:9844578阅读:292来源:国知局
一种评价智能终端与电能表的表码数据同步状态的方法及其系统的制作方法
【技术领域】
[0001] 本发明涉及电力信息技术领域,尤其涉及一种评价智能终端与电能表的表码数据 同步状态的方法及其系统。
【背景技术】
[0002] 数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联 系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。有了普遍深入 的数据质量,企业在任何时候都可以信任满足所有需求的所有数据。
[0003] 在智能电网中,影响电力数据质量的因素主要包括数据完整性和数据准确性。其 中,数据完整性约束包括实体完整性约束、参照完整性约束、函数依赖约束、统计约束四类。 而智能电网中的计量自动化终端通常会发生通信故障和记录时间对不齐等问题,这些问题 在数据中心中直接反应为数据记录缺失和约束不严格。基于此,有必要研究计量自动化智 能终端和电能表终端采集到的电能量表码数据在缺失同步性上的整体趋势,从而对电网运 行状态有一个整体的认识,提升采集终端的运维水平,提高终端完整率。

【发明内容】

[0004] 本发明所要解决的技术问题是:提供一种评价智能终端与电能表的表码数据同步 状态的方法及其系统,以分析智能终端和电能表的运行状态和数据传输的一致性,利于运 维工作人员掌握计量自动化系统端运行状态,提升采集终端的运维水平及终端数据完整 率。
[0005] 为解决上述技术问题,本发明采用的技术方案如下:
[0006] 提供一种评价智能终端与电能表的表码数据同步状态的方法,包括步骤:
[0007] 从数据主站获取一预设时间内智能终端和电能表所采集的所有表码数据,并对表 码数据进行预处理;
[0008] 根据表码数据在整点时刻上的存在情况,对预处理后的表码数据进行去值化处 理;
[0009] 对去值化处理后的两份表码数据进行异或处理;
[0010] 采用K-均值聚类算法对异或处理后的表码数据进行聚类分析,以得到聚类结果; [0011]根据聚类结果评价智能终端与电能表的表码数据的同步状态。
[0012]与现有技术相比,该方法先从数据主站获取一预设时间内智能终端和电能表所采 集的所有表码数据,并对其进行预处理及去值化处理,之后对两份数据进行异或处理以整 合数据,接着采用及其学习中的K-均值聚类算法(即KMEANS算法)对处理后的数据进行聚类 分析,最后根据聚类分析结果对智能终端和电能表的表码数据进行同步状态的整体评价; 该方法可以及时发现计量自动化系统中的电能表与智能终端采集数据的差异,从而对电网 运行状态有一个整体的认识,提升了采集终端的运维水平,提高了终端完整率,且该方法是 数据挖掘及机器学习在电网数据中的有效应用,对数据质量的提升具有一定的指导意义。
[0013] 相应地,本发明还提供了一种评价智能终端与电能表的表码数据同步状态的系 统,包括:
[0014] 获取模块,用于从数据主站获取一预设时间内智能终端和电能表所采集的所有表 码数据,并对表码数据进行预处理;
[0015] 去值化处理模块,用于根据表码数据在整点时刻上的存在情况,对预处理后的表 码数据进行去值化处理;
[0016] 异或处理模块,用于对去值化处理后的表码数据进行异或处理;
[0017] 分析模块,用于采用κ-均值聚类算法对异或处理后的表码数据进行聚类分析,以 得到聚类结果;
[0018] 评价模块,用于根据聚类结果评价智能终端与电能表的表码数据的同步状态。
【附图说明】
[0019] 图1为本发明评价智能终端与电能表的表码数据同步状态的方法的主流程图。
[0020] 图2为本发明方法一实施例的流程图。
[0021] 图3为图2中步骤S207的子流程图。
[0022] 图4为本发明评价智能终端与电能表的表码数据同步状态的系统的结构框图。 [0023]图5为图4中装置300的结构框图。
[0024]图6为图5中分析模块的结构框图。
【具体实施方式】
[0025] 现在参考附图描述本发明的实施例,附图中类似的元件标号代表类似的元件。
[0026] 请参考图1,本发明评价智能终端与电能表的表码数据同步状态的方法,包括:
[0027] S101,从数据主站获取一预设时间内智能终端和电能表所采集的所有表码数据, 并对表码数据进行预处理;
[0028] S102,根据表码数据在整点时刻上的存在情况,对预处理后的表码数据进行去值 化处理;
[0029] S103,对去值化处理后的两份表码数据进行异或处理;
[0030] S104,采用K-均值聚类算法对异或处理后的表码数据进行聚类分析,以得到聚类 结果;
[0031] S105,根据聚类结果评价智能终端与电能表的表码数据的同步状态。
[0032] 再请参考图2,在本发明的一优选实施例中,该方法具体包括:
[0033] S201,通过智能终端和电能表分别采集整点时刻的表码数据,即智能终端和电能 表采集表码数据的频率为lh-次。
[0034] S202,电能表所采集的表码数据通过485总线传输至智能终端。
[0035] S203,智能终端将两份表码数据通过GPRS网络传输至数据主站;具体地,智能终端 包含信号传输模块,可以将自身采集到的和电能表传输来的这两份冗余的数据一并通过 GPRS移动网络传输到数据主站。需要说明的是,当发生硬件损坏、S頂故障、485规约错误、无 信号等软硬件问题时,传输采集到的表码数据至主站便会发生缺失或者数据损坏。且,发送 至数据主站的表码数据包含了用户实时用电信息,其所包含的具体内容如表1所示:
[0036]
[0037] 表1:表码数据样例表
[0038] S204,从数据主站获取一预设时间内智能终端和电能表所采集的所有表码数据, 并对,表码数据进行预处理;具体地,从数据主站获取2014年12月1日当天所有的智能终端 和电能表采集到的表码数据,判断任一条表码数据的重要字段是否发生缺失,若发生缺失, 则抛弃该条表码数据并视该条表码数据为空。
[0039] S205,根据表码数据在整点时刻上的存在情况,对预处理后的表码数据进行去值 化处理;具体地,每份智能终端和电能表的表码数据根据其在相应的整点时间的数据存在 与否,化为表2所示的数据格式: 「rwwil L〇〇4l j 表2:评价悮型数据选取
[0042] 其中P0INTID代表智能终端或者电能表的数据点编号,ΒΜ0、ΒΜ1、···、ΒΜ23分别代表 数据在〇点时刻、1点时刻、…、23点时刻的数据存在与否,若数据存在则标记为1,否则标记 为0〇
[0043] S206,对去值化处理后的两份所述表码数据进行异或处理;具体地,将去值化并整 理好格式的智能终端和电能表的两份数据在相应的时间位置上进行异或处理,得到如表3 所示的数据: 「0044?
?〇(Μ5」表3:评价模型数据构造
[0046]其中P0INTID代表智能终端的数据点编号,DATATIME代表数据时间,以天为准, X0R0、X0R1、…、X0R23分别代表互相关联的智能终端和电能表在0点时刻、1点时刻、…、23点 时刻的去值化后的数据的异或结果,若智能终端和电能表的表码数据均缺失或者均存在则 标记为1,否则标记为0。
[0047] S207,采用K-均值聚类算法对异或处理后的所述表码数据进行聚类分析,以得到 聚类结果。考虑到计量自动化系统采集的表码数据并没有完整性标注,且需要从原始的表 码数据中辨别出智能终端和电能表采集到的数据的差异,因此使用无监督的机器学习模型 比较合适,其中K-均值聚类算法可以将相似的对象归到同一个簇中并且易于实现,在海量 数据处理中有应用优势。其中,K-均值聚类算法具体步骤将在下文详述。
[0048] S208,根据聚类结果评价所述智能终端与电能表的表码数据的同步状态。
[0049] 具体地,请参考图3,步骤S207包括:
[0050] S2071,设定多个簇,提取任一条所述表码数据并将该条表码数据分配于任一簇 中;
[0051] S2072,设定算法中K的数值;其中,K由所述聚类结果的精度确定,如果想让数据结 果更加精准,可以是当地增加 K的数值,在本实施例中,取K = 4;
[0052] S2073,随机确定K个初始点作为各个簇的初始质心,根据剩余的表码数据与各个 簇的初始质心的欧式距离,将剩余的表码数据分配到最相近的簇中;
[0053] S2074,计算每一个簇中所有表码数据的均值,并将均值作为该簇的新质心;
[0054] S2075,根据新质心重新分配所有的表码数据;
[0055] S2076,迭代S2074和S2075直到所有的所述表码数据分配不再变化;
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1