一种电力配网信息聚类系统及方法_2

文档序号:9418108阅读:来源:国知局
取需求侧管理信 息;
[0024] 所述多个数据存储系统包括数据采集和监控信息数据库、自动发电控制信息数据 库,经济调度控制信息数据库、电力系统状态估计信息数据库、安全分析信息数据库、调度 员模拟培训信息数据库、配电网自动化信息数据库、地理信息数据库、配电网重构信息数据 库、管理信息数据库、需求侧管理信息数据库、班组建设信息数据库、班组成员培训信息数 据库、班组动态信息数据库和历史数据库。
[0025] 所述电力配网信息聚类系统的信息聚类方法中,信息中的标签包括数据采集和监 控信息、自动发电控制信息、经济调度控制信息、电力系统状态估计信息、安全分析信息、调 度员模拟培训信息、配电网自动化信息、地理信息、配电网重构信息、管理信息、需求侧管理 信息、班组建设信息、班组成员培训信息、班组动态信息,如果抓取的数据带有标签,那么按 照标签分类,或者赋予特定权重使用默认的K-MEANS算法重新进行聚类。
[0026] 本发明的另一实施例,电力配网信息的K-MEANS聚类方法,包括以下步骤:
[0027] 步骤101,选定参数。
[0028] 具体的,选定参数步骤中参数个数由用户自定义,可以选择为电力配网信息的发 布时间、电力配网信息的大小、电力配网信息的级别等,若电力配网信息总数为m个,参数 个数为η个,则电力配网信息集合可以记为(D 11D2...DJ,每个电力配网信息可以表示为一 个坐标'=(.\.,丨,.:^._,.:^),.1=_1,.:2,,,?1。
[0029] 特别的,参数选定之后,可以确定参数对应的数值。例如发布时间可以定义为截止 到目前的天数,电力配网信息大小可以定义为资料字节数,电力配网信息的级别可以分别 映射为1,2, 3等。
[0030] 步骤102,归一化处理。
[0031] 通过步骤101确定参数之后,对电力配网电力配网信息的各个参数进行归一化处 理;
[0032] 具体的,对第p个参数归一化中使用的公式可以表达为:
[0033]
1其中,η是步骤101选定的参数个数, Ip是第i个电力配网信息第P个参数的样本空间的样本点个数,X 1Ρ是第i个电力配网信息 的第P个参数,X1/是第i个电力配网信息的第P个参数归一化后的结果,X 1P1是第i个电 力配网信息的第P个参数的取值区间。使用这种归一化方法,不受参数个数选择限制,能够 将99%以上的参数取值区间纳入归一化范围,而且能够根据参数的重要程度对参数进行排 序从而保证归一化效果。
[0034] 步骤103,选定聚类中心。
[0035] 具体的,通过步骤102确定电力配网信息的坐标后,进一步由用户任意选出K个聚 类中心,K为用户自定义,本实施例优选为3个。
[0036] 步骤104,聚类处理。
[0037] 具体的,通过步骤103确定聚类的中心之后,分别计算其他的元素到K个聚类中心 的相异度,将这些元素分别划归到相异度最低的簇。
[0038] 选定K个聚类中心之后,则聚类中心集合可以表示为IO1, O2. .. O1J,聚类中心的坐 标可以记为ζ = 1,2..1。针对电力配网信息集合中的每个元素,为每个参 数设定不同的权重,权重序列为
,分别计算与各个聚类中心的加权欧式距 离,具体计算公式为:
[0039]
[0040] i = 1,2. · · m, j = 1,2. · · k,其中η为步骤101选定的参数个数;若第i个元素到 第j个聚类中心的距离最近,那么就认为此元素与第j个聚类中心的相异度最低,并将它划 归到第j个簇。
[0041] 采取这样的权重分配模式,不受参数个数选择限制,而且能够根据参数的重要程 度对参数进行排序,保证聚类效果最优。
[0042] 另一实施例,在实际的聚类过程中,常见的情况是一部分电力配网信息已知分类 而另一部分没有分类,这种情况下将所有数据一视同仁重新聚类,可能导致处理时间延长, 处理精度下降的后果。为解决这个问题,如果抓取的电力配网信息中带有信息标签,可以 按照标签给予不同类型的信息不同的权重,与上述步骤104中的参数权重相结合,采用二 次加权的方法,能够适应更多的场景,更快速的将信息聚类到已知分类中。其中,数据采集 和监控信息的权重为0. 10,自动发电控制信息的权重为0. 09,经济调度控制信息的权重为 0. 07、电力系统状态估计信息的权重为0. 06、安全分析信息的权重为0. 08、调度员模拟培 训信息的权重为〇. 06、配电网自动化信息的权重为0. 08、地理信息的权重为0. 10、配电网 重构信息的权重为〇. 05、管理信息的权重为0. 10、需求侧管理信息的权重为0. 09、班组建 设信息的权重为〇. 05、班组成员培训信息的权重为0. 03、班组动态信息的权重为0. 04 ;
[0043] 如果标签中没有已知分类,那么将信息赋予固定权重,使用默认的K-MEANS算法 进行聚类,其中数据采集和监控信息的权重为〇. 10,自动发电控制信息的权重为0.09,经 济调度控制信息的权重为〇. 07、电力系统状态估计信息的权重为0. 06、安全分析信息的权 重为〇. 08、调度员模拟培训信息的权重为0. 05、配电网自动化信息的权重为0. 08、地理信 息的权重为0. 09、配电网重构信息的权重为0. 05、管理信息的权重为0. 10、需求侧管理信 息的权重为0. 08、班组建设信息的权重为0. 05、班组成员培训信息的权重为0. 03、班组动 态信息的权重为〇. 03,未知分类信息权重固定为0. 04 ;
[0044] 如果信息中没有标签,由所述聚类服务器根据电力信息的类型采用默认的聚类方 法或者用户指定的聚类方法;默认的聚类方法为K-MEANS聚类方法,用户指定的聚类方法 包括但不仅限于 K-MEANS、K_MODES、PAM(Partitioning around meoids、CLARA (Clustering Large Applications)、AP (Affinity Propagation Clustering)、SPEA(Spectral Analysis)等聚类算法。
[0045] 步骤105,计算聚类中心。
[0046] 具体的,通过步骤104获得聚类结果后,重新计算K个簇各自的中心。令K个簇的 元素个数分别为叫,m 2. · · mk,且m = H^m2+. · · +mk,为电力配网信息集中所有元素按照数值 大小重新排序,坐标分别记为夂,.=(χ,.Ρ.ην.·.η,,),/ = ,前j个聚类的元素总数记为0j,j =1,2. . . k,ο。= 0,则聚类中心的坐标计算公式为

[0047] 步骤106,聚类循环。
[0048] 具体的,通过步骤105确定新的聚类中心坐标之后,将电力配网信息集的全部元 素按照新的中心重新聚类,直至聚类结果不再变化或者达到聚类次数上限。聚类结果不再 变化的判断条件为:对重新聚类的结果再次排序,假如序号相同的聚类中元素也相同,就认 为聚类结果不再变化。聚类次数上限由用户自定义,优选为200次。
[0049] 本发明的另一实施例,一种电力配网信息聚类方法,其特征在于,包括以下步骤:
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1