一种基于二次聚类的商业负荷特性聚类分析方法

文档序号:10535389阅读:366来源:国知局
一种基于二次聚类的商业负荷特性聚类分析方法
【专利摘要】本发明提供一种基于二次聚类的商业负荷特性聚类分析方法,所述方法包括如下步骤:(1)通过系统聚类法确定聚类数K的上下限值Kmax,Kmin以及设置参数,并设K=Kmin;(2)对K?means算法进行初始化;(3)进行聚类操作,得到新一代种群个体适应度;(4)判断适应度函数是否收敛,若是则输出最终的聚类中心和聚类结果,否则跳转到步骤(3);(5)判断K是否大于Kmax,若是则确定最合适的K值,否则K值加一,跳转到步骤(2)。本发明成功的改善了k?means算法中的初始K值设定和局部收敛等缺点,使得聚类结果更加准确、客观。
【专利说明】
一种基于二次聚类的商业负荷特性聚类分析方法
技术领域
[0001] 本发明属于电力系统分析领域,具体涉及一种基于二次聚类的商业负荷特性聚类 分析方法。
【背景技术】
[0002] 面对日益纷繁复杂的电力用户数据,要想了解用户需求响应潜力,就需要对用户 群体的负荷特性有较为清晰的整体把握,而不必对每个用户一一进行分析研究。此外,以聚 类的方式,将其聚为特征差异比较明显的几类,依据其生产生活习惯,归纳出各类用户的用 电特性以及需求响应潜力。
[0003] 在智能电表和高级量测体系的支持下,商业用户能够参与到需求侧管理中。而负 荷特性聚类分析过程则是对用户的电能量数据等的分析与整合,为了进一步能够实现需求 响应提供初步的数据支持。
[0004] 聚类分析过程所需的原始数据来源于用电信息采集系统,系统采集的主要数据项 有:
[0005] 电能量数据:总电能示值、各费率电能示值、总电能量、各费率电能量、最大需量 等;
[0006] 交流模拟量:电压、电流、有功功率、无功功率、功率因数等;
[0007] 工况数据:采集终端及计量设备的工况信息;
[0008] 电能质量越限统计数据:电压、功率因数、谐波等越限统计数据;
[0009] 事件记录数据:终端和电能表记录的事件记录数据;
[0010] 其他数据:费控信息等。
[0011] 为了满足商业平稳运营和服务质量的要求,商业用户一般对电能质量的要求较 高,不仅要关注用电信息采集系统采集的电能量数据,还应关注交流模拟量数据以及电能 质量越限数据。因此,在保证交流模拟量数据和电能质量越限数据处于合理范围内的条件 下,以15min为时间间隔,记录下一天之中的96个时刻之间的电能量数据的差值,即为该时 段的耗电量。
[0012] 以24个整点时刻记录的耗电量为原始数据,在将这些数据用于聚类之前,还需要 进行数据预处理,这一过程主要包括"噪声"和孤立点数据处理、数据归一化处理与数据加 权处理。
[0013] 为了消除原始数据量纲和幅值的差异,需要对数据按最大负荷进行归一化处理, 经过处理的负荷曲线仅保留其原有的曲线形态。具有相似负荷曲线形态的负荷,其在各时 段用电量占其总用电量的比例大体是一致的。因此,可以将这些相似的负荷特性曲线聚为 一类,找出具有代表性的聚类中心的负荷特性曲线,进行负荷特性分析。
[0014] k-means算法是典型的基于距离的聚类方法,属于划分方法的一种。它采用欧氏距 离作为相似性的评估指标,即两个样本的距离越近,其相似性越大,将新的样本划分到与其 距离最近的一类中,使得类内差异最小,而类间差异最大,从而保证聚类效果最好。
[0015] k-means算法虽然简单且收敛性好,但是也存在一些缺点:K值要事先给定,若K值 选择不合理,对聚类结果影响很大;算法对初始聚类中心选取的依赖性很大,经常以局部最 优结束。算法对"噪声"和孤立点数据比较敏感。

【发明内容】

[0016] 为了克服上述现有技术的不足,本发明提供一种基于二次聚类的商业负荷特性聚 类分析方法,本发明成功的改善了k-means算法中的初始K值设定和局部收敛等缺点,使得 聚类结果更加准确、客观。
[0017]为了实现上述发明目的,本发明采取如下技术方案:
[0018] -种基于二次聚类的商业负荷特性聚类分析方法,所述方法包括如下步骤:
[0019] (1)通过系统聚类法确定聚类数K的上下限值Kmax,K_以及设置参数,并初始设K = Kmin;
[0020] (2)对K-means算法进行初始化;
[0021] (3)进行聚类操作,得到新一代种群个体适应度;
[0022] (4)判断适应度函数是否收敛,若是则输出最终的聚类中心和聚类结果,否则跳转 到步骤(3);
[0023] (5)判断K是否大于Kmax,若是则确定最合适的K值,否则K值加一,跳转到步骤(2)。
[0024] 优选的,所述步骤(1)中,所述设置参数包括种群规模G、最大迭代次数KMI、交叉概 率Mc,变异概率^,自适应控制参数M cl、Mc2、Mc3、Mml、Mm2、M m3。
[0025]优选的,所述步骤(2)包括如下步骤:
[0026] 步骤2-1、采用基于浮点数的染色体编码方案,对染色体种群进行编码,染色体种 群编码方式如下:
[0027] S(t) = {sit,S2t, . . .,SKt}
[0028] -v = \ , \<i<K
[0029] xj = {aji,aj2, ? ? ? ,ajn},K j<Li
[0030] 式中,在第t代种群S(t)中,K为染色体数量,染色体sit为第i条染色体;Li为染色体 Slt的编码长度,即第i条染色体中的样本数目;基因&为n维负荷特性样本数据;
[0031]步骤2-2、种群初始化;
[0032]步骤2-3、初始种群个体适应度计算,
[0033]在第t代种群S(t)中,目标函数:类内距离的平方,即欧式距离的平方,计算公式如 下:
(1)
[0036] 式中,D(sit)为染色体sit的目标函数;在染色体sit中,类内样本数据xj={aji, a」2, ? ? ? ,a」24},式(2)计算得到的聚类中心x,=彳am}%
[0037] 染色体Sit适应度函数,计算公式如下: (3)〇
[0039] 优选的,所述步骤2-2中,包括如下步骤:
[0040] 步骤2-2-1、以第i条染色体的初始化过程为例,随机设置染色体长度Li,矣:派,N 为样本数,#为聚类数的经验值;
[0041 ]步骤2-2-2、从[1,N]中随机选取Li个不重复的自然数,这些自然数对应的样本数 据组成一条染色体Sl〇;
[0042] 步骤2-2-3、通过比较判断种群中是否已经存在与SlQ完全相同的染色体。若存在, 则重新进行第i条染色体的初始化;若不存在,则转而进行i+1染色体的初始化;
[0043] 步骤2-2-4、依次完成K条染色体的初始化过程,最终形成染色体初始种群S(0)。
[0044] 优选的,所述步骤(3)包括如下步骤:
[0045] 步骤3-1、遗传算子操作;
[0046] 步骤3-2、交叉概率M。和变异概率^的自适应调整;
[0047] 步骤3-3、采用k-means算法进行优化操作;
[0048] 步骤3-4、新一代种群个体的适应度计算。
[0049] 优选的,所述步骤3-1包括如下步骤:
[0050] 步骤3-1-1、选择操作
[0051] 染色体Sit被选中的概率:

[0053]式中,Slt表示第t代种群S(t)中的第i条染色体,染色体的总数为K,f(slt)表示染 色体Sit的适应度;
[0054]步骤3-1-2、进行插入删除交叉算子操作;
[0055]步骤3-1-3、进行变异操作;
[0056]步骤3-1-3-1、染色体sit中,染色体长度为U,随机选取一自然数C作为变异点总个 数,满足Ce[l,U];
[0057] 步骤3-1-3-2、在[0,1 ]中随机选取一数r,若为变异概率,则不进行变异操 作;否则在[1,N]中随机选取一个的自然数,用其对应的初始样本数据来替换父代染色体中 的数据;
[0058] 步骤3-1 -3-3、重复C次,退出变异操作。
[0059]优选的,所述步骤3-2中,所述交叉概率M。和所述变异概率1随着个体的适应度在 种群的最小适应度、平均适应度和最大适应度之间进行线性调整, (5) (6)
[0062]式中,fmax为当代群体中最大适应度值,favg为当代群体中平均适应度值,f min为当 代群体中最小适应度值,f为要进行交叉操作的两染色体中的较大适应度值;f为要进行变 异操作的染色体适应度,M。、Mcl、M c2、Mc3为交叉概率,Mm、Mml、Mm2、M m3为变异概率。
[0063]优选的,所述步骤3-3包括如下步骤:
[0064]步骤3-3-1、确定经过遗传操作之后数据的分类情况以及各类的聚类中心;
[0065] 步骤3-3-2、计算每组数据与各聚类中心欧式距离的平方和D(slt),计算公式如下:
(7)
[0067] 式中,类Sit的样本数据XjHajiaj〗,.? ?,aj24},聚类中心[={&"2,...,^4},将该组数 据划分到距离其最近的一类中,重新进行分类;
[0068] 步骤3-3-3、计算各类的平均值,并作为该类新的聚类中心;
[0069] 步骤3-3-4、不断重复步骤3-3-2和3-3-3,直到准则函数收敛为止,即以连续20个 函数值的差值均小于1 (T6为标准。
[0070] 优选的,所述步骤3-4中,所述适应度计算方法如下:
[0071]在第t+1代种群S(t+1)中,染色体sit+1的适应度函数:
[0074]在染色体sit+l中,类内样本数据xj={ajl,a j2,…,aj24},由式⑵计算得到的聚类 中)? 〇
[0075] 与现有技术相比,本发明的有益效果在于:
[0076] 本发明提出的一种基于系统聚类法、遗传算法和k-means算法的二次聚类方法。该 方法通过结合系统聚类法的无需初始设定、遗传算法的全局搜索能力以及k-means算法的 局部快速收敛性等优点,成功的改善了 k-means算法中的初始K值设定和局部收敛等缺点, 使得聚类结果更加准确、客观。
[0077] 本发明满足了商业用户平稳运营和服务质量的要求,保证交流模拟量数据和电能 质量越限数据在合理的范围内。
[0078] 本发明为制定需求响应策略奠定了基础,达到"以点代面"的效果,即以几组聚类 中心的负荷数据来模拟众多商业用户的需求响应情况,减少了许多重复性的操作,优化了 整个操作流程。
【附图说明】
[0079] 图1是本发明提供的一种基于二次聚类的商业负荷特性聚类分析方法流程图
[0080] 图2是本发明提供的利用系统聚类法进行一次聚类后的聚类树图
[0081] 图3是本发明提供的K值的聚类评价指标曲线图
[0082] 图4是本发明提供的聚类结果图
[0083]图5是本发明提供的商场日负荷曲线与中央空调冷负荷分配情况图
[0084] 图6是本发明提供的蓄冷系统参与下中央空调的冷负荷分配图
【具体实施方式】
[0085] 下面结合附图对本发明作进一步详细说明。
[0086] 二次聚类,指的是第一次聚类采用系统聚类法,第二次聚类采用遗传k-means算 法。系统聚类法有7种类间距离定义的方法,本发明考虑到各类数据的整体分布,选取基于 平均距离的系统聚类法,确定数据的大体分布情况,并为k-me an s算法的初始K值设定确定 合适的范围。
[0087] 如图1所示,为本发明提供的一种基于二次聚类的商业负荷特性聚类分析方法,具 体步骤如下:
[0088] 步骤1、通过系统聚类法确定聚类数K的上下限值Kmax,Kmin以及设置参数,并设K =Kmin;
[0089]所述设置参数包括种群规模G、最大迭代次数KMI、交叉概率M。,变异概率^,自适应 控制参数Mcl、MC2、Mc3、Mml、Mm2、Mm3 〇
[0090] 步骤2、对K-means算法进行初始化;
[0091] 步骤2-1、染色体编码形式
[0092]遗传算法常用的编码方式主要有二进制编码和浮点数编码两种,用于聚类的数据 量大且维度较高。若采用二进制编码,为了达到精度的要求,就需要增加染色体的长度,大 大增加了数据存储和搜索空间,计算效率也大为降低。本文采用了基于浮点数的染色体编 码方案,这种编码方案可以有效的节省数据存储所需的内存空间,简化数据的编码和搜索 过程,减少算法的运算量,大大缩减了整个算法的计算时间。
[0093]染色体种群编码方式如下:
[0094] S(t) = {sit, S2t, . . . ,SKt};
[0095] , l<i<AT ; (1.)
[0096] xj= {aji,aj2, . . . ,ajn}, 1^ j^Li;
[0097] 在第t代种群S(t)中,K为染色体数量,染色体sit为第i条染色体;Li为染色体sit的 编码长度,即第i条染色体中的样本数目,不同染色体的编码长度不尽相同;基因&为n维负 荷特性样本数据。
[0098]步骤2-2、种群初始化;
[0099]由于各染色体的编码长度不同,所以在种群初始化过程中,各染色体的长度需要 一一进行设置。以第i条染色体的初始化过程为例,随机设置染色体长为样本 数,私为聚类数的经验值),从[1,N]中随机选取U个不重复的自然数,这些自然数对应的样 本数据组成一条染色体 SlQ,通过比较判断种群中是否已经存在与SlQ完全相同的染色体。若 存在,则重新进行第i条染色体的初始化;若不存在,则转而进行第i+1条染色体的初始化。 依次完成K条染色体的初始化过程,最终形成染色体初始种群S(0)。步骤2-2-4、依次完成K 条染色体的初始化过程,最终形成染色体初始种群s(0)。
[0100] 步骤2-3、初始种群个体适应度计算,
[0101] 在第t代种群s(t)中,目标函数:类内距离的平方,即欧式距离的平方
[0104]染色体Sit中,类内样本数据Xj = {aji,aj2, ? ? ?,aj24},式(3)计算得到的聚类中心
[0105] Xi -{^1,1--.,) d
[0106] 染色体Sit适应度函数:
(4)。
[0108] 步骤3、进行聚类操作,得到新一代种群个体适应度;
[0109] 步骤3-1、遗传算子操作
[0110] 在遗传算法中,选择、交叉与变异算子相结合可以保证遗传算法的有效性,使其具 有局部随机搜索能力,同时保持种群的多样性,防止非成熟收敛。
[0111] 步骤3-1-1、选择操作
[0112] 染色体Sit被选中的概率:
(5:)
[0114]其中,Slt表示第t代种群S(t)中的第i条染色体,染色体的总数为K,f(slt)表示染 色体Sit的适应度。
[0115] 这一操作体现了 "适者生存"的原则,适应度越高的个体,参与后代繁殖的概率越 高。通过交叉和变异等操作可以不断地产生新个体,并随着种群的进化会出现越来越多的 优良个体,但是由于选择、交叉、变异等操作的随机性,有可能会破坏适应度最好的个体,降 低种群的平均适应度,从而影响算法的运行效率。为了避免这种情况的发生,本文改进的算 法中采用了最佳保留选择和轮盘赌选择相结合的思路。在每一步的迭代中,选出适应度最 高的n条染色体结构完整的直接复制到下一代中,再用轮盘赌选出优秀个体进入下一代。
[0116] 步骤3-1-2、插入删除交叉算子操作
[0117] 插入删除交叉算子的主要思想是:将一个染色体的一段基因删除,并将这段基因 插入另一个染色体的某一位置。
[0118] 为了与染色体编码相适应,本文采用了插入删除交叉算子,不仅实现了基因片段 的交换,还会删除掉新染色体中的重复基因和十分相似的基因,并对过长的基因进行截尾 操作,保证了不会在交叉操作中产生无意义的个体。
[0119] 步骤3-1-3、变异操作
[0120] 染色体Sit中,染色体长度为Li,随机选取一自然数C作为变异点总个数,满足C G [1,U];在[0,1 ]中随机选取一数r,若r<Mm(变异概率),则不进行变异操作;否则在[1,N]中 随机选取一个的自然数,用其对应的初始样本数据来替换父代染色体中的数据,重复C次, 退出变异操作。
[0121] 步骤3-2、交叉率和变异率的自适应调整
[0122] 在遗传算法中,交叉率和变异率直接影响算法的收敛速度。由于过低的交叉率不 易产生新个体,易出现"早熟现象",停滞不前,过高的交叉率又极易破坏优良的个体模式; 而变异率过小,不易于生成新的模式结构,变异率过大,会使遗传算法变成纯粹的随机搜索 算法。因此,在传统的遗传算法中,无论交叉率和变异率的取值是大还是小,都无法决定算 法能否收敛到全局最优解。本文为了避免出现局部收敛的情况,需要交叉率和变异率随着 个体的适应度在种群的最小适应度、平均适应度和最大适应度之间进行线性调整。
(B) (7)
[0125] 式中,fmax为当代群体中最大适应度值,favg为当代群体中平均适应度值,fmin为当 代群体中最小适应度值,f为要进行交叉操作的两染色体中的较大适应度值;f为要进行变 异操作的染色体适应度。M。、M cl、Mc2为交叉概率,Mm、Mml、Mm2、M m3为变异概率。
[0126] 步骤3-3、k_means优化操作
[0127] 由于K-means算法具有较强的局部搜索能力,所以对于经过遗传操作形成的新种 群进行k-means优化操作,可以大大提高算法的收敛速度。
[0128] k-means算法采用欧氏距离作为相似性的评估指标,准则函数指的是数据库中各 组数据与其聚类中心欧氏距离的平方和:
(8)
[0130] 式中,类Sit的样本数据叉」={&」1冲2,…,aj24},聚类中心B 。
[0131] 基本流程如下:
[0132] 步骤3-3-1、确定经过遗传操作之后数据的分类情况以及各类的聚类中心。
[0133] 步骤3-3-2、计算每组数据与各聚类中心欧式距离的平方和D(slt),将该组数据划 分到距离其最近的一类中,重新进行分类;
[0134] 步骤3-3-3、计算各类的平均值,并作为该类新的聚类中心。
[0135] 步骤3-3-3、不断重复步骤步骤3-3-2和步骤3-3-3,直到准则函数收敛为止(以连 续20个函数值的差值均小于1 (T6为标准)。
[0136] 步骤3-4、新一代种群个体的适应度计算
[0137] 将上述操作的结果记作第t+1代种群S(t+1)。其中,染色体sit+1的适应度函数: (9) ^ L ",4
[0139] ^,.,)=E Z |p-^|| =Z L (1〇) ".二.1 糾 尸 1. .x_,es制 A---}
[0140]染色体sit+i中,类内样本数据Xj^ajhaj〗,...,aj24},由式⑶计算得到的聚类中 Xi 一 ,你 2,??:?,仏24 ! 〇
[0141] 遗传算法的目的是搜索使目标函数D(slt+1)值最小的聚类中心,目标函数值越小 的聚类中心,其适应度也就越大,聚类划分的质量越好。以汽 81*+1)的收敛情况作为判断是 否结束算法的条件。
[0142] 步骤4、判断适应度函数是否收敛,若是则输出最终的聚类中心和聚类结果,否则 跳转到步骤3;
[0143] 步骤5、判断K是否大于Kmax,若是则确定最合适的K值,否则K值加一,跳转到步骤 2〇
[0144] 以安徽省某地区180家商业用户在某一工作日的24个时段内的耗电量为聚类特征 向量,其中包括商场、百货、超市、批发市场、饭店、酒店、宾馆、写字楼、KTV、网吧、酒吧和游 乐场等十几类用户,经过初步筛选,有效数据为135组,编号1-135,当日的平均温度为24.6 °C。对有效数据进行归一化处理,按照图1所示的算法流程进行聚类,并结合用户实际情况 进行用电特性分析。
[0145] 利用系统聚类法进行一次聚类,为二次聚类提供一个合适的K值范围,数据太多, 无法全部显示,如图2所示,聚类树图显示出聚为30类之后的结果,纵坐标表示类与类之间 的相似度大小,相似度大的先聚为一类,相似度小的后聚为一类。各类编号对应的有效数据 编号如表1所示。聚类过程中选用类平均法计算类内个样本的平均值,再将各类平均值之间 距离最近的聚为一类。根据图2中有效数据的聚类结果的层次结构,可以确定初始聚类中心 数目K的上、下限分别为11和2。
[0146] 表1.聚类树图中类编号与有效数据编号对应关系
[0148]为了进一步确定合适的K值,本文设置一聚类评价指标Sum(K),即在聚类结果(&, C2,…,CK)中,各类的类内欧氏距离的平方和。
[0151] K值的聚类评价曲线如图3所示,Sum(K)的值越小,表示聚类结果的类内距离越小, 即聚类结果越好。由图3可知,当K彡6时,Sum(K)逐渐趋于收敛,K值变化对Sum(K)的影响越 来越小。因此,设置初始聚类中心数目K值为6。
[0152] 参数设置:种群规模G = 40,最大迭代次数KMI = 50,交叉率Mcl = 0.9、Mc2 = 0.6、Mc3 =〇.4,变异率^1 = 0.1^2 = 0.0513 = 0.01,每代保留的精英个体数1^ = 2。利用本文中改 进的遗传k-means算法进行聚类,最终的聚类结果如表2和图4所示。
[0153]表2.聚类结果中的类属关系
[0155] 由图4可知,通过研究各类聚类中心的负荷特性,大体可以推测出各类曲线的基本 负荷特性,因此,可以用这6类聚类中心的负荷曲线来代替各类的负荷曲线簇。用户按照用 电模式可以分为避峰型、迎峰型、高负荷率型和连续型四大类,依据各聚类中心的负荷曲线 形状,各类的用电模式划分情况如表3所示,并且通过计算各聚类中心的日负荷率等指标来 比较各类的负荷特性。
[0156] 表3.各聚类中心的负荷特性指标
[0158]结合图4和表3可以看出,类1和类3属于夜间工作、白天休息的避峰型负荷,在10点 ~20点存在一定的低谷负荷。类1存在一个较长的谷期,且谷期负荷比较平稳;而类3谷期波 动较大,存在2个谷期,14点~17点存在一个较小的峰期。这两类负荷已经避开了电网日负 荷曲线的高峰,实施需求响应的潜力不大,大部分的KTV、舞厅、酒吧以及商品批发市场等负 荷属于这两类负荷。
[0159] 类2、类4和类6属于迎峰型负荷,在8点~22点存在峰期负荷且持续时间较长。类2 存在两个高峰分别为午高峰和晚高峰,午高峰出现在13点左右,晚高峰出现在20点~21点, 且晚高峰用电量明显要高于午高峰,部分餐饮业属于这类负荷。类4在9点~18点存在一个 比较平稳的峰期,类6的峰期与之类似,但要稍长一些,一直持续到22点左右,写字楼、商场、 大型超市等具有类似的负荷特性。这三类负荷的峰期均出现在用电高峰时段,由于当日的 平均温度为24.6°C,空调降温负荷比例较大,加之晚高峰的照明负荷,这些负荷的变化会对 电网产生重大影响,这三类用户负荷具有很大的需求响应潜力。
[0160] 类5的日负荷率最高,峰谷差最小,负荷曲线也比较平缓,属于连续型负荷,基于价 格的需求响应潜力不大。这类负荷一般是一些24小时营业的商业用户,如网吧、酒店、KFC等 快餐店和便利超市等。
[0161] 综上所述,与其他行业相比,商业用户用电总量较小,避峰型和连续型的负荷对电 网的峰荷影响不大,需求响应潜力较小;但迎峰型负荷的峰值多集中在用电高峰时段,其中 空调负荷耗电量越来越大,造成电网尖峰负荷激增。因此,为了缓解电网压力,需要对迎峰 型商业负荷实施需求响应,由于空调降温负荷比例较大,其需求响应潜力巨大,针对空调负 荷实施需求相应,可以达到"削峰填谷"的效果。
[0162] 在聚类分析的基础上,从类6中选取某大型商场,以15min为采样间隔,采集其96个 日负荷数据,编号为1-96。由于商场当日的大部分负荷是空调降温负荷,该商场的日负荷曲 线和中央空调的冷负荷分配情况如图5所示。
[0163] 由于中央空调的用电高峰和用电低谷与电网的峰谷时段重合,使得峰谷差增大, 为了实现商场日负荷的"削峰填谷",本文采用基于双工况冷机的蓄冷系统方案,利用谷时 段电网多余的电力使冷机继续制冷,并用蓄冷设备储存起来,在用电高峰时段按照需要将 冷释放出来,减轻冷机的制冷压力,从而也避免中央空调使用过多的峰时段电力。结合安徽 省当地的峰谷时段划分,在蓄冷系统参与下中央空调冷负荷的分配情况如表4和图6所示。 [0164]表4.蓄冷系统参与下中央空调的冷负荷分配表

[0167] 设备共同承担,其中,在蓄冷设备参与下,该方案的蓄冷率为29.16%,中央空调冷 负荷的峰值由86001^下降为57251^,减少33.43%,使得冷机的装机容量能够有较大幅度的 减少,将峰期的部分负荷转移到谷期,达到了"削峰填谷"的目的。
[0168] 最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽 管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然 可以对本发明的【具体实施方式】进行修改或者等同替换,而未脱离本发明精神和范围的任何 修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。
【主权项】
1. 一种基于二次聚类的商业负荷特性聚类分析方法,其特征在于,所述方法包括如下 步骤: (1) 通过系统聚类法确定聚类数K的上下限值Kmax、K_以及设置参数,并初始设κ=κ_; (2) 对K-means算法进行初始化; (3) 进行聚类操作,得到新一代种群个体适应度; (4) 判断适应度函数是否收敛,若是则输出最终的聚类中心和聚类结果,否则跳转到步 骤⑶; (5) 判断K是否大于Kmax,若是则确定最合适的K值,否则K值加一,跳转到步骤(2)。2. 根据权利要求1所述分析方法,其特征在于,所述步骤(1)中,所述设置参数包括种群 规模G、最大迭代次数KMI、交叉概率M。,变异概率^,自适应控制参数Md I213、Mml、Mm2、Mm3。3. 根据权利要求1所述分析方法,其特征在于,所述步骤(2)包括如下步骤: 步骤2-1、采用基于浮点数的染色体编码方案,对染色体种群进行编码,染色体种群编 码方式如下: S (t ) 一 { Slt, S2t, . . . , SKt} Sit - { Xl , X2 , . . . , XLi } j I ^ I Xj - {aji,aj2, . . . ,&jn} 71^ j^Li 式中,在第t代种群S(t)中,K为染色体数量,染色体Sit为第i条染色体;Li为染色体Sit的 编码长度,即第i条染色体中的样本数目;基因维负荷特性样本数据; 步骤2-2、种群初始化; 步骤2-3、初始种群个体适应度计算, 在第t代种群S(t)中,目标函数:类内距离的平方,即欧式距离的平方,计算公式如下:式中,D(Sit)为染色体Sit的目标函数;在染色体Sit中,类内样本数据χ」= {β」ι,β」2,…, aj24},式⑵计算得到的聚类中心i 染色体Sit适应度函数,计算公式如下:(3)〇4. 根据权利要求3所述分析方法,其特征在于,所述步骤2-2中,包括如下步骤: 步骤2-2-1、以第i条染色体的初始化过程为例,随机设置染色体长度L1,A C況,N为样 本数,#为聚类数的经验值; 步骤2-2-2、从[I,N]中随机选取L1个不重复的自然数,这些自然数对应的样本数据组成 一条染色体SiO; 步骤2-2-3、通过比较判断种群中是否已经存在与SlQ完全相同的染色体。若存在,则重 新进行第i条染色体的初始化;若不存在,则转而进行i+Ι染色体的初始化; 步骤2-2-4、依次完成K条染色体的初始化过程,最终形成染色体初始种群S(O)。5. 根据权利要求1所述分析方法,其特征在于,所述步骤(3)包括如下步骤: 步骤3-1、遗传算子操作; 步骤3-2、交叉概率M。和变异概率Mm的自适应调整; 步骤3-3、采用k-means算法进行优化操作; 步骤3-4、新一代种群个体的适应度计算。6. 根据权利要求5所述分析方法,其特征在于,所述步骤3-1包括如下步骤: 步骤3-1-1、选择操作 染色体Sit被选中的概率:(4) 式中,Slt表示第t代种群S(t)中的第i条染色体,染色体的总数为K,f (Slt)表示染色体 s it的适应度; 步骤3-1-2、进行插入删除交叉算子操作; 步骤3_1_3、进行变异操作; 步骤3-1-3-1、染色体Sit中,染色体长度为Li,随机选取一自然数C作为变异点总个数, 满足 Ce[l,U]; 步骤3-1 -3-2、在[O,1 ]中随机选取一数r,若r SMm,Mm为变异概率,则不进行变异操作; 否则在[I,N]中随机选取一个的自然数,用其对应的初始样本数据来替换父代染色体中的 数据; 步骤3-1-3-3、重复C次,退出变异操作。7. 根据权利要求5所述分析方法,其特征在于,所述步骤3-2中,所述交叉概率M。和所述 变异概率^随着个体的适应度在种群的最小适应度、平均适应度和最大适应度之间进行线 性调整 (53 m 式中,fmax为当代群体中最大适应度值,favg为当代群体中平均适应度值,fmin为当代群 体中最小适应度值,f为要进行交叉操作的两染色体中的较大适应度值;P为要进行变异操 作的染色体适应度,M。、Mcl、M c213为交叉概率,Mm、Mml、Mm2、M m3为变异概率。8. 根据权利要求5所述分析方法,其特征在于,所述步骤3-3包括如下步骤: 步骤3-3-1、确定经过遗传操作之后数据的分类情况以及各类的聚类中心; 步骤3-3-2、计算每组数据与各聚类中心欧式距离的平方和D(Slt),计算公式如下: (7) 式中,类Sit的样本数据Xj= {aji,aj2, · · ·,aj24},聚类中心^ =丨",…,'4 ,将该组数据 划分到距离其最近的一类中,重新进行分类; 步骤3-3-3、计算各类的平均值,并作为该类新的聚类中心; 步骤3-3-4、不断重复步骤3-3-2和3-3-3,直到准则函数收敛为止,即以连续20个函数 值的差值均小于HT6为标准。9.根据权利要求5所述分析方法,其特征在于,所述步骤3-4中,所述适应度计算方法如 下: 在第t+Ι代种群S(t+1)中,染色体sit+1的适应度函数:在染色体sit+ι中,类内样本数据Xj = IajLaj2,…,aj24},由式⑵计算得到的聚类中心Xi - \Qi\ ^Qn ·,···} I p C8) (9)
【文档编号】G06K9/62GK105894034SQ201610203939
【公开日】2016年8月24日
【申请日】2016年4月1日
【发明人】史常凯, 盛万兴, 段青, 刘振, 艾欣, 李玉凌, 李二霞, 张波, 高媛, 吕志鹏, 周勐
【申请人】中国电力科学研究院, 国家电网公司, 国网江西省电力公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1