一种基于决策树分类的负荷模型参数校验方法

文档序号:10687257阅读:396来源:国知局
一种基于决策树分类的负荷模型参数校验方法
【专利摘要】本发明涉及一种基于决策树分类的负荷模型参数校验方法,包括以下步骤:1)得到负荷节点的负荷模型参数及相应负荷节点在扰动时电压、电流、有功和无功的动态特征曲线;2)将负荷模型参数区间离散化;3)得到最终特征段shapelet,及相应的分裂点dbsp;4)选取信息增益最大的最终特征段shapelet作为最好特征段shapelet;5)将所有样本划分数据子集;6)判断所有样本是否都正确分类,如果没有都正确分类则转步骤7),否则转步骤8);7)分别对D1和D2中的样本进行判断,并转步骤3)进行迭代搜索;8)运用C4.5算法依次得到pct,s0,R2的决策树模型;9)采用10折交叉验证的方式对所得决策树的分类准确度进行测试,进而得到负荷模型参数校验模型整体的准确度。
【专利说明】
一种基于决策树分类的负荷模型参数校验方法
技术领域
[0001] 本发明涉及一种负荷模型参数校验方法,特别是关于一种在电力系统领域中使用 的基于决策树分类的负荷模型参数校验方法。
【背景技术】
[0002] 电力系统负荷模型结构和参数对系统仿真结果具有重要影响。负荷模型结构、负 荷模型参数辨识以及负荷模型参数校验是负荷建模的三个主要方面。而当前负荷建模的研 究主要集中在负荷模型参数的辨识。负荷模型参数的辨识本质是曲线拟合,即针对某一负 荷模型结构在负荷参数空间搜索得到一组参数可以最好的拟合输入与输出之间的关系,因 此,负荷模型参数的辨识所得结果仍需进一步校验。传统负荷模型参数的校验主要通过负 荷模型参数辨识所得曲线与仿真曲线对比来实现,这样,针对某一故障情况下所得负荷模 型参数不一定适用于其他故障情形,因此传统负荷模型参数校验存在一定的缺陷。
[0003] 随着广域测量系统(Wide Area Measurement System,WAMS)的发展,PMU数据为负 荷模型参数的辨识提供了又一数据来源,同时利用这些数据结合数据挖掘的方法和思路可 以实现负荷模型参数的校验。考虑到负荷模型参数辨识的主要思路是在电压作为输入的情 况下,通过拟合功率的输出来得到相应的负荷模型参数,借鉴这一思路,负荷模型参数与动 态特征之间应该存在一定的联系。因此,亟需通过挖掘负荷模型参数与动态响应曲线之间 的关系,来实现在发生故障情况下,正确进行负荷模型参数校验。

【发明内容】

[0004] 针对上述问题,本发明的目的是提供一种基于决策树分类的负荷模型参数校验方 法,其通过数据挖掘的方法得到负荷模型参数与负荷节点在发生扰动后动态响应曲线之间 的统计关系。
[0005] 为实现上述目的,本发明采取以下技术方案:一种基于决策树分类的负荷模型参 数校验方法,其特征在于它包括以下步骤:1)通过系统仿真结果得到负荷节点的负荷模型 参数以及相应负荷节点在扰动时电压曲线、电流曲线、有功曲线和无功曲线的动态特征曲 线,进而得到包含N个样本的数据集D; 2)将负荷模型参数进行区间离散化,负荷模型参数主 要包括负荷模型参数中动静负荷比例pct,转子侧电阻R2以及初始滑差so三个参数,根据各 参数总的变化区间分别得到其具体的离散区间以及类别编号;3)根据所得类别编号,分别 从电压曲线、电流曲线、有功曲线和无功曲线中得到最终的特征段shapelet,及相应的分裂 点d bsp; 4)从步骤3)中电压曲线对应的最终特征段shape I et、电流曲线对应的最终特征段 shapelet、有功曲线对应的最终特征段shapelet和无功曲线对应的最终特征段shapelet, 选取信息增益最大的最终特征段shapelet作为最好特征段shapelet;5)计算所有样本与最 好特征段shapelet之间的距离,并根据相应的分裂点d bsp,将所有样本划分为DjPD2两部分 数据集;6)判断所有样本是否都正确分类,如果没有都正确分类则进入步骤7),否则进入步 骤8) ;7)分别判断01和02中的样本是否属于同一类,如果D1中样本不属于同一类则令D = D1 进入步骤3)进行迭代搜索,否则停止迭代;如果D2中样本不属于同一类则令0 =出进入步骤 3)进行迭代搜索,否则停止迭代;8)计算N个样本与迭代搜索所得所有最好特征段shapelet 的距离,然后将各距离作为分类属性,运用C4.5算法依次得到?(^,8〇,1?2的决策树模型;9)为 验证决策树模型的有效性,采用10折交叉验证的方式对所得决策树的分类准确度进行测 试,分别得到pct,s〇以及R 2的模型准确度,进而得到负荷模型参数校验模型整体的准确度。
[0006] 优选地,所述步骤3)中,以电压曲线为例,得到最终的特征段shapelet,及相应的 分裂点dbsp的步骤如下:(3.1)从N个样本中选取所有长度在[111;[111611,11^1611]之间的子序 列,由此得到候选特征段shapelet的个数为:
[0007]
[0008] 其中,1^为第:[个样本时间序列长度,111;[111611和1]^11611均为预先设定值 ;(3.2)通过 下面公式计算各候选特征段shapelet s与所有样本T之间的距离d(s,T),其中,第i个样本 与第j个候选特征段shapelet之间的距离记为d(Sj,Ti);
[0009]
[00?0] 其中,length(s)表示候选特征段shapelet s的长度;(3.3)针对每个候选特征段 shapelet,根据CKs^T1),依次选择任意两个临近点距离的平均值作为分裂点距离dsp,计算 得到在不同分裂点距离情况下该候选特征段shapelet的信息增益值;(3.4)选取最大的信 息增益作为该候选shapelet的信息增益,并且此时分裂点为d bsp; (3.5)选取信息增益最大 的候选特征段shapelet为最终特征段shapelet。
[0011] 优选地,所述步骤(3.3)中,候选特征段shapelet的信息增益值计算步骤如下:(a) 对于包含m个类别且第j类样本比例为!^的数据集D,其熵定义为:
[0012]
[0013] (b)在数据集D中,把d(Sj,Ti)大于dsp的样本归于子数据集Di,把d( Sj,Ti)小于dsp的 样本归于子数据集D2,如果DjPD2中样本比例分别为f(D〇和f (D2),则划分后数据集D的熵定 义为:£(/)) = /(D, P(AhZ(D2)E(I)2)s(C)则该划分策略的信息增益为:/G(^p) = £(£>卜五 [0014]优选地,所述步骤5)中,把各个样本与最好特征段shapelet之间的距离同相应的 4@进行比较,其距离大于相应的4@的样本归于一类,其距离小于相应的d bsp的样本归于另 一类,即得到Dd,两个数据集。
[0015] 优选地,所述步骤6)中,如果每个数据子集中只包含一种类别编号的样本,即所有 样本都正确分类。
[0016] 本发明由于采取以上技术方案,其具有以下优点:1、本发明采用基于决策树分类 的负荷模型参数校验方法,利用所有运行数据来挖掘相应动态特征曲线与负荷模型参数之 间的相关关系,因此所得校验模型更具统计意义。2、本发明采用基于决策树分类的负荷模 型参数校验方法,通过样本的学习可以得到总体校验模型可信度的大小,对实际电网具有 一定的指导意义。
【附图说明】
[0017] 图1是本发明的整体流程示意图;
[0018] 图2是本发明中实施例的电网单线结构示意图;
[0019] 图3是本发明中实施例对训练样本集进行分类学习得到的动静负荷比例决策树模 型结构示意图;
[0020] 图4是本发明中实施例对训练样本集进行分类学习得到的初始滑差决策树模型结 构示意图;
[0021] 图5是本发明中实施例对训练样本集进行分类学习得到的转子侧电阻决策树模型 结构示意图。
【具体实施方式】
[0022]下面结合附图和实施例对本发明进行详细的描述。
[0023] 如图1所示,本发明提供一种基于决策树分类的负荷模型参数校验方法,其具体步 骤如下:
[0024] 1)通过系统仿真结果得到负荷节点的负荷模型参数以及相应负荷节点在扰动时 电压曲线、电流曲线、有功曲线和无功曲线的动态特征曲线,进而得到包含N个样本的数据 集D;
[0025] 2)将负荷模型参数进行区间离散化,负荷模型参数主要包括负荷模型参数中动静 负荷比例pct,转子侧电阻R 2以及初始滑差so三个参数,根据各参数总的变化区间分别得到 其具体的离散区间以及类别编号;
[0026] 3)根据所得类别编号,分别从电压曲线、电流曲线、有功曲线和无功曲线中得到最 终的特征段shape I et,及相应的分裂点dbsp;
[0027]以其中电压曲线为例,获取最终的特征段shapelet的步骤如下:
[0028] (3.1)从N个样本中选取所有长度在[minlen,maxlen]之间的子序列,由此得到候 选特征段shaoelet的个数为:
[0029]
Cl)
[0030] 其中,mi为第i个样本时间序列长度,minlen和maxlen均为预先设定值;
[0031] (3.2)通过公式(2)计算各候选特征段shapelet s与所有样本T之间的距离d(s, T),其中,第i个样本与第j个候选特征段shapelet之间的距离记为d(sj,Ti);
[0032]
(2)
[0033] 其中,length(s)表示候选特征段shapelet s的长度;
[0034] (3.3)针对每个候选特征段shapelet,根据CKs^T1),依次选择任意两个临近点距 离的平均值作为分裂点距离dsp,计算得到在不同分裂点距离情况下该候选特征段shapelet 的信息增益值;
[0035] (3.4)选取最大的信息增益作为该候选shapelet的信息增益,并且此时分裂点为 dbsp ;
[0036] (3.5)选取信息增益最大的候选特征段81^口6161:为最终特征段81^口6161:;
[0037] 4)从步骤3)中电压曲线对应的最终特征段shapelet、电流曲线对应的最终特征段 shapelet、有功曲线对应的最终特征段shapelet和无功曲线对应的最终特征段shapelet, 选取信息增益最大的最终特征段shapelet作为最好特征段shapelet;
[0038] 5)计算所有样本与最好特征段shapelet之间的距离,并根据相应的分裂点dbsP,将 所有样本划分为Di和D 2两部分数据集;
[0039] 6)判断所有样本是否都正确分类,如果没有都正确分类则进入步骤7),否则进入 步骤8);
[0040] 7)分别判断01和出中的样本是否属于同一类,如果D1*的样本不属于同一类,则令 0 = 01进入步骤3)进行迭代搜索,否则停止迭代;如果02中的样本不属于同一类,则令D = D2 进入步骤3)进行迭代搜索,否则停止迭代;
[0041] 8)计算N个样本与迭代搜索所得所有最好特征段shapelet的距离,然后将各距离 作为分类属性,运用C4.5算法依次得到pet,so,此的决策树模型;
[0042] 9)为验证决策树模型的有效性,采用10折交叉验证的方式对所得决策树的分类准 确度进行测试,分别得到pCt,SQ以及R2的模型准确度,进而得到负荷模型参数校验模型整体 的准确度。
[0043]上述步骤1)中,以某一负荷节点所带负荷为仿真研究对象,在不同潮流情况下,当 电力系统中发生三相短路故障时,则以该负荷节点的负荷模型参数以及相应电压动态特征 曲线,电流动态特征曲线、有功动态特征曲线和无功动态特征曲线为样本。
[0044] 上述步骤(3.3)中,候选特征段shapelet的信息增益值计算步骤如下:
[0045] (a)对于包含m个类别且第j类样本比例为仍的数据集D,其熵定义为:
[0046]
⑶.
[0047] (b)在数据集D中,把d(Sj,Ti)大于dsp的样本归于子数据集Di,把d( Sj,Ti)小于dsp的 样本归于子数据集D2,如果DjPD 2中样本比例分别为f(D〇和f (D2),则被划分后数据集D的熵 定义为:
[0048]
(4)
[0049] (c)则该划分策略的信息增益IG(Sp)通过公式(5)得到。
[0050]
(5)
[00511 上述步骤5)中,把各个样本与最好特征段shapelet之间的距离同相应的(1_进行 比较,其距离大于相应的(1_的样本归于一类,其距离小于相应的dbsp的样本归于另一类,即 得到DjPD2两个数据集。
[0052]上述步骤6)中,如果每个数据子集中只包含一种类别编号的样本,即所有样本都 正确分类。
[0053]实施例,如图2~5所示,利用基于决策树分类的负荷模型参数校验方法来校验 BUS16所带负荷的系统仿真结果,其具体步骤如下:
[0054] 1)以Busie所带负荷为仿真研究对象,在不同潮流情况下BUS19-BUS21发生三相短 路故障时,以Busl6在不同负荷模型参数情况下的电压动态特征曲线、电流动态特征曲线、 有功动态特征曲线和无功动态特征曲线为样本,得到包含135个样本的数据集D;
[0055] 2)将负荷模型参数进行区间离散化,主要考虑负荷模型参数中动静负荷比例pct, 转子侧电阻R2以及初始滑差so三个参数,根据各参数总的变化区间分别得到其具体的离散 区间以及类别编号,如表1所示:
[0056]表1各参数离散区间及类别编号
[0058] 3)根据所得类别编号,分别从电压曲线、电流曲线、有功曲线和无功曲线中得到最 终的特征段shapelet,及相应的分裂点db sp,其具体实现步骤如下:
[0059] (3.1)从135个样本中选取所有长度在[10,200]之间的子序列,由此得到候选 shape let的个数为:
[0060]
(6)
[0061 ]其中,minlen = 10,maxlen = 200,N=135,mi = 290;
[0062] (3.2)通过公式(2)计算各候选shapelet s与所有样本T之间的距离d(s,T),其中, 第i个样本与第j个候选shapelet之间的距离记为d(Sj,Ti);
[0063]
(7)
[0064] (3.3)针对每个候选特征段shapelet,根据CKs^T1),依次选择任意两个临近点距 离的平均值作为分裂点距离dsp,计算得到在不同分裂点距离情况下该候选特征段shapelet 的信息增益值;
[0065] (3.4)选取最大的信息增益作为该候选shapelet的信息增益,并且此时分裂点为 dbsp ;
[0066] (3.5)选取信息增益最大的候选特征段shapelet为最终特征段shapelet;
[0067] 4)从步骤3)中电压曲线对应的最终特征段shapelet、电流曲线对应的最终特征段 shapelet、有功曲线对应的最终特征段shapelet和无功曲线对应的最终特征段shapelet, 选取信息增益最大的最终特征段shapelet作为最好特征段shapelet;
[0068] 5)计算所有样本与最好的特征段shapelet之间的距离,并根据相应的dbsp,将所有 样本划分为Di和D2两部分;
[0069] 6)判断所有样本是否都正确分类,如果没有都正确分类则进入步骤7),否则进入 步骤8);
[0070] 7)分别判断Di和D2中的样本是否属于同一类,如果Di中的样本不属于同一类,则令 0 = 01进入步骤3)进行迭代搜索,否则停止迭代;如果02中的样本不属于同一类,则令D = D2 进入步骤3)进行迭代搜索,否则停止迭代;
[0071] 8)计算得到N个样本与迭代搜索所得所有shapelet的距离,然后将各距离特征作 为分类属性,依次得到PCt,so,R2的决策树模型,如图3~5所示,其中,决策树叶子节点表示 各参数的离散区间与表1相同,决策树中的分裂点dqi代表来自无功q的第i个特征段;分裂 点dp i代表来自有功p的第i个特征段;分裂点dv i代表来自电压V的第i个特征段;分裂点d i i 代表来自电流i的第i个特征段;
[0072] 9)为验证决策树模型的有效性,采用10折交叉验证的方式对所得决策树的分类准 确度进行测试,分别得到pet的精度为96.2963%,1?2的精度为89.6296%,so的精度为 95.5556%,由此可见负荷模型参数整体的分类准确度相对较高,将决策树用于电力系统负 荷模型参数校验对负荷模型参数辨识以及负荷模型参数有效性验证具有一定的指导意义。 [0073]上述各实施例仅用于说明本发明,各部件的结构、尺寸、设置位置及形状都是可以 有所变化的,在本发明技术方案的基础上,凡根据本发明原理对个别部件进行的改进和等 同变换,均不应排除在本发明的保护范围之外。
【主权项】
1. 一种基于决策树分类的负荷模型参数校验方法,其特征在于:它包括以下步骤: 1) 通过系统仿真结果得到负荷节点的负荷模型参数以及相应负荷节点在扰动时电压 曲线、电流曲线、有功曲线和无功曲线的动态特征曲线,进而得到包含N个样本的数据集D; 2) 将负荷模型参数进行区间离散化,负荷模型参数主要包括负荷模型参数中动静负荷 比例pct,转子侧电阻R2以及初始滑差so三个参数,根据各参数总的变化区间分别得到其具 体的离散区间以及类别编号; 3) 根据所得类别编号,分别从电压曲线、电流曲线、有功曲线和无功曲线中得到最终的 特征段shapelet,及相应的分裂点db sp; 4) 从步骤3)中电压曲线对应的最终特征段s h a p e 1 e t、电流曲线对应的最终特征段 shapelet、有功曲线对应的最终特征段shapelet和无功曲线对应的最终特征段shapelet, 选取信息增益最大的最终特征段shapelet作为最好特征段shapelet; 5) 计算所有样本与最好特征段shapelet之间的距离,并根据相应的分裂点dbsp,将所有 样本划分为Di和D 2两部分数据集; 6) 判断所有样本是否都正确分类,如果没有都正确分类则进入步骤7),否则进入步骤 8); 7) 分别判断Di和D2中的样本是否属于同一类,如果Di中样本不属于同一类则令D = Di进 入步骤3)进行迭代搜索,否则停止迭代;如果D2中样本不属于同一类则令0 =出进入步骤3) 进行迭代搜索,否则停止迭代; 8) 计算N个样本与迭代搜索所得所有最好特征段shapelet的距离,然后将各距离作为 分类属性,运用C4.5算法依次得到pet,so,此的决策树模型; 9) 为验证决策树模型的有效性,采用10折交叉验证的方式对所得决策树的分类准确度 进行测试,分别得到pct,sQ以及R 2的模型准确度,进而得到负荷模型参数校验模型整体的准 确度。2. 如权利要求1所述的一种基于决策树分类的负荷模型参数校验方法,其特征在于:所 述步骤3)中,以电压曲线为例,得到最终的特征段shapelet,及相应的分裂点4#的步骤如 下: (3.1) 从N个样本中选取所有长度在[minlen,maxlen]之间的子序列,由此得到候选特 征段shape let的个数为:其中,mi为第i个样本时间序列长度,minlen和maxlen均为预先设定值; (3.2) 通过下面公式计算各候选特征段shapelet s与所有样本T之间的距离d(s,T),其 中,第i个样本与第j个候选特征段shapelet之间的距离记为d(Sj,Ti);其中,length(s)表示候选特征段shapelet s的长度; (3.3) 针对每个候选特征段shapelet,根据cKs^TO,依次选择任意两个临近点距离的 平均值作为分裂点距离dsp,计算得到在不同分裂点距离情况下该候选特征段shapelet的信 息增益值; (3.4) 选取最大的信息增益作为该候选811&口616丨的信息增益,并且此时分裂点为(1^; (3.5) 选取信息增益最大的候选特征段81^?6161:为最终特征段81^?6161:。 3 .如权利要求2所述的一种基于决策树分类的负荷模型参数校验方法,其特征在于:所 述步骤(3.3)中,候选特征段81^口6161:的信息增益值计算步骤如下: (a) 对于包含m个类别且第j类样本比例为仍的数据集D,其熵定义为:(b) 在数据集D中,把d(Sj,Ti)大于dsp的样本归于子数据集Di,把d(Sj,Ti)小于d sp的样本 归于子数据集D2,如果DjPD2中样本比例分别为f(D〇和f(D 2),则划分后数据集D的熵定义 为: £(D) = /(0l)£(0l) + /(D2)£(D2); (c) 则该划分策略的信息增益为: IG(sp)= E(D)-E(D) 〇4. 如权利要求1所述的一种基于决策树分类的负荷模型参数校验方法,其特征在于:所 述步骤5)中,把各个样本与最好特征段shapelet之间的距离同相应的(1_进行比较,其距离 大于相应的(1_的样本归于一类,其距离小于相应的d bsp的样本归于另一类,即得到DdPD2两 个数据集。5. 如权利要求1所述的一种基于决策树分类的负荷模型参数校验方法,其特征在于:所 述步骤6)中,如果每个数据子集中只包含一种类别编号的样本,即所有样本都正确分类。
【文档编号】G06K9/62GK106055761SQ201610354094
【公开日】2016年10月26日
【申请日】2016年5月25日
【发明人】陆超, 王颖, 苏寅生, 黄河, 刘映尚, 韩英铎
【申请人】清华大学, 中国南方电网有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1