一种基于智能电网大数据的电价执行稽查方法

文档序号:9811166阅读:1544来源:国知局
一种基于智能电网大数据的电价执行稽查方法
【技术领域】
[0001] 本发明涉及一种基于智能电网大数据的电价执行稽查方法,尤其是涉及一种基于 密度的改进kieans聚类(Modified Density K-means Clustering,MDKC)和Fr6chet距离 判别分析(Frgchet Distance Discriminant Analysis,FDDA)算法的电价执行稽查方法, 属于电价执行稽查方法的创新技术。
【背景技术】
[0002] 电费收入是供电企业最主要的经营收入来源,按期按量回收电费是供电企业的重 要经济指标之一。随着智能电网大数据的发展,配用电环节产生的数据量大、多维度、处理 逻辑复杂、存储周期长、计算频度高等大数据特征,传统的营销稽查方法已无法满足智能电 网大数据分析的需求。
[0003] 目前的电价执行营销稽查主要依靠定期巡检、随机抽样等方法,工作方式被动且 稽查目标很不明确,无法及时发现并取缔电价执行异常用户。
[0004] 近年来,随着数据挖掘技术和智能算法的发展,k均值(kmeans)算法逐步被运用到 电力营销中来,如智能客户分群等。但是kmeans算法也存在许多不足,如初始聚类中心随机 选取,聚类结果不稳定;容易陷入聚类结果的局部最优解等。此外,判别分析方法也在电力 系统领域分析得到一定的应用。然而,利用数据挖掘技术和智能算法等方法实现电价执行 在线稽查的研究尚属空白。

【发明内容】

[0005] 本发明的目的在于提供一种基于智能电网大数据的电价执行稽查方法,本发明以 充分利用及分析智能电网中海量计量营销系统中的实时数据,实现电价执行营销稽查的智 能化和精确化。
[0006] 本发明采用的技术方案是:
[0007] 本发明基于智能电网大数据的电价执行稽查方法,包括以下步骤:
[0008] 1)利用数据预处理模块对电力用户用电数据进行处理;
[0009] 2)利用聚类算法构建电力用户典型用电轨迹专家库;
[0010] 3)利用距离判别分析算法实现对电力用户电价执行稽查。
[0011] 上述步骤1)中,数据预处理模块包括数据获取,数据缺失值处理,数据"去噪"处 理;
[0012] 数据缺失值处理采用三次样条插值法,其利用的公式为:
[0014]其中,电力用户用电特性曲线满足71 = 5(11),11为5(11)在1 = 11出的二阶导数,111 = Xi-Xi-1为增量;
[0015]数据"去噪"处理采用高斯滤波对电力用户用电特性曲线进行曲线平滑处理,公式 如下:
[0017] 式中,ie[l,n],n为样本个数,σ为样本方差。
[0018] 上述步骤2)中,聚类算法构建电力用户典型用电轨迹专家库的具体步骤为:
[0019] 21)初始化最大聚类数kmax,最大和最小的密度参数调整系数amax,a min,收敛判决 ξ,初始迭代标志I ter;
[0020] 22)计算每个样本点的密度参数值,其计算公式如下:
[0021 ] Density(Pi,ε)=|Neighbor(Pi, ε)
[0022] 其中,Pi为样本点,i e [ 1,η],ε为半径;
[0023] 23)根据步骤22)求出所有点的密度参数值,形成密度参数集合Den并按降幂排序, 利用高密度阈值〇_也,取出其中的部分高密度参数AH_Den作为初始聚类中心的选择对象; [0024] 24)在HiDen中选取最大密度参数值所对应的数据对象作为第1个聚类中心C!,并 将&的密度参数值从高密度集合&中删除;
[0025] 25)选取HiDen中距离&最远的数据对象作为第2个聚类中心C2,并将C2所对应的密 度参数值从高密度集合HiDen中删除;
[0026] 26)计算HiDen所对应的数据对象与&,&的距离(ΚΧ,&)和(1(乂,(:2)4已3,(: 3为满足 1^奴(101(:1),(1〇1(:2))所对应的数据对象,并将(:3从高密度集合把〇 611中删除;
[0027] 27)重复步骤25),直到产生个聚类中心为止,k为聚类数;
[0028] 28)根据样本集与聚类中心的最小欧式距离来分配类簇,计算公式如下
[0029] Dist(xt,Ck( Iter)) =min{Dist(xt,C(j)( Iter) ),j = l,2,…,k}
[0030] 其中xt为第j的样本,CW (I ter)为第I ter次迭代的聚类中心;
[0031] 29)计算误差准则函数
[0033] 其中〗e (7?.你,CG)(Iter)和如分别是第Iter次迭代中第j类的聚类中心和 该类的样本个数;
[0034] 30)重复步骤23)和步骤24),直到满足|j(Iter)-J(Iter-l)|<|停止;
[0035] 31)利用组合聚类评价指标DBI和得分评价指标SCORE,结合高密度阈值0_他对聚 类结果进行评价,相应的公式如下:
[0037]
表示类间距离,Xl,m,Cl分别表示第i的数据对象,个数以及 对应的聚类中心;dij表示聚类中心Ci和Cj的欧式距离;
[0040]表示当前聚类结果中各个类簇内对象与类簇中心的最大距离之和的平均值,即聚 类平均半径;
[0042]表示当前聚类结果中各个类簇内所有对象与其余对象之间最小距离之和的平均 值,即聚类平均最小间距;特别地,当聚类数为1时,聚类平均最小间距为〇;
[0043] 32)选取最大得分评价指标值S0CRE所对应的k做为最佳聚类数,形成电力用户典 型用电轨迹。
[0044] 上述步骤3)中,电力用户电价执行稽查判别具体步骤如下:
[0045] 41)利用MDKC聚类算法构建每种电价类别的典型用电轨迹,形成典型用电轨迹专 家库;
[0046] 42)计算待判定用户与其典型用电轨迹的Fr6chet距离,其计算
[0047] 公式如下:
[0050]其中A,B为两条用电轨迹曲线;
[0051] 43)设置异常判别阈值fre_th,根据样本与典型轨迹的距离是否在允许范围内,得 出异常嫌疑客户;
[0052 ] 44)结合指标嫌疑系数阈值ab_rat i o_th,确定用户异常名单;
[0053] 45)计算嫌疑异常用户与典型用电轨迹专家库中每种用电轨迹的欧式距离,距离 最小的典型用电轨迹即为嫌疑异常用户实际执行的电价类别;
[0054] 46)形成最终的电价执行异常用户名单。
[0055] 与现有技术相比,本发明具有如下显著的效果:
[0056] (1)本发明提出的一种基于智能电网大数据的电价执行稽查方法原理简单明了, 稳定性高,稽查精度高;
[0057] (2)本发明提出的一种基于智能电网大数据的电价执行稽查方法,采用基于密度 的改进kmeans (MDKC)算法,有效地利用数据样本的密度来选取初始聚类中心。至于最佳聚 类数的确定,贝>1采用了综合〇3¥16 8-8〇111(1;[11111(161(081)指标和一种新的评价指标(即 SCORE指标)的组合聚类评价指标择优方法;在新用户的判别分析方面,采用了一种更为高 级的Frgchet距离判别方法(FDDA),从而极大地提高了判别结果的精度。
[0058] (3)本发明提出的一种基于智能电网大数据的电价执行稽查方法能够实时获取 计量营销系统中的客户用电数据进行分析,从而实现电价执行稽查的在线运作,提高了营 销稽查工作的智能性。
[0059] 本发明能够实现用电行为轨迹的智能分析和辨识;实现客户电价执行的远程在线 诊断,提高营销稽查的针对性、准确性和时效性。
【附图说明】
[0060] 图1为本发明的一种基于智能电网大数据的电价执行稽查方法的总体框图;
[0061] 图2为本发明的一种基于智能电网大数据的电价执行稽查方法之MDKC算子的流程 图;
[0062] 图3为本发明的一种基于智能电网大数据的电价执行稽查方法之H)DA算子的流程 图。
【具体实施方式】
[0063]如图2所示为本发明的一种基于智能电网大数据的电价执行稽查方法MDKC算子在 某电网的应用流程图,包括以下步骤:
[0064] 步骤1,结合数据集的特点,初始化最大聚类数kmax= 15,最大和最小的密度参数 调整系数amax = 0.8,amin = 〇. 5,收敛判据ξ = 0.0001,初始迭代标志I ter = 1;
[0065] 步骤2,根据密度参数值来确定初始聚类中心,具体步骤如下:
[0066] ⑴根据公式
[0067] Density(Pi,e)= |Neighbor(Pi,e) |,其中,Pi为样本点,ie[l,n],e为半径;
[0068] 求出所有点的密度参数值,形成密度参数集合Den并按降幂排序,利用高密度阈值 D_th,取出其中的部分高密度参数AH_Den作为初始聚类中心的选择对象;
[0069]⑵在HiDen中选取最大密度参数值所对应的数据对象作为第1个聚类中心&,并将 &的密度参数值从高密度集合&中删除;
[0070] ⑶在HiDen中选取最大密度参数值所对应的数据对象作为第1个聚类中心a,并将 &的密度参数值从高密度集合&中删除;
[0071] ⑷选取HiDen中距离&最远的数据对象作为第2个聚类中心C2,并将C2所对应的密 度参数值从高密度集合HiDen中删除;
[0072] (5)计算HiDen所对应的数据对象与&,(:2
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1