一种基于自动最优聚类算法的用户用电行为分析方法与流程

文档序号:16470942发布日期:2019-01-02 23:05阅读:576来源:国知局
一种基于自动最优聚类算法的用户用电行为分析方法与流程
本发明属于电力系统大数据处理
技术领域
,更为具体地讲,涉及一种基于自动最优聚类算法的用户用电行为分析方法。
背景技术
:数据挖掘是当今的热门学科之一,利用数据挖掘技术可以从海量数据中提取出有效信息,为管理者统筹、决策提供参考。聚类分析是数据挖掘领域内的重要分支,利用聚类技术,对大量智能电表记录的用电数据进行分类,找出具有相似特征的用户,划分用户类型。对处于不同类型的用户,分别构建用户用电模型,进行针对性的行为分析,发现用户用电的规律,将这些规律与电力营销策略等相结合,从而发现目前电力销售活动中可能存在的问题,并进一步修正,同时可以指导不同类型的用户合理用电,能有效降低电网调度成本,支撑电网安全稳定运行。由于用户用电具有随机性,各用电设备电气特征差异很大,采用传统的聚类分析的效果不佳。而且,不同时期用户的用电行为特征差异也很大,因此需要自动聚类方法,适应用户用电行为分析动态变化。文献“张素香,刘建明,赵丙镇,等.基于云计算的居民用电行为分析模型研究.电网技术,2013,37(6):1542-1546.”提出基于云计算的居民用电行为分析方法。采用k-means聚类算法对居民用电数据分析,将居民用户分为多类,构建用户用电规律。该方法需要人工设定用户类别数量和对应类别的初始点,容易形成局部最优解,得到的用户用电规律有限,仅能得到某类用户在某时段的用电趋势。文献“王星华,陈卓优,彭显刚.一种基于双层聚类分析的负荷形态组合识别方法_王星华.电网技术,2016,(5):1495-1501.”提出了时间序列数据双层聚类方法,分别用余弦相似度和欧氏距离作为聚类的距离指标,并且给出了简洁快速的初始聚类中心的选取规则,最终得到了稳定性和精确度良好的聚类算法。文献“张欣,高卫国,苏运.基于函数型数据分析和k-means算法的电力用户分类.电网技术,2015,(11):3153-3162.”利用核回归将离散的电量数据还原成连续的曲线,再进行聚类分析,解决了电量数据长短不一致,欧氏距离的计算问题。文献提出了pearson相关系数聚类算法,将pearson相关系数作为样本相似性的指标,该算法侧重于时间序列曲线轮廓的聚类,充分反应了时间序列曲线的轮廓的相似性。文献“王星华,许炫壕,周亚武.一种基于pearson相关系数的电力用户负荷曲线聚类算法_王星华.黑龙江电力,2017,(5):397-401,415.”针对时间序列数据,总结了聚类分析中,对聚类效果有重大影响的相似性度量指标。以上聚类方法需要人工确定参数,因此,为了进一步分析海量用电数据中隐藏的价值信息,需要提出新的自动聚类方法来分析用户用电数据。技术实现要素:本发明的目的在于克服现有技术的不足,提供一种基于自动最优聚类算法的用户用电行为分析方法,通过自动最优聚类方式,完成对用户用电数据的聚类,从而挖掘出用户用电行。为实现上述发明目的,本发明一种基于自动最优聚类算法的用户用电行为分析方法,其特征在于,包括以下步骤:(1)、用户用电负荷数据预处理采集n组用户用电负荷数据,判断各组用户用电数据是否完整,再对不完整的用户用电负荷数据进行处理,其中,对间断缺失的用户用电负荷数据,采用上下两个点数据求均值的方式进行补差;对连续缺的用户用电负荷数据,采用模糊预测手段来补差,以保证用户用电负荷数据的完整性;(2)、亲和度传播聚类(2.1)、构建相似度矩阵s,s中的元素表示任意两组用户用电负荷数据xi、xj间的相似度,通过计算两组用户用电负荷数据间的欧氏距离得到,即:其中,s的大小为n×n,i,j∈n;(2.2)、选择相似度的中值或最小值作为偏向参数p,再用偏向参数p替代相似度矩阵s的主对角元素;(2.3)、设置最大迭代次数t;计算第t次迭代时的吸引度矩阵rt和归属度矩阵at,t=1,2,…,t;其中,rt中的元素rt(i,j)为:rt(i,j)=st(i,j)-max(at-1(i,j′)+st-1(i,j′)),j≠j'其中,at中的元素at(i,j)为:(2.4)、设置初始阻尼因子γ0,γ0∈(0,1);再利用初始阻尼因子γ0更新吸引度矩阵rt和归属度矩阵at;更新后的吸引度矩阵rt为:rt=rt·(1-γ0)+rt-1·γ0;更新后的归属度矩阵at为:at=at·(1-γ0)+at-1·γ0(2.5)、利用亲和度传播聚类,输出聚类数量和聚类中心点判断当前迭代次数是否达到设置的最大次数或迭代次数内聚类的结果没有改变,则迭代停止,将当前迭代完成后的吸引度矩阵rt和归属度矩阵at作为最终的迭代结果;然后在迭代完成后的吸引度矩阵rt和归属度矩阵at中,找到元素rt(i,k)和at(i,k),k∈n,选择最大化rt(i,k)+at(i,k)的k作为聚类中心点,输出聚类数量;如果找不到,则自动初始阻尼因子γ0,再返回步骤(2.4);(3)、将步骤(2)得到的聚类中心和聚类数量作为k均值算法的初始聚类中心和k值,进行第二次聚类,输出分类簇、类别数量和中心点,从而得到用户用电信息中具有相似特征的用户及用户类型;(4)、挖掘各类用户的用电规律。(4.1)、根据每一类用户用电曲线在一段时间内的变化情况,判断该类用户中各用电设备的运行状态是否变化,通过负荷曲线中的突变信息,将用户负荷分解为各用设备;(4.2)、分解后的各用电设备,根据时间排序,从而构建该类用户用电行为序列,然后使用时序关联关系分析算法分析用户用电行为序列,找到该类用户用电行为特征;(4.3)、结合该类用户的总体特征,挖掘同类用户用电行为强关联规则,构建不同类用户的用电行为规律。本发明的发明目的是这样实现的:本发明一种基于自动最优聚类算法的用户用电行为分析方法,通过将用户用电数据进行自动最优聚类,形成具有同类特征的用户集,对各类用户,分别进行负荷分解,构建各类用户用电行为时序,采用关联关系以及强关联规则提取方法,挖掘各类用户的用电行为特征,构建不同类用户的用电行为规律。同时,本发明一种基于自动最优聚类算法的用户用电行为分析方法还具有以下有益效果:(1)、提出了计及亲和度传播聚类和k均值算法的自动最优聚类方法,保障用户用电行为随机波动情况下,能自动全局寻优,具有优良的用户分类效果,同时有效减少了算法程序的计算量和运行时间;(2)自动最优聚类方法无需确定聚类中心点和聚类数量,通过设置系统阻尼系数,即可获取全局最优聚类划分;(3)通过将负荷分解加入到传统的关联算法流程中,对分类后的用户进行用电行为规律分析,提供了有价值的不同类型用户用电规律。附图说明图1是本发明一种基于自动最优聚类算法的用户用电行为分析方法流程图;图2是利用本发明所述方法对用户用电行为的聚类结果图。具体实施方式下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。实施例图1是本发明一种基于自动最优聚类算法的用户用电行为分析方法的流程图。在本实施例中,如图1所示,本发明一种基于自动最优聚类算法的用户用电行为分析方法,包括以下步骤:s1、用户用电负荷数据预处理本实施以某地区智能电表计量10000个表计数据为对象,采用电力大数据技术,通过自动最优聚类算法和用户用电行为分析方法,验证本发明的有效性。用户计量数据包含用户编码、峰谷平电量、峰谷平时刻、平均用电量、总用电量等众多属性。首先需要对各用户用电数据进行去噪和标幺化处理,然后,对其中间断缺失的用户用电负荷数据,采用上下两个点数据求均值的方式进行补差;对连续缺的用户用电负荷数据,采用模糊预测手段来补差,以保证用户用电负荷数据的完整性;s2、亲和度传播聚类s2.1、构建相似度矩阵s,s中的元素表示两组用户用电负荷数据间的相似度,通过计算两组用户用电负荷数据间的欧氏距离得到,即:在本实施例中,p(j)为第j个偏向参数,构建相似度矩阵s为10000×10000的矩阵;i=j=10000;s2.2、选择相似度矩阵s中每一行的相似度的中值或最小值作为偏向参数p,再用偏向参数p替代相似度矩阵s的主对角元素;s2.3、设置最大迭代次数t=100;计算第t次迭代时的吸引度矩阵rt和归属度矩阵at,t=1,2,…,t;其中,rt中的元素rt(i,j)为:rt(i,j)=st(i,j)-max(at-1(i,j′)+st-1(i,j′)),j≠j'其中,at中的元素at(i,j)为:s2.4、设置初始阻尼因子γ0=0.5;再利用初始阻尼因子rt更新吸引度矩阵rt和归属度矩阵at;在本实施例中,取上一次迭代后的rt-1的γ0倍和本次迭代后的rt的1-rt倍来更新吸引度矩阵rt,更新后的吸引度矩阵rt为:rt=rt·(1-γ0)+rt-1·γ0;同理,更新后的归属度矩阵at为:at=at·(1-γ0)+at-1·γ0s2.5、利用亲和度传播聚类,输出聚类数量和聚类中心点判断当前迭代次数是否达到设置的最大次数或迭代次数内聚类的结果没有改变,则迭代停止,将当前迭代完成后的吸引度矩阵rt和归属度矩阵at作为最终的迭代结果;然后在迭代完成后的吸引度矩阵rt和归属度矩阵at中,找到元素rt(i,k)和at(i,k),选择最大化rt(i,k)+at(i,k)的k作为聚类中心点,输出聚类数量;如果找不到,则自动初始阻尼因子γ0,再返回步骤s2.4;s3、将步骤s2得到的聚类中心和聚类数量作为k均值算法的初始聚类中心和k值,进行第二次聚类,输出分类簇、类别数量和中心点,如图2所示,从而得到用户用电信息中具有相似特征的用户及用户类型;在本实施例中,根据用户用电信息将所有的用电用户分为了5类,包括图2(a)所示的超大用电量用户,图2(b)所示的消费水平偏低的普通用户,图2(c)所示的用电大户或商业用户,图2(d)所示的工厂货商业用电,图2(e)所示的普通用户;s4、挖掘各类用户的用电规律。s4.1、根据每一类用户用电曲线在一段时间内的变化情况,判断该类用户中各用电设备的运行状态是否变化,通过负荷曲线中的突变信息,将用户负荷分解为各用设备,如表1所示;表1s4.2、分解后的各用电设备,根据时间排序,从而构建该类用户用电行为序列,然后使用时序关联关系分析算法分析用户用电行为序列,找到该类用户用电行为特征;s4.3、结合该类用户的总体特征,挖掘同类用户用电行为强关联规则,构建不同类用户的用电行为规律。在本实施例中,结合表1,某一类中某用户十天的用电行为规律如表2所示;日期用电行为序列2016/6/5d→f→e→a→d→fa→b→c→d→a→f→f2016/6/6f→b→e→ef→c→b→d2016/6/7f→c→b→a→a→e→f→c→f→b2016/6/8ea→fc→d→a→b→c→d→f→d2016/6/9f→a→c→d→b→f→e→b2016/6/10e→f→b→d→c→d→f→f→c→b2016/6/11f→e→f→d→a→b→c→b→f→b2016/6/12f→d→a→f→a→e→f→b→c→b→f2016/6/13f→a→d→e→f→a→d→c→b→d→b→f→b2016/6/14b→f→e→a→c→d→b→d→f→c表2尽管上面对本发明说明性的具体实施方式进行了描述,以便于本
技术领域
的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本
技术领域
的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1