本发明涉及电能体验技术领域,尤其涉及一种基于用户行为数据挖掘的电能体验分析方法和系统。
背景技术:
随着信息技术和高新产业的发展,用户对电能的需求已从单纯的用电量向电能质量转变,因此电能质量评估对电力用户和供电商的服务质量,在供电和售电环节是很重要的因素。现有的电能质量标准是通过电能供给宏观上的稳态或暂态电流电压来描述的,仅强调电的物理属性,如电压暂降、暂升和短时中断、谐波产生的电压波形畸变等,而实际上电能质量的评估还取决于用户侧的敏感度和实际体验,从而才能更好的反映用户对电能质量客观和主观上的满意度。
当前,电能体验已成为充分考虑到传统电能质量标准和相关电力用户信息而得到的综合电能评估标准,该评估标准不仅取决于发电侧,同时也与负载敏感度和电力用户侧的主观体验有关,因此实际应用更具有意义。
用户敏感度是电能体验的重要评价指标,在同样的电能质量扰动强度下,使用高敏感度负载的用户受到的影响更大。实际上根据特征以及电能质量需求的不同,负载大致上可以分为普通负载和敏感负载,人们常常将运行大量敏感负载的电力用户称为敏感用户。由于电能质量扰动是不可避免的,所以敏感用户面临很大的风险,即使非常短时间的电压扰动也会对敏感负载产生很严重的影响。因此,对于敏感用户来说,即使是微乎其微的电能质量问题也会导致严重的经济损失。
由此可见,亟需一种基于用户行为数据挖掘的电能体验分析方法,改变以往单独电能质量评价方式,通过结合用户侧负荷敏感度,从用户的角度出发,综合了电的物理属性(如谐波、暂降、无功等)和用户的要求提出的评价指标,使得评价更具有实际应用意义。
技术实现要素:
本发明实施例所要解决的技术问题在于,提供一种基于用户行为数据挖掘的电能体验分析方法和系统,结合用户侧负荷敏感度,从用户的角度出发,得到对用户电能体验的分析结果。
为了解决上述技术问题,本发明实施例提供了一种基于用户行为数据挖掘的电能体验分析方法,所述方法包括:
获取用户侧各用户历史用电数据,并根据所述获取到的用户侧各用户历史用电数据,以日期信息、时间信息和用户信息为坐标轴构建三维张量模型;
通过Tucker分解方法对所述构建的三维张量模型进行分解,得到由所述日期信息、时间信息和用户信息分别对应的二维特征矩阵,并根据所述得到的日期信息、时间信息和用户信息分别对应的二维特征矩阵,确定用户用电负荷的分布规律;
对所述确定的用户用电负荷的分布规律进行聚类分析,并根据聚类分析后得到的各种聚类结果,构建出与相应聚类结果对应的用户用电模式类别;其中,所述用户用电模式的类别包括三峰型用电、双峰型用电、平稳型用电和避峰型用电;
确定用户敏感度的各个等级,并将所述确定的用户敏感度的各个等级与所述构建出与相应聚类结果对应的用户用电模式类别相结合,通过预设的算法构建出用电模式预测模型;
获取目标用户当前实际用电数据,并将所述获取到的目标用户当前实际用电数据导入所述构建出的用电模式预测模型中,得到目标用户的当前用电模式类别及其对应的当前敏感度等级。
其中,所述各用户历史用电数据和所述目标用户当前实际用电数据均通过智能表采集,采集周期为半小时,且所述各用户历史用电数据和所述目标用户当前实际用电数据均包括日期信息、时间信息、用户信息、用电量、有功功率和无功功率。
其中,所述确定的用户用电负荷的分布规律包括用户用电负荷的周变化规律和日变化规律。
其中,所述各种聚类结果还包括对各用户用电量均值进行聚类分析后得到的聚类结果。
其中,所述用户敏感度的各个等级是根据供用电合同或用户敏感负荷调研结果获取用电用户使用的所有敏感负荷信息,并结合出现电能质量问题后用户投诉次数以及对用户电能体验的调研结果而确定。
其中,所述构建出的用电模式预测模型是通过随机森林算法将所述用户用电模式的各个类别以及有功功率和无功功率作为输入以及将所述确定的用户敏感度的各个等级作为输出训练成分类器而获得。
本发明实施例还提供了一种基于用户行为数据挖掘的电能体验分析系统,所述系统包括:
参数获取单元,用于获取用户侧各用户历史用电数据,并根据所述获取到的用户侧各用户历史用电数据,以日期信息、时间信息和用户信息为坐标轴构建三维张量模型;
张量模型分解单元,用于通过Tucker分解方法对所述构建的三维张量模型进行分解,得到由所述日期信息、时间信息和用户信息分别对应的二维特征矩阵,并根据所述得到的日期信息、时间信息和用户信息分别对应的二维特征矩阵,确定用户用电负荷的分布规律;
用电模式构建单元,用于对所述确定的用户用电负荷的分布规律进行聚类分析,并根据聚类分析后得到的各种聚类结果,构建出与相应聚类结果对应的用户用电模式类别;其中,所述用户用电模式的类别包括三峰型用电、双峰型用电、平稳型用电和避峰型用电;
用电模式预测模型构建单元,用于确定用户敏感度的各个等级,并将所述确定的用户敏感度的各个等级与所述构建出与相应聚类结果对应的用户用电模式类别相结合,通过预设的算法构建出用电模式预测模型;
用户体验分析单元,用于获取目标用户当前实际用电数据,并将所述获取到的目标用户当前实际用电数据导入所述构建出的用电模式预测模型中,得到目标用户的当前用电模式类别及其对应的当前敏感度等级。
其中,所述确定的用户用电负荷的分布规律包括用户用电负荷的周变化规律和日变化规律。
其中,所述用户敏感度的各个等级是根据供用电合同或用户敏感负荷调研结果获取用电用户使用的所有敏感负荷信息,并结合出现电能质量问题后用户投诉次数以及对用户电能体验的调研结果而确定。
其中,所述构建出的用电模式预测模型是通过随机森林算法将所述用户用电模式的各个类别以及有功功率和无功功率作为输入以及将所述确定的用户敏感度的各个等级作为输出训练成分类器而获得。
实施本发明实施例,具有如下有益效果:
在本发明实施例中,通过将用户历史用电数据构建三维张量模型,并利用张量分解方法处理用户历史用电数据,且进一步通过机器学习算法对数据进行分析,不同于以往单独的电能质量评价,而是结合用户侧负荷敏感度,从用户的角度出发,综合了电的物理属性和用户的要求提出的评价指标,因此更具有实际应用意义。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明实施例提供的一种基于用户行为数据挖掘的电能体验分析方法的流程图;
图2为图1中步骤S2三维张量模型分解示意图;
图3为本发明实施例提供的一种基于用户行为数据挖掘的电能体验分析系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明实施例中,提供的一种基于用户行为数据挖掘的电能体验分析方法,所述方法包括:
步骤S1、获取用户侧各用户历史用电数据,并根据所述获取到的用户侧各用户历史用电数据,以日期信息、时间信息和用户信息为坐标轴构建三维张量模型;
具体过程为,通过智能电表采集用户侧用户历史用电数据,且每半小时采集一次作为采集周期,并将采集到的历史用电数据以每个用户为存储单元,按照日期、时刻、用电量、有功功率、无功功率形式存放起来。因此,用户历史用电数据不仅包括日期信息、时间信息和用户信息,还包括用电量、有功功率、无功功率等等。
由于机器及人为等因素的影响,获取到的数据会有一些偏差,所以对采集到的历史用电数据进行预处理,如检测异常值,剔除冗余数据、填补缺失值等,并将数据进行归一化处理,具体公式(1)所示:
其中,μ(xi)是xi的均值,δ(xi)是xi的标准差。待归一化处理后的数据将分为训练集和测试集,以备后续应用。
将训练集中的数据以日期信息、时间信息和用户信息为坐标轴构建三维张量模型。
步骤S2、通过Tucker分解方法对所述构建的三维张量模型进行分解,得到由所述日期信息、时间信息和用户信息分别对应的二维特征矩阵,并根据所述得到的日期信息、时间信息和用户信息分别对应的二维特征矩阵,确定用户用电负荷的分布规律;
具体过程为,利用Tucker分解方法对步骤1中构建的三维张量模型进行分解,如图2所示,将三维张量分解至二维矩阵,生成3个新的矩阵U、V和W。
张量分解形式化定义如下:X=G×1U×2V×3W;
其中,G为核心张量,U、V和W是日期信息、时间信息和用户信息三个维度上的特征矩阵,×i为mode-i张量-矩阵乘法。对经过投影后得到的矩阵进行分类,实际上就是对原张量进行分类,而且还保持了原张量的结构信息。
在一个实施例中,可以只通过对G×1U的可视化,可以观察出不同用户以星期为周期的负荷变化曲线,此时代表用户用电负荷的周变化规律
在另一个实施例中,不仅通过对G×1U的可视化,可以观察出不同用户以星期为周期的负荷变化曲线,并且还通过对G×1U×2V的可视化,可以观察出不同用户每天各个时刻的用电量变化,此时代表用户用电负荷的周变化规律和日变化规律。
因此,用户用电负荷的分布规律可以选择用户用电负荷的周变化规律、日变化规律之中其一或其多。
步骤S3、对所述确定的用户用电负荷的分布规律进行聚类分析,并根据聚类分析后得到的各种聚类结果,构建出与相应聚类结果对应的用户用电模式类别;其中,所述用户用电模式的类别包括三峰型用电、双峰型用电、平稳型用电和避峰型用电;
具体过程为,用户用电模式的类别可大致分为三峰型用电、双峰型用电、平稳型用电和避峰型用电等几个类别;
通过步骤S2的初步观察,对分解得到的矩阵U、V先进行标准化,分别代表用户用电负荷的周变化规律和日变化规律,将用户的负荷曲线投影到[0,1]区间,只保留用户用电负荷曲线的用电习惯和特点,再应用K-means聚类算法进行聚类分析。
K-means聚类是一种经典的距离聚类方法,具体步骤如下:(1)选择K个点作为初始质心;(2)将每个点指派到最近的质心,形成K个簇,并重新计算每个簇的新的质心;(3)重复步骤(2),直到每个簇不发生变化或达到预先设定的最大迭代次数,停止聚类算法。应当说明的是,K取值由用户用电模式的类别数目初步决定,可根据聚类结果进行适当调整。
待对用户用电负荷的分布规律进行聚类分析后,根据得到的各种聚类结果,构建出与相应聚类结果对应的用户用电模式类别。
当然,在本发明实施例中,也可以增加用户用电量均值聚类分析得到的聚类结果,再与用户用电负荷分布规律聚类分析得到的聚类结果相结合,构建出与相应聚类结果对应的用户用电模式类别。可以理解的是,此时各种聚类结果还包括对各用户用电量均值进行聚类分析后得到的聚类结果。
例如同时对各用户用电量均值进行统计,区分出用电大客户和居民用户,并对各用户用电量均值进行聚类分析得到聚类结果,然后根据用户用电负荷周分布规律和日分布规律以及用电量均值分别得到的聚类结果进行综合,得到综合后的与相应聚类结果相对应的用户用电模式类别。
步骤S4、确定用户敏感度的各个等级,并将所述确定的用户敏感度的各个等级与所述构建出与相应聚类结果对应的用户用电模式类别相结合,通过预设的算法构建出用电模式预测模型;
具体过程为,电能质量敏感用户是一些使用了大量敏感负荷的用户,对电能质量的要求和敏感度比较高,即使轻微的电能质量问题也会对这些用户造成极大损失,也会对敏感度高的用电设备造成较大损害。根据供用电合同或用户敏感负荷调研结果获取用电用户使用的所有敏感负荷信息,确定负荷敏感度等级。并结合断电和电压暂降等电能质量问题后用户的投诉次数,和对用户电能体验的调研结果,综合得到电力用户敏感度的等级划分,并以此作为每个电力用户电能体验的评分标签。
由此可见,用户敏感度的各个等级是根据供用电合同或用户敏感负荷调研结果获取用电用户使用的所有敏感负荷信息,并结合出现电能质量问题后用户投诉次数以及对用户电能体验的调研结果而确定。
将用户用电模式类别与用户敏感度信息结合,通过随机森林算法,即多个决策树对样本进行训练并预测的一种分类器,将得到的用户的用电模式类别(三峰型用电、双峰型用电、平稳型用电和避峰型用电等)以及有功、无功功率等特征作为模型的输入,用户电能体验评分标签作为输出,用电脑编写程序训练分类器,最终建立综合用电模式预测模型。
可以理解的是,用电模式预测模型是通过随机森林算法将所述用户用电模式的各个类别以及有功功率和无功功率作为输入以及将所述确定的用户敏感度的各个等级作为输出训练成分类器而获得。
应当说明的是,可以利用交叉验证方法来提高用电模式预测模型的预测精度,即分别将训练集的一部分数据作为验证集反复验证,选择预测精度最高的模型来作为修正后的用电模式预测模型,并将测试集作为测试数据来测试用电模式预测模型的预测效果,不断进行改进以完善用电模式预测模型。
步骤S5、获取目标用户当前实际用电数据,并将所述获取到的目标用户当前实际用电数据导入所述构建出的用电模式预测模型中,得到目标用户的当前用电模式类别及其对应的当前敏感度等级。
具体过程为,将目标用户当前实际用电数据导入所述构建出的用电模式预测模型中,就能得到目标用户的当前用电模式类别及其对应的当前敏感度等级,从而制定用电调度策略,提高用户电能体验。
可以理解的是目标用户当前实际用电数据也是通过智能表采集,采集周期为半小时,且目标用户当前实际用电数据也包括日期信息、时间信息、用户信息、用电量、有功功率和无功功率等等。
如图3所示,本发明实施例还提供一种基于用户行为数据挖掘的电能体验分析系统,所述系统包括:
参数获取单元110,用于获取用户侧各用户历史用电数据,并根据所述获取到的用户侧各用户历史用电数据,以日期信息、时间信息和用户信息为坐标轴构建三维张量模型;
张量模型分解单元120,用于通过Tucker分解方法对所述构建的三维张量模型进行分解,得到由所述日期信息、时间信息和用户信息分别对应的二维特征矩阵,并根据所述得到的日期信息、时间信息和用户信息分别对应的二维特征矩阵,确定用户用电负荷的分布规律;
用电模式构建单元130,用于对所述确定的用户用电负荷的分布规律进行聚类分析,并根据聚类分析后得到的各种聚类结果,构建出与相应聚类结果对应的用户用电模式类别;其中,所述用户用电模式的类别包括三峰型用电、双峰型用电、平稳型用电和避峰型用电;
用电模式预测模型构建单元140,用于确定用户敏感度的各个等级,并将所述确定的用户敏感度的各个等级与所述构建出与相应聚类结果对应的用户用电模式类别相结合,通过预设的算法构建出用电模式预测模型;
用户体验分析单元150,用于获取目标用户当前实际用电数据,并将所述获取到的目标用户当前实际用电数据导入所述构建出的用电模式预测模型中,得到目标用户的当前用电模式类别及其对应的当前敏感度等级。
其中,所述确定的用户用电负荷的分布规律包括用户用电负荷的周变化规律和日变化规律。
其中,其中,所述用户敏感度的各个等级是根据供用电合同或用户敏感负荷调研结果获取用电用户使用的所有敏感负荷信息,并结合出现电能质量问题后用户投诉次数以及对用户电能体验的调研结果而确定。
其中,所述构建出的用电模式预测模型是通过随机森林算法将所述用户用电模式的各个类别以及有功功率和无功功率作为输入以及将所述确定的用户敏感度的各个等级作为输出训练成分类器而获得。
实施本发明实施例,具有如下有益效果:
在本发明实施例中,通过将用户历史用电数据构建三维张量模型,并利用张量分解方法处理用户历史用电数据,且进一步通过机器学习算法对数据进行分析,不同于以往单独的电能质量评价,而是结合用户侧负荷敏感度,从用户的角度出发,综合了电的物理属性和用户的要求提出的评价指标,因此更具有实际应用意义。
值得注意的是,上述系统实施例中,所包括的各个系统单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。