基于信赖域算法的用户窃电概率预测方法、装置及设备与流程

文档序号:12669399阅读:389来源:国知局
基于信赖域算法的用户窃电概率预测方法、装置及设备与流程

本发明实施例涉及概率预测方法,尤其涉及基于信赖域算法的用户窃电概率预测方法、装置及设备。



背景技术:

用户用电异常是困扰电力正常供应和供电企业健康发展的一个突出问题,许多引发电量异常的外部行为尤其是窃电行为给国家财产和企业收入带来了极大的负面影响,扰乱了正常的供用电秩序。以广东为例,2014年,广东全省共查处窃电案件3964起,累计损失达5223.12万元。

由于供电线路的经常性调荷、用户办理用电变更业务、负控终端未安装等多种因素的客观存在,传统的用户窃电分析存在人工干预较多,分析周期长、及时性较差、误差较高等问题。随着电网信息化建设的推进,电网在经营管理过程中产生了海量数据,包括用户的实时用电量数据、用户用电的其他信息等,这些数据蕴藏着许多与用户用电等领域密切相关的规律和特征,利用技术手段对这些数据进行分析挖掘可以辅助企业把握用电户的分析电力消耗曲线、用户用能习惯、用户能量消耗结构等用电特征,进而对用电户的窃电概率进行预测,辅助制订用电检查计划。从而提升企业的管理精益化水平,推进企业管理方式由粗放型向集约型、精细化转变。然而,用户用电特征数据涉及数据较多、数据类型多、体量大、增量快,在数据挖掘过程对于算法的效率具有较高的要求。



技术实现要素:

本发明实施例提供一种基于信赖域算法的用户窃电概率预测方法、装置及设备,以提高用户窃电概率预测的效率及准确度。

一方面,本发明实施例提供了一种基于信赖域算法的用户窃电概率预测方法,包括:

S101、获取历史用户的特征因子以及历史用户的窃电信息;

S102、依据逻辑斯蒂回归模型和所述历史用户的特征因子,构建窃电概率预测函数,其中所述窃电概率预测函数包括待确定的系数向量;

S103、依据所述历史用户的特征因子以及所述历史用户的窃电信息,对所述预测拟合函数进行转化得到代价函数;

S104、基于信赖域算法求解所述代价函数得到所述系数向量的取值;

S105、依据所述系数向量的取值,得到窃电概率预测函数;

S106、依据当前用户的特征因子和所述窃电概率预测函数,确定当前用户的窃电概率。

另一方面,本发明实施例还提供了一种基于信赖域算法的用户窃电概率预测装置,包括:

样本获取模块,用于获取历史用户的特征因子以及历史用户的窃电信息;

窃电预测函数构建模块,用于依据逻辑斯蒂回归模型和所述历史用户的特征因子,构建窃电概率预测函数,其中所述窃电概率预测函数包括待确定的系数向量;

窃电预测函数转化模块,用于依据所述历史用户的特征因子以及所述历史用户的窃电信息,对所述预测拟合函数进行转化得到代价函数;

信赖域求解模块,用于基于信赖域算法求解所述代价函数得到所述系数向量的取值;

窃电预测函数输出模块,用于依据所述系数向量的取值,得到窃电概率预测函数;

窃电概率预测模块,用于依据当前用户的特征因子和所述窃电概率预测函数,确定当前用户的窃电概率。

另一方面,本发明实施例还提供了一种设备,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所述的方法。

本发明实施例提供的技术方案,基于逻辑斯蒂回归模型和历史用户的特征因子构建包含待确定的系数向量的窃电概率预测函数,利用信赖域的方法来对逻辑回归分析过程中抽象而出的代价函数进行数值求解,改良传统梯度下降法带来的收敛速度慢等问题,而对于信赖域子问题,我们使用双割线折线法进行求解,提高了窃电概率预测函数的生成效率和准确度,从而提高了用户窃电概率预测的效率及准确度。

附图说明

图1为本发明实施例中提供的一种基于信赖域算法的用户窃电概率预测方法的流程图;

图2为本发明实施例中提供的一种基于信赖域算法的用户窃电概率预测装置的结构图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

图1为本发明实施例中提供的一种基于信赖域算法的用户窃电概率预测方法的流程图。本实施例的方法可以由基于信赖域算法的用户窃电概率预测装置来执行,该装置可以通过软件的方式来实现,且可以加载于终端设备中。参考图1,本实施例提供的基于信赖域算法的用户窃电概率预测方法可以包括如下步骤:

S101、获取历史用户的特征因子以及历史用户的窃电信息。

其中,用户的特征因子指的是确定用户是否窃电的影响因子,如用户的特征因子可以是合同容量、用电电压等级、用户行业类别和用电类别等。具体的,获取M个历史用户的特征因子以及历史用户的窃电信息x=(x(1),x(2),…,x(n))T,其中历史用户j的特征因子为n维的特征向量,即n个和窃电相关的特征因子数据,yj为分类标签,取值1或0,分别表征历史用户j窃电和没窃电。

S102、依据逻辑斯蒂回归模型和所述历史用户的特征因子,构建窃电概率预测函数,其中所述窃电概率预测函数包括待确定的系数向量。

具体的,线性回归的拟合函数为逻辑斯蒂回归(Logistic)函数因而预测拟合函数为

依据预测拟合函数得到yj取1的概率是:其中θ=(θ(1)(2),…,θ(n))T为待确定的系数向量,也就是逻辑斯蒂回归问题中需要求解的模型参数。

S103、依据所述历史用户的特征因子以及所述历史用户的窃电信息,对所述预测拟合函数进行转化得到代价函数。

具体的,将yj取1和yj取0的概率相乘得逻辑斯蒂回归模型:

故逻辑斯蒂回归模型的最大似然函数估计为:

对最大似然函数估计求对数得:

因而,最大似然就是求使得l(θ)取最大值时的θ,即随后,取则变为J(θ)取最小值时的θ,即

S104、基于信赖域算法求解所述代价函数得到所述系数向量的取值。

具体的,基于信赖域算法求解代价函数的最小值,并得到代价函数为最小值时系数向量的取值。

示例性的,S104可以包括:

S104-1、给出系数向量的初始值θ0=(0,0,…,0)T,选定初始参数0≤ε<<1,0≤η12<1,0<τ1<1<τ2,取定信赖域半径的上界初始信赖域半径令k:=0。

具体的,选定初始参数ε=10-61=0.01,η2=0.75,τ1=0.5,τ2=2,取定信赖域半径的上界初始信赖域半径令k:=0。

S104-2、计算并确定是否满足:||gk||≤ε,若满足则停止迭代,并得到所述系数向量的取值;否则继续执行S104-3。

在满足停止迭代条件时,求得θ=θk为的最优数值解。

S104-3、在θk的Δk邻域内,对J(θ)泰勒展开得到近似函数从而得出信赖域方法的子问题:

并求解信赖域方法的子问题的解δk,其中δ=θ-θk,Jk=J(θk),Gk是Hessian矩阵或其近似,Δk>0为信赖域半径。

S104-4、计算

S104-5、依据rk校正信赖域半径得到Δk+1

S104-6、确定是否满足rk1,若否则继续执行S104-7;若是则跳转执行S104-8。

S104-7、令θk+1:=θk,k:=k+1,并返回执行S104-4;

S104-8、令θk+1:=θkk,更新Gk+1,且令k:=k+1,并返回执行S104-2。本发明实施例通过使用信赖域方法求解逻辑回归分析,有如下优点:既具有牛顿法的快速局部收敛性,又具有理想的总体收敛性;不要求目标函数的Hesse矩阵是正定的;利用了二次模型来求修正量,使得目标函数的下降比线性搜索方法更有效;步长受到信赖域半径的限制,避免发生由于步长过大而导致算法失败的现象。因此本发明实施例提高了提高了代价函数的收敛效率,即提高了逻辑斯蒂回归模型的训练效率。

示例性的,S104-3中求解信赖域方法的子问题的解δk可以包括:

S104-3-1、给定梯度g,正定矩阵B,信赖域半径Δ。

具体的,给定梯度g=gk,正定矩阵B=Gk,信赖域半径Δ=Δk

S104-3-2、取计算

其中λi是B的特征值,并计算牛顿步δnpnp=-B-1g。

S104-3-3、计算投影矩阵A=[δapnp],P=A(ATA)-1AT

S104-3-4、确定δsp:d=-δnp,s=P(δapnp),确定k,使得则

S104-3-5、形成双割线Γ=[0,δspnp]。

S104-3-6、确定是否满足Δ≤||δsp||2,若是,则若否,则继续执行S104-2-3-7;

S104-3-7、确定是否满足Δ≥||δnp||2,若是,则δk=δnp;否则,δk=δsp+η(δnpsp),其中η使得||δk||2=Δ。

因此,在信赖域算法中第k步求子问题的最优解为δk时,ΔJk:=Jk-J(θkk)为J在第k步中的实际下降量,对应的预测下降量为Δqk:=qk(0)-qkk)。定义比值为一般地,我们有Δqk>0。因此:

若rk<0,表明qk(δ)与目标函数J(θ)的一致性程度不好,需要缩小信赖域半径重新求解子问题;

rk越接近1,表明qk(δ)与J(θ)的一致性程度越好,此时θk+1:=θkk作为新的迭代点,同时增大Δk进行下一次迭代;

对于其他情况,Δk可以保持不变。

通过使用双割线折线法对信赖域子问题进行求解,相比于使用单折线法,双割线折线法的折线路径更靠近牛顿方向,即更靠近最优点的方向,有利于减少迭代次数,进一步优化了信赖域子问题的求解效率,从而提升了用户窃电概率预测过程中的计算效率。

S105、依据所述系数向量的取值,得到窃电概率预测函数。

将系数向量的取值θ=θk代入步骤S102中包括待确定的系数向量的窃电概率预测函数得到窃电概率预测函数。

S106、依据当前用户的特征因子和所述窃电概率预测函数,确定当前用户的窃电概率。

将测试集中待预测的当前用户数据x=(x(1),x(2),…,x(n))T代入S105中窃电概率预测函数中,即可预测当前用户的窃电概率。

本发明实施例提出用信赖域方法求解逻辑回归分析,相对于常用的经典的梯度下降法,具有更快速的局部收敛性、更理想的总体收敛性,且由于利用了二次模型来求修正量,使得目标函数的下降比线性搜索方法更有效。过程中使用了比较高效的双割线折线法对信赖域子问题进行求解,更使得整个计算过程得到了进一步优化,最终可以提升用户窃电概率预测过程中的计算效率。

本发明实施例还提供了一种基于信赖域算法的用户窃电概率预测装置。图2为本发明实施例中提供的一种基于信赖域算法的用户窃电概率预测装置的结构图,如图2所示,该装置可以包括:

样本获取模块21,用于获取历史用户的特征因子以及历史用户的窃电信息;

窃电预测函数构建模块22,用于依据逻辑斯蒂回归模型和所述历史用户的特征因子,构建窃电概率预测函数,其中所述窃电概率预测函数包括待确定的系数向量;

窃电预测函数转化模块23,用于依据所述历史用户的特征因子以及所述历史用户的窃电信息,对所述预测拟合函数进行转化得到代价函数;

信赖域求解模块24,用于基于信赖域算法求解所述代价函数得到所述系数向量的取值;

窃电预测函数输出模块25,用于依据所述系数向量的取值,得到窃电概率预测函数;

窃电概率预测模块26,用于依据当前用户的特征因子和所述窃电概率预测函数,确定当前用户的窃电概率。

示例性的,所述窃电概率预测函数为:

其中,x=(x(1),x(2),…,x(n))T为所述历史用户的特征因子,θ=(θ(1)(2),…,θ(n))T为待确定的系数向量。

示例性的,所述代价函数为:

其中xi为历史用户i的特征因子数据,yi为历史用户i的分类标签,M为历史用户的总数,求解目标为

示例性的,信赖域求解模块24具体可以用于:

给出系数向量的初始值θ0,选定初始参数0≤ε<<1,0≤η12<1,0<τ1<1<τ2,取定信赖域半径的上界初始信赖域半径令k:=0;

计算确定是否满足:||gk||≤ε,若满足则停止迭代,并得到所述系数向量的取值;否则继续求解信赖域方法的子问题的解δk

在θk的Δk邻域内,对J(θ)泰勒展开得到近似函数从而得出信赖域方法的子问题:

并求解信赖域方法的子问题的解δk,其中δ=θ-θk,Jk=J(θk),Gk是Hessian矩阵Δk>0为信赖域半径;

计算

依据rk校正信赖域半径得到Δk+1

确定是否满足rk1,若否,则令θk+1:=θk,k:=k+1,并重新计算rk;若是,则令θk+1:=θkk,更新Gk+1,且令k:=k+1,并重新计算且判断是否满足停止迭代条件。

示例性的,在求解信赖域方法的子问题的解δk时,信赖域求解模块24具体可以用于:

给定梯度g,正定矩阵B,信赖域半径Δ;

取计算其中λi是B的特征值,并计算牛顿步δnpnp=-B-1g;

计算投影矩阵A=[δapnp],P=A(ATA)-1AT

确定δsp:d=-δnp,s=P(δapnp),确定k,使得则

形成双割线Γ=[0,δspnp];

确定是否满足Δ≤||δsp||2,若是,则若否,则确定是否满足Δ≥||δnp||2,若是,则δk=δnp;若均不满足则δk=δsp+η(δnpsp),其中η使得||δk||2=Δ。

本实施例提供的用户窃电概率预测装置,与本发明任意实施例所提供的用户窃电概率预测方法属于同一发明构思,可执行本发明任意实施例所提供的用户窃电概率预测方法,具备执行用户窃电概率预测方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的用户窃电概率预测方法。

本发明实施例还提供了一种设备,该设备可以包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例提供的用户窃电概率预测方法。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1