基于支持向量机的窃电用户判断方法与流程

文档序号:18108575发布日期:2019-07-06 11:50阅读:406来源:国知局
基于支持向量机的窃电用户判断方法与流程

本发明涉及一种窃电用户判断技术领域,是一种基于支持向量机的窃电用户判断方法。



背景技术:

随着用电信息采集系统的部署应用,用户的用电信息实现了自动化采集,然而仍然有一些客户抱着侥幸心理致使电量少计或者不计,造成用电秩序混乱、用电安全遭受到威胁、供电企业受到经济损失等问题。目前判断用户窃电的方法主要有三种:一种是到用电现场进行台区用户普查;第二种是到指定用户进行用电检查;第三种是运用数据挖掘的方法基于客户的用电信息实现窃电用户判断,主要有高维随机矩阵分析法,离群点算法,曲线相似分析法、神经网络算法等。

第一种窃电用户判断方法虽然效果显著,但是对人力、财力、物力的消耗是巨大的,缺乏针对性;第二种窃电用户判断方法是对用户的抽查,效果不是很明显,是小概率事件导致效率不高;第三种窃电用户判断方法是通过近几年来的新兴算法来实现数据挖掘分析,但区别正常客户和窃电客户的误差较大,其中高维随机矩阵分析法对0.4kv配电网中的用户无法进行判断;离点群算法则具有高的时间复杂度,难以挖掘局部离群点;曲线相似法只能对实时负荷采集的用户进行判断;神经网络算法则容易陷入局部极小。



技术实现要素:

本发明提供了一种基于支持向量机的窃电用户判断方法,克服了上述现有技术之不足,其能有效解决现有判断窃电用户的方法存在的判断误差大、效率低的问题。

本发明的技术方案是通过以下措施来实现的:一种基于支持向量机的窃电用户判断方法,包括以下步骤:

第一步:利用用电信息采集系统的历史数据获取客户月电量wij、客户所在台区的线损率η、开表盖事件on、编程事件pn、月度电量环比增长率αij和月度电量同比增长率βij;

第二步:根据月度电量环比增长率αij和月度电量同比增长率βij计算各自的平均值、标准差和最坏值,并获取9个指标变量,记[x1,…x9],9个指标变量分别为生成月度电量环比增长率αij的平均值、标准差和最坏值、月度电量同比增长率βij的平均值、标准差和最坏值、客户所在台区的线损率η、开表盖事件on和编程事件pn;

第三步:建立训练样本集[ai,yi],其中i=1,…n,ai=[x1,…x9],ai∈r9,yi=1为正常客户,yi=-1为窃电客户;

第四步:对训练样本集[ai,yi]进行标准化,通过高斯核函数的支持向量机模型对标准化后的训练样本进行训练,求得分类函数

第五步:通过分类函数对未知分类结果的样本进行分类,若则为正常用户,若则为窃电用户。

下面是对上述发明技术方案的进一步优化或/和改进:

上述第四步中对训练样本集[ai,yi]进行标准化的具体过程如下:

(1)计算训练样本集[ai,yi]的均值向量μ=[μ1,…μ9]和标准差向量σ=[σ1,…σ9];

(2)通过公式(1)对训练样本进行标准化:

其中i=1,…n;j=1,…9;

(3)得出标准化后训练样本的行向量

上述第四步中求得分类函数的具体过程如下:

(1)根据拉个朗日对偶函数计算支持向量为si(i∈i)、权系数ζi(i∈i)和常数项b;

(2)根据上述计算结果建立最优决策函数,即得到分类函数,分类函数如公式(2)所示:

其中为高斯核函数,

上述第一步中根据客户月电量wij生成月度电量环比增长率αij和月度电量同比增长率βij,月度电量环比增长率αij生成公式如公式(3)所示,月度电量同比增长率βij生成公式如公式(4)所示:

其中,i表示年份,j表示月份。

本发明先通过对现有的用电信息采集系统中的历史数据进行计算分析为后续的样本训练提供基础数据,然后建立包括至少400个正常用电信息数据和至少400个窃电信息数据的训练样本集,并根据基础数据对每个训练样本建立9个量化特征,然后对训练样本进行训练,求得分类函数,即利用高斯核函数的支持向量机模型将给定的训练样本集作为输入空间,然后在该空间内寻找实值函数g(x),从而获得分类函数f(x)=sgn(g(x)),之后通过分类函数对未知分类结果的样本进行分类。由此可见本发明能基于支持向量机技术根据历史用电信息信息的基本数据进行训练获取分类函数,建立准确分类标准,从而对未分类客户进行准确判断,降低了用电检查人员现场核查次数,能有针对性的打击了窃电行为,降低了供电企业的损失,节约了人力、财力和物力成本。

附图说明

附图1为本发明的流程图。

附图2为本发明的对训练样本集进行标准化及训练的流程图。

具体实施方式

本发明不受下述实施例的限制,可根据本发明的技术方案与实际情况来确定具体的实施方式。

下面结合实施例及附图对本发明作进一步描述:

实施例1:如附图1所示,该基于支持向量机的窃电用户判断方法方法,包括以下步骤:

第一步:利用用电信息采集系统的历史数据获取客户月电量wij、客户所在台区的线损率η、开表盖事件on、编程事件pn、月度电量环比增长率αij和月度电量同比增长率βij;

第二步:根据月度电量环比增长率αij和月度电量同比增长率βij计算各自的平均值、标准差和最坏值,并获取9个指标变量,记[x1,…x9],9个指标变量分别为生成月度电量环比增长率αij的平均值、标准差和最坏值、月度电量同比增长率βij的平均值、标准差和最坏值、客户所在台区的线损率η、开表盖事件on和编程事件pn;

第三步:建立训练样本集[ai,yi],其中i=1,…n,ai=[x1,…x9],ai∈r9,yi=1为正常客户,yi=-1为窃电客户;

第四步:对训练样本集[ai,yi]进行标准化,通过高斯核函数的支持向量机模型对标准化后的训练样本进行训练,求得分类函数

第五步:通过分类函数对未知分类结果的样本进行分类,若则为正常用户,若则为窃电用户。

上述第一步是利用现有的用电信息采集系统中的历史数据(历史用电信息数据)为后续学习训练提供数据基础,这里要求获取至少3年的历史用电信息数据;第二步中的根据月度电量环比增长率αij和月度电量同比增长率βij计算各自的平均值、标准差和最坏值,其中最坏值为月度电量环比增长率αij和月度电量同比增长率βij各自的最大绝对值;第三步中建立训练样本集[ai,yi],该训练样本集内均为已分类样本,需包括至少400个正常用电信息数据和至少400个窃电信息数据,其中若窃电信息数据为400个,则窃电信息数据需包括80个更改电能表接线的窃电信息数据,100个毁坏还更改电能表内部电路或元器件的窃电信息数据,30个破坏电能表内部程序的窃电信息数据,50个外部信号干扰计量模块的窃电信息数据,140个绕越计量模块的窃电信息数据。

本发明先通过对现有的用电信息采集系统中历史数据的计算分析为后续的样本训练提供基础数据,然后建立包括至少400个正常用电信息数据和至少400个窃电信息数据的训练样本集,并根据基础数据对每个训练样本建立9个量化特征,然后对训练样本进行训练,求得分类函数,即利用高斯核函数的支持向量机模型将给定的训练样本集作为输入空间,然后在该空间内寻找实值函数g(x),从而获得分类函数f(x)=sgn(g(x)),之后通过分类函数对未知分类结果的样本进行分类。由此可见本发明能基于支持向量机技术根据历史用电信息信息的基本数据进行训练获取分类函数,建立准确分类标准,从而对未分类客户进行准确判断,降低了用电检查人员现场核查次数,能有针对性的打击了窃电行为,降低了供电企业的损失,节约了人力、财力和物力成本。

下面是对上述发明技术方案的进一步优化或/和改进:

如附图1、2所示,第四步中对训练样本[ai,yi]进行标准化的具体过程如下:

(1)计算训练样本集[ai,yi]的均值向量μ=[μ1,…μ9]和标准差向量σ=[σ1,…σ9];

(2)通过公式(1)对训练样本进行标准化:

其中i=1,…n;j=1,…9;

(3)得出标准化后训练样本集的行向量

上述训练样本集包括至少400个正常用电信息数据和至少400个窃电信息数据,其中若窃电信息数据为400个,则窃电信息数据需包括80个更改电能表接线的窃电信息数据,100个毁坏还更改电能表内部电路或元器件的窃电信息数据,30个破坏电能表内部程序的窃电信息数据,50个外部信号干扰计量模块的窃电信息数据,140个绕越计量模块的窃电信息数据。

如附图1、2所示,第四步中求得分类函数的具体过程如下:

(1)根据拉个朗日对偶函数计算支持向量为si(i∈i)、权系数ζi(i∈i)和常数项b;

(2)根据上述计算结果建立最优决策函数,即得到分类函数,分类函数如公式(2)所示:

其中为高斯核函数,

上述求取根据拉个朗日对偶函数计算支持向量为si(i∈i)、权系数ζi(i∈i)和常数项b的过程如下:

(1)将训练样本集[ai,yi]中的训练样本带入如下式所示的拉格朗日对偶函数中,求得最优化问题,得到权系数的最优解α=[α1,...,α800];

(2)根据ζ=αy和求得权系数ζ=[ζ1,...,ζ800]和支持向量si;

(3)在α中选择一个不为零的分量α*,其相应的分类结果为y*,分类样本为

(4)根据求得常数项b。

使用上述公式(2)对未知分类结果的分类样本进行判别的过程如下:

(1)将分类样本的带入公式(2)中计算

(2)通过下式对判别结果进行确定:

如附图1、2所示,第一步中根据客户月电量wij生成月度电量环比增长率αij和月度电量同比增长率βij,月度电量环比增长率αij生成公式如公式(3)所示,月度电量同比增长率βij生成公式如公式(4)所示:

其中,i表示年份,j表示月份。

以上技术特征构成了本发明的最佳实施例,其具有较强的适应性和最佳实施效果,可根据实际需要增减非必要的技术特征,来满足不同情况的需求。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1