一种基于图像识别的用电异常用户识别方法与流程

文档序号:33045651发布日期:2023-01-24 22:25阅读:35来源:国知局
一种基于图像识别的用电异常用户识别方法与流程

1.本发明涉及电力领域,重点涉及基于图像识别的用电异常用户识别方法。


背景技术:

2.大数据技术蓬勃发展,人工智能等均取得了大的突破,在各个领域行业都积极开展典型应用实践,公司电力系统升级,智能电力设备的普及,信息化建设稳步推进,也为公司积累了海量的用户用电量、电压电流、功率等数据,为公司大数据应用创造了数据条件。因此乘着大数据的发展浪潮,以用户用电行为等数据为基础,充分利用大数据分析及人工智能研究成果,科学有效地开展基于大数据与计算智能的反窃电分析工作,提高反窃电及计量异常分析工作的精准度,对于提升公司经济效益,推动营销服务创新有着重要的意义。


技术实现要素:

3.本发明的目的是提供一种基于图像识别的用电异常用户识别方法,实现对用户日常用电行为差异的识别和分析,提高异常用电行为识别能力。
4.为了实现上述目的,本发明提供的技术方案如下:
5.一种基于图像识别的用电异常用户识别方法,包括:
6.对原始的用户数据信息进行清洗处理以获得真实、正确的用户数据信息;
7.对处理之后的用户数据信息向图像信息转换:首先对用户数据信息裁剪,得到满足神经网络模型输入要求的数据格式,最后将符合条件的数据转换成三通道图像信息;
8.利用卷积神经网络进行图像识别训练:首先对训练样本集中正负样本的图像进行标签标记,然后将三通道图像信息带入初步构建的神经网络模型中进行训练,最终输出最优参数下的神经网络模型;
9.基于图像识别模型进行用电异常用户识别:利用训练好的神经网络模型对未知用户进行分类,输出所述未知用户的窃电概率大小。
10.在本发明一个优选实施例中,对用户数据信息裁剪包括:
11.对用户数据信息
[0012][0013]
进行裁剪,其中n为数据获取天数,m为96个示值点将xn×m需裁剪成xn×n,即抽取每月24天中每日24个点示值,分别为每天的0时到23时电压、电流、功率所对应的示值数。
[0014]
在本发明一个优选实施例中,构建三通道图像信息具体包括:将裁剪之后的用户数据信息中每一个元素视为一个像素点,一个用户的电流、电压、功率数据信息就可以用一张图像q来表示。
[0015]
在本发明一个优选实施例中,通过三通道图像信息组成完整的图像:
[0016]
对正常户和窃电户用电数据图像进行标记{0,1}:0为正常户、1为窃电户,将不同用户的图像信息和标签信息进行合并,即q={q1,q2,q3,...,qn,ci},n≥100,ci=(c1,c2,...,cn)为n个用户对应的数据标签(0/1)。
[0017]
在本发明一个优选实施例中,图像信息从神经网络模型的输入层进入,经过卷积层,relu层、池化(pooling)层和全连接层,最终在输出层中进行结果输出,计算每一个用户出现窃电的概率p=(c=j|q)。
[0018]
在本发明一个优选实施例中,输出p》0.65的为疑似异常用电用户。
[0019]
在本发明一个优选实施例中,原始的用户数据信息包括获取到的用户近一个月的电流、电压、功率数据如下
[0020][0021][0022][0023]
其中,uj、vj、pj分别代表用户j一个月的电流、电压、功率数据矩阵。
[0024]
在本发明一个优选实施例中,依据用电数据的采集规律,对用户数据信息进行统计规则和业务规则上的异常识别,并对异常数据进行针对性填充。
[0025]
在本发明一个优选实施例中,构建神经网络模型包括:
[0026]
神经网络公式如下:
[0027][0028]
其中:α
i1
、α
i1-1
分别为神经网络中的一个神经元,分别位于第l层和第l-1层第j个;w
ij1
为权重;b
i1
为偏置项;函数f为激活函数;
[0029]
设置网络参数:选取分类激活函数,将高维数据转换维二分类数据输出;通过adam优化器对迭代参数进行一定范围内学习;采用gd优化器进行迭代求解,使得损失最小。
附图说明
[0030]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0031]
图1为本发明实施例提供的一种基于图像识别的用电异常用户识别方法的流程图;
[0032]
图2为发明实施例提供的基于多规则的异常数据识别与清洗的流程图;
[0033]
图3为发明实施例提供的用户数据信息抽取和转换的流程图;
[0034]
图4为发明实施例提供的基于卷积神经网络进行图像识别训练的流程图;
[0035]
图5为发明实施例提供的基于卷积神经网络进行图像识别训练的图像q的示意图;
[0036]
图6为发明实施例提供的基于卷积神经网络进行图像识别训练的relu函数图像。
具体实施方式
[0037]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0038]
一种基于图像识别的低压用户异常用电行为识别方法,包括:
[0039]
基于多规则的异常数据识别与清洗:依据用电数据的采集规律,对数据进行统计规则和业务规则上的异常识别,并对异常数据进行针对性填充。
[0040]
用户数据信息向图像信息转换:首先对清洗后的用户用电多维度数据进行获取;然后进行数据裁剪,得到满足模型输入要求的数据格式;最后将符合条件的数据转换成三通道图像信息。
[0041]
利用卷积神经网络进行图像识别训练:首先对训练样本集中正负样本的图像进行标签标记,然后将图像带入初步构建的神经网络模型中进行训练,最终输出最优参数下的神经网络模型。
[0042]
基于图像识别模型进行用电异常用户识别:将预测图像信息带入训练好的神经网络模型中进行预测,结果输出疑似异常用电概率。
[0043]
实施例:
[0044]
请参阅图1,其示出了本发明实施例提供的一种基于图像识别的用电异常用户识别方法的流程图,包括:
[0045]
s101:基于多规则的异常数据识别与清洗:依据用电数据的采集规律,对数据进行统计规则和业务规则上的异常识别,并对异常数据进行针对性填充。
[0046]
s102:用户数据信息向图像信息转换:首先对清洗后的用户用电多维度数据进行获取;然后进行数据裁剪,得到满足模型输入要求的数据格式;最后将符合条件的数据转换成三通道图像信息。
[0047]
s103:利用卷积神经网络进行图像识别训练:首先对训练样本集中正负样本的图像进行标签标记,然后将图像带入初步构建的神经网络模型中进行训练,最终输出最优参数下的神经网络模型。
[0048]
s104:基于图像识别模型进行用电异常用户识别:将预测图像信息带入训练好的神经网络模型中进行预测,结果输出疑似异常用电概率。
[0049]
请参阅图2,其示出了本发明实施例提供的一种基于多规则的异常数据识别与清洗的流程图,包括:
[0050]
s201:获取电流、电压、功率数据:从用电采集系统和营销系统获取样本用户电流、电压、功率一个月的实时数据。
[0051]
s202:电流、电压、功率数据的统计分析:对于电流i、电压v、功率p分别进行统计特征计算,查看各数据值的均值最大值x

=max(x1,x2,...,xn)、最小值x

=min(x1,x2,...,xn)、中位数众数等基本描述性统计指标,进而判断数据是否合理。最常用的统计量是最大值和最小值,用来判断这个变量的取值是否超出了合理的范围。
[0052]
异常值分布检测时采用3σ法则以及箱线图法。3σ法则为:
[0053]
数值y分布在(μ-σ,μ+σ)中的概率为0.6827
[0054]
数值y分布在(μ-2σ,μ+2σ)中的概率为0.9545
[0055]
数值y分布在(μ-3σ,μ+3σ)中的概率为0.9973
[0056]
可以认为,y的取值几乎全部集中在(μ-3σ,μ+3σ)区间内,超出这个范围的可能性仅占不到0.3%。
[0057]
箱线图法:第三个四分位数和第一个四分位数的差(iqr=q
3-q1)。在这种情况下,离群点被定义为低于箱形图下触须(或q
1-1.5*iqr)或高于箱形图上触须(或q
3-1.5*iqr)的观测值。
[0058]
电流、电压、功率数据的业务规则判断:
[0059]
电流:设ij=(i1,i2,...,i
95
,i
96
)为第j天电流的96点示值数据集合,k为额定电流,ij是电流数据中出现的一次电流,即则ij>k*1.6或ij<k*0.2。
[0060]
电压:设vj=(v1,v2,...,v
95
,v
96
)为第j天电压的96点示值数据集合,f为额定电流,vj是电压数据中出现的一次电压,即则vj>f*1.6或vj<f*0.2。
[0061]
功率:测量点一次功率p与合同容量c之间满足p/c=2;总加组功率p与合同容量c之间满足p/c=4。
[0062]
s203:异常值修正:修正规则:i
ji
=(i
(j-1)i
+i
(j+1)i
)/2,其中i
ji
为第j天第i个测量时间点的异常值,i
(j-1)i
、i
(j+1)i
分别代表j-1天和j+1天第i个测量时间点的正常值;i∈(1,2,3...,95,96)代表96个测量时间点。
[0063]
s204:输出清洗后的用户样本用户电流、电压、功率数据。
[0064]
请参阅图3,其示出了本发明实施例提供的用户数据信息抽取和转换的流程图,包括:
[0065]
s301:获取到的用户近一个月的电流、电压、功率数据如下:
[0066]
[0067][0068][0069]
其中,uj、vj、pj分别代表用户j一个月的电流、电压、功率数据矩阵。
[0070]
s302:数据裁剪。由于神经网络中图像识别图像大小大多为n
×
n,因此对原始用户数据
[0071][0072]
需要进行裁剪,其中n为数据获取天数,m为96个示值点。根据模型算法要求,将xn×m需裁剪成xn×n,即抽取每月24天中每日24个点示值,分别为每天的0时到23时电压、电流、功率所对应的示值数。
[0073]
s303:数据转换。得到用户不同维度的用电数据之后,依据图像理论,将数组中每一个元素视为一个像素点,一个用户的电流、电压、功率数据信息就可以用一张图像q来表示(如图5所示)。
[0074]
s304:图像标签。对正常户和窃电户用电数据图像进行标记{0,1}:0为正常户、1为窃电户。根据模型训练输入要求,将不同用户的图像信息和标签信息进行合并,即q={q1,q2,q3,...,qn,ci},n≥100,ci=(c1,c2,...,cn)为n个用户对应的数据标签(0/1)。
[0075]
请参阅图4,其示出了本发明实施例提供的一种基于卷积神经网络进行图像识别训练的流程图,包括:
[0076]
s401:数据输入,将整合的用户用电图像数据作为输入源,即q={q1,q2,q3,...,qn,ci},n≥100,作为卷积神经网络输入层数据来源。
[0077]
s402:建神经网络。卷积神经网络(cnn)本质上是由多个单层感知机不断更新迭代出来的网络结构,其网络结构具有局部连接、权重共享等特性,是一种深层前馈神经网络。神经网络公式如下:
[0078][0079]
其中:α
i1
、α
i1-1
分别为神经网络中的一个神经元,分别位于第l层和第l-1层第j个;w
ij1
为权重;b
i1
为偏置项;函数f为激活函数。搭建神经网络时采用2层卷积池化层和3个全连接层这种经典网络结构,防止模型参数出现过拟合。
[0080]
卷积神经网络(cnn)本质上是由多个单层感知机不断更新迭代出来的网络结构,其网络结构具有局部连接、权重共享等特性,是一种深层前馈神经网络。
[0081]
卷积神经网络由多层卷积层和池化层组成,在输入元中输入图像信息,通过将输入元与第一层的神经元连接,后续层的神经元与其前一层神经元相连接,经过卷积操作后,就会获取到局部以及全局特征信息。对于同一图像输入源,其神经元赋予相同的权重,即权重共享。权重共享使网络结构更加简单,降低网络训练的耗时,同时也有效避免了过拟合现象的发生。选用不同的卷积核会学习出不同的特征,一般在开始训练之前,采用随机小数矩阵赋值法,对卷积核权值进行初始化,初始化后的卷积核权值在训练的过程中,不断迭代更新并最终趋向收敛,得到最终用户分类结果。
[0082]
s403:设置网络参数。选取分类激活函数,将高维数据转换维二分类数据输出;通过adam优化器对迭代参数进行一定范围内学习;采用gd优化器进行迭代求解,使得损失最小。
[0083]
s404:模型训练。对于输入q={q1,q2,q3,...,qn,ci},n≥100,计算每一个用户出现窃电的概率p=(c=j|q)。定义一个样本数据集为{(x1,c1),(x2,c2),...,(xn,cn)},xn∈{q1,q2,...,qn},yi∈{0,1},模型参数为w,softmax函数sw(qi)要输出一个k维向量来估计k分类概率值,在是否异常用电识别中定义k为2,公式如下:
[0084][0085]
其中:w
jt
xi为输出值;k为输出神经元个数(二分类任务中,k=2);为归一项,保证输出概率值在(0,1)之间。
[0086]
s405:模型评价。对于输出的模型准确度和查全率进行评估,利用已有的验证集对模型效果进行评估。如满足,进入用户识别应用;否则返回s402步骤进行模型优化。
[0087]
s406:模型应用。将预测图像信息带入训练好的神经网络模型中进行预测,输出疑似异常用电概率。
[0088]
具体过程如下:
[0089]
(1)卷积层是卷积核与二维图像做卷积操作,即卷积核到二维图像上所有位置,并在每个位置上与该像素点及其领域像素点做内积。通过卷积操作可以提取出图像低级到复杂的特征。
[0090]
输入输出特征图的关系公式如下:
[0091][0092]
其中:a
il
、a
il-1
分别为第l层和第l-1层第i个特征图,符号*表示卷积运算;k
ijl
为第l层第i个特征图与第l-1层第j个特征图之间进行卷积映射的卷积核。
[0093]
卷积操作示例图如下:
[0094][0095]
same卷积运算的公式如下
[0096][0097]
其中i代表的是输入图像,k代表的是卷积核。
[0098]
(2)池化层进行降维,即在池化窗口内选择一个值作为输出结果均值池化方式就是从池化窗口中选取所有值的平均值作为输出的值,公式如下所示:
[0099][0100]
其中,池化窗口中神经元的数目为n。
[0101]
(3)relu层又称为激活函数层,其主要特征就是它既具有非线性的特点,同时也具有线性的特点。使得relu函数在随机梯度下降过程中能够明显加快收敛速度。relu函数的公式和函数图像(如图6所示)如下:
[0102][0103]
(4)运用全连接层进行分类。即输出每个类别出现的概率,最大概率值对应的类别即待分类图像所属的类别。公式如下所示:
[0104][0105]
在公式中,softmax函数使用指数变换在输入为类别得分的前提下出输出概率,类别的数目为n,p即为待分类图像属于j类的概率。
[0106]
对于输入q={q1,q2,q3,...,qn,ci},n≥100,计算每一个用户出现窃电的概率p=(c=j|q)。
[0107]
定义一个样本数据集为{(x1,c1),(x2,c2),...,(xn,cn)},xn∈{q1,q2,...,qn},yi∈{0,1},模型参数为w,softmax函数sw(qi)要输出一个k维向量来估计k分类概率值,在是否异常用电识别中定义k为2,公式如下:
[0108]
[0109]
其中:w
jt
xi为输出值;k为输出神经元个数(二分类任务中,k=2);为归一项,保证输出概率值在(0,1)之间。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1