本技术涉及反窃电,尤其是涉及到一种用户窃电行为预测方法及装置、存储介质、计算机设备。
背景技术:
1、窃电是指以非法占用电能,以不交或者少交电费为目的,采用非法手段不计量或者少计量用电的行为。窃电行为严重损害了供电公司的合法权益,为避免此现象,供电公司工作人员会进行营业普查,尤其是夏季和冬季用电高峰期会加大普查力度和范围,对用户电表箱进行逐一排查,判断是否有人在窃电。由于用户量巨大,用电排查占用了大量人力物力却难以达到理想效果。
技术实现思路
1、有鉴于此,本技术提供了一种用户窃电行为预测方法及装置、存储介质、计算机设备,对于电网平台中的海量数据进行了有效利用;该算法相对于线性模型能更好的对于预测结果进行拟合,使预测结果更加准确;成本较低可复用性高,极大的节省了窃电排查的人力物力。
2、根据本技术的一个方面,提供了一种用户窃电行为预测方法,其特征在于,所述方法包括:
3、获取包含至少一种用电特征指标的学习样本数据,对所述学习样本数据进行标签标注,其中,标签为窃电标签或非窃电标签;
4、构建并初始化深度网络模型,利用标注后的学习样本数据将所述深度网络模型训练至收敛;
5、接收包含所述用电特征指标的预测样本数据,对所述预测样本数据进行数据预处理,将预处理后的预测样本数据输入到所述深度网络模型中,获得所述深度网络模型输出的窃电概率预测值;
6、依据所述窃电概率预测值,确定所述预测样本数据对应的用户是否为窃电嫌疑用户。
7、可选地,所述用电特征指标包括用户编号、用户历史用电量、用户使用电表的线损率、用户使用电表的三相电压、用户使用电表的三相电流、用户类型以及用户使用电表的所属线路。
8、可选地,所述对所述学习样本数据进行标签标注,包括:
9、将所述学习样本数据中的窃电用户数据标记为窃电标签,将非窃电用户数据标记为非窃电标签;
10、相应地,所述利用标注后的学习样本数据将所述深度网络模型训练至收敛,包括:
11、将标记有窃电标签的学习样本数据记录为正例,将标记为非窃电标签的学习样本数据记录为负例;
12、以预设比例选取正例的学习样本数据和负例的学习样本数据,并利用选取的学习样本数据将所述深度网络模型训练至收敛。
13、可选地,所述获取包含用电特征指标的学习样本数据之后,所述方法还包括:
14、识别所述学习样本数据中的停电事故数据和存在离散型指标缺失的第一缺失样本数据,并将所述停电事故数据和所述第一缺失样本数据从所述学习样本数据中删除;
15、识别所述学习样本数据中连续型用电特征指标存在缺失的第二缺失样本数据,对除所述第二缺失样本数据之外的学习样本数据进行连续型用电特征指标的归一化处理,并对所述第二缺失样本数据采用拉格朗日插值法进行缺失值填补。
16、可选地,所述深度网络模型包括包含7个输入节点的输入层、第一层隐藏层、第二层隐藏层、包含1个输出节点的输出层、第一层隐藏层的节点数为32、第二层隐藏层的节点数为16;
17、其中,7个输入节点分别为用户编号节点、用户历史用电量节点、线损率节点、三相电压节点、三相电流节点、用户类型节点以及所属线路节点,第一层隐藏层的权重值分别为w1和b1,第二层隐藏层的权重值分别为w2和b2,输出层的权重值为w3和b3;第一层激活函数为relu(w1*x+b1),第二层激活函数为relu(w2*h1+b2),输出层激活函数为p=sigmoid(w3*h2+b3),其中,x表示学习样本数据中各用电特征指标的特征向量。
18、可选地,所述利用标注后的学习样本数据将所述深度网络模型训练至收敛,包括:
19、基于预测单次训练数据量n,将标注后的学习样本数据划分为包含多个批次的训练集,每个批次包含预设单次训练数据量n的学习样本数据;
20、将所述训练集中一个批次中各学习样本数据对应的用电特征指标数据特征向量分别输入到深度网络模型中,获得深度网络模型输出的各学习样本数据对应的窃电概率pi,
21、利用深度网络模型的损失函数,对各学习样本数据对应的窃电概率pi以及各学习样本数据的标签之间的损失值进行计算,其中,损失函数yi表示训练集中第i个学习样本数据的标签,当标签为窃电用户时yi=1,当标签为非窃电用户时yi=0;
22、若深度网络模型未满足收敛条件,则基于所述损失值计算深度网络模型的权重值梯度,并基于权重值梯度以及预设模型学习率对深度网络模型中的权重值进行更新,利用权重值更新后的深度网络模型进行下一个批次的学习样本数据的训练,直到深度网络模型收敛为止。
23、可选地,所述方法还包括:
24、发送所述预测样本数据对应的窃电嫌疑用户信息。
25、根据本技术的另一方面,提供了一种用户窃电行为预测装置,所述装置包括:
26、模型训练模块,用于获取包含至少一种用电特征指标的学习样本数据,对所述学习样本数据进行标签标注,其中,标签为窃电标签或非窃电标签;构建并初始化深度网络模型,利用标注后的学习样本数据将所述深度网络模型训练至收敛;
27、预测模块,用于接收包含所述用电特征指标的预测样本数据,对所述预测样本数据进行数据预处理,将预处理后的预测样本数据输入到所述深度网络模型中,获得所述深度网络模型输出的窃电概率预测值;依据所述窃电概率预测值,确定所述预测样本数据对应的用户是否为窃电嫌疑用户。
28、可选地,所述用电特征指标包括用户编号、用户历史用电量、用户使用电表的线损率、用户使用电表的三相电压、用户使用电表的三相电流、用户类型以及用户使用电表的所属线路。
29、可选地,所述模型训练模块,还用于:
30、将所述学习样本数据中的窃电用户数据标记为窃电标签,将非窃电用户数据标记为非窃电标签;
31、将标记有窃电标签的学习样本数据记录为正例,将标记为非窃电标签的学习样本数据记录为负例;
32、以预设比例选取正例的学习样本数据和负例的学习样本数据,并利用选取的学习样本数据将所述深度网络模型训练至收敛。
33、可选地,所述模型训练模块,还用于:
34、在所述获取包含用电特征指标的学习样本数据之后,识别所述学习样本数据中的停电事故数据和存在离散型指标缺失的第一缺失样本数据,并将所述停电事故数据和所述第一缺失样本数据从所述学习样本数据中删除;
35、识别所述学习样本数据中连续型用电特征指标存在缺失的第二缺失样本数据,对除所述第二缺失样本数据之外的学习样本数据进行连续型用电特征指标的归一化处理,并对所述第二缺失样本数据采用拉格朗日插值法进行缺失值填补。
36、可选地,所述深度网络模型包括包含7个输入节点的输入层、第一层隐藏层、第二层隐藏层、包含1个输出节点的输出层、第一层隐藏层的节点数为32、第二层隐藏层的节点数为16;
37、其中,7个输入节点分别为用户编号节点、用户历史用电量节点、线损率节点、三相电压节点、三相电流节点、用户类型节点以及所属线路节点,第一层隐藏层的权重值分别为w1和b1,第二层隐藏层的权重值分别为w2和b2,输出层的权重值为w3和b3;第一层激活函数为relu(w1*x+b1),第二层激活函数为relu(w2*h1+b2),输出层激活函数为p=sigmoid(w3*h2+b3),其中,x表示学习样本数据中各用电特征指标的特征向量。
38、可选地,所述模型训练模块,还用于:
39、基于预测单次训练数据量n,将标注后的学习样本数据划分为包含多个批次的训练集,每个批次包含预设单次训练数据量n的学习样本数据;
40、将所述训练集中一个批次中各学习样本数据对应的用电特征指标数据特征向量分别输入到深度网络模型中,获得深度网络模型输出的各学习样本数据对应的窃电概率pi,
41、利用深度网络模型的损失函数,对各学习样本数据对应的窃电概率pi以及各学习样本数据的标签之间的损失值进行计算,其中,损失函数yi表示训练集中第i个学习样本数据的标签,当标签为窃电用户时yi=1,当标签为非窃电用户时yi=0;
42、若深度网络模型未满足收敛条件,则基于所述损失值计算深度网络模型的权重值梯度,并基于权重值梯度以及预设模型学习率对深度网络模型中的权重值进行更新,利用权重值更新后的深度网络模型进行下一个批次的学习样本数据的训练,直到深度网络模型收敛为止。
43、可选地,所述预测模块,还用于发送所述预测样本数据对应的窃电嫌疑用户信息。
44、依据本技术又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述用户窃电行为预测方法。
45、依据本技术再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述用户窃电行为预测方法。
46、借由上述技术方案,本技术提供的一种用户窃电行为预测方法及装置、存储介质、计算机设备,对于电网平台中的海量数据进行了有效利用;该算法相对于线性模型能更好的对于预测结果进行拟合,使预测结果更加准确;成本较低可复用性高,极大的节省了窃电排查的人力物力。
47、上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。