一种基于字典学习的区别分组非侵入式负荷分解方法与流程

文档序号:26875974发布日期:2021-10-09 10:51阅读:80来源:国知局
一种基于字典学习的区别分组非侵入式负荷分解方法与流程

1.本发明涉及电力负荷分解技术领域,特别涉及一种基于字典学习的区别分组非侵入式负荷分解方法。


背景技术:

2.随着现代社会的发展,人们对能源的需求也同步激增。能源危机的到来,使得节能问题引起了全社会的高度重视,提高能源效率是减少碳排放、缓解能源危机的重要途径。电能作为一种经济、实用、清洁的可再生二次能源,能够实现灵活调节和精确控制,使终端能源利用效率提高。智能电网是一个被广泛讨论的可以提高能源效率的概念。负荷分解技术作为智能电网实现节能的关键技术之一,主要是通过将负荷总用电信息分解为各时段每个负荷的运行状态和对应能耗信息,使得用户获取详细用电信息,以引导用户调整用电习惯达到节能降耗的目的。
3.目前负荷分解技术主要包括侵入式和非侵入式两类。侵入式负荷分解需要为每个用电设备安装传感器以获得详细用电数据,其优点是数据准确可靠,缺点是可操作性低、成本高、用户接受程度低。而非侵入式负荷分解只需采集总能耗信息就可以利用各用电设备的工作特征识别出单个设备能耗信息。非侵入式负荷分解技术弥补了传统侵入式的缺陷,是未来负荷分解的主要发展方向。
4.目前国内外都对非侵入式负荷分解方法进行了大量的研究,如组合优化算法,支持向量机,稀疏编码,隐马尔可夫模型,深度长短时记忆网络等算法。相较于其他方法深度神经网络和稀疏编码方法能够取得更好结果。但是深度神经网络随着网络层数增加,会导致参数量的增加,模型的训练难度也随之加大。稀疏编码算法在这方面具有一定优势能提升分解性能,但在识别的准确度上仍然有较大的提升空间。因此,如何提高现有非侵入式负荷分解方法的效率与准确性,是现有技术亟待解决的问题之一。


技术实现要素:

5.本发明的主要目的为提供一种基于字典学习的区别分组非侵入式负荷分解方法,旨在解决现有技术中非侵入式负荷分解方法的效率与准确性难以提高的技术问题。
6.为实现上述发明目的,本发明采用了如下技术方案:
7.一种基于字典学习的区别分组非侵入式负荷分解方法,包括以下步骤:
8.s1:获取设备的数据集,对所述数据集进行数据预处理,并将预处理后的数据分为训练样本数据和测试样本数据;所述数据集包括原始测量的功率信号;
9.s2:对训练样本数据进行设备集分组,所述设备集分组包括第一分组与第二分组,所述第一分组包括一个设备,所述第二分组包括多个设备;
10.s3:根据训练样本数据,对第一分组和第二分组进行区别字典训练,分别得到对应的第一字典和第二字典;
11.s4:基于区别指标,对所述第一字典与所述第二字典区别衡量,并记录区别指标
值;
12.s5:在第一分组和第二分组中选择出字典区别指标最小的分组,将其确定为最优分组;
13.s6:进行功率分解,利用最优分组训练好的第一字典和第二字典对预处理好的聚合功率信号数据进行稀疏编码,得到稀疏表示,并将稀疏表示与区别字典相乘得到分解结果;
14.s7:通过剔除最优分组里面被分出来的设备及其功率预测值来更新设备集和总功率;
15.s8:重复步骤s2

s7,得到每次迭代的分解结果,直到所述第二分组中只包括一个设备,进入s9;
16.s9:将每次递归迭代结果作为一个设备的预测结果,并对该预测结果进行反归一化处理及输出。
17.优选的,步骤s1中,所述数据预处理包括以下步骤:
18.(1

1)对所述数据集进行选取;
19.(1

2)将所述数据集的进行除燥;
20.(1

3)将除燥后的数据集进行归一化;
21.(1

4)生成样本数据。
22.优选的,步骤s2中,所述设备集分组包括第一分组与第二分组,所述第一分组包括一个设备,命名为one;所述第二分组包括多个设备,命名为rest。
23.优选的,步骤s3中,所述区别字典训练包括以下步骤:
24.(2

1)对每个设备的功率信号x
i
∈r
m
×
n
学习一个字典d
i
∈r
m
×
q
和一个稀疏表示z
i
∈r
q
×
n
使得每个设备的功率信号等于一个字典和一个稀疏表示的乘积,其计算公式为:
25.x
i
=d
i
z
i
,i=1...n
ꢀꢀꢀꢀꢀꢀꢀ
(1)
26.其中,i表示设备编号,n表示总设备数,x
i
为设备的功率信号,d
i
为字典,z
i
为稀疏表示;
27.(2

2)利用预处理好的训练样本数据建立学习字典,所述学习字典的基本模型如下:
[0028][0029]
其中,λ1是权衡重构误差与稀疏性的参数,添加约束d
i
≥0,z
i
≥0的原因是设备的功率信号总是非负的,d
j
表示字典d
i
的第j列,即d
i
=[d1,d2,...,d
j
,...,d
q
],亦称为字典原子,令||d
j
||2=1是为了防止出现退化解;||
·
||
f
表示f范数运算,||
·
||1表示1范数运算;
[0030]
(2

3)加入第一正则化项,提高字典的辨别能力,所述第一正则化项的计算公式为:
[0031][0032]
其中,α是第一正则化参数,d
it
表示字典d
i
的转置,i∈r
m
×
m
为单位矩阵;
用于确保字典内部原子间的非连贯性;
[0033]
(2

4)加入第二正则化项,提高字典间的区别,所述第二正则化项的计算公式为:
[0034][0035]
其中,oned,restd分别表示针对one和rest所学习的字典,β是第二正则化参数,oned
t
表示字典oned的转置;用于确保字典间的区别,即实现针对某一设备训练的字典只对该设备起作用;
[0036]
(2

5)联立方程(1)~(4),得到第一分组one和第二分组rest最终的区别字典学习的模型。
[0037]
(2

6)根据第一分组one和第二分组rest最终的区别字典学习的模型,分别求解分组第一分组one和第二分组rest的字典:
[0038]
优选的,步骤(2

5)中,所述第一分组one的区别字典学习的模型为:
[0039][0040]
其中,x1、z1、分别表示第一分组one的设备功耗和第一稀疏表示,oned
j
表示第一字典oned的原子;λ1是权衡重构误差与稀疏性的参数,α是第一正则化参数,β是第二正则化参数,||
·
||
f
表示f范数运算,||
·
||1表示1范数运算。
[0041]
优选的,步骤(2

5)中,所述第二分组rest的区别字典学习的模型为:
[0042][0043]
其中,x2、z2分别表示第二分组rest的设备功耗和第二稀疏表示,restd
j
分别表示第二字典restd的原子;λ1是权衡重构误差与稀疏性的参数,α是第一正则化参数,β是第二正则化参数,||
·
||
f
表示f范数运算,||
·
||1表示1范数运算。
[0044]
优选的,步骤s4中,对所述第一字典与所述第二字典区别衡量包括定义区别矩阵a=oned
t
restd,且a∈r
q
×
q
,并将训练所得的第一字典oned和第二字典restd作为输入,计算得到两者的区别指标。
[0045]
优选的,所述计算区别指标的计算公式为:
[0046][0047]
其中,di表示区别指标,a
ij
表示区别矩阵a第i列第j行的元素。
[0048]
优选的,步骤s6中,所述功率分解包括利用聚合信号x、最优分组结构和训练所得第一字典oned、第二字典restd建立稀疏分解模式。
[0049]
优选的,所述的稀疏分解模式计算公式为:
[0050][0051]
其中,z1、z2分别表示第一分组与第二分组的中各设备的稀疏表示,oned表示所述第一字典的原子,restd表示所述第二字典的原子;λ2是权衡重构误差与稀疏性的参数。
[0052]
本发明的有益效果为:本发明提供了一种基于字典学习的区别分组非侵入式负荷分解方法,采用区别字典学习算法以及分组思想训练出每个设备的字典,再根据字典进行稀疏编码,实现负荷的非侵入式分解。利用字典学习方法能够较快的学习到各类用电设备的用电模式,使得该算法迁移到不同地方时具有较强的适应能力。同时,在训练阶段考虑了字典内部的非连贯性和字典间的区别性,使所训练的字典能够较好的针对特定设备。这样训练的字典保留了设备各自的独特性,能够降低因为特征相近所带来的误判,使得负荷分解结果准确性更好。对训练样本数据进行设备集分组,能够将非侵入式负荷监测问题由传统的整体分解任务转化为递归分解任务,提高负荷分解结果的准确性和稳定性,避免出现功率相近电器分解效果差的现象。本发明能够应用于负荷分解、智能电网、用电行为分析、负荷节能等多个技术领域,对居民、电力公司以及全社会都具有重要意义。
附图说明
[0053]
图1是本发明实施例提供的一种基于字典学习的区别分组非侵入式负荷分解方法的整体流程图;
[0054]
图2是是本发明实施例提供的一种基于字典学习的区别分组非侵入式负荷分解方法的具体流程图;
[0055]
图3是是本发明实施例提供的一种基于字典学习的区别分组非侵入式负荷分解方法的分组结构示例图;
[0056]
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0057]
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0058]
请参阅图1、图2及图3,本发明实施例提供了一种基于字典学习的区别分组非侵入式负荷分解方法,包括以下步骤:
[0059]
s1:获取设备的数据集,对所述数据集进行数据预处理,并将预处理后的数据分为训练样本数据和测试样本数据;所述数据集包括原始测量的功率信号;
[0060]
在本发明实施例步骤s1中,所述测试样本数据计算设备中的设备总功率。
[0061]
在本发明实施例步骤s1中,所述数据预处理的方法包括
[0062]
(1

1)对所述数据集进行选取;选用redd公开数据集进行实验,此数据集包含六个家庭的用电数据,电源级采样频率为1hz,设备级的电器采样频率为1/3hz。针对每个家庭的
聚合功率信号和单设备功率信号进行数据对齐和数据填充操作。
[0063]
(1

2)将所述数据集的进行除燥;测量获得的功率原始数据往往存在噪声,所以选择中值滤波方法进行去噪,保证在滤去噪声的同时保护信号边缘。
[0064]
(1

3)将除燥后的数据集进行归一化;对信号进行归一化处理,通过采用最大值最小值归一化方法,使结果映射到区间[0,1]内,得到所需要的序列。
[0065]
(1

4)生成样本数据。将归一化处理后的负荷序列分解为初始训练序列和初始测试序列;再对所述初始训练序列和初始测试序列通过设定窗口长度和步长进行滑动处理得到训练样本数据和测试样本数据。
[0066]
具体的,在本发明实施例中,所述数据预处理是利用redd数据集中house_1的数据来获取训练样本数据和测试样本数据,选用其中的洗碗机、冰箱、微波炉和洗衣机四种用电设备用做目标设备进行负荷分解,即设备集b={洗碗机,冰箱,微波炉,洗衣机},设备数n=4。
[0067]
首先由于设备级的采样频率(1/3hz)和电源级的采样频率(1hz)不一致,需要先将设备级的数据和电源级的数据根据时间戳进行对齐,对于缺失的设备级数据进行后填充;
[0068]
针对设备级的数据通过中值滤波去除噪声和毛刺,并保留信号边缘。例如对功率信号序列x进行滤波处理时,定义窗口长度为l=2
×
5+1=11。对窗口内的信号样本值按从小到大的顺序排列后得x(j

5),

,x(j),

,x(j+5),其中值x(j)被定义为中值滤波的输出值;
[0069]
对经过中值滤波的数据进行下采样。例如存在功率信号x={x1,x2,

,x
n
},下采样时间为1min,即是60个间隔采样一次,得到下采样之后的功率信号为x’={x1,x
61
,x
121


};
[0070]
然后对数据进行归一化处理以消除指标间的纲量影响,采用最大值最小值归一化方法,使其映射到区间[0,1]。归一化函数为y=(x

xmin)/(xmax

xmin),其中,x为样本数据,xmax为样本数据最大值,xmin为样本数据的最小值,y为归一化后得到的样本数据;
[0071]
为了增加样本数量,通过重叠滑动窗口获得训练样本。滑动窗口大小和步长分别为180和30,代表的时间分别是3小时和半小时。对于长为z的训练序列来说需要滑动(z

180)/30+1次来获取训练样本;
[0072]
最后获取测试样本,测试样本采用非重叠滑动方式获取,长度为h的测试序列需要滑动h/180次。其中训练样本和测试样本没有重合,并且训练样本和测试样本的数据量比例为4:1;
[0073]
对于设备集b中的四个目标设备均执行上述操作就可以得到四组一一对应的用于负荷分解的训练样本数据和测试样本数据,分别为x
a
、x
b
、x
c
、x
d
和x
a’、x
b’、x
c’、x
d’。
[0074]
s2:对训练样本数据进行设备集分组,所述设备集分组包括第一分组与第二分组,所述第一分组包括一个设备,命名为one,所述第二分组包括多个设备,命名为rest;
[0075]
如上述s2步骤所述的,针对设备集b选取其中一个设备作为第一分组,并命名为one。剩下的设备组成第二分组,命名为rest。例如one={洗碗机},rest={冰箱,微波炉,洗衣机}。由于用电设备之间的功耗具有相似性,这种相似性会对分解结果产生极大的影响,降低分解精度,通过将设备集进行分组能够消减这种相似性,以达到更好的分解效果。
[0076]
s3:根据训练样本数据,对第一分组和第二分组进行区别字典训练,分别得到对应的第一字典和第二字典;
[0077]
在本发明实施例中,用预处理好的训练样本数据对第一分组one和第二分组rest分别进行区别字典训练,所述区别字典模型是指带有字典内原子非连贯性约束和字典间区别性约束的模型,即带有罚函数和和
[0078]
在本发明实施例步骤s3中,所述区别字典训练包括以下步骤:
[0079]
(2

1)对每个设备的功率信号x
i
∈r
m
×
n
学习一个字典d
i
∈r
m
×
q
和一个稀疏表示z
i
∈r
q
×
n
使得每个设备的功率信号等于一个字典和一个稀疏表示的乘积,其计算公式为:
[0080]
x
i
=d
i
z
i
,i=1...n
ꢀꢀꢀꢀꢀꢀꢀ
(1)
[0081]
其中,i表示设备编号,n表示总设备数,x
i
为设备的功率信号,d
i
为字典,z
i
为稀疏表示;
[0082]
(2

2)利用预处理好的训练样本数据建立学习字典,所述学习字典的基本模型如下:
[0083][0084]
其中,λ1是权衡重构误差与稀疏性的参数,添加约束d
i
≥0,z
i
≥0的原因是设备的功率信号总是非负的,d
j
表示字典d
i
的第j列,即d
i
=[d1,d2,...,d
j
,...,d
q
],亦称为字典原子,令||d
j
||2=1是为了防止出现退化解;||
·
||
f
表示f范数运算,||
·
||1表示1范数运算;
[0085]
(2

3)加入第一正则化项,提高字典的辨别能力,所述第一正则化项的计算公式为:
[0086][0087]
其中,α是第一正则化参数,d
it
表示字典d
i
的转置,i∈r
m
×
m
为单位矩阵;用于确保字典内部原子间的非连贯性;
[0088]
(2

4)加入第二正则化项,提高字典间的区别,所述第二正则化项的计算公式为:
[0089][0090]
其中,oned,restd分别表示针对one和rest所学习的字典,β是第二正则化参数,oned
t
表示字典oned的转置;用于确保字典间的区别,即实现针对某一设备训练的字典只对该设备起作用;
[0091]
(2

5)联立方程(1)~(4),得到最终区别字典学习的模型:
[0092]
所述第一分组one的区别字典学习的模型为:
[0093][0094]
其中,x1、z1、分别表示第一分组one的设备功耗和第一稀疏表示,oned
j
表示第一字典oned的原子;λ1是权衡重构误差与稀疏性的参数,α是第一正则化参数,β是第二正则化参数,||
·
||
f
表示f范数运算,||
·
||1表示1范数运算。
[0095]
所述第二分组rest的区别字典学习的模型为:
[0096][0097]
其中,x2、z2分别表示第二分组rest的设备功耗和第二稀疏表示,restd
j
分别表示第二字典restd的原子;λ1是权衡重构误差与稀疏性的参数,α是第一正则化参数,β是第二正则化参数,||
·
||
f
表示f范数运算,||
·
||1表示1范数运算。
[0098]
(2

6)利用式(5)和式(6)分别求解第一分组one和第二分组rest的字典。
[0099]
在本发明实施例中,利用交替最小化求解上述问题,当近似误差变为收敛或迭代次数达到指定数值时,迭代结束。将上述问题转化为如下优化问题:
[0100]
首先,固定第一稀疏表示z1求解第一字典oned,式(5)转换为:
[0101][0102]
将式(7)采用梯度下降法解第一字典oned,求解形式如下:
[0103][0104]
其中,μ表示梯度下降的步长,[
·
]
+
表示负数置零,以确保oned≥0。
[0105]
然后再对oned的每列oned
j
进行单位化||oned
j
||2=1。
[0106]
同理,固定oned求解z1,式(5)转换为:
[0107][0108]
上式属于l1最小化问题,且带有非负约束,采用非负矩阵分解求解,求解形式如下:
[0109]
z1=z1.*(2oned
t
x1)./(2oned
t
onedz1+λ1)
ꢀꢀꢀꢀ
(10)
[0110]
同理,可求得第二字典restd和第二稀疏表示z2,求解形式如下:
[0111][0111][0112]
对第二字典restd的每列restd
j
进行单位化||restd
j
||2=1
[0113]
z2=z2.*(2restd
t
x2)./(2restd
t
restdz2+λ1)
ꢀꢀꢀꢀ
(12)
[0114]
通过交替最小化求解上述最小化问题可以得到第一字典oned和第二字典restd。求解字典时使用梯度下降法,求解稀疏表示时使用非负矩阵分解,以保证非负约束。交替最小化迭代的结束条件是目标函数的变化率小于10
‑5,即上一次迭代的目标函数值减本次迭代的目标函数值的绝对值除以上一次迭代的目标函数值的值小于10
‑5。
[0115]
s4:基于区别指标,对所述第一字典与所述第二字典区别衡量,并记录区别指标值;
[0116]
在本发明实施例步骤s4中,对所述第一字典与所述第二字典区别衡量包括定义区别矩阵a=oned
t
restd,且a∈r
q
×
q
,并将训练所得的第一字典oned和第二字典restd作为输入,计算得到两者的区别指标。
[0117]
在本发明实施例中,所述计算区别指标的计算公式为:
[0118][0119]
其中,di表示区别指标,a
ij
表示区别矩阵a第i列第j行的元素。di越小说明字典oned和restd之间的区别越大。
[0120]
s5:在第一分组和第二分组中选择出字典区别指标最小的分组,将其确定为最优分组;
[0121]
如上述s5步骤所述的,重复s2

s4,递归的从设备集b中选择一个设备作为one分组,分别进行区别字典学习,记录字典区别评估指标。从记录的评估指标中选择出最小值,将此分组作为最优分组,即是在此分组情况下设备集b能够训练出最具有区别性的两个字典,能够带来更高的分解精度。
[0122]
s6:进行功率分解,利用最优分组训练好的第一字典和第二字典对预处理好的聚合功率信号数据进行稀疏编码,得到稀疏表示,并将稀疏表示与区别字典相乘得到分解结果;
[0123]
在本发明实施例步骤s6中,所述功率分解包括利用聚合信号x、最优分组结构和训练所得第一字典oned、第二字典restd建立稀疏分解模式。
[0124]
所述的稀疏分解模式计算公式为:
[0125][0126]
其中,z1、z2分别表示第一分组与第二分组的中各设备的稀疏表示,oned表示所述
第一字典的原子,restd表示所述第二字典的原子;λ2是权衡重构误差与稀疏性的参数。
[0127]
具体的,输入待分解的总功率信号x,利用最优分组结构和和训练好的字典oned和restd对其进行拟合,分别求得稀疏编码系数,求解方法选择非负矩阵分解。然后将对应的字典和稀疏编码系数相乘得到本次迭代的分解结果。例如one分组的分解结果为rest分组的分解结果为其中z
′1和z
′2利用下式求解:
[0128][0129]
x表示待分解总功率,针对第一分组one={洗碗机},第二分组rest={冰箱,微波炉,洗衣机}有x=xa’+xb’+xc’+xd’。其中,λ2用于权衡重构误差和稀疏度,因为最终分解目的是使重构误差较小,所以将λ2设置为一个较小值0.001。
[0130]
s7:通过剔除最优分组里面被分出来的设备及其功率预测值来更新设备集和总功率;
[0131]
如上述s7所述的,针对选出的最优分组可以得到分组情况和该分组的分解效果。设备集b的更新是从b中剔除最优第一分组one所包含的设备,例如目前设备集={洗碗机,冰箱,微波炉,洗衣机},最优分组的情况是第一分组one={微波炉},第二分组rest={洗碗机,冰箱,洗衣机},那么更新后的设备集={洗碗机,冰箱,洗衣机}。总功率x的更新是利用原来的总功率x1减去最优第一分组one的分解结果onedz'
1最优
,即x=x1

onedz'
1最优

[0132]
s8:重复步骤s2

s7,得到每次迭代的分解结果,直到所述第二分组中只包括一个设备,进入s9;
[0133]
如上述s8所述的,将更新后的设备集和总功率以及训练样本数据作为输入,并重复步骤s2

s7,每次迭代都针对选择出来的最优分组结构进行功率分解,直到设备集中只剩下一个设备时停止迭代。
[0134]
s9:将每次递归迭代结果作为一个设备的预测结果,并对该预测结果进行反归一化处理及输出。
[0135]
如图3所示是一个分组递归分解的分组结构示例图,具体的,每次迭代都能得到一个设备的预测结果,对该预测结果进行反归一化处理,即是将得到的预测数据从[0,1]区间还原到设备实际功率消耗值。反归一化的公式为:y’=x’(x
max

x
min
)+x
min
,其中,x’为预测数据,x
max
为样本数据最大值,x
min
为样本数据的最小值,y’为反归一化后得到的预测数据,即是最终预测结果。
[0136]
本发明提供了一种基于字典学习的区别分组非侵入式负荷分解方法,采用区别字典学习算法以及分组思想训练出每个设备的字典,再根据字典进行稀疏编码,实现负荷的非侵入式分解。利用字典学习方法能够较快的学习到各类用电设备的用电模式,使得该算法迁移到不同地方时具有较强的适应能力。同时,在训练阶段考虑了字典内部的非连贯性和字典间的区别性,使所训练的字典能够较好的针对特定设备。这样训练的字典保留了设备各自的独特性,能够降低因为特征相近所带来的误判,使得负荷分解结果准确性更好。对训练样本数据进行设备集分组,能够将非侵入式负荷监测问题由传统的整体分解任务转化为递归分解任务,提高负荷分解结果的准确性和稳定性,避免出现功率相近电器分解效果
差的现象。本发明能够应用于负荷分解、智能电网、用电行为分析、负荷节能等多个技术领域,对居民、电力公司以及全社会都具有重要意义。
[0137]
上列详细说明是针对本发明可行实施例的具体说明,以上实施例并非用以限制本发明的专利范围,凡未脱离本发明所为的等效实施或变更,均应包含于本案的专利范围中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1