一种非侵入式负荷用电信息的聚类方法、装置及设备

文档序号:25653215发布日期:2021-06-29 21:12阅读:100来源:国知局
一种非侵入式负荷用电信息的聚类方法、装置及设备

1.本发明涉及信息聚类领域,特别是涉及一种非侵入式负荷用电信息的聚类方法,本发明还涉及一种非侵入式负荷用电信息的聚类装置及设备。


背景技术:

2.为了对非侵入负荷进行分解并研究,那么就必须对每个电器的用电信息(包括有功功率、无功功率、电压以及电流等)进行分类,现有技术中缺少一种成熟的对于目标电器的用电信息进行分类的方法,在进行分类时往往需要进行海量的计算,一方面增加了cpu的工作压力,另一方面分类速度较慢。
3.因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。


技术实现要素:

4.本发明的目的是提供一种非侵入式负荷用电信息的聚类方法,在损失较小精度的基础上减少了运算量,降低了cpu的工作压力并提升了分类速度;本发明的另一目的是提供一种非侵入式负荷用电信息的聚类装置及设备,在损失较小精度的基础上减少了运算量,降低了cpu的工作压力并提升了分类速度。
5.为解决上述技术问题,本发明提供了一种非侵入式负荷用电信息的聚类方法,包括:
6.获取目标电器的用电信息的采集序列;
7.采用kmeans聚类算法将所述采集序列中的所有对象预先划分为第一预设数量个中层集群;
8.通过凝聚层次聚类方法对所有的所述中层集群进行合并聚类;
9.判断最后一次合并聚类后的多个集群是否满足预设迭代截止条件;
10.若是,则停止迭代;
11.若否,则将最后一次合并聚类后的多个集群作为所述中层集群并执行所述通过凝聚层次聚类方法对所有的所述中层集群进行合并聚类的步骤。
12.优选地,所述采用kmeans聚类算法将所述采集序列中的所有对象预先划分为第一预设数量个中层集群具体为:
13.随机选取所述采集序列中的第一预设数量个对象作为初始集群中心;
14.将所述采集序列中除所述初始集群中心之外的各个对象,分别划分至距其最近的所述初始集群中心所在的集群,以便得到第一预设数量个初始集群;
15.更新每个所述初始集群的集群中心;
16.判断各个所述初始集群最新的集群中心是否均与上次更新后的集群中心相同;
17.若否,则执行所述将所述采集序列中除所述初始集群中心之外的各个对象,分别划分至距其最近的所述初始集群中心所在的集群,以便得到第一预设数量个初始集群的步
骤;
18.若是,则将最后一次划分得到的所述第一预设数量个集群作为中层集群。
19.优选地,所述通过凝聚层次聚类方法对所有的所述中层集群进行合并聚类包括:
20.计算每两个所述中层集群之间的邻近度;
21.根据邻近度最小的第二预设数量对所述中层集群进行集群合并。
22.优选地,所述根据邻近度最小的第二预设数量对所述中层集群进行集群合并包括:
23.将邻近度最小的第二预设数量对所述中层集群中,存在交集的所有中层集群对合并为一个中层集群;
24.将邻近度最小的第二预设数量对所述中层集群中,不存在交集的中层集群对单独合并为一个中层集群。
25.优选地,所述判断最后一次合并聚类后的多个集群是否满足预设迭代截止条件具体为:
26.判断最后一次合并聚类后的多个集群中最小的集群间距是否小于预设阈值;
27.则所述根据邻近度最小的第二预设数量对所述中层集群进行集群合并之后,所述判断最后一次合并聚类后的多个集群中最小的集群间距是否小于预设阈值之前,该非侵入式负荷用电信息的聚类方法还包括:
28.更新每个合并后得到的中层集群的集群中心,以便通过其计算集群间距。
29.优选地,所述更新每个合并后得到的中层集群的集群中心具体为:
[0030][0031]
其中,c
new
(t)为合并后得到的某个中层集群的第t个特征值,n
u
表示第u个集群内的对象数,u∈[1,q],q为用于合并该新集群的所述中层集群的总数,q∈[2,2f],f为所述第二预设数量,c
u
(t)表示第u个集群中所有对象的第t个特征的均值。
[0032]
优选地,所述计算每两个所述中层集群之间的邻近度具体为:
[0033]
计算每两个所述中层集群之间的欧氏距离。
[0034]
优选地,所述第一预设数量具体为:
[0035][0036]
其中,m为所述第一预设数量,n为所述采集序列中的对象总数。
[0037]
为解决上述技术问题,本发明还提供了一种非侵入式负荷用电信息的聚类装置,包括:
[0038]
获取模块,用于获取目标电器的用电信息的采集序列;
[0039]
预划分模块,用于采用kmeans聚类算法将所述采集序列中的所有对象预先划分为第一预设数量个中层集群;
[0040]
合并模块,用于通过凝聚层次聚类方法对所有的所述中层集群进行合并聚类;
[0041]
判断模块,用于判断最后一次合并聚类后的多个集群是否满足预设迭代截止条件,若是,则触发终止模块,若否,则触发循环模块;
[0042]
所述终止模块,用于停止迭代;
[0043]
所述循环模块,用于将最后一次合并聚类后的多个集群作为所述中层集群并执行所述通过凝聚层次聚类方法对所有的所述中层集群进行合并聚类的步骤。
[0044]
为解决上述技术问题,一种非侵入式负荷用电信息的聚类设备,包括:
[0045]
存储器,用于存储计算机程序;
[0046]
处理器,用于执行所述计算机程序时实现如上所述非侵入式负荷用电信息的聚类方法的步骤。
[0047]
本发明提供了一种非侵入式负荷用电信息的聚类方法,考虑到kmeans聚类算法能够将原始的包含多对象的数据集,以较低的计算量迅速划分为指定数目个集群,因此本申请率先用kmeans聚类算法对目标电器的用电信息的采集序列进行处理,以得到第一预设数量个中层集群,在此基础之上再通过凝聚层次聚类方法对所有的中层集群进行循环地合并聚类,直至聚类结果满足预设迭代截止条件,避免了直接对原始的数据集进行迭代运算,在损失较小精度的基础上减少了运算量,降低了cpu的工作压力并提升了分类速度。
[0048]
本发明还提供了一种非侵入式负荷用电信息的聚类装置及设备,具有如上非侵入式负荷用电信息的聚类方法相同的有益效果。
附图说明
[0049]
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0050]
图1为本发明提供的一种非侵入式负荷用电信息的聚类方法的流程示意图;
[0051]
图2为本发明提供的一种非侵入式负荷用电信息的聚类装置的结构示意图;
[0052]
图3为本发明提供的一种非侵入式负荷用电信息的聚类设备的结构示意图。
具体实施方式
[0053]
本发明的核心是提供一种非侵入式负荷用电信息的聚类方法,在损失较小精度的基础上减少了运算量,降低了cpu的工作压力并提升了分类速度;本发明的另一核心是提供一种非侵入式负荷用电信息的聚类装置及设备,在损失较小精度的基础上减少了运算量,降低了cpu的工作压力并提升了分类速度。
[0054]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0055]
请参考图1,图1为本发明提供的一种非侵入式负荷用电信息的聚类方法的流程示意图,该非侵入式负荷用电信息的聚类方法包括:
[0056]
步骤s1:获取目标电器的用电信息的采集序列;
[0057]
具体的,由于在对用电信息进行聚类,因此本申请中首先获取目标电器的用电信息并将其作为后续步骤中的数据基础。
[0058]
步骤s2:采用kmeans聚类算法将采集序列中的所有对象预先划分为第一预设数量
个中层集群;
[0059]
具体的,考虑到现有技术中若直接对用电信息中各个对象间的距离进行计算从而进行聚类,由于用电信息中的对象数巨大,因此势必需要极大的运算量才能完成聚类,而申请人考虑到kmeans聚类算法能够预先确定第一预设数量的初始集群中心,随后围绕这些初始集群中心进行集群生成并不断优化,可以极大地减少运算量,因此本申请中首先采用kmeans聚类算法将采集序列中的所有对象预先划分为第一预设数量个中层集群。
[0060]
值得一提的是,用电信息中各个对象均包含的特征主要可以有:有功功率、无功功率、视在功率、电压、电流以及电流谐波等,本发明实施例在此不做限定。
[0061]
其中,第一预设数量可以进行自主设定,其与用电信息中的对象数相关,本发明实施例在此不做限定。
[0062]
步骤s3:通过凝聚层次聚类方法对所有的中层集群进行合并聚类;
[0063]
具体的,由于考虑到经过kmeans聚类算法聚类得到的多个中层集群的数量从一开始就确定了,通常第一预设数量也要大于最终聚类得到的集群数量要求,因此这些中层集群的聚类程度还不够,还需要对这些中层集群进一步地合并聚类,从而达到最终的聚类要求,因此本申请进而通过凝聚层次聚类方法对所有的中层集群进行合并聚类。
[0064]
其中,由于中层集群已经聚类到一定程度,此时进行凝聚层次聚类并不会耗费多大的计算量。
[0065]
步骤s4:判断最后一次合并聚类后的多个集群是否满足预设迭代截止条件;
[0066]
具体的,可以为目标电器的用电信息的聚类过程预先设置迭代截止条件,并且每次通过凝聚层次聚类方法进行合并聚类后便可以进行判断,以便在合适的时机终止迭代并完成聚类。
[0067]
步骤s5:若是,则停止迭代;
[0068]
具体的,在最后一次合并聚类后的多个集群满足预设迭代截止条件时便可以停止迭代,此时得到的多个集群便为目标电器的用电信息的聚类结果。
[0069]
步骤s6:若否,则将最后一次合并聚类后的多个集群作为中层集群并执行通过凝聚层次聚类方法对所有的中层集群进行合并聚类的步骤。
[0070]
具体的,在最后一次合并聚类后的多个集群未满足预设迭代截止条件时,便可以返回步骤s3继续进行迭代合并,以便最终完成非侵入式负荷用电信息的聚类。
[0071]
本发明提供了一种非侵入式负荷用电信息的聚类方法,考虑到kmeans聚类算法能够将原始的包含多对象的数据集,以较低的计算量迅速划分为指定数目个集群,因此本申请率先用kmeans聚类算法对目标电器的用电信息的采集序列进行处理,以得到第一预设数量个中层集群,在此基础之上再通过凝聚层次聚类方法对所有的中层集群进行循环地合并聚类,直至聚类结果满足预设迭代截止条件,避免了直接对原始的数据集进行迭代运算,在损失较小精度的基础上减少了运算量,降低了cpu的工作压力并提升了分类速度。
[0072]
在上述实施例的基础上:
[0073]
作为一种优选的实施例,采用kmeans聚类算法将采集序列中的所有对象预先划分为第一预设数量个中层集群具体为:
[0074]
随机选取采集序列中的第一预设数量个对象作为初始集群中心;
[0075]
将采集序列中除初始集群中心之外的各个对象,分别划分至距其最近的初始集群
中心所在的集群,以便得到第一预设数量个初始集群;
[0076]
更新每个初始集群的集群中心;
[0077]
判断各个初始集群最新的集群中心是否均与上次更新后的集群中心相同;
[0078]
若否,则执行将采集序列中除初始集群中心之外的各个对象,分别划分至距其最近的初始集群中心所在的集群,以便得到第一预设数量个初始集群的步骤;
[0079]
若是,则将最后一次划分得到的第一预设数量个集群作为中层集群。
[0080]
具体的,由于已经将采集序列中第一预设数量个对象作为初始集群中心,因此需要对采集序列中除初始集群中心之外的各个对象进行集群归属的确定,本申请中通过距离近优先的原则将采集序列中除初始集群中心之外的各个对象,分别划分至距其最近的初始集群中心所在的集群,以便得到第一预设数量个初始集群,这是第一次得到第一预设数量个初始集群,随后要做的便是“确定这第一预设数量个集群中的对象组成是否还可以进一步优化”,具体的做法是“判断所有的集群中心是否与上次更新后的集群中心相同”,如果不相同,那么便可以返回执行“将采集序列中除初始集群中心之外的各个对象,分别划分至距其最近的初始集群中心所在的集群,以便得到第一预设数量个初始集群”的步骤,最终截止的条件便是“各个初始集群最新的集群中心均与上次更新后的集群中心相同”,此时便代表已经得到了第一预设数量个聚类最合理的用电信息对象的集群。
[0081]
具体的,假设用电信息的采集序列为x=[x1,x2,...,x
n
],其中,x
i
(i=1,2,..,n)为该数据集的单个对象,且任意对象x
i
有特征[x
i1
,x
i2
...x
ir
],r为特征总数。
[0082]
其中,在对采集序列进行kmeans聚类时:
[0083]
首先,随机选取m(第一预设数量)个对象作为初始集群中心,可以将选择的初始集群中心记为q=[q1,q2,...,q
j
,...,q
m
],接着计算采集序列中除初始集群中心之外的每个对象x
i
与q中的每个初始集群中心的距离d
ij
,其计算方式如下:
[0084][0085]
x
it
表示对象x
i
的第t个特征,i∈[1,n],q
jt
表示对象q
j
的第t个特征,j∈[1,m],t∈[1,r]。
[0086]
接着便可以根据计算出来的距离,将各个对象分配到距离最近的初始集群中心所在的集群中,得到了m个初始集群,随后便需要更新各个集群的集群中心,更新方式如下:
[0087][0088]
其中,c
j
表示第j个集群的集群中心,c
j
(t)表示第j个集群中所有对象第t个特征值的均值,n
j
表示集群j内的对象数,表示集群j内第个对象的第t个特征值,
[0089]
最后,在kmeans聚类过程中最后得到的第一预设数量个中层集群的集群中心可以表示为c=[c1,c2,...,c
m
]。
[0090]
作为一种优选的实施例,通过凝聚层次聚类方法对所有的中层集群进行合并聚类包括:
[0091]
计算每两个中层集群之间的邻近度;
[0092]
根据邻近度最小的第二预设数量对中层集群进行集群合并。
[0093]
具体的,本发明实施例中的第二预设数量可以进行自主设定,当将其设置为大于1的数量时,那么便可以同时对两个以上的集群进行合并,合并效率较高,提高了聚类速度以及效率,本发明实施例不对其具体数值进行限定。
[0094]
作为一种优选的实施例,根据邻近度最小的第二预设数量对中层集群进行集群合并包括:
[0095]
将邻近度最小的第二预设数量对中层集群中,存在交集的所有中层集群对合并为一个中层集群;
[0096]
将邻近度最小的第二预设数量对中层集群中,不存在交集的中层集群对单独合并为一个中层集群。
[0097]
具体的,考虑到在对大于一对的中层集群对进行合并时,待合并的中层集群对中可能会存在交集,例如第二预设数量为2时,待合并的中层集群对包括(1,2)以及(2,4),由于两个中层集群对存在交集,那么便可以将这两个中层集群对中的三个集群同时合并为一个集群,从而进一步地提高了合并效率。
[0098]
作为一种优选的实施例,判断最后一次合并聚类后的多个集群是否满足预设迭代截止条件具体为:
[0099]
判断最后一次合并聚类后的多个集群中最小的集群间距是否小于预设阈值;
[0100]
则根据邻近度最小的第二预设数量对中层集群进行集群合并之后,判断最后一次合并聚类后的多个集群中最小的集群间距是否小于预设阈值之前,该非侵入式负荷用电信息的聚类方法还包括:
[0101]
更新每个合并后得到的中层集群的集群中心,以便通过其计算集群间距。
[0102]
具体的,考虑到在合并聚类过程中,如果过分合并那么势必会导致各个集群之间的距离过小,此时便属于聚类过度的情况,为了防止该种情况的发生,本发明实施例中将预设迭代截止条件设定为:最后一次合并聚类后的多个集群中最小的集群间距小于预设阈值,可以防止聚类过度。
[0103]
当然,除了该条件外,预设迭代截止条件还可以为其他类型,例如可以为最后一次合并聚类后的集群数量小于预设数值等,本发明实施例在此不做限定。
[0104]
作为一种优选的实施例,更新每个合并后得到的中层集群的集群中心具体为:
[0105][0106]
其中,c
new
(t)为合并后得到的某个中层集群的第t个特征值,n
u
表示第u个集群内的对象数,u∈[1,q],q为用于合并该新集群的中层集群的总数,q∈[2,2f],f为第二预设数量,c
u
(t)表示第u个集群中所有对象的第t个特征的均值。
[0107]
具体的,本发明实施例中更新合并集群的集群中心的过程较为简单,计算量较少,提高了聚类速度与效率。
[0108]
当然,除了该方式外,更新合并集群的集群中心还可以通过其他方式实现,本发明实施例在此不做限定。
[0109]
作为一种优选的实施例,计算每两个中层集群之间的邻近度具体为:
[0110]
计算每两个中层集群之间的欧氏距离。
[0111]
具体的,欧式距离的计算方式比较简单高效。
[0112]
其中,计算每两个中层集群之间的欧氏距离的过程可以为:
[0113][0114]
其中,c
i
,c
j
为两个不同中层集群的集群中心。
[0115]
当然,除了欧式距离外,还可以用其他距离表示每两个中层集群之间的邻近度,本发明实施例在此不做限定。
[0116]
作为一种优选的实施例,第一预设数量具体为:
[0117][0118]
其中,m为第一预设数量,n为采集序列中的对象总数。
[0119]
具体的,本发明实施例中第一预设数量具体为对进行相上取整,能够得到较为合理的m的取值。
[0120]
当然,除了该方式外,第一预设数量的确定方式还可以为其他具体形式,本发明实施例在此不做限定。
[0121]
请参考图2,图2为本发明还提供的一种非侵入式负荷用电信息的聚类装置的结构示意图,该非侵入式负荷用电信息的聚类装置包括:
[0122]
获取模块1,用于获取目标电器的用电信息的采集序列;
[0123]
预划分模块2,用于采用kmeans聚类算法将采集序列中的所有对象预先划分为第一预设数量个中层集群;
[0124]
合并模块3,用于通过凝聚层次聚类方法对所有的中层集群进行合并聚类;
[0125]
判断模块4,用于判断最后一次合并聚类后的多个集群是否满足预设迭代截止条件,若是,则触发终止模块5,若否,则触发循环模块6;
[0126]
终止模块5,用于停止迭代;
[0127]
循环模块6,用于将最后一次合并聚类后的多个集群作为中层集群并执行通过凝聚层次聚类方法对所有的中层集群进行合并聚类的步骤。
[0128]
对于本发明实施例提供的非侵入式负荷用电信息的聚类装置的介绍请参照前述的非侵入式负荷用电信息的聚类方法的实施例,本发明实施例在此不再赘述。
[0129]
请参考图3,图3为本发明还提供的一种非侵入式负荷用电信息的聚类设备的结构示意图,该非侵入式负荷用电信息的聚类设备包括:
[0130]
存储器7,用于存储计算机程序;
[0131]
处理器8,用于执行计算机程序时实现如前述实施例中非侵入式负荷用电信息的聚类方法的步骤。
[0132]
对于本发明实施例提供的非侵入式负荷用电信息的聚类设备的介绍请参照前述的非侵入式负荷用电信息的聚类方法的实施例,本发明实施例在此不再赘述。
[0133]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一
个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0134]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1