本技术涉及智能电网大数据,特别是涉及一种用户聚类方法、装置、设备、存储介质和程序产品。
背景技术:
1、在电力系统中,基于用户的用电负荷曲线来对用户进行聚类对于用电负荷分析和优化具有重要意义。目前,对用户进行聚类的前提是使用统计分析或聚类算法处理各用户的用电负荷曲线,从而确定聚类数目。也就是说,相关技术中在对用户进行聚类时,需要预先确定聚类数目。
2、但是,由于用户数量的海量性以及用电负荷曲线的多样性,用户的用电负荷曲线类别和数量通常是未知的,预先确定聚类数目的难度太大,且预先确定的聚类数目也不一定合适,导致相关技术中对用户的聚类效果不好。因此,亟需提供一种能够提高用户聚类准确性的用户聚类方法。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高用户聚类准确性的用户聚类方法、装置、设备、存储介质和程序产品。
2、第一方面,本技术提供了一种用户聚类方法。该方法包括:
3、根据待聚类用户在历史时间段内对应的历史负荷曲线,确定历史负荷曲线属于初始高斯混合模型中各概率分布函数的子概率值,并根据历史负荷曲线对应各概率分布函数的子概率值,对初始高斯混合模型包含的概率分布函数进行调整,得到目标高斯混合模型;
4、根据待聚类用户对应的历史负荷曲线属于目标高斯混合模型中各概率分布函数的子概率值,确定待聚类用户对应的目标负荷曲线;
5、根据待聚类用户对应的目标负荷曲线,对待聚类用户进行聚类,并根据聚类后各类用户对应的贝叶斯信息准则值,判断聚类后的各类用户是否均达到聚类结束条件;
6、若是,则获取对待聚类用户的聚类结果。
7、在其中一个实施例中,根据待聚类用户在历史时间段内对应的历史负荷曲线,确定历史负荷曲线属于初始高斯混合模型中各概率分布函数的子概率值,包括:
8、根据待聚类用户在历史时间段内对应的历史负荷曲线,确定历史负荷曲线属于初始高斯混合模型的概率密度值;
9、根据待聚类用户的历史负荷曲线对应的概率密度值,以及初始高斯混合模型包含的各概率分布函数的权重,确定历史负荷曲线属于初始高斯混合模型中各概率分布函数的子概率值。
10、在其中一个实施例中,根据历史负荷曲线对应各概率分布函数的子概率值,对初始高斯混合模型包含的概率分布函数进行调整,得到目标高斯混合模型,包括:
11、根据待聚类用户的历史负荷曲线对应各概率分布函数的子概率值,确定待聚类用户的历史负荷曲线在各概率分布函数下对应的总风险值;
12、判断总风险值是否小于风险阈值;
13、若是,则将总风险值对应的初始高斯混合模型作为目标高斯混合模型;
14、若否,则对初始高斯混合模型包含的概率分布函数进行调整,并基于调整后的初始高斯混合模型返回执行根据待聚类用户在历史时间段内对应的历史负荷曲线,确定历史负荷曲线属于初始高斯混合模型中各概率分布函数的子概率值的操作。
15、在其中一个实施例中,历史负荷曲线包含至少两个子曲线段;根据待聚类用户对应的历史负荷曲线属于目标高斯混合模型中各概率分布函数的子概率值,确定待聚类用户对应的目标负荷曲线,包括:
16、根据待聚类用户的各子曲线段属于目标高斯混合模型中各概率分布函数的子概率值,从待聚类用户的各子曲线段中,确定每一概率分布函数对应的典型负荷曲线;
17、根据待聚类用户的各子曲线段属于目标高斯混合模型中各概率分布函数的子概率值,确定待聚类用户的各子曲线段对应的典型负荷曲线;
18、根据待聚类用户的各子曲线段对应的典型负荷曲线,从各概率分布函数对应的典型负荷曲线中,确定待聚类用户的目标负荷曲线。
19、在其中一个实施例中,判断聚类后的各类用户是否均达到聚类结束条件之后,还包括:
20、将未达到聚类结束条件的各类用户分别作为待聚类用户,返回执行对待聚类用户进行聚类的操作。
21、在其中一个实施例中,根据聚类后各类用户对应的贝叶斯信息准则值,判断聚类后的各类用户是否均达到聚类结束条件,包括:
22、判断本轮次聚类后各类用户的贝叶斯信息准则值中是否均不存在小于历史最小贝叶斯信息准则值的目标贝叶斯信息准则值;其中,历史最小贝叶斯信息准则值为历史轮次聚类得到的各类用户的贝叶斯信息准则值中的最小贝叶斯信息准则值;
23、若是,则确定聚类后的各类用户均达到聚类结束条件;
24、若否,则确定存在小于历史最小贝叶斯信息准则值的目标贝叶斯信息准则值对应类的用户未达到聚类结束条件。
25、在其中一个实施例中,该方法还包括:
26、获取待聚类用户在历史时间段内各单位时段对应的单位负荷曲线;
27、对待聚类用户对应的各单位负荷曲线进行降负荷处理,得到待聚类用户在历史时间段内对应的历史负荷曲线。
28、第二方面,本技术还提供了一种用户聚类装置。该装置包括:
29、目标模型确定模块,用于根据待聚类用户在历史时间段内对应的历史负荷曲线,确定历史负荷曲线属于初始高斯混合模型中各概率分布函数的子概率值,并根据历史负荷曲线对应各概率分布函数的子概率值,对初始高斯混合模型包含的概率分布函数进行调整,得到目标高斯混合模型;
30、目标曲线确定模块,用于根据待聚类用户对应的历史负荷曲线属于目标高斯混合模型中各概率分布函数的子概率值,确定待聚类用户对应的目标负荷曲线;
31、聚类结束判断模块,用于根据待聚类用户对应的目标负荷曲线,对待聚类用户进行聚类,并根据聚类后各类用户对应的贝叶斯信息准则值,判断聚类后的各类用户是否均达到聚类结束条件;
32、聚类结果获取模块,用于若是,则获取对待聚类用户的聚类结果。
33、第三方面,本技术还提供了一种计算机设备。该计算机设备包括存储器和处理器,该存储器存储有计算机程序,该处理器执行该计算机程序时实现以下步骤:
34、根据待聚类用户在历史时间段内对应的历史负荷曲线,确定历史负荷曲线属于初始高斯混合模型中各概率分布函数的子概率值,并根据历史负荷曲线对应各概率分布函数的子概率值,对初始高斯混合模型包含的概率分布函数进行调整,得到目标高斯混合模型;
35、根据待聚类用户对应的历史负荷曲线属于目标高斯混合模型中各概率分布函数的子概率值,确定待聚类用户对应的目标负荷曲线;
36、根据待聚类用户对应的目标负荷曲线,对待聚类用户进行聚类,并根据聚类后各类用户对应的贝叶斯信息准则值,判断聚类后的各类用户是否均达到聚类结束条件;
37、若是,则获取对待聚类用户的聚类结果。
38、第四方面,本技术还提供了一种计算机可读存储介质。该计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以下步骤:
39、根据待聚类用户在历史时间段内对应的历史负荷曲线,确定历史负荷曲线属于初始高斯混合模型中各概率分布函数的子概率值,并根据历史负荷曲线对应各概率分布函数的子概率值,对初始高斯混合模型包含的概率分布函数进行调整,得到目标高斯混合模型;
40、根据待聚类用户对应的历史负荷曲线属于目标高斯混合模型中各概率分布函数的子概率值,确定待聚类用户对应的目标负荷曲线;
41、根据待聚类用户对应的目标负荷曲线,对待聚类用户进行聚类,并根据聚类后各类用户对应的贝叶斯信息准则值,判断聚类后的各类用户是否均达到聚类结束条件;
42、若是,则获取对待聚类用户的聚类结果。
43、第五方面,本技术还提供了一种计算机程序产品。该计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
44、根据待聚类用户在历史时间段内对应的历史负荷曲线,确定历史负荷曲线属于初始高斯混合模型中各概率分布函数的子概率值,并根据历史负荷曲线对应各概率分布函数的子概率值,对初始高斯混合模型包含的概率分布函数进行调整,得到目标高斯混合模型;
45、根据待聚类用户对应的历史负荷曲线属于目标高斯混合模型中各概率分布函数的子概率值,确定待聚类用户对应的目标负荷曲线;
46、根据待聚类用户对应的目标负荷曲线,对待聚类用户进行聚类,并根据聚类后各类用户对应的贝叶斯信息准则值,判断聚类后的各类用户是否均达到聚类结束条件;
47、若是,则获取对待聚类用户的聚类结果。
48、上述用户聚类方法、装置、设备、存储介质和程序产品,根据待聚类用户在历史时间段内对应的历史负荷曲线,确定历史负荷曲线属于初始高斯混合模型中各概率分布函数的子概率值,从而确定目标高斯混合模型。由于目标高斯混合模型中包含的概率分布函数都是基于历史负荷曲线属于初始高斯混合模型中各概率分布函数的子概率值确定的,所以,加入确定目标高斯混合模型的步骤可以使得后续确定出的待聚类用户对应的目标负荷曲线更加有代表性。之后,由于各待聚类用户仅对应一个目标负荷曲线,而不是对应所有历史负荷曲线,可以提高对待聚类用户进行聚类的效率。另外,在对待聚类用户进行聚类的过程中无需提前预设聚类数目,而是通过计算各类用户对应的bic来判断是否达到聚类结束条件,当各类用户对应的bic达到结束条件时即可确定出聚类结果(包括聚类数目和各类用户),可以使得对待聚类用户的聚类效果更好,准确性更高。