一种面向不均衡电力数据的蒸馏集成模式感知算法及系统

文档序号:31053612发布日期:2022-08-06 09:36阅读:来源:国知局

技术特征:
1.一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,包括如下步骤:s1:采用基于dgs的过采样技术,对存在态势分布不均衡的电力数据进行态势空间重构处理;s2:采用模型压缩技术,并结合ln机制和attention机制,构建基于clstm神经网络的电力数据深度学习模式感知模型;s3:提出蒸馏式集成学习策略并进行优化,解决基学习机集群的冗余问题。2.根据权利要求1所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述步骤s1具体包括如下步骤:s11:判别少数类日负荷序列样本,设日负荷序列样本集为d,按负荷模式类别差异划分为m类样本子集{d
m
|m=1,

,m},若样本子集d
m
的样本数量小于最大样本子集数量的1/5,则判定该类负荷样本子集为少数类,对其进行样本合成,得到少数类样本集d
m
;s12:对少数类样本集d
m
实施dbscan聚类,得到若干聚类簇{d
m,c
|c=1,

,c},并记录各聚类簇的聚类中心样本s13:记录dbscan聚类后每个聚类簇d
m,c
的密度直接可达图g(d
m,c
,ρ,κ);s14:计算各聚类簇的样本数目分布比例,按比例在各聚类簇中合成新样本;s15:搜索采样路径,每次合成新样本时在聚类簇d
m,c
随机选定一个真实样本x
r
,在g(d
m,c
,ρ,κ)中采用dijkstra算法搜索x
r
到聚类中心的最短加权图路径,其中其中和表示x
r
到聚类中心最短加权图路径经过的样本点,表示直接密度可达,将作为本次的采样路径;s16:进行新样本合成,在中随机选择一段直接密度可达边作为本次的采样区间,在采样区间内设定插值距离另其服从均匀分布:随机生成插值坐标θ:为增强合成样本的多样性,对θ添加一随机扰动向量o,o的每一维度均服从如下正态分布:式中σ表示相对标准差,最后生成本次的新样本,表示如下:s17:重复步骤s15-s16,直到少数类样本总数目达到最大样本子集数目的1/5。3.根据权利要求1所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征
在于,所述步骤s2具体包括如下步骤:s21:对lstm单元进行改进,改进后的lstm单元通过对网络参数降维投影来缩减模型参数规模;s22:利用ln层对神经网络层参数进行归一化处理;s23:attention层的输入为lstm网络层所有时间步的输出列向量根据对队列任务的贡献程度分配注意力权值参数。4.根据权利要求1所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于:在步骤s3中,所述蒸馏式集成学习策略,通过最小正则化经验风险函数来确定基学习机在分类决策中的权重系数ω,其基本目标函数由经验风险项和正则项构成,表示如下:γ(ω)=λl(ω)+p(ω)其中,l(ω)表示经验风险项,p(ω)表示正则项,λ为超参数。5.根据权利要求4所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述经验风险项的构建过程如下:令ω=[ω1,


n
]
t
,表示基学习机集群{h1,

h
n
}的权重系数,则集成基学习机决策模型对样本x
i
的分类结果表示如下:的分类结果表示如下:基于上式,定义集成边界m(x
i
):其中,y
i
为样本标签,m(x
*
)∈{1,-1},当分类正确时为1,分类错误时为-1,基于集成边界,定义集成基学习机决策模型下所有样本的经验风险函数l:对经验风险函数l进行优化,得到的经验风险函数l表示如下:6.根据权利要求5所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于:在对经验风险函数l进行优化时,采用代理损失优化方法,将改进huber函数作为l的代理优化函数,表示如下:
其中,参数δ用于调节函数对噪声样本的敏感性,按经验设为0.65。7.根据权利要求4所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述正则项的构建过程如下:将基学习机h
k
和h
p
对训练集的分类结果组织为向量形式,计算其互信息系数表示两基学习机学习结果的相似程度,公式表示如下:其中,p(*,*)表示两变量的联合概率分布,p(*)表示变量的边缘概率,v表示基学习机{h}对训练集{x}的分类决策结果,其矩阵表达为:其中,n表示训练集样本总数目,将基学习机h
k
与其他基学习机的互信息系数均值作为该基学习机的冗余度,表示如下:其中,ω
k
表示基学习机集合,定义基学习机h
k
的贡献度,表示如下:s(h
k
)=i(h
k
,y)-r(h
k
)其中,y为训练集标签样本的标签向量,将s(h
k
)作为惩罚因子带入正则项,贡献度低的基学习机s(h
k
)越大,被萃取的几率越小,计及基学习机贡献度的正则项p构建如下:p=ω
t
s-1
ω其中,s=diag[s(h1),

,s(h
n
)]。8.根据权利要求4所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述步骤s3具体为:基于蒸馏式集成学习策略,构建蒸馏式集成优化模型,采用多数投票法集成clstm分类模型,解决基学习机集群的冗余问题。9.根据权利要求8所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述采用多数投票法集成clstm分类模型的具体步骤为:将clstm分类模型,通过标签样本集训练生成基分类器池,经过蒸馏式集成学习策略萃取去冗余后的clstm基学习机子
集群,通过多数投票法对各基学习机的分类结果融合决策,得到最终分类结果。10.一种面向不均衡电力数据的蒸馏集成模式感知系统,其特征在于:所述蒸馏集成模式感知系统被应用于权利要求1-9中任一项权利要求所述的算法中,所述蒸馏集成模式感知系统包括压缩深度学习机,所述压缩深度学习机采用clstm分类模型,所述clstm分类模型包括依次级联的数据预处理模块、改进lstm层、ln层、relu非线性层、attention层以及softmax层,并通过softmax层决策输出分类结果,表征数据样本隶属于各类别标签的概率。

技术总结
本发明涉及一种面向不均衡电力数据的蒸馏集成模式感知算法,包括如下步骤:S1:采用基于DGS的过采样技术,对存在态势分布不均衡的电力数据进行态势空间重构处理;S2:采用模型压缩技术,并结合LN机制和Attention机制,构建基于CLSTM神经网络的电力数据深度学习模式感知模型;S3:提出蒸馏式集成学习策略并进行优化,解决基学习机集群的冗余问题。本发明具有算法效能稳定、效率高、规模小的特点,同时能够解决基学习机集群的冗余问题。解决基学习机集群的冗余问题。解决基学习机集群的冗余问题。


技术研发人员:韩丁 白宏坤 王世谦 王圆圆 李秋燕 宋大为 卜飞飞 华远鹏 王涵 贾一博 刘洋
受保护的技术使用者:四川大学 国家电网有限公司
技术研发日:2022.03.31
技术公布日:2022/8/5
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1