本发明涉及数据安全,尤其是指一种电力计量数据安全风险评估方法及装置。
背景技术:
1、随着新型电力系统构建不断深入,电力计量数据作为各项电力业务开展的基石,直接决定着电力项目的运行效率。然而,随着电力终端数量的逐步上升和电力业务的多样化拓展,电力计量数据的积累呈现高储备趋势。为有效利用电力计量数据,智能监测终端、集中器等设备以一定时间间隔及时将采集到的电力计量数据周期性上传至服务器进行处理,为电力系统各项业务的高效运行提供支撑。然而,由于海量电力计量数据的迸发以及通信过程中潜在的各项安全威胁,电力计量数据的传输与利用面临着新的挑战。因此,迫切需要设计一种电力计量数据安全风险评估与主动防御方法,当服务器接收到新的电力计量数据时,可以高效判断当前电力计量数据存在的安全风险类型,并基于工作人员实际反馈结果进一步完善评估机制,提高安全风险评估效率。
2、目前,已有一些针对数据安全风险评估与主动防御的研究。例如公开号为cn115841253a的专利“一种考虑多维度指标的能源安全风险评估方法及系统”中,基于供应安全维度、使用安全维度、环境安全维度和经济安全维度,构建了多维度安全风险评估指标体系,其次,还构建了自编码器-bp神经网络-熵权topsis融合的安全风险评估模型,并基于所述多维度指标体系测算能源分项评价指数,最后基于测算结果,采用改进最大熵模型对能源系统安全风险进行多维度、全方面的分析评估。又如公开号为cn106357636a的专利“一种针对智慧能源终端数据安全模型的预测方法”中,根据安全风险评估的目标,实时获取智慧能源终端采集的数据集,并对数据集完成安全风险评估的数据融合,获得异常态势数据;其次,对感知的异常态势数据及逆行态势指标计算,判断所述指标是否超过预先设定的安全阈值,一旦超过预先设定的安全阈值,则识别为异常行为元件;最后,根据异常行为元件的识别结果确定安全风险应对策略和安全裕度调整策略。然而,这些方法中仍然存在以下两个问题:一是未考虑对原始数据的学习聚类分析,导致用于安全风险评估的数据存在过多冗余,特征不够明显,极大地降低了安全风险评估与主动防御的效率与准确性。二是未考虑数据安全风险评估置信界,仅仅依据单一的评估结果对数据安全分析风险进行分析,导致安全风险评估准确性与主动防御效果较差。
3、综上所述,现有的电力计量数据安全风险评估方法存在评估效率与评估准确性低的问题。
技术实现思路
1、为此,本发明所要解决的技术问题在于克服现有技术中安全风险评估方法存在评估效率与评估准确性低的问题。
2、为解决上述技术问题,本发明提供了一种电力计量数据安全风险评估方法,包括:
3、获取电力计量数据集,并计算所述电力计量数据集中每条电力计量数据的特征,得到第一特征向量集合;其中,所述电力计量数据的特征包括但不限于所述电力计量数据的平均值、方差、离群点数;
4、利用exp3-聚类算法对所述第一特征向量集合进行聚类,输出电力计量数据簇集以及所述电力计量数据簇集中的电力计量数据簇对应的聚类权重;
5、将所述电力计量数据簇集中的电力计量数据簇分别输入至第一卷积神经网络中,得到所述电力计量数据簇集中每个电力计量数据簇的第二特征向量;
6、将所述第二特征向量与所述电力计量数据簇对应的聚类权重、预设安全风险评估上置信界组合得到第一目标特征向量,并将所述第一目标特征向量输入至第二卷积神经网络中,得到电力计量数据簇的安全风险评估上置信界向量;其中,安全风险评估上置信界为电力计量数据簇存在安全风险的概率上限;
7、将所述第二特征向量与所述电力计量数据簇对应的聚类权重、预设安全风险评估下置信界组合得到第二目标特征向量,并将所述第二目标特征向量输入至第三卷积神经网络中,得到电力计量数据簇的安全风险评估下置信界向量;其中,安全风险评估下置信界为电力计量数据簇存在安全风险的概率下限;
8、基于所述电力计量数据簇的安全风险评估上置信界向量与所述电力计量数据簇的安全风险评估下置信界向量计算电力计量数据簇安全风险评估结果。
9、在本发明的一个实施例中,所述利用exp3-聚类算法对所述第一特征向量集合进行聚类,输出电力计量数据簇集以及所述电力计量数据簇集中的电力计量数据簇对应的聚类权重包括:
10、将所述第一特征向量集合中至少两个特征向量作为聚类中心向量,并将所述第一特征向量集合中聚类中心向量以外的第一特征向量划分为以所述聚类中心向量为中心的电力计量数据簇,得到电力计量数据簇集;
11、分别计算所述电力计量数据簇集中每个电力计量数据簇的误差平方和以及误差平方和权重,并基于所述每个电力计量数据簇的误差平方和以及误差平方和权重计算所述电力计量数据簇集的加权误差平方和;
12、判断所述加权误差平方和与加权误差平方和预设阈值的大小;
13、若所述加权误差平方和大于等于所述加权误差平方和预设阈值,则更新相对聚类收益;
14、其中,所述相对聚类收益的更新公式为:
15、,
16、其中,为更新前的相对聚类收益,为电力计量数据簇集中每个电力计量数据簇的误差平方和,为电力计量数据簇集的加权误差平方和,表示折中因子,[0,1],表示电力计量数据簇集中的电力计量数据簇数量;
17、计算所述电力计量数据簇集中各个电力计量数据簇之间的第一相关性,将第一相关性小于相关性预设阈值的电力计量数据簇合并为一个新的电力计量数据簇;
18、计算所述电力计量数据簇集中每个电力计量数据簇内的第二相关性,将第二相关性小于相关性预设阈值的电力计量数据簇分为两个新的电力计量数据簇;
19、基于所述新的电力计量数据簇得到新的电力计量数据簇集,并计算所述新的电力计量数据簇集的加权误差平方和,直到所述加权误差平方和小于所述加权误差平方和预设阈值;
20、输出当前电力计量数据簇集,并将当前电力计量数据簇集中的电力计量数据簇的误差平方和权重作为电力计量数据簇对应的聚类权重。
21、在本发明的一个实施例中,所述电力计量数据簇集中每个电力计量数据簇的误差平方和的计算公式为:
22、,
23、其中,为第个电力计量数据簇包含的第一特征向量个数,为第一特征向量,表示第个电力计量数据簇,表示第个电力计量数据簇的聚类中心向量,表示推理关系;
24、所述电力计量数据簇集中每个电力计量数据簇的误差平方和权重的计算公式为:
25、,
26、其中,为电力计量数据簇集包含的第一特征向量个数;
27、所述电力计量数据簇集的加权误差平方和的计算公式为:
28、。
29、在本发明的一个实施例中,所述电力计量数据簇的安全风险评估上置信界向量为:
30、,
31、其中,为电力计量数据簇存在第种安全风险的概率上置信界;
32、所述电力计量数据簇的安全风险评估下置信界向量为:
33、,
34、其中,为电力计量数据簇存在第种安全风险的概率下置信界;
35、所述电力计量数据簇安全风险评估结果为:
36、,
37、其中,为电力计量数据簇对应的第种安全风险的预设权重,表示电力计量数据簇存在的安全风险种类。
38、在本发明的一个实施例中,所述基于所述电力计量数据簇的安全风险评估上置信界向量与所述电力计量数据簇的安全风险评估下置信界向量计算电力计量数据簇安全风险评估结果后还包括:
39、将所述电力计量数据簇安全风险评估结果与电力计量数据安全风险预设阈值进行比较;
40、若所述电力计量数据簇安全风险评估结果大于等于所述电力计量数据安全风险预设阈值,则触发主动防御。
41、在本发明的一个实施例中,所述若所述电力计量数据簇安全风险评估结果大于等于所述电力计量数据安全风险预设阈值,则触发主动防御包括;
42、根据所述电力计量数据簇存在第种安全风险的概率上置信界与所述电力计量数据簇存在第种安全风险的概率下置信界计算所述电力计量数据簇存在第种安全风险的概率;
43、将所述电力计量数据簇存在第种安全风险的概率与电力计量数据第种安全风险主动防御预设阈值进行比较;
44、若所述电力计量数据簇存在第种安全风险的概率大于所述电力计量数据第种安全风险主动防御预设阈值,则利用电力计量数据簇第种安全风险主动防御方案进行防御,并将所述电力计量数据簇第种安全风险主动防御方案保存至电力计量数据安全风险主动防御方案库。
45、在本发明的一个实施例中,利用电力计量数据簇第种安全风险主动防御方案进行防御后还包括:
46、构建电力计量数据簇的安全风险评估上置信界目标向量和电力计量数据簇的安全风险评估下置信界目标向量;
47、基于所述电力计量数据簇的安全风险评估上置信界向量、所述电力计量数据簇的安全风险评估下置信界向量、所述电力计量数据簇的安全风险评估上置信界目标向量和所述电力计量数据簇的安全风险评估下置信界目标向量构建电力计量数据安全风险评估损失函数;
48、基于所述电力计量数据安全风险评估损失函数,采用梯度下降法调整所述第一卷积神经网络、所述第二卷积神经网络和所述第三卷积神经网络的参数。
49、在本发明的一个实施例中,所述电力计量数据簇的安全风险上置信界目标向量为:
50、,
51、其中,为电力计量数据簇存在第种安全风险的目标概率上置信界;
52、所述电力计量数据簇的安全风险评估下置信界目标向量为:
53、,
54、其中,为电力计量数据簇存在第种安全风险的目标概率下置信界;
55、所述电力计量数据安全风险评估损失函数为:
56、,
57、其中,表示电力计量数据簇存在的安全风险种类。
58、在本发明的一个实施例中,所述基于所述电力计量数据安全风险评估损失函数,采用梯度下降法调整所述第一卷积神经网络、所述第二卷积神经网络和所述第三卷积神经网络的参数包括:
59、根据所述电力计量数据安全风险评估损失函数调整所述第一卷积神经网络、所述第二卷积神经网络和所述第三卷积神经网络中的参数,其调整公式为:
60、,
61、其中,为调整后第一卷积神经网络、第二卷积神经网络和第三卷积神经网络的参数,为当前第一卷积神经网络、第二卷积神经网络和第三卷积神经网络的参数,为当前第一卷积神经网络、第二卷积神经网络和第三卷积神经网络的学习速率;
62、,
63、其中,为调整后第一卷积神经网络、第二卷积神经网络和第三卷积神经网络的学习速率,为电力计量数据安全风险评估次数,为第次电力计量数据安全风险评估时第一卷积神经网络、第二卷积神经网络和第三卷积神经网络的学习速率,为梯度方向指示因子,若卷积神经网络参数在两次调整过程中梯度下降方向相同,则;若卷积神经网络参数在两次调整过程中梯度下降方向相反,则;为当前学习速率置信界;
64、,
65、其中,为调整后的学习速率置信界,为学习速率置信界调整因子。
66、在本发明的一个实施例中,调整所述第一卷积神经网络、所述第二卷积神经网络和所述第三卷积神经网络的参数后还包括:
67、根据所述电力计量数据簇的安全风险评估上置信界向量、所述电力计量数据簇的安全风险评估下置信界向量、所述电力计量数据簇的安全风险评估上置信界目标向量和所述电力计量数据簇的安全风险评估下置信界目标向量更新安全风险评估上置信界和安全风险评估下置信界,以便进行下一次电力计量数据安全风险评估;
68、其中,更新后的电力计量数据安全风险评估上置信界为:
69、,
70、更新后的电力计量数据安全风险评估下置信界为:
71、。
72、本发明还提供了一种电力计量数据安全风险评估装置,包括:
73、数据获取及特征计算模块,用于获取电力计量数据集,并计算所述电力计量数据集中每条电力计量数据的特征,得到第一特征向量集合;其中,所述电力计量数据的特征包括但不限于所述电力计量数据的平均值、方差、离群点数;
74、聚类模块,用于利用exp3-聚类算法对所述第一特征向量集合进行聚类,输出电力计量数据簇集以及所述电力计量数据簇集中的电力计量数据簇对应的聚类权重;
75、第一特征提取模块,用于将所述电力计量数据簇集中的电力计量数据簇分别输入至第一卷积神经网络中,得到所述电力计量数据簇集中每个电力计量数据簇的第二特征向量;
76、第二特征提取模块,用于将所述第二特征向量与所述电力计量数据簇对应的聚类权重、预设安全风险评估上置信界组合得到第一目标特征向量,并将所述第一目标特征向量输入至第二卷积神经网络中,得到电力计量数据簇的安全风险评估上置信界向量;其中,安全风险评估上置信界为电力计量数据簇存在安全风险的概率上限;
77、第三特征提取模块,用于将所述第二特征向量与所述电力计量数据簇对应的聚类权重、预设安全风险评估下置信界组合得到第二目标特征向量,并将所述第二目标特征向量输入至第三卷积神经网络中,得到电力计量数据簇的安全风险评估下置信界向量;其中,安全风险评估下置信界为电力计量数据簇存在安全风险的概率下限;
78、计算模块,用于基于所述电力计量数据簇的安全风险评估上置信界向量与所述电力计量数据簇的安全风险评估下置信界向量计算电力计量数据簇安全风险评估结果。
79、本发明所述的电力计量数据安全风险评估方法包括:获取电力计量数据集并计算得到该数据集中每条电力计量数据的第一特征向量,组成第一特征向量集合;使用exp3-聚类算法对该第一特征向量集合进行聚类分析得到电力计量数据簇集和聚类权重,降低了电力计量数据冗余,使得用于电力计量数据安全风险评估的数据特征更加明显,以此提高安全风险评估的效率和准确性;将电力计量数据簇集中的数据簇分别输入第一卷积神经网络得到对应的第二特征向量,并将该第二特征向量、聚类权重分别与安全风险评估上置信界和下置信界组合得到第一目标特征向量和第二目标特征向量,分别提取第一目标特征向量和第二目标特征向量的特征,得到安全风险评估上置信界向量和安全风险评估下置信界向量,并基于安全风险评估上置信界向量和安全风险评估下置信界向量得到电力计量数据簇的安全风险评估结果。通过设置安全风险评估上置信界和下置信界,充分考虑了电力计量数据存在安全风险的概率上下限,使得对电力计量数据进行安全风险评估时的依据更为丰富,提高了电力计量数据安全风险评估的准确性。