一种基于图学习的虚拟电厂用户敏感数据识别方法及装置与流程

文档序号:33390367发布日期:2023-03-08 10:32阅读:25来源:国知局
一种基于图学习的虚拟电厂用户敏感数据识别方法及装置与流程

1.本发明涉及电力数据安全技术领域,具体涉及一种基于图学习的虚拟电厂用户敏感数据识别方法及装置。


背景技术:

2.在能源互联网蓬勃发展的大环境下,能源系统中出现大量产消者,大量分布式资源的随机性和波动性增加了电网复杂性和管控难度,对电网的安全、可靠和经济运行产生重大影响。复杂虚拟电厂技术利用先进的传感、控制技术,有效地聚合和调度新能源发电、储能等分布式资源,在参与辅助服务市场获取收益的同时,为电网提供灵活性,提升电网安全水平,降低电网运行成本与投资成本,是多能流综合能量管理系统中的重要模块。
3.因此,复杂虚拟电厂用户数据的安全保护成为国网数据安全防护工作的重要基础。随着各类数据保护法的发布,明确提出了数据识别要求。近年来,电网公司围绕数据识别积极做出一系列初步探索,初步形成了识别方法和实践操作基础。但同时,目前识别工作主要依赖人工方式,存在着效率低、准确性差且难以落地等诸多问题。
4.复杂虚拟电厂用户数据呈现体量大、类型多和涉密程度高等特点,包含大量对国家、社会及公司利益造成影响的商密数据和个人信息数据。为更好理清重要数据、明确数据风险、强化数据安全防护,近年来电力行业围绕复杂虚拟电厂用户敏感数据识别积极做出一系列初步探索,先后发布各类文件,提出了电力数据识别总体要求,并基于数据表、字段描述,通过人工梳理方式,发布了共享负面清单目录,推进电力数据内部共享融通。
5.因此,如何同时满足复杂虚拟电厂用户敏感数据快速识别的需求,是复杂虚拟电厂用户敏感数据识别方案目前亟待解决的关键问题。


技术实现要素:

6.有鉴于此,本发明实施例提供了涉及一种基于图学习的虚拟电厂用户敏感数据识别方法及装置,以解决现有技术中如何同时满足复杂虚拟电厂用户敏感数据快速识别的技术问题。
7.本发明提出的技术方案如下:
8.本发明实施例第一方面提供一种基于图学习的虚拟电厂用户敏感数据识别方法,包括:获取待识别用户数据;根据待识别用户数据中关键词的关系生成待识别图网络;将待识别图网络输入至预先训练的图卷积神经网络模型,得到待识别图网络对应的最小连通支配集;基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图;将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果。
9.可选地,根据待识别用户数据中关键词的关系生成待识别图网络,包括:基于词频统计对待识别用户数据进行分词处理,生成待识别用户数据对应的关键词列表;遍历待识别用户数据,提取待识别用户数据中与所述关键词列表匹配的词汇以及词汇之间的关系,
生成待识别图网络,待识别图网络包括节点和边。
10.可选地,所述图卷积神经网络模型采用如下方式训练:获取多个图网络,图网络包括节点和边;采用最小生成树普利姆算法生成每个图网络的最小连通支配集;基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,得到预先训练的图卷积神经网络模型。
11.可选地,基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,包括:采用多个图网络中每个节点的度数作为节点特征矩阵;将图网络中属于最小连通支配集的节点标记为1,不属于的节点标记为0,得到节点的标签值;基于所述节点特征矩阵和所述节点的标签值对图卷积神经网络进行训练,图卷积神经网络中采用relu作为激活函数,卷积层中包括dropout,采用对数似然函数作为损失函数。
12.可选地,基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图,包括:获取待识别图网络对应的最小连通支配集中任意两个节点;判断待识别图网络中对应两个节点之间在待识别图网络中是否存在一条边;若存在,在两个节点中加上边;重复上述步骤,直至遍历完成最小连通支配集中的所有节点,得到待识别图网络的简化图。
13.可选地,将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果,包括:计算待识别图网络的简化图和标准敏感级别数据对应的简化图的最大公共子图;计算待识别图网络的简化图和标准敏感级别数据对应的简化图中的节点个数;基于最大公共子图和节点个数中的最大值进行匹配度计算,将待识别用户数据归为匹配度最高的标准敏感级别数据对应的敏感结果。
14.可选地,计算待识别图网络的简化图和标准敏感级别数据对应的简化图的最大公共子图,包括:计算待识别图网络的简化图和标准敏感级别数据对应的简化图的共有节点;基于所述共有节点计算待识别图网络的简化图和标准敏感级别数据对应的简化图共有边;基于所述共有节点和共有边确定最大公共子图。
15.本发明实施例第二方面提供一种基于图学习的虚拟电厂用户敏感数据识别装置,包括:数据获取模块,用于获取待识别用户数据;图网络生成模块,用于根据待识别用户数据中关键词的关系生成待识别图网络;支配集生成模块,用于将待识别图网络输入至预先训练的图卷积神经网络模型,得到待识别图网络对应的最小连通支配集;简化图生成模块,用于基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图;分类分级模块,用于将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果。
16.可选地,图网络生成模块具体用于:基于词频统计对待识别用户数据进行分词处理,生成待识别用户数据对应的关键词列表;遍历待识别用户数据,提取待识别用户数据中与所述关键词列表匹配的词汇以及词汇之间的关系,生成待识别图网络,待识别图网络包括节点和边。
17.可选地,所述图卷积神经网络模型采用如下方式训练:获取多个图网络,图网络包括节点和边;采用最小生成树普利姆算法生成每个图网络的最小连通支配集;基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,得到预先训练的图卷积神经网络模型。
18.可选地,基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,
包括:采用多个图网络中每个节点的度数作为节点特征矩阵;将图网络中属于最小连通支配集的节点标记为1,不属于的节点标记为0,得到节点的标签值;基于所述节点特征矩阵和所述节点的标签值对图卷积神经网络进行训练,图卷积神经网络中采用relu作为激活函数,卷积层中包括dropout,采用对数似然函数作为损失函数。
19.可选地,简化图生成模块具体用于:获取待识别图网络对应的最小连通支配集中任意两个节点;判断待识别图网络中对应两个节点之间在待识别图网络中是否存在一条边;若存在,在两个节点中加上边;重复上述步骤,直至遍历完成最小连通支配集中的所有节点,得到待识别图网络的简化图。
20.可选地,分类分级模块具体用于:计算待识别图网络的简化图和标准敏感级别数据对应的简化图的最大公共子图;计算待识别图网络的简化图和标准敏感级别数据对应的简化图中的节点个数;基于最大公共子图和节点个数中的最大值进行匹配度计算,将待识别用户数据归为匹配度最高的标准敏感级别数据对应的敏感结果。
21.可选地,计算待识别图网络的简化图和标准敏感级别数据对应的简化图的最大公共子图,包括:计算待识别图网络的简化图和标准敏感级别数据对应的简化图的共有节点;基于所述共有节点计算待识别图网络的简化图和标准敏感级别数据对应的简化图共有边;基于所述共有节点和共有边确定最大公共子图。
22.本发明实施例第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如本发明实施例第一方面及第一方面任一项所述的基于图学习的虚拟电厂用户敏感数据识别方法。
23.本发明实施例第四方面提供一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如本发明实施例第一方面及第一方面任一项所述的基于图学习的虚拟电厂用户敏感数据识别方法。
24.本发明提供的技术方案,具有如下效果:
25.本发明实施例提供的基于图学习的虚拟电厂用户敏感数据识别方法、装置及存储介质,通过获取待识别用户数据;根据待识别用户数据中关键词的关系生成待识别图网络;将待识别图网络输入至预先训练的图卷积神经网络模型,得到待识别图网络对应的最小连通支配集;基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图;将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果。由此实现了通过图学习的方法生成最小连通支配集,降低了后续图匹配的复杂度,提高匹配速度,相比传统敏感识别方法具有更高的效率。
附图说明
26.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
27.图1是根据本发明实施例的基于图学习的虚拟电厂用户敏感数据识别方法的流程图;
28.图2是根据本发明实施例的基于图学习的虚拟电厂用户敏感数据识别装置的结构框图;
29.图3是根据本发明实施例提供的计算机可读存储介质的结构示意图;
30.图4是根据本发明实施例提供的电子设备的结构示意图。
具体实施方式
31.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
32.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
33.根据本发明实施例,提供了一种基于图学习的虚拟电厂用户敏感数据识别方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
34.在本实施例中提供了一种基于图学习的虚拟电厂用户敏感数据识别方法,可用于电子设备,如电脑、手机、平板电脑等,图1是根据本发明实施例基于图学习的虚拟电厂用户敏感数据识别方法的流程图,如图1所示,该方法包括如下步骤:
35.步骤s101:获取待识别用户数据。其中,待识别用户数据可以是复杂虚拟电厂中需要进行敏感识别的用户数据。对于待识别用户数据的获取方式和来源本发明实施例不作具体限定。
36.其中,敏感识别主要是识别数据的敏感程度或敏感程度。根据用户电力数据重要程度以及泄露后对国家安全、社会秩序、企业经营管理和公众利益造成的影响和危害程度,分为严重、高、中、低四个敏感级别。
37.步骤s102:根据待识别用户数据中关键词的关系生成待识别图网络。具体地,待识别用户数据中可能包括大量数据,为了更快速的对待识别用户数据进行敏感识别,先获取待识别用户数据中的关键词,然后以关键词作为节点,以关键词之间的上下文关系作为边,生成待识别图网络。
38.步骤s103:将待识别图网络输入至预先训练的图卷积神经网络模型,得到待识别图网络对应的最小连通支配集。具体地,通过预先训练的图卷积神经网络模型能够快速的确定待识别图网络的最小连通支配集。其中,支配集为图网络中担当着骨干节点的集合,而若支配集中的节点是可连通的,则该支配集称为连通支配集,在所有的连通支配集中,集合
中节点个数最少的连通支配集称之为最小连通支配集。
39.步骤s104:基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图。通过将待识别图网络和最小连通支配集比较,保留最小连通支配集节点之间的边,能够生成简化版的数据的图结构表示,即待识别图网络的简化图,便于进行后续的图匹配。
40.步骤s105:将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果。具体地,标准敏感级别数据具体包括根据步骤s101中的敏感级别确定的每个级别的数据。标准敏感级别数据的简化图的确定方式与待识别图网络的简化图的确定方式相同,在此不再赘述。
41.在进行匹配度计算时,计算待识别图网络的简化图和每个级别的标准敏感级别数据的简化图的匹配度,确定计算的匹配度之间的最大值,则待识别用户数据与最大值对应的标准敏感级别数据的级别相同,从而完成待识别用户数据的敏感识别。
42.本发明实施例提供的基于图学习的虚拟电厂用户敏感数据识别方法,通过获取待识别用户数据;根据待识别用户数据中关键词的关系生成待识别图网络;将待识别图网络输入至预先训练的图卷积神经网络模型,得到待识别图网络对应的最小连通支配集;基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图;将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果。由此实现了通过图学习的方法生成最小连通支配集,降低了后续图匹配的复杂度,提高匹配速度,相比传统敏感识别方法具有更高的效率。
43.在一实施方式中,根据待识别用户数据中关键词的关系生成待识别图网络,包括如下步骤:
44.步骤s201:基于词频统计对待识别用户数据进行分词处理,生成待识别用户数据对应的关键词列表。具体地,词是文本的基本信息单元,但是汉语的词语并不像英文的词语一样,汉语的词语之间没有明确的分割,选取词语需要先进行分词。而词是字的稳定组合,在上下文中,字的某一组合出现的频次越多,就越有可能是一个词。
45.为了表示某一组合出现的频次,需要计算某一字串w的似然度,用下列公式表示:
[0046][0047]
式中,wi指字串中的每个字,n是参数,表示词的字数,在三元模型中n=3,p(w)表示字串w的出现概率。
[0048]
为了计算字串w的出现概率,假设某一字wi的出现概率只与它前面两个字有关,此时得到一个三元模型:
[0049][0050]
其中p(w3|w1w2)表示在字的组合w1w2出现的条件下,下一个字的概率为w3的概率,通过如下公式计算:
[0051]
[0052]
式中,count(

)表示特定词序列在文本中出现的次数。
[0053]
由此,通过上述词频统计的方式实现了待识别用户数据的分词处理。分词结束后,取出现频率大于预设阈值的若干个词构建关键词列表。该预设阈值可以根据实际情况预先确定。
[0054]
步骤s202:遍历待识别用户数据,提取待识别用户数据中与所述关键词列表匹配的词汇以及词汇之间的关系,生成待识别图网络,待识别图网络包括节点和边。图的顶点表示词语,图的边表示词语之间的邻近关系。图的具体生成过程如下:根据上一个步骤得到的关键词列表,对待识别用户数据进行筛选,读取待识别用户数据中与关键词列表相匹配的词汇,将其提取出来放入图网络中。图网络的节点是由待识别用户数据中匹配到的关键词组成,两个相邻的关键词对应的节点直接用一条边进行连接,即节点之间的边表示关键词上下文的关系。最终得到待识别用户数据的图形式,即待识别图网络。
[0055]
在一实施方式中,所述图卷积神经网络模型采用如下方式训练:获取多个图网络,图网络包括节点和边;采用最小生成树普利姆算法生成每个图网络的最小连通支配集;基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,得到预先训练的图卷积神经网络模型。
[0056]
具体地,最小连通支配集的具体确定方式是采用最小生成树普利姆算法,将图网络中每一条边对应的两个无序节点对的度之和作为该边的权值,生成图对应的权值之和最大的最大生成树。其中,生成树表示包含连通图中所有的顶点并且任意两顶点之间有且仅有一条通路的子图。
[0057]
最小生成树普利姆算法具体计算过程如下:计算图网络中与每个节点相连的边数作为每个节点的度;计算图网络中与每条边相连的节点的度之和作为每条边的权值;从图网络中预先选取的节点出发,选择与该节点连接的边中权值最大的边,将边的另一侧相连顶点加入已选择集合;查找图网络中一个节点已被选择,另一个节点未被选择的权值最大边,将该边连接的未被选择的节点加入已选择节点集合;直至全部节点选择完毕,得到已选择节点集合作为最小连通支配集;其中预先选取的节点可以是图网络中的随机选取的任一个节点。
[0058]
在一实施方式中,基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,包括如下步骤:
[0059]
步骤s301:采用多个图网络中每个节点的度数作为节点特征矩阵。具体地,采用一维特征矩阵代替将节点度数放置在对角线上的对角矩阵作为节点特征矩阵。例如,100个节点的图对应着100x1的特征矩阵。
[0060]
步骤s302:将图网络中属于最小连通支配集的节点标记为1,不属于的节点标记为0,得到节点的标签值;通过标签值的设定,则训练的图神经卷积网络能够实现一个节点二分类问题的建模。同时由于图卷积神经网络不适用于归纳式学习,需要采用拼图的方式将训练图拼接起来。
[0061]
步骤s303:基于所述节点特征矩阵和所述节点的标签值对图卷积神经网络进行训练,图卷积神经网络中采用relu作为激活函数,卷积层中包括dropout,采用对数似然函数作为损失函数。其中,选用relu作为激活函数,目的是不会出现由于神经网络连接层增多和训练数据分布不均匀而出现的梯度消失问题;在卷积层引入dropout,避免出现过拟合现
象,以及降低图卷积神经网络的复杂度;选用对数似然函数作为损失函数,为损失引入权重,使模型在将为1的样本预测为0时产生更大的损失,而将0样本预测为1样本时产生较小的损失,以此平衡训练样本中0样本的数量的偏少。
[0062]
具体地,多个图网络可以是1000张100个节点的随机生成图,它们的最小连通支配集节点已知,并将该信息作为训练节点的标签输入图卷积神经网络。标签的值为在最小连通支配集中的点标为1,其余点标为0,则多个图网络构成了训练集。测试集是待求出最小连通支配集的图组成的集合,其图的规模和张数均任意。将测试集和训练集的邻接矩阵以及一维的节点特征矩阵分别拼接后作为模型第一层卷积的输入,乘上随机初始化的1x8维的权重矩阵w1,再经过relu激活函数,每个节点得到一个8维的特征表示。将该8维的特征表示和邻接矩阵作为第二层卷积的输入,乘上8x2维的权重矩阵w2,经激活函数激活后,每个节点得到一个2维的输出特征。拓展训练节点标签矩阵,新维的值是1减去原有维度上的值,得到一个二维矩阵。计算该二维标签矩阵和二层模型输出的训练样本对应的特征矩阵中之间的交叉熵损失,并通过0.01的学习率和0.2的dropout率反向更新权重矩阵w1和w2,直到损失值收敛。
[0063]
在一实施方式中,基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图,包括:获取待识别图网络对应的最小连通支配集中任意两个节点;判断待识别图网络中对应两个节点之间在待识别图网络中是否存在一条边;若存在,在两个节点中加上边;重复上述步骤,直至遍历完成最小连通支配集中的所有节点,得到待识别图网络的简化图。具体地,简化图的具体生成方式为,遍历最小连通支配集的节点vi和vj,如果在待识别图网络中vi和vj之间存在一条边,则在vi和vj之间加一条边。
[0064]
在一实施方式中,将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果,包括如下步骤:
[0065]
步骤s401:计算待识别图网络的简化图和标准敏感级别数据对应的简化图的最大公共子图;具体的,最大公共子图可以看做是两个简化图的交集。则最大公共子图的具体计算方式如下:
[0066]
计算待识别图网络的简化图和标准敏感级别数据对应的简化图的共有节点;确定共有节点时,分别遍历待识别图网络的简化图g和标准敏感级别数据对应的简化图g’的所有节点,若有v∈vg且v∈v
g’,则v为图g和图g’的共有节点。
[0067]
基于所述共有节点计算待识别图网络的简化图和标准敏感级别数据对应的简化图共有边;确定共有边时,遍历共有节点中的任何两个节点vi和vj,若vi和vj在图g和图g’都有一条边,则此为图g和图g’的共有边。
[0068]
基于所述共有边确定最大公共子图。确定共有边之后,则共有边对应的节点构成了最大公共子图。
[0069]
步骤s402:计算待识别图网络的简化图和标准敏感级别数据对应的简化图中的节点个数。
[0070]
步骤s403:基于最大公共子图和节点个数中的最大值进行匹配度计算,将待识别用户数据归为匹配度最高的标准敏感级别数据对应的敏感结果。
[0071]
其中,匹配度计算公式如下:
[0072][0073]
其中,mcs(g,g

)为图g与图g

的最大公共子图,|g|,|g

|分别代表图g和图g

的节点个数。
[0074]
具体地,为了对待识别用户数据进行敏感识别,则需要采用上述匹配度计算公式计算待识别图网络的简化图与每个级别对应的标准敏感级别数据的简化图的匹配度,得到多个匹配度值。然后选出多个匹配度值中的最大值,则待识别用户数据属于最大值对应的级别,从而完成待识别用户数据敏感识别。
[0075]
本发明实施例还提供一种基于图学习的虚拟电厂用户敏感数据识别装置,如图2所示,该装置包括:
[0076]
数据获取模块,用于获取待识别用户数据;具体内容参见上述方法实施例对应部分,在此不再赘述。
[0077]
图网络生成模块,用于根据待识别用户数据中关键词的关系生成待识别图网络;具体内容参见上述方法实施例对应部分,在此不再赘述。
[0078]
支配集生成模块,用于将待识别图网络输入至预先训练的图卷积神经网络模型,得到待识别图网络对应的最小连通支配集;具体内容参见上述方法实施例对应部分,在此不再赘述。
[0079]
简化图生成模块,用于基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图;具体内容参见上述方法实施例对应部分,在此不再赘述。
[0080]
分类分级模块,用于将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果。具体内容参见上述方法实施例对应部分,在此不再赘述。
[0081]
本发明实施例提供的基于图学习的虚拟电厂用户敏感数据识别装置,通过获取待识别用户数据;根据待识别用户数据中关键词的关系生成待识别图网络;将待识别图网络输入至预先训练的图卷积神经网络模型,得到待识别图网络对应的最小连通支配集;基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图;将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果。由此实现了通过图学习的方法生成最小连通支配集,降低了后续图匹配的复杂度,提高匹配速度,相比传统分类分级方法具有更高的效率。
[0082]
可选地,图网络生成模块具体用于:基于词频统计对待识别用户数据进行分词处理,生成待识别用户数据对应的关键词列表;遍历待识别用户数据,提取待识别用户数据中与所述关键词列表匹配的词汇以及词汇之间的关系,生成待识别图网络,待识别图网络包括节点和边。
[0083]
可选地,所述图卷积神经网络模型采用如下方式训练:获取多个图网络,图网络包括节点和边;采用最小生成树普利姆算法生成每个图网络的最小连通支配集;基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,得到预先训练的图卷积神经网络模型。
[0084]
可选地,基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,
包括:采用多个图网络中每个节点的度数作为节点特征矩阵;将图网络中属于最小连通支配集的节点标记为1,不属于的节点标记为0,得到节点的标签值;基于所述节点特征矩阵和所述节点的标签值对图卷积神经网络进行训练,图卷积神经网络中采用relu作为激活函数,卷积层中包括dropout,采用对数似然函数作为损失函数。
[0085]
可选地,简化图生成模块具体用于:获取待识别图网络对应的最小连通支配集中任意两个节点;判断待识别图网络中对应两个节点之间在待识别图网络中是否存在一条边;若存在,在两个节点中加上边;重复上述步骤,直至遍历完成最小连通支配集中的所有节点,得到待识别图网络的简化图。
[0086]
可选地,分类分级模块具体用于:计算待识别图网络的简化图和标准敏感级别数据对应的简化图的最大公共子图;计算待识别图网络的简化图和标准敏感级别数据对应的简化图中的节点个数;基于最大公共子图和节点个数中的最大值进行匹配度计算,将待识别用户数据归为匹配度最高的标准敏感级别数据对应的敏感结果。
[0087]
可选地,计算待识别图网络的简化图和标准敏感级别数据对应的简化图的最大公共子图,包括:计算待识别图网络的简化图和标准敏感级别数据对应的简化图的共有节点;基于所述共有节点计算待识别图网络的简化图和标准敏感级别数据对应的简化图共有边;基于所述共有节点和共有边确定最大公共子图。
[0088]
本发明实施例提供的基于图学习的虚拟电厂用户敏感数据识别装置的功能描述详细参见上述实施例中基于图学习的虚拟电厂用户敏感数据识别方法描述。
[0089]
本发明实施例还提供一种存储介质,如图3所示,其上存储有计算机程序601,该指令被处理器执行时实现上述实施例中基于图学习的虚拟电厂用户敏感数据识别方法的步骤。该存储介质上还存储有音视频流数据,特征帧数据、交互请求信令、加密数据以及预设数据大小等。其中,存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)、随机存储记忆体(random access memory,ram)、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固态硬盘(solid-state drive,ssd)等;所述存储介质还可以包括上述种类的存储器的组合。
[0090]
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)、随机存储记忆体(randomaccessmemory,ram)、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固态硬盘(solid-state drive,ssd)等;所述存储介质还可以包括上述种类的存储器的组合。
[0091]
本发明实施例还提供了一种电子设备,如图4所示,该电子设备可以包括处理器51和存储器52,其中处理器51和存储器52可以通过总线或者其他方式连接,图4中以通过总线连接为例。
[0092]
处理器51可以为中央处理器(central processing unit,cpu)。处理器51还可以为其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
[0093]
存储器52作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的对应的程序指令/模块。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的基于图学习的虚拟电厂用户敏感数据识别方法。
[0094]
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需要的应用程序;存储数据区可存储处理器51所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至处理器51。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0095]
所述一个或者多个模块存储在所述存储器52中,当被所述处理器51执行时,执行如图1所示实施例中的基于图学习的虚拟电厂用户敏感数据识别方法。
[0096]
上述电子设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
[0097]
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1