一种基于矩阵分解的网络结构去匿名化系统及方法与流程

文档序号:20203401发布日期:2020-03-27 20:52阅读:来源:国知局

技术特征:

1.一种基于矩阵分解的网络结构去匿名化系统,其特征在于,包括动态网络的获取数据模块,低秩稀疏模型训练模块,非负矩阵分解训练模型的构建模块,优化模块,其中:

动态网络-静态网络转换模块,用于根据实时动态网络的社交网络数据获取静态网络以及静态网络的邻接矩阵;

低秩稀疏模型训练模块,用于约束每个静态网络的局部特征结构同时去除每个静态网络的噪声;

非负矩阵分解训练模型的构建模块,用于捕捉网络内在的固有规律,对网络的潜在特征进行刻画;

优化模块,用于降低网络的随机性,进一步减少网络噪声对预测模型性能的负面影响。

2.根据权利要求1所述的一种基于矩阵分解的网络结构去匿名化系统,其特征在于,动态网络-静态网络转换模块包括原始数据获取模块、基于时间的划分模块以及邻接矩阵划分模块,其中:

原始数据获取模块,用于从现有的社交网络中获取实时动态网络数据;

基于时间的划分模块,用于将获取的实时动态网络数据根据时间区间分为t个静态网络;

邻接矩阵划分模块,用于获取每个静态网络的邻接矩阵。

3.根据权利要求1所述的一种基于矩阵分解的网络结构去匿名化系统,其特征在于,低秩稀疏模型训练模块包括低秩模块和稀疏模块,其中:

低秩模块,用于根据静态网络的邻接矩阵对静态网络的局部特征进行刻画,提取该静态网络中的局部特征;

稀疏模块,用于根据静态网络的邻接矩阵对静态网络的噪声进行刻画,提取该静态网络中的噪声。

4.根据权利要求1所述的一种基于矩阵分解的网络结构去匿名化系统,其特征在于,非负矩阵分解训练模型的构建模块包括降维模块和非负约束模块,其中:

降维模块,用于对低秩稀疏模型训练模块训练后的静态网络进行网络压缩;

非负约束模块,用于对进行网络压缩后的静态网络进行非负约束,使网络中每个元素都为非负。

5.根据权利要求1所述的一种基于矩阵分解的网络结构去匿名化系统,其特征在于,优化模块包括随机扰动模块、相似度评分模块以及叠加模块,其中:

随机扰动模块,用于随机删除或者添加网络中的连接关系,对网络造成随机扰动;

相似度评分模块,用于计算发生扰动之后网络的相似度评分矩阵;

叠加模块,用于对相似度评分矩阵进行叠加,并清除根据扰动变化的连接,固话不根据扰动变化的连接。

6.一种基于矩阵分解的网络结构去匿名化方法,其特征在于,包括以下步骤:

s1、获取数据源,数据源包括各个网络之间的关系的拓扑结构以及网络中用户之间关系的拓扑结构;

s2、将动态社交网络的数据集根据时间划分为t个静态网络数据集,获取每个静态网络结构信息所对应的邻接矩阵;

s3、将邻接矩阵输入根据低秩表示模型进行训练,计算得到目标矩阵;

s4、将目标矩阵输入改进的非负矩阵分解模型进行训练和预测,得到目标矩阵的去匿名化矩阵。

7.根据权利要求6所述的一种基于矩阵分解的网络结构去匿名化方法,其特征在于,为了提高优化效率,将目标矩阵的求解过程表示为:

其中,λ表示阻尼系数;et表示第t个静态网络的噪音误差矩阵;at表示第t个静态网络的邻接矩阵;st表示第t个静态网络的目标矩阵;||st||*表示矩阵s的奇异值之和;||et||1为第t个静态网络的噪音误差矩阵中元素的绝对值之和。

8.根据权利要求6所述的一种基于矩阵分解的网络结构去匿名化方法,其特征在于,将目标矩阵输入改进的非负矩阵分解模型进行训练和预测包括:

s41、将t-1个时刻的数据作为训练集训练模型,将第t个时刻的数据输入训练好的模型,预测t+1时刻的网络结构;

s42、利用社团检测求得社交网络潜在特征的数量;

s43、基于回报函数,求取不同时刻的基矩阵和系数矩阵;

s44、根据不同时刻的基矩阵和系数矩阵计算得到相似度评分矩阵,通过topn排序来寻找可能产生链接的用户对;

s45、对相似度评分矩阵中各个元素的绝对值进行排序,将值最大的n个作为匿名边集,即预测在t+1时刻产生的链接,以此来对网络进行去匿名化,进而对可能被推断出的关系进行匿名隐藏,防止网络推理攻击。

9.根据权利要求8所述的一种基于矩阵分解的网络结构去匿名化方法,其特征在于,基于回报函数,求取不同时刻的基矩阵和系数矩阵包括:

其中,j表示回报函数;s(t)表示低秩稀疏模型训练后的输出数据;u(t)表示潜在特征的基矩阵;v(t)表示潜在特征的基矩阵的系数矩阵;u(*)表示为了利用网络各个时刻的拓扑信息而找到的最接近u(t)的矩阵;v(*)表示为了利用网络各个时刻的拓扑信息而找到的最接近v(t)的矩阵;表示f-范数。

10.根据权利要求8所述的一种基于矩阵分解的网络结构去匿名化方法,其特征在于,相似度矩阵表示为:

其中,a*为相似度矩阵;r表示扰动的次数;u(*)表示表示为了利用网络各个时刻的拓扑信息而找到的最接近u(t)的矩阵,u(t)表示潜在特征的基矩阵;v(*)是为了利用网络各个时刻的拓扑信息而找到的最接近v(t)的矩阵,v(t)表示潜在特征的基矩阵的系数矩阵。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1