一种基于同态加密的影响力最大化方法

文档序号:31047337发布日期:2022-08-06 05:44阅读:99来源:国知局
一种基于同态加密的影响力最大化方法

1.本发明属于社交网络挖掘和隐私保护领域,具体涉及一种基于同态加密的影响力最大化方法。


背景技术:

2.随着网络科学的不断发展,很多现实问题可以建模为复杂网络问题并进行求解。社交网络作为一种典型的网络类型,是指一群人或团体按照某种关系连接而构成的一个系统,反映了人与人之间的交互信息。复杂网络中对社交网络领域关注广泛的是如何寻找有影响力的节点集以最大限度地扩大信息的传播范围,这具有重要的现实意义。比如,在社交媒体平台上如何设计有效的广告投放策略(选择哪些用户进行宣传)使得最终了解该产品的人数达到最大化;高价雇佣微博大v做新产品的推广,如何找到合适的一些达人;当发生失踪案件的时候,我们应该如何寻找社交媒体上有影响力的用户来最大限度地传播关于失踪人口的信息等。
3.在现实中,用户往往拥有多个社交媒体的账户,他可以选其中若干个账户对商品进行转发和分享,此情况下仅考虑单一社交媒体的影响力最大化是不充分的,因而,跨多个社交媒体平台的影响力最大化问题是值得关注的。现有方法在处理多个社交媒体平台的影响力最大化问题时没有考虑各个社交媒体平台的用户数据隐私。从用户和企业的角度出发,社交媒体平台记录的数据往往涉及个人隐私,同时具有巨大的价值,两个甚至多个公司之间在考虑合作以获得更大收益时往往都不愿意直接共享或者交换各自的数据。所以没有一个平台可以搜集到用户的完整数据,每个平台仅掌握原始网络的部分结构。如何在不泄露各个社交媒体平台用户隐私的同时,融合各个平台的网络结构信息,找到更优的种子用户集合使得受影响的用户数更多,成为当前面临的重要问题。
4.本发明在保护隐私的前提下,利用同态加密算法协同融合不同社交平台的用户信息,寻找具有较大影响力的用户集合以最大化信息在社交网络中的扩散传播。同时,本发明提出的基于同态加密的影响力最大化方法(he-dd)相比于仅考虑单一平台拥有的用户信息时,可以找到全局更优的种子节点集合以最大限度地扩大影响力传播范围。最后,本发明提出的框架可以同时解决隐私保护和影响力最大化问题,即在不泄露各平台用户隐私的同时,融合多个平台的网络结构信息,找到更优的种子用户集合使得受影响的用户数更多。


技术实现要素:

5.本发明目的在保护隐私的前提下,融合各个社交媒体平台的网络结构信息,借助第三方服务器(无论是否受信任),联合同态加密安全协议,找到更优的种子用户集合使得受影响的用户数最多。
6.本发明采用以下的方法步骤实现上述的目的:
7.一种基于同态加密的影响力最大化方法,即he-dd算法,包括如下步骤:
8.步骤1:生成密钥对:密钥服务器生成密钥对,将公钥公开给每个客户端,自己保留
私钥;
9.步骤2:加密度折扣值:每个客户端根据自己的私有网络,利用度折扣启发式算法,求出所有节点的度折扣值后,通过密钥服务器分发的公钥将所有节点的度折扣值加密发送给计算服务器;
10.步骤3:融合加密的度折扣值:计算服务器融合计算所有客户端发送的密文,并将计算结果发送给密钥服务器;
11.步骤4:解密密文:密钥服务器用私钥对融合后的密文进行解密,解密函数解密得到明文;
12.步骤5:更新种子节点集:选取融合后度折扣值最大且未被选择作为种子的节点作为此轮种子节点,并将更新后的种子节点集合的结果分发给各个客户端,计算下一次迭代中所有节点的度折扣值,重复选择种子直到选取k个种子,最终得到原始网络中的种子集合。
13.进一步地,所述步骤1中,包括如下步骤:
14.(1.1)随机选择两个大质数p和q,满足gcd(pq,(p-1)(q-1))=1,其中gcd(
·
,
·
)表示最大公约数;
15.(1.2)计算n=pq和λ=lcm(p-1,q-1),其中lcm(
·
,
·
)表示最小公倍数;
16.(1.3)随机选择一个整数g∈z
n2
,满足gcd(l(g
λ
modn2),n)=1,其中
17.(1.4)选择公钥k
p
={n,g}和密钥ks={λ}作为生成得密钥对,密钥服务器将公钥公开给每个客户端,自己保留私钥。
18.进一步地,所述步骤2,包括如下步骤:
19.(2.1)每个客户端仅根据自己拥有的私有网络g
t
,利用度折扣启发式算法,求出所有节点的度折扣值(初始时节点的度折扣值即为度值),记为{dd
t,1
,dd
t,2
,...,dd
t,n
}:其中t表示第t个客户端拥有私有网络g
t
,{1,2,...,n}表示节点,m
t,1
表示私有网络g
t
的第1个节点的值,其他私有网络的表示类似可推;
20.(2.2)每个客户端t通过公钥k
p
将所有节点的度折扣值加密发送给计算服务器(其中i表示第i次迭代),即对于私有网络g
t
而言,记加密后的度折扣值即密文为其中表示加密算法。
21.进一步地,所述步骤3中,包括如下步骤:
22.(3.1)计算服务器融合所有客户端发送过来的密文得到以下向量:
[0023][0024]
其中,dd
t,i
,i={1,2,3,

,n}表示私有网络g
t
中节点i的度折扣值,表示加密算法。
[0025]
(3.2)计算服务器将密文发送给密钥服务器。
[0026]
进一步地,所述步骤4中,密钥服务器利用私钥ks对计算服务器发送的密文进行解
密,利用同态加密系统得到明文其中表示解密方案,ks表示私钥,j∈{1,2,...,n}。
[0027]
进一步地,所述步骤5中,包括如下步骤:
[0028]
(5.1)选取融合后度折扣值最大且未被选择作为种子的节点作为此轮种子节点,即所对应的节点zi作为此轮选取的种子节点(已作为种子的节点不能被重复选取作为新一轮的种子节点),其中1≤zi≤n,
[0029]
(5.2)将更新后的种子节点集合结果分发给各个客户端g
t
,计算下一次迭代中所有节点的度折扣值,重复选择种子zi,1≤i≤k,i表示第i轮选取的种子,直到选取k个种子,最终得到原始网络g中的种子集为{z1,z2,...,zk}。
[0030]
与现有技术相比,本发明的有益效果:
[0031]
1.本发明提出的影响力最大化方法利用同态加密安全协议并借助第三方服务器进行信息加解密运算和种子节点集合的更新,相比于仅考虑单一平台拥有的用户信息时,可以找到更优的种子节点集合以最大限度地扩大影响力传播范围;
[0032]
2.本发明提出的基于同态加密的影响力最大化方法可以在不泄露用户隐私的前提下,融合各个社交媒体平台的用户信息,用于广告投放、产品推广、信息传播等场景下合适用户群体的寻找;
[0033]
3.本发明提出了一个可以有效整合隐私保护和影响力最大化问题的框架,实现隐私不泄露的同时,融合多方平台的用户信息,实现社交媒体中的影响力最大化。
附图说明
[0034]
图1是本发明涉及的he-dd算法的流程图
[0035]
图2是本发明涉及的he-dd算法的示意图
[0036]
图3是不同数据集上的影响力范围图
[0037]
图4是与原始网络影响范围比较实验图
[0038]
图5是bcspwr10网络上不同传播概率β的影响力范围图
[0039]
图6是power网络上不同稀疏度αs和不同重叠度αo,α
t
影响力范围图
具体实施方式
[0040]
下面通过具体实施例进一步说明本发明的技术方案:
[0041]
本实例采取的实验数据为公开数据集power数据集、bcspwr10数据集、dd21数据集和hep数据集。
[0042]
如图1,本发明技术方案包括如下步骤:
[0043]
步骤一,生成子网数据和密钥对;
[0044]
具体步骤如下:
[0045]
(1)利用原始网络,构造三个子网,分发给三个客户端。在不同的数据集上构造三个子网的过程如下:对于每个在原始网络中的边,都会生成一个随机数p∈[0,1]用来确定
原始网络中的一条边存在于哪个子网中。若p≤1-3αs+3αsα
t-αsαo,则在任何子网中都不保留该边。若1-3αs+3αsα
t-αsαo《p≤1+2αsα
o-3αsα
t
,则只在一个子网中保留该边;如果1+2αsα
o-3αsα
t
《p≤1-αsαo,则在两个子网中保留该边。否则,当1-αsαo《p≤1时,在所有子网中均保留该边。此外,参数αo用来控制所有子网的整体重叠度,即三个子网重叠的程度,参数α
t
来控制两个子网之间的重叠程度,αs是衡量子网的稀疏化水平。在没有特别说明的情况下,我们设置生成三层子网的参数αs=0.4,α0=0.05,α
t
=0.25。
[0046]
(2)密钥服务器生成密钥对过程如下:
[0047]
(2.1)随机选择两个大质数p和q,满足gcd(pq,(p-1)(q-1))=1,其中gcd(
·
,
·
)表示最大公约数;
[0048]
(2.2)计算n=pq和λ=lcm(p-1,q-1),其中lcm(
·
,
·
)表示最小公倍数;
[0049]
(2.3)随机选择一个整数满足gcd(l(g
λ
modn2),n)=1,其中
[0050]
(2.4)选择公钥k
p
={n,g}和密钥ks={λ}作为生成得密钥对,密钥服务器将公钥k
p
公开给每个客户端,自己保留私钥ks。
[0051]
这时,三个客户端具有子网结构数据和公钥k
p
信息,密钥服务器拥有私钥ks[0052]
步骤二,计算度折扣值并加密;
[0053]
具体步骤如下:
[0054]
(1)每个客户端仅根据自己拥有的私有网络g
t
,利用度折扣启发式算法,求出所有节点的度折扣值(初始时节点的度折扣值即为度值),记为{dd
t,1
,dd
t,2
,...,dd
t,n
}:其中t表示第t个客户端拥有私有网络g
t
,t=1,2,3,{1,2,...,n}表示节点,m
t,1
表示私有网络g
t
的第1个节点的值,其他私有网络的表示类似可推;度折扣启发式算法具体过程如下:设dv表示节点v的度,β表示每条边的激活概率,tv表示节点v的邻居中是种子节点的数量,则节点v没有被邻居种子节点激活的概率为此时选择节点v作为传播种子可以激活的期望节点数为1+(d
v-tv)β;节点v被邻居种子节点激活的概率为此时节点v的影响力为0。这样,选择节点v作为种子节点的期望影响力为:
[0055][0056]
其中,dv表示节点v的度,β表示每条边的激活概率,tv表示节点v的邻居中是种子节点的数量。
[0057]
当节点v没有邻居种子节点时,选择节点v作为种子节点的期望影响力为:
[0058][0059]
设γ为每个邻居种子节点的度折扣,则有γtvβ=b-a,这样可以解得
[0060]
γ=2+(d
v-tv)β
[0061]
因此,当节点v有tv个邻居种子节点时,其度折扣定义为:
[0062]
ddv=d
v-tvγ=d
v-2t
v-(d
v-tv)tvβ
[0063]
(2)每个客户端t通过公钥k
p
将所有节点的度折扣值加密发送给计算服务器,即对于私有网络g
t
而言,记加密后的度折扣值即密文为
其中表示加密算法。
[0064]
步骤三,融合加密的度折扣值,具体地,计算服务器融合所有客户端发送过来的密文得到以下向量:并将密文发送给密钥服务器,其中,dd
t,i
,i={1,2,3,

,n}表示私有网络g
t
中节点i的度折扣值,表示加密算法。
[0065]
步骤四,解密融合后的密文,具体地,密钥服务器利用私钥ks对计算服务器发送的密文进行解密,得到明文其中表示解密方案,ks表示私钥,j∈{1,2,...,n}。
[0066]
步骤五,选取度折扣值最大的节点,并更新种子集;具体地,包括如下步骤:
[0067]
(1)选取融合后度折扣值最大的节点作为第一轮种子节点,即所对应的节点z1作为第一轮选取的种子节点,将其添加进种子集合s中,其中1≤zi≤n;
[0068]
(2)将更新后的种子节点集合s结果分发给各个客户端g
t
,计算下一次迭代中所有节点的度折扣值,重复步骤二、步骤三、步骤四,选取融合后度折扣值最大且未被选择作为种子的节点作为此轮种子节点zi,2≤i≤k,i表示第i轮选取的种子,将其添加进s中,直到选取k个种子,最终得到原始网络g中的种子集为s={z1,z2,...,zk}。
[0069]
下面结合附图对实例进行性能分析:
[0070]
为了对比实验,本实验中,使用p=0.1的独立级联(ic)模型来刻画算法所选择的种子节点集合的传播影响范围,从而衡量不同算法的优劣。
[0071]
1.不同数据集上的影响力范围
[0072]
本实验设置生成三层子网的参数αs=0.4,α0=0.05,α
t
=0.25,传播概率β=0.1,包含生成三个子网络的power网络、bcspor10网络以及dd21网络的种子集大小k=50,包含生成三个子网络的hep网络的种子集大小k=100。三层子网影响力范围σ(
·
)随种子集大小变化的实验结果如图3所示。
[0073]
从图3中可以看出:在不同网络下,he-dd算法相比较于仅利用单个子网的结构信息,可以寻找使得原始网络影响力范围更广泛的种子节点集合,结果明显优于单个子网的效果,即仅仅利用单个子网的结构信息是不够充分的。
[0074]
2.单个子网、融合的影响范围与原始网络影响范围比较
[0075]
本实验网络的传播率β=0.1,hep网络取k=100,其余网络均取k=50。
[0076]
定义相对比率(rr)来刻画其他算法的影响力需要乘以多少倍才能达到与完全知道网络结构的算法影响力σ(s)相同的影响范围。因此,如果一种算法的rr值比其他算法更接近于1,则说明该算法在使影响范围最大化方面的性能最好。
[0077]
图4展示了基于完整网络、三个私有网络以及he-dd算法下分别选择k个种子节点下的传播范围的对比,可以看出,he-dd算法所寻找的种子节点的影响力范围相比较于基于三个私有网络更接近完整网络的影响力范围,再一次凸显he-dd算法的有效性。
[0078]
3.不同传播概率β取值下的影响力范围
[0079]
本实验中数据集为bcspwr10网络,在种子集k=50时,三方以及融合的最终影响力范围随不同传播率β∈[0.05,0.30]下的比较结果如图5所示。
[0080]
从图5可以看出:可以看出无论取多大的传播率,he-dd算法的最终传播范围都明显优于仅使用任何一个子网的最终传播范围。
[0081]
4.不同生成网络参数取值下的影响力范围
[0082]
本实验选择传播概率β=0.1,包含生成三个子网络的power网络,种子数k=50
[0083]
图6(a)展示了在固定重叠度αo=0.05,α
t
=0.25情况下,网络的稀疏度αs在[0.2,0.4]下三方子网和he-dd算法的影响范围比较。
[0084]
从图6(a)可以看出,随着αs的增大,子网获得的关于原始网络的结构信息越多,越有利于寻找原始网络的种子节点集合,所有算法下的传播范围均呈现不断增大的趋势。
[0085]
图6(b)展示了在固定稀疏度αs=0.4情况下,网络的重叠度αo,α
t
均在[0.05,0.30]下三方子网和he-dd算法的影响范围比较。
[0086]
从图6(b)可以看出,随着重叠度αo,α
t
的增加,子网之间的结构差异性越来越小,传播范围差异性不大,同时he-dd算法利用每个子网的结构寻找种子节点集合的信息非常有限,因此传播范围也呈现下降趋势。
[0087]
本技术中,为了解决“如何在保护隐私的前提下,融合各个社交媒体平台的网络结构信息,找到更优的种子用户集合使得受影响的用户数最多”这一问题,提出基于同态加密的影响力最大化方法,在保护隐私的前提下,协同融合不同社交平台的用户信息,寻找具有较大影响力的用户集合以最大化信息在社交网络中的扩散传播;并且通过实施例表明,本发明提出的he-dd算法相比于仅仅考虑单一网络的结构信息,可以找到更优的种子节点集合以最大限度地扩大影响力传播范围。
[0088]
本实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1