一种基于社区结构的影响最大化方法

文档序号:10553476阅读:352来源:国知局
一种基于社区结构的影响最大化方法
【专利摘要】本发明提出一种基于社区结构的影响最大化方法。影响最大化问题研究如何从网络中找到k个种子节点作为初始传播源,使传播的最终影响范围最广。该问题是一个NP难题,传统的贪心算法效率很低,而简单的启发式算法得不到高质量的解。为解决上述问题,本发明提出了基于社区结构的影响最大化模型。模型假设传播分为两个阶段:第一阶段是种子节点的扩张,在该阶段种子节点可以扩张到各个社区;第二阶段是社区内传播,即扩张后的种子节点在各个社区内部独立传播。基于该模型推导出目标函数的一种简化形式,并提出一个高效的种子选取算法。在五个真实数据集上的实验结果表明,本发明所提算法效率远高于传统的贪心算法,且准确性高于简单的启发式算法。
【专利说明】
一种基于社区结构的影响最大化方法
技术领域
[0001] 本发明属于计算机数据挖掘技术领域,涉及大规模网络中的影响最大化问题,特 别涉及一种基于社区结构的影响最大化方法。
【背景技术】
[0002] 影响最大化(Influence Maximization)是一个关于传播的优化问题,它最开始来 自于广告营销领域,尤其是病毒式网络营销。设想这种情况,某公司开发出一款新产品,想 要推广给用户。该公司准备选择一批用户,让这些用户免费试用该产品,并有可能把该产品 推荐给他们的朋友,最后通过"口碑相传"的效应,使该产品在整个用户群中最大范围内推 广开来。一般来说,公司的前期试用投入是有限的,那么随之而来的问题是:如何在有限的 预算内,找到"最佳"的试用人群,使得最终推广的范围最广(即影响的人群最多)。抽象为数 学的形式就是,给定一个网络,从网络中找到k个节点,使得从这k个节点开始,最终的传播 范围最广。由此可见,影响最大化的研究具有很大的经济价值。
[0003] 影响最大化是一个传播优化问题,由Kempe等最先给出其形式化描述。对于网络G = (V,E),影响最大化问题要求找到一个种子节点集合S,使得从S开始,在某种传播模型下 (如IC、LT),最终的传播影响范围最广,即:
[0004] S* = args max〇(S)
[0005] 其中,〇(S)是一个评价影响范围的函数,被定义为最终被影响的节点数的期望。
[0006] Kempe等证明,在经典的LT(Linear Threshold,线性阈值)和IC( Independent Cascade,独立级联)传播模型下,该问题是一个NP难题,且目标函数满足Submodularity。若 一个函数〇(S)满足Submodularity,则它具备两个性质:1)单调递增,即G r,o(SX〇 (T);2)VveF,*S Q?7,有o(S Uv)-〇(S)^〇(TUv)-o(T)。基于Submodular 函数的性质和相 关理论[21],Kempe等进一步给出了求解该问题的一个"爬山式"的贪心算法,该算法从一个 空集合开始构造 S,每次都选择能给目标函数带来最大增益的节点加入Sjempe等证明,该 算法得到的解是最优解的(l-1/e-S)近似。其中,第二项中的e为自然对数的底,该项来自于 Submodular函数的性质本身。第三项S来自于采用蒙特卡洛法计算目标函数值〇(S)所产生 的误差。在实际中,该算法的解与最优解已相当接近。但由于需要重复上万次蒙特卡洛仿真 来计算目标函数值,导致该算法效率极低,只能适用于规模很小的网络。
[0007] 在Kempe等提出影响最大化问题之后,很多研究者针对该问题提出了新的算法,其 中大多数算法都是从优化效率的角度出发,例如基于模块度的算法、基于节点中心性度量 指标的算法、基于传播路径的算法等等。然而,目前已有的各种求解影响最大化问题的方法 都存在着各自的缺点和不足,其中,绝大部分算法要么效率偏低、要么内存开销较大,不能 有效处理大规模网络,而一些效率较高的算法则由于策略过于简单,无法得到高质量的解。
[0008] 社区结构作为网络的一种普遍特征,提供了网络拓扑特征的有价值的信息。已有 的影响最大化算法往往只考虑了网络的局部特征,如节点度、路径等,没有充分利用诸如度 分布、聚类特性、社区结构这种宏观特征,从而限制了它们的效果。

【发明内容】

[0009] 有鉴于此,本发明的目的在于提供一种基于社区结构的影响最大化方法,该方法 能够克服已有算法在效率上的不足,同时保证解的质量不会下降。
[0010] 为达到上述目的,本发明提供如下技术方案:
[0011] -种基于社区结构的影响最大化方法,该方法包括以下步骤:
[0012] S1:针对影响最大化问题,基于社区结构建立两阶段传播模型:第一阶段为传播初 期不同社区间种子节点的扩张;第二阶段为社区内部的独立传播,即不同社区间不再相互 传播;在该模型中,将种子节点集合S称为一阶种子节点,其邻居节点集合N(S)称为二阶种 子节点,所述第一阶段就是从一阶种子节点到二阶种子节点的传播,第二阶段则是从二阶 种子节点到社区内部其他节点的传播;
[0013] 在所述第一阶段中,传播主要从一阶种子节点S向二阶种子节点N(S)进行;由于二 阶种子节点可能分布于不同的社区,因此这一阶段相当于把种子在不同的社区间进行扩 散;给定一阶种子节点S,对任意一个二阶种子节点vGN(S),在经过第一阶段的传播之后, 该节点处于活跃状态的概率是:
[_ 丨''⑶=卜,u-
[0015]其中,puv是节点u至lj节点V的传播概率;
[0016] 在所述第二阶段中,传播只在社区内部进行,而不同社区间不会进行传播且每个 社区内的传播行为相互独立;最终某个社区C内被影响的节点数取决于:社区包含的节点集 合、一阶种子节点和二阶种子节点;因此,将其定义为一个函数f(S,S',C),其中S和S'分别 为一阶和二阶种子节点;整个网络的影响范围为:
[0017] J(S) = ^ i (S,S ,〇 , -C&C
[0018] S2:根据步骤S1的结果将基于社区结构的影响最大化问题转化为:给定一个带非 重叠社区结构C的网络G(V,E)以及相应的传播模型,寻找一个大小为k的种子节点集合S*, 使得公式中的影响函数f(S)最大化,SP:
[0019] S* = argsmaxf (S) 〇
[0020] 进一步,在步骤S2中,对社区C中的任意节点vGC,令PjSy,C)表示节点v经过第 一和第二阶段传播后最终处于活跃状态的概率,则社区C被影响的范围f(S,S',C)可以通过 如下公式计算:
[0021] J\SSX1 = ^,(S,S\C) veC
[0022] 对任意的一阶种子节点VGS,有PjSj',C) = 1;对任意的二阶种子节点VGS7,有 Pjsy,C) = l-nueN(v:ins(l-puv);对一阶和二阶种子节点以外的任意节点vGV\{SU S7 }, 采用蒙特卡洛仿真法、节点恒定值法、社区恒定值法来计算其对应的PXS,^)值。
[0023] 进一步,所述蒙特卡洛仿真法为根据传播模型,在社区内部重复R次蒙特卡洛仿 真,具体包括:在初始时刻,让每个一阶种子节点处于活跃状态;对每个二阶种子节点,根据 公式:
[0024] iU以概率Pv(S)使其处于活跃状态,以此作为初始条件启 动传播过程,并限制传播只在社区内部进行;假设在R次仿真中,节点4皮激活了R(V)次,则 PV(S,S\C)可作如下近似:
[0025] PJS.S',C)=R(v)/R。
[0026] 进一步,所述节点恒定值法包括:直接给每个除一阶和二阶种子节点外的节点赋 予相同的Pdsy,C)值,如此即有:
[0028]根据公式./^?^〇 = 1^以'^〇,社区(:被影响的总范围为: ve.G f(s,s\c) = \snc\ +
[0029] ^ (1_ n a-pj)+p\c\\si}s'}\ v^ns- ,,ejV(v)av
[0030] 在这种计算方法下,每个社区(除一阶和二阶种子节点之外)受影响的范围与该社 区中包含的节点数成正比。
[0031] 进一步,所述社区恒定值法对社区中每个除一阶和二阶种子节点外的节点v G V\ {SUSM,将它们的Pv(s,s\c)值之和设为恒定值,即则有:
[0033] 根据公式= 社区C被影响的总范围为: vsC. /(w,〇=i*snci+
[0034] Z 〇- n 〇-/>,,,))+p veCTlS' W^V(V)n'y
[0035] 在这种计算方法下,每个社区(除一阶和二阶种子节点外)受影响的范围为恒定 值。
[0036] 进一步,在WC(Weighted Cascade,带权级联)传播模型下,采用所述社区恒定值 法,将:
[0037] /?=Z/(S,5(,C) C^C
[0038] 转化为:g(S)=|N(S)| + y |NC(S)|,其中,y 为可调参数。
[0039] 本发明的有益效果在于:本发明提出的基于社区结构的影响最大化算法,其效率 不仅比已有最新的算法(如IPA算法)高,而且其准确性也高于IPA算法及其他启发式算法, 能够很好的克服已有算法在效率上的不足,同时保证解的质量不会下降。
【具体实施方式】
[0040] 下面将对本发明的优选实施例进行详细的描述。
[0041] 不失一般性,在本发明中,将一个无向无权图定义为G=(V,E),其中V是节点集合, E是边集合。对于图G,可以用一个邻接矩阵A表示,如下: ^ 若〖与/相连
[0042] ~ < ^ (1) 9 其他情况
[0043] 对图中的任意节点V,其邻居节点集合表示为:
[0044] N(v) = {u | Av,u>0} (2)
[0045] 图G的社区结构定义为图G中节点的划分. . .,Ck},其中第i个社区Ci包 含一个或多个节点(本发明只考虑非重叠社区,即任意两个社区间无同时包含的节点)。给 定任意节点V,用C(v)表示该节点所在社区。这样就可以进一步定义节点v的邻居社区集合:
[0046] NC(v) = {C(u) |uGN(v)} (3)
[0047] 令S表示任意的节点集合,则集合S的邻居节点集合定义为:
[0048] N(S)= UvesN(v) (4)
[0049] 类似地,S的邻居社区集合定义为:
[0050] NC(S) = {C(u) |uGNC(S)} (5)
[0051] 为了解决已有的影响最大化算法存在的不足,本发明提出基于社区结构的两阶段 传播模型,该模型假设传播分为两个阶段:
[0052]第一阶段为传播初期不同社区间种子节点的扩张;第二阶段为社区内部的独立传 播,即不同社区间不再相互传播。将种子节点集合S称为一阶种子节点,其邻居节点集合N (S)称为二阶种子节点。这样第一阶段就是从一阶种子节点到二阶种子节点的传播,第二阶 段则是从二阶种子节点(由于一阶种子节点已传播过,故不再继续传播)到社区内部其他节 点的传播。
[0053]显然模型假设的第一阶段恒成立,因为任何传播必然是先从种子节点S到其邻居 节点。第二阶段,由于社区结构具有社区内部联系紧密,社区之间联系稀疏的特点,而稠密 的社区内部连接会将传播限制在社区内部,因此第二阶段的假设也具有其合理性。
[0054] 1)种子扩张阶段:
[0055] 在这一阶段,传播主要从一阶种子节点S向二阶种子节点N(S)进行。由于二阶种子 节点可能分布于不同的社区,因此这一阶段相当于把种子在不同的社区间进行扩散。给定 一阶种子节点S,对任意一个二阶种子节点vGN(S),在经过第一阶段的传播之后,该节点处 于活跃状态的概率是:
[0056] ⑶=1-』)f/-/U .6)
[0057] 其中,puv是节点u至lj节点v的传播概率。
[0058] 2)社区内部传播阶段:
[0059]在这一阶段,假设传播只在社区内部进行,而不同社区间不会进行传播且每个社 区内的传播行为相互独立。易知,最终某个社区C内被影响的节点数取决于:社区包含的节 点集合、一阶种子节点和二阶种子节点。因此,将其定义为一个函数f(s,S',C),其中S和s' (即N(s),为方便起见,将其记为S')分别为一阶和二阶种子节点。整个网络的影响范围为:
[0060] f(S)=^f(SSXl (7) C<sC
[0061 ]根据上述公式,可以对基于社区结构的影响最大化问题做如下定义:
[0062] 基于社区结构的影响最大化问题被定义为,给定一个带非重叠社区结构C的网络G (V,E)以及相应的传播模型,寻找一个大小为k的种子节点集合S'使得公式(7)中的影响函 数f(S)最大化,即:
[0063] S* = argsmaxf (S) (8)
[0064] 对社区C中的任意节点vGC,令PjSy,C)表示节点v经过第一和第二阶段传播后 最终处于活跃状态的概率,则社区C被影响的范围f(S,S',C)可以通过如下公式计算:
[0065] = (9)
[0066] 显然对任意的一阶种子节点vGS,有PjSj',C) = 1。
[0067] 对任意的二阶种子节点vGS',有,C) = l-nueN(v)ns(l-puv)。
[0068] 对于计算其他节点对应的PXSj',C)值,本发明采用如下方案:对一阶和二阶种 子节点以外的任意节点vEV\{SU S'},采用蒙特卡洛仿真法、节点恒定值法、社区恒定值法 来计算其对应的PXSj',C)值,具体如下:
[0069] a)、蒙特卡洛仿真法为根据传播模型,在社区内部重复R次蒙特卡洛仿真。具体做 法是,在初始时刻,让每个一阶种子节点处于活跃状态。对每个二阶种子节点,根据公式(6) 以概率P V(S)使其处于活跃状态。以此作为初始条件启动传播过程,并限制传播只在社区内 部进行。假设在R次仿真中,节点v被激活了R(v)次,则PdSy,C)可作如下近似:
[0070] PvCS.S7 ,C)=R(v)/R (10)。
[0071] b )、节点恒定值法:直接给每个除一阶和二阶种子节点外的节点赋予相同的Pv (S, S',C)值,如此即有: 1 G S
[0072] pr(s,s\C)^h- n.d-^) (11) ueN(v)f]S _ P 其他
[0073] 根据公式(9),社区C被影响的总范围为: /(W,C) = |S 门 C| + _4][(】n (卜爲)) + /7|C\{lfU:y}| (12):
[0075] 在这种计算方法下,每个社区(除一阶和二阶种子节点之外)受影响的范围与该社 区中包含的节点数成正比。
[0076] c)、社区恒定值法:对社区中每个除一阶和二阶种子节点外的节点vGVUSUSM, 将它们的PV(S,S',C)值之和设为恒定值,SP Z 则有: V€CM5US,,|
[0078]根据公式(9 ),社区C被影响的总范围为: f(s,s\c) = \snc\ + _9] [ (1 p (1 )) + /? (14) v^ny "eN{v)ns
[0080]在这种计算方法下,每个社区(除一阶和二阶种子节点外)受影响的范围为恒定 值。
[0081 ] 进一步,在WC(Weighted Cascade,带权级联)传播模型下,选择社区恒定值方法, 可以推导出目标函数的一种等价简化形式。WC传播模型为IC( IndependentCascade,独立级 联)传播模型的一种特例,先简单介绍1C传播模型。在1C模型下,网络中的节点有活跃 (Active)和非活跃(Inactive)两种状态。其中,活跃状态表示已接受新产品并且可以对其 进行传播的用户,如初期试用者和他们推广成功的邻居用户等。而非活跃状态表示还未接 触产品,或接触了但拒绝接受该产品的用户。最初所有节点均处于非活跃状态,从中选择k 个种子用户并激活它们,让这k个种子用户开始传播。在t时刻每个活跃用户u会尝试激活它 的每一个非活跃邻居V,并以概率Puv成功。用户u只有一次机会去激活它的邻居,无论成功与 否,从t+1时刻起它都不会再做更多尝试。若v被成功激活,从t+1时刻起,v将处于活跃状态 并继续传播。若在t时刻没有任何非活跃节点被激活,则整个传播过程停止。在1C模型中,若 节点U至I」节点V的传播概率为p uv = 1 /kv,其中kv = IN(V) I为节点V的度,则对应的传播模型就 称为WC模型。
[0082] 在基于社区结构的影响最大化问题中,若传播模型为WC模型,并采用公式(13)计 算PXS,",C)值,则公式(7)中的目标函数等价于以下简化形式:
[0083] g(S)= |N(S) | + y |NC(S) (15)
[0084] 其中,y为可调参数。
[0085] 实施例:
[0086] 本实施例在五个数据集上对实验结果进行评估,这些数据集跨越了不同的领域和 尺度。其中最大的数据集包含30万节点1百万条边。这五个数据集如下:
[0087] NetHEPT:NetHEPT是来自预出版平台arXiv的数据集,包含了高能物理理论(High EnergyPhysics Theory)领域的研究者之间论文合作关系。网络中每个节点表示一个作者, 边(i,j)表示作者i和j至少合作发表过一篇论文。由这些合作关系组成的网络包含15,233 个节点和31,376条边。
[0088] NetPHY:NetPHY数据集与NetHEPT同样来自arXiv,包含了物理(Physics)领域的研 究者之间的论文合作关系。该数据集包含37,149个节点、174,161条边。
[0089] Epinions :Epin ions数据集包含了来自商品评论网站Epin ions ? com (http : // www.epinions .com/)的用户相互信任关系数据。在Epinison网站上用户对商品进行打分, 其他用户可以选择是否信任该用户的评分。网络中的节点表示用户,边表示用户之间的信 任关系。我们对数据进行了处理,并去除一些重复的边,最终得到的网络包含75,879个节 点、405,740条边。
[0090] DBLP :DBLP(http: //dblp ? uni-trier ? de/db/)是一个计算机领域的文献数据库系 统,该数据集包含了系统中的论文作者合作关系。数据集中每个节点表示一个作者,如果两 个作者至少合作过一篇论文,则他们之间存在一条边。最终得到的网络包含317,080个节点 和1,049,866条边。
[0091 ] Amazon: Amazon数据集由Leskovec等从大型在线购物网站Amazon ? com(https : // WWW ? amaz on ? com/)爬取得到,包含了 Amaz on平台上的商品被同时购买的关系。数据集中的 每个节点表示一个商品,若两个商品被经常被同时购买,则它们之间存在一条边。最终的网 络包含334,863个节点和925,872条边。
[0092]五个数据集的基本统计特征如表1所示:
[0093]表1.数据集介绍
[0096]将本发明所提供的方法与以下五个算法进行对比:
[0097] CELF Greedy:该算法由Leskovec等提出,是Greedy算法的改进版本。算法进一步 利用目标函数的Submodularity特性来提高时间效率。与传统的Greedy算法相比,该算法能 产生相同的解,且运行速度提高了许多。
[0098] IPA: (Independent PathAlgorithm)该算法由Kim等提出,是目前最新的算法之 一。算法假设网络中的传播沿着相互独立的路径进行,并通过传播路径来计算影响范围。该 算法还具有并行化的特点。算法包含一个参数0,用于控制路径的长度。这里我们将参数设 置为9,这也是作者给的默认设置。
[0099] SD: (SingleDiscount)Chen等提出的基于节点度的启发式算法。该算法每次选择 度最大的节点,当一个节点被选中之后,对它的每一个邻居,将其度值减一。
[0100] Degree:基于节点度的算法,即选择度值最大的k个节点。
[°101 ] Random:该算法随机选择k个节点。
[0102]在本实施例中,主要采用两个指标对算法性能进行评价:
[0103] 影响范围(Influence Spread):即在选定的种子节点下,经过传播,最终处于活跃 状态的节点数的期望。通常被用来评价算法的准确性,Influence Spread值越高,说明算法 越准确。由于计算Influence Spread的精确值是一个#?难题,一般的做法是通过蒙特卡洛 仿真得到。本章通过10, 〇〇〇次蒙特卡洛仿真来计算Influence Spread值。
[0104]运行时间:运行时间用于评价算法的时间效率,即选择k个种子节点所需要的时 间。运行时间反映了算法在大规模网络应用中的可扩展性,是影响最大化问题的主要关注 点。
[0105] 通过实验比较:
[0106] 在影响范围方面,在前两个数据集上,CELF算法的Influence Spread指标要高于 其他算法(后三个数据集由于CELF算法运行时间超过24小时故未列出)。同时,基于路径的 IPA算法和基于社区结构的算法Influence Spread指标略低于CELF算法,但高于Degree等 启发式算法。尤其在NetPHY数据集上,SD算法和Degree算法的Influence Spread指标下降 明显。Random算法由于没有任何启发信息,因此效果最差。在后三个数据集上,基于社区结 构的算法显示了它的鲁棒性,在每个数据集上Influence Spread指标都高于其他四个算 法。其中在DBLP数据集上,IPA算法的效果反而不如简单的Degree和SD算法。综上可知,合理 利用社区结构信息,有助于我们求解影响最大化问题。
[0107]在运行时间方面,与传统的CELF Greedy算法相比,本发明所提算法速度提升了约 四个数量级。值得注意的是,本算法的运行时间不仅包括种子节点选取时间,还包括运行 Louvain算法挖掘社区结构的时间。本发明所提基于社区结构的算法,其时间效率在绝大多 数数据集上都优于IPA算法。若网络的社区结构已知,则不需要进行社区挖掘,此时本发明 所提算法的效率优势将更加明显。Degr ee、SD和Random算法虽然运行速度很快,但所得的解 没有质量保障,从而局限了这些算法在实际中的应用。
[0108]最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通 过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在 形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
【主权项】
1. 一种基于社区结构的影响最大化方法,其特征在于:该方法包括W下步骤: SI:针对影响最大化问题,基于社区结构建立两阶段传播模型:第一阶段为传播初期不 同社区间种子节点的扩张;第二阶段为社区内部的独立传播,即不同社区间不再相互传播; 在该模型中,将种子节点集合S称为一阶种子节点,其邻居节点集合N(S)称为二阶种子节 点,所述第一阶段就是从一阶种子节点到二阶种子节点的传播,第二阶段则是从二阶种子 节点到社区内部其他节点的传播; 在所述第一阶段中,传播主要从一阶种子节点S向二阶种子节点N(S)进行;由于二阶种 子节点可能分布于不同的社区,因此运一阶段相当于把种子在不同的社区间进行扩散;给 定一阶种子节点S,对任意一个二阶种子节点VGN(S),在经过第一阶段的传播之后,该节点 处于活跃状态的概率是: 其中,Puv是节点Il至Ij节点V的传播概率;在所述第二阶段中,传播只在社区内部进行,而不同社区间不会进行传播且每个社区 内的传播行为相互独立;最终某个社区C内被影响的节点数取决于:社区包含的节点集合、 一阶种子节点和二阶种子节点;因此,将其定义为一个函数f(S,S',C),其中S和S'分别为一 阶和二阶种子节点;整个网络的影响范围为:S2:根据步骤Sl的结果将基于社区结构的影响最大化问题转化为:给定一个带非重叠 社区结构C的网络G(V,E) W及相应的传播模型,寻找一个大小为k的种子节点集合使得 公式中的影响函数f(S)最大化,即: S* = arg抑axf (S)。2. 根据权利要求1所述的一种基于社区结构的影响最大化方法,其特征在于:在步骤S2 中,对社区C中的任意节点VGC,令Pv(S,S/,C)表示节点V经过第一和第二阶段传播后最终 处于活跃状态的概率,则社区"4^3'"^^^^^-。- --''1'围过如下公式计算: 对任意的一阶种子节点V G S,有Pv( S,S',C) = 1;对任意的二阶种子节点V G ,有Pv(S, ,C) = l-nuEN(v)ns(l-puv);对一阶和二阶种子节点W外的任意节点vEV\{SUSM,采用蒙 特卡洛仿真法、节点恒定值法、社区恒定值法来计算其对应的Pv(S,S/,C)值。3. 根据权利要求2所述的一种基于社区结构的影响最大化方法,其特征在于:所述蒙特 卡洛仿真法为根据传播模型,在社区内部重复R次蒙特卡洛仿真,具体包括:在初始时刻,让 每个一阶种子节点处于活跃状态;对每个二阶种子节点,根据公式:W概率Pv(S)使其处于活跃状态,W此作为初始条件启动传 播巧巧,巧限制传滞M巧社K巧部进行;假设在R次仿真中,节点V被激活了R( V)次,则Pv( S, ,C)可作如下近似: Pv(S,S',C)=R(v)/R。4. 根据权利要求2所述的一种基于社区结构的影响最大化方法,其特征在于:所述节点 恒定值法包括:直接给每个除一阶和二阶种子节点外的节点赋予相同的Pv(s,s/,c)值,如 此即有: 根据公;在运种计算方法下,每个社区(除一阶和二阶种子节点之外)受影响的范围与该社区中 包含的节点数成正比。5. 根据权利要求2所述的一种基于社区结构的影响最大化方法,其特征在于:所述社区 恒定值法对社区中每个除一阶和二阶种子节点外的节点vGV\{SUSM,将它们的Pv(S,S/, C)值之和设为恒定值,即根据公式范围为: 在运种计算方法下,每个社区(除一阶和二阶种子节点外)受影响的范围为恒定值。6. 根据权利要求5所述的一种基于社区结构的影响最大化方法,其特征在于:在WC (Wei曲ted化scade,带权级联)传播模型下,采用所述社区恒定值法,将:转化为:g(s)= In(S)I +丫 Inc(S)I,其中,丫为可调参数,N(S)为S的邻居节点集合,NC (S)为S的邻居社区集合。
【文档编号】G06Q30/02GK105913287SQ201610340219
【公开日】2016年8月31日
【申请日】2016年5月20日
【发明人】尚家兴, 武红春, 周尚波, 林晓然, 齐颖, 吴晓雨
【申请人】重庆大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1