基于团体的竞争影响力最大化方法与流程

文档序号:14774312发布日期:2018-06-23 02:38阅读:238来源:国知局
基于团体的竞争影响力最大化方法与流程

本发明涉及一种基于团体的竞争影响力最大化方法,属于社交网络分析技术领域。

背景内容

目前在社交网络上计算影响力的传播范围大多都是以全局影响节点总数来衡量,未考虑到团体决策效应,即,忽略了团体内的局部影响。具体的社交网络中关于影响力最大化的研究通常以计算全局受影响的节点数来代表影响范围,具体如图1所示,但是这忽略了这样一种情况——一个群体内多数人赞同的观点最终会代表该群体的观念,群体的团购行为是这一现象的典型案例。在这种情况下,以全局受影响的节点数目来衡量影响范围将显得过于片面。

名字解释:

Louvain算法即是一种基于模块度的图算法模型。

LT模型:线性阈值模型,即一种信息传播模型,是信息传播过程的抽象描述。



技术实现要素:

本发明克服现有技术存在的不足,本发明公开了一种基于团体的竞争影响力最大化方法。本发明根据团体大小进行分组,团体内部按多数人观点进行统一决策,并考虑团体外部侧面影响,根据团体大小进行分组,有利于区分不同产品,实现对不同规模团体的广告选种算法,使推广人群更加明确;团体内部按多数人观点进行统一决策是反映团体中人的从众心理,具有现实参考价值;团体外部侧面影响是反映现实生活中群体间的口碑效应,在广告推广过程中,也是不可忽视的因素。

为解决上述技术问题,本发明所采用的技术方案为:

一种基于团体的竞争影响力最大化方法,包括如下步骤:

步骤一:网络中挑选合适传播时间的传播团体,对挑选的得到的团体给定网络结构G(V,E)G()表示无向无权图,V为无向无权图中节点集合,E为无向无权图中边集合;预处理获得的团体集合Groups,竞争节点集SN,影响因素ρ,规模比例τ;(合适传播时间中合适的意思是指,同一团体传播时间不同,估算获得的影响范围不同,选取最划算的传播时间的团体。

举例来说,有团体A,传播时间为2时,估算影响范围为10,代价为5,传播时间为1时,估算影响范围20,代价15,所谓合适即性价最好的,团体A选传播时间为2。)

步骤二:使用初始化任意团体A对团体B的权重;

其中,表示团体A指向团体B的边集合;CA表示团体A,CB表示团体B;TE(CB)表示团体B内的总边数与其他团体指向团体B的边数之和;

步骤三:建立社区传播模型,使用团体中挑选节点算法获得Groups中每个团体Ci在被以ρ比例正激活的最长时间Tmax(Ci+,ρ);Ci+表示团体i被正激活,即选取目标种子节点激活

步骤四:对于团体集合Groups中每一个团体Ci通过团体中挑选节点算法计算团体Ci在时间范围1~Tmax(Ci+,ρ)内,各时间点获得的影响力-开销比,即影响力除以开销的比值;本步骤所述的时间的单位是抽象化的,代表网络中的跳数,一定为整数,如果Tmax(Ci+,ρ)=0,代表团体i选取的节点数超过团体总数的ρ比例,在现实生活中是不现实的,故取从1开始。

步骤五:在步骤一挑选的团体中挑选每一个时间,获得影响力-开销比最大的团体,并对比选出最佳时间s的团体p的种子,将其加入挑选的目标种子节点集合SP;最佳时间s指在开始时,我们计算每个团体在1~Tmax(Ci+,ρ)每个时间点里影响力/开销,选取该团体影响力-开销比最大的,记录此时时间s。再对于每个团体分时间计算后获得影响力-开销比的最大值进行比较,选取最大的,即最佳时间s的团体p。

步骤六:若挑选团体的邻居团体j传播时间大于s的则更新挑选团体的邻居群组激活阈值;

步骤七:更新团体p邻居团体在不同时刻达到激活阈值的开销及种子集;若目标种子节点集合SP影响范围I(SP)<τ*|V|,则重复步骤三到六,若I(SP)≥τ*|V|则将得到的正种子节点集合SP输出,目标广告推广用户。

进一步的改进,所述步骤一中挑选竞争节点集SN(竞争对手)的种子节点时,分别采用两种不同的方法进行挑选:

一是随机挑选:随机挑选的总节点数为

二是依据社区内部节点度的大小等间隔挑选:将竞争种子在每个社区的数目控制为等间隔挑选时,间隔为竞争节点集SN,此处对于其来源进行阐述,上面2种方法都要使用,实验时,通过竞争节点集SN的不同选择方法(对于同一个数据集,分别用两种方法选取不同的竞争种子,观察输出的SP集合),来体现算法的有效性。

进一步的改进,所述步骤三中,建立社区传播模型,步骤如下:

Ⅰ)假设为正初始影响传播集合,即正种子集合;为负初始影响传播集合,即负种子集合;其中R0+表示正初始影响传播集合,即正种子集合,V表示给定的无向无权图中所有节点集合,R0-表示负初始影响传播集合,即负种子集合;

Ⅱ)建立LT竞争模型,以团体为单位进行影响力统计,设当团体Ci中被某一正影响的节点数目达到ρ*n(Ci)时,团体Ci节点被(正)的影响全部占据,并不再改变;其中

Ⅲ)当节点u中≥ρ*d(u)个邻居被激活时,节点u被激活,并不再改变;ρ表示影响因素,0<ρ<1,d(u)表示节点u的度数,或者说邻居数;

Ⅳ)允许重叠的种子,即一个单一的种子可以服务多个影响;

Ⅴ)每一个非种子节点,设4个可能的状态:正激活状态P_active,负激活状态N_active,中立状态Neutral和未激活状态Inactive;

Ⅵ)竞争采用先到先得,同时到达节点阈值则节点保持中立的原则,但一旦激活状态不再发生改变;

Ⅶ)一个节点如果有多种影响共存,那么各影响对其邻居的阈值影响均为1;

Ⅷ)影响力计算:网络中节点状态不再发生变化时,我们开始计算各影响的范围,对于正影响来说,网络中的节点若正激活,范围加1,若中立,范围加0.5,未激活不考虑。

进一步的改进,所述团体中挑选节点算法包括如下步骤:

一)刻画团体网络结构的:G(V,E);竞争节点集SN,影响因素ρ,达到阈值时最大传播时间t;其中,G()表示无向无权图,V为无向无权图中节点集合,E为无向无权图中边集合

二)在网络G中挑选符合下式的种子节点v:

将挑选的节点v加入目标种子节点集合SP;其中,arg max()表示(取括号里面取最大值时候的节点v),I表示(影响范围),I(SP)表示目标种子集合SP的影响范围,c(v)表示选择节点v的成本,为简化实验,实验中c(v)=1;

三)若目标种子节点集合SP影响范围I(SP)<ρ*|V|,则返回步骤二),否则记录此时的种子SP,传播时间T;

四)若传播时间T>t,则重复步骤二),直至t>T,返回目标种子节点集合SP,t表示(达到阈值时最大传播时间t)。

进一步的改进,所述刻画团体网络结构的步骤如下:

5.1)团体A,B间的边权重WAB为:

其中表示团体A指向团体B的边集合,TE(CB)表示表示团体B内的总边数与其他团体指向团体B的边数之和;

5.2)团体Ci正激活后对团体Ci的邻居团体Cj的正激活阈值影响为:

表示团体Ci和Cj间的边权重;

5.3)团体Ci负激活后对团体Ci的邻居团体Cj的负激活阈值

的影响为:

5.4)估算团体激活后获得的影响力I(Ci):

团体Ci激活获得的影响范围为团体Ci的节点总数加上团体Ci与邻居团体的权重乘以邻居团体的节点总数,即,

n(Ci)表示团体i内的节点总数。

附图说明

图1为现有的影响力最大化流程图。

图2为本发明的流程图。

图3为Youtube数据集的真实数据图与处理结果图。

具体实施方式

如图2-3所示,

一、数据预处理

本专利使用改进的Louvain算法对社区进行划分。原始的Louvain算法会产生resolution limit问题,即,会阻止在大网络中检测小社区。本专利引用他人改进算法,通过resolution参数对社区结构进行不同层次的研究,进而缓解这种影响。通过统计网络的ground-truth数据集,调整Louvain改进算法中的参数resolution获得与该网络中真实社区大小比例相似的groups。下图3,a,b分别为Youtube数据集(N=1,134,890,E=2,987,624)的ground-truth数据集统计结果,以及该数据集调参后获得的结果统计图,统计时忽略社区节点内节点数目小于3的社区,横坐标为社区内节点数目,纵坐标为社区内节点数目小于横坐标值的社区数占总社区数目的比例。

二、模型介绍

社区传播模型:假设为正初始影响传播集合,即正种子集合(即目标种子节点集合SP);为负初始影响传播集合,即负种子集合。

1)竞争模型以LT模型为基础,以团体为单位进行影响力统计,即当团体Ci中被某一影响的节点数目达到ρ*n(Ci)时,该团体节点被该影响全部占据,并不再改变。

2)当节点u中ρ*d(u)个邻居被激活时,节点u被激活,并不再改变。;

3)允许重叠的种子,即一个单一的种子可以服务多个影响。

4)每一个非种子节点,有4个可能的状态:P_active,N_active,Neutral,Inactive,分别代表正激活,负激活,中立和未激活这四种状态。

5)竞争采用先到先得,同时到达节点阈值则节点保持中立的原则,但一旦激活状态不再发生改变。

6)一个节点如果有多种影响共存,那么各影响对其邻居的阈值影响均为1。

7)影响力计算:Iv是t时刻节点v接受到影响的集合,在t+1时刻,其中每个有影响力1/Iv

影响因素0<ρ<1是一个常量,是决定网络中影响传播快慢的一个重要因素。它反映了在真实世界中人们接收一个观点的难易程度。ρ=1/2是我们常说的majority model,在投票,选举中经常被用到。在本文中,有两处用到参数ρ:一是社区S中节点v被激活,当且仅当其激活邻居的数目大于等于ρ*d(v);二是社区S意见统一,当且仅当社区S中某一影响的节点集合数目大于等于ρ*n(Ci)。

三、算法

1.符号及其相关含义

2.竞争节点选择算法

为模拟现实生活中的影响力传播的复杂情况,本专利考虑涉及多产品的竞争。挑选竞争对手的种子节点时,分别采用两种不同的方法进行挑选:

一是随机挑选。随机挑选的总节点数为

二是依据社区内部节点度的大小等间隔挑选。将竞争种子在每个社区的数目控制为等间隔挑选时,间隔为

3.团体中挑选节点算法

步骤1:给定团体网络结构G(V,E),竞争节点集SN,影响因素ρ,达到阈值时最大传播时间t;

步骤2:使用在网络G中挑选种子节点v,将其加入目标种子节点集合SP

步骤3:若目标种子节点集合SP影响范围I(SP)<ρ*|V|,则返回步骤2,否则记录此时的种子SP,传播时间T

步骤4:若此时的传播时间T>t,则重复上述步骤2,直至t>T,返回目标种子节点集合SP。

4.网络中挑选团体

4.1本专利考虑团体效应,故不考虑团体成员对外产生的影响,将其整合为团体间影响,使用如下方法进行刻画:

(1)团体A,B间的边权重WAB。

(2)团体Ci正激活后对邻居团体Cj的正激活阈值的影响。

(3)团体A负激活后对邻居团体的负激活阈值的影响与正激活类似。

4.2团体激活后获得的影响力计算

由于团体由社区划分而来,那么团体间的影响小于内部内部影响,加之计算上的复杂性,本专利在计算团体激活后对外获得的影响力时进行简化,即,简单考虑团体激活时间小于邻居团体最小种子集激活时间的情况。

团体Ci激活获得的影响范围为团体Ci的节点总数加上团体Ci与

邻居团体的权重乘以邻居团体的节点总数。即,

4.2网络中挑选合适传播时间的团体

步骤1:给定网络结构G(V,E),预处理获得的团体集合Groups,竞争节点集SN,影响因素ρ,规模比例τ。

步骤2:使用初始化任意团体a对团体b的权重。

步骤3:使用团体中挑选节点算法获得Groups中每个团体在被以ρ比例正激活最长时间Tmax(Ci+,ρ)。

步骤4:对于团体集合Groups中每一个团体Ci通过团体中挑选节点算法计算其在不同时间(1~Tmax(Ci+,ρ))完成获得的影响力/开销。

步骤5:在未选择过的团体中挑选每一个时间获得影响力/开销最大的团体,并将对比选出最佳时间s的团体p的种子,将其加入SP。

步骤6:若挑选团体的邻居j传播时间大于s的则更新其邻居群组激活阈值。

步骤7:更新团体p邻居团体在不同时刻达到激活阈值的开销及种子集。

步骤8:若I(SP)<τ*|V|,则重复步骤3-6,否则结束。

上述实例仅是本发明的一个具体实施方式,对其的简单变换、替换等也均在发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1