社交网络用户相对影响力度量方法与流程

文档序号:11178252阅读:851来源:国知局
社交网络用户相对影响力度量方法与流程

本发明涉及一种网络影响力度量方法,具体地说是一种度量社交网络用户相对影响力的方法。

技术背景

web2.0时代,ugc成为网络内容产生的主流渠道,越来越多的用户通过互联网主动地检索、发布和传播信息,有意识地积累自身网络话语影响力。大量的研究成果表明,在社会化媒体平台,具有影响力的网络用户无论在信息传播还是信息引导方面都至关重要。互联网的开放性和繁杂性意味着网络用户的差异性和网络内容的多样性。不同网络用户因文化背景、知识建构、经历经验、社会关系和社会活动能力等方面的差异,其关注的领域和话题也有所不同,导致其网络影响力的作用范围和作用强度也千差万别。

目前关于网络用户影响力度量和识别的研究,主要集中于:(1)从物理学角度,深入研究用户的网络结构、链接层次和社交关系,采用社会网络分析的方法,描述其物理拓扑结构以及结点之间的关系,以计算获得用户的网络影响力;(2)从信息传播学角度,深入研究网络用户的信息选择行为以及彼此间的关注关系,运用pagerank算法计算获得用户的网络影响力;(3)从传播学角度,分析网络用户影响力的传播特征和覆盖范围,建立网络影响力传播概率模型,以获得用户的网络影响力;(4)从信息管理学角度,根据用户之间的信息发布和选择行为,刻画其个人和社会性属性特征,构建用户影响力多维信息熵测度模型,以计算获得用户的网络影响力。

现有研究虽然从不同视角研究了网络用户影响力的度量方法,但大多是度量用户影响力的整体大小,鲜少分析用户影响力在作用范围和作用强度上的相对性表现,无法全面地评估用户影响力的效用价值,增加了遴选网络用户的决策难度。



技术实现要素:

本发明为克服现有技术存在的不足,提供一种社交网络用户相对影响力度量方法,以期能界定网络用户影响力作用的领域范围,度量用户基于不同领域方向的影响力大小,从而识别用户影响力的优势作用领域方向,进而降低网络用户遴选难度,提升决策质量。

为了达到上述目的,本发明采用如下技术方案:

本发明一种社交网络用户相对影响力的度量方法的特点是按如下步骤进行:

步骤1、基于个人属性特征、社会性属性特征以及与各领域方向的相关度,构建社交网络用户集中任一用户ui的相对影响力测度指标集为{pi,si,ri},其中,pi表示用户ui的个人属性,并有pi={pi1,pi2,…,pix,…,pih},pix表示用户ui的第x项个人属性指标,h为个人属性指标项的数量,且x=1,2,…,h;si表示用户ui的社会性属性,并有si={si1,si2,…,siy,…,sig},siy表示用户ui的第y项社会性属性指标,g为社会性属性指标项的数量,且y=1,2,…,g;ri表示用户ui与各领域方向相关度集合,并有ri={ri1,ri2,…,rik,…,rim},rik表示用户ui与领域f中第k个领域方向fk的相关度,m为领域方向的数量,且k=1,2,…,m;

步骤2、运用主客观综合赋权方法,确定所述社交网络中用户ui的个人属性pi和社会性属性si的权重及其相应指标的权重:

步骤2.1、利用专家打分法分别对个人属性和社会性属性的重要程度进行经验打分,得到所有专家打分的均值并进行归一化处理,获得个人属性的权重α和社会性属性的权重β;

步骤2.2、基于所述用户集的个人属性指标和社会性属性指标,建立初始矩阵d,根据各项指标效益的正负,对初始矩阵d进行无量纲化处理得到无量纲矩阵d',利用熵权法对所述无量纲矩阵d'进行计算,得到个人属性指标项权重集合和社会性属性指标项集合

步骤3、构建用户ui的文本特征向量vui和各领域方向文本特征向量vfk,计算用户ui与各领域方向的相关度:

步骤3.1、获取第k个领域方向fk下所有用户发布的文本,利用分词工具标记和统计关键词,得到第k个领域方向fk的特征词项集合tk={tk1,tk2,…,tka,…,tka},其中,tka表示第k个领域方向fk的第a个特征词项,a表示第k个领域方向fk的特征词项数量;从而得到m个领域方向的特征词项集合{t1,t2,…,tk,…,tm};

步骤3.2、对m个领域方向的特征词项集合{t1,t2,…,tk,…,tm}中的特征词项去重,构造所述领域f的特征词项集合t={t1,t2,…,tp,…tn},其中tp表示第p个特征词项,则用n维向量表示第k个领域方向fk和用户ui文本特征向量,记为其中,表示第p个特征词项tp在第k个领域方向fk中的权重,表示第p个特征词项tp在用户ui文本中的权重;

步骤3.3、利用式(1)和式(2)计算第p个特征词项tp在第k个领域方向fk中的权重和第p个特征词项tp在用户ui文本中的权重

式(1)中,nfk表示第k个领域方向fk下的用户文本数量,dj表示第k个领域方向fk下的第j个用户文本,tf-idf(tp,dj)表示利用tf-idf公式计算得到的第p个特征词项tp在第j个用户文本dj中的权重,表示第p个特征词项tp在所述领域f中的整体重要程度,其中,表示第p个特征词项tp出现在m个领域方向的特征词项集合{t1,t2,…,tk,…,tm}中的次数,

式(2)中,nui表示用户ui发布的文本数,dl为用户ui发布的第l个文本,tf-idf(tp,dl)为利用tf-idf公式计算得到第p个特征词项tp在第l个文本dl中的权重;

步骤3.4、利用式(3)计算用户ui与第k个领域方向fk的相关度rik,从而得到用户ui与m个领域方向的相关度集合ri:

步骤4、构建所述社交网络中用户ui的相对影响力测度模型,计算用户ui的相对影响力:

步骤4.1、利用式(4)和式(5)计算用户ui的个人属性值ip(ui)和社会性属性值is(ui):

步骤4.2、利用式(6)构建用户ui的个人影响力总量测度模型:

c(ui)=ip(ui)+is(ui)(6)

式(6)中,c(ui)表示用户ui的个人影响力总量大小;

步骤4.3、利用式(7)构建用户ui基于第k个领域方向fk的影响力测度模型:

式(7)中,表示用户ui基于第k个领域方向fk的影响力大小;

步骤4.4、利用式(8)和式(9)分别计算用户ui的相对影响力:

式(8)中,rcu(i)表示用户ui影响力总量的相对大小,表示用户集影响力总量的均值;

式(9)中,rcu(ik)表示用户ui在第k个领域方向fk下的相对影响力,表示用户集基于第k个领域方向fk的影响力均值。

相较于现有技术,本发明的有益效果体现在:

1、本发明通过分析网络用户文本内容与各领域方向的相关度,界定用户关注或涉及的领域方向,并结合社交网络用户在个人属性和社会性属性方面的特征表现,从用户自身和网络全局两个角度,设计了网络用户相对影响力的度量模型,既考虑了用户整体影响力大小,也明晰了用户在不同领域方向下的影响力大小,提高了网络用户影响力的适用性,降低了影响力用户挑选难度。

2、本发明基于各领域方向的特征词项集合,构建表征整体领域的特征词项向量,通过该向量构建用户文本特征向量和各领域方向的文本特征向量,保证了准确度的同时,也降低了操作复杂度。

3、本发明综合考虑特征词项在某一领域方向和整体领域中的重要程度,获得特征词项在各领域方向文本特征向量中的权重,凸显了各领域方向间的关联性,提高了权重计算准确度。

4、本发明构建的网络用户相对影响力度量模型,能够从自身相对和全局相对两个角度,评估用户整体相对影响力及其在不同领域方向下的相对影响力,克服了传统单一度量影响力大小的局限性,极大地提升了网络用户影响力的适用性和实用性,降低了挑选网络用户的决策难度。

附图说明

图1为本发明度量方法的流程图;

图2为用户影响力总量大小分布效果曲线;

图3为用户基于不同领域方向的影响力分布效果图。

具体实施方式

本实施例中,如图1所示,一种社交网络用户相对影响力的度量方法,可有效界定网络用户影响力作用的领域范围,并度量用户在不同范围内的影响力大小,克服了以往仅考虑用户影响力总量的局限,有助于识别网络用户的优势领域方向,降低网络用户的挑选难度,可用于社会化网络广告投放、社区管理、舆情监测等领域。具体的说,该方法是按如下步骤进行:

步骤1、基于个人属性特征、社会性属性特征以及与各领域方向的相关度,构建社交网络用户集中任一用户ui的相对影响力测度指标集为{pi,si,ri},其中,pi表示用户ui的个人属性,并有pi={pi1,pi2,…,pix,…,pih},pix表示用户ui的第x项个人属性指标,h为个人属性指标项的数量,且x=1,2,…,h;si表示用户ui的社会性属性,并有si={si1,si2,…,siy,…,sig},siy表示用户ui的第y项社会性属性指标,g为社会性属性指标项的数量,且y=1,2,…,g;ri表示用户ui与各领域方向相关度集合,并有ri={ri1,ri2,…,rik,…,rim},rik表示用户ui与领域f中第k个领域方向fk的相关度,m为领域方向的数量,且k=1,2,…,m;

“汽车之家”论坛以品牌社区为组织方式,且各品牌社区间的界线比较清晰,本发明采用汽车之家jeep品牌社区数据,将jeep品牌社区视为用户话题聚焦的领域f,社区中的产品论坛视为各领域方向fk。通过网络爬虫,获取统计时段内各产品论坛中用户发布的所有文本、用户个人属性指标数据、用户社会性属性指标数据以及用户发布的文本。

本实施例中,构建用户ui的相对影响力测度指标集为{pi,si,ri},其中,pi表示用户ui的个人属性,pi={pi1,pi2,…,pix,…,pi5},pi1表示用户在jeep品牌社区中的网络等级;pi2表示用户身份认证状态,通过记为1,未通过记为0;pi3表示用户的粉丝数;pi4表示发文数量,指用户在统计时段内发布的文本数量;pi5表示高质量文本数量,指统计时段内用户发布的高质量文本数量,本例指用户发布的精华帖数量;si={si1,si2,si3},si表示用户ui的社会性属性,si1表示文本平均点击量,指统计时段内用户发布文本的点击总数/发文数量;si2表示文本平均回复量,指统计时段内用户发布文本的回复总数/发文数量;si3表示高等级用户回复数,指统计时段内用户发布文本的高等级用户回复总数;ri={ri1,ri2,ri3,ri4},ri1,ri2,ri3,ri4分别表示用户与jeep品牌社区下牧马人产品、指南者产品、大切诺基产品、自由光产品的相关度。

步骤2、运用主客观综合赋权方法,确定所述社交网络中用户ui的个人属性pi和社会性属性si的权重及其相应指标的权重:

步骤2.1、利用专家打分法分别对个人属性和社会性属性的重要程度进行经验打分,得到所有专家打分的均值并进行归一化处理,获得个人属性的权重α和社会性属性的权重β;

步骤2.2、基于所述用户集的个人属性指标和社会性属性指标,建立初始矩阵d,根据各项指标效益的正负,对初始矩阵d进行无量纲化处理得到无量纲矩阵d',利用熵权法对所述无量纲矩阵d'进行计算,得到个人属性指标项权重集合和社会性属性指标项集合

本实施例中,各指标权重计算结果见表1。

表1各指标权重计算结果

步骤3、构建用户ui的文本特征向量vui和各领域方向文本特征向量vfk,计算用户ui与各领域方向的相关度:

步骤3.1、获取第k个领域方向fk下所有用户发布的文本,利用分词工具标记和统计关键词,得到第k个领域方向fk的特征词项集合tk={tk1,tk2,…,tka,…,tka},其中,tka表示第k个领域方向fk的第a个特征词项,a表示第k个领域方向fk的特征词项数量;从而得到m个领域方向的特征词项集合{t1,t2,…,tk,…,tm};

步骤3.2、对m个领域方向的特征词项集合{t1,t2,…,tk,…,tm}中的特征词项去重,构造所领域f的特征词项集合t={t1,t2,…,tp,…tn},其中tp表示第p个特征词项,则用n维向量表示第k个领域方向fk和用户ui文本特征向量,记为其中,表示第p个特征词项tp在第k个领域方向fk中的权重,表示第p个特征词项tp在用户ui文本中的权重;

步骤3.3、利用式(1)和式(2)计算第p个特征词项tp在第k个领域方向fk中的权重和第p个特征词项tp在用户ui文本中的权重

式(1)中,nfk表示第k个领域方向fk下的用户文本数量,dj表示第k个领域方向fk下的第j个用户文本,tf-idf(tp,dj)表示利用tf-idf公式计算得到的第p个特征词项tp在第j个用户文本dj中的权重,表示第p个特征词项tp在所述领域f中的整体重要程度,其中,表示第p个特征词项tp出现在m个领域方向的特征词项集合{t1,t2,…,tk,…,tm}中的次数,

式(2)中,nui表示用户ui发布的文本数,dl为用户ui发布的第l个文本,tf-idf(tp,dl)为利用tf-idf公式计算得到第p个特征词项tp在第l个文本dl中的权重;

步骤3.4、利用式(3)计算用户ui与第k个领域方向fk的相关度rik,从而得到用户ui与m个领域方向的相关度集合ri:

本实施例中,用户ui与各领域方向相关度计算结果见表2。

表2用户ui与各领域方向相关度计算结果

步骤4、构建所述社交网络中用户ui的相对影响力测度模型,计算用户ui的相对影响力:

步骤4.1、利用式(4)和式(5)计算用户ui的个人属性值ip(ui)和社会性属性值is(ui):

步骤4.2、利用式(6)构建用户ui的个人影响力总量测度模型:

c(ui)=ip(ui)+is(ui)(6)

式(6)中,c(ui)表示用户ui的个人影响力总量大小;

本实施例中,各用户的影响力总量计算结果见表3。

表3用户ui的影响力总量计算结果

各用户影响力总量大小分布曲线如图2所示,不同用户影响力总量具有相对性,此外,即使两个用户的影响力总量大小一致,其个人属性值和社会性属性值也可能存在差别,如用户u7和u9。

步骤4.3、利用式(7)构建用户ui基于第k个领域方向fk的影响力测度模型:

式(7)中,表示用户ui基于第k个领域方向fk的影响力大小;

本实施例中,用户基于各领域方向的影响力计算结果见表4。

表4用户ui基于各领域方向的影响力计算结果

不同用户基于各领域方向的影响力分布效果如图3所示,结果显示不同用户其影响力的作用范围和作用强度具有较大差异,用户u10四个领域方向皆有涉及,且在大切诺基中影响力最大;而用户u2、u7仅涉及一个领域方向,且影响力作用领域方向不一致;u7和u9影响力总量大小基本一致,但两者影响力的作用范围和作用强度也大相径庭。同时,影响力总量高的用户,具体到某一领域方向上,影响力作用效果未必最佳,以牧马人为例,用户影响力总量,由大到小依次是u2>u1>u9>u10,而在牧马人方向下,用户的影响力由大到小依次为:u1>u2>u10>u9。

步骤4.4、利用式(8)和式(9)分别计算用户ui的相对影响力:

式(8)中,rcu(i)表示用户ui影响力总量的相对大小,表示用户集影响力总量的均值;

式(9)中,rcu(ik)表示用户ui在第k个领域方向fk下的相对影响力,表示用户集基于第k个领域方向fk的影响力均值。

本实施例中,用户ui整体相对影响力和基于各领域方向的相对影响力计算结果见表5和表6。

表5用户ui整体相对影响力计算结果

表6用户ui基于各领域方向的相对影响力计算结果

以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1