基于分形维模型的微博用户影响力度量方法与流程

文档序号:13236780阅读:312来源:国知局
基于分形维模型的微博用户影响力度量方法与流程

本发明涉及企业实施互联网营销战略领域,具体的说是一种基于社会资本理论的微博用户影响力分形维度量方法。



背景技术:

微博用户影响力是企业开展社会化营销的重要资源,利用微博用户影响力可以帮助企业遴选广告代言人,维系客户实现对产品及品牌的营销。然而在现实世界中,由于用户在社会知名度、从业经验、专业技能和个人魅力等特征上存在差异,使得其通过微博获取粉丝进而对其产生影响作用的能力有所不同。因此如何度量微博用户影响力成为社会化营销绩效最大化研究领域中的科学问题、企业互联网营销管理中的热点问题、社交网络分析的重要问题。

用户个体影响力度量问题研究成果主要领域分为三个方面,分别是:物理学视角下的网络拓扑结构角度;影响力传播最大化的传播学角度;行为学角度。网络拓扑结构角度认为社交网络的度是度量节点影响力的重要指标,粉丝数量越多,节点越处在社交网络的中心位置,其影响力越大;传播学角度认为影响力分为直接影响力和间接影响力,通过逐级迭代计算最终影响力的大小;个体行为方面对用户影响力的研究认为用户的行为决定用户影响力,分别对应回复、转发、阅读、评论等影响力。综上所述,目前对个体影响力评价方面并没有统一的认识,学者试图从网络结构、社交互动、个人属性、传播影响等各个方面试图更为全面的定义、测量用户影响力。然而上述研究只是从片面的单个方面去考虑用户影响力,或者即使考虑了较为全面的用户影响力概括,所使用的度量方法与理论并不能完美解释微博用户影响力。



技术实现要素:

本发明为了解决上述现有技术存在的不足之处,提供一种基于分形维模型的微博用户影响力度量方法,以期能解决微博用户的影响力度量问题,从而为企业挑选具有合适影响力的微博用户,为实施互联网营销战略提供方法依据。

为达到上述目的,本发明采用如下技术方案:

本发明一种基于分形维模型的微博用户影响力度量方法的特点是按照如下步骤进行:

步骤1、选取n个微博用户u={u1,u2,...ui,...un},,ui表示第i个微博用户,i=1,2,…,n;

步骤2、构建第i个微博用户ui的影响力度量指标集合,记为其中,表示第i个微博用户ui的第m种指标集合,m=1,2,…,m;所述指标集合包括:威望维度指标集、话语权力维度指标集和交互价值指标集,并有:表示第i个微博用户ui的第m种指标集合下的第k个子指标值;k=1,2,…,km,km表示第m种指标集合下的子指标总个数;

利用第i个微博用户ui的所有子指标值来表征第i个微博用户ui的影响力度量指标集合,记为表示第i个微博用户ui的第r个子指标值,r=1,2,…,r,r表示所有子指标值的总数;

步骤3、利用式(1)对第i个微博用户ui的第r个子指标值进行标准化处理,得到标准化后的第i个微博用户ui的第r个子指标值从而得到标准化后的第i个微博用户ui的r个子指标值进而得到n个微博用户的r个子指标值

y={y1,y2,…,yi,…yn}t

式(1)中,表示n个微博用户的第r个子指标值的平均值,sr表示n个微博用户的第r个子指标值的标准差;

步骤4、计算n个微博用户的r个子指标值y的协方差矩阵br×r,再计算协方差矩阵br×r的特征向量a1,a2,...an作为变换矩阵a={a1,a2,...,an},从而得到去相关性后的n个微博用户的r个子指标值z={z1,z2,...zi,...zn}t=ay;zi表示去相关性后的第i个微博用户ui的r个子指标值;

步骤5、构造微博用户影响力的分形维度量模型;

步骤5.1、将所述去相关性后的第i个微博用户ui的r个子指标值zi视为n维空间中各个坐标点;定义n维空间中任意两个坐标点之间的距离为且p≠q;由所有坐标点之间的距离构成距离集合并令为所述距离集合gi中的距离最大值;

步骤5.2、定义循环次数为t,并初始化t=1;

步骤5.3、定义初始第t次循环的半径为rt,并初始化rt>0;定义步长为δr;

步骤5.4、令第t+1次循环的半径rt+1=rt+δr;

步骤5.5、利用式(2)得到在第t+1次循环中,所述距离集合gi中距离值在半径为rt+1的球内的个数与距离集合gi中所有距离值的比例ci(rt+1):

式(2)中,表示heaviside函数,并有:

步骤5.6、分别计算ln(rt+1)和lnci(rt+1)并保存为二维点集;

步骤5.7、判断是否成立,若成立,则表示距离集合gi中所有距离值均在球内,否则,令t+1赋值给t,返回步骤5.4;

步骤5.8、将所有保存的二维点集作成散点图,根据所述散点图,利用最小二乘法进行拟合,得到的斜率即第i个微博用户ui的分维数di;以所述分维数di表征第i个微博用户ui的影响力。

与现有技术相比,本发明的有益效果体现在:

1、本发明通过构造声誉威望维度、话语权力维度及交互价值三维度用户影响力数据集,充分反映了用户微博影响力形成、彰显及传递过程,避免了传统方法单一考虑物理结构或者用户行为的缺陷,利用分形维理论,构建微博用户影响力的分形维度量模型,通过对模型的求解和计算,形成一套微博用户影响力分形维度量方法,为企业挑选合适的用户进行社会化营销提供支持。

2、本发明创建的微博用户影响力分形维度量方法,完美契合了微博用户影响力的复杂性、迭代性、以及传播过程相似性,避免了传统方法只能处理二维与线性问题,更好的刻画了微博用户影响力内部的功能与分布特征,且在计算时不需要考虑各指标权重问题。

3、本发明对heaviside函数进行了改进,改进后克服了分形方法对数据集数量要求的限制,极大降低了企业挑选合适用户进行社会化营销支持的难度,保证企业以更少的成本、更少的时间挑选到合适的微博用户。

附图说明

图1为本发明方法的流程图;

图2为本发明排名最终结果图。

具体实施方式

本实施例中,如图1所示,一种微博用户影响力分形维度量方法是按照如下步骤进行:

步骤1、基于社会资本理论从声誉威望、话语权力、交互价值三个方面构建微博用户影响力度量指标体系,如表1所示:

表1微博用户影响力测度指标体系

步骤2、选取n个微博用户u={u1,u2,...ui,...un},,ui表示第i个用户,1≤i≤n;

本文选取新浪微博商业领域中用户为研究对象,选取40个用户为研究对象,在借助集搜客数据采集工具基础上逐日采集并记录从2016年12月1日起到2017年3月31日为止4个月的数据。

步骤3、构建第i个微博用户ui的影响力度量指标集合,记为其中,表示第i个微博用户ui的第m种指标集合,m=1,2,…,m;本实施例中,采用m=3种指标集合,包括:威望维度指标集、话语权力维度指标集和交互价值指标集,并有:表示第i个微博用户ui的第m种指标集合下的第k个子指标值;k=1,2,…,km,km表示第m种指标集合下的子指标总个数;

利用第i个微博用户ui的所有子指标值来表征第i个微博用户ui的影响力度量指标集合,记为表示第i个微博用户ui的第r个子指标值,r=1,2,…,r,r表示所有子指标值的总数;

本实施例中,如表一所示,k1=3,k2=3,k3=4,r=10。表示初始用户等级;表示用户初始粉丝数量;表示用户初始微博数量;表示用户平均关键词数量;表示用户平均文本字数;表示用户新增原创微博数量;表示用户博文平均转发数量;表示用户博文平均评论数量;表示用户博文平均获赞数量;表示用户新增粉丝数量。

具体实施中对数据进行如下处理工作:①初始用户等级、②初始粉丝数量、③初始微博数量,此三个指标均是根据观测当天博主主页所显示信息如实记录并数量化。④平均关键词数量,文本关键词是文本关键词数是运用中国科学院计算机所软件室的中文分词工具

ictclas对数据库中的词条进行切词和统计所得。平均关键词数量,对用户观测期间所有微博逐一统计关键词数后计算平均值,⑤平均文本字数,用户观测期间所有微博逐一统计文本字数后计算平均值。⑥新增原创微博数量,对于用户观测期间内所有微博,转发标记为0,原创标记为1,计算观测期间所有原创微博数目。⑦博文平均转发数量、⑧博文平均评论数量、⑨博文平均获赞数量,此三个指标,首先计算总值,再计算平均值。⑩新增粉丝数量,此子指标是根据观测终止日粉丝数量减去观测开始日粉丝数量得来。若为正值则为增加量,若为负值则为减少量。若观测期间观测的微博用户没有发微博,则相关系列指标记录为0。

经过上述数据处理,整个观测期内收集到的数据经过处理后,得到数据见表2:

表2微博用户部分数据一览表

步骤4、利用式(1)对第i个微博用户ui的第r个子指标值进行标准化处理,得到标准化后的第i个微博用户ui的第r个子指标值从而得到标准化后的第i个微博用户ui的r个子指标值进而得到n个微博用户的r个子指标值y={y1,y2,…,yi,…yn}t

式(1)中,表示n个微博用户的第r个子指标值的平均值,sr表示n个微博用户的第r个子指标值的标准差;

本实施例中,标准化处理得到的值如表3、表4所示。

表2sr数据一览表

表3微博用户标准化后部分数据一览表

步骤5、计算n个微博用户的r个子指标值y的协方差矩阵br×r,再计算协方差矩阵br×r的特征向量a1,a2,...an作为变换矩阵a={a1,a2,...,an},从而得到去相关性后的n个微博用户的r个子指标值z={z1,z2,...zi,...zn}t=ay;zi表示去相关性后的第i个微博用户ui的r个子指标值;本实例计算所得bn×n中对应数据元素为:

本实例计算所得z={z1,z2,...zi,...zn}t中对应数据元素为:

步骤6、构造微博用户影响力的分形维度量模型;

步骤6.1、将所述去相关性后的第i个微博用户ui的r个子指标值zi视为n维空间中各个坐标点;定义n维空间中任意两个坐标点之间的距离为且p≠q;由所有坐标点之间的距离构成距离集合并令为所述距离集合gi中的距离最大值;

步骤6.2、定义循环次数为t,并初始化t=1;

步骤6.3、定义初始第t次循环的半径为rt,并初始化rt>0;定义步长为δr;

步骤6.4、令第t+1次循环的半径rt+1=rt+δr;

步骤6.5、利用式(2)得到在第t+1次循环中,所述距离集合gi中距离值在半径为rt+1的球内的个数与距离集合gi中所有距离值的比例ci(rt+1):

式(2)中,表示heaviside函数,并有:

步骤6.6、分别计算ln(rt+1)和lnci(rt+1)并保存为二维点集;

步骤6.7、判断是否成立,若成立,则表示距离集合gi中所有距离值均在球内,否则,令t+1赋值给t,返回步骤5.4;

步骤6.8、将所有保存的二维点集作成散点图,根据所述散点图,利用最小二乘法进行拟合,得到的斜率即第i个微博用户ui的分维数di;以所述分维数di表征第i个微博用户ui的影响力。本实施例中,计算得到的分形维数如表3.

表3微博用户分形维及截距数据

步骤7、对所得结果进行排序得到图2所示微博用户影响力排名图,如图2所示。

本方法基于社会资本理论构建微博用户影响力三维度数据集,克服了影响力测度体系单一不全面的问题,用户影响力分形维度量方法则契合了影响力价值实现过程复杂性、迭代性与相似性的特征,经过验证该方法实用且有效。微博用户分形维度量方法对于企业挑选合适用户作营销推广具有重要的意义。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1