一种社会网络用户参与主题行为分析方法

文档序号:6514904阅读:149来源:国知局
一种社会网络用户参与主题行为分析方法
【专利摘要】本发明涉及的是一种社会网络用户参与主题的行为分析方法。本发明包括:定义主题相似性,关键词相似性,并建立“用户—主题—关键词”三个层次的网络模型;设计具有最大区分度的“关键词”选择算法;给出用户行为分析的相关定义和计算公式,具体包括:用户主动参与主题行为,被动参与主题行为,主题传播力以及主题影响力,并对用户参与主题的行为进行分析。本发明用网络模型完整的记录了用户在社会网络中的行为,并设计了具有最大区分度的关键词选择算法,保证了用户行为分析的效率。
【专利说明】一种社会网络用户参与主题行为分析方法
【技术领域】
[0001]本发明涉及的是一种社会网络用户参与主题的行为分析方法。
【背景技术】
[0002]社会网站的流行使得人们分享和传播信息变得十分方便和快捷,不同用户对网络信息有着不同的喜好程度,如何分析用户选择信息的行为方式,并根据用户参与主题的行为特征推荐用户可能喜欢的信息内容是一个重要的研究问题。
[0003]目前国内外的研究学者在这些方面已经有了一定的研究和应用的成果。如:《Science》杂志干丨J 登的 The Spread of Behavior in an Online Social NetworkExperiment研究了行为的传播对于网络结构的影响。在《电子学报》杂志刊登的“基于用户偏好的嵌入性网络结构分析”一文分析了用户行为与其所处的互联网及现实社会关系网络之间的双重嵌入关系,从关系性嵌入和结构性嵌入两个维度给出了一些测度指标和分析方法。《计算机应用与软件》杂志刊登的“基于短信的社会网络行为分析”一文从交往圈和交往频度这两个方面对手机用户的短信发送行为进行实证研究。通过对出度、入度、交往圈大小、入出边比、新联系人比、出边平均权重和出边权重方差等七个行为特征的统计分析。《计算机研究与发展》杂志中“基于用户行为的色情网站识别”一文验证了用户访问色情网站与普通网站时的行为的差异性,并设计了基于用户行为的色情网站识别方法。《小型微型计算机系统》杂志刊登的“基于情感词典扩展技术的网络舆情倾向性分析”针对网民关于话题评论简单、数目众多的特点,建立了基于扩展的情感词典,开发了一个评论倾向性分析的半自动化网络舆情分析系统。从已有研究成果可知,研究用户参与主题行为模型是研究社会网络中用户话题倾向性分析和用户主题推荐和预测的基础,具有一定的研究意义。

【发明内容】

[0004]本发明的目的在于提出一种利用网络分析方法对社会网络用户参与主题的行为进行分析的方法。
[0005]本发明的目的是这样实现的:
[0006]I)定义主题相似性,关键词相似性,并建立“用户一主题一关键词”三个层次的网络模型;
[0007]2)设计具有最大区分度的“关键词”选择算法;
[0008]3)给出用户行为分析的相关定义和计算公式,具体包括:用户主动参与主题行为,被动参与主题行为,主题传播力以及主题影响力,并对用户参与主题的行为进行分析。
[0009]定义主题相似性,关键词相似性,并建立“用户一主题一关键词”三个层次的网络模型的方法为:1)从社会网络的日志文件中获得每个用户发布和接收的主题信息;2)如果两个用户之间进行了通信,则产生一条从发送用户到被发送用户的有向边;3)当主题中包含一个关键词时,则从主题到该关键词产生一条无向边;4)用户发布一个主题,则从用户到主题建立一条有向连边,如果用户接收一个主题,则从主题到用户建立一条有向连边;5)定义主题的相似性,如果两个主题的相似性超过阈值则以这两个主题为端点,建立一条无向边;6)定义关键词的相似性,如果两个关键词的相似性超过阈值则以这两个关键词为端点,建立一条无向边。
[0010]设计具有最大区分度的“关键词”选择算法是:1)选择“用户一主题一关键词”三层网络中度最大的关键词节点,并将其加入到所选关键词集合中;3)在“用户一主题一关键词”三层网络中删除被选择节点,以及与该节点相连接的其他主题节点;3)返回到步骤I)直到所选关键词节点的度小于设定的阈值。
[0011]给出用户行为分析的相关定义和计算公式,具体包括:用户主动参与主题行为,被动参与主题行为,主题传播力以及主题影响力,并对用户参与主题的行为进行分析的方法是:1)使用用户发送这一类主题的概率表示用户主动参与主题行为,计算方法为用户发送这一类主题信息占其发送总信息的比例;2)使用用户被发送这一类主题的概率表示用户被动参与主题行为,计算方法为用户被发送这一类主题的信息占其所接收信息的比例;3)主题的传播力使用用户所发送的该主题占所有用户的发送该主题的比例来计算;4)主题的影响力使用用户接收的该类主题占所有用户的接收该类主题的比例来计算。
[0012]本发明的有益效果在于:
[0013]本发明用网络模型完整的记录了用户在社会网络中的行为,并设计了具有最大区分度的关键词选择算法,保证了用户行为分析的效率。
【专利附图】

【附图说明】
[0014]图1 “用户一主题一关键词”三层网络示意图;
[0015]图2关键词选取算法原理示意图。
【具体实施方式】
[0016]下面结合附图和实施例对本发明进一步说明。本发明包括:
[0017]I)定义主题相似性,关键词相似性,并建立“用户一主题一关键词”三个层次的网络模型;
[0018]2)设计具有最大区分度的“关键词”选择算法;;
[0019]3)给出用户行为分析的相关定义和计算公式,具体包括:用户主动参与主题行为,被动参与主题行为,主题传播力以及主题影响力,并对用户参与主题的行为进行分析。
[0020]所述的定义主题相似性,关键词相似性,并建立“用户一主题一关键词”三个层次的网络模型的方法为:1)从社会网络的日志文件中获得每个用户发布和接收的主题信息;
2)如果两个用户之间进行了通信,则产生一条从发送用户到被发送用户的有向边。3)当主题中包含一个关键词时,则从主题到该关键词产生一条无向边;4)用户发布一个主题,则从用户到主题建立一条有向连边,如果用户接收一个主题,则从主题到用户建立一条有向连边。5)定义主题的相似性,如果两个主题的相似性超过阈值则以这两个主题为端点,建立一条无向边;6)定义关键词的相似性,如果两个关键词的相似性超过阈值则以这两个关键词为端点,建立一条无向边。
[0021]所述的设计具有最大区分度的“关键词”选择算法是:1)选择“用户一主题一关键词”三层网络中度最大的关键词节点,并将其加入到所选关键词集合中;3)在“用户一主题一关键词”三层网络中删除被选择节点,以及与该节点相连接的其他主题节点;3)返回到步骤I)直到所选关键词节点的度小于设定的阈值。
[0022]所述的给出用户行为分析的相关定义和计算公式,具体包括:用户主动参与主题行为,被动参与主题行为,主题传播力以及主题影响力,并对用户参与主题的行为进行分析的方法是:1)使用用户发送这一类主题的概率表示用户主动参与主题行为,计算方法为用户发送这一类主题的信息占其发送总信息的比例;2)使用用户被发送这一类主题的概率表示用户被动参与主题行为,计算方法为用户被发送这一类主题的信息占其所接受信息的比例;3)主题的传播力使用用户所发送的该主题占所有用户的发送该主题的比例来计算;4)主题的影响力使用用户接收的该类主题占所有用户的接收该类主题的比例来计算。
[0023]针对以上情况,本发明从网络分析的角度出发,提出一种社会网络用户参与主题的行为分析技术。
[0024]本发明是基于如下问题而设计的:
[0025]社会网络中用户参与主题的行为分析是一个挑战性的任务,对用户参与主题的行为模式分析为用户推荐有效的信息 提供技术基础。对主题的传播力和影响力的分析可对当前社会网络中的讨论热点提供量化的评价,因此具有重要的理论和现实意义。
[0026]本发明的主要技术特征体现在:
[0027]I)建立“用户一主题一关键词”三个层次的网络模型
[0028]具体技术路线是:1.用户、主题和关键词的相互关联关系在它们之间建立边;
2.通过“用户一主题一关键词”三个层次的网络模型可以完整地保存用户的所有信息,为后续的网络分析提供了基础。
[0029]2)设计具有最大区分度的“关键词”选择算法。
[0030]具体技术路线:1.使用贪婪策略,每步骤选取具有最大度的关键词节点;2.删除该节点以及与该节点相连接的所有主题节点;3.返回到步骤I。
[0031]列有公共交点。量化后的数据列形成新的数据序列,建立GM(1,N_1)模型,继而得到灰色关联矩阵。该模型为
【权利要求】
1.一种社会网络用户参与主题行为分析方法,其特征在于: 1)定义主题相似性,关键词相似性,并建立“用户一主题一关键词”三个层次的网络模型; 2)设计具有最大区分度的“关键词”选择算法; 3)给出用户行为分析的相关定义和计算公式,具体包括:用户主动参与主题行为,被动参与主题行为,主题传播力以及主题影响力,并对用户参与主题的行为进行分析。
2.根据权利要求1所述的一种社会网络用户参与主题行为分析方法,其特征在于:所述定义主题相似性,关键词相似性,并建立“用户一主题一关键词”三个层次的网络模型的方法为:1)从社会网络的日志文件中获得每个用户发布和接收的主题信息;2)如果两个用户之间进行了通信,则产生一条从发送用户到被发送用户的有向边;3)当主题中包含一个关键词时,则从主题到该关键词产生一条无向边;4)用户发布一个主题,则从用户到主题建立一条有向连边,如果用户接收一个主题,则从主题到用户建立一条有向连边;5)定义主题的相似性,如果两个主题的相似性超过阈值则以这两个主题为端点,建立一条无向边;6)定义关键词的相似性,如果两个关键词的相似性超过阈值则以这两个关键词为端点,建立一条无向边。
3.根据权利要求2所述的一种社会网络用户参与主题行为分析方法,其特征在于:所述的设计具有最大区分度的“关键词”选择算法是:1)选择“用户一主题一关键词”三层网络中度最大的关键词节点,并将其加入到所选关键词集合中;3)在“用户一主题一关键词”三层网络中删除被选择节点,以及与该节点相连接的其他主题节点;3)返回到步骤I)直到所选关键词节点的度小于设定的阈值。
4.根据权利要求3所述的一种社会网络用户参与主题行为分析方法,其特征在于:所述给出用户行为分析的相关定义和计算公式,具体包括:用户主动参与主题行为,被动参与主题行为,主题传播力以及主题影响力,并对用户参与主题的行为进行分析的方法是:I)使用用户发送这一类主题的概率表示用户主动参与主题行为,计算方法为用户发送这一类主题信息占其发送总信息的比例;2)使用用户被发送这一类主题的概率表示用户被动参与主题行为,计算方法为用户被发送这一类主题的信息占其所接收信息的比例;3)主题的传播力使用用户所发送的该主题占所有用户的发送该主题的比例来计算;4)主题的影响力使用用户接收的该类主题占所有用户的接收该类主题的比例来计算。
【文档编号】G06F17/30GK103838806SQ201310470139
【公开日】2014年6月4日 申请日期:2013年10月10日 优先权日:2013年10月10日
【发明者】张乐君, 张永辉, 国林, 张健沛, 杨静, 邓鑫 申请人:哈尔滨工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1