社会网络传播拓扑中用户关系构建方法及系统的制作方法

文档序号:7814023阅读:284来源:国知局
社会网络传播拓扑中用户关系构建方法及系统的制作方法
【专利摘要】本发明提供了一种社会网络传播拓扑中用户关系构建方法及系统,所述方法包括:S1.根据某一社会网络事件,获取一个以上所述社会网络事件的转发页面的链接作为种子列表;S2.根据所述种子列表,通过网页解析方式获取所述社会网络事件的传播用户;S3.将所述社会网络事件的传播用户作为关注任务,并将所述关注任务分为N组;S4.预设的N个登录账号模拟N个用户登录,分别对N组关注任务执行关注操作,将每个登录账号得到的用户关注列表作为一个群组;S5.构建群组内的用户关系网络;S6.构建本群组内的用户与其他群组的用户关系网络。本发明可以获取参与网络事件传播的用户之间的关系。
【专利说明】社会网络传播拓扑中用户关系构建方法及系统

【技术领域】
[0001]本发明涉及网络与信息安全【技术领域】,具体涉及一种社会网络传播拓扑中用户关系构建方法及系统。

【背景技术】
[0002]社会网络分析技术是信息安全和社会网络领域中的核心技术。其主要任务是以社会网络中的个人、群体、事件等不同维度进行多角度分析。
[0003]社会媒体的内部结构称为社会网络。社会网络最初起源于1934年美国社会心理学家Moreno对小群体使用计量学的方法进行的实验研究。哈佛大学的心理学教授StanleyMilgram在1967年创立了六度分割理论,其主要思想是在网络上随机抽取的两个人之间所间隔的人不会超过六个,通过这个理论每一个人物的社交范围都会不断地被放大并形成大型的网络。70年代,社会网络研究逐渐成为一个新兴的社会学专业,近年来社交网络的相关研究也成为计算机科学领域的一个研究热点。
[0004]2011年2月,著名的IT风险投资人约翰.杜尔提出一个新兴概念ZSoLoMo”。So (Social,社交);Lo (Local,本地位置);Mo (Mobile,移动)。在此之后,SoLoMo被一致认为是互联网未来发展趋势,SoLoMo的概念风靡全世界。
[0005]随着社会网络的发展,截止到2014年I月,Facebook、Twitter、新浪微博的月活跃用户数分别突破了 12.3亿、2.55亿和1.438亿。与此同时,社会网络也产生了大量的用户生成内容(User Generated Content,UGC)信息,这些UGC信息在社会网络上呈病毒式信息扩散,而且传播速度呈指数性增长。
[0006]社会网络中用户关系是维持人与人交流最普遍和最重要的基本属性之一,通过用户之间的消息传递使得事件在网络中快速传播。揭示复杂网络中事件的传播过程对分析网络拓扑结构、理解其功能、发现其隐含模式、预测其行为都具有十分重要的理论意义和应用价值,在科学研究、计算机科学、社会、生物和互联网等领域中具有广泛应用。然而,在事件传播研究领域中,往往分析人员很难获取到参与事件讨论用户之间的关系,现在还没有一种非常有效的事件传播中用户关系构建方法。


【发明内容】

[0007]针对现有技术中的缺陷,本发明提供一种社会网络传播拓扑中用户关系构建方法及系统,以获取参与网络事件传播的用户之间的关系。
[0008]第一方面,本发明提供一种社会网络传播拓扑中用户关系构建方法,所述方法包括:
[0009]S1.根据某一社会网络事件,获取一个以上所述社会网络事件的转发页面的链接作为种子列表;
[0010]S2.根据所述种子列表,通过网页解析方式获取所述社会网络事件的传播用户;
[0011]S3.将所述社会网络事件的传播用户作为关注任务,并将所述关注任务分为N组;
[0012]S4.预设的N个登录账号模拟N个用户登录,分别对N组关注任务执行关注操作,将每个登录账号得到的用户关注列表作为一个群组;
[0013]S5.依次进入各群组中用户的共同关注页面,并将共同关注的用户信息存储至所述群组的用户关注列表中,通过用户之间的关注信息,构建群组内的用户关系网络;
[0014]S6.每个登录账号依次访问其他登录账号得到的群组中的用户,通过用户之间的关注信息,构建本群组内的用户与其他群组的用户关系网络。
[0015]其中,步骤S2中所述社会网络事件的传播用户包括社会网络事件的原创用户和转发用户。
[0016]其中,所述方法还包括:步骤S2中,在所述通过网页解析方式获取所述社会网络事件的传播用户之后,对所述社会网络事件的传播用户进行去重。
[0017]其中,步骤S4中所述预设的N个登录账号模拟N个用户登录为:
[0018]通过模拟浏览器的形式,以post请求形式与社会网络服务器进行直接通信,将N个登录账号的用户名和密码信息打包发送至社会网络服务器端,通过验证后实现N个用户登录。
[0019]其中,步骤S4中所述群组为每个登录账号通过网页解析的方式添加的关注,被关注者为参与社会网络事件的传播用户。
[0020]其中,步骤S5和步骤S6中所述用户关系网络为所述社会网络事件的传播用户之间,通过关注和粉丝两种连接关系形成的节点网络拓扑。
[0021]第二方面,本发明还提供了一种社会网络传播拓扑中用户关系构建系统,所述系统包括:
[0022]种子列表获取模块,用于根据某一社会网络事件,获取一个以上所述社会网络事件的转发页面的链接作为种子列表;
[0023]社会网络事件的传播用户获取模块,用于根据社会网络事件获取模块发送的种子列表,通过网页解析方式获取所述社会网络事件的传播用户;
[0024]关注任务分配模块,用于将所述社会网络事件的传播用户作为关注任务分为N组,将N组关注任务分配给N个登录账号;
[0025]关注模块,用于使预设的N个登录账号模拟N个用户登录,分别对N组关注任务执行关注操作,将每个登录账号得到的用户关注列表作为一个群组;
[0026]共同关注获取模块,用于依次进入各群组中用户的共同关注页面,并将共同关注的用户信息存储至所述群组的用户关注列表中,通过用户之间的关注信息,构建群组内的用户关系网络;
[0027]二级关注获取模块,用于使每个登录账号依次访问其他登录账号得到的群组中的用户,通过用户之间的关注信息,构建本群组内的用户与其他群组的用户关系网络。
[0028]其中,所述系统还包括重复项识别模块,用于对社会网络事件的传播用户获取模块获取的社会网络事件的传播用户进行去重。
[0029]其中,社会网络事件的传播用户获取模块中所述社会网络事件的传播用户包括社会网络事件的原创用户和转发用户。
[0030]其中,共同关注获取模块和二级关注获取模块中的所述用户关系网络为所述社会网络事件的传播用户之间,通过关注和粉丝两种连接关系形成的节点网络拓扑。
[0031]由上述技术方案可知,
[0032]本发明的社会网络传播拓扑中用户关系构建方法及系统,采用了一个有效且高效的框架构建转发网络信息的用户之间的关系,设计了一种基于共同关注的方法对未知关系的两个用户进行边连接,识别其是否存在关注属性,同时可以采用多线程的方式并发实现关注操作,即保证了系统的执行效率又防止了社会网络的异常用户审查机制。

【专利附图】

【附图说明】
[0033]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]图1是本发明实施例一提供的社会网络传播拓扑中用户关系构建方法的流程图;
[0035]图2是社会网络事件传播拓扑中用户关系示例图;
[0036]图3是社会网络事件传播拓扑示例图;
[0037]图4是本发明实施例三提供的社会网络传播拓扑中用户关系构建系统结构示意图。

【具体实施方式】
[0038]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0039]图1示出了本发明实施例一提供的社会网络传播拓扑中用户关系构建方法的流程图,图2和图3分别示出了社会网络事件传播拓扑中用户关系示例图和社会网络事件传播拓扑示例图。
[0040]如图1所示,本实施例的社会网络传播拓扑中用户关系构建方法如下所述。
[0041]步骤101:根据某一社会网络事件,获取一个以上所述社会网络事件的转发页面的链接作为种子列表。
[0042]步骤102:根据所述种子列表,通过网页解析方式获取所述社会网络事件的传播用户。
[0043]在本步骤中,根据所述种子列表,通过网页解析方式获取所述社会网络事件的传播用户,并将其加入到用户列表中,所述用户列表包括用户ID、用户名称、主页链接等。
[0044]其中,所述社会网络事件的传播用户包括社会网络事件的原创用户和转发用户。
[0045]优选地,在所述通过网页解析方式获取所述社会网络事件的传播用户之后,对所述社会网络事件的传播用户进行去重。
[0046]步骤103:将所述社会网络事件的传播用户作为关注任务,并将所述关注任务分为N组。
[0047]步骤104:预设的N个登录账号模拟N个用户登录,执行关注操作。
[0048]在本步骤中,首先需要创建N个登录账号,将用户名和密码存储至数组中,以post请求形式与社会网络服务器进行直接通信,将N个登录账号的用户名和密码信息打包发送至社会网络服务器端,通过验证后实现N个用户登录,上述步骤103中已经为每个登录账号分配好关注任务,关注任务为所述社会网络事件的传播用户。
[0049]步骤105:判断是否产生验证码,若是,产生验证码的登录账号开始休眠;否则执行步骤106。
[0050]在本步骤中,若某登录账号在登录时产生验证码,则统计该登录账号出现验证码的次数N,并计算本次线程休眠时间,休眠结束后执行步骤104。
[0051]步骤106:更新该登录账号完成关注任务的标志位,等待其他登录账号的结束,当所述登录账号均完成关注任务后,执行步骤107。
[0052]步骤107:将每个登录账号得到的用户关注列表作为一个群组,依次进入各群组中用户的共同关注页面,并将共同关注的用户信息存储至所述群组的用户关注列表中,通过用户之间的关注信息,构建群组内的用户关系网络。
[0053]步骤108:每个登录账号依次访问其他登录账号得到的群组中的用户,通过用户之间的关注信息,构建本群组内的用户与其他群组的用户关系网络。
[0054]通过步骤107和108,最终实现参与事件传播的用户之间的关系拓扑网络。
[0055]由此本实施例的社会网络传播拓扑中用户关系构建方法,采用了一个有效且高效的框架构建转发网络信息的用户之间的关系,设计了一种基于共同关注的方法对未知关系的两个用户进行边连接,识别其是否存在关注属性,同时可以采用多线程的方式并发实现关注操作,即保证了系统的执行效率又防止了社会网络的异常用户审查机制。
[0056]本实施例的社会网络传播拓扑中用户关系构建方法,创新性地采用基于共同关注、关注的关注、网页解析登录等方法实现对网络事件传播中用户之间的关系进行构建,确保了用户关系网络的真实性与准确性。
[0057]本实施例二以新浪微博为例,说明本发明的技术方案。本实施例二的事件传播中用户关系的构建方法包括步骤与上述实施例一的【具体实施方式】相同,由于新浪微博对于用户的批量关注操作具有审查机制,并严格限制网页机器人行为,当进行单一关注操作到达一定次数后将返回验证码,因此需要等待一段时间后再执行相关动作。
[0058]在获取转发用户列表过程中,会遇到翻页问题。当某个事件转发量较大时,无法一次性返回全部用户信息,而是采用翻页形式,每次翻页会得到最多20条用户信息,最终将全部获取的信息去重后融合到一起,因此需要针对当前页号、翻页次数等现象进行判断。
[0059]通过网页解析方式实现新浪微博的登录,并新浪中若干热门微博为种子节点,经过系统的用户关系构建方法,最终实现了将参与事件转发的用户通过“关注、粉丝”的关系连接起来。在采用多账号多线程同步执行关注操作的情况下,程序的时间复杂度为0(m*n),其中m代表登录账号的个数,η代表时间传播过程中参与用户的人数。
[0060]图4示出了实施例三提供的社会网络传播拓扑中用户关系构建系统的结构图,如图4所示,本实施例的社会网络传播拓扑中用户关系构建系统包括种子列表获取模块401、社会网络事件的传播用户获取模块402、关注任务分配模块403、关注模块404、共同关注获取模块405和二级关注获取模块406 ;
[0061]其中,
[0062]种子列表获取模块401,用于根据某一社会网络事件,获取一个以上所述社会网络事件的转发页面的链接作为种子列表;
[0063]社会网络事件的传播用户获取模块402,用于根据社会网络事件获取模块发送的种子列表,通过网页解析方式获取所述社会网络事件的传播用户;
[0064]关注任务分配模块403,用于将所述社会网络事件的传播用户作为关注任务分为N组,将N组关注任务分配给N个登录账号;
[0065]关注模块404,用于使预设的N个登录账号模拟N个用户登录,分别对N组关注任务执行关注操作,将每个登录账号得到的用户关注列表作为一个群组;
[0066]共同关注获取模块405,用于依次进入各群组中用户的共同关注页面,并将共同关注的用户信息存储至所述群组的用户关注列表中,通过用户之间的关注信息,构建群组内的用户关系网络;
[0067]二级关注获取模块406,用于使每个登录账号依次访问其他登录账号得到的群组中的用户,通过用户之间的关注信息,构建本群组内的用户与其他群组的用户关系网络。
[0068]其中,所述系统还包括重复项识别模块407,用于对社会网络事件的传播用户获取模块获取的社会网络事件的传播用户进行去重。
[0069]其中,会网络事件的传播用户获取模块中所述社会网络事件的传播用户包括社会网络事件的原创用户和转发用户。
[0070]其中,共同关注获取模块和二级关注获取模块中的所述用户关系网络为所述社会网络事件的传播用户之间,通过关注和粉丝两种连接关系形成的节点网络拓扑。
[0071]本实施例所述的系统,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
[0072]以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【权利要求】
1.一种社会网络传播拓扑中用户关系构建方法,其特征在于,所述方法包括: 51.根据某一社会网络事件,获取一个以上所述社会网络事件的转发页面的链接作为种子列表; 52.根据所述种子列表,通过网页解析方式获取所述社会网络事件的传播用户; 53.将所述社会网络事件的传播用户作为关注任务,并将所述关注任务分为N组; 54.预设的N个登录账号模拟N个用户登录,分别对N组关注任务执行关注操作,将每个登录账号得到的用户关注列表作为一个群组; 55.依次进入各群组中用户的共同关注页面,并将共同关注的用户信息存储至所述群组的用户关注列表中,通过用户之间的关注信息,构建群组内的用户关系网络; 56.每个登录账号依次访问其他登录账号得到的群组中的用户,通过用户之间的关注信息,构建本群组内的用户与其他群组的用户关系网络。
2.根据权利要求1所述的方法,其特征在于,步骤S2中所述社会网络事件的传播用户包括社会网络事件的原创用户和转发用户。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:步骤S2中,在所述通过网页解析方式获取所述社会网络事件的传播用户之后,对所述社会网络事件的传播用户进行去重。
4.根据权利要求1所述的方法,其特征在于,步骤S4中所述预设的N个登录账号模拟N个用户登录为: 通过模拟浏览器的形式,以post请求形式与社会网络服务器进行直接通信,将N个登录账号的用户名和密码信息打包发送至社会网络服务器端,通过验证后实现N个用户登录。
5.根据权利要求1所述的方法,其特征在于,步骤S4中所述群组为每个登录账号通过网页解析的方式添加的关注,被关注者为参与社会网络事件的传播用户。
6.根据权利要求5所述的方法,其特征在于,步骤S5和步骤S6中所述用户关系网络为所述社会网络事件的传播用户之间,通过关注和粉丝两种连接关系形成的节点网络拓扑。
7.—种社会网络传播拓扑中用户关系构建系统,其特征在于,所述系统包括: 种子列表获取模块,用于根据某一社会网络事件,获取一个以上所述社会网络事件的转发页面的链接作为种子列表; 社会网络事件的传播用户获取模块,用于根据社会网络事件获取模块发送的种子列表,通过网页解析方式获取所述社会网络事件的传播用户; 关注任务分配模块,用于将所述社会网络事件的传播用户作为关注任务分为N组,将N组关注任务分配给N个登录账号; 关注模块,用于使预设的N个登录账号模拟N个用户登录,分别对N组关注任务执行关注操作,将每个登录账号得到的用户关注列表作为一个群组; 共同关注获取模块,用于依次进入各群组中用户的共同关注页面,并将共同关注的用户信息存储至所述群组的用户关注列表中,通过用户之间的关注信息,构建群组内的用户关系网络; 二级关注获取模块,用于使每个登录账号依次访问其他登录账号得到的群组中的用户,通过用户之间的关注信息,构建本群组内的用户与其他群组的用户关系网络。
8.根据权利要求7所述的系统,其特征在于,所述系统还包括重复项识别模块,用于对社会网络事件的传播用户获取模块获取的社会网络事件的传播用户进行去重。
9.根据权利要求7所述的系统,其特征在于,社会网络事件的传播用户获取模块中所述社会网络事件的传播用户包括社会网络事件的原创用户和转发用户。
10.根据权利要求7所述的系统,其特征在于,共同关注获取模块和二级关注获取模块中的所述用户关系网络为所述社会网络事件的传播用户之间,通过关注和粉丝两种连接关系形成的节点网络拓扑。
【文档编号】H04L29/08GK104243234SQ201410461022
【公开日】2014年12月24日 申请日期:2014年9月11日 优先权日:2014年9月11日
【发明者】薛一波, 姜京池, 易成岐 申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1