一种社交网络综合分析方法

文档序号:10572562阅读:366来源:国知局
一种社交网络综合分析方法
【专利摘要】本发明公开了一种社交网络综合分析方法,通过对社交网络账号相关数据进行采集,并根据采集的信息分析多个社交网络账号之间的最短距、互动情况和关联情况,从而获取更多的嫌疑人在社交网络的活动情况,解决当前办案分析人员采用社交网络综合分析方法,通过社交网络调查嫌疑人时工作负担过重的问题,进一步提高工作效率。同时本发明所述社交网络综合分析方法具有良好的实用性、可靠性和安全性。
【专利说明】
一种社交网络综合分析方法
技术领域
[0001]本发明涉及网络信息分析技术领域,具体涉及一种社交网络综合分析方法。
【背景技术】
[0002]随着网络的普及、计算机技术的发展,互联网正以前所未有的深度和广度影响着人们工作和生活的方方面面。例如对于犯罪嫌疑人犯罪证据的提取,除了原有的传统取证夕卜,采用社交网络综合分析方法,通过社交网络进行取证的方式也被广泛运用。目前采用的社交网络综合分析方法以人工手动点击网页来调查嫌疑人的方式进行,但随着国内外各种社交网络的兴起以及数据量日益增长,这大大增加了办案分析人员调查时的工作负担。

【发明内容】

[0003]本发明所要解决的技术问题是实现自动分析嫌疑人在社交网络的活动情况,目的在于提供一种社交网络综合分析方法,解决当前办案分析人员采用社交网络综合分析方法,通过社交网络调查嫌疑人时工作负担过重的问题。
[0004]本发明通过下述技术方案实现:
一种社交网络综合分析方法,包括如下步骤:
A、将社交网站主页地址或社交网站账号放入分析系统任务队列;
B、分步式爬虫领取任务队列中的任务,对任务的相关数据进行采集,并将采集的数据回传分析系统;
C、分析系统根据采集的数据对N个社交网站账号进行分析,获得N个社交网站账号之间的最短距、互动情况和关联情况,其中,N为大于等于2的正整数。
[0005]特别地,所述步骤B具体包括:
B1、分布式爬虫领取任务队列中的任务,对任务的相关数据进行采集,将采集的数据回传分析系统;
B2、分析系统判断采集的数据所处的层级是否达到系统设置的最大层级限制,若未达至IJ,则将采集的数据作为新任务加入任务队列,再返回执行步骤BI;若达到,则直接将采集的数据导入分析系统数据库。
[0006]特别地,所述步骤B中的任务的相关数据包括但不限于社交网站账号在该社交网站的个人信息、发表的日志、博客、好友、关注人、留言、评论、点赞。
[0007]特别地,所述社交网络综合分析方法还包括步骤D:对回传到分析系统的采集数据进行搜索。
[0008]特别地,所述社交网络综合分析方法还包括步骤E:对包括但不限于与社交网站账号相关的邮箱、电话、账号、域名及身份证号码的社工信息进行提取。
[0009]特别地,所述步骤C中获得的N个社交网站账号之间的最短距、互动情况和关联情况作为分析结果输出到用户页面进行动态展示。
[0010]本发明与现有技术相比,具有如下的优点和有益效果: 所述一种社交网络综合分析方法,能够对社交网络自动进行分析,避免传统的分析方法依靠人工手工点击网页的方式对社交网络进行分析的问题,减轻了办案分析人员的工作负担,进一步提高了工作效率。
【附图说明】
[0011]此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明实施例1提供的社交网络综合分析方法流程图。
【具体实施方式】
[0012]为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
[0013]实施例1
如图1所示,图1为本发明实施例1提供的社交网络综合分析方法流程图。
[0014]本实施例中,社交网络综合分析方法具体包括:
SlOl、将社交网站主页地址或社交网站账号放入分析系统任务队列。
[0015]办案分析人员针对嫌疑人在某社交网站的活动情况进行调查时,将该嫌疑人在该社交网站的账号或该社交网站主页地址提交到分析系统,分析系统将其放入任务队列。例如,办案分析人员针对嫌疑人在新浪微博中的活动情况进行调查时,获悉嫌疑人在新浪微博中注册账号为X,则将X的新浪微博主页地址和/或账号对是交到分析系统,分析系统将其放入任务队列。
[0016]S102、分布式爬虫领取任务队列中的任务,对任务的相关数据进行采集,并将采集的数据回传分析系统。
[0017]分布式爬虫领取任务列队中的任务,对该社交网站的该社交网站账号的相关数据进行采集,所述相关数据包括但不限于社交网站账号在该社交网站的个人信息、发表的日志、博客、好友、关注人、留言、评论、点赞等信息,并将采集的数据回传分析系统。仍以上述办案分析人员针对嫌疑人在新浪微博中的活动情况进行调查时,获悉嫌疑人在新浪微博中注册账号为X为例,分布式爬虫对于账号X发布的博客、日志及账号X的好友、关注人以及对账号X发布的博客、日志信息进行的留言、评论和点赞等的信息进行采集。
[0018]S103、分析系统判断采集的数据所处的层级是否达到系统设置的最大层级限制。
[0019]分析系统内部预设数据采集最大层级限制,判断采集的数据所处的层级是否达到系统设置的最大层级限制,若未达到,则将采集的数据作为新任务加入任务队列,再返回执行步骤BI;若达到,则直接将采集的数据导入分析系统数据库。所述采集的数据包括但不限于该社交网站账号的其他联系人账号、好友、关注人、关注者。本实施例中分析系统设置的最大层级限制为3级,仍以上述办案分析人员针对嫌疑人在新浪微博中的活动情况进行调查时,获悉嫌疑人在新浪微博中注册账号为X为例,分析系统对于账号X进行采集获取的数据包括Xl、X2,则将Xl、X2返回,分析系统判断Xl、X2所处的层级是2级,则判断未达到系统设置的最大层级限制,将X1、X2作为新任务加入任务队列,再返回执行步骤S102,对与Xl相关的数据和与X2相关的数据进行采集。分析系统对于Xl进行采集获取的数据包括X11、X12,对于X2进行采集获取的数据包括X21、X22,则将X11、X12、X21、X22返回,分析系统判断Xl 1、X12、X21、X22所处的层级是3级,则判断达到系统设置的最大层级限制,则执行步骤S104。需要说明的是,所述分析系统内部预设数据采集最大层级限制根据实际应用中具体情况进行调整。
[0020]S104、分析系统将采集的数据导入分析系统数据库。
[0021]当分析系统判断采集的数据所处的层级已经达到系统设置的最大层级限制时,将采集的数据导入分析系统数据库。仍以上述办案分析人员针对嫌疑人在新浪微博中的活动情况进行调查时,获悉嫌疑人在新浪微博中注册账号为X为例,判断Xl 1、Xl2、X21、X22所处的层级达到系统设置的最大层级限制,则将X11、X12、X21、X22导入分析系统数据库。
[0022]S105、分析系统根据采集的数据对N个社交网站账号进行分析,获得N个社交网站账号之间的最短距、互动情况和关联情况。
[0023]办案分析人员提交两个或多个社交网站账号,分别对社交网站账号的相关数据进行采集,并根据采集的数据对社交网站账号之间的关系进行分析,获得各个社交网站账号之间的最短距、互动情况和关联情况。例如,办案分析人员提交Χ、γ两个社交网站账号,对X进行采集获得的数据包括X11、Χ12、Χ21、Χ22,对Y进行采集获得的数据包括Y11、Υ12、Υ21、丫22,比较乂11、乂12、乂21、乂22与¥11、¥12、¥21、¥22之间的一致性,获取各个社交网站账号之间的最短距、互动情况和关联情况。
[0024]S106、N个社交网站账号之间的最短距、互动情况和关联情况作为分析结果输出到用户页面进行动态展示。
[0025]各个网站账号之间的最短距、互动情况和关联情况作为分析结果输出到用户页面,以数字、图表等形式进行动态展示。
[0026]需要说明的是,本实施例中,还可以对分析系统采集的数据进行搜索,提交关键词,如点赞,则可以自动搜索出采集的数据中的点赞信息,其他信息提交对应的关键词即可。
[0027]需要说明的是,本实施例中,还可以通过插件对采集的数据进行邮箱、电话、账号、域名及身份证号码的社工信息提取。
[0028]本发明的技术方案应用于社交网络综合分析系统,对社交网络账号相关数据进行采集,并根据采集的信息分析多个社交网络账号之间的最短距、互动情况和关联情况,从而获取更多的嫌疑人在社交网络的活动情况,解决当前办案分析人员采用社交网络综合分析方法,通过社交网络调查嫌疑人时工作负担过重的问题,进而提高工作效率。
[0029]以上所述的【具体实施方式】,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的【具体实施方式】而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种社交网络综合分析方法,其特征在于,包括如下步骤: A、将社交网站主页地址或社交网站账号放入分析系统任务队列; B、分步式爬虫领取任务队列中的任务,对任务的相关数据进行采集,并将采集的数据回传分析系统; C、分析系统根据采集的数据对N个社交网站账号进行分析,获得N个社交网站账号之间的最短距、互动情况和关联情况,其中,N为大于等于2的正整数。2.根据权利要求1所述的社交网络综合分析方法,其特征在于,所述步骤B具体包括: B1、分布式爬虫领取任务队列中的任务,对任务的相关数据进行采集,将采集的数据回传分析系统; B2、分析系统判断采集的数据所处的层级是否达到系统设置的最大层级限制,若未达至IJ,则将采集的数据作为新任务加入任务队列,再返回执行步骤BI;若达到,则直接将采集的数据导入分析系统数据库。3.根据权利要求1所述的社交网络综合分析方法,其特征在于,所述步骤B中的任务的相关数据包括但不限于社交网站账号在该社交网站的个人信息、发表的日志、博客、好友、关注人、留目、评论、点赞。4.根据权利要求1所述的社交网络综合分析方法,其特征在于,还包括步骤D:对回传到分析系统的采集数据进行搜索。5.根据权利要求1所述的社交网络综合分析方法,其特征在于,还包括步骤E:对包括但不限于与社交网站账号相关的邮箱、电话、账号、域名及身份证号码的社工信息进行提取。6.根据权利要求1所述的社交网络综合分析方法,其特征在于,所述步骤C中获得的N个社交网站账号之间的最短距、互动情况和关联情况作为分析结果输出到用户页面进行动态展示。
【文档编号】H04L12/58GK105933203SQ201610229518
【公开日】2016年9月7日
【申请日】2016年4月14日
【发明人】陈俊杰
【申请人】四川神琥科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1