信息处理方法及系统的制作方法

文档序号:9870018阅读:304来源:国知局
信息处理方法及系统的制作方法
【技术领域】
[0001]本发明涉及通信技术领域,尤其涉及一种信息处理方法及系统。
【背景技术】
[0002]微博作为一种新兴的网络社交平台,一时间受到大量互联网网民的追捧。对于一副关于某事件的微博帖子,如果短时间内转发或评论该事件的网民越多,这说明该社会事件关注的人就越多,该事件的关注度就越高,那么就会引起相关人员的重视。但随之也出现了大量灌水的人员,他们为了达到某种利益,往往一个人就注册上百个甚至于上千个用户ID,然后使用这些用户ID发送或转发帖子,故意炒作某事件,而影响了该事件的真实关注度。

【发明内容】

[0003]本发明提供一种信息处理方法及系统,用以解决现有微博用户中出现大量灌水的人员。
[0004]本发明提供一种信息处理方法,包括:DPI设备获取通信网络中传输的微博数据包;KDPI设备从所述微博数据包中获取终端设备标识、微博ID以及微博内容;并将所述终端设备标识、微博ID以及微博内容三者的对应关系发送至分析单元;所述分析单元根据收集到的对应关系,确定是否存在满足如下条件的微博ID:同一终端设备标识对应不同微博ID的总数超过预设阈值,且所述不同微博ID对应的微博内容一致;所述分析单元确定满足上述条件的微博ID为水军ID。
【具体实施方式】
[0005]本发明提供的信息处理方法实施例流程为:
[0006]SlOU DPI设备获取通信网络中传输的微博数据包;
[0007]具体来说,DPI设备从通信网络中抓取数据包;根据数据包中包含的应用标识从抓取的数据包中筛选出微博数据包,微博数据包中包含的应用标识为微博应用标识。,移动终端设备在上网时,发送的数据包首先通过服务支持节点(Serving Gprs Support Node,以下简称SGSN),然后通过Gn接口到达网关支持节点(Gateway Gprs Support Node,以下简称GGSN),然后由GGSN传送至互联网。因此,可以在SGSN和GGSN间之间的Gn接口处部署深度包检测设备(Deep Packet Inspect1n,以下简称DPI)。
[0008]DPI设备可以在Gn接口处抓取到移动终端设备发送的数据包,然后解析数据包,解析数据包报文头信息,从报文头有信息中可以获取到微博应用标识,进而可以根据数据包中包含的应用标识从抓取的数据包中筛选出微博数据包。
[0009]需要说明的是,本实施例中所涉及到的发送数据包的终端设备均指移动终端设备。
[0010]S102、DPI设备从微博数据包中获取终端设备标识、微博ID以及微博内容;并将终端设备标识、微博ID以及微博内容三者的对应关系发送至分析单元;需要说明的是,终端设备标识可以为终端设备上网时用的上网号码,也可以为终端设备的设备标识,或者,同时包括上网号码以及设备标识。
[0011 ] 具体来说,DPI设备获取到微博数据包之后,进一步解析数据包报文头信息以及报文信息。从数据包报文头信息可以获取到微博ID,发送数据包的源IP地址,由于移动终端设备例如手机在上网时,网络会给该上网的终端设备分配一个固定的IP地址,并将该IP地址与终端设备标识绑定在一起,例如,将IP地址与手机上网时用的手机号码以及手机MEI号绑定,存储在网络侧,使移动终端设备在发送数据包时使用该IP地址,因此,DPI设备可以根据源IP地址确定发送微博数据包的终端设备所用的手机号码以及移动终端设备的頂EI号即终端设备标识,并从数据包报文信息中获取发送数据包的微博内容,例如可以为关键字,将获取的终端设备标识、微博ID以及微博内容三者的对应关系发送至分析单元。
[0012]S103分析单元根据收集到的对应关系,确定是否存在满足如下条件的微博ID:同一终端设备标识对应不同微博ID的总数超过预设阈值,且不同微博ID对应的微博内容一致;分析单元根据收集到的对应关系,分析同一终端设备标识对应不同微博ID的总数是否超过预设阈值,且这些不同的微博ID对应的微博内容是否一致。其中,预设阈值可以根据不同的情况来进行设置。
[0013]具体来说,如果终端设备标识为移动终端设备上网时用的上网号码,则查找该上网号码下对应的不同微博ID的总数是否超过预设阈值,并分析所发送的微博内容是否一致;如果终端设备标识为移动终端设备的设备标识,例如为手机IMEI号,则查找该设备标识下对应的不同微博ID的总数是否超过预设阈值,并分析所发送的微博内容是否一致。
[0014]S104分析单元确定满足上述条件的微博ID为水军ID。
[0015]如果确定同一终端设备标识对应不同微博ID的总数超过预设阈值,且这些不同的微博ID对应的微博内容一致,则说明这些不同的微博ID是为了炒作而故意发送帖子或转账帖子而申请的微博ID,进而确定该微博ID为水军ID。
[0016]本实施例通过DPI设备从微博数据包中获取终端设备标识、微博ID以及微博内容,并建立三者的对应关系,进而使分析单元根据收集到的三种对应关系,确定是否是水军ID:如果同一终端设备标识对应不同微博ID的总数超过预设阈值,且不同微博ID对应的微博内容一致;则确定该多个不同的微博ID为水军ID。通过上述方法可以判断出由同一个终端设备发出相似内容的那些微博ID是水军ID,从而可以判断该条微博内容的真实关注度。
[0017]以上实施例仅用以说明本发明的技术方案,而非对其限制;其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1.一种信息处理方法,其特征在于,包括:DPI设备获取通信网络中传输的微博数据包;所述DPI设备从所述微博数据包中获取终端设备标识、微博ID以及微博内容;并将所述终端设备标识、微博ID以及微博内容三者的对应关系发送至分析单元;所述分析单元根据收集到的对应关系,确定是否存在满足如下条件的微博ID:同一终端设备标识对应的不同微博ID的总数超过预设阈值,且所述不同微博ID对应的微博内容一致;所述分析单元确定满足上述条件的微博ID为水军ID。2.根据权利要求1所述的方法,其特征在于,所述DPI设备获取通信网络中传输的微博数据包包括:所述DPI设备从通信网络中抓取数据包;所述DPI设备根据数据包中包含的应用标识,从抓取的数据包中筛选出微博数据包,所述微博数据包中包含的应用标识为微博应用标识。
【专利摘要】本发明公开了一种信息处理方法及系统,其中方法包括:DPI设备获取通信网络中传输的微博数据包;DPI设备从微博数据包中获取终端设备标识、微博ID以及微博内容;并将终端设备标识、微博ID以及微博内容三者的对应关系发送至分析单元;分析单元根据收集到的对应关系,确定是否存在同一终端设备标识对应不同微博ID的总数超过预设阈值,且所述不同微博ID对应的微博内容一致;若存在则确定上述微博ID为水军ID。本发明通过上述方法可以判断出发出相似内容的哪些微博ID是同一个终端设备发出的,从而判断出该微博ID为水军ID,进而可以正确判断该条微博内容的社会关注度。
【IPC分类】H04L12/58
【公开号】CN105634906
【申请号】CN201410583509
【发明人】李 东
【申请人】青岛金讯网络工程有限公司
【公开日】2016年6月1日
【申请日】2014年10月27日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1