识别网络水军团体的方法及系统的制作方法

文档序号:8258888阅读:258来源:国知局
识别网络水军团体的方法及系统的制作方法
【技术领域】
[0001] 本发明涉及一种网络水军识别技术领域,具体地说是一种识别网络水军团体的方 法及系统。
【背景技术】
[0002] 网络水军是指那些由商业利益驱动,为达到如影响网络民意、扰乱网络环境等不 正当目的,在互联网中制造、传播虚假意见和垃圾信息等网络垃圾意见产生者的总称。网络 水军识别即从当前互联网环境中运用web信息挖掘技术,确定高区分度特征及行为模式发 现潜藏的水军。传统被动式网络水军识别方法多是在网络水军造成一定的危害行为后进 行,对网络水军的探测具有一定的滞后性,并且其研究在网络水军危害驱动下,关注网络水 军已产生的影响,易受网络水军变化性欺骗行为的影响。该类网络水军识别方法无法在网 络水军造成危害前阻止其发生,对网络水军的预防效果较差。而网络水军的研究和治理,关 键在于从源头遏制垃圾信息的泛滥,因此在网络水军未产生大量垃圾信息、造成严重网络 影响前,完成对其发现与探测的工作具有十分重要的意义。网络水军也可以理解为整个网 络用户中的离群点,但其特征与正常用户十分相近,具有复杂多变的行为,因此识别单个网 络水军的难度很高,网络水军识别研究难以做到全面、准确。
[0003] 网络团体是指由2个或2个以上网络用户组成的团体,网络水军团体即由2个或 2个以上网络水军组成的水军团体。网络团体和网络水军团体均指代的是网络上存在的用 户账号组成的虚拟团体,其并不是由对应现实生活中的真实用户组成。网络水军团体背后 可能由某一个或某几个真实用户操控,会形成相同或相似的属性或行为模式,比如都出现 在某几个目标产品评论里、用户命名具有一定相似模式(都采用无序数字+字母)等。并 且网络水军团体在在受到外来刺激时,如论坛网络水军团体的团体成员发表的帖子被评论 后,操控网络水军团体的真实用户,会操控网络水军团体内的水军用户账号进行回应,其回 应数据中的团体特征更为突出,使得对其的识别较为容易。

【发明内容】

[0004] 为此,本发明所要解决的技术问题在于传统的网络水军识别方法多是在网络水军 造成一定的危害行为后进行,而无法在网络水军造成危害前阻止其发生,对网络水军的预 防效果很差,从而提出一种能够在网络水军造成一定的危害前主动识别出隐藏的网络水军 的方法。
[0005] 为解决上述技术问题,本发明提供的技术方案如下:
[0006] 一种识别网络水军团体的方法,包括以下步骤:
[0007] 获取多个网络团体的应激性回应数据,网络团体是包括多个具有相同或相似行为 特征和/或属性特征的疑似为网络水军的网络用户,应激性回应数据是网络团体中的网络 用户在其他网络用户对其发表内容进行回复点评后进行回应而产生的回应数据;
[0008] 根据应激性回应数据,标出可疑网络水军团体样本;
[0009] 根据可疑网络水军团体样本和已有的网络水军团体样本,确定网络水军团体应激 性回应特征;
[0010] 根据网络水军团体应激性回应特征,建立网络水军团体主动识别模型;
[0011] 利用网络水军团体主动识别模型识别出多个网络团体中的网络水军团体。
[0012] 作为优化,获取多个网络团体的应激性回应数据的过程,包括:
[0013] 建立智能交互机器人,智能交互机器人由智能交互机器人生成软件建立;
[0014] 确定智能交互机器人主动出击策略,主动出击策略为根据已知的网络水军的行为 特点制定对应的主动出击行为模式,包括时间、内容、方式;
[0015] 按照主动出击策略进行主动出击行为,主动出击行为是操作智能交互机器人对网 络团体发表的内容进行评论或主动发表针对性的主题内容;
[0016] 收集多个网络团体的回应数据作为应激性回应数据。
[0017] 作为优化,智能交互机器人为模拟正常用户行为的机器人账号,具备正常用户的 所有属性。
[0018] 作为优化,网络团体的应激性回应数据为智能交互机器人进行主动出击行为后网 络团体中网络用户的回应数据,包括回应账号、回应内容、回应时间、回应账号注册时间和 回应账号等级中的至少一种。
[0019] 作为优化,根据应激性回应数据标出可疑网络水军团体样本的过程包括:
[0020] 根据应激性回应数据,标出每个或部分网络团体的所有回应的最早时间和最晚时 间;
[0021] 若一个网络团体的所有回应的最早时间和最晚时间间隔在一定时间内则标记为 可疑网络水军团体。
[0022] 作为优化,网络水军团体应激性回应特征包括回应紧密度、回应时间接近度、回应 内容相似度、团体回应度中的至少一个。
[0023] 作为优化,回应紧密度由如下公式(I )( II )计算得到:
【主权项】
1. 一种识别网络水军团体的方法,其特征在于,包括以下步骤: 获取多个网络团体的应激性回应数据,所述网络团体是包括多个具有相同或相似行为 特征和/或属性特征的疑似为网络水军的网络用户,所述应激性回应数据是网络团体中的 网络用户在其他网络用户对其发表内容进行回复点评后进行回应而产生的回应数据; 根据所述应激性回应数据,标出可疑网络水军团体样本; 根据所述可疑网络水军团体样本和已有的网络水军团体样本,确定网络水军团体应激 性回应特征; 根据所述网络水军团体应激性回应特征,建立网络水军团体主动识别模型; 利用所述网络水军团体主动识别模型识别出所述多个网络团体中的网络水军团体。
2. 如权利要求1所述的识别网络水军团体的方法,其特征在于,所述获取多个网络团 体的应激性回应数据的过程,包括: 建立智能交互机器人,所述智能交互机器人由智能交互机器人生成软件建立; 确定所述智能交互机器人主动出击策略,所述主动出击策略为根据已知的网络水军的 行为特点制定对应的主动出击行为模式,包括时间、内容、方式; 按照所述主动出击策略进行主动出击行为,所述主动出击行为是操作智能交互机器人 对所述网络团体发表的内容进行评论或主动发表针对性的主题内容; 收集所述多个网络团体的回应数据作为应激性回应数据。
3. 如权利要求2所述的识别网络水军的方法,其特征在于,所述智能交互机器人为模 拟正常用户行为的机器人账号,具备正常用户的所有属性。
4. 如权利要求1-3中任一项所述的识别网络水军团体的方法,其特征在于,所述网络 团体的应激性回应数据为所述智能交互机器人进行主动出击行为后所述网络团体中网络 用户的回应数据,包括回应账号、回应内容、回应时间、回应账号注册时间和回应账号等级 中的至少一种。
5. 如权利要求1所述的识别网络水军团体的方法,其特征在于,所述根据所述应激性 回应数据标出可疑网络水军团体样本的过程包括: 根据所述应激性回应数据,标出每个或部分网络团体的所有回应的最早时间和最晚时 间; 若一个网络团体的所有回应的最早时间和最晚时间间隔在一定时间内则标记为可疑 网络水军团体。
6. 如权利要求1所述的识别网络水军团体的方法,其特征在于,所述网络水军团体应 激性回应特征包括回应紧密度、回应时间接近度、回应内容相似度、团体回应度中的至少一 个。
7. 如权利要求6所述的识别网络水军团体的方法,其特征在于, 所述回应紧密度由如下公式(I)(II)计算得到:
其中,L(g,r)、F(g,r)分别表示网络团体g中的一个网络用户对针对其的智能交互机 器人回应的最晚时间和最早时间,R
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1