恶意用户识别方法及装置的制造方法

文档序号:8489990阅读:194来源:国知局
恶意用户识别方法及装置的制造方法
【技术领域】
[0001]本发明涉及互联网技术领域,特别是涉及一种恶意用户识别方法及装置。
【背景技术】
[0002]传统的社交网络应用中,某些恶意用户通常在同一 IP下使用多个社交网络账号群发广告、色情、暴力或者具有政治目的的垃圾信息。传统技术中则根据用户提交服务器的消息内容来识别恶意用户,然而提交垃圾信息的恶意用户通常针对性地对垃圾信息中的信息内容添加干扰信息(例如,在敏感词的字符之间加入符号等),使得恶意用户的识别不准确。

【发明内容】

[0003]基于此,有必要提供一种能提高识别的准确率的恶意用户识别方法。
[0004]一种恶意用户识别方法,包括:
[0005]获取全局用户的用户标识,计算其对应的信用度,根据所述全局用户的用户标识对应的信用度生成全局用户信用分布;
[0006]获取预设的查询条件,根据所述查询条件在所述全局用户的用户标识中筛选得到条件用户的用户标识;
[0007]获取所述条件用户的用户标识对应的信用度,根据所述条件用户的用户标识对应的信用度生成条件用户信用分布;
[0008]获取预设的信用度阈值,在所述全局用户信用分布和条件用户信用分布中分别获取其信用度大于/小于所述信用度阈值的全局优质/恶意用户数以及条件优质/恶意用户数;
[0009]获取预设的优质/恶意用户数阈值,计算所述全局优质/恶意用户数与所述条件优质/恶意用户数的差值,根据所述差值和所述优质/恶意用户数阈值判断所述查询条件是否对应恶意用户。
[0010]此外,还有必要提供一种能提高识别的准确率的恶意用户识别装置。
[0011]一种恶意用户识别装置,包括:
[0012]全局分布生成模块,用于获取全局用户的用户标识,计算其对应的信用度,根据所述全局用户的用户标识对应的信用度生成全局用户信用分布;
[0013]条件用户查找模块,用于获取预设的查询条件,根据所述查询条件在所述全局用户的用户标识中筛选得到条件用户的用户标识;
[0014]条件分布生成模块,用于获取所述条件用户的用户标识对应的信用度,根据所述条件用户的用户标识对应的信用度生成条件用户信用分布;
[0015]用户筛选模块,用于获取预设的信用度阈值,在所述全局用户信用分布和条件用户信用分布中分别获取大于/小于所述信用度阈值的全局优质/恶意用户数以及条件优质/恶意用户数;
[0016]恶意用户识别模块,用于获取预设的优质/恶意用户数阈值,计算所述全局优质/恶意用户数与所述条件优质/恶意用户数的差值,根据所述差值和所述优质/恶意用户数阈值判断所述查询条件是否对应恶意用户。
[0017]上述恶意用户识别方法,根据查询条件对应的条件用户的条件用户信用度分布与社交网络应用上注册的全局用户的全局用户信用度分布的差异性来判定条件用户是否对应恶意用户,与传统技术相比,即使某些添加了干扰的垃圾信息漏过检查,仍然能通过恶意用户与非恶意用户提交的消息在整体上的差异性将其识别出来,从而识别的准确率较高。
【附图说明】
[0018]图1为一个实施例中恶意用户识别方法的流程图;
[0019]图2为一个实施例中全局用户信用分布示意图;
[0020]图3为一个实施例中条件用户信用分布示意图;
[0021]图4为一个实施例中使用信用等级的全局用户信用分布示意图;
[0022]图5为一个实施例中使用信用等级的条件用户信用分布示意图;
[0023]图6为一个实施例中恶意用户识别装置的结构示意图;
[0024]图7为一个实施例中恶意用户识别装置的硬件环境图。
【具体实施方式】
[0025]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0026]除非上下文另有特定清楚的描述,本发明中的元件和组件,数量既可以单个的形式存在,也可以多个的形式存在,本发明并不对此进行限定。本发明中的步骤虽然用标号进行了排列,但并不用于限定步骤的先后次序,除非明确说明了步骤的次序或者某步骤的执行需要其他步骤作为基础,否则步骤的相对次序是可以调整的。可以理解,本文中所使用的术语“和/或”涉及且涵盖相关联的所列项目中的一者或一者以上的任何和所有可能的组口 ο
[0027]如图1所示,在一个实施例中,一种恶意用户识别方法,该方法的执行依赖于计算机程序,可运行于基于冯洛伊曼体系的计算机系统上,该方法包括:
[0028]步骤S102,获取全局用户的用户标识,计算其对应的信用度,根据所述全局用户的用户标识对应的信用度生成全局用户信用分布。
[0029]全局用户即为在社交网络应用中注册的用户。用户在社交网络应用中注册后,社交网络应用中通常使用用户数据库存储已注册用户的用户标识及相应注册信息、用户资料。可在用户数据库中查找到全局用户的用户标识。
[0030]用户标识对应的信用度即为该用户标识对应的社交网络账号提交给社交网络服务器的消息(UGC,User Generated Content,用户生成内容)的信用程度。若某个用户经常使用其社交网络账号在社交网络应用上提交具有色情、暴力、广告或政治目的的垃圾信息,则该用户的信用度则较低。
[0031]恶意用户即为信用度较低的用户,恶意用户通常将垃圾信息频繁传播给其他用户,从而影响其他用户的正常浏览。与恶意用户相对应的即为优质用户,优质用户信用度较高,为正常使用社交网络,较少违规发帖、较少重复发帖且发帖内容合乎规范的用户。
[0032]在本实施例中,计算全局用户的用户标识对应的信用度的步骤可具体为:获取全局用户的用户标识对应的消息提交次数、在线时长和垃圾消息提交次数;通过将消息提交次数、在线时长和垃圾消息提交次数分别乘以相应的预设的权重系数后叠加得到全局用户的用户标识对应的信用度。
[0033]例如,若某用户共向社交网络应用提交消息NI次,其中提交垃圾消息的次数为N2次,且在线的天数为D,则可根据公式:
[0034]C=klXNl+k2XD-k3XN2
[0035]其中,C即为信用度,kl、k2和k3分别为相应的权重系数。
[0036]在优选的方式中,还可预先设定时间区间,获取该时间区间内全局用户的用户标识对应的消息提交次数、在线时长和垃圾消息提交次数,并根据上述公式计算出全局用户在该时间区间中的信用度。例如,预先设定的时间区间为上个月,从而可获取社交网络应用上的用户在上个月30天内提交消息的次数、提交垃圾消息的次数以及上个月30天中由多少天登录过,进而计算出全局用户在上个月的信用度。
[0037]需要说明的是,对于用户提交的消息,可通过关键字匹配或机器学习算法来识别其是否为垃圾消息。例如,若消息的内容中具有与色情、暴力、政治、广告和政治目的的关键字,则可将其判定为垃圾消息,相应的,在统计垃圾消息提交次数时则加I。也可使用用于识别垃圾邮件的支持向量机对消息进行分类,从而识别用户提交的消息是否为垃圾消息。
[0038]全局用户信用分布即为计算得到社交网络应用上的用户各自的信用度后,信用度大小与用户人数的分布情况。需要说明的是,用户数均为百分比用户数,以下不再赘述。如图2所述,横轴即为信用度(可归一化到O至100),纵轴即为小于或等于相应信用度的百分比用户数。由图中即可看出,信用度小于或等于60的用户数为30%。
[0039]步骤S104,获取预设的查询条件,根据查询条件在全局用户的用户标识中筛选得到条件用户的用户标识。
[0040]在本实施例中,查询条件在社交网络应用的注册用户中筛选出特定用户群体(SP条件用户)的条件信息。可以是IP地址、消息标识、用户群组标识或用户个人资料属性值中的一种。
[0041 ] 例如,若某个IP地址在一个月内群发了大量的消息,即向社交服务器提交了大量UGC,则
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1