一种恶意消息的识别方法及装置、服务器的制造方法_4

文档序号:8265697阅读:来源:国知局
图7所示的恶意消息的识别装置中,可以有管理人员根据实际情况自行决定是启动第二识别单元505,还是启动第二提取单元508、第四判断单元509和第四识别单元510。例如,当管理人员想进行一步提高恶意消息的识别率时,管理人员可以不启动第二识别单元505,而启动第二提取单元508、第四判断单元509和第四识别单元510。
[0083]本发明实施例中,训练信息源的维度可以包括文本内容、图片、音视频、发帖用户信息、发帖用户IP以及被转载者信息中的两个或两个以上。举例来说,当训练信息源的维度为文本内容、图片或音视频时,消息特征可以是文本内容、图片或音视频的链接地址;当训练信息源的维度为发帖用户信息时,消息特征可以是发帖用户的账号信息;当训练信息源的维度为发帖用户IP时,消息特征可以是发帖用户IP。
[0084]本发明实施例公开的恶意消息的识别装置可以提高对恶意消息特征的覆盖度,在此基础上,可以提闻恶意消息的识别率。
[0085]请参阅图8,图8是本发明实施例公开的一种服务器的结构示意图。其中,图8所示的服务器可以包括恶意消息的识别装置,该恶意消息的识别装置的结构、功能可以和图5?图7中任一个恶意消息的识别装置的结构、功能相同,本发明实施例不作赘述。其中,图8公开的一种服务器可以提闻对恶意消息特征的覆盖度,在此基础上,可以提闻恶意消息的识别率。
[0086]本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random AccessMemory, RAM)、磁盘或光盘等。
[0087]以上对本发明实施例公开的一种恶意消息的识别方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
【主权项】
1.一种恶意消息的识别方法,其特征在于,包括: 识别每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度; 判断所述每一维度的各类相同消息特征的聚集度中是否存在聚集度大于等于所述维度对应的聚集阈值,若存在,提取所述聚集度大于等于所述维度对应的聚集阈值的相同消息特征加入恶意消息特征集合;以及,从所述聚集度大于等于所述维度对应的聚集阈值的相同消息特征中每一消息特征所属消息内,提取该消息特征所属消息包括的位于其他维度的消息特征加入所述恶意消息特征集合; 当检测到用户输入的信息源时,判断所述用户输入的信息源包括的消息特征是否属于所述恶意消息特征集合包括的恶意消息特征,若属于,识别出所述用户输入的信息源包括的恶意消息特征所属消息为恶意消息。
2.根据权利要求1所述的方法,其特征在于,若判断所述用户输入的信息源包括的消息特征属于所述恶意消息特征集合包括的恶意消息特征,所述方法还包括: 判断所述用户输入的信息源包括的恶意消息特征的数量与所述恶意消息特征集合包括的恶意消息的总数量的比值是否大于等于预设阈值,如果是,识别出所述用户输入的信息源包括的恶意消息特征所属消息为恶意消息。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括: 从所述训练信息源中,提取所述聚集度大于等于所述维度对应的聚集阈值的相同消息特征中每一消息特征所属消息的用户属性;以及将所述用户属性加入恶意用户属性集合。
4.根据权利要求3所述的方法,其特征在于,若判断所述用户输入的信息源包括的消息特征属于所述恶意消息特征集合包括的恶意消息特征,所述方法还包括: 判断所述用户输入的信息源包括的恶意消息特征的数量与所述恶意消息特征集合包括的恶意消息的总数量的比值是否大于等于预设阈值,如果是,判断所述用户输入的信息源包括的恶意消息特征所属消息的用户属性是否属于所述恶意用户属性集合包括的恶意用户属性,若属于,识别出所述用户输入的信息源包括的恶意消息特征所属消息为恶意消肩、O
5.根据权利要求1?4任一项所述的方法,其特征在于,所述训练信息源的维度包括文本内容、图片、音视频、发帖用户信息、发帖用户IP以及被转载者信息中的两个或两个以上。
6.一种恶意消息的识别装置,其特征在于,包括: 第一识别单元,用于识别每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度; 第一判断单元,用于判断所述每一维度的各类相同消息特征的聚集度中是否存在聚集度大于等于所述维度对应的聚集阈值; 第一提取单元,用于在所述第一判断单元的辨别结果为是时,提取所述聚集度大于等于所述维度对应的聚集阈值的相同消息特征加入恶意消息特征集合;以及,从所述聚集度大于等于所述维度对应的聚集阈值的相同消息特征中每一消息特征所属消息内,提取该消息特征所属消息包括的位于其他维度的消息特征加入所述恶意消息特征集合; 第二判断单元,用于当检测到用户输入的信息源时,判断所述用户输入的信息源包括的消息特征是否属于所述恶意消息特征集合包括的恶意消息特征, 第二识别单元,用于在所述第二判断单元的判断结果为是时,识别出所述用户输入的信息源包括的恶意消息特征所属消息为恶意消息。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括: 第三判断单元,用于在所述第二判断单元的判断结果为是时,判断所述用户输入的信息源包括的恶意消息特征的数量与所述恶意消息特征集合包括的恶意消息的总数量的比值是否大于等于预设阈值; 第三识别单元,用于在所述第三判断单元的判断结果为是时,识别出所述用户输入的信息源包括的恶意消息特征所属消息为恶意消息。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括: 第二提取单元,用于从所述训练信息源中,提取所述聚集度大于等于所述维度对应的聚集阈值的相同消息特征中每一消息特征所属消息的用户属性;以及,将所述用户属性加入恶意用户属性集合。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括: 第四判断单元,用于在所述第二判断单元的判断结果为是时,判断所述用户输入的信息源包括的恶意消息特征的数量与所述恶意消息特征集合包括的恶意消息的总数量的比值是否大于等于预设阈值,如果是,判断所述用户输入的信息源包括的恶意消息特征所属消息的用户属性是否属于所述恶意用户属性集合包括的恶意用户属性; 第四识别单元,用于在所述第四判断单元判断出所述用户输入的信息源包括的恶意消息特征所属消息的用户属性属于所述恶意用户属性集合包括的恶意用户属性结果时,识别出所述用户输入的信息源包括的恶意消息特征所属消息为恶意消息。
10.根据权利要求6?9任一项所述的装置,其特征在于,所述训练信息源的维度包括文本内容、图片、音视频、发帖用户信息、发帖用户IP以及被转载者信息中的两个或两个以上。
11.一种服务器,其特征在于,所述服务器包括权利要求6?10任一项所述的恶意消息的识别装置。
【专利摘要】一种恶意消息的识别方法及装置,该方法包括:识别每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度;若每一维度的各类相同消息特征的聚集度中存在聚集度大于等于该维度对应的聚集阈值,提取聚集度大于等于该维度对应的聚集阈值的相同消息特征加入恶意消息特征集合;从聚集度大于等于该维度对应的聚集阈值的相同消息特征中每一消息特征所属消息内,提取该消息特征所属消息包括的位于其他维度的消息特征加入恶意消息特征集合;当检测到用户输入的信息源时,若判断用户输入的信息源包括的消息特征属于恶意消息特征集合包括的恶意消息特征,识别出用户输入的信息源包括的恶意消息特征所属消息为恶意消息。能够提高恶意消息的识别率。
【IPC分类】H04L29-06
【公开号】CN104580100
【申请号】CN201310501326
【发明人】赵立, 沈飞, 周斌, 谢波, 刘婷婷, 杨正朋, 稂衡峰
【申请人】腾讯科技(深圳)有限公司
【公开日】2015年4月29日
【申请日】2013年10月23日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1