一种恶意消息的识别方法及装置、服务器的制造方法_3

文档序号:8265697阅读:来源:国知局
色小方块表示的另一类相同消息特征的聚集度为3。如图2所示,在分析周期A内维度β的灰色小方块表示的一类相同消息特征的聚集度为2。如图2所示,在分析周期A内维度σ的浅色小方块表示的一类相同消息特征的聚集度为5。
[0054]S402、服务器判断每一维度的各类相同消息特征的聚集度中是否存在聚集度大于等于该维度对应的聚集阈值,若存在,执行步骤S403 ;若不存在,结束本流程。
[0055]S403、服务器提取聚集度大于等于该维度对应的聚集阈值的相同消息特征加入恶意消息特征集合;以及,从聚集度大于等于该维度对应的聚集阈值的相同消息特征中每一消息特征所属消息内,提取该消息特征所属消息包括的位于其他维度的消息特征加入恶意消息特征集合。
[0056]举例来说,在图2中假设维度α对应的聚集阈值为3,那么服务器通过执行上述步骤S402,在分析周期A内可以判断出维度α中的黑色小方块表示的一类相同消息特征的聚集度(即3)大于等于维度α对应的聚集阈值3,因此,服务器可以提取维度α中的黑色小方块表示的相同消息特征加入恶意消息特征集合;以及,服务器可以从维度α中的黑色小方块表示的相同消息特征中每一消息特征所属消息中,提取该消息特征所属消息包括的位于维度β以及维度σ的消息特征加入恶意消息特征集合(其中,维度α、维度β以及维度σ在同一垂直线上的消息特征属于同一消息),从而可以提高对恶意消息特征的覆盖度。
[0057]S404、服务器从训练信息源中,提取聚集度大于等于该维度对应的聚集阈值的相同消息特征中每一消息特征所属消息的用户属性;以及将用户属性加入恶意用户属性集口 ο
[0058]本发明实施例中,用户属性可以包括用户名称、账号、用户IP等,本发明实施例不作限定。
[0059]本发明实施例中,将用户属性加入恶意用户属性集合,可以形成长期信用度及短期作恶记录。
[0060]S405、当检测到用户输入的信息源时,服务器判断用户输入的信息源包括的消息特征是否属于恶意消息特征集合包括的恶意消息特征,若属于,执行步骤S406 ;若不属于,结束本流程。
[0061]S406、服务器判断用户输入的信息源包括的恶意消息特征的数量与恶意消息特征集合包括的恶意消息的总数量的比值是否大于等于预设阈值,如果是,执行步骤S407 ;如果否,执行步骤S409。
[0062]S407、服务器判断用户输入的信息源包括的恶意消息特征所属消息的用户属性是否属于恶意用户属性集合包括的恶意用户属性,若属于,执行步骤S408 ;若不属于,执行步骤 S409。
[0063]S408、服务器识别出用户输入的信息源包括的恶意消息特征所属消息为恶意消息,结束本流程。
[0064]S409、服务器识别出用户输入的信息源包括的恶意消息特征所属消息为非恶意消息,结束本流程。
[0065]本发明实施例中,训练信息源的维度可以包括文本内容、图片、音视频、发帖用户信息、发帖用户IP以及被转载者信息中的两个或两个以上。举例来说,当训练信息源的维度为文本内容、图片或音视频时,消息特征可以是文本内容、图片或音视频的链接地址;当训练信息源的维度为发帖用户信息时,消息特征可以是发帖用户的账号信息;当训练信息源的维度为发帖用户IP时,消息特征可以是发帖用户IP。
[0066]在图4所描述的方法中,在识别出每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度之后,若判断出每一维度的各类相同消息特征的聚集度中存在聚集度大于等于该维度对应的聚集阈值,则提取聚集度大于等于该维度对应的聚集阈值的相同消息特征加入恶意消息特征集合,以及从聚集度大于等于该维度对应的聚集阈值的相同消息特征中每一消息特征所属消息内,提取该消息特征所属消息包括的位于其他维度的消息特征加入恶意消息特征集合,从而可以提高对恶意消息特征的覆盖度,在此基础上,还可以从训练信息源中,提取聚集度大于等于该维度对应的聚集阈值的相同消息特征中每一消息特征所属消息的用户属性;以及将用户属性加入恶意用户属性集合,当判断出用户输入的信息源包括的消息特征属于恶意消息特征集合包括的恶意消息特征,且用户输入的信息源包括的恶意消息特征的数量与恶意消息特征集合包括的恶意消息的总数量的比值大于等于预设阈值,且用户输入的信息源包括的恶意消息特征所属消息的用户属性属于恶意用户属性集合包括的恶意用户属性时,即可识别出用户输入的信息源包括的恶意消息特征所属消息为恶意消息,从而可以提高恶意消息的识别率。
[0067]请参阅图5,图5是本发明实施例公开的一种恶意消息的识别装置的结构示意图。其中,图5所示的恶意消息的识别装置既可以是一种独立装置,也可以是对论坛服务器、社交服务器以及其他具有信息发布功能的服务器、平台所新增的一部分,本发明实施例不作限定。如图5所示,该恶意消息的识别装置可以包括:
[0068]第一识别单元501,用于识别每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度;
[0069]第一判断单元502,用于判断每一维度的各类相同消息特征的聚集度中是否存在聚集度大于等于该维度对应的聚集阈值;
[0070]第一提取单元503,用于在第一判断单元502的辨别结果为是时,提取聚集度大于等于该维度对应的聚集阈值的相同消息特征加入恶意消息特征集合;以及,从聚集度大于等于该维度对应的聚集阈值的相同消息特征中每一消息特征所属消息内,提取该消息特征所属消息包括的位于其他维度的消息特征加入恶意消息特征集合;
[0071]第二判断单元504,用于当检测到用户输入的信息源时,判断用户输入的信息源包括的消息特征是否属于恶意消息特征集合包括的恶意消息特征,
[0072]第二识别单元505,用于在第二判断单元504的判断结果为是时,识别出用户输入的信息源包括的恶意消息特征所属消息为恶意消息。
[0073]本发明实施例中,恶意消息特征集合可以存储在第一提取单元503中。
[0074]请一并参阅图6,图6是本发明实施例公开的另一种恶意消息的识别装置的结构示意图。其中,图6所示的恶意消息的识别装置是由图5所示的一种恶意消息的识别装置进行优化得到的,与图5所示的一种恶意消息的识别装置相比较,图6所示的一种恶意消息的识别装置还包括:
[0075]第三判断单元506,用于在第二判断单元504的判断结果为是时,判断用户输入的信息源包括的恶意消息特征的数量与恶意消息特征集合包括的恶意消息的总数量的比值是否大于等于预设阈值;
[0076]第三识别单元507,用于在第三判断单元506的判断结果为是时,识别出用户输入的信息源包括的恶意消息特征所属消息为恶意消息。
[0077]本发明实施例中,在图6所示的恶意消息的识别装置中,可以有管理人员根据实际情况自行决定是启动第二识别单元505,还是启动第三判断单元506和第三识别单元507。例如,当管理人员想进行一步提高恶意消息的识别率时,管理人员可以不启动第二识别单元505,而启动第三判断单元506和第三识别单元507。
[0078]请一并参阅图7,图7是本发明实施例公开的另一种恶意消息的识别装置的结构示意图。其中,图7所示的恶意消息的识别装置是由图5所示的一种恶意消息的识别装置进行优化得到的,与图5所示的一种恶意消息的识别装置相比较,图7所示的一种恶意消息的识别装置还包括:
[0079]第二提取单元508,用于从训练信息源中,提取聚集度大于等于该维度对应的聚集阈值的相同消息特征中每一消息特征所属消息的用户属性;以及,将用户属性加入恶意用户属性集合。
[0080]第四判断单元509,用于在第二判断单元504的判断结果为是时,判断用户输入的信息源包括的恶意消息特征的数量与恶意消息特征集合包括的恶意消息的总数量的比值是否大于等于预设阈值,如果是,判断用户输入的信息源包括的恶意消息特征所属消息的用户属性是否属于恶意用户属性集合包括的恶意用户属性;
[0081]第四识别单元510,用于在第四判断单元509判断出用户输入的信息源包括的恶意消息特征所属消息的用户属性属于恶意用户属性集合包括的恶意用户属性结果时,识别出用户输入的信息源包括的恶意消息特征所属消息为恶意消息。
[0082]本发明实施例中,在
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1