一种恶意消息的识别方法及装置、服务器的制造方法

文档序号:8265697阅读:301来源:国知局
一种恶意消息的识别方法及装置、服务器的制造方法
【技术领域】
[0001]本发明涉及互联网技术领域,具体涉及一种恶意消息的识别方法及装置、服务器。
【背景技术】
[0002]众所周知,用户可以通过互联网工具(如论坛)来进行信息源发表(即发帖),而在实践中发现,用户通过互联网工具发表的信息源中可能会包括用户反复灌水的恶意消息。为了识别这些恶意消息,现有技术中通常会在固定的分析周期内切割信息源,以获得某一维度(如发帖的用户信息、用户IP等)的消息特征,进一步地可以分析这一维度的相同消息特征的聚集度,当聚集度大于等于预设聚集度时,可以识别出消息特征所属消息为恶意消息。然而,仅将某一维度的消息特征作为分析对象而忽略了其他维度的消息特征,会降低恶意消息的识别率。

【发明内容】

[0003]本发明实施例公开了一种恶意消息的识别方法及装置,能够提高恶意消息的识别率。
[0004]本发明实施例第一方面公开一种恶意消息的识别方法,包括:
[0005]识别每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度;
[0006]判断所述每一维度的各类相同消息特征的聚集度中是否存在聚集度大于等于所述维度对应的聚集阈值,若存在,提取所述聚集度大于等于所述维度对应的聚集阈值的相同消息特征加入恶意消息特征集合;以及,从所述聚集度大于等于所述维度对应的聚集阈值的相同消息特征中每一消息特征所属消息内,提取该消息特征所属消息包括的位于其他维度的消息特征加入所述恶意消息特征集合;
[0007]当检测到用户输入的信息源时,判断所述用户输入的信息源包括的消息特征是否属于所述恶意消息特征集合包括的恶意消息特征,若属于,识别出所述用户输入的信息源包括的恶意消息特征所属消息为恶意消息。
[0008]本发明实施例第二方面公开一种恶意消息的识别装置,包括:
[0009]第一识别单元,用于识别每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度;
[0010]第一判断单元,用于判断所述每一维度的各类相同消息特征的聚集度中是否存在聚集度大于等于所述维度对应的聚集阈值;
[0011]第一提取单元,用于在所述第一判断单元的辨别结果为是时,提取所述聚集度大于等于所述维度对应的聚集阈值的相同消息特征加入恶意消息特征集合;以及,从所述聚集度大于等于所述维度对应的聚集阈值的相同消息特征中每一消息特征所属消息内,提取该消息特征所属消息包括的位于其他维度的消息特征加入所述恶意消息特征集合;
[0012]第二判断单元,用于当检测到用户输入的信息源时,判断所述用户输入的信息源包括的消息特征是否属于所述恶意消息特征集合包括的恶意消息特征,
[0013]第二识别单元,用于在所述第二判断单元的判断结果为是时,识别出所述用户输入的信息源包括的恶意消息特征所属消息为恶意消息。
[0014]本发明实施例第三方面公开一种服务器,所述服务器包括本发明实施例第二方面公开的恶意消息的识别装置。
[0015]本发明实施例中,在识别出每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度之后,若判断出每一维度的各类相同消息特征的聚集度中存在聚集度大于等于该维度对应的聚集阈值,则提取聚集度大于等于该维度对应的聚集阈值的相同消息特征加入恶意消息特征集合,以及从聚集度大于等于该维度对应的聚集阈值的相同消息特征中每一消息特征所属消息内,提取该消息特征所属消息包括的位于其他维度的消息特征加入恶意消息特征集合,从而可以提高对恶意消息特征的覆盖度,在此基础上,当判断出用户输入的信息源包括的消息特征属于恶意消息特征集合包括的恶意消息特征时,即可识别出用户输入的信息源包括的恶意消息特征所属消息为恶意消息,从而可以提高恶意消息的识别率。
【附图说明】
[0016]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是本发明实施例公开的一种恶意消息的识别方法的流程示意图;
[0018]图2是本发明实施例公开的一种不同分析周期下训练信息源的各个维度的消息特征的分布示意图;
[0019]图3是本发明实施例公开的另一种恶意消息的识别方法的流程示意图;
[0020]图4是本发明实施例公开的又一种恶意消息的识别方法的流程示意图;
[0021]图5是本发明实施例公开的一种恶意消息的识别装置的结构示意图;
[0022]图6是本发明实施例公开的另一种恶意消息的识别装置的结构示意图;
[0023]图7是本发明实施例公开的又一种恶意消息的识别装置的结构示意图;
[0024]图8是本发明实施例公开的一种服务器的结构示意图。
【具体实施方式】
[0025]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0026]本发明实施例公开了一种恶意消息的识别方法及装置,可以提高对恶意消息特征的覆盖度,从而能够提高恶意消息的识别率。以下分别进行详细说明。
[0027]请参阅图1,图1是本发明实施例公开的一种恶意消息的识别方法的流程示意图。其中,图1所示的恶意消息的识别方法可以适用于论坛服务器、社交服务器以及其他具有信息发布功能的服务器、平台,本发明实施例不作限定。如图1所示,该恶意消息的识别方法可以包括以下步骤。
[0028]S101、识别每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度。
[0029]本发明实施例中,可以由论坛服务器、社交服务器等服务器来识别每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度。
[0030]本发明实施例中,每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度是指,每一分析周期内训练信息源的每一维度的各类相同消息特征的数目。如图2所示,假设在分析周期A、B、C内,训练信息源包括3个维度,分别是维度α、维度β以及维度σ ,在每一维度中小方块均表不消息特征,而且相同颜色的小方块代表一类相同的消息特征,其中,不同维度在同一垂直线上的消息特征属于同一消息。如图2所示,在分析周期A内维度α的白色小方块表示的一类相同消息特征的聚集度为2,黑色小方块表示的另一类相同消息特征的聚集度为3。如图2所示,在分析周期A内维度β的灰色小方块表示的一类相同消息特征的聚集度为2。如图2所示,在分析周期A内维度σ的浅色小方块表示的一类相同消息特征的聚集度为5。
[0031]S102、判断每一维度的各类相同消息特征的聚集度中是否存在聚集度大于等于该维度对应的聚集阈值,若存在,提取聚集度大于等于该维度对应的聚集阈值的相同消息特征加入恶意消息特征集合;以及,从聚集度大于等于该维度对应的聚集阈值的相同消息特征中每一消息特征所属消息内,提取该消息特征所属消息包括的位于其他维度的消息特征加入恶意消息特征集合。
[0032]本发明实施例中,服务器在识别每一分析周期内训练信息源的每一维度的各类相同消息特征的聚集度之后,可以执行上述步骤S102。
[0033]举例来说,在图2中假设维度α对应的聚集阈值为3,那么服务器通过执行上述步骤S102,在分析周期A内可以判断出维度α中的黑色小方块表示的一类相同消息特征的聚集度(即3)大于等于维度α对应的聚集阈值3,因此,服务器可以提取维度α中的黑色小方块表示的相同消息特征加入恶意消息特征集合;以及,服务器可以从维度α中的黑色小方块表示的相同消息特征中每一消息特征所属消息中,提取该消息特征所属消息包括的位于维度β以及维度σ的消息特征加入恶意消息特征集合(其中,维度α、维度β以及维度σ在同一垂直线上的消息特征属于同一消息),从而可以提高对恶意消息特征的覆盖度。
[0034]举例来说,在图2中假设维度β对应的聚
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1