一种识别恶意信息的方法及装置的制造方法

文档序号:9791013阅读:337来源:国知局
一种识别恶意信息的方法及装置的制造方法
【技术领域】
[0001] 本发明设及互联网通信领域,特别设及一种识别恶意信息的方法及装置。
【背景技术】
[0002] 目前,用户经常通过即时通讯应用或社交网络与好友进行聊天W增进与好友之间 的感情,但是越来越多的恶意份子通过即时通讯应用或社交网络发送恶意信息给用户,如 此会给用户带来打扰。为了屏蔽运些恶意信息W避免给用户带来打扰,服务器需要识别运 些恶意信息,W便屏蔽运些恶意信息。
[0003] 当前,现有技术提供了一种识别恶意信息的方法,包括:技术人员根据经验捜集恶 意信息中常用的特征词,将捜集到的特征词组成特征词集合,将特征词集合发布到服务器 上。当服务器接收到用户发送的通讯信息时,查看特征词集合,如果该通讯信息中包括特征 词集合中包括的特征词,则将该通讯信息确定为恶意信息。
[0004] 在实现本发明的过程中,发明人发现现有技术至少存在W下问题: 阳〇化]当恶意份子利用新的特征词组合成恶意信息时,由于特征词集合中不包括运些新 的特征词,所W导致服务器无法识别出该恶意信息。

【发明内容】

[0006] 为了识别出不包括特征词集合中的特征词的恶意信息,本发明提供了一种识别恶 意信息的方法及装置。所述技术方案如下:
[0007] 一种识别恶意信息的方法,所述方法包括:
[0008] 接收用户发送的第一通讯信息;
[0009] 获取所述用户的历史信息记录,所述历史信息记录中包括在离当前时间最近的预 设时间段内所述用户发送的每个第二通讯信息;
[0010] 根据所述历史信息记录,识别所述第一通讯信息是否为恶意信息。
[0011] 一种识别恶意信息的装置,所述装置包括:
[0012] 接收模块,用于接收用户发送的第一通讯信息;
[0013] 第一获取模块,用于获取所述用户的历史信息记录,所述历史信息记录中包括在 离当前时间最近的预设时间段内所述用户发送的每个第二通讯信息;
[0014] 识别模块,用于根据所述历史信息记录,识别所述第一通讯信息是否为恶意信息。
[0015] 在本发明实施例中,接收用户发送的第一通讯信息;获取该用户的历史信息记录, 该历史信息记录中包括在离当前时间最近的预设时间段内该用户发送的每个第二通讯信 息;根据该历史信息记录,识别第一通讯信息是否为恶意信息。由于获取了用户的历史信息 记录,如此当第一通讯信息中不包括特征词集合中的特征词时,可W根据用户的历史信息 记录来识别第一通讯信息是否为恶意信息,如此能够识别出不包括特征词集合中的特征词 的恶意f旨息D
【附图说明】
[0016] 图1是本发明实施例1提供的一种识别恶意信息的方法流程图;
[0017] 图2是本发明实施例2提供的一种识别恶意信息的方法流程图;
[001引图3是本发明实施例3提供的一种识别恶意信息的方法流程图;
[0019] 图4是本发明实施例4提供的一种识别恶意信息的装置结构示意图。
【具体实施方式】
[0020] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方 式作进一步地详细描述。 阳OW 实施例1 阳02引参见图1,本发明实施例提供了一种识别恶意信息的方法,包括:
[0023] 步骤101 :接收用户发送的第一通讯信息;
[0024] 步骤102 :获取该用户的历史信息记录,该历史信息记录中包括在离当前时间最 近的预设时间段内该用户发送的每个第二通讯信息; 阳0巧]步骤103 :根据该历史信息记录,识别第一通讯信息是否为恶意信息。
[00%] 优选地,根据该历史信息记录,识别第一通讯信息是否为恶意信息,包括:
[0027] 根据第一通讯信息和历史信息记录,计算第一通讯信息分别与历史信息记录中包 括的每个第二通讯信息之间的相似度;
[0028] 获取与第一通讯信息之间的相似度超过预设相似度阔值的第二通讯信息的数 目;
[0029] 当获取的第二通讯信息的数目超过预设数目阔值时,确定第一通讯信息为恶意信 息。
[0030] 优选地,根据第一通讯信息和历史信息记录,计算第一通讯信息分别与历史信息 记录中包括的每个第二通讯信息之间的相似度,包括:
[0031] 将第一通讯信息转换为第一信息矩阵,W及将第二通讯信息转换为第二信息矩 阵;
[0032] 计算第一信息矩阵与第二信息矩阵之间的距离方差;
[0033] 根据第一信息矩阵与第二信息矩阵之间的距离方差,计算第一通讯信息与第二通 讯信息之间的相似度。 阳034] 优选地,将第一通讯信息转换为第一信息矩阵,包括:
[0035] 从第一通讯信息包括的单词中获取关系表中存在的单词作为第一单词,W及获取 关系表中不存在的单词作为第二单词,该关系表中包括单词与索引值的对应关系;
[0036] 从关系表中获取第一单词对应的索引值;
[0037] 为第二单词分配对应的索引值;
[0038] 将第一单词对应的索引值和第二单词对应的索引值组成第一通讯信息对应的第 一信息矩阵。
[0039] 优选地,根据第一信息矩阵与第二信息矩阵之间的距离方差,计算第一通讯信息 与第二通讯信息之间的相似度,包括:
[0040] 计算第一信息矩阵与第二信息矩阵之间的距离方差的倒数;
[0041] 将该倒数确定为第一通讯信息与第二通讯信息之间的相似度。
[0042] 进一步地,获取用户的历史信息记录之前,还包括:
[0043] 确定第一通讯信息中是否包括特征词集合中的特征词,如果包括,则识别出第一 通讯信息为恶意信息,如果不包括,则执行获取用户的历史信息记录的操作。
[0044] 进一步地,该方法还包括:
[0045] 如果第一通讯信息不包括特征词集合中的特征词且识别出第一通讯信息为恶意 信息,则从第一通讯信息中获取特征词;
[0046] 将获取的特征词添加到特征词集合中。
[0047] 优选地,根据历史信息记录,识别第一通讯信息是否为恶意信息,包括:
[0048] 获取第一通讯信息和每个第二通讯信息中包括的每个单词,组成单词集合;
[0049] 根据第一通讯信息和历史信息记录,生成单词集合中包括的每个单词分别对应的 单词矩阵;
[0050] 根据单词集合中包括的每个单词对应的单词矩阵,确定第一通讯信息中包括的特 征词;
[0051] 当第一通讯信息中包括的特征词的数目超过第二预设数目阔值时,识别第一通讯 f目息为恶意f目息。
[0052] 优选地,根据单词集合中包括的每个单词对应的单词矩阵,确定第一通讯信息中 包括的特征词,包括:
[0053] 计算第=单词对应的单词矩阵分别与单词集合中包括的除第=单词W外的每个 单词对应的单词矩阵之间的距离方差,第=单词为第一通讯信息中包括的任一单词;
[0054] 获取与第=单词对应的单词矩阵之间的距离方差小于预设方差阔值的每个单词 矩阵;
[0055] 当获取的单词矩阵的数目超过第=预设数目阔值时,将第=单词确定为特征词。
[0056] 在本发明实施例中,接收用户发送的第一通讯信息;获取该用户的历史信息记录, 该历史信息记录中包括在离当前时间最近的预设时间段内该用户发送的每个第二通讯信 息;根据该历史信息记录,识别第一通讯信息是否为恶意信息。由于获取了用户的历史信息 记录,如此当第一通讯信息中不包括特征词集合中的特征词时,可W根据用户的历史信息 记录来识别第一通讯信息是否为恶意信息,如此能够识别出不包括特征词集合中的特征词 的恶意f目息。
[0057] 实施例2
[0058] 本发明实施例提供了一种识别恶意信息的方法。
[0059] 目前,用户经常通过即时通讯应用或社交网络发送通讯信息给好友,但是越来越 多的恶意份子通过即时通讯应用或社交网络发送恶意信息给用户,恶意信息可W为广告信 息或欺诈信息等,运些恶意信息会给用户带来打扰。为了屏蔽运些恶意信息W避免给用户 带来打扰,服务器可W通过本发明实施例提供的方法来识别运些恶意信息,W便屏蔽运些 恶意f目息。
[0060] 参见图2,该方法具体包括:
[0061] 步骤201 :接收用户发送的第一通讯信息和该用户的用户账号;
[0062] 其中,用户在通过即时通讯应用或社交网络与好友进行聊天时,用户编辑第一通 讯信息,第一通讯信息包括至少一个单词。用户对应的终端当检测到用户触发的发送指令 时,获取该用户编辑的第一通讯信息W及该用户的用户账号,将第一通讯信息和该用户的 用户账号发送给服务器。服务器接收用户对应的终端发送的第一通讯信息和用户账号。 阳06引例如:接收用户A发送的第一通讯信息Sl为"家居饰品超低价尽在13655551110" 和用户账号IMA。
[0064] 步骤202 :确定第一通讯信息中是否包括特征词集合中的特征词,如果是,则执行 步骤203,如果否,则执行步骤204 ; 阳0化]其中,特征词集合中包括至少一个特征词。运些特征词均为从已识别的恶意信息 中提取的特征词。由于恶意信息中通常包括邮箱地址、网页地址、电话号码W及即时通讯或 社交网络账号等。所W特征词一般为包含数字、http、WWW、com、cn或@等字符的单词。例 如,广告信息中通常会有产品的价格、产品信息的网页地址W及商家的电话号码等,所W广 告信息中包含价格、网页地址和电话号码的单词都是特征词。
[0066] 本步骤具体为,对第一通讯信息进行分词处理,确定第一通讯信息中包括的每个 单词,查看特征词集合中包括的特征词,如果第一通讯信息中存在特征词集合中包括的特 征词,则执行步骤203,如果第一通讯信息中不存在特征词集合中包括的特征词,则执行步 骤 204。 W67] 例如,假设特征词集合中包括特征词"httpV'wwwV'com"和"135666
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1