一种基于ip信誉值的邮件反垃圾方法及系统的制作方法

文档序号:9846744阅读:555来源:国知局
一种基于ip信誉值的邮件反垃圾方法及系统的制作方法
【技术领域】
[0001] 本发明涉及反垃圾邮件技术领域,具体涉及一种基于IP信誉值的邮件反垃圾方法 及系统。
【背景技术】
[0002] 电子邮件作为网络通信的基础应用,方便了人们的交流沟通。随之产生了垃圾邮 件的问题。垃圾邮件,即那些人们没有意愿去接收的电子邮件,严重干扰了人们的正常生 活,浪费用户的时间,造成经济损失。因而,反垃圾邮件技术应运而生。
[0003] 当前,反垃圾邮件系统主要采用IP过滤、账号黑白名单、关键词匹配、贝叶斯分类 算法等技术。其中,基于IP地址的垃圾邮件过滤,因实施简便、资源消耗少、计算速度快等优 点,得以广泛应用。
[0004] 目前,基于IP地址的邮件反垃圾系统,主要有基于单IP的流量控制、以及IP黑名单 两种方式。一,基于单IP流量控制的方式,即对每个IP最近一段时间(如5分钟、1小时、1天) 内的发信量进行控制,设置一段时间内发信量的阈值,将超出阈值的邮件判定为垃圾邮件。 二,基于IP黑名单的方式,即维护一个IP实时黑名单(RBL),将发信IP在RBL中的邮件判定为 垃圾邮件,从而进行垃圾邮件的控制和过滤。
[0005] 在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
[0006] 基于单IP流量控制的方式,因各IP的发信量差异很大,使用统一的流量控制标准, 一方面,阈值不易确定;另一方面,容易拦截正常邮件,放过垃圾邮件。基于IP黑名单的方 式,同一个IP很可能既发垃圾邮件也发好邮件,列入黑名单IP的失效时间不易把握;公开的 IP黑名单针对全网邮件,不能解决自己邮件系统的特有问题。当前两种方式都是基于单个 IP的,没有利用IP地址分级的特点,不能根据已知IP黑名单发现未知黑名单。综上,现有技 术方案简单直接,但存在较高的误判率和漏判率,影响了用户体验。

【发明内容】

[0007] 本发明实施例提供一种基于IP信誉值的邮件反垃圾方法及系统,基于IP实时黑名 单,从时域和空域分析IP行为,计算邮件IP地址的信誉值进行二分类,以增加垃圾邮件的过 滤量,减少正常邮件的拦截量,提升邮箱用户的使用体验。
[0008] -方面,本发明实施例提供了一种基于IP信誉值的邮件反垃圾方法,包括:
[0009] 识别发件方IP地址;
[0010]查询缓存中的分类信息,确认所述发件方IP地址是否正常;所述分类信息包括指 定时间段内所接收邮件对应的IP地址及所述IP地址是否正常的标识;若在所述缓存中不能 查到该发件方IP地址,则进行IP分类计算,得到该发件方IP地址的分类信息,具体包括:
[0011] 查询邮件服务器保存的IP历史记录中,该发件方IP地址出现的历史时刻的列表;
[0012] 计算每个历史时刻相对当前时刻的衰减值;
[0013] 查询该发件方IP地址所属的类别包含的IP个数;
[0014] 根据所述历史时刻的列表、每个历史时刻相对当前时刻的衰减值以及发件方IP地 址所属的类别包含的IP个数,计算该发件方IP地址的信誉值以及该发件方IP地址所属类别 的信誉值;
[0015] 根据所述信誉值对所述发件方IP地址进行二分类,得到其分类信息并写入所述缓 存中;
[0016] 若该发件方IP地址的分类信息为正常,则进行后续反垃圾程序;若该发件方IP地 址的分类信息为非正常,则将所述邮件丢弃。
[0017] 优选的,所述计算该发件方IP地址的信誉值以及该发件方IP地址所属类别的信誉 值具体通过如下公式:
,r〇为该发件方IP地址的信誉值;c =1时^为该发件方IP地址所属类别的信誉值;其中,
[0019] hist(x,c) =〈tl,t2,t3,…〉,为发件方IP地址出现的历史时刻的列表,c = 0或1; 其中,c = 0表示计算该发件方IP地址出现的历史时刻的列表,c = 1表示计算该发件方IP地 址所属类别包括的所有IP地址出现的历史时刻的列表;
[0020] decay(t,h) =2-(1:_-1:)/11,为每个历史时亥1」1:相对当前时刻1:_的衰减值,其中,11 为衰减因子,其单位与时间差的单位相同;
[0021 ] size(x,c),c = 0或1;其中,c = 0时,size(x,c) = I,c = 1时表示查询所述发件方IP 地址所述类别包含的IP个数。
[0022] 可选的:
[0023] 当tmw-t > d时,t相对当前时亥Ij t_的衰减值
[0024]否则,decay (t,h) = 1;其中,d为所述邮件服务器中记录的该发件方IP地址的失效 时间。
[0025]优选的,所述计算该发件方IP地址的信誉值以及该发件方IP地址所属类别的信誉 值还包括以下步骤:
[0026] 计算归一化信誉值:』
[0027] 其中,MAX为抑和打的最大值:
[0028] 可选的,所述缓存中还包括白名单,用于存储可信任发件服务器的外发IP地址以 及误判的非正常发件方IP地址;
[0029] 以及,在所述查询缓存中的分类信息之前,还包括:确认所述发件方IP地址未在所 述白名单中。
[0030] 另一方面,本发明实施例提供了一种基于IP信誉值的邮件反垃圾系统,包括:
[0031] 邮件服务器,用于识别发件方IP地址;
[0032] IP过滤单元,用于查询缓存中的分类信息,确认所述发件方IP地址是否正常;所述 分类信息包括指定时间段内所接收邮件对应的IP地址及所述IP地址是否正常的标识;IP分 类器,用于当所述缓存中不能查到该发件方IP地址时,则进行IP分类计算,得到该发件方IP 地址的分类信息;
[0033] 该IP分类器包括:
[0034] 历史记录查询子单元,用于查询邮件服务器保存的IP历史记录中,该发件方IP地 址出现的历史时刻的列表;
[0035] 历史记录衰减值计算子单元,用于计算每个历史时刻相对当前时刻的衰减值;
[0036] 同类别IP个数查询子单元,用于查询该发件方IP地址所属的类别包含的IP个数;
[0037] 信誉值计算子单元,用于根据所述历史时刻的列表、每个历史时刻相对当前时刻 的衰减值以及发件方IP地址所属的类别包含的IP个数,计算该发件方IP地址的信誉值以及 该发件方IP地址所属类别的信誉值;
[0038] 二分类器,用于根据所述信誉值对所述发件方IP地址进行二分类,得到其分类信 息并写入所述缓存中;
[0039]后续反垃圾单元,用于当该发件方IP地址的分类信息为正常时,进行后续反垃圾 程序;
[0040] 垃圾邮件处理单元,用于当该发件方IP地址的分类信息为非正常时,将所述邮件 丢弃。
[0041] 可选的,所述信誉值计算子单元用于通过以下公式计算该发件方IP地址的信誉值 以及该发件方IP地址所属类别的信誉值:
ro为该发件方IP地址的信誉值;c =1时^为该发件方IP地址所属类别的信誉值;其中,
[0043] hist(x,c) =〈tl,t2, t3,…〉,为发件方IP地址出现的历史时刻的列表,c = 0表示 计算该发件方IP地址出现的历史时刻的列表,c = 1表示计算该发件方IP地址所属类别包括 的所有IP地址出现的历史时刻的列表;
[0044] decay(t,h) =2-(1:_-1:)/11,为每个历史时亥1」1:相对当前时刻1:_的衰减值,其中,11 为衰减因子,其单位与时间差的单位相同;
[0045] 当c = 0时,size(x,c) = I,c = 1时size(x,c)表示查询所述发件方IP地址所述类别 包含的IP个数。
[0046] 可选的,所述历史记录衰减值计算子单元进行衰减值计算时:
[0047] 若tn?_ t > d,则 t相对当前时亥Ij t_的衰减值
[0048]否则,decay (t,h) = 1;其中,d为所述邮件服务器中记录的该发件方IP地址的失效 时间。
[0049] 优选的,所述信誉值计算子单元还用于:
[0050] 计算归一化信誉值
[0051 ] 其中,MAX为的最大值:
[0052]可选的,所述缓存中还包括白名单,用于存储可信任发件服务器的外发IP地址以 及误判的非正常发件方IP地址;
[0053]以及,所述IP过滤单元还用于在所述查询缓存中的分类信息之前,确认所述发件 方IP地址未在所述白名单中。
[0054] 上述技术方案具有如下有益效果:因采用了根据基于实时黑名单的IP历史记录及 衰减值结合计算信誉值来进行IP地址分类的技术手段,所以不仅保持了实时黑名单简便高 效的优点,还可根据已知黑名单发现未知黑名单,大幅降低了误判率和漏判率,提高了邮件 收发质量。
【附图说明】
[0055] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1