一种垃圾邮件过滤方法及装置制造方法

文档序号:7816810阅读:169来源:国知局
一种垃圾邮件过滤方法及装置制造方法
【专利摘要】本发明公开了一种垃圾邮件过滤方法及装置,用以提高垃圾邮件过滤效果。该方法将接收到的各待发送邮件对应的发送方标识作为当前标识,将预先记录的已发送邮件对应的发送方标识作为历史标识,当未包含在由历史标识构成的标识集合中的当前标识的数量大于第一设定阈值时,拒绝发送各待发送邮件中的部分邮件。上述方法通过对比各待发送邮件的发送方标识与已发送邮件的发送方标识,来确定当前是否存在通过多个账号发送垃圾邮件的用户,一旦未包含在由历史标识构成的标识集合中的当前标识的数量较多,就可确定当前存在通过多个账号发送垃圾邮件的用户,从而对各待发送邮件进行过滤,可有效过滤垃圾邮件。
【专利说明】一种垃圾邮件过滤方法及装置

【技术领域】
[0001]本发明涉及反垃圾邮件技术,尤其涉及一种垃圾邮件过滤方法及装置。

【背景技术】
[0002]随着电子商务与网络技术的发展,电子邮箱已经成为广大用户常用的信息交流工具之一,而越来越多的垃圾邮件也出现在用户的邮箱中。垃圾邮件是指未经用户许可而强行发送到用户邮箱中的任何电子邮件。
[0003]垃圾邮件在外发过程中不仅会占用大量的传输、存储和运算等的网络资源,造成网络资源的浪费,还可能会给收到垃圾邮件的用户带来诸多不便。此外,如果接收服务器接收到发送服务器发送的大量垃圾邮件后,很可能会将该发送服务器添加到黑名单中,从而拒绝接收该发送服务器发送的任何邮件,从而影响正常邮件的发送。
[0004]为了避免上述因垃圾邮件导致的各种问题,需要在发送服务器中配置垃圾邮件过滤策略,来阻止垃圾邮件的发送。
[0005]在现有技术中,垃圾邮件过滤策略一般为:发送服务器在接收到一个用户发送邮件的请求时,确定该用户在单位时间(如,一分钟)内发送的邮件的数量,如果确定的数量大于预设阈值,则拒绝为该用户发送邮件。
[0006]但是,如果发送垃圾邮件的用户通过多个账号来发送邮件,每个账号在单位时间内发送的邮件的数量小于上述预设阈值,则上述现有技术中的垃圾邮件过滤方法就将失效,也即,现有技术中的垃圾邮件过滤方法不能有效的过滤垃圾邮件。


【发明内容】

[0007]本发明实施例提供一种垃圾邮件过滤方法及装置,用以提高对垃圾邮件的过滤效果O
[0008]本发明实施例提供的一种垃圾邮件过滤方法,包括:
[0009]接收各待发送邮件;
[0010]确定各待发送邮件对应的发送方标识,作为当前标识;
[0011]确定预先记录的已发送邮件对应的发送方标识,作为历史标识;
[0012]根据由各历史标识所构成的标识集合,确定未包含在所述标识集合中的当前标识的数量;
[0013]当所述数量大于第一设定阈值时,拒绝发送各待发送邮件中的部分邮件。
[0014]本发明实施例提供的一种垃圾邮件过滤装置,包括:
[0015]待发送邮件接收模块,用于接收各待发送邮件;
[0016]当前标识确定模块,用于确定各待发送邮件对应的发送方标识,作为当前标识;
[0017]历史标识确定模块,用于确定预先记录的已发送邮件对应的发送方标识,作为历史标识;
[0018]数量确定模块,用于根据由各历史标识所构成的标识集合,确定未包含在所述标识集合中的当前标识的数量;
[0019]邮件处理模块,用于当所述数量大于第一设定阈值时,拒绝发送各待发送邮件中的部分邮件。
[0020]本发明实施例提供的一种垃圾邮件过滤方法,该方法将接收到的各待发送邮件对应的发送方标识作为当前标识,将预先记录的已发送邮件对应的发送方标识作为历史标识,当未包含在由历史标识构成的标识集合中的当前标识的数量大于第一设定阈值时,拒绝发送各待发送邮件中的部分邮件。上述方法通过对比各待发送邮件的发送方标识与已发送邮件的发送方标识,来确定当前是否存在通过多个账号发送垃圾邮件的用户,一旦未包含在由历史标识构成的标识集合中的当前标识的数量较多,就可确定当前存在通过多个账号发送垃圾邮件的用户,从而对各待发送邮件进行过滤,可有效过滤垃圾邮件。

【专利附图】

【附图说明】
[0021]此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0022]图1为本发明实施例提供的垃圾邮件过滤的过程;
[0023]图2为本发明实施例提供的垃圾邮件过滤的详细过程;
[0024]图3为本发明实施例提供的垃圾邮件过滤装置结构示意图。

【具体实施方式】
[0025]在现有技术中,如果发送垃圾邮件的用户通过多个账号(俗称“小号”)来发送邮件,每个账号在单位时间内发送的邮件的数量小于设定阈值,则现有技术中垃圾邮件过滤方法就会失效。为了有效的过滤垃圾邮件,本发明实施例通过对比当前各待发送邮件对应的发送方标识与已发送邮件对应的发送方标识,来确定当前是否存在通过多个小号发送邮件的用户,如果存在,则进行相应的邮件过滤。
[0026]为使本发明的目的、技术方案和优点更加清楚,以下将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0027]以下将具体说明本发明实施例提供的垃圾邮件过滤方法。
[0028]参见图1,为本发明实施例提供的垃圾邮件过滤过程,包括:
[0029]SlOl:接收各待发送邮件。
[0030]在本发明实施例中,用户编辑好邮件后,将邮件发送出去时,该邮件首先会发送到发送服务器中,此时,发送服务器接收到的该用户编辑好的邮件就是待发送邮件。一般的,发送服务器接收到待发送邮件后,会先采用预设策略判断该待发送邮件是否合法,如果合法,再根据该待发送邮件中携带的接收方标识,将该待发送邮件发送出去。
[0031]S102:确定各待发送邮件对应的发送方标识,作为当前标识。
[0032]在本发明实施例中,待发送邮件对应的发送方标识可以是该待发送邮件中携带的发件人邮箱地址,也就是发件人账号。具体的,发送服务器接收到各待发送邮件后,可从每个待发送邮件中提取出发送方标识,并对提取出的发送方标识进行去重处理,将去重处理后得到的发送方标识作为当前标识。
[0033]例如,发送服务器接收到5个待发送邮件,其中,第1、2个待发送邮件是账号A发送的,第3、4个待发送邮件是账号B发送的,第5个待发送邮件是账号C发送的。发送服务器从这5待发送邮件中提取出来的发送方标识包括:2个账号A、2个账号B、I个账号C。对各账号进行去重处理,得到账号A、账号B、账号C这三个账号,将这三个账号作为当前标识。
[0034]S103:确定预先记录的已发送邮件对应的发送方标识,作为历史标识。
[0035]在本发明实施例中,发送服务器每发送一个邮件之后,可将发送该邮件的日志保存在历史记录中,该日志中至少包括:发送邮件的时间,发送方标识和接收方标识。因此,发送服务器就可以根据历史记录,获取各已发送邮件的发送方标识,对获取的各发送方标识进行去重处理,将去重处理后的发送方标识作为历史标识。
[0036]继续沿用上例,假设发送服务器之前已经发送了 4个邮件,其中,这4个已发送邮件中,第I个已发送邮件是账号A发送的,第2、3个已发送邮件是账号D发送的,第4个已发送邮件是账号E发送的。则发送服务器可根据历史记录中保存的这4个已发送邮件的发送日志,分别提取这4个已发送邮件的发件人账号,并进行去重处理,得到账号A、账号D、账号E,将这三个账号作为历史标识。
[0037]S104:根据由各历史标识所构成的标识集合,确定未包含在所述标识集合中的当前标识的数量。
[0038]继续沿用上例,发送服务器确定出的由历史标识所构成的标识集合即为{账号A,账号D,账号E},当前标识包括账号A、账号B、账号C,因此,可确定未包含在上述标识集合中的当前标识为账号B和账号C,从而确定未包含在该标识集合中的当前标识的数量为2。
[0039]S105:当该数量大于第一设定阈值时,拒绝发送各待发送邮件中的部分邮件。
[0040]也就是说,发送服务器可判断步骤S104确定出的未包含在标识集合中的当前标识的数量是否大于第一设定阈值,若是,则说明当前存在通过多个小号发送邮件的用户,因此对各待发送邮件进行过滤,拒绝发送各待发送邮件中的部分邮件,其余部分的邮件可以发送,否则,说明当前不存在通过多个小号发送邮件的用户,可直接发送所有的待发送邮件。
[0041]继续沿用上例,假设第一设定阈值为1,则由于发送服务器通过步骤S104确定出未包含在标识集合中的当前标识的数量为2,大于第一设定阈值,因此,拒绝发送5个待发送邮件中的部分邮件。其中,可随机从各待发送邮件中选择出部分邮件并拒绝发送。
[0042]具体的,对于每个待发送邮件来说,可预设拒绝发送每个待发送邮件的概率P,拒绝发送每个待发送邮件的概率P均相同,因此,发送服务器针对每个待发送邮件,可以概率P拒绝发送该待发送邮件,以概率(1-P)允许发送该待发送邮件。而由于预先针对每个待发送邮件设置的拒绝发送的概率P均相同,因此,发送服务器也可直接确定各待发送邮件的数量与预设百分比的乘积,对该乘积进行取整,得到取整值,从各待发送邮件中,随机选择数量为该取整值的待发送邮件,并拒绝发送选择出的待发送邮件,发送其余未被选择的邮件。也即,上述的预设百分比就等于针对每个待发送邮件设置的拒绝发送的概率P。
[0043]其中,上述的取整方法可以为上取整、下取整或四舍五入取整等方法,本发明对此不做限定。
[0044]继续沿用上例,假设针对每个待发送邮件设置的拒绝发送的概率P为0.7,则该预设百分比即为70%,发送服务器可确定各待发送邮件的数量5与预设百分比70%的乘积为5X70%= 3.5,对确定的值3.5进行四舍五入取整,得到取整值4,从5个待发送邮件中,随机选择4个待发送邮件,拒绝发送选择出的这4个邮件,发送其余的I个邮件。
[0045]上述图1所示的方法,通过对比各待发送邮件的发送方标识与已发送邮件的发送方标识,来确定当前是否存在通过多个小号发送邮件的用户,即使发送垃圾邮件的用户通过多个小号来发送垃圾邮件,且每个小号在单位时间内发送邮件的数量较少,上述方法也可确定出当前存在通过多个小号发送垃圾邮件的用户,从而对各待发送邮件进行过滤,因此可以有效过滤垃圾邮件。
[0046]考虑到在实际应用场景中,垃圾邮件发送期一般都是在某一特定的时间段内,t匕如在凌晨的1:00?3:00这一时间段内,为了使得本发明实施例上述图1所示的垃圾邮件过滤方法在时间上更加有针对性,以避免资源的浪费,可以设定一个预设时间段,仅在该预设时间段内采用图1所示的方法过滤垃圾邮件。
[0047]具体的,发送服务器在通过步骤S105拒绝发送各待发送邮件中的部分邮件之前,需要确定当前时刻在预设时间段内。进一步的,发送服务器可先判断当前时刻是否在预设时间段内,若是,则执行如图1所示的方法过滤垃圾邮件,否则,可采用其他方法过滤垃圾邮件。
[0048]进一步的,在本发明实施例中,可将多个时间段设定为预设时间段,例如,由于垃圾邮件的发送时间一般集中在每天凌晨的1:00?3:00和中午12:00?13:00这两个时间段,因此可以设置每天的1:00?3:00和12:00?13:00这两个时间段为预设时间段。则发送服务器在接收到各待发送邮件之后,先判断当前时刻是否在1:00?3:00以及12:00?13:00之内,如果是,则执行图1所示的垃圾邮件过滤方法,否则,可采用其他方法过滤垃圾邮件。
[0049]相应的,在上述步骤S103中,确定历史标识的方法具体可以为,通过在历史记录中,确定发送时刻不在预设时间段内的已发送邮件对应的发送方标识,作为历史标识。
[0050]例如,假设预设时间段为每天1:00?3:00,而历史记录中共保存的4个已发送邮件的发送日志,这4个已发送邮件分别由账号A、账号D、账号E发送,其中,账号A发送邮件的发送时刻为9:00,不在预设时间段(I:00?3:00)内,而账号D和账号E发送的邮件均在预设时间段内,因此,发送服务器在确定历史标识时,确定发送时刻不在预设时间段内的已发送邮件为账号D和账号E发送的邮件,从而确定账号D和账号E为历史标识。
[0051]考虑到在实际应用场景中,用户通常不会每时每刻都在发送邮件,在不同的时间段内,发送邮件的用户不完全相同甚至完全不同是非常正常的现象,也就是说,在不同的时间段内,发送服务器接收到的各待发送邮件对应的发送方标识存在很大差异是非常正常的。因此,当未包含在上述标识集合(由各历史标识构成)中的当前标识的数量较多(大于第一设定阈值)时,仍不能完全说明当前存在通过多个小号发送垃圾邮件的用户,这些未包含在标识集合中的当前标识也有可能是正常用户的标识,如果只要未包含在标识集合中的当前标识的数量大于第一设定阈值,就拒绝发送一部分待发送邮件,势必会导致大量的正常邮件不能被发送。
[0052]因此,为了尽量保证正常邮件的发送,在本发明实施例中,发送服务器在拒绝发送各待发送邮件中的部分邮件之前,还可确定各待发送邮件的数量与各待发送邮件对应的发送方标识的数量的比值,并判断该比值是否大于第二设定阈值,若是,则说明当前存在通过多个小号发送邮件的用户,因此对各待发送邮件进行过滤,拒绝发送各待发送邮件中的部分邮件,其余部分的邮件可以发送,否则,说明当前不存在通过多个小号发送邮件的用户,可直接发送所有的待发送邮件。
[0053]例如,假设各待发送邮件的数量为500,各待发送邮件对应的发送方标识的数量为3,第二设定阈值为200,则发送服务器在确定出未包含在标识集合中的当前标识的数量大于第一设定阈值之后,可确定各待发送邮件的数量与各待发送邮件对应的发送方标识的数量的比值,为500/3。由于该比值小于第二设定阈值200,因此,可说明当前不存在通过多个小号发送邮件的用户,可直接发送所有的待发送邮件。这样,就可以保证正常邮件的发送。当然,如果该比值大于第二设定阈值,则可确定存在通过多个小号发送邮件的用户,拒绝发送各待发送邮件中的部分邮件。
[0054]其中,在设定上述第二设定阈值时,可统计发送正常邮件的用户在单位时间内发送邮件的最大数量,将该最大数量作为该第二设定阈值即可。
[0055]较佳的,图1所示的垃圾邮件过滤方法还可以结合其他一种或多种垃圾邮件过滤策略,以进一步提高对垃圾邮件的过滤效果,尽量降低发送垃圾邮件的可能。
[0056]例如,可采用流量控制策略、黑名单策略、文本分析策略中的一种或几种与图1所示的方法结合。其中:
[0057]采用流量控制策略过滤邮件的方法一般是:发送服务器在接收到各待发送邮件后,针对每个发送方标识,当确定该发送方标识对应的待发送邮件的数量大于第三设定阈值时,拒绝发送该发送方标识对应的各待发送邮件。
[0058]需要说明的是,如果先采用流量控制策略对各待发送邮件过滤,再采用如图1所示的方法对各待发送邮件过滤,则上述的第二设定阈值需小于第三设定阈值,才能保证图1所示的方法有效。
[0059]采用黑名单策略过滤邮件的方法一般是:发送服务器在接收到各待发送邮件后,针对每个发送方标识,当确定该发送方标识包含在预设的黑名单中时,拒绝发送该发送方标识对应的各待发送邮件。
[0060]采用文本分析策略过滤邮件的方法一般是:发送服务器在接收到各待发送邮件后,针对每个待发送邮件,对该待发送邮件中的内容进行文本分析,以判断该待发送邮件中的内容中是否包含预设关键词,若包含,则拒绝发送该待发送邮件,否则可发送该待发送邮件。
[0061]假设将流量控制策略、黑名单策略、文本分析策略三种方法与图1所示的方法结合,则本发明实施例提供的垃圾邮件过滤的详细过程如图2所示。
[0062]参见图2,为本发明实施例提供的垃圾邮件过滤方法,包括以下步骤:
[0063]S201、接收各待发送邮件。
[0064]S202、采用流量控制策略对各待发送邮件进行过滤。
[0065]S203、采用黑名单策略对过滤后的待发送邮件进行过滤。
[0066]其中,步骤S203中所述的过滤后的待发送邮件是指经过流量控制策略过滤后剩余的各待发送邮件。
[0067]S204、采用文本分析策略对过滤后的待发送邮件进行过滤。
[0068]其中,步骤S204中所述的过滤后的待发送邮件是指经过黑名单策略过滤后剩余的各待发送邮件。
[0069]需要说明的是,上述步骤S202、S203和S204的执行顺序可以互换。
[0070]S205、判断当前时刻是否在预设时间段内,若是,执行步骤S206,否则,执行步骤S214。
[0071]S206、确定过滤后的待发送邮件对应的发送方标识,作为当前标识。
[0072]其中,步骤S206中所述的过滤后的待发送邮件是指经过流量控制策略、黑名单策略、文本分析策略过滤后剩余的各待发送邮件。
[0073]S207、在历史记录中,确定当前时刻不在预设时间段内的已发送邮件对应的发送方标识,作为历史标识。
[0074]S208、确定未包含在由各历史标识所构成的标识集合中的当前标识的数量。
[0075]S209、判断该数量是否大于第一设定阈值,如果是,执行步骤S210,否则,执行步骤S214。
[0076]S210、确定各待发送邮件的数量与各待发送邮件对应的发送方标识的数量的比值。
[0077]S211、判断该比值是否大于第二设定阈值,若是,执行步骤S212,否则,执行步骤S214。
[0078]S212、确定各待发送邮件的数量与预设百分比的乘积,对该乘积进行取整,得到取整值。
[0079]S213、从各待发送邮件中,随机选择数量为该取整值的待发送邮件,并拒绝发送,发送未选择的待发送邮件。
[0080]S214、发送过滤后的待发送邮件。
[0081]其中,步骤S214中所述的过滤后的待发送邮件是指经过流量控制策略、黑名单策略、文本分析策略过滤后剩余的各待发送邮件。
[0082]以上为本发明实施例提供的垃圾邮件过滤方法,基于同样的思路,本发明实施例还提供了一种垃圾邮件过滤装置,如图3所示,包括:
[0083]待发送邮件接收模块31,用于接收各待发送邮件;
[0084]当前标识确定模块32,用于确定发送各待发送邮件的当前用户标识;
[0085]历史标识确定模块33,用于确定预先记录的已发送邮件对应的发送方标识,作为历史标识;
[0086]数量确定模块34,用于根据由各历史标识所构成的标识集合,确定未包含在所述标识集合中的当前标识的数量;
[0087]邮件处理模块35,用于当所述数量大于第一设定阈值时,拒绝发送各待发送邮件中的部分邮件。
[0088]可选的,所述装置还包括:
[0089]时间确定模块36,用于在拒绝发送各待发送邮件中的部分邮件之前,确定当前时刻在预设时间段内。
[0090]可选的,历史标识确定模块33,具体用于:在历史记录中,确定发送时刻不在预设时间段内的已发送邮件对应的发送方标识,作为历史标识。
[0091]可选的,所述装置还包括:
[0092]比较模块37,用于在拒绝发送各待发送邮件中的部分邮件之前,确定各待发送邮件的数量与各待发送邮件对应的发送方标识的数量的比值大于第二设定阈值。
[0093]邮件处理模块35,具体用于:
[0094]确定各待发送邮件的数量与预设百分比的乘积;
[0095]对所述乘积进行取整,得到取整值;
[0096]从各待发送邮件中,随机选择数量为所述取整值的待发送邮件;
[0097]拒绝发送选择出的待发送邮件。
[0098]本发明实施例提供的一种垃圾邮件过滤方法,该方法将接收到的各待发送邮件对应的发送方标识作为当前标识,将预先记录的已发送邮件对应的发送方标识作为历史标识,当未包含在由历史标识构成的标识集合中的当前标识的数量大于第一设定阈值时,拒绝发送各待发送邮件中的部分邮件。上述方法通过对比各待发送邮件的发送方标识与已发送邮件的发送方标识,来确定当前是否存在通过多个账号发送垃圾邮件的用户,一旦未包含在由历史标识构成的标识集合中的当前标识的数量较多,就可确定当前存在通过多个账号发送垃圾邮件的用户,从而对各待发送邮件进行过滤,可有效过滤垃圾邮件。
[0099]本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0100]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0101]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0102]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0103]在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0104]内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
[0105]计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0106]还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0107]本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0108]以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
【权利要求】
1.一种垃圾邮件过滤方法,其特征在于,包括: 接收各待发送邮件; 确定各待发送邮件对应的发送方标识,作为当前标识; 确定预先记录的已发送邮件对应的发送方标识,作为历史标识; 根据由各历史标识所构成的标识集合,确定未包含在所述标识集合中的当前标识的数量; 当所述数量大于第一设定阈值时,拒绝发送各待发送邮件中的部分邮件。
2.如权利要求1所述的方法,其特征在于,拒绝发送各待发送邮件中的部分邮件之前,所述方法还包括: 确定当前时刻在预设时间段内。
3.如权利要求1或2所述的方法,其特征在于,确定预先记录的已发送邮件对应的发送方标识,具体包括: 在历史记录中,确定发送时刻不在预设时间段内的已发送邮件对应的发送方标识。
4.如权利要求1所述的方法,其特征在于,拒绝发送各待发送邮件中的部分邮件之前,所述方法还包括: 确定各待发送邮件的数量与各待发送邮件对应的发送方标识的数量的比值大于第二设定阈值。
5.如权利要求1所述的方法,其特征在于,拒绝发送各待发送邮件中的部分邮件,具体包括: 确定各待发送邮件的数量与预设百分比的乘积; 对所述乘积进行取整,得到取整值; 从各待发送邮件中,随机选择数量为所述取整值的待发送邮件; 拒绝发送选择出的待发送邮件。
6.一种垃圾邮件过滤装置,其特征在于,包括: 待发送邮件接收模块,用于接收各待发送邮件; 当前标识确定模块,用于确定各待发送邮件对应的发送方标识,作为当前标识; 历史标识确定模块,用于确定预先记录的已发送邮件对应的发送方标识,作为历史标识; 数量确定模块,用于根据由各历史标识所构成的标识集合,确定未包含在所述标识集合中的当前标识的数量; 邮件处理模块,用于当所述数量大于第一设定阈值时,拒绝发送各待发送邮件中的部分邮件。
7.如权利要求6所述的装置,其特征在于,所述装置还包括: 时间确定模块,用于在拒绝发送各待发送邮件中的部分邮件之前,确定当前时刻在预设时间段内。
8.如权利要求6或7所述的装置,其特征在于, 历史标识确定模块,具体用于:在历史记录中,确定发送时刻不在预设时间段内的已发送邮件对应的发送方标识,作为历史标识。
9.如权利要求6所述的装置,其特征在于,所述装置还包括: 比较模块,用于在拒绝发送各待发送邮件中的部分邮件之前,确定各待发送邮件的数量与各待发送邮件对应的发送方标识的数量的比值大于第二设定阈值。
10.如权利要求6所述的装置,其特征在于,邮件处理模块,具体用于: 确定各待发送邮件的数量与预设百分比的乘积; 对所述乘积进行取整,得到取整值; 从各待发送邮件中,随机选择数量为所述取整值的待发送邮件; 拒绝发送选择出的待发送邮件。
【文档编号】H04L12/58GK104348712SQ201410545491
【公开日】2015年2月11日 申请日期:2014年10月15日 优先权日:2014年10月15日
【发明者】宋健 申请人:新浪网技术(中国)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1