电子邮件过滤方法及装置的制造方法

文档序号:9330460阅读:810来源:国知局
电子邮件过滤方法及装置的制造方法
【技术领域】
[0001]本发明涉及电子信息技术领域,尤指一种用于实现垃圾邮件过滤的电子邮件过滤方法及装置。
【背景技术】
[0002]在电子邮件反垃圾领域一直需要解决两类问题,一个是尽可能准确的把垃圾邮件识别出来,并将其剔除掉,使其不进入到用户的收件夹中,另外一个就是在过滤垃圾邮件的同时,要保证用户真正关心的好邮件,不要被误判成垃圾邮件,错误的进入到用户的垃圾夹中。
[0003]由于用户的职业,兴趣,年龄等差异,不同用户对于同一封电子邮件的主观态度是不一样的,有人认为是垃圾邮件,有人认为不是垃圾邮件。因此,产生了一种个性化的电子邮件过滤方案,现有的个性化电子邮件过滤方案对每个用户建立特征库,新接收到的电子邮件对其提取邮件特征,与用户已有特征库进行比对,从而获得判定结果,对其进行过滤或保留操作。
[0004]现有技术中实现垃圾邮件过滤的方法流程具体如图1所示。邮件客户端(邮件客户端A、邮件客户端B、邮件客户端C等)中的邮件学习模块对存储在邮件客户端的邮件样本进行特征学习,生成特征学习库,并将学习结果发送到邮件服务器,邮件服务器将最新学习结果与该邮件客户端的原有特征库整合,形成各个客户端的最新特征库;垃圾邮件过滤器采用最新特征库对邮件服务器接收到的对应邮件客户端的新邮件进行过滤。当确定为垃圾邮件时放入回收站,当确定不是垃圾邮件时,则放入收件位置供用户收取。
[0005]在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
[0006]现有技术需要对每一个用户都建立邮件特征库,在用户量较大的情况下,需要占用很多存储资源,并且,随着收件量的增加,特征库的大小也在增加,进一步加大对存储资源的占用。

【发明内容】

[0007]本发明实施例提供一种电子邮件过滤方法及装置,用以解决现有技术中存在的针对大量用户的垃圾邮件过滤占用存储资源多,过滤效率低的问题。
[0008]—方面,本发明实施例提供了一种电子邮件过滤方法,包括:
[0009]获取待过滤的电子邮件;
[0010]确定所述电子邮件的邮件类型,以及确定所述电子邮件的收件用户所属的用户类型;
[0011]根据预先建立的用户类型和邮件类型的对应关系,判断所述待过滤的电子邮件的邮件类型是否属于所述收件用户所属的用户类型所允许接收的邮件类型;
[0012]当判断为是时,确定所述待过滤的电子邮件不是垃圾邮件;当判断为否时,确定所述待过滤的电子邮件是垃圾邮件。
[0013]在一些可选的实施例中,建立用户类型和邮件类型的对应关系的过程包括:
[0014]获取用户的邮件样本数据,其中,邮件样本数据包括邮件数据和用户数据;
[0015]根据所述邮件数据建立邮件类型特征库,根据所述用户数据建立用户类型特征库;
[0016]根据所述邮件类型特征库和所述用户类型特征库,确定用户类型和邮件类型的对应关系。
[0017]在一些可选的实施例中,确定用户类型和邮件类型的对应关系,具体包括:
[0018]从所述用户类型特征库中获取被分类到选定用户类型的用户编号;
[0019]根据获取的用户编号,获取对应用户的邮件数据,确定该用户所涉及到的邮件类型和各类型邮件的数量;
[0020]根据确定出的邮件类型和各类型邮件的数量,确定用户类型和邮件类型的对应关系O
[0021]在一些可选的实施例中,所述邮件数据包括下列信息中的至少一项:邮件编号、信封发件人、信体发件人、发信IP、邮件主题及主题分词、邮件正文及正文分词;
[0022]所述用户数据包括下列信息中的至少一项:用户编号、注册时间、年龄、职业、活跃度、用户行为、常用登陆地、常用登录方式。
[0023]在一些可选的实施例中,获取待过滤的电子邮件,具体包括:
[0024]获取接收到的新邮件;或
[0025]获取对接收到的新邮件进行全局过滤后确定出的垃圾邮件。
[0026]另一方面,本发明实施例提供了电子邮件过滤装置,包括:
[0027]获取模块,用于获取待过滤的电子邮件;
[0028]分类模块,用于确定所述电子邮件的邮件类型,以及确定所述电子邮件的收件用户所属的用户类型;
[0029]判断模块,用于根据预先建立的用户类型和邮件类型的对应关系,判断所述待过滤的电子邮件的邮件类型是否属于所述收件用户所属的用户类型所允许接收的邮件类型;
[0030]确定模块,用于当所述判断模块判断为是时,确定所述待过滤的电子邮件不是垃圾邮件;当判断为否时,确定所述待过滤的电子邮件是垃圾邮件。
[0031]在一些可选的实施例中,上述装置还包括训练模块,用于:
[0032]获取用户的邮件样本数据,其中,邮件样本数据包括邮件数据和用户数据;
[0033]根据所述邮件数据建立邮件类型特征库,根据所述用户数据建立用户类型特征库;
[0034]根据所述邮件类型特征库和所述用户类型特征库,确定用户类型和邮件类型的对应关系。
[0035]在一些可选的实施例中,所述训练模块,具体用于:
[0036]从所述用户类型特征库中获取被分类到选定用户类型的用户编号;
[0037]根据获取的用户编号,获取对应用户的邮件数据,确定该用户所涉及到的邮件类型和各类型邮件的数量;
[0038]根据确定出的邮件类型和各类型邮件的数量,确定用户类型和邮件类型的对应关系O
[0039]在一些可选的实施例中,所述获取模块,具体用于:
[0040]获取接收到的新邮件;或
[0041]获取对接收到的新邮件进行全局过滤后确定出的垃圾邮件。
[0042]本发明实施例还提供一种电子邮件服务器,包括:上述的电子邮件过滤装置。
[0043]上述技术方案具有如下有益效果:根据用户的邮件样本数据预先建立用户类型和邮件类型的对应关系,根据预先建立的对应关系对接收到的电子邮件进行过滤筛选,从而实现了针对用户的个性化的垃圾邮件过滤,不用针对每个用户建立专门的特征库,从而减少了存储资源的占用,节约了存储空间,降低了系统负荷,该方法根据用户类型和邮件类型的对应关系,对不同类型的用户的邮件进行筛选过滤,实现简单、方便,筛选速度快,提高了垃圾邮件过滤的筛选速度和效率。
【附图说明】
[0044]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0045]图1是现有技术中电子邮件过滤方法的实现流程图;
[0046]图2是本发明实施例一中电子邮件过滤方法的实现流程图;
[0047]图3是本发明实施例二中电子邮件过滤方法的实现流程图;
[0048]图4是本发明实施例二中准备邮件样本数据的原理示意图;
[0049]图5是本发明实施例二中建立邮件类型特征库的原理示意图;
[0050]图6是本发明实施例二中建立用户类型特征库的原理示意图;
[0051]图7是本发明实施例二中建立邮件类型和用户类型对应关系的原理示意图;
[0052]图8是本发明实施例二中执行邮件过滤的原理示意图;
[0053]图9是本发明实施例二中建立的邮件类型和用户类型对应关系示例图;
[0054]图10是本发明实施例二中基于图9的对应关系执行邮件过滤的示例图;
[0055]图11是本发明实施例三中电子邮件过滤方
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1