电子邮件过滤方法及装置的制造方法_3

文档序号:9330460阅读:来源:国知局
br>[0098]对邮件类型M进行整理,去除异常数据(比如某类型中只有一封邮件的情况),得到用户类型Ui对应的邮件类型Mk。例如图7所示的,用户类型U2对应的邮件类型M3和邮件类型M6等。
[0099]从而建立起用户类型U与邮件类型M的对应关系R。
[0100]建立好用户类型和邮件类型的对应关系后,即可用于后续的邮件过滤流程了,步骤S201至步骤S204建立用户类型和邮件类型的对应关系的过程,不需要在每次新邮件过滤前都执行一遍,只需要根据设定的建立或更新规则,进行建立或更新即可,例如,周期性的重新建立或更新,或者具备设定的更新条件时重新建立或更新。可选的,设定的更新条件可以是当具有设定数量的新的邮件样本数据时。
[0101]步骤S205:获取邮件服务器接收到的新邮件。
[0102]邮件服务器接收到新邮件,开始执行邮件过滤的流程,执行邮件过滤的原理如图8所示。
[0103]步骤S206:对获取的新邮件进行解析。
[0104]如图8所示的,对新邮件进行解析得到新邮件的邮件数据和用户数据,
[0105]步骤S207:获取新邮件的邮件数据,对邮件进行分类,确定该新邮件的邮件类型。
[0106]如图8所示的,根据邮件数据对新邮件进行分类后,确定其邮件类型Mk。
[0107]步骤S208:获取新邮件的收件用户,确定收件用户所属的用户类型。
[0108]根据获取的新邮件的邮件数据中收件用户的相关信息,可以确定收件用户所属的用户类型Uk。
[0109]该步骤识别邮件收件用户,获得收件用户对应的用户类型Uk。可选的,此数据可以预先计算好,保存在邮件服务器中,使用时直接获取,从而不需要每次重新计算。
[0110]步骤S209:查找新邮件的邮件类型是否在收件用户所属的用户类型所允许接收的邮件类型中。
[0111]根据预先建立的用户类型和邮件类型的对应关系,查找新邮件的邮件类型是否在收件用户所属的用户类型的对应关系中,如果在,则为收件用户所属的用户类型所允许接收的邮件类型。
[0112]例如,如图8所示的,根据上面建立的用户类型和邮件类型的对应关系,获取收件用户所属的用户类型所允许接收的邮件类型,查找确定出的新邮件的邮件类型Mk是否在收件用户所属的用户类型Uk的对应关系中。
[0113]当判断为是时,执行步骤S210 ;否则,执行步骤S211。
[0114]步骤S210:确定该新邮件不是垃圾邮件。
[0115]对于通过过滤的新邮件,进行保留,并放置在相应的邮件接收位置。
[0116]步骤S211:确定该新邮件是垃圾邮件。
[0117]对于没有通过过滤的新邮件,可以进行删除,也可以放置在垃圾邮件位置处,供收件用户选择是否需要接收。
[0118]上述实施例二的电子邮件过滤流程的一个举例如图9和图10所示。
[0119]其中,图9为已建立的邮件类型和用户类型对应关系示例图。用户ul、用户u2、用户u3属于用户类型U1,用户类型Ul对应着邮件类型Ml和邮件类型M4 ;用户u4和用户u5属于用户类型U5,用户类型U5对应着邮件类型M2和邮件类型M3
[0120]图10为基于图9的对应关系执行邮件过滤的示例图。邮件服务器接收到新邮件时,对新邮件进行解析,获取到收件用户u2和邮件数据;根据获取到的邮件数据对邮件进行分类,获得邮件类型为M4 ;收件用户u2所属的用户类型为U1,U1类型的用户对应的感兴趣的邮件类型为Ml和M4 ;由于新邮件类型为M4,在用户类型Ul的感兴趣范围内,因此,新邮件允许接收的邮件,不是垃圾邮件。
[0121]实施例三
[0122]本发明实施例三提供上述电子邮件过滤方法的另一种具体实现方法,以本发明实施例所提供的邮件过滤流程作为补充使用的邮件过滤流程为例,对全局过滤后的垃圾邮件进行进一步过滤,其流程如图11所示。
[0123]如图11所示的邮件过滤过程,其建立用户类型和邮件类型的对应关系的过程参照步骤S201-步骤S204。
[0124]邮件服务器接收到新邮件时,对接收到的新邮件进行解析,获取到收件用户和邮件数据,根据邮件数据和收件用户对接收到的新邮件进行全局过滤,进行全局过滤时,可以采用现有的邮件过滤方法,当确定是允许接收的好邮件(即非垃圾邮件)时,保留至收件用户的接收邮件位置,比如收件箱;当确定是不允许接收的垃圾邮件时,放入垃圾箱。
[0125]获取对接收到的新邮件进行全局过滤后确定出的垃圾邮件,根据上述获取的邮件数据对获取的全局过滤后确定出的垃圾邮件进行分类,确定获取的垃圾邮件的邮件类型。以及根据上述获取的收件用户确定用户类型,根据上述建立的用户类型和邮件类型的对应关系后,确定该用户类型所允许接收的邮件类型,判断获取到的全局过滤后确定出的垃圾邮件是否在该用户类型所允许接收的邮件类型中,若是,则重新确定该全局过滤后确定出的垃圾邮件不是垃圾邮件,否则确定该全局过滤后确定出的垃圾邮件不是垃圾邮件。
[0126]也就是说,本发明实施例提供的电子邮件过滤方法,可以作为一个完整独立的电子邮件过滤方案;也可以作为全局邮件过滤方案的一个补充方案,用来对误判邮件进行召回操作,可根据实际邮件系统的自身特点灵活使用。
[0127]基于同一发明构思,本发明实施例还提供一种电子邮件过滤装置,其结构如图12所示,包括:获取模块121、分类模块122、判断模块123和确定模块124。
[0128]获取模块121,用于获取待过滤的电子邮件。
[0129]分类模块122,用于确定获取的电子邮件的邮件类型,以及确定获取的电子邮件的收件用户所属的用户类型。
[0130]判断模块123,用于根据预先建立的用户类型和邮件类型的对应关系,判断待过滤的电子邮件的邮件类型是否属于收件用户所属的用户类型所允许接收的邮件类型。
[0131]确定模块124,用于当判断模块123判断为是时,确定待过滤的电子邮件不是垃圾邮件;当判断为否时,确定待过滤的电子邮件是垃圾邮件。
[0132]7优选的,上述电子邮件过滤装置还包括训练模块125,用于获取用户的邮件样本数据,其中,邮件样本数据包括邮件数据和用户数据;根据邮件数据建立邮件类型特征库,根据用户数据建立用户类型特征库;根据邮件类型特征库和用户类型特征库,确定用户类型和邮件类型的对应关系。
[0133]优选的,上述训练模块125,具体用于从用户类型特征库中获取被分类到选定用户类型的用户编号;根据获取的用户编号,获取对应用户的邮件数据,确定该用户所涉及到的邮件类型和各类型邮件的数量;根据确定出的邮件类型和各类型邮件的数量,确定用户类型和邮件类型的对应关系。
[0134]优选的,上述获取模块121,具体用于获取接收到的新邮件;或获取对接收到的新邮件进行全局过滤后确定出的垃圾邮件。
[0135]本发明实施例提供的电子邮件过滤方法及装置,需要存储的数据类型有3种:对邮件类型建立的邮件类型特征库,对用户类型建立的用户类型特征库,每种用户类型对应的邮件类型(对应关系)。此外,根据需要,可选的,可以存储每个用户属于哪种用户类型。
[0136]据统计,目前常见的邮件类型有十几到几十种,可以根据自身系统特点决定邮件类型的精细化程度,总体来说不会超过100种,邮件类型特征库中的邮件类型总体来说不会超过100种,并且不随用户量的增加而增长,一旦确定下来,可长期保持稳定。同理,用户类型特征库中的用户类型也是如此。用户类型、用户类型和邮件类型的对应关系其所包含的信息量比较简单,占用存储空间小,只有几个字节,即便用户量很大的情况下也不会占用太多的存储空间。综合来说,上述几种类型的数据的总量不会很大,因此,本发明实
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1