电子邮件过滤方法及装置的制造方法_2

文档序号:9330460阅读:来源:国知局
法的实现流程图;
[0056]图12是本发明实施例中电子邮件过滤装置的结构示意图。
【具体实施方式】
[0057]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0058]为了解决现有技术中存在的实现个性化的电子邮件过滤时,占用的存储资源过大的问题,本发明实施例提供一种电子邮件过滤方法,该方法能保证电子邮件个性化的过滤效果,且占用的存储资源比较小,能够节省存储空间,提高电子邮件的速度和效率。
[0059]实施例一
[0060]本发明实施例一提供一种电子邮件过滤方法,其流程如图2所示,包括如下步骤:
[0061]步骤SlOl:获取待过滤的电子邮件。
[0062]可选的,获取待过滤的电子邮件,可以获取接收到的新邮件。这种情况下,是将本发明实施例所提供的电子邮件过滤方法单独作为对电子邮件进行过滤的方法。
[0063]可选的,获取待过滤的电子邮件,也可以获取对接收到的新邮件进行全局过滤后确定出的垃圾邮件。这种情况下,是将本发明实施例所提供的电子邮件过滤方法作为全局邮件过滤的一种补充方案,实现对全局过滤后的垃圾邮件的进一步筛选和识别,以进一步提高全局邮件过滤方案时垃圾邮件过滤的准确性。
[0064]步骤S102:确定获取的电子邮件的邮件类型。
[0065]确定电子邮件的邮件类型时,可以根据电子邮件的邮件数据进行分类,其中,电子邮件的邮件数据包括下列信息中的至少一项:邮件编号、信封发件人、信体发件人、发信IP、邮件主题及主题分词、邮件正文及正文分词。
[0066]步骤S103:确定获取的电子邮件的收件用户所属的用户类型。
[0067]确定电子邮件的收件用户所属的用户类型时,可以根据收件用户的用户数据进行分类,其中,用户数据包括下列信息中的至少一项:用户编号、注册时间、年龄、职业、活跃度、用户行为、常用登陆地、常用登录方式。
[0068]步骤S102和步骤S103的执行顺序不分先后,可以交换顺序进行,也可以同时进行。
[0069]步骤S104:根据预先建立的用户类型和邮件类型的对应关系,判断待过滤的电子邮件的邮件类型是否属于收件用户所属的用户类型所允许接收的邮件类型。若是,执行步骤S105 ;否则,执行步骤S106。
[0070]用户类型和邮件类型的对应关系可以根据各用户的邮件样本数据建立。选择一段时间内的一定数量的用户的邮件样本数据,比如,所选择的用户在所选择的时间段内,其收件箱中的邮件,可以作为训练用的邮件样本数据。
[0071 ] 建立用户类型和邮件类型的对应关系的过程可以包括:获取用户的邮件样本数据,其中,邮件样本数据包括邮件数据和用户数据;根据邮件数据建立邮件类型特征库,根据用户数据建立用户类型特征库;根据邮件类型特征库和用户类型特征库,确定用户类型和邮件类型的对应关系。
[0072]获取的邮件样本数据中,其邮件数据包括下列信息中的至少一项:邮件编号、信封发件人、信体发件人、发信IP、邮件主题及主题分词、邮件正文及正文分词;其用户数据包括下列信息中的至少一项:用户编号、注册时间、年龄、职业、活跃度、用户行为、常用登陆地、常用登录方式。
[0073]建立好用户类型和邮件类型的对应关系后,当需要进行电子邮件过滤时,判断待过滤的电子邮件的邮件类型是否属于收件用户所属的用户类型所允许接收的邮件类型。上述建立用户类型和邮件类型的对应关系,不必需在每次进行电子邮件过滤时都建立一次,可选的,根据设定的对应关系更新时间周期,周期性的进行对应关系的更新就可以了。
[0074]步骤S105:确定待过滤的电子邮件不是垃圾邮件。
[0075]当判断为是时,确定待过滤的电子邮件不是垃圾邮件,将该电子邮件放入该收件用户的邮件接收位置,比如,收件箱。
[0076]步骤S106:确定待过滤的电子邮件是垃圾邮件。
[0077]当判断为否时,确定待过滤的电子邮件是垃圾邮件,将该电子邮件放入该收件用户的垃圾邮件位置,比如,垃圾箱。
[0078]实施例二
[0079]本发明实施例二提供上述电子邮件过滤方法的一种具体实现方法,以本发明实施例所提供的邮件过滤流程作为单独使用的邮件过滤流程为例,对接收到的新邮件进行过滤。其流程如图3所示,包括如下步骤:
[0080]步骤S201:获取训练所需的邮件样本数据。
[0081]准备邮件样本数据的原理如图4所示,选择某段时间内一定数量(尽量合理全面)的用户及其收件箱中的电子邮件作为训练的邮件样本数据,对邮件样本数据进行初步整理,并标记。将邮件样本数据分成邮件数据和用户数据两部分。
[0082]其中,邮件数据包括下列信息中的一个或多个:邮件编号(ml,m2,m3,……)、信封发件人、信体发件人、发信IP、邮件主题及主题分词、邮件正文及正文分词等。
[0083]用户数据包括下列信息中的一个或多个:用户编号(ul,u2,u3,……)、注册时间、年龄、性别、职业、活跃度、用户行为(阅读,举报,删除,移动等)、常用登陆地、常用登陆方式等。
[0084]步骤S202:根据邮件数据建立邮件类型特征库。
[0085]建立邮件类型特征库的原理如图5所示。该步骤中选取邮件数据,建立邮件类型特征库。如图5所示的,取出邮件样本数据中的所有邮件数据,通过分类器,获得邮件类型Ml, M2, M3,......ο
[0086]对分类器的选取可以采用目前常用的任何一种分类器,如贝叶斯,决策树,神经网络等。
[0087]步骤S203:根据用户类型建立用户类型特征库。
[0088]建立用户类型特征库的原理如图6所示。该步骤中选取用户数据,建立用户类型特征库。如图6所示的,取出邮件样本数据中的所有用户数据,通过分类器,获得用户类型U1,U2,U3,......。
[0089]对分类器的选取可以采用目前常用的任何一种分类器,如贝叶斯,决策树,神经网络等。
[0090]步骤S202和步骤S203的执行顺序不分先后,可以交换顺序进行,也可以同时进行。
[0091]步骤S204:根据邮件类型特征库和用户类型特征库,确定用户类型和邮件类型的对应关系。
[0092]确定用户类型和邮件类型的对应关系的过程可以包括:从用户类型特征库中获取被分类到选定用户类型的用户编号;根据获取的用户编号,获取对应用户的邮件数据,确定该用户所涉及到的邮件类型和各类型邮件的数量;根据确定出的邮件类型和各类型邮件的数量,确定用户类型和邮件类型的对应关系。
[0093]建立用户类型和邮件类型的对应关系的原理如图7所示。
[0094]从用户类型特征库中U中获取任意用户类型Ui,比如:用户类型U1、用户类型U2、用户类型U3、……、等等。
[0095]获得被分类到用户类型Ui的用户编号uj(j = 1,2,3,……),以用户类型U2为例,获取用户类型U2对应的用户编号ul、用户编号u4、用户编号u7、用户编号u9等。
[0096]获取用户编号Uj所对应的邮件数据mj。例如:用户编号Ul对应的邮件数据ml、用户编号u4对应的邮件数据m4、用户编号u7对应的邮件数据m7、用户编号u9对应的邮件数据m9等。
[0097]根据邮件类别数据库U,对邮件数据mj进行分类,得到若干邮件类型M及各类型中包含的邮件数。例如:邮件数据ml和邮件数据m4属于邮件类型M3,邮件数据m7和邮件数据m9属于邮件类型M6等。<
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1