一种垃圾邮件的识别方法及系统的制作方法

文档序号:7869908阅读:357来源:国知局
专利名称:一种垃圾邮件的识别方法及系统的制作方法
技术领域
本发明涉及通信技术领域,尤其涉及一种垃圾邮件的识别方法及系统。
背景技术
目前垃圾邮件常常通过一些伪装手段,以便避开垃圾邮件识别软件,攻击者故意添加一些合法邮件中经常出现的关键词,或者删除一些垃圾邮件中经常出现的关键词来伪装垃圾邮件。通常情况下,攻击者为了不损坏垃圾邮件中对邮件发送者有价值内容,只能修改垃圾邮件一部分的内容。
通过TREC 2007垃圾邮件的语料库进行了一组实验,结果表面当垃圾邮件中修改的关键词越多的时候,标准的识别算法,如支持向量机算法,性能下降得很快。发明内容
本发明要解决的技术问题是提供一种垃圾邮件的识别方法及系统。
为了解决上述技术问题,本发明提供了垃圾邮件的识别方法,包括,
设置识别器参数,
将邮件转化为向量,
利用所述识别器识别该邮件,
输出识别结果。
进一步地,所述识别器参数设置具体包括
所述识别器计算有限攻击成本条件,所述识别器应用线性支持向量算法。
进一步地,所述攻击成本为d
权利要求
1.一种垃圾邮件的识别方法,其特征在于,包括 设置识别器参数, 将邮件转化为向量, 利用所述识别器识别该邮件, 输出识别结果。
2.根据权利要求I所述的方法,其特征在于,所述识别器参数设置具体包括 所述识别器计算有限攻击成本条件, 所述识别器应用线性支持向量算法。
3.根据权利要求2所述的方法,其特征在于,所述攻击成本为
4.根据权利要求3所述的方法,其特征在于,所述qi定义为
5.根据权利要求4所述的方法,其特征在于,所述线性支持向量算法为
6.一种垃圾邮件的识别系统,其特征在于,包括设置模块,用于设置识别器参数,转化模块,用于将邮件转化为向量,识别模块,用于利用所述识别器识别该邮件,输出模块,用于输出识别结果。
7.根据权利要求6所述的系统,其特征在于,所述设置模块具体包括,计算模块,用于计算有限攻击成本条件,应用模块,用于应用线性支持向量算法。
全文摘要
本发明公开了一种垃圾邮件的识别方法及系统,针对现有技术中当垃圾邮件中修改的关键词越多的时候,标准的识别算法,如支持向量机算法,性能下降得很快的缺陷而发明,本方法包括,设置识别器参数,将邮件转化为向量,利用所述识别器识别该邮件,输出识别结果,本发明方法和系统能够实现抵抗伪装攻击的垃圾邮件智能识别,且达到识别性能更加稳定的技术效果。
文档编号H04L29/06GK102984176SQ201210566319
公开日2013年3月20日 申请日期2012年12月24日 优先权日2012年12月24日
发明者周喜川, 严超, 胡盛东, 甘平, 黄智勇, 张玲 申请人:重庆大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1