基于贝叶斯模型的文本垃圾识别方法和系统与流程

文档序号:11990803阅读:来源:国知局
技术总结
本发明公开了一种基于贝叶斯模型的文本垃圾识别方法和系统,所述方法包括:对待判定文本进行分词,得到所述待判定文本的关键词;针对所述待判定文本的每个关键词,计算该关键词的特征值,并在贝叶斯模型中查找与该关键词相匹配的特征词,获取查找到的特征词的正向权重值和负向权重值,分别作为该关键词的正向权重值和负向权重值;根据所述待判定文本的每个关键词的特征值以及正向权重值和负向权重值,计算所述待判定文本的正向分类值和负向分类值;根据所述待判定文本的正向分类值和负向分类值,确定所述待判定文本是否为垃圾文本。依据上述的贝叶斯模型进行垃圾文本识别,大大提高了文本垃圾识别系统的鲁棒性。

技术研发人员:姜贵彬
受保护的技术使用者:微梦创科网络科技(中国)有限公司
文档号码:201310278616
技术研发日:2013.07.04
技术公布日:2017.04.05

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1