一种基于Stacking的恶意网页集成识别方法及系统与流程

文档序号:18902098发布日期:2019-10-18 22:05阅读:来源:国知局

技术特征:

技术总结
本发明提供了一种基于Stacking的恶意网页集成识别方法及系统,其中方法包括:获取训练样本数据;使用K近邻算法、逻辑回归算法和决策树算法建立初级分类器,使用SVM算法建立次级元分类器;对训练样本数据利用十折交叉验证法对训练模型进行训练和验证,得到Stacking集成分类器模型;采集待测样本数据,其中,待测样本数据包括:待识别网页的网页URL和网页源代码;利用网页源代码判断网页是否改变,在网页没改变的情况下,对网页URL进行特征提取,得到特征向量文件;将特征向量文件输入Stacking集成分类器模型,得到待识别网页的识别结果。

技术研发人员:任俊玲;朴杨鹤然
受保护的技术使用者:北京信息科技大学
技术研发日:2019.07.15
技术公布日:2019.10.18
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1