一种基于Stacking的恶意网页集成识别方法及系统与流程

文档序号：18902098发布日期：2019-10-18 22:05阅读：来源：国知局

技术特征：

技术总结
本发明提供了一种基于Stacking的恶意网页集成识别方法及系统，其中方法包括：获取训练样本数据；使用K近邻算法、逻辑回归算法和决策树算法建立初级分类器，使用SVM算法建立次级元分类器；对训练样本数据利用十折交叉验证法对训练模型进行训练和验证，得到Stacking集成分类器模型；采集待测样本数据，其中，待测样本数据包括：待识别网页的网页URL和网页源代码；利用网页源代码判断网页是否改变，在网页没改变的情况下，对网页URL进行特征提取，得到特征向量文件；将特征向量文件输入Stacking集成分类器模型，得到待识别网页的识别结果。

技术研发人员：任俊玲;朴杨鹤然
受保护的技术使用者：北京信息科技大学
技术研发日：2019.07.15
技术公布日：2019.10.18