一种基于网络关系图的网站分类方法与流程

文档序号:12271511阅读:来源:国知局
技术总结
本发明公开了一种基于网络关系图的网站分类方法,包括以下步骤:以“安全联盟”的恶意数据作为样本数据源,获取已有的数据分类和URL数据;形成站点映射表和词频分析表、提取样本指纹特征,用于构建特征表、形成类型表;由各站点和其连接权重构成一个无向权重图;众多的站点和权重构成一个网络关系图,通过图聚类算法把一个大图分成若干个子图;各任务单元在各自的服务器上通过站点指纹特征提取器和分类器来抽取指纹特征并分类。本发明显著地提高网站分类的检测速度,区分具体类型;对于不断新增的站点,依据其与现有的连接关系来确定处理单元,有效地减少计算复杂度以及训练的迭代次数,节省计算资源。

技术研发人员:杨珩
受保护的技术使用者:成都知道创宇信息技术有限公司
文档号码:201610831775
技术研发日:2016.09.19
技术公布日:2017.02.22

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1