基于Web页面特征的金融类钓鱼网页检测方法与流程

文档序号:12278707阅读:来源:国知局
技术总结
本发明涉及一种基于Web页面特征的金融类钓鱼网页检测方法,基于预建立的金融类第一Title关键词库、第二Title关键词库、敏感关键词库及网页Logo图标特征点规则库;包括:使用爬虫获取待测网页HTML,提取Title标签文本信息,计算与第一、第二Title关键词库匹配度,若匹配度大于阈值,判定为钓鱼网页,否则转下一步检测;提取待测网页特定标签文本信息,统计与敏感关键词库匹配个数,计算敏感特征值,若特征值大于阈值,判定为钓鱼网页,否则转下一步检测;对待测网页进行定点截图,获取待测网页Logo图标,提取其特征点,并与图标特征点规则库对比,根据特征点匹配个数计算相似度,若相似度大于阈值,判定为钓鱼网页,否则为正常网页。本发明能够准确并快速地判断待测Web页面是否为金融类钓鱼网页。

技术研发人员:胡向东;林家富;刘可;张峰;魏琴芳;李林乐;杨子明;陈国军;白银;刘玥;付俊;郭智慧
受保护的技术使用者:重庆邮电大学
文档号码:201610933083
技术研发日:2016.10.31
技术公布日:2017.02.22

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1