一种基于图形匹配的仿冒网站检测系统及检测方法

文档序号:10615947阅读:664来源:国知局
一种基于图形匹配的仿冒网站检测系统及检测方法
【专利摘要】一种基于图形匹配的仿冒网站检测系统及检测方法,本发明涉及信息安全领领域;它包含仿冒网站logo图片识别系统;所述的仿冒网站logo图片识别系统包含仿冒网站域名管理模块、仿冒网站logo图片提取模块和仿冒网站相似度计算模块。解决现有技术中存在的问题,准确率更高,不容易误报。
【专利说明】
-种基于图形匹配的仿冒网站检测系统及检测方法
技术领域
[0001] 本发明设及信息安全领域,具体设及一种基于图形匹配的仿冒网站检测系统及检 测方法。
【背景技术】
[0002] 仿冒网站,指未经授权建立的相似网站,如果是出于恶意目的,称为钓鱼网站。对 仿冒网站的检测一直是安全行业的一个重要问题,需要更精确和有效的技术来识别判断仿 冒网站。
[0003] 经对现有技术的文献检索发现,中国专利申请号CN201110402085.2,专利名称"钓 鱼网站检测方法及装置",提供一种钓鱼网站检测方法及装置。该钓鱼网站检测方法包括: 获取已知钓鱼网站的互联网协议IP地址;根据与所述已知钓鱼网站的IP地址相邻的预设范 围设定可疑IP域;查询所述可疑IP域所包括的可疑IP地址所映射的统一资源定位符URL,并 根据所述U化生成可疑钓鱼网站列表;针对所述可疑钓鱼网站列表中的各所述U化进行钓鱼 网站检测。根据本发明的钓鱼网站检测方法及装置,实现了从庞大的网站资源中主动发现 未知钓鱼网站。
[0004] 中国专利申请号CN201210220826.X,专利名称"一种钓鱼网站查找系统及方法% 公开了一种钓鱼网站查找系统及方法,设及网络安全领域。所述系统包括:种子库建立单 元,适于将命中已知钓鱼网站的个数大于预定阔值的目标网页的原始链接作为种子链接放 入种子库;种子提取器,适于提取出种子库中的种子链接;种子网页分析器,适于根据提取 出的种子链接查找对应的种子网页,对种子网页进行分析,得到种子网页中存在的可疑链 接;判断单元,适于查找可疑链接对应的可疑网页,判断可疑网页是否是钓鱼网站;输出接 口,适于在可疑网页是钓鱼网站时,输出相应的钓鱼网站。所述系统及方法,大幅提高了钓 鱼网站的查找速度,降低了网民使用互联网的安全风险。
[0005] 现有技术准确率低,容易发生误报的情况,亟待改进。

【发明内容】

[0006] 本发明的目的在于针对现有技术的缺陷和不足,提供一种设计合理的基于图形匹 配的仿冒网站检测系统及检测方法,解决现有技术中存在的问题,准确率更高,不容易误 报。
[0007] 为实现上述目的,本发明采用的技术方案是:它包含仿冒网站logo图片识别系统; 所述的仿冒网站logo图片识别系统包含仿冒网站域名管理模块、仿冒网站logo图片提取模 块和仿冒网站相似度计算模块。
[000引它的操作步骤如下:
[0009] A、使用HTTP协议或HTWS协议连接目标网站,下载网站首页;
[0010] B、提取带有logo字样的图片,如果没有则提前右上角的图片或第一张图片;
[OOW C、针对目标网站的logo图片和原始网站的logo图片分别划分为若干小块,一般为 64X64个小块,对每一小块生成灰度数组,每一小块的灰度值在O到255之间,原始网站的每 一小块灰度值为Sx,y,目标网站每一小块的灰度值为Tx,y;
[0012] D、计算两个图片的相似度D,计算方法参照如下公式:
[0013]
[0014] E、相似度的范围在0到无穷大之间,根据测试结论,0为完全相同,0~1为十分相 似,IW上可W认为是完全不同的图片,即目标网站不是原始网站的仿冒者。
[0015] 采用上述结构后,本发明有益效果为:
[0016] 1、通过使用图形比较的方式可W模拟网站用户的使用体验,通过识别logo图片判 断是否是仿冒网站,提供了一种新的仿冒网站的识别方式;
[0017] 2、图形比较识别仿冒网站比传统的文字识别方式准确率更高,不容易误报,某些 仿冒网站可能通过避免使用特征词的方式绕过文字识别,却难W绕开logo相似度的问题。
【附图说明】
[0018] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可 W根据运些附图获得其他的附图。
[0019] 图1是本发明的结构示意图。
[0020] 图2是本发明的操作流程图。
[0021] 附图标记说明:
[0022] 仿冒网站logo图片识别系统1、仿冒网站域名管理模块2、仿冒网站logo
[0023] 图片提取模块3、仿冒网站相似度计算模块4。
【具体实施方式】
[0024] 下面结合附图对本发明作进一步的说明。
[0025] 参看如图1和图2所示,本【具体实施方式】采用的技术方案是:它包含仿冒网站logo 图片识别系统1;所述的仿冒网站logo图片识别系统1包含仿冒网站域名管理模块2、仿冒网 站logo图片提取模块3和仿冒网站相似度计算模块4。
[00%] 它的操作步骤如下:
[0027] A、使用HTTP协议或HTWS协议连接目标网站,下载网站首页;
[0028] B、提取带有logo字样的图片,如果没有则提前右上角的图片或第一张图片;
[0029] C、针对目标网站的logo图片和原始网站的logo图片分别划分为若干小块,一般为 64X64个小块,对每一小块生成灰度数组,每一小块的灰度值在0到255之间,原始网站的每 一小块灰度值为Sx,y,目标网站每一小块的灰度值为Tx,y;
[0030] D、计算两个图片的相似度D,计算方法参照如下公式:
[0031]
[0032] E、相似度的范围在0到无穷大之间,根据测试结论,0为完全相同,0~I为十分相 似,IW上可W认为是完全不同的图片,即目标网站不是原始网站的仿冒者。
[0033] 采用上述结构后,本【具体实施方式】有益效果为:解决现有技术中存在的问题,准确 率更高,不容易误报,通过识别logo图片判断是否是仿冒网站,提供了一种新的仿冒网站的 识别方式。
[0034] W上所述,仅用W说明本发明的技术方案而非限制,本领域普通技术人员对本发 明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围, 均应涵盖在本发明的权利要求范围当中。
【主权项】
1. 一种基于图形匹配的仿冒网站检测系统,其特征在于:它包含仿冒网站logo图片识 别系统;所述的仿冒网站logo图片识别系统包含仿冒网站域名管理模块、仿冒网站logo图 片提取模块和仿冒网站相似度计算模块。2. -种基于图形匹配的仿冒网站检测方法,其特征在于:它的操作步骤如下: (A) 、使用HTTP协议或HTTTS协议连接目标网站,下载网站首页; (B) 、提取带有logo字样的图片,如果没有则提前右上角的图片或第一张图片; (C) 、针对目标网站的logo图片和原始网站的logo图片分别划分为若干小块,一般为64 X64个小块,对每一小块生成灰度数组,每一小块的灰度值在0到255之间,原始网站的每一 小块灰度值为Sx,y,目标网站每一小块的灰度值为Tx,y; 化)、计算两个图片的相似度D,计算方法参照如下公式:化)、相似度的范围在0到无穷大之间,根据测试结论,0为完全相同,0~1为十分相似,1 W上可W认为是完全不同的图片,即目标网站不是原始网站的仿冒者。
【文档编号】H04L29/06GK105978850SQ201610213651
【公开日】2016年9月28日
【申请日】2016年4月8日
【发明人】樊凯, 梁志宏, 吕华辉, 关泽武, 杨航
【申请人】中国南方电网有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1