虚假链接拦截方法、装置以及系统的制作方法

文档序号:10597214阅读:410来源:国知局
虚假链接拦截方法、装置以及系统的制作方法
【专利摘要】本发明涉及网络安全技术领域,特别涉及虚假链接拦截方法和系统。本发明的虚假链接拦截方法,对用户客户端发起的网页访问请求进行识别并获取镜像链接,主动分析链接的域名信息和所指向的网页内容信息的安全性,拦截虚假链接的访问请求,为用户提供更准确且识别效率更高的虚假链接拦截方法。对于虚假链接的拦截方法,可以通过建立功能模块,组合成功能模块构架,由存储在计算机可读存储介质中的计算机程序来实施。基于该虚假链接拦截方法建立虚假链接拦截系统,该系统包括客户端、运营商主机、网络端和服务器。虚假链接拦截系统的服务器具有功能模块构架,能够录入实施该功能模块构架的计算机程序,从而实现该虚假链接的拦截方法。
【专利说明】
虚假链接拦截方法、装置以及系统
技术领域
[0001]本发明涉及网络安全技术领域,特别涉及虚假链接拦截方法和系统。对于虚假链接的拦截方法,可以通过建立功能模块,组合成功能模块构架,由存储在计算机可读存储介质中的计算机程序来实施。
【背景技术】
[0002]随着互联网和移动终端的快速发展,一些假冒或者恶意模仿知名网络地址的虚假链接在网络上传播,一旦用户进入虚假链接指向的网页,就容易被这些网页的内容欺骗,造成个人信息泄露甚至财务上的损失。随着虚假链接对互联网通讯和电子商务安全性能的威胁不断增加,虚假链接检测技术也日益受到人们的关注。
[0003]目前对虚假链接的识别主要来自用户举报,互联网安全服务提供商建立网页链接的黑白名单,接到用户举报信息后,把验证为虚假链接的网页链接加入黑名单。互联网安全服务提供商通过在客户端建立拦截机制,在用户浏览网页时过滤掉保存在黑名单内的链接。这种虚假链接拦截方法的信息更新滞后,保护性不强,其发挥效应时往往用户的利益已经受到侵害,无法全方位保护用户的网络使用安全。而针对链接域名进行主动识别的虚假链接识别方法,一般是针对域名主体的字符相似度进行识别,如分析链接的二级域名是否与WWW.baidu.com中的baidu几个字母相似,这种虚假链接识别方法的精确度不高,容易造成误拦截,而且这种识别方法大多需要用户再次进行确认,给用户的使用带来不便。

【发明内容】

[0004]本发明的目的在于:主动分析客户端发起的网页请求的链接的安全性,拦截虚假链接的访问请求,为用户提供更准确且识别效率更高的虚假链接拦截方法。
[0005]为实现上述发明目的,本发明提供虚假链接拦截方法,获取客户端访问的链接镜像,判断该链接是否为虚假链接,若判断出该链接是虚假链接,则拦截对该链接的访问请求,判断该链接是否为虚假链接的步骤具体地:取该链接所指向的网页和预存的正规网页进行比较,根据两者页面的相似程度,判断该链接是否为虚假链接。
[0006]本发明的虚假链接拦截方法,对用户客户端发起的网页访问请求进行识别并获取镜像链接,主动分析链接的域名信息和所指向的网页内容信息的安全性,拦截虚假链接的访问请求,为用户提供更准确且识别效率更高的虚假链接拦截方法。对于虚假链接的拦截方法,可以通过建立功能模块,组合成功能模块构架,由存储在计算机可读存储介质中的计算机程序来实施。
[0007]基于该虚假链接拦截方法建立虚假链接拦截系统,该系统包括客户端、运营商主机、网络端和服务器。虚假链接拦截系统的服务器具有功能模块构架,能够录入实施该功能模块构架的计算机程序,从而实现该虚假链接的拦截方法。具体地,客户端发出网页访问请求的链接,通过运营商主机与所述网络端通信,服务器通过运营商主机获取客户端访问的链接镜像,取该链接所指向的网页和预存的正规网页进行比较,根据两者页面的相似程度,判断该链接是否为虚假链接,从而拦截虚假链接的访问请求。通过该虚假链接拦截系统可以实现对虚假链接更准确且识别效率更高的拦截。
【附图说明】
[0008]图1是基于页面相似度判断的虚假链接拦截流程示意图。
[0009]图2是基于域名和页面相似度判断的虚假链接拦截流程示意图。
[0010]图3是虚假链接拦截系统的结构示意图。
[0011]图4是淘宝网的页面主图标。
【具体实施方式】
[0012]如图3所示,用户通过电脑客户端发出网页访问请求,经过运营商主机与网络端通信,网络端收到来自用户的网页请求信号后,返回对应的网页信息给到用户。本实施例中,互联网安全服务提供商把服务器连接在运营商主机处,通过网络旁路获得经过该运营商主机的所有网页访问请求的链接镜像。服务器主动分析所获取的所有链接的安全性,一旦识别到虚假链接的访问请求,就对该链接进行拦截操作,返回预设的网页信息,如网址大全主页给用户的客户端。用户点击到有风险的虚假链接时,服务器直接拦截用户的访问请求,杜绝安全隐患。
[0013]实施例一。
[0014]如图1所示的基于页面相似度判断的虚假链接的拦截流程,服务器获取客户端访问的链接镜像后,判断该链接是否在服务器的数据库内。服务器的数据库包括链接的黑名单和白名单,若该链接在数据库的白名单内,说明该链接是正常的网页链接,服务器允许用户对该网页进行访问;若该链接在数据库的黑名单内,说明该链接是虚假链接,服务器拦截用户对该网页的访问,并且通过网页重定向技术返回网址大全主页给用户的客户端。若该链接不在数据库内,服务器把获得的链接所指向的网页和预存的正规网页进行比较,根据两者页面的相似程度,判断该链接是否为虚假链接。
[0015]以淘宝网的页面为例,服务器通过获取的网页访问请求获取目标网页的页面信息,通过网页的主图标、页面关键字和页面排版三种比较的因素来确定网页的相似度:
I)比较网页的主图标。在淘宝网主页的左上角设置有如图4所示的含有淘宝网和Taoba0.com这两个中英文logo的主图标。本虚假链接的拦截方法,在计算网页的相似度时首先针对该位置进行检测,若未发现相似主图标,则对页面其他部分进行检测,若在页面内发现相近或基本相同的主图标,通过对主图标的图形和文字对比分析计算网页相似度。
[0016]2)比较网页的关键字。如淘宝网页面内有反复出现的淘宝字样,有大量的商品信息,在网页下方的相关链接栏里有与淘宝关联的“阿里”集团的链接等。本虚假链接的拦截方法能够提取这些页面关键字信息,并计算得到网页关键字的相似度。
[0017]3)比较网页的页面排版。如淘宝网的分类目录设置在页面左侧,搜索栏在正上方居中,登录窗口在右侧上方等。通过采集网页内这些模块的位置、尺寸等排版信息,就能计算得到两个网页的页面排版的相似度。
[0018]结合上述三种检测结果,如果页面相似度高于虚假链接的判断值,如80%,就可以判断这个链接是虚假链接,服务器拦截该链接的访问请求,并且通过网页重定向技术返回网址大全主页给用户的客户端。若该内容相似度低于虚假链接的判断值,说明该链接是正常的网页链接,服务器允许用户对该网页进行访问。基于页面相似度的检测可以最大限度地识别虚假链接,漏检的可能性低。
[0019]实施例二。
[0020]如图2所示的基于域名和页面相似度判断的虚假链接的拦截流程,服务器获取客户端访问的链接镜像后,判断该链接是否在服务器的数据库内。服务器的数据库包括链接的黑名单和白名单,若该链接在数据库的白名单内,说明该链接是正常的网页链接,服务器允许用户对该网页进行访问;若该链接在数据库的黑名单内,说明该链接是虚假链接,服务器拦截用户对该网页进行访问,并且通过网页重定向技术返回网址大全主页给用户的客户端。若该链接不在数据库内,服务器取该链接和正规网页所对应的域名进行比较,根据该比较结果结合按实施例一中的网页比较方法得到的页面相似度,判断该链接是否为虚假链接。
[0021]服务器较先完成对链接的域名检测,并计算得到该链接与数据库内各个链接的域名相似度。若该链接的域名相似度高于虚假链接的判断值,如80%,就可以判断这个链接是虚假链接,服务器拦截该链接的访问请求,并且通过网页重定向技术返回网址大全主页给用户的客户端。若该链接的域名相似度低于80%,但是在预设的60%?80%的范围内,服务器就筛选出数据库内与该链接的域名相似度在该预设范围内的链接,并对这些链接指向的网页的页面相似度进行检测。如果页面相似度高于虚假链接的判断值,如80%,就可以判断这个链接是虚假链接,服务器拦截该链接的访问请求,并且通过网页重定向技术返回网址大全主页给用户的客户端。若该内容相似度低于虚假链接的判断值,说明该链接是正常的网页链接,服务器允许用户对该网页进行访问。
[0022]利用服务器优先得到对链接的域名检测结果的特性,可以排除一部分已经确定是虚假链接或者是虚假链接的可能性比较低的链接,从而减少对网页相似度的计算量,加快对虚假链接的识别。
[0023]以百度的域名WWW.baidu.com为例,服务器通过对比链接的主体和顶级域名两部分来确定域名相似度:
I)检测链接的主体。百度的域名主体是baidu,而虚假网站的链接中,常对字母做相似替换,利用字符的相似性来欺骗用户,如把i换成I的虚假链接www.baIdu.com,该链接与百度www.baidu.com的域名相似度达到80%以上,可以判断这个链接是虚假链接。这种用形似的字母、数字进行替换的手法有很强的迷惑性,不容易被用户发现,在计算域名相似度时占有较大比重。
[0024]2)检测链接的顶级域名。百度的顶级域名是.com,而虚假网站的链接中,保持域名主体baidu不变,该顶级域名可能被修改成_com、.cn等,或者在该顶级域名.com的后方加.123.cn,使顶级域名.com成为次级域名,以达到在视觉上的混淆。这些链接与百度WWW.baidu.com的域名相似度也被判定为80%以上,可以判断这个链接是虚假链接。对顶级域名的修改是一种隐蔽的作假方式,通过对顶级域名的检测,可以避免用户只输入域名主体进行检索的情况下,被虚假网站的域名地址迷惑。
[0025]本发明的虚假链接拦截方法,对用户客户端发起的网页访问请求进行识别并获取镜像链接,通过链接的主体和顶级域名来确定域名相似度,通过网页的主图标、页面关键字和页面排版信息等来确定网页的相似度,主动分析链接的域名信息和所指向的网页内容信息的安全性,拦截虚假链接的访问请求,可以更准确地为用户拦截虚假链接,并且识别效率更高。对于虚假链接的拦截方法,可以通过建立功能模块,组合成功能模块构架,由存储在计算机可读存储介质中的计算机程序来实施。
[0026]基于该虚假链接拦截方法建立虚假链接拦截系统,该系统包括客户端、运营商主机、网络端和服务器。虚假链接拦截系统的服务器具有功能模块构架,能够录入实施该功能模块构架的计算机程序,从而实现该虚假链接的拦截方法。
【主权项】
1.虚假链接拦截方法,获取客户端访问的链接镜像,判断该链接是否为虚假链接,若判断出该链接是虚假链接,则拦截对该链接的访问请求,其特征是,判断该链接是否为虚假链接的步骤具体地:取该链接所指向的网页和预存的正规网页进行比较,根据两者页面的相似程度,判断该链接是否为虚假链接。2.根据权利要求1所述的虚假链接拦截方法,其特征是,所比较的因素包括网页的主图标。3.根据权利要求1所述的虚假链接拦截方法,其特征是,所比较的因素包括网页中的关键字。4.根据权利要求1所述的虚假链接拦截方法,其特征是,所比较的因素包括页面排版。5.根据权利要求1所述的虚假链接拦截方法,其特征是,判断所述链接是否为虚假链接的步骤具体地:还取该链接和正规网页所对应的域名进行比较,根据该比较结果结合所述的两者页面的相似程度,判断该链接是否为虚假链接。6.虚假链接拦截装置,包括: 链接获取模块,获取客户端访问的链接镜像; 虚假链接判断模块,判断该链接是否虚假链接; 拦截模块,若判断出该链接是虚假链接,则拦截对该链接的访问请求; 其特征是,虚假链接判断模块具体地:取该链接所指向的网页和预存的正规网页进行比较,根据两者页面的相似程度,判断该链接是否为虚假链接。7.根据权利要求6所述的虚假链接拦截装置,其特征是,虚假链接判断模块所比较的因素包括网页的主图标。8.根据权利要求6所述的虚假链接拦截装置,其特征是,虚假链接判断模块所比较的因素包括网页中的关键字。9.根据权利要求6所述的虚假链接拦截装置,其特征是,虚假链接判断模块所比较的因素包括页面排版。10.根据权利要求6所述的虚假链接拦截的装置,其特征是,虚假链接判断模块具体地:还取该链接和正规网页所对应的域名进行比较,根据该比较结果结合所述的两者页面的相似程度,判断该链接是否为虚假链接。11.虚假链接拦截系统,包括客户端、运营商主机、网络端和服务器,所述客户端通过运营商主机与所述网络端通信,所述服务器通过运营商主机获取客户端访问的链接镜像,其特征是:所述服务器执行权利要求1?5当中任一项所述的虚假链接拦截方法,或者所述服务器具有权利要求6?10当中任一项所述的虚假链接拦截装置。
【文档编号】H04L29/06GK105959330SQ201610571094
【公开日】2016年9月21日
【申请日】2016年7月20日
【发明人】李涛
【申请人】广东世纪网通信设备股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1