网页安全访问的方法及装置的制作方法

文档序号:6371294阅读:211来源:国知局
专利名称:网页安全访问的方法及装置的制作方法
技术领域
本发明涉及到网页访问安全技术,特别涉及到一种网页安全访问的方法及装置。
背景技术
现有技术中的钓鱼网站主要包括以下几个类别非法类、恶意欺诈类以及仿冒类。该非法类如色情网站、非法博彩等网站,此类网站往往通过挂马盗取用户身份信息、关键帐号和密码等信息,或是通过虚假预测骗取会员费。该恶意欺诈类如欺诈性机票代理商(没有经过特别授权)、欺诈性火车票代理商(如钓鱼性质的火车票代购网站)、假药网站以及虚假充值卡网站,此类网站通过虚假交易骗取用户的钱财。
上述仿冒类网站,主要是仿冒网上银行、知名电子商务(如淘宝、京东商城、支付宝)、网络运营商(如中国移动、中国电信)、网络服务提供商以及知名网络游戏网站(如魔兽世界)等。此类网站从视觉上看与被仿冒的真实网站几乎一模一样。仿冒者通过此类网站骗取用户身份信息、关键帐号和密码(如网银帐号、手机号码、游戏帐号和密码等)。针对仿冒类钓鱼网站的自动识别,目前主要采用如下两种检测方法一、基于钓鱼页面与真实页面(被仿冒页面)相似度比较;二、基于钓鱼页面特征,如根据接收的URL(UniformResourceLocator,统一资源定位符)访问请求,获取网站的最终页面信息,将页面的各HTML (Hypertext Markup Language,超文本标记语言)标签解析到一棵DOM (DocumentObject Model,文档对象模型)树中,并与预先设置的特征数据库进行比对,确认该URL是否为钓鱼URL。现有技术仅能够实现对仿冒类钓鱼网站的检测,但在检测到仿冒类钓鱼网站后,并不能将访问者指引到访问者需要访问的网站(被仿冒网站),不能确保访问者后续访问的安全。

发明内容
本发明的主要目的为提供一种网页安全访问的方法,提升网页访问的安全性。本发明提出一种网页安全访问的方法,包括获取需访问网页的网址以及对应网页的网页特征;将所述网址以及对应网页的网页特征与预设网址推荐表进行匹配;所述网址推荐表推荐网址及对应的网页特征;所述网页特征包括标题标签关键字和/或版权关键字;根据所述匹配情况,判断所述网页是否属于仿冒,在判定属于仿冒后将被仿冒网址设定为推荐网址。优选地,所述根据需访问网页的网址,提取多种网页特征分别与预设网址推荐表进行匹配的步骤包括将网址与网址推荐表中网址匹配,判断是否存在匹配网址;在存在时,记录匹配网址为第一记录;将标题标签关键字与网址推荐表中标题标签关键字匹配,判断是否存在匹配标题标签关键字;在存在时,记录匹配标题标签关键字对应的网址为第二记录;将版权关键字与网址推荐表中版权关键字匹配,判断是否存在匹配版权关键字;在存在时,记录匹配版权关键字对应的网址为第三记录。优选地,所述根据所述匹配情况,判断所述网页是否属于仿冒,在判定属于仿冒后推荐被仿冒网址的步骤包括判断第一记录、第二记录以及第三记录中是否存在网址记录;在存在网址记录时,判断保存的网址记录是否为同一网址;将所述网址记录设置为推荐网址。优选地,所述在存在网址记录时,判断保存的网址记录是否为同一网址的步骤包括在存在网址记录时,判断是否存在两个以上的网址记录;在存在两个以上的网址记录时,判断两个以上的网址记录是否为同一网址;如是,将所述网址记录设置为推荐网址。优选地,所述方法之后还包括将类型关键字与数据表中类型关键字匹配,判断数量是否超出门限值;在超出时,将推荐网址提供给访问终端;所述类型关键字包括META标签及正文关键字。优选地,所述获取需访问网页的网址的步骤之后还包括根据网页的网址提取域名;判断所述域名是否存在于域名白名单中;在不存在时,将所述网址以及对应网页的网页特征与预设网址推荐表进行匹配。本发明还提出一种网页安全访问的装置,包括网址特征获取模块,用于获取需访问网页的网址以及对应网页的网页特征;特征匹配模块,用于将所述网址以及对应网页的网页特征与预设网址推荐表进行匹配;所述网址推荐表推荐网址及对应的网页特征;所述网页特征包括标签关键字和/或版权关键字;仿冒判断模块,用于根据所述匹配情况,判断所述网页是否属于仿冒,在判定属于仿冒后将被仿冒网址设定为推荐网址。 优选地,所述特征匹配模块包括网址匹配单元,用于将网址与网址推荐表中网址匹配,判断是否存在匹配网址;在存在时,记录匹配网址为第一记录;标签匹配单元,用于将标题标签关键字与网址推荐表中标题标签关键字匹配,判断是否存在匹配标题标签关键字;在存在时,记录匹配标题标签关键字对应的网址为第二记录;版权匹配单元,用于将版权关键字与网址推荐表中版权关键字匹配,判断是否存在匹配版权关键字;在存在时,记录匹配版权关键字对应的网址为第三记录。优选地,所述仿冒判断模块包括存在判断单元,用于判断第一记录、第二记录以及第三记录中是否存在网址记录;相同判断单元,用于在存在网址记录时,判断保存的网址记录是否为同一网址;、
网址推荐单元,用于将所述网址记录设置为推荐网址。优选地,所述相同判断单元包括第一判断元件,用于在存在网址记录时,判断是否存在两个以上的网址记录;第二判断元件,用于在存在两个以上的网址记录时,判断两个以上的网址记录是否为同一网址;如是,通过网址推荐单元将所述网址记录设置为推荐网址。优选地,所述装置还包括类型匹配模块,用于将类型关键字与数据表中类型关键字匹配,判断数量是否超出门限值;在超出时,将推荐网址提供给访问终端;所述类型关键字包括META标签及正文关键字。优选地,所述装置还包括
域名提取模块,用于根据网页的网址提取域名;域名判断模块,用于判断所述域名是否存在于域名白名单中;在不存在时,将所述网址以及对应网页的网页特征与预设网址推荐表进行匹配。本发明能够检测仿冒类钓鱼网站,并能给出与之对应的被仿冒网站的安全URL;其通过网页特征的匹配,判断访问终端所访问的网址是否为仿冒网址,并确定被仿冒网站的网址,推荐给访问终端访问。由此提升网页访问的安全性,保障访问终端不受非法网站侵害。


图I是本发明网页安全访问的方法一实施例中的步骤流程示意图;图2是本发明网页安全访问的方法一实施例中具体实现的页面展示示意图;图3是本发明网页安全访问的方法另一实施例中的步骤流程示意图;图4是本发明网页安全访问的方法又一实施例中特征匹配的步骤流程示意图;图5是本发明网页安全访问的方法又一实施例中仿冒判断的步骤流程示意图;图6是本发明网页安全访问的方法又一实施例中的步骤流程示意图;图7是本发明网页安全访问的方法一实施例中的结构示意图;图8是本发明网页安全访问的方法另一实施例中的结构示意图;图9是本发明网页安全访问的方法又一实施例中特征匹配模块的结构示意图;图10是本发明网页安全访问的方法又一实施例中仿冒判断模块的结构示意图;图11是本发明网页安全访问的方法又一实施例中相同判断单元的结构示意图;图12是本发明网页安全访问的方法又一实施例中的结构示意图。本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施例方式应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。仿冒类钓鱼网站能够以假乱真,主要原因是被仿冒网站页面的诸多页面特征都与被仿冒的网站相同或相似,主要包括以下情况URL相类似,钓鱼网站的URL与被仿冒网站的URL相似,如仿冒工商银行网银的URL中包含icbc或Icbc等类似的字母序列、仿冒淘宝的URL中包含taobao以及仿冒搜狐的URL中出现sohu这样类似sohu的字母序列等。标题标签或版权关键字相同或相类似,钓鱼页面〈title〉标签、Copyright内容分别与被仿冒页面的〈title〉标签、Copyright内容相同或相类似,且文本长度相差不大,都包含特定的关键字,关键字的内容可依被仿冒页面而定。如仿冒工商银行的网站〈title〉都包含“工商银行”字样。META标签或正文内容具有相 同特定关键字,钓鱼页面<meta>标签内容及正文内容与被仿冒页面的<meta>标签内容及正文内容具有相同的特定关键字,关键字的内容可依被仿冒页面而定。如仿冒工商银行的网站<meta>标签及正文都包含“基金”、“股票”、“黄金”、“理财”或“登录”等关键字。META标签用来描述一个HTML网页文档的属性,例如网页描述、关键字以及页面刷新等。参照图1,提出本发明一种网页安全访问的方法的一实施例。该方法可包括步骤S11、获取需访问网页的网址以及对应网页的网页特征;步骤S12、将该网址以及对应网页的网页特征与预设网址推荐表进行匹配;该网址推荐表推荐网址及对应的网页特征;该网页特征包括标题标签关键字和/或版权关键字;步骤S13、根据该匹配情况,判断该网页是否属于仿冒,在判定属于仿冒后将被仿冒网址设定为推荐网址。上述网页安全访问的方法,能够检测仿冒类钓鱼网站,并能给出与之对应的被仿冒网站的安全URL;其通过网页特征的匹配,判断访问终端所访问的网址是否为仿冒网址,并确定被仿冒网站的网址,推荐给访问终端访问。由此提升网页访问的安全性,保障访问终端不受非法网站侵害。该网页特征可包括标题标签关键字和/或版权关键字等。参照图2,例如,当用户终端访问到一个网页,经过检测该网页为仿冒农业银行网上银行的钓鱼网页,通过确认后可给出用户终端真正需要访问的网站,即是图2中框出的“推荐您访问农业银行”,其中“农业银行”为指向农业银行网上银行http://www. abchina.com的链接。参照图3,在本发明另一实施例中,上述步骤Sll之后还可包括步骤S111、根据网页的网址提取域名;步骤S112、判断该域名是否存在于域名白名单中;在不存在时,进行步骤S12 ;在存在时,进行步骤S14 ;步骤S14、判定该网页为非仿冒网页。本实施例中,在检测之前首先需要建立域名白名单,以及选定可能会被仿冒的网站建立网址推荐表(T_Key_Url)。该被仿冒网站可根据实际情况,选择银行类或票务购买类等,比如工商银行以及南方航空公司等公司网站。在选定可能会被仿冒网站的域名录入域名白名单中时,一个网站可能对应多个域名,需要收集完整,比如南方航空有csair. com和cs-air. com两个域名,收集域名白名单可防止检测时被误报。上述网址推荐表中的内容可包括推荐网址以及对应的网页特征。该网页特征可通过界面使用工具检测推荐网址的相应信息录入。该网址推荐表中项目可包含编号(id)、仿冒类别(grp_id)、标题(〈title〉)标签关键字、Copyright (版权)关键字和推荐网址(URL)五个字段。其中,该id为顺序增长字段;该grp_id可为仿冒组字段,表示仿冒的某一类的网站,如网上银行类或航空公司购票官网类;该推荐URL可为被仿冒网站的官网URL。参见表I如下
权利要求
1.一种网页安全访问的方法,其特征在于,包括 获取需访问网页的网址以及对应网页的网页特征; 将所述网址以及对应网页的网页特征与预设网址推荐表进行匹配;所述网址推荐表推荐网址及对应的网页特征;所述网页特征包括标题标签关键字和/或版权关键字; 根据所述匹配情况,判断所述网页是否属于仿冒,在判定属于仿冒后将被仿冒网址设定为推荐网址。
2.根据权利要求I所述的网页安全访问的方法,其特征在于,所述根据需访问网页的网址,提取多种网页特征分别与预设网址推荐表进行匹配的步骤包括 将网址与网址推荐表中网址匹配,判断是否存在匹配网址;在存在时,记录匹配网址为第一记录; 将标题标签关键字与网址推荐表中标题标签关键字匹配,判断是否存在匹配标题标签关键字;在存在时,记录匹配标题标签关键字对应的网址为第二记录; 将版权关键字与网址推荐表中版权关键字匹配,判断是否存在匹配版权关键字;在存在时,记录匹配版权关键字对应的网址为第三记录。
3.根据权利要求2所述的网页安全访问的方法,其特征在于,所述根据所述匹配情況,判断所述网页是否属于仿冒,在判定属于仿冒后推荐被仿冒网址的步骤包括 判断第一记录、第二记录以及第三记录中是否存在网址记录; 在存在网址记录时,判断保存的网址记录是否为同一网址; 将所述网址记录设置为推荐网址。
4.根据权利要求3所述的网页安全访问的方法,其特征在于,所述在存在网址记录时,判断保存的网址记录是否为同一网址的步骤包括 在存在网址记录时,判断是否存在两个以上的网址记录; 在存在两个以上的网址记录时,判断两个以上的网址记录是否为同一网址;如是,将所述网址记录设置为推荐网址。
5.根据权利要求I至4中任一项所述的网页安全访问的方法,其特征在于,所述方法之后还包括 将类型关键字与数据表中类型关键字匹配,判断数量是否超出门限值;在超出时,将推荐网址提供给访问终端;所述类型关键字包括META标签及正文关键字。
6.根据权利要求I至4中任一项所述的网页安全访问的方法,其特征在于,所述获取需访问网页的网址的步骤之后还包括 根据网页的网址提取域名; 判断所述域名是否存在于域名白名单中;在不存在吋,将所述网址以及对应网页的网页特征与预设网址推荐表进行匹配。
7.—种网页安全访问的装置,其特征在于,包括 网址特征获取模块,用于获取需访问网页的网址以及对应网页的网页特征; 特征匹配模块,用于将所述网址以及对应网页的网页特征与预设网址推荐表进行匹配;所述网址推荐表推荐网址及对应的网页特征;所述网页特征包括标题标签关键字和/或版权关键字; 仿冒判断模块,用于根据所述匹配情况,判断所述网页是否属于仿冒,在判定属于仿冒后将被仿冒网址设定为推荐网址。
8.根据权利要求6所述的网页安全访问的装置,其特征在于,所述特征匹配模块包括网址匹配単元,用于将网址与网址推荐表中网址匹配,判断是否存在匹配网址;在存在时,记录匹配网址为第一记录; 标签匹配単元,用于将标题标签关键字与网址推荐表中标题标签关键字匹配,判断是否存在匹配标题标签关键字;在存在时,记录匹配标题标签关键字对应的网址为第二记求; 版权匹配単元,用于将版权关键字与网址推荐表中版权关键字匹配,判断是否存在匹配版权关键字;在存在时,记录匹配版权关键字对应的网址为第三记录。
9.根据权利要求8所述的网页安全访问的装置,其特征在于,所述仿冒判断模块包括 存在判断単元,用于判断第一记录、第二记录以及第三记录中是否存在网址记录; 相同判断単元,用于在存在网址记录时,判断保存的网址记录是否为同一网址; 网址推荐单元,用于将所述网址记录设置为推荐网址。
10.根据权利要求9所述的网页安全访问的装置,其特征在于,所述相同判断単元包括 第一判断元件,用于在存在网址记录时,判断是否存在两个以上的网址记录; 第二判断元件,用于在存在两个以上的网址记录时,判断两个以上的网址记录是否为同一网址;如是,通过网址推荐单元将所述网址记录设置为推荐网址。
11.根据权利要求7至10中任一项所述的网页安全访问的装置,其特征在于,所述装置还包括 类型匹配模块,用于将类型关键字与数据表中类型关键字匹配,判断数量是否超出门限值;在超出时,将推荐网址提供给访问終端;所述类型关键字包括META标签及正文关键字。
12.根据权利要求7至10中任一项所述的网页安全访问的装置,其特征在于,所述装置还包括 域名提取模块,用于根据网页的网址提取域名; 域名判断模块,用于判断所述域名是否存在于域名白名单中;在不存在时,将所述网址以及对应网页的网页特征与预设网址推荐表进行匹配。
全文摘要
本发明揭示了一种网页安全访问的方法及装置。该方法可包括获取需访问网页的网址以及对应网页的网页特征;将所述网址以及对应网页的网页特征与预设网址推荐表进行匹配;所述网址推荐表推荐网址及对应的网页特征;所述网页特征包括标题标签关键字和/或版权关键字;根据所述匹配情况,判断所述网页是否属于仿冒,在判定属于仿冒后将被仿冒网址设定为推荐网址。本发明能够检测仿冒类钓鱼网站,并能给出与之对应的被仿冒网站的安全URL;其通过网页特征的匹配,判断访问终端所访问的网址是否为仿冒网址,并确定被仿冒网站的网址,推荐给访问终端访问。由此提升网页访问的安全性,保障访问终端不受非法网站侵害。
文档编号G06F17/30GK102737183SQ201210192839
公开日2012年10月17日 申请日期2012年6月12日 优先权日2012年6月12日
发明者罗焱 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1