网站变换域名的检测方法、装置和系统与流程

文档序号:14612913发布日期:2018-06-05 21:17阅读:265来源:国知局
网站变换域名的检测方法、装置和系统与流程

本发明涉及网络安全技术领域,尤其涉及一种网站变换域名的检测方法、装置和系统。



背景技术:

随着科技的普及化,域名技术已被广泛应用。域名,是由一串用“点”分隔的字符组成的Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位。域名的目的是便于记忆和沟通的一组服务器的地址(网站,电子邮件,FTP等)。域名可以作为互联网参与者便于记忆的网站名称。域名按域名系统(DNS)的规则流程组成。在DNS中注册的任何名称都是域名。域名可用于各种网络环境和应用程序特定的命名和寻址目的。

因此,可以利用域名对各个网站进行监督和管理。目前在网站内容管理中,主要采用基于域名的管理,某些网站域名总是不定期进行变化,对于这些特定网站,需要采用特殊的方法才能够识别。



技术实现要素:

本发明实施例提供了的目的在于提出一种网站变换域名的检测方法、装置和系统,以解决现有技术中屏蔽特定网站的方式时效性差的技术问题。

第一方面,本发明实施例提供了一种网站变换域名的检测方法,包括:

获取特定网站的域名;

根据域名变换规则对所述域名进行变换,生成变换域名;

访问所述变换域名所对应的网页,在访问成功时,保存所述网页的内容;

将所述网页的内容与特定网站的网页的内容进行比对,在比对成功时,标记所述变换域名为特定网站域名。

第二方面,本发明实施例还提供了一种网站变换域名的生成装置,包括:

获取模块,用于获取特定网站的域名;

生成模块,用于根据域名变换规则对所述域名进行变换,生成变换域名;

访问模块,用于访问所述变换域名所对应的网页,在访问成功时,获取所述网页的内容;

比对模块,用于将所述网页的内容与特定网站的网页的内容进行比对,在比对成功时,标记所述变换域名为特定网站域名。

第三方面,本发明实施例还提供了一种网站变换域名的检测系统,包括:

域名变换服务器,用于获取特定网站的域名,根据域名变换规则对所述域名进行变换,生成变换域名;

变换域名检测服务器,用于访问所述变换域名所对应的网页,在访问成功时,保存所述网页的内容,并将所述网页的内容与特定网站的网页的内容进行比对,在比对成功时,标记所述变换域名为特定网站域名。

本发明实施例提供的网站变换域名的检测方法、装置和系统,基于特定网站的域名,按照设定的规则对域名进行变换,并对变换的域名的网页内容进行检测,以识别变换的域名对应的网站是否为特定网站。可以主动对特定网站进行识别,提高了特定网站识别的时效性,提升了防护特定网站的效率,进而增强了网络通信的安全。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1为本发明实施例一提供的网站变换域名的检测方法的流程图;

图2是本发明实施例二提供的网站变换域名的检测方法的流程图;

图3是本发明实施例三提供的网站变换域名的检测方法的流程图;

图4是本发明实施例四提供的网站变换域名的检测装置的结构图;

图5是本发明实施例四提供的网站变换域名的检测系统的结构图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的网站变换域名的检测方法的流程示意图,本实施例的方法适用于对特定网站的变换域名进行检测的情况。可以由定网站变换域名的检测装置来执行,该装置可通过硬件和/或软件的方式实现。

参见图1,所述网站变换域名的检测方法,包括:

S110,获取特定网站的域名。

域名(Domain Name),是由一串用“点”分隔的字符组成的Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位。域名的目的是便于记忆和沟通的一组服务器的地址。域名是上网单位和个人在网络上的重要标识,起着识别作用,便于他人识别和检索某一企业、组织或个人的信息资源,从而更好地实现网络上的资源共享。除了识别功能外,在虚拟环境下,域名还可以起到引导、宣传、代表等作用。对于任何一个可在互联网被访问的网站,其都有对应的域名。在本实施例中,所述特定网站可以是涉及色情,赌博和钓鱼内容的非法网站。特定网站的域名可以从现有的黑名单中获取,也可通过接收检测人员手动输入的域名得到。

S120,根据域名变换规则对所述域名进行变换,生成变换域名。

为了逃避网站被屏蔽,不法分子往往为同一个特定网站注册多个域名,用于在其中一个域名被屏蔽时,采用其它域名继续提供服务。由于域名在使用前需要向域名注册服务机构进行申请,经过审查后才可以使用。因此,不法分子往往在注册一个常用域名的基础上,再注册多个与常用域名相近似的域名作为备用域名,在常用域名被屏蔽时,使用其它备用域名。

由于备用域名与常用域名相近似,因此,可以利用域名变换规则对特定网站的域名进行变换,以得到变换域名,所述变换域名可能是不法分子所采用的备用域名。所述域名变换规则可以从其它备用域名和常用域名的关系中抽取得到的。所述域名变换规则可以通过机器算法或者人工两种方式得到。示例性的,可以通过Apriori算法挖掘域名变换规则,或者基于工作人员对现有的备用域名和常用域名,进行总结,得出域名变换规则。所述域名变化规则可以不止一个,可以根据所有域名变换规则对常用域名进行变换,也可以通过用户选取的某一个或者多个域名变换规则常用域名进行变换。所生成的变换域名通常为多个。

S130,访问所述变换域名所对应的网页,在访问成功时,保存所述网页的内容。

由于经过域名变换规则所得到的变换域名并不一定与备用域名相一致,因此,需要对变换域名所对应的网页进行访问,以确认变换域名当前是否在使用。示例性的,可以通过浏览器访问所述变换域名所对应的网页,该网页通常为网站的首页。如果访问成功,则说明该变换域名当前处于使用状态。如果访问失败,则说明该变换域名还未被启用。在访问成功时,保存所述网页的内容。所述网页的内容可以包括文本、图片、布局、颜色以及各种嵌入的函数和插件等。在访问失败时,标记所述变换域名为无法访问。通过对访问失败的变换域名进行标记,可以排除当前变换域名为特定网站的备用域名。

S140,将所述网页的内容与特定网站的网页的内容进行比对,在比对成功时,标记所述变换域名为特定网站域名。

虽然变换域名所对应的网页能够访问成功,但并不代表所述变换域名一定是特定网站的备用域名。需要根据其内容进一步确定其是否对应特定网站。在本实施例中,可以将上述步骤中保存的网页的内容与特定网站的网页内容进行比对。示例性的,可以将保存的网页中的布局与特定网站的首页的布局进行比对,或者可以选取保存的网页中的布局选取某一位置的图片并选取在特定网站的首页中对应位置的图片,并将两张图片转为灰度图片,根据灰度图片的灰度分布情况进行比对,判断是否为同一张图片。如果比对成功,则可以确定变换域名为特定网站域名,并将所述变换域名标记为特定网站域名。在标记完成后,可以根据标记结果将所述变换域名加入到黑名单中,以实现对变换域名进行屏蔽。

本实施例基于特定网站的域名,按照设定的规则对域名进行变换,并对变换的域名的网页内容进行检测,以识别变换的域名对应的网站是否为特定网站。可以主动对特定网站进行识别,提高了特定网站识别的时效性,提升了防护特定网站的效率,进而增强了网络通信的安全。

在本实施例的一个优选实施方式中,在在根据域名变换规则对所述域名进行变换之前还可增加如下步骤:根据选择的转换算法配置域名变换规则。由于域名变换规则可能存在多种,但并不是每一种变换规则都适用于当前特定网站的域名。因此,在本实施例中,可以提供多种转换算法,每种转换算法都对应有一种域名变换规则,用户可以从提供的多种转换算法中选取一种或多种转换算法,根据用户所选择的转换算法配置域名变换规则,并根据所述域名变换规则对特定网站的域名进行变换。通过根据选择的转换算法配置域名变换规则,可以通过用户的选择确定与当前特定网站域名合适的域名变换规则,可以提高变换域名的命中率,并能够减少域名变换的运算量。

实施例二

图2是本发明实施例二提供的网站变换域名的检测方法的流程示意图。本实施例以上述实施例为基础进行优化,在本实施例中,将所述根据域名变换规则对所述域名进行变换,具体优化为:对所述域名的后缀名进行转换;在所述域名主体后追加字符;和\或在所述域名主体以数字结尾时,对所述数字加一,直至所述数字达到最大值。

参见图2,所述网站变换域名的检测方法,包括:

S210,获取特定网站的域名。

S220,对所述域名的后缀名进行转换,在所述域名主体后追加字符,和\或在所述域名主体以数字结尾时,对所述数字加一,直至所述数字达到最大值,生成变换域名。

不法分子常常将备用域名设置为与常用域名相近似的域名,以期望在常用域名被屏蔽之后,网络用户可以方便的找到新的域名。根据这一特性,可以设定相应的域名变换规则,实现对备用域名的枚举。

示例性的,可以对所述域名的后缀名进行转换。域名包括主题和后缀名,中间由点号分隔。例如,baidu网址是由二部分组成,标号“baidu”是这个域名的主体,而最后的标号“com”则是该域名的后缀,代表的这是一个com国际域名。通常后缀名包括:top、com、xyz、net、org等。对所述域名的后缀名进行转换,可以将特定网站域名的后缀名转换为另一种后缀名。示例性的,特定网站的域名为td886k.com,通过转换,可以生成td886k.org和td886k。net等多个变换域名。

示例性的,还可以在所述域名主体后追加字符实现对域名的变换。所述域名主体可以是用于标识域名唯一性的数字和字符的组合。例如:域名baidu.com中baidu为域名主体。可以在域名主体后追加字符。所述字符可以字母和数字。示例性的,特定网站的域名为:td886.com,可以在td886后追加字符,通过追加,可以生成td886a.com、td886b.com……td886z.com,和td8861.com……td8860.com等变换域名。此外,追加字符的位数可以为一位,也可以为两位,甚至更多位。

此外,在所述域名主体以数字结尾时,可以对所述数字加一,直至所述数字达到最大值。示例性的,特定网站的域名为:td86.com,其域名主体为td86,是以数字结尾的,可以对所述数字循环加一,直至所述数字达到有所述数字位数对应的最大值。例如:可以生成td87.com、td88.com、……td99.com的变换域名。

S230,访问所述变换域名所对应的网页,在访问成功时,保存所述网页的内容。

S240,将所述网页的内容与特定网站的网页的内容进行比对,在比对成功时,标记所述变换域名为特定网站域名。

本发明实施例通过将所述根据域名变换规则对所述域名进行变换,具体优化为:对所述域名的后缀名进行转换;在所述域名主体后追加字符;和\或在所述域名主体以数字结尾时,对所述数字加一,直至所述数字达到最大值。可以有针对性的对特定网站的域名进行变换,能够提高生成的变换域名的命中率。

实施例三

图3是本发明实施例三提供的网站变换域名的检测方法的流程示意图。本实施例以上述实施例为基础进行优化,在本实施例中,将所述网页的内容与特定网站的网页的内容进行比对,在比对成功时,标记所述变换域名为特定网站域名,具体优化为:从所述网页的内容中提取文字内容,将所述文字内容与的特定网站预设关键字进行匹配,在匹配成功时,标记所述变换域名为特定网站域名。

参见图3,所述网站变换域名的检测方法,包括:

S310,获取特定网站的域名。

S320,根据域名变换规则对所述域名进行变换,生成变换域名。

S330,访问所述变换域名所对应的网页,在访问成功时,保存所述网页的内容。

S340,从所述网页的内容中提取文字内容,将所述文字内容与的特定网站预设关键字进行匹配,在匹配成功时,标记所述变换域名为特定网站域名。

虽然可以将访问成功的网页内容中的图片和\或布局等与特定网站对应的图片和\或布局进行比对,并根据比对结果判断所述变换域名是否为特定网站的域名。但从网页内容中提取图片和\或布局相对运算较复杂,且采用图片和\或布局进行比对,判断所述变换域名是否为特定网站域名的错误率较高。因此,在本实施例中,将从所述网页的内容中提取文字内容,所述文字内容与特定网站预设关键字进行匹配。由于特定网站的文字内容必然含有一些特定的词汇,因此,采用文字内容与预设关键字进行匹配,能够准确的判断所述变换域名是否为特定网站域名,并且从网页内容中提取文字内容相对较为容易。将提取的文字内容与预设关键字进行匹配。所述预设关键字可以是根据特定网站的文字内容手动输入的,也可以从所述特定网站的网页内容中导入关键字,作为预设关键字。具体的,了可以已知特定网站文字内容中提取,统计频次较高的词得到的。在匹配成功时,则可以确定所述变换域名为特定网站域名,并对所述变换域名进行标记,在标记完成后,可以根据标记结果将所述变换域名加入到黑名单中,以实现对变换域名进行屏蔽。

本实施例通过将所述网页的内容与特定网站的网页的内容进行比对,在比对成功时,标记所述变换域名为特定网站域名,具体优化为:从所述网页的内容中提取文字内容,将所述文字内容与的特定网站预设关键字进行匹配,在匹配成功时,标记所述变换域名为特定网站域名。通过将文字内容作为对比项,便于从保存的网页内容中进行提取,并且能够提高判断所述变换域名为特定网站域名的准确性。

实施例四

图4是本发明实施例四提供的网站变换域名的检测装置的结构图,如图4所示,所述装置包括:

获取模块410,用于获取特定网站的域名;

生成模块420,用于根据域名变换规则对所述域名进行变换,生成变换域名;

访问模块430,用于访问所述变换域名所对应的网页,在访问成功时,获取所述网页的内容;

比对模块440,用于将所述网页的内容与特定网站的网页的内容进行比对,在比对成功时,标记所述变换域名为特定网站域名。

本实施例提供的网站变换域名的检测装置,基于特定网站的域名,按照设定的规则对域名进行变换,并对变换的域名的网页内容进行检测,以识别变换的域名对应的网站是否为特定网站。可以主动对特定网站进行识别,提高了特定网站识别的时效性,提升了防护特定网站的效率,进而增强了网络通信的安全。

在上述各实施例的基础上,所述转换模块用于:

对所述域名的后缀名进行转换;

在所述域名主体后追加字符;和\或

在所述域名主体以数字结尾时,对所述数字加一,直至所述数字达到最大值。

在上述各实施例的基础上,所述比对模块用于:

从所述网页的内容中提取文字内容,将所述文字内容与的特定网站预设关键字进行匹配,在匹配成功时,标记所述变换域名为特定网站域名。

在上述各实施例的基础上,所述装置还包括:

配置模块,用于根据选择的转换算法配置域名变换规则。

在上述各实施例的基础上,所述装置还包括:

失败标记模块,用于在访问失败时,标记所述变换域名为无法访问。

本发明实施例所提供的网站变换域名的检测装置可执行本发明任意实施例所提供的网站变换域名的检测方法,具备执行方法相应的功能模块和有益效果。

实施例五

图5为本发明实施例五提供的一种网站变换域名的检测系统的结构示意图。

上述实施例所提供的网站变换域名的检测方法,可以由一个包括一个或多个处理器;存储装置,用于存储一个或多个程序的服务器执行,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述实施例提供特定网站变换域名方法。

在本实施例中,出于系统安全和运算能力的考虑,由上述实施例所提供的网站变换域名的检测方法,可以由包括域名变换服务器和变换域名检测服务器的网站变换域名的检测系统执行。其中,每个服务器都至少包括:一个或者多个处理器或者处理单元,系统存储器,连接不同系统组件(包括系统存储器和处理单元)的总线。以及与使得该服务器能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。并且,所述变换域名检测服务器可以通过网络适配器与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。

具体的,所述域名变换服务器,用于获取特定网站的域名,根据域名变换规则对所述域名进行变换,生成变换域名;

所述变换域名检测服务器,用于访问所述变换域名所对应的网页,在访问成功时,保存所述网页的内容,并将所述网页的内容与特定网站的网页的内容进行比对,在比对成功时,标记所述变换域名为特定网站域名。

变换域名检测服务器因需要访问外界网络,因此该服务器需要与互联网网络连接,但域名变换服务器无需访问外界网络,因此,可以将变换域名检测服务器和域名变换服务器设置在同一局域网内,二者之间通过防火墙保证数据传输即可。

显然,本领域技术人员应该明白,上述本发明的各模块或各步骤可以通过如上所述的设备实施。可选地,本发明实施例可以用计算机装置可执行的程序来实现,从而可以将它们存储在存储装置中由处理器来执行,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等;或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1