网站访问记录的分析方法与网站访问记录的分析装置制造方法

文档序号:6526424阅读:154来源:国知局
网站访问记录的分析方法与网站访问记录的分析装置制造方法
【专利摘要】本发明提供了一种网站访问记录的分析方法与网站访问记录的分析装置。其中,网站访问记录的分析方法包括以下步骤:获取对目标网站的访问请求记录;判断访问请求记录中的目标域名是否与目标网站的子域名匹配;根据判断结果将访问请求记录保存到不同的数据表中。利用本发明的技术方案,将与子域名匹配的访问记录和不匹配的访问记录分别保存在不同的数据表中,以分别进行相应的处理。由于进行了有针对性的区分,在进行具体应用时减小了数据量,提高了数据处理效率。
【专利说明】网站访问记录的分析方法与网站访问记录的分析装置
【技术领域】
[0001]本发明涉及互联网,特别是涉及一种网站访问记录的分析方法与网站访问记录的分析装置。
【背景技术】
[0002]网络中的地址方案分为两套:IP地址系统和域名地址系统。这两套地址系统存在着对应的关系。IP地址用二进制数来表示,每个IP地址长32比特,由4个小于256的数字组成,数字之间用点间隔。由于IP地址是数字标识,使用时难以记忆和书写,因此在IP地址的基础上又发展出一种符号化的地址方案,来代替数字型的IP地址。每一个符号化的地址都与特定的IP地址对应,这样网络上的资源访问起来就容易得多了。这个与网络上的数字型IP地址相对应的字符型地址,就被称为域名。
[0003]以一个常见的域名为例说明,百度网址是由二部分组成,标号“百度”是这个域名的主体,而最后的标号“com”则是该域名的后缀,代表的这是一个com国际域名,是顶级域名。
[0004]二级域名是顶级域名(一级域名)的下一级,域名整体包括两个例如“www.baidu.com”、“music, baidu.com”、“ image, baidu.com” 都是百度网站的二级域名。二级域名是指由域名使用者自己设计的,能够体现使用者的特殊性,并据以同其他人的域名相区别的字符串。
[0005]域名与IP地址的转换工作由域名解析系统(Domain Name System,简称DNS)完成,域名解析系统中配置有于域名与IP地址的对应关系。现有的网站访问记录的分析方法将向目标网站发送的所有访问请求按照一级域名进行记录和分析,会产生较多的垃圾数据,较大数据量占用了较多的计算资源,而且无法实现精细化分析。

【发明内容】

[0006]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的网站访问记录的分析装置和相应的网站访问记录的分析方法。本发明一个进一步的目的是要使得过滤网站访问记录中的无效数据,实现精细化分析。
[0007]依据本发明的一个方面,提供了网站访问记录的分析方法。该网站访问记录的分析方法包括以下步骤:获取对目标网站的访问请求记录;判断访问请求记录中的目标域名是否与目标网站的子域名匹配;根据判断结果将访问请求记录保存到不同的数据表中。
[0008]可选地,判断访问请求记录中的目标域名是否与目标网站的子域名匹配包括:获取目标网站的子域名列表;将子域名列表中的条目与目标域名进行比较,判断是否存在与目标域名一致的条目。
[0009]可选地,获取目标网站的子域名列表包括:从域名解析系统中获取目标网站配置的所有子域名,以得到子域名列表。
[0010]可选地,根据判断结果将访问请求记录保存到不同的数据表中包括:若判断结果为是,将访问请求记录按照子域名分类存储至第一数据表中;若判断结果为否,将访问请求记录存储至第二数据表中。
[0011]可选地,将访问请求记录按照子域名分类存储至第一数据表中之后还包括:按照第一数据表中记录的数据,生成目标网站的访问分析报表。
[0012]可选地,,将访问请求记录存储至第二数据表中之后还包括:对第二数据表中记录的数据进行分析,提取出恶意请求特征,以用于网站安全防护。
[0013]根据本发明的另一个方面,还提供了一种网站访问记录的分析装置。该网站访问记录的分析装置包括:获取模块,用于获取对目标网站的访问请求记录;判断模块,用于判断访问请求记录中的目标域名是否与目标网站的子域名匹配;保存模块,用于根据判断结果将访问请求记录保存到不同的数据表中。
[0014]可选地,判断模块被配置为:获取目标网站的子域名列表;将子域名列表中的条目与目标域名进行比较,判断是否存在与目标域名一致的条目。
[0015]可选地,保存模块包括:第一数据表保存子模块,用于在判断模块的判断结果为是的情况下,将访问请求记录按照子域名分类存储至第一数据表中;第二数据表保存子模块,用于在判断模块的判断结果为否的情况下,将访问请求记录存储至第二数据表中。
[0016]可选地,以上网站访问记录的分析装置还包括:报表分析模块,用于按照第一数据表中记录的数据,生成目标网站的访问分析报表。
[0017]可选地,以上网站访问记录的分析装置还包括:特征提取模块,用于对第二数据表中记录的数据进行分析,提取出恶意请求特征,以用于网站安全防护。
[0018]本发明的网站访问记录的分析方法和装置将访问记录与目标网站配置的子域名进行匹配,将与子域名匹配的访问记录和不匹配的访问记录分别保存在不同的数据表中,以分别进行相应的处理。由于进行了有针对性的区分,在进行具体应用时减小了数据量,提高了数据处理效率。
[0019]进一步地,本发明的网站访问记录的分析方法由于进行了子域名的匹配计算,从而可以将网站访问记录按照子域名进行分类处理,提高了数据分析的精细程度。
[0020]又进一步地,本发明的网站访问记录的分析方法可以利用与子域名不匹配的访问记录的数据表,对泛解析的访问记录进行分析,提取出其中的恶意访问特征,为网络安全防护提供了数据支持。
[0021]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
[0022]根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
【专利附图】

【附图说明】
[0023]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0024]图1是根据本发明一个实施例的网站访问记录的分析装置100的示意图;[0025]图2是根据本发明一个实施例的网站访问记录的分析方法的示意图;以及
[0026]图3是根据本发明一个实施例的网站访问记录的分析方法的流程图;
【具体实施方式】
[0027]在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0028]图1是根据本发明一个实施例的网站访问记录的分析装置100的示意图,该网站访问记录的分析装置100 —般性地可以包括:获取模块110,判断模块120,保存模块130。在一些优选方案和特殊的使用环境下,本实施例的网站访问记录的分析装置100可以增加设置报表分析模块140和特征提取模块150,保存模块130可以分别设置有第一数据表保存子模块131、第二数据表保存子模块132。
[0029]在以上模块中,获取模块110用于获取对目标网站的访问请求记录;判断模块120用于判断访问请求记录中的目标域名是否与目标网站的子域名匹配;保存模块130用于根据判断结果将访问请求记录保存到不同的数据表中。
[0030]域名与IP地址的转换工作由域名解析系统(Domain Name System,简称DNS)完成,域名解析系统中配置有于域名与IP地址的对应关系。为了让域名支持无限的子域名,可以采用泛解析方式,支持将在域名解析里面设置通配符“*”,将顶级域名下的所有二级域名对应到同一个IP上去,例如对应值网站主页对应的IP上。也就是泛解析支持利用通配符“ * ”来做次级域名以实现所有的次级域名均指向同一 IP地址,
[0031]仍以百度为例,在支持泛解析的情况下,可以将所有出子域名之外的包括baidu.com的网址均对应至百度主页“www.baidu.com”的IP地址下,也就将“123.baidu.com”、“admin, baidu.com”等不存在的网址也对应到百度主页上,使用泛解析可以域名支持无限的子域名,并可以解决部分用户错误输入导致的网站不能访问的问题。
[0032]然而使用泛解析的危害性较大,首先会将带来大量的垃圾数据,例如黑客可以随机生成大量的无效域名对目标网站进行攻击,另外,还会引起搜索引擎对网站的二级域名进行降权处理,即不收录二级域名页面或降低收录二级域名页面的数量。
[0033]对于目标网站的访问请求分析装置而言,将泛解析的数据进行记录和分析,会将大量无效的请求数据保存到请求记录中,造成数据库中数据量增大,影响了数据处理效率。
[0034]本实施例的网站访问记录的分析装置100在进行数据分析时,获取模块110得到访问请求记录数据后,需要经过判断模块120的判断,由保存模块130按照判断模块120的判断结果进行分类保存,减小了无效数据对数据分析的干扰,并且提高了数据处理的效率。
[0035]其中判断模块120的一种配置方式为:获取目标网站的子域名列表;将子域名列表中的条目与目标域名进行比较,判断是否存在与目标域名一致的条目。以上目标网站的子域名列表可以由用户在联网应用服务提供商中的配置数据得出,这些子域名分别对应着网站不同的页面,例如对于百度而言,其配置的有效子域名包括:“tieba.baidu.com”、“news, baidu.com,,、“www.baidu.com,,、“map.baidu.com,,、“v.baidu.com,,、“ image, baidu.com”、“music.baidu.com”、“zhida0.baidu.com”可以将按照这些有效的子域名生成子域名列表,当获取模块110获取到的访问请求记录中的域名是否在以上子域名列表中存在一致的条目,例如当前访问请求记录的域名为“image, baidu.com”,则认为该请求记录属于第一类数据,而对于访问访问请求记录的域名为“admine.baidu.com”,则认为该请求记录是第
二类数据。
[0036]相应地,第一数据表保存子模块131用于存储第一类数据,也就是在判断模块120的判断结果为是的情况下,将访问请求记录按照子域名分类存储至第一数据表中;第二数据表保存子模块132用于存储第二类数据,也就是判断模块120的判断结果为否的情况下,将访问请求记录按照子域名分类存储至第二数据表中。以上第一数据表和第二数据表可以分别在不同的数据库中建立,也可以是同一数据库的不同数据表。
[0037]以上第一类数据和第二类数据可以作为不同用途的数据源,其中,第一数据表中的数据可以由报表分析模块140用于生成目标网站的访问分析报表。第二数据表中的数据可以由特征提取模块150进行分析,提取出恶意请求特征,以用于网站安全防护。
[0038]其中,第一数据表中数据都是网站配置的子域名对应的请求数据,对此类数据进行分析,可以客观反映用户对网站的请求情况,而且经过了数据匹配,以上数据可以按照子域名进行分类,实现了精细化数据分析。例如可将实时的请求按照子域名生成报表,供网站运营人员插卡。
[0039]第二数据表中的数据是泛解析的域名,并不属于网站有效配置的子域名,其中可能包括有大量的黑客攻击数据,对这类数据进行分析,提取出恶意请求特征,可以有助于网站的安全防护。
[0040]本发明实施例还提供了一种网站访问记录的分析方法。该网站访问记录的分析方法可以由以上实施例中介绍的网站访问记录的分析装置100执行,实现网站访问数据的分类处理和保存。图2是根据本发明一个实施例的网站访问记录的分析方法的示意图,该网站访问记录的分析方法包括以下步骤:
[0041 ] 步骤S202,获取对目标网站的访问请求记录;
[0042]步骤S204,判断访问请求记录中的目标域名是否与目标网站的子域名匹配;
[0043]步骤S206,根据判断结果将访问请求记录保存到不同的数据表中。
[0044]其中,步骤S204的一种实现方式为:获取目标网站的子域名列表;将子域名列表中的条目与目标域名进行比较,判断是否存在与目标域名一致的条目。其中获取目标网站的子域名列表的步骤可以从域名解析系统中获取目标网站配置的所有子域名,生成子域名列表。
[0045]步骤S206的一种实现方式为:若步骤S204的判断结果为是,将访问请求记录按照子域名分类存储至第一数据表中;若步骤S204的判断结果为否,将访问请求记录存储至第二数据表中。其中,按照第一数据表中记录的数据可以用于生成目标网站的访问分析报表。第二数据表中记录的数据可进一步进行分析,提取出恶意请求特征,以用于网站安全防护。
[0046]图3是根据本发明一个实施例的网站访问记录的分析方法的流程图,该实施例的网站访问记录的分析方法的一种实现流程为:
[0047]步骤S302,获取对目标网站的访问请求记录;
[0048]步骤S304,判断访问请求记录中的目标域名与目标网站配置的有效子域名是否一致;
[0049]步骤S306,若步骤S304的判断结果为是,将访问请求记录保存至第一数据表,用于生成请求记录报表;
[0050]步骤S308,若步骤S304的判断结果为否,将访问请求记录保存至第二数据表。对第二数据表中的数据进行进一步分析,如果发现在DNS中配置了泛解析,则向用户告知泛解析的危害,及时提醒用户。
[0051]以下一个具体的网站为例对本发明的网站访问记录的分析方法进行说明。例如网站根域名为“ABDCE.COM”。表1是该网站配置的所有子域名的列表。
[0052]表1
[0053]
【权利要求】
1.一种网站访问记录的分析方法,包括: 获取对目标网站的访问请求记录; 判断所述访问请求记录中的目标域名是否与所述目标网站的子域名匹配; 根据判断结果将所述访问请求记录保存到不同的数据表中。
2.根据权利要求1所述的方法,其中,判断所述访问请求记录中的目标域名是否与所述目标网站的子域名匹配包括: 获取所述目标网站的子域名列表; 将所述子域名列表中的条目与所述目标域名进行比较,判断是否存在与所述目标域名一致的条目。
3.根据权利要求2所述的方法,其中,获取所述目标网站的子域名列表包括:从域名解析系统中获取所述目标网站配置的所有子域名,以得到所述子域名列表。
4.根据权利要求1至3中任一项所述的方法,其中,根据判断结果将所述访问请求记录保存到不同的数据表中包括: 若所述判断结果为是,将所述访问请求记录按照所述子域名分类存储至第一数据表中; 若所述判断结果为否,将所述访问请求记录存储至第二数据表中。
5.根据权利要求4所述的方法,其中,将所述访问请求记录按照所述子域名分类存储至第一数据表中之后还包括: 按照所述第一数据表中记录的数据,生成所述目标网站的访问分析报表。
6.根据权利要求4所述的方法,其中,将所述访问请求记录存储至第二数据表中之后还包括: 对所述第二数据表中记录的数据进行分析,提取出恶意请求特征,以用于网站安全防护。
7.一种网站访问记录的分析装置,包括: 获取模块,用于获取对目标网站的访问请求记录; 判断模块,用于判断所述访问请求记录中的目标域名是否与所述目标网站的子域名匹配; 保存模块,用于根据判断结果将所述访问请求记录保存到不同的数据表中。
8.根据权利要求7所述的装置,其中,所述判断模块被配置为: 获取所述目标网站的子域名列表; 将所述子域名列表中的条目与所述目标域名进行比较,判断是否存在与所述目标域名一致的条目。
9.根据权利要求7或8所述的装置,其中,所述保存模块包括: 第一数据表保存子模块,用于在所述判断模块的判断结果为是的情况下,将所述访问请求记录按照所述子域名分类存储至第一数据表中; 第二数据表保存子模块,用于在所述判断模块的判断结果为否的情况下,将所述访问请求记录存储至第二数据表中。
10.根据权利要求9所述的装置,还包括: 报表分析模块,用于按照所述第一数据表中记录的数据,生成所述目标网站的访问分析报表。
【文档编号】G06F17/30GK103701951SQ201310741720
【公开日】2014年4月2日 申请日期:2013年12月27日 优先权日:2013年12月27日
【发明者】董方 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1