一种识别请求的方法及网站服务器的制造方法

文档序号:9219790阅读:331来源:国知局
一种识别请求的方法及网站服务器的制造方法
【技术领域】
[0001]本发明涉及搜索技术领域,具体涉及一种识别请求的方法及网站服务器。
【背景技术】
[0002]蜘蛛请求(又被称为网页蜘蛛,网络机器人)是一种按照一定规则,自动的抓取互联网信息的程序或者脚本;蜘蛛请求一般由提供搜索服务的搜索公司发出,搜索公司通过蜘蛛请求可定向抓取相关的网站信息(如网站的网页信息等),并将抓取到的网站信息整合到搜索引擎中,提升搜索引擎输出搜索结果的全面性和准确性;由于网站信息被蜘蛛请求抓取后,能够被搜索公司整合入搜索引擎中,提升网站被用户搜索到的可能性,因此大多数的网站对于由搜索公司所发出的蜘蛛请求是持欢迎态度的,并不对其进行屏蔽。
[0003]本发明的发明人在研宄过程中发现,目前一些非搜索公司出于窃取网站信息的目的,存在伪造蜘蛛请求,恶意采集网站信息的情况;出于保证网站信息的安全,对于伪造的蜘蛛请求进行识别,从而在后续加以屏蔽,显得尤为必要;然而,伪造的蜘蛛请求与由搜索公司发出的合法蜘蛛请求在内容上基本一致,目前并没有一种能够有效识别伪造的蜘蛛请求的技术。
[0004]因此,如何提供一种能够识别伪造的蜘蛛请求的方法,成为本领域技术人员需要考虑的问题。

【发明内容】

[0005]有鉴于此,本发明实施例提供一种识别请求的方法及网站服务器,以实现有效识别伪造的蜘蛛请求的目的。
[0006]为实现上述目的,本发明实施例提供如下技术方案:
[0007]一种识别请求的方法,包括:
[0008]获取接入网站的请求;
[0009]判断所述请求是否携带蜘蛛标识;
[0010]若所述请求中携带蜘蛛标识,确定所述请求的IP地址;
[0011]根据所述IP地址,判断所述请求是否由搜索公司发出;
[0012]若所述请求由搜索公司发出,则确定所述请求为合法蜘蛛请求;
[0013]若所述请求不是由搜索公司发出,则确定所述请求为伪造的蜘蛛请求。
[0014]其中,所述方法还包括:
[0015]放行所述合法蜘蛛请求,以便所述合法蜘蛛请求抓取网站信息;
[0016]屏蔽所述伪造的蜘蛛请求。
[0017]其中,所述根据所述IP地址,判断所述请求是否由搜索公司发出包括:
[0018]判断所述IP地址是否为合法IP地址,所述合法IP地址为搜索公司对应的IP地址;
[0019]若是,则确定所述请求由搜索公司发出;
[0020]若否,则确定所述请求不是由搜索公司发出。
[0021]其中,所述判断所述IP地址是否为合法IP地址包括:
[0022]调取预设的合法IP地址,判断所述IP地址是否与预设的合法IP地址对应,若是,则确定所述IP地址为合法IP地址,若否,则确定所述IP地址不为合法IP地址;
[0023]或,确定所述IP地址对应的域名信息,判断所述域名信息是否与预设的搜索公司的域名信息对应,若是,则确定所述IP地址为合法IP地址,若否,则确定所述IP地址不为合法IP地址。
[0024]其中,所述根据所述IP地址,判断所述请求是否由搜索公司发出包括:
[0025]确定所述IP地址的归属地址;
[0026]判断所述归属地址与设定的搜索公司的所在地址是否对应;
[0027]若是,则确定所述请求由搜索公司发出;
[0028]若否,则确定所述请求不是由搜索公司发出。
[0029]其中,所述根据所述IP地址,判断所述请求是否由搜索公司发出包括:
[0030]判断所述IP地址是否为合法IP地址,所述合法IP地址为搜索公司对应的IP地址;
[0031]若否,则确定所述请求不是由搜索公司发出;
[0032]若是,确定所述IP地址的归属地址,并判断所述归属地址与设定的搜索公司的所在地址是否对应;
[0033]若所述归属地址与设定的搜索公司的所在地址相对应,则确定所述请求由搜索公司发出;
[0034]若所述归属地址与设定的搜索公司的所在地址不对应,则确定所述请求不是由搜索公司发出。
[0035]本发明实施例还提供一种网站服务器,包括:
[0036]请求获取模块,用于获取接入网站的请求;
[0037]标识判断模块,用于判断所述请求是否携带蜘蛛标识;
[0038]地址确定模块,用于若所述请求中携带蜘蛛标识,确定所述请求的IP地址;
[0039]判断模块,用于根据所述IP地址,判断所述请求是否由搜索公司发出;
[0040]第一结果确定模块,用于若所述请求由搜索公司发出,则确定所述请求为合法蜘蛛请求;
[0041]第二结果确定模块,用于若所述请求不是由搜索公司发出,则确定所述请求为伪造的蜘蛛请求。
[0042]其中,所述判断模块包括:
[0043]第一地址合法判断单元,用于判断所述IP地址是否为合法IP地址,所述合法IP地址为搜索公司对应的IP地址;
[0044]第一合法确定单元,用于若第一地址合法判断单元的判断结果为是,则确定所述请求由搜索公司发出;
[0045]第二合法确定单元,用于若第一地址合法判断单元的判断结果为否,则确定所述请求不是由搜索公司发出;
[0046]所述地址合法判断单元包括:
[0047]第一判断执行子单元,用于调取预设的合法IP地址,判断所述IP地址是否与预设的合法IP地址对应,若是,则确定所述IP地址为合法IP地址,若否,则确定所述IP地址不为合法IP地址;
[0048]或,第二判断执行子单元,用于确定所述IP地址对应的域名信息,判断所述域名信息是否与预设的搜索公司的域名信息对应,若是,则确定所述IP地址为合法IP地址,若否,则确定所述IP地址不为合法IP地址。
[0049]其中,所述判断模块包括:
[0050]第一归属地址判断单元,用于确定所述IP地址的归属地址,判断所述归属地址与设定的搜索公司的所在地址是否对应;
[0051]第一地址确定单元,用于若所述第一归属地址判断单元的判断结果为是,则确定所述请求由搜索公司发出;
[0052]第二地址确定单元,用于若所述第一归属地址判断单元的判断结果为否,则确定所述请求不是由搜索公司发出。
[0053]其中,所述判断模块包括:
[0054]第二地址合法判断单元,用于判断所述IP地址是否为合法IP地址,所述合法IP地址为搜索公司对应的IP地址;
[0055]第一确定单元,用于若所述第二地址合法判断单元的判断结果为否,则确定所述请求不是由搜索公司发出;
[0056]第二归属地址判断单元,用于若第二地址合法判断单元的判断结果为是,确定所述IP地址的归属地址,并判断所述归属地址与设定的搜索公司的所在地址是否对应;
[0057]第二确定单元,用于若所述第二归属地址判断单元的判断结果为是,则确定所述请求由搜索公司发出;
[0058]第三确定单元,用于若所述第二归属地址判断单元的判断结果为否,则确定所述请求不是由搜索公司发出。
[0059]基于上述技术方案,本发明实施例提供的识别请求的方法,包括:获取接入网站的请求;判断所述请求是否携带蜘蛛标识;若所述请求中携带蜘蛛标识,确定所述请求的IP地址;根据所述IP地址,判断所述请求是否由搜索公司发出;若所述请求由搜索公司发出,则确定所述请求为合法蜘蛛请求;若所述请求不是由搜索公司发出,则确定所述请求为伪造的蜘蛛请求。可以看出,本发明实施例通过蜘蛛标识,可从接入网站的请求中确定出请求的识别范围,即合法蜘蛛请求和伪造的蜘蛛请求;从而根据携带有蜘蛛标识的请求的IP地址,判断所述请求是否由搜索公司,当确定所述请求由搜索公司发出时,则确定所述请求为合法蜘蛛请求,当确定所述请求不是由搜索公司发出时,贝lJ确定所述请求为伪造的蜘蛛请求;进而实现从接入网站的请求中有效识别伪造的蜘蛛请求的目的,为后续屏蔽伪造的蜘蛛请求,保证网站信息的安全提供了可能。
【附图说明】
[0060]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0061]图
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1