元搜索引擎高频访问单个网站的方法及元搜索引擎与流程

文档序号:14657841发布日期:2018-06-12 07:34阅读:111来源:国知局

本发明实施例涉及互联网技术领域,尤其涉及一种元搜索引擎高频访问单个网站的方法及元搜索引擎。



背景技术:

元搜索引擎是为弥补传统搜索引擎的不足而出现的一种辅助搜索工具,有着传统搜索引擎所不具备的许多优势。在已有的独立搜索引擎的基础上建立一个高效的元搜索引擎能够扩展独立搜索引擎的处理能力,提高检索的查全率,并且有可能进一步提高查准率。但是各个成员搜索引擎的自治性引起了集成的困难,特别是各个搜索引擎自有的防止恶意访问的机制,使得元搜索工具在处理高并发请求时受到了一定的限制。其中,以Cookie为依据的封禁机制是网站设计者应对这种过度频繁访问的重要手段。

Cookie是用来记录用户短信息的一段文本信息。客户端开启一次会话时,会收到服务器发来的Cookie信息,浏览器将Cookie信息保存,下次访问时,用以标记访问信息。服务器也会依据Cookie判断该客户是否访问过于频繁,从而做出相应访问限制。而当元搜索引擎处理高并发请求时可能需要对某个网站做频繁的访问,此时元搜索引擎对该网站的访问容易被限制,从而导致元搜索服务质量的下降。



技术实现要素:

本发明实施例提供一种元搜索引擎高频访问单个网站的方法及元搜索引擎,用以解决网站对Cookie的封禁问题,提高元搜索对单个网站的访问频率。

本发明实施例第一方面提供一种元搜索引擎高频访问单个网站的方法,该方法包括:

根据用户输入的搜索信息,从本地存储的多个网站标识中获取至少一个目标网站的网站标识,所述目标网站包括所述搜索信息,所述本地存储的多个网站标识中的每个网站标识对应有一个Cookie集合,所述Cookie集合包括多个Cookie;

分别从每个目标网站对应的Cookie集合中确定出一个目标Cookie;

根据所述目标Cookie访问所述目标Cookie对应的网站。

本发明实施例第二方面提供一种元搜索引擎,该元搜索引擎,包括:

接收模块,用于接收用户的搜索信息;

第一获取模块,用于根据用户输入的搜索信息,从本地存储的多个网站标识中获取至少一个目标网站的网站标识,所述目标网站包括所述搜索信息,所述本地存储的多个网站标识中的每个网站标识对应有一个Cookie集合,所述Cookie集合包括多个Cookie;

第一确定模块,用于分别从每个目标网站对应的Cookie集合中确定出一个目标Cookie;

访问模块,用于根据所述目标Cookie访问所述目标Cookie对应的网站。

本发明实施例,通过将多个网站的网站标识与各网站标识各自对应的多个Cookie关联存储在本地存储区域中,当用户输入搜索信息时,从本地存储的多个网站的网站标识中获取至少一个目标网站的网站标识,再分别从每个目标网站对应的多个Cookie中确定出一个Cookie作为目标Cookie,从而根据目标Cookie实现对对应网站的访问。由于本发明实施例中本地存储的每个网站标识都对应有多个Cookie,且在访问网站时只需要根据多个Cookie中的一个进行访问即可,因此,在对同一网站进行多次访问时,可以根据不同的Cookie进行访问,而不会因为频繁的使用同一Cookie对同一网站进行访问,而造成Cookie被封禁的问题,能够提高元搜索对单个网站的访问频率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的元搜索引擎高频访问单个网站的方法的流程示意图;

图2为本发明一实施例提供的建立Cookie集合的方法的流程示意图;

图3为本发明一实施例提供的元搜索引擎的结构示意图;

图4为本发明又一实施例提供的元搜索引擎的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤的过程或结构的装置不必限于清楚地列出的那些结构或步骤而是可包括没有清楚地列出的或对于这些过程或装置固有的其它步骤或结构。

图1为本发明一实施例提供的网站访问方法的流程示意图,该方法可以由元搜索引擎来执行,如图1所示,该方法包括:

步骤S101、根据用户输入的搜索信息,从本地存储的多个网站标识中获取至少一个目标网站的网站标识,所述目标网站包括所述搜索信息,所述本地存储的多个网站标识中的每个网站标识对应有一个Cookie集合,所述Cookie集合包括多个Cookie。

本实施例中,元搜索引擎中存储有多个网站的网站标识,以及每个网站标识对应的Cookie集合,特别的,本实施例中每个Cookie集合中均包括多个Cookie,根据集合中的任一Cookie都能访问该集合对应的网站标识所对应的网站。

实际应用中,当用户通过诸如谷歌、百度等搜索引擎进行搜索操作时,与搜索引擎集成在一起的元搜索引擎获取用户的搜索信息(例如关键字、关键词等),并根据用户的搜索信息确定本地存储的包含该搜索信息的网站的网站标识。通常情况下,包含搜索信息的网站至少为一个。进一步的,在确定包含搜索信息的网站的网站标识后,元搜索引擎从其自身存储的网站标识与Cookie集合之间的对应关系中,确定出每个包含搜索信息的网站的网站标识对应的Cookie集合。

步骤S102、分别从每个目标网站对应的Cookie集合中确定出一个目标Cookie。

在一次访问中,只需要一个Cookie即可对相应网站进行访问。而本实施例中,每个网站对应的Cookie集合中包括多个Cookie,因此,在实际应用中需要从包含搜索信息的每个网站对应的Cookie集合中选择一个Cookie(即目标Cookie),以根据选择出的每个Cookie访问每个Cooke对应的网站。

实际应用中,为了降低Cookie被封禁的风险。优选的可以从包含搜索信息的每个网站对应的Cookie集合中,分别选择一个使用频率最低的Cookie作为目标Cookie。其中,每个Cookie的使用频率,可以以单位时间内的使用次数来计算,在这里不多做赘述。

特别的,本实施例中,也可以采用随机抽取的方式,分别从包含搜索信息的每个网站对应的Cookie集合中随机抽取一个Cookie。由于Cookie的抽取具有随机性,因此,也能够降低Cookie被封禁的概率。

步骤S103、根据所述目标Cookie访问所述目标Cookie对应的网站。

在实际应用中,由于步骤S102中确定的目标Cookie可能已经被封禁,此时,可能需要输入特定的验证码才能完成对网站的访问。这种情况时,元搜索引擎先根据该目标Cookie从对应的网站上获取验证码的输入提示,并将该验证码的输入提示转发给用户以使用户根据提示输入验证码,再将用户输入的验证码返回给该网站,以达到解封Cooke和访问网站的目的。

另外,在本实施例中,当目标Cookie未被封禁时,根据目标Cookie访问网站的方法与现有技术类似,在这里不再赘述。

本实施例,通过将多个网站的网站标识与各网站标识各自对应的多个Cookie关联存储在本地存储区域中,当用户输入搜索信息时,从本地存储的多个网站的网站标识中获取至少一个目标网站的网站标识,再分别从每个目标网站对应的多个Cookie中确定出一个Cookie作为目标Cookie,从而根据目标Cookie实现对对应网站的访问。由于本实施例中本地存储的每个网站标识都对应有多个Cookie,且在访问网站时只需要根据多个Cookie中的一个进行访问即可,因此,在对同一网站进行多次访问时,可以根据不同的Cookie进行访问,而不会因为频繁的使用同一Cookie对同一网站进行访问,而造成Cookie被封禁的问题,能够提高元搜索对单个网站的访问频率。

图2为本发明一实施例提供的建立Cookie集合的方法的流程示意图,如图2所示,在图1所示实施例的基础上,本实施例提供的方法包括:

步骤S201、从多个网站上周期性获取Cookie,所述多个网站包括本地存储的每个网站标识对应的网站。

本实施例中,获取Cookie的周期可以根据具体的需要具体设定,在这里不做限定。另外,本实施例中所称的网站包括本地已存储的网站标识对应的网站,即周期性的从当前已存储的网站标识对应的网站上获取新的Cookie。在这里需要说明的是,当获取到当前已存储的网站标识对应的网站的Cookie时,可从该网站对应的集合中删除相应的Cookie,以使集合中的Cookie总数保持恒定。其中删除的规则可以是根据集合中每个cookie的获取时间,从获取时间最早的cookie开始依次删除。当然此处仅为示例说明并不是对本发明的唯一限定,比如,也可以采用随机删除的方式从集合中删除相应数量的cookie以保持集合中Cookie数量的恒定。

特别的,本实施例中所称的网站还可以包括本地未存储的网站标识对应的网站。即在周期性获取Cooke的操作中,也包括对新的网站的Cookie的获取。

具体的,在执行步骤S201时,可以通过周期性登录多个网站的方式,使得多个网站中的每个网站均下发相应的Cookie。此与现有技术相同在这里不再赘述。进一步的,为了确保网站下发的Cookie有效可用,在获得网站下发的Cookie后,还要根据接收到的Cookie回访该网站,其中,若访问失败,则说明网站下发的Cookie无效不可用。此时需要将无效的Cookie删除。而若访问成功,则说明网站下发的Cookie有效可用。由于在实际情况中会出现网站下发的Cookie缺少字段的情况,而在这种情况时,根据该Cookie进行回访的结果中通常会携带有设置该Cookie的字段,将该字段添加到该Cookie中即可获得完整的Cookie。因此,本实施例在验证Cookie有效可用之后,还需要对每个有效Cookie对应的访问结果进行判断,当某一有效Cookie的访问结果中存在设置Cookie的字段,则将该字段添加到该Cookie中,并存储补全后的Cookie,而当访问结果中不存在设置Cookie的字段时,则直接存储相应的有效Cookie。

步骤S202、根据获取到的Cookie,建立所述多个网站中每个网站的Cookie集合。

举例来说,假设当前本地存储有网站标识a和对应的Cookie集合A。而当前周期登录的网站中包括网站标识a所对应的网站,则将该网站下发的Cookie添加到Cooke集合A中。优选的,若Cookie集合A中的Cookie数超过预设数量,则从Cookie集合A删除相应个数的Cookie,以使Cookie集合A的数量维持恒定。

而当当前周期登录的网站中不包括已存储的网站标识所对应的网站时,则新建一个与该网站对应的Cookie集合,并将本次获取到的Cookie添加到该Cooke集合中。

当然此处仅为示例说明并不是对本发明的唯一限定。

本实施例,通过将多个网站的网站标识与各网站标识各自对应的多个Cookie关联存储在本地存储区域中,当用户输入搜索信息时,从本地存储的多个网站的网站标识中获取至少一个目标网站的网站标识,再分别从每个目标网站对应的多个Cookie中确定出一个Cookie作为目标Cookie,从而根据目标Cookie实现对对应网站的访问。由于本实施例中本地存储的每个网站标识都对应有多个Cookie,且在访问网站时只需要根据多个Cookie中的一个进行访问即可,因此,在对同一网站进行多次访问时,可以根据不同的Cookie进行访问,而不会因为频繁的使用同一Cookie对同一网站进行访问,而造成Cookie被封禁的问题,能够提高元搜索对单个网站的访问频率。

图3为本发明一实施例提供的元搜索引擎的结构示意图,如图3所示,该元搜索引擎包括:

第一获取模块11,用于根据用户输入的搜索信息,从本地存储的多个网站标识中获取至少一个目标网站的网站标识,所述目标网站包括所述搜索信息,所述本地存储的多个网站标识中的每个网站标识对应有一个Cookie集合,所述Cookie集合包括多个Cookie;

第一确定模块12,用于分别从每个目标网站对应的Cookie集合中确定出一个目标Cookie;

访问模块13,用于根据所述目标Cookie访问所述目标Cookie对应的网站。

其中,所述第一确定模块12,具体用于:

分别从每个目标网站对应的Cookie集合中确定出一个使用频率最低的Cookie作为目标Cookie。

本实施例提供的元搜索引擎适用于图1所示的方法,其执行方式和有益效果类似,在这里不再赘述。

图4为本发明又一实施例提供的元搜索引擎的结构示意图,如图4所示,在图3所示实施例的基础上,该元搜索引擎还可以包括:

第二获取模块14,用于从多个网站上周期性获取Cookie,所述多个网站包括本地存储的每个网站标识对应的网站;

管理模块15,用于根据获取到的Cookie,建立所述多个网站中每个网站的Cookie集合。

其中,所述第二获取模块14,包括:

登录子模块141,用于周期性的登录多个网站,并接收所述多个网站中每个网站下发的Cookie;

第一确定子模块142,用于根据每个网站下发的Cookie访问对应的每个网站,确定每个网站下发的Cookie是否有效;若无效,则删除无效的Cookie;

第二确定子模块143,用于当登录网站的Cookie有效时,确定有效Cookie对应的访问结果中是否包括设置所述有效Cookie的字段,若不包括,则保存所述有效Cookie;

若包括,则将所述字段添加到所述有效Cookie中,并保存修改后的有效Cookie。

本实施例提供的元搜索引擎适用于图2所示的方法,其执行方式和有益效果类似,在这里不再赘述。

最后需要说明的是,本领域普通技术人员可以理解上述实施例方法中的全部或者部分流程,是可以通过计算机程序来指令相关的硬件完成,所述的程序可存储于一计算机可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可以为磁盘、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。

本发明实施例中的各个功能单元可以集成在一个处理模块中,也可以是各个单元单独的物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现,并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。上述提到的存储介质可以是只读存储器、磁盘或光盘等。

以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1