基于组合式网络爬虫防御技术的页面显示方法、装置和电子设备与流程

文档序号:20917278发布日期:2020-05-29 13:41阅读:来源:国知局

技术特征:

1.一种基于组合式网络爬虫防御技术的页面显示方法,其特征在于,包括:

建立网络地址黑名单池,并构建请求识别规则;

网站服务器获取用户通过客户端浏览器提出访问请求信息;

所述网站服务器基于所述访问请求信息利用所述网络地址黑名单池及所述请求识别规则对所述用户进行网络爬虫初步筛选;

所述网站服务器根据初步筛选通过的用户的访问请求信息生成页面内容,且使用加密规则对所述页面内容中待加密内容进行加密,并依据所述加密规则构建解密规则插入至所述页面内容中;

所述用户的客户端浏览器从所述网站服务器获取加密后的页面内容及解密规则,依据所述解密规则对所述页面内容进行解密并根据所述页面内容渲染生成页面进行显示。

2.根据权利要求1所述的方法,其特征在于,所述访问请求信息包括:所述用户网络地址信息、所述用户访问请求内容信息及所述用户访问请求命令。

3.根据权利要求1-2所述的方法,其特征在于,所述构建识别规则步骤包括:

构建访问请求命令类型排除池;

获取访问请求命令类型;

比较所述访问请求命令类型是否与所述访问请求命令类型排除池;

将比较结果为一致的用户识别为网络爬虫。

4.根据权利要求1-3所述的方法,其特征在于,所述网站服务器基于所述访问请求信息利用所述网络地址黑名单池及所述请求识别规则对所述用户进行网络爬虫初步筛选步骤进一步包括:

所述网站服务器获取所述用户的访问请求信息中所述用户网络地址信息及访问请求命令;

比较所述用户的网络地址信息是否在所述网络地址黑名单池中,以及使用所述请求识别规则识别所述用户请求;

将符合所述网络地址黑名单池和/或所述请求识别规则的用户识别为网络爬虫予以排除。

5.根据权利要求1-4所述的方法,其特征在于:

所述加密规则包括一种加密算法或多种加密算法的组合,其中所述多种加密算法的组合包括使用相同或不同的加密算法对所述待加密内容进行多重加密,在先加密后生成的内容作为在后加密算法的加密对象。

6.根据权利要求1-5中任一项所述的方法,其特征在于,所述网站服务器根据加密规则对页面内容中待加密内容进行加密后进一步包括:批量抓取工具抓取所述页面内容为加密后数据。

7.根据权利要求1-6所述的方法,其特征在于,所述解密规则进一步包括:对应于所述加密规则中所述加密算法或所述加密算法组合的解密算法或解密算法的组合。

8.一种基于组合式网络爬虫防御技术的页面显示装置,其特征在于,包括:

网络爬虫初步筛选模块,其构建于网站服务器上,包括网络地址黑名单池单元和访问请求识别规则单元,用于对用户进行网络爬虫初步筛查;

内容提供模块,位于所述网站服务器上,用于根据用户请求提供网页内容;

加密解密模块,位于所述网站服务器上,用于对所述网页内容中待加密内容通过加密规则进行加密,并依据所述加密规则构建解密规则插入至网页内容中;

网页浏览器,位于客户端,用于向所述网站服务器提出访问请求信息并获取所述网站服务器提供的加密后的网页内容及解密规则,依据所述解密规则对所述加密后的网页内容进行解密并根据解密后的页面内容渲染生成页面进行显示。

9.一种电子设备,其中,该电子设备包括:

处理器;以及,

存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-7中任一项所述的方法。


技术总结
本发明公开了一种基基于组合式网络爬虫防御技术的页面显示方法、装置和电子设备,包括:建立网络地址黑名单池,构建请求识别规则;网站服务器获取用户通过客户端浏览器提出访问请求信息;网站服务器对用户进行网络爬虫初步筛选;生成页面内容,且使用加密规则对页面内容中待加密内容进行加密,并依据加密规则构建解密规则插入至页面内容中;用户的客户端浏览器从网站服务器获取加密后的页面内容及解密规则,依据解密规则对页面内容进行解密并根据页面内容渲染生成页面进行显示。本方法通过多角度多层次,主动被动相结合的防御措施,提高对恶意抓取网页内容的网络爬虫的识别,从而保障用户隐私和对网站的正常使用。

技术研发人员:海启龙;苏绥绥;常富洋
受保护的技术使用者:北京淇瑀信息科技有限公司
技术研发日:2019.12.16
技术公布日:2020.05.29
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1