一种网页数据的加密方法与流程

文档序号:11545479阅读:586来源:国知局
一种网页数据的加密方法与流程

本发明涉及数据加密技术领域,尤其涉及一种网页数据的加密方法。



背景技术:

随着互联网的迅猛发展,网页信息的数量呈现出爆发式增长。在数以亿计的网页中,沉淀出许多有价值的信息数据。

在互联网这个开放的平台中,有价值的数据可以通过搜索引擎和网络爬虫等技术而被有效提取,但同时也面临着被采集的风险。对于一些具有版权或具隐私性的数据来说,未经允许的采集属非法行为,或涉及不正当的商业竞争。

基于这种对自有信息的防采集诉求,很多网站加强了网页构造的复杂化和对数据的加密程度,比如增加验证码,屏蔽和限制ip访问等。但是这些较为普通的防采集机制很快就可能会被破解,所以网页数据的防采集不得不整合出更加有效的应对方法。

在众多方法中,将字符信息转化为图片形式展示的方法能够应对一些网络爬虫的解析,但是却无法避免利用识别工具对图片进行识别从而转化为文字或字符的高级破解情况。



技术实现要素:

有鉴于此,本发明要解决的技术问题是提供一种网页数据的加密方法,能够防止识别工具对图片形式的数据的破解。

本发明的技术方案是这样实现的:

一种网页数据的加密方法,包括:

将待处理的字符数据分割为字符块,为字符块匹配包括字符块的字典数据库,生成由字典数据库中字典字符块随机分布的二维矩阵图片,并记录字符块在二维矩阵图片中的坐标位置;

根据二维矩阵图片和坐标位置,在网页中显示字符块组成的图片。

优选的,还包括:

设置包括不同类型的字典字符块的字典数据库;

为字符块匹配包括字符块的字典数据库包括:判断字符块类型,根据字符块类型为字符块匹配包括字符块的字典数据库。

优选的,还包括:

生成二维矩阵图片的调用地址,对调用地址进行加密设置,对二维矩阵图片和调用地址进行过期失效设置。

优选的,还包括:

设置字典白名单;

字符块存在于字典白名单时,生成基于二维矩阵图片的cssclass文件(cascadingstylesheetsclass,层叠样式表类文件),并生成cssclass文件的调用地址。

优选的,根据二维矩阵图片的调用地址获取二维矩阵图片,根据坐标位置或cssclass文件的位置信息在网页中显示字符块组成的图片。

优选的,在将待处理的字符数据分割为字符块之后,还包括:

根据网页的显示需要,为字符块匹配适应的格式。

本发明提出的网页数据的加密方法,通过将待处理的字符数据分割成字符块,并为字符块匹配包括字符块的字典数据库,将字典数据库中字典字符块随机生成图片,从而生成的图片为字典字符块无序组成,解析的规律性很低,从而识别工具无法破解图片形式的数据。

附图说明

图1为本发明实施例提出的网页数据的加密方法的流程图;

图2为本发明另一个实施例提出的网页数据的加密方法的流程图;

图3为二维矩阵图;

图4为cssclass位置信息图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明实施例提出了一种网页数据的加密方法,包括以下步骤:

步骤101:将待处理的字符数据分割为字符块,为字符块匹配包括字符块的字典数据库,生成由字典数据库中字典字符块随机分布的二维矩阵图片,并记录字符块在二维矩阵图片中的坐标位置;

步骤102:根据二维矩阵图片和坐标位置,在网页中显示字符块组成的图片。

可见,本发明实施例提出的网页数据的加密方法,通过将待处理的字符数据分割成字符块,并为字符块匹配包括字符块的字典数据库,将字典数据库中字典字符块随机生成图片,从而生成的图片为字典字符块无序组成,解析的规律性很低,从而识别工具无法破解图片形式的数据。

在本发明的一个优选实施例中,在步骤101之前,还包括:

设置包括不同类型的字典字符块的字典数据库;

为字符块匹配包括字符块的字典数据库:判断字符块类型,根据字符块类型为字符块匹配包括字符块的字典数据库。

在本发明的一个优选实施例中,在步骤101之后,还包括:

生成二维矩阵图片的调用地址,对调用地址进行加密设置,对二维矩阵图片和调用地址进行过期失效设置。

在本实施例中,通过加密设置和过期失效设置,降低页面被采集的可能性。

在本发明的一个优选实施例中,在步骤101之前,还包括:

设置字典白名单;

字符块存在于字典白名单时,生成基于二维矩阵图片的cssclass文件,并生成cssclass文件的调用地址。

步骤102包括:

根据二维矩阵图片的调用地址获取二维矩阵图片,根据坐标位置或cssclass文件的位置信息在网页中显示字符块组成的图片。

通过对存在于字典白名单的字典字符块生成基于二维矩阵图片的cssclass文件,浏览器可以随机根据坐标位置或cssclass文件的位置信息在网页中显示字符块组成的图片,从而增加了采集的难度。

在本发明的一个优选实施例中,在将待处理的字符数据分割为字符块之后,还包括:

根据网页的显示需要,为字符块匹配适应的格式。

如图2所示,在本发明另一实施例提出了一种网页数据的加密方法,包括以下步骤:

步骤201:设置不同类型的字典字符块的字典数据库和字典白名单。

详细的,字符块可以有多种字符类型,比如文字、字母、数字和符号等类型。可以设置包括52个大小写字母的字母字典字符块及包括0-9的十个数字的数字字典字符块。

同时,可以选取部分字符设置为字典白名单。

步骤202:将待处理的字符数据分割为字符块,根据网页的显示需要,为字符块匹配适应的格式。

为使页面请求时不因过多的图片缓存而影响响应速度,可以选择一些关键性的信息作为待处理数据。

在进行待处理的字符数据分割时,可以对字符进行矩形分割。举例来说,需要处理的字符数据内容是一个邮箱地址:dzz*h*@1**.com,可以根据页面的展示需求,将每一个字符等宽分割为width:8px(pixel,像素);height:16px的字符块。

同时为了满足网页的显示需求,可以生成适应的文字字体、样式、颜色、字号、背景色,行高。

步骤203:为字符块匹配包括字符块的字典数据库,生成由字典数据库中字典字符块随机分布的二维矩阵图片。

详细的,邮箱地址所包含的信息有英文、数字和符号,所以为之匹配52个大小写英文字母、10个数字、及7个常用符号的字典字符块。

字典字符块随机分布填充为二维矩阵图片的行,为使纵坐标具有可变性,可以如图3所示随机配置10行。那么二维矩阵图片的大小即为width:552px;height:160px。

其中,二维矩阵图片中,字典字符块在每一行中的分布位置是随机的,行数也是可以随机设置的,借此确保坐标位置的横纵双向随机性以提高加密效果。

另外,当多个字典数据库包括字符块时,可以选择字典数据块数量最少的一个字典数据库进行匹配。

步骤204:记录字符块在二维矩阵图片中的坐标位置,生成二维矩阵图片的调用地址,对调用地址进行加密设置,对二维矩阵图片和调用地址进行过期失效设置;字符块存在于字典白名单时,同时生成基于二维矩阵图片的cssclass文件,并生成cssclass文件的调用地址。

详细的,保存二维矩阵图片后,记录字符块对应的字典字符块在二维矩阵图片中的坐标位置;当字符块存在于字典白名单时,生成并记录基于二维矩阵图片的cssclass文件。

一个网页请求可能会包含多个需要处理的字符块,为了节省服务器资源和加快浏览器的渲染速度,在同一个网页请求中处理的字符块将共用同一个二维矩阵图片,同一个cssclass文件。

调用地址可以使用aes(一种高级的区块加密标准)对称加密,密钥长度64位,且二维矩阵图片与调用地址均过期失效。

举例来说,存在于白名单的字符块不仅具备如background-position:-160px-16px的坐标描述,还具备了形式如map-a1f35f172fffd0afe63a8b1dda53d5c6的cssclass位置信息,从而不仅能够以位置坐标描述找到字符块,还可以通过cssclass位置信息找到对应的字符块,再次降低字符块拾取的规律性。

步骤205:根据二维矩阵图片的调用地址获取二维矩阵图片,根据坐标位置或cssclass文件的位置信息在网页中显示字典字符块组成的图片。

浏览器根据调用地址获取二维矩阵图片后,根据坐标位置或cssclass文件的位置信息在网页中显示字典字符块组成的图片。其中,以坐标位置呈现还是cssclass位置信息呈现是随机的。

以一次浏览器访问为例,字符块d随机显示为图4所示的cssclass位置信息,依次往下,字符块z显示的位置为width:-16px;height:-64px。最后,字符块m显示的位置为:width:-264px;height:-64px。

最终网页的浏览器呈现的就是图片化展示的信息,而服务器端返回的文件就呈现出无理论规律的加密状态,大大降低页面被采集的可能性。

综上所述,本发明实施例至少可以实现如下效果:

在本发明实施例中,通过将待处理的字符数据分割成字符块,并为字符块匹配包括字符块的字典数据库,将字典数据库中字典字符块随机生成图片,从而生成的图片为字典字符块无序组成,解析的规律性很低,从而识别工具无法破解图片形式的数据。

在本发明实施例中,通过加密设置和过期失效设置,降低页面被采集的可能性。

在本发明实施例中,通过生成基于二维矩阵图片的cssclass文件,浏览器可以随机根据坐标位置或cssclass文件的位置信息在网页中显示字符块组成的图片,从而增加了工具识别和采集的难度。

在本发明实施例中,二维矩阵图片中,字符块和在每一行中的分布位置是随机的,行数也是可以随机设置的,从而可以确保坐标位置的横纵双向随机性以提高加密效果。

在本发明实施例中,在同一个网页请求中处理的字符块共用同一个二维矩阵图片,同一个cssclass文件,从而节省服务器资源,加快浏览器的渲染速度。

在本发明实施例中,采用随机加混合的策略,而不是非同步的多图片下载缓存,从而可以不影响网页的读取速度。

最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1