网页文字的加密显示方法和装置制造方法

文档序号:6545836阅读:168来源:国知局
网页文字的加密显示方法和装置制造方法
【专利摘要】本发明公开了一种网页文字的加密显示方法和装置。所述网页文字的加密显示方法包括:将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系;根据所述调整的关系,将调整后的网页源内容在网页中进行还原显示。本发明实施例提供的网页文字的加密显示方法和装置能够通过简单的技术手段防止网页文字内容被非法抓取,增强了网页文字内容的安全性。
【专利说明】网页文字的加密显示方法和装置
【技术领域】
[0001 ] 本发明实施例涉及计算机应用技术,尤其涉及一种网页文字的加密显示方法和装置。
【背景技术】
[0002]在互联网的使用十分盛行的今天,各种网络爬虫(Web crawler)和网络刮削器(Web scraper)的活动也十分猖獗。网络爬虫和网络刮削器通过非授权的读取目标网站的网页内容来获知竞争对手的关键信息。因此,防止网络爬虫和网络刮削器对网站内容的非法读取对保护企业的商业秘密十分必要。
[0003]现有的防范网络爬虫和网络刮削器的手段一般通过IP地址过滤和防爬虫策略来实现。这些防范措施的实现过程都较为复杂,而网络爬虫或者网络刮削器则可以通过简单的改变访问策略而轻易的避开这些防范措施。

【发明内容】

[0004]有鉴于此,本发明实施例提出一种网页文字的加密显示方法和装置,以增强网页文字内容的安全性,防止网页文字内容被轻易的抓取。
[0005]第一方面,本发明实施例提供了一种网页文字的加密显示方法,所述方法包括:
[0006]将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系;
[0007]根据所述调整的关系,将调整后的网页源内容在网页中进行还原显示。
[0008]第二方面,本发明实施例提供了 一种网页文字的加密显示装置,所述装置包括:
[0009]内容调整模块,用于将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系;
[0010]还原显示模块,用于根据所述调整的关系,将调整后的网页源内容在网页中进行还原显示。
[0011]本发明实施例提供的网页文字的加密显示方法和装置,通过将网页文字切分和置舌L并在切分和置乱后设置相对应的CSS选择器,使得网络爬虫或者刮削器即使抓取了网页文字内容页难以从中获取真实的信息,提高了网页文字内容的安全性,有效防止了网页文字内容被非法抓取。
【专利附图】

【附图说明】
[0012]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0013]图1是本发明第一实施例提供的网页文字的加密显示方法的流程图;
[0014]图2是本发明第二实施例提供的网页文字的加密显示方法中内容调整的流程图;
[0015]图3是本发明第二实施例提供的网页文字的加密显示方法中子串切分的流程图;[0016]图4是本发明第三实施例提供的网页文字的加密显示方法中内容调整的流程图;
[0017]图5是本发明第三实施例提供的网页文字的加密显示方法中扰码添加的流程图;
[0018]图6是本发明第三实施例提供的层叠显示的原理示意图;
[0019]图7是本发明第三实施例提供的网页文字的加密显示方法中干扰字添加的流程图;
[0020]图8是本发明第四实施例提供的网页文字的加密显示方法中内容调整的流程图;
[0021]图9是本发明第五实施例提供的网页文字的加密显示装置的结构图。
【具体实施方式】
[0022]下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
[0023]第一实施例
[0024]图1是本发明第一实施例提供的网页文字的加密显示方法的流程图。本实施例的方法可以由网页文字的加密显示装置来实现,该装置通常可配置在诸如搜索服务器或网页编辑服务器中,对待发布的网页内容进行处理。参见图1,所述网页文字的加密显示方法包括:
[0025]S110,将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系。
[0026]网页数据一般包括文字、链接地址和图片等,在网页的脚本文件中,文字、链接地址和图片的资源地址通常是以字符串形式记录的,所以可采用相同手段处理。由于链接地址和图片并不容易被抓取,所以本实施例优选是对文字形式的内容进行加密。优选的,以行为单位,对待加密的网页文字进行处理。
[0027]对所述待加密的网页数据的调整可以是调整所述待加密的网页数据中包含的字符子串的前后位置关系,也就是将字符子串置乱,也可以是在在所述待加密的网页数据中添加扰码。调整形式可以有多种,能满足使调整后的内容失去原有表达语义即可。
[0028]在完成了对所述待加密的网页数据的内容调整后,需要对所述调整的关系进行记录。优选的,可以通过层叠样式表(Cascading style sheet, CSS)选择器对所述调整的关系进行记录。
[0029]S120,根据所述调整的关系,将调整后的网页源内容在网页中进行还原显示。
[0030]由于在对待加密的网页数据进行内容调整后对所述调整的关系进行了记录,所以在对内容进行调整之后,可以根据所记录的调整的关系,将调整后的网页源内容在网页中进行还原显示。优选的,可以根据在CSS选择器中记录的调整的关系,将调整后的网页源内容在网页中进行还原显示。
[0031]本实施例通过将待加密的网页数据进行内容调整,将调整后的网页数据存储在网页源内容中,记录所述调整的关系,以及将调整后的网页源内容在网页中进行还原显示,实现的对网页文字的加密显示,不仅使得网页内容能够正常的显示,而且使得网络爬虫或者刮削器从网页源内容中即使抓取了网页文字内容也难以从中获取真实的信息,提高了网页文字内容的安全性,有效防止了网页文字内容被非法抓取。[0032]第二实施例
[0033]图2是本发明第二实施例提供的网页文字的加密显示方法中内容调整的流程图。所述网页文字的加密显示方法以本发明的第一实施例为基础,进一步的,将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系包括:将网页源内容中待加密的网页字符串切分为至少两个字符子串;在所述网页源内容中,调整所述至少两个字符子串的位置关系;将所述字符子串的切分关系,以及将调整的字符子串位置关系作为所述调整的关系进行记录。
[0034]参见图2,将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系包括:
[0035]S111,将网页源内容中待加密的网页字符串切分为至少两个字符子串。
[0036]对待加密的网页数据进行的内容调整是以字符子串为单元进行的,因此,在对待加密的网页数据进行内容调整时必须将网页源内容中待加密的网页字符串进行切分。每个字符子串至少包含一个字符。
[0037]对所述待加密的网页字符串的切分可以是随机的,也可以是按照预定的函数关系进行的切分。
[0038]示例的,所述网页源内容如下:
[0039]<html>
[0040]〈body〉
[0041]
新疆同时决定,今后在天山一号冰川保护区域内不得再设置探矿权、釆矿权,到期的矿业权不予延续,现有矿点不得扩建,用3到5年时间关停保护区域内所有矿点,并停止一切以天山一号冰川为目的地的旅游、探险等活动。〈/P〉
[0042]〈/body〉
[0043]</html>。
[0044]那么,对待加密的网页文字进行切分后的文字可以是:
[0045]<html>
[0046]〈body〉
[0047]
[0048]〈span〉新疆同〈/span><span> 时决定,今〈/spanXspan〉后在天山〈/spanXspan〉一号冰〈/spanXspan)川保护区〈/spanXspan)域内不得再设〈/spanXspan)置探矿权、釆矿〈/spanXspan〉权,到期的矿业〈/spanXspan〉权不予延续〈/spanXspan〉,现有〈/spanXspan〉矿点不〈/spanXspan〉得扩建,用3到5年时〈/spanXspan〉间关停保护〈/spanXspan〉区域内所有〈/spanXspan〉矿点,并停止〈/spanXspan〉一切以天〈/spanXspan)山一号冰川为〈/spanXspan〉目的地的旅游、探〈/spanXspan〉险等活动。〈/span>
[0049]</p>
[0050]〈/body〉
[0051]</html>0
[0052]S112,在所述网页源内容中,调整所述至少两个字符子串的位置关系。
[0053]在本实施例中,对所述待加密的网页数据的调整是指调整所述待加密的网页数据中包含的字符子串的位置关系。
[0054]具体的,对所述至少两个字符子串的位置调整可以是完全随机的。例如,实时产生一组随机数,并依照该组随机数的取值确定每一个字符子串调整后的位置。对所述至少两个字符子串的位置调整也可以是依照预定的函数关系的调整,即根据预定的函数关系确定调整后的每个字符子串的位置。
[0055]以本实施例中给出的网页源内容的数据为例,对上述网页源内容进行位置调整后的网页数据可以是:
[0056]<html>
[0057]〈body〉
[0058]
[0059]<sl>权不予延续</sl>〈s2> —切以天</s2Xs3>新疆同</s3Xs4>川保护区〈/s4Xs5>后在天山</s5>〈s6>—号冰</s6>〈s7>时决定,今</s7>〈s8>置探矿权、采矿〈/s8>〈s9>域内不得再设</s9XslO>权,到期的矿业〈/slOXsll〉,现有</sll>〈sl2>矿点不</sl2Xsl3>区域内所有</sl3Xsl4>得扩建,用3到5年时</sl4Xsl5>间关停保护</sl5Xsl6>矿点,并停止</sl6Xsl7>险等活动。</sl7Xsl8>目的地的旅游、探</sl8Xsl9>山一号冰川为</sl9>
[0060]</p>
[0061]〈/body〉
[0062]</html>。
[0063]S113,将所述字符子串的切分关系,以及将调整的字符子串位置关系作为所述调整的关系进行记录。
[0064]为了能够在将待加密的网页数据进行加密处理后,仍然能够对所述待加密的网页数据进行显示,需要将所述字符子串的切分关系,以及将调整的字符子串位置关系作为所述调整的关系进行记录。
[0065]优选的,可以利用CSS选择器对上述字符子串的切分关系,以及将调整的字符子串位置关系作为所述调整的关系进行记录。
[0066]示例的,所述CSS选择器的代码如下:
[0067]
【权利要求】
1.一种网页的加密显示方法,其特征在于,包括: 将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系; 根据所述调整的关系,将调整后的网页源内容在网页中进行还原显示。
2.根据权利要求1所述的方法,其特征在于,将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系包括: 将网页源内容中待加密的网页字符串切分为至少两个字符子串; 在所述网页源内容中,调整所述至少两个字符子串的位置关系,和/或,为所述字符子串添加扰码,且为添加有扰码的所述字符子串配置层叠关系; 将所述字符子串的切分关系,以及将调整的字符子串位置关系,和/或,配置的字符子串层叠关系作为所述调整的关系进行记录。
3.根据权利要求2所述的方法,其特征在于,将所述字符子串的切分关系,以及将调整的字符子串位置关系,和/或,配置的字符子串层叠关系作为所述调整的关系进行记录包括: 采用层叠样式表CSS选择器记录字符子串切分长度,以及记录调整的字符子串位置关系,和/或,配置的字符子串层叠关系。
4.根据权利要求2所述的方法,其特征在于,将网页源内容中待加密的网页字符串切分为至少两个字符子串包括: 按照预定方式产生切分子串长度数组,其中,所述切分子串长度数组中的数值的和大于所述待加密的网页字符串的长度; 将所述切分子串长度数组中的数值作为切分后字符子串的长度,对所述待加密的网页字符串进行切分。
5.根据权利要求2所述的方法,其特征在于,为所述字符子串添加扰码,且为添加有扰码的所述字符子串配置层叠关系包括: 在所述字符子串的首部和/或尾部添加干扰字,作为所述扰码; 将添加有扰码的所述字符子串配置为部分覆盖在相邻字符子串的下层,以使所述相邻字符子串覆盖所述扰码,且露出所述字符子串。
6.根据权利要求5所述的方法,其特征在于,在所述字符子串的首部和/或尾部添加干扰字包括: 从所述至少两个字符子串中选择切分点,作为目标切分点; 在所述目标切分点的前向字符子串的尾部或后向字符子串的首部添加所述干扰字。
7.—种网页文字的加密显示装置,其特征在于,包括: 内容调整模块,用于将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系; 还原显示模块,用于根据所述调整的关系,将调整后的网页源内容在网页中进行还原显不O
8.根据权利要求7所述的装置,其特征在于,所述内容调整模块包括: 子串切分单元,用于将网页源内容中待加密的网页字符串切分为至少两个字符子串; 关系调整单元,用于在所述网页源内容中,调整所述至少两个字符子串的位置关系,和/或,为所述字符子串添加扰码,且为添加有扰码的所述字符子串配置层叠关系; 调整记录单元,用于将所述字符子串的切分关系,以及将调整的字符子串位置关系,和/或,配置的字符子串层叠关系作为所述调整的关系进行记录。
9.根据权利要求8所述的装置,其特征在于,所述调整记录单元具体用于: 采用层叠样式表CSS选择器记录字符子串切分长度,以及记录调整的字符子串位置关系,和/或,配置的字符子串层叠关系。
10.根据权利要求8所述的装置,其特征在于,所述子串切分单元具体用于: 按照预定方式产生切分子串长度数组,其中,所述切分子串长度数组中的数值的和大于所述待加密的网页字符串的长度; 将所述切分子串长度数组中的数值作为切分后字符子串的长度,对所述待加密的网页字符串进行切分。
11.根据权利要求8所述的装置,其特征在于,所述关系调整单元为所述字符子串添加扰码,且为添加有扰码的所述字符子串配置层叠关系包括: 在所述字符子串的首部和/或尾部添加干扰字,作为所述扰码; 将添加有扰码的所述字符子串配置为部分覆盖在相邻字符子串的下层,以使所述相邻字符子串覆盖所述扰码,且露出所述字符子串。
12.根据权利要求11所述的装置,其特征在于,所述关系调整单元在所述字符子串的首部和/或尾部添加干扰字包括: 从所述至少两个字符子串中选择切分点,作为目标切分点; 在所述目标切分点的前向字符子串的尾部或后向字符子串的首部添加所述干扰字。
【文档编号】G06F3/041GK103955632SQ201410191034
【公开日】2014年7月30日 申请日期:2014年5月7日 优先权日:2014年5月7日
【发明者】韩利豪, 逯鹏宇 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1