网页数据加载方法、系统及装置制造方法

文档序号:7982802阅读:198来源:国知局
网页数据加载方法、系统及装置制造方法
【专利摘要】本发明公开了一种网页数据加载方法、系统及装置,该方法包括:获取客户端发送的用户请求的目标网页的地址信息,根据所述目标网页的地址信息获取目标网页的内容数据;将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据;将所述内容差异数据提供给客户端,以便客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。该方法能够减少网页数据的传输量,提高网页的加载速度。
【专利说明】网页数据加载方法、系统及装置
【技术领域】
[0001]本发明属于网络【技术领域】,尤其涉及一种网页数据加载方法、系统及装置。
【背景技术】
[0002]随着互联网技术的发展和应用的普及,互联网已经成为巨大的资讯平台、沟通平台、交易平台,在日常工作、生活中发挥不可或缺的作用,利用浏览器软件上网浏览网页内容成了日常生活不可或缺的一部分。
[0003]浏览器主要通过超文本传输协议(Hyper Text Transfer ProtocoI,HTTP)协议与网页服务器交互并获取网页数据,一个完整的网页数据通常由多个资源文件构成,包括超文本标记语言(Hypertext Markup Language, HTML)文件、图像文件、javascript 文件、CSS文件等等,所有的资源文件都分别由统一资源定位符(Universal Resource Locator, URL)指定。
[0004]目前,网页的发展趋势是越来越复杂,当网页要表述的内容过多时,通常采用将要表述的内容分成若干个网页的方式,将网页内容分开进行展示,这些分成的若干网页由不同的URL指定。由于HTTP协议是无状态协议,浏览器根据不同URL获取其网页数据是个独立的过程,因此,对于分成的若干网页,不论其内容差别大小,浏览器在加载每个网页时都需要分别获取每个网页的全部数据,加载该网页的完整的网页数据才能实现网页的正常显示,这就导致在将复杂的网页内容划分为若干网页进行展示时,浏览器的加载速度慢,耗费的数据流量大。

【发明内容】

[0005]有鉴于此,本发明的一个目的是提供一种网页数据加载方法、系统及装置,用于解决现有技术中复杂网页加载速度慢、耗费数据流量大的问题。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
[0006]本发明实施例提供一种网页数据加载方法,包括:
[0007]获取客户端发送的用户请求的目标网页的地址信息,根据所述目标网页的地址信息获取目标网页的内容数据;
[0008]将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据;
[0009]将所述内容差异数据提供给客户端,以便客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
[0010]在一些可选的实施例中,所述将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较之前,还包括:获取客户端选择的参考网页的内容数据。
[0011]在一些可选的实施例中,所述获取客户端选择的参考网页的内容数据,具体包括:
[0012]获取客户端发送的参考网页的地址信息,根据所述参考网页的地址信息,获取参考网页的内容数据;或
[0013]接收客户端发送的参考网页的内容数据。
[0014]在一些可选的实施例中,所述将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较之前,还包括:
[0015]若所述目标网页的内容数据和/或所述参考网页的内容数据为压缩数据,则对压缩数据进行解压缩。
[0016]在一些可选的实施例中,所述将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据,具体包括:
[0017]生成目标网页的内容数据对应的目标网页数据文本文件,以及生成参考网页的内容数据对应的参考网页数据文本文件;比较目标网页数据文本文件和参考网页数据文本文件的文本内容差异,得到目标网页和参考网页的文本内容差异文件;
[0018]相应的,所述客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据,具体包括:
[0019]根据目标网页与参考网页的文本内容差异文件和参考网页数据文本文件,得到目标网页数据文本文件;根据目标网页数据文本文件,得到目标网页的内容数据。
[0020]在一些可选的实施例中,所述将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据,具体包括:
[0021]根据目标网页的内容数据,构造目标网页的文档模型树;以及根据参考网页的内容数据构造参考网页的文档模型树;比较目标网页的文档模型树和参考网页的文档模型树的树形数据结构差异,得到目标网页和参考网页的文档模型树差异数据;
[0022]相应的,所述客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据,具体包括:
[0023]根据目标网页与参考网页的文档模型树差异数据和参考网页的文档模型树,得到目标网页的文档模型树;根据目标网页的文档模型树,得到目标网页的内容数据。
[0024]本发明实施例提供一种网络侧装置,包括:
[0025]数据获取模块,用于获取客户端发送的用户请求的目标网页的地址信息,根据所述目标网页的地址信息获取目标网页的内容数据;
[0026]内容比较模块,用于将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据;
[0027]结果提供模块,用于将所述内容差异数据提供给客户端,以便客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
[0028]在一些可选的实施例中,所述数据获取模块,还用于:
[0029]获取客户端选择的参考网页的内容数据,提供给所述内容比较模块。
[0030]在一些可选的实施例中,所述数据获取模块,具体用于:
[0031]获取客户端发送的参考网页的地址信息,根据所述参考网页的地址信息,获取参考网页的内容数据;或接收客户端发送的参考网页的内容数据。
[0032]在一些可选的实施例中,所述内容比较模块,还用于:[0033]若所述目标网页的内容数据和/或所述参考网页的内容数据为压缩数据,则对压缩数据进行解压缩。
[0034]在一些可选的实施例中,所述内容比较模块,具体用于:
[0035]生成目标网页的内容数据对应的目标网页数据文本文件,以及生成参考网页的内容数据对应的参考网页数据文本文件;比较目标网页数据文本文件和参考网页数据文本文件的文本内容差异,得到目标网页和参考网页的文本内容差异文件;或根据目标网页的内容数据,构造目标网页的文档模型树;以及根据参考网页的内容数据构造参考网页的文档模型树;比较目标网页的文档模型树和参考网页的文档模型树的树形数据结构差异,得到目标网页和参考网页的文档模型树差异数据。
[0036]本发明实施例还提供一种客户端,包括:
[0037]信息发送模块,用于发送用户请求的目标网页的地址信息给网络侧装置;
[0038]信息接收模块,用于接收网络侧装置返回的目标网页与参考网页的内容差异数据,其中所述内容差异数据为网络侧装置根据目标网页的地址信息获取目标网页的内容数据,将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较后得到的;
[0039]数据提取模块,用于根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
[0040]在一些可选的实施例中,所述信息发送模块,还用于:
[0041]发送参考网页的地址信息给网络侧装置,或发送参考网页的内容数据给网络侧装置。
[0042]在一些可选的实施例中,所述数据提取模块,具体用于:
[0043]根据参考网页数据文本文件和网络侧装置返回的目标网页与参考网页的文本内容差异文件,得到目标网页数据文本文件;根据目标网页数据文本文件,得到目标网页的内容数据;或
[0044]根据参考网页的文档模型树和网络侧装置返回的目标网页与参考网页的文档模型树差异数据,得到目标网页的文档模型树;根据目标网页的文档模型树,得到目标网页的内容数据。
[0045]本发明实施例还提供一种网页数据加载系统,包括上述的网络侧装置和上述的客户端。
[0046]本发明实施例还提供一种网页数据加载系统,包括上述的客户端、中转服务器和网络服务器;
[0047]所述中转服务器中包括上述的网络侧装置;
[0048]所述网络服务器,用于提供网页内容数据。
[0049]本发明实施例还提供一种网页数据加载系统,包括上述的客户端和网络服务器;
[0050]所述网络服务器中包括上述的网络侧装置,并用于提供网页内容数据。
[0051]本发明实施例提供的网页数据加载方法、系统及装置,在为客户端提供需要加载的目标网页的内容数据时,先将目标网页的内容数据与客户端曾加载过的参考网页的内容数据比较,得到目标网页与参考网页的内容差异数据,并将内容差异数据提供客户端,这样客户端在加载目标网页的内容数据时,仅需加载差异部分即可,从而减少了多页面网页加载时的加载数据量,减少了网络数据流量的消耗,同时提高了加载速度,实现了网页数据的高效、快速加载。
[0052]为了上述以及相关的目的,一个或多个实施例包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明某些示例性方面,并且其指示的仅仅是各个实施例的原则可以利用的各种方式中的一些方式。其它的益处和新颖性特征将随着下面的详细说明结合附图考虑而变得明显,所公开的实施例是要包括所有这些方面以及它们的等同。
[0053]说明书附图
[0054]图1是本发明实施例中两个网页差异性比较的示意图;
[0055]图2是本发明实施例中网页数据加载方法的流程图;
[0056]图3是本发明实施例一中网页数据加载方法的流程图;
[0057]图4是本发明实施例二中网页数据加载方法的流程图;
[0058]图5是本发明实施例中网页数据加载系统的结构示意图;
[0059]图6是本发明实施例中网络侧装置的结构示意图;
[0060]图7是本发明实施例中客户端的结构示意图;
[0061]图8是本发明实施例中网页数据加载系统的一种具体架构示意图;
[0062]图9是本发明实施例中网页数据加载系统的另一种具体架构示意图。
【具体实施方式】
[0063]以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。其他实施方案可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的组件和功能是可选的,并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本发明的实施方案的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。在本文中,本发明的这些实施方案可以被单独地或总地用术语“发明”来表示,这仅仅是为了方便,并且如果事实上公开了超过一个的发明,不是要自动地限制该应用的范围为任何单个发明或发明构思。
[0064]由于现有技术中存在复杂网页加载速度慢,耗费数据流量大的问题,而且本发明发明人根据分析发现将复杂内容分为若干个网页展示时,网页数据之间的差别一般都比较小,因此,每个网页都加载全部数据则会造成很大的数据冗余。如图1所示,分别是一份展示内容分为若干个网页后的第一个网页(第一页)和第二个网页(第二页),它们之间除了〈title〉标签之间的数据略有不同,以及〈body〉标签之间的数据不同,其他部分的数据完全相同。
[0065]造成这种数据冗余现象的原因是由于HTTP协议是无状态协议,浏览器根据不同URL获取其网页数据是个独立的过程,即使前后两次获取的网页,其数据内容相差很小,浏览器也无法识别,必须加载完整的网页数据,包括网页URL对应的数据以及内嵌其中的网络资源URL所对应的数据。而这正是造成复杂展示内容的网页加载速度慢,耗费数据流量大的原因所在。基于此,本发明实施例提供一种网页数据加载方法、系统及装置,该方法可以减少数据流量的耗费,加快复杂网页的加载速度,该方法流程如图2所示,包括下列步骤。
[0066]SlOl:客户端获取用户请求的目标网页的地址信息发送给网络侧装置。
[0067]客户端可以获取用户提供的目标网页的地址信息,例如目标网页的URL,并将该目标网页的地址信息发送给网络侧装置,以便获取目标网页的内容数据。
[0068]S102:网络侧装置获取客户端发送的用户请求的目标网页的地址信息。
[0069]网络侧装置接收客户全发送的目标网页的地址信息,比如目标网页的URL。
[0070]S103:网络侧装置根据目标网页的地址信息获取目标网页的内容数据。
[0071]例如:网络侧装置根据该目标网页的U RL到网络服务器中相应的网页地址获取网页的内容数据。
[0072]S104:网络侧装置将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据。
[0073]优选的,将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较之前,网络侧装置还会获取客户端选择的参考网页的内容数据,其中参考网页为客户端已经拥有其数据内容的网页。网络侧装置可采用下列方式之一获取参考网页的内容数据:
[0074]方式一:网络侧装置获取客户端发送的参考网页的地址信息,根据参考网页的地址信息,获取参考网页的内容数据。该方式客户端仅提供参考网页的地址信息,由网络侧装置到相应的网页地址获取参考网页的内容数据。
[0075]方式二:网络侧装置接收客户端发送的参考网页的内容数据。该方式客户端直接将选择的参考网页的内容数据提供给网络侧装置。
[0076]网络侧装置将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据的方式很多,例如可以采用下面列举的两种方式中的一种:
[0077]方式一:文本比较方式。
[0078]网络侧装置生成目标网页的内容数据对应的目标网页数据文本文件,以及生成参考网页的内容数据对应的参考网页数据文本文件;比较目标网页数据文本文件和参考网页数据文本文件的文本内容差异,得到目标网页和参考网页的文本内容差异文件。这种方式直接将网页数据当作文本文件进行比较,例如Linux操作系统下的diff命令就可以完成两个文本文件之间的比较并输出两者的差异之处。
[0079]方式二:模型树比较方式。
[0080]网络侧装置根据目标网页的内容数据,构造目标网页的文档模型树;以及根据参考网页的内容数据构造参考网页的文档模型树;比较目标网页的文档模型树和参考网页的文档模型树的树形数据结构差异,得到目标网页和参考网页的文档模型树差异数据。这种方式先解析网页的HTML的内容,将网页数据构建成文档模型树(DOM tree),然后比较两个树形数据结构之间的差异。
[0081]优选的,将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较之前,确定目标网页的内容数据和参考网页的内容数据是否是压缩数据,若目标网页的内容数据和/或参考网页的内容数据为压缩数据,则对压缩数据进行解压缩。
[0082]S105:网络侧装置将目标网页与参考网页的内容差异数据提供给客户端。[0083]网络侧装置将目标网页与参考网页的内容差异数据提供给客户端,以便客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
[0084]S106:客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
[0085]客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据的方式,与上述步骤S104中网络侧装置得到目标网页与参考网页的内容差异数据的方式对应。例如针对上述步骤S104中列举的获得内容差异数据的两种方式,得到目标网页的内容数据的方式分别为下列两种:
[0086]方式一:文本方式。
[0087]根据目标网页与参考网页的文本内容差异文件和参考网页数据文本文件,得到目标网页数据文本文件;根据目标网页数据文本文件,得到目标网页的内容数据。这种方式针对文本比较方式实现目标网页的内容数据获取,根据输出的包含两个文本内容差异的文本内容差异文件,以及已拥有的参考网页数据,得到目标网页的文本文件,实现目标网页数据的获取及目标网页的展示。
[0088]方式二:模型树方式。
[0089]根据目标网页与参考网页的文档模型树差异数据和参考网页的文档模型树,得到目标网页的文档模型树;根据目标网页的文档模型树,得到目标网页的内容数据。这种方式模型树方式实现目标网页的内容数据获取,根据输出的包含两个文档模型树差异的文档模型树差异数据,以及已拥有的参考网页的文档模型树,得到目标网页的文档模型树,实现目标网页数据的获取及目标网页的展示。
[0090]客户端得到目标网页的内容数据后,可以将目标网页的内容数通过浏览器软件和显示屏幕呈现给用户。
[0091]下面通过具体的实施例详细说明上述网页数据加载方法的可选的具体实现流程。
[0092]实施例一
[0093]本发明实施例一提供的网页数据加载方法,其流程如图3所示,包括下列步骤:
[0094]S201:客户端将用户请求的目标网页的地址信息和参考网页的地址信息发送给网络侧装置。
[0095]客户端可以获取用户提供的目标网页的地址信息和参考网页的地址信息,例如目标网页的URL和参考网页的URL,并将该目标网页的地址信息和参考网页的地址信息发送给网络侧装置,以便获取目标网页和参考网页的内容数据。其中参考网页为客户端已拥有其内容数据的网页,例如图1中所示的,客户端已经获取过多页面网页的第一个网页的内容数据了,则在请求访问第二个网页时,浏览器将第二个网页的URL作为目标网页的URL,将第一个网页的URL作为参考网页的URL,将这两个网页的URL均发送给网络侧装置。其中网络侧装置可以设置在一个独立的中转服务器中,也可以设置在提供网页的网络服务器中,当设置在中转服务器中时,该中转服务器可实现与多个不同网络服务器的数据交互。
[0096]S202:网络侧装置获取客户端发送的用户请求的目标网页的地址信息和参考网页的地址信息。
[0097]网络侧装置接收客户全发送的目标网页的地址信息和参考网页的地址信息,例如目标网页的URL和参考网页的URL。[0098]S203:网络侧装置根据目标网页的地址信息获取目标网页的内容数据,以及根据参考网页的地址信息,获取参考网页的内容数据。
[0099]网络侧装置可以根据接收到目标网页的URL和参考网页的URL,到相应的网络服务器的网页地址获取目标网页和参考网页的内容数据。沿用上边图1所示的例子,网络侧装置从网络服务器获取目标网页(即第二个网页)的内容数据和参考网页(即第一个网页)的内容数据。
[0100]S204:网络侧装置将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据。
[0101]参见步骤S104,在对目标网页的内容数据和参考网页的内容数据进行比较时可以采用文本比较方式,也可以采用模型树比较方式,此处以文本比较方式为例进行说明。
[0102]沿用上边图1所示的例子,网络侧装置获取到目标网页(即第二个网页)的内容数据和参考网页(即第一个网页)的内容数据之后,计算两者的差异之处,此处如果两个网页的内容数据为压缩数据,则相对两个网页的内容数据进行解压缩之后再进行计算比较。网络侧装置进行比较时,先根据第二个网页的内容数据得到对应的目标网页数据文本文件,以及根据第一个网页的内容数据得到对应的参考网页数据文本文件;比较目标网页数据文本文件和参考网页数据文本文件的文本内容差异,得到目标网页和参考网页的文本内容差异文件。这种方式直接将两个网页的内容数据当作文本文件进行比较,例如图1所示的两个网页在Linux操作系统下输入diff命令之后输出的结果如下:
[0103]3c3
[0104]<<title>AAAA—第一页〈/title〉
[0105]___
[0106]><title>AAAA—第二页〈/title〉
[0107]9, llc9, 11
[0108]〈第一页内容
[0109]<<img src=//http I //www.b.com/E.jpg^/ >
[0110]〈第一页内容继续
[0111]---
[0112]>第二页内容
[0113]Ximg src=〃http: //www.b.com/F.jpg77 />
[0114]>第二页内容继续
[0115]上述输出结果表示第二个网页可以由第一个网页经过两处修改而获得:
[0116]第一步:将第一个网页的第3行“〈title>AAAA—第一页〈/title〉”修改为“<title>AAAA—第二页〈/title〉”
[0117]第二步:将第一个网页的第9~11行的内容对应地修改为“第二页内容、<imgsrc=〃http: //www.b.com/F.jpg77 />、第二页内容继续”】 [0118]上述对根据参考网页的内容数据和内容差异数据得到目标网页的内容数据需要进行的修改的描述,即为目标网页与参考网页的内容差异数据。
[0119]S205:网络侧装置将目标网页与参考网页的内容差异数据提供给客户端。
[0120]S206:客户端接收网络侧装置发送的目标网页与参考网页的内容差异数据。[0121]S207:客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
[0122]沿用上边的例子,客户端根据上述步骤S204中的内容差异数据和第一个网页的内容数据可以得到第二个网页的内容数据,此处得到目标网页的内容数据的方式和步骤S204中获取内容差异数据的方式相对应,并可以预先配置或选择采用哪种方式。例如步骤3里采用linux diff命令,贝U此处对应的采用linux patch命令,实现网页的内容数据的文本文件的恢复。这样就避免了整体下载第二个网页的内容数据,减少了数据传输量并提高了网页加载速度和效率,降低了网页加载的响应时延。
[0123]S208:客户端将获得的目标网页的内容数据呈现给用户。
[0124]客户端在得到第二个网页的内容数据后可以将其展示给用户,后续也可以将第二个网页作为参考网页,获取后续第三个网页的内容数据。
[0125]上述实施例一中网络侧装置根据参考网页的地址信息自行到相应的网络服务器获取参考网页的内容数据,下面的实施例二中,网络侧装置直接接收客户端提供的参考网页的内容数据。
[0126]实施例二
[0127]本发明实施例二提供的网页数据加载方法,其流程如图4所示,包括下列步骤:
[0128]S301:客户端将用户请求的目标网页的地址信息和参考网页的内容数据发送给网络侧装置。
[0129]客户端可以获取用户提供的目标网页的地址信息(例如目标网页的URL)和参考网页的内容数据,并将该目标网页的地址信息和参考网页的地址信息发送给网络侧装置。
[0130]例如图1中所示的,客户端已经获取过多页面网页的第一个网页的内容数据了,则在请求访问第二个网页时,将第二个网页的URL作为目标网页的URL发送给网络侧装置,将第一个网页的内容数据直接发送给网络侧装置。其中网络侧装置可以设置在一个独立的中转服务器中,也可以设置在提供网页的网络服务器中,当设置在中转服务器中时,该中转服务器可实现与多个不同网络服务器的数据交互。
[0131]S302:网络侧装置获取客户端发送的用户请求的目标网页的地址信息和参考网页的内容数据。
[0132]S303:网络侧装置根据目标网页的地址信息获取目标网页的内容数据。
[0133]沿用上边的例子,此处网络侧装置只需要到目标网页的URL对应的网络服务器的网页地址获取目标网页的内容数据即可,参考网页的内容数据无需再获取。沿用上边的例子,只需要获取第二个网页的内容数据即可第一个网页的内容数据不用再到网络服务器获取。
[0134]S304:网络侧装置将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据。
[0135]参见步骤S104和步骤S204,此处不再赘述。
[0136]S305:网络侧装置将目标网页与参考网页的内容差异数据提供给客户端。
[0137]S306:客户端接收网络侧装置发送的目标网页与参考网页的内容差异数据。
[0138]S307:客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。[0139]参见步骤S207,此处不再赘述。
[0140]S308:客户端将获得的目标网页的内容数据呈现给用户。
[0141]客户端在得到第二个网页的内容数据后可以将其展示给用户,后续也可以将第二个网页作为参考网页,获取后续第三个网页的内容数据。
[0142]基于同一发明构思,本发明实施例还提供一种网页数据加载系统,该系统结构如图5所示,包括:网络侧装置I和客户端2。
[0143]网络侧装置1,用于获取客户端发送的用户请求的目标网页的地址信息,根据目标网页的地址信息获取目标网页的内容数据;将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据;将目标网页与参考网页的内容差异数据提供给客户端,以便客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
[0144]客户端2,用于发送用户请求的目标网页的地址信息给网络侧装置;接收网络侧装置返回的目标网页与参考网页的内容差异数据;根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
[0145]优选的,上述网络侧装置I,还用于将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较之前,获取客户端选择的参考网页的内容数据。
[0146]优选的,上述网络侧装置1,具体用于获取客户端发送的参考网页的地址信息,根据参考网页的地址信息,获取参考网页的内容数据;或接收客户端发送的参考网页的内容数据。
[0147]优选的,上述网络侧装置I,还用于将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较之前,若目标网页的内容数据和/或参考网页的内容数据为压缩数据,则对压缩数据进行解压缩。
[0148]优选的,上述网络侧装置I,具体用于生成目标网页的内容数据对应的目标网页数据文本文件,以及生成参考网页的内容数据对应的参考网页数据文本文件;比较目标网页数据文本文件和参考网页数据文本文件的文本内容差异,得到目标网页和参考网页的文本内容差异文件;相应的,上述客户端2,具体用于根据目标网页与参考网页的文本内容差异文件和参考网页数据文本文件,得到目标网页数据文本文件;根据目标网页数据文本文件,得到目标网页的内容数据。
[0149]优选的,上述网络侧装置1,具体用于根据目标网页的内容数据,构造目标网页的文档模型树;以及根据参考网页的内容数据构造参考网页的文档模型树;比较目标网页的文档模型树和参考网页的文档模型树的树形数据结构差异,得到目标网页和参考网页的文档模型树差异数据;相应的,上述客户端2,具体用于根据目标网页与参考网页的文档模型树差异数据和参考网页的文档模型树,得到目标网页的文档模型树;根据目标网页的文档模型树,得到目标网页的内容数据。
[0150]上述网页数据加载系统中包括的网络侧装置的结构如图6所示,包括:数据获取模块11、内容比较模块12和结果提供模块13。
[0151]数据获取模块11,用于获取客户端发送的用户请求的目标网页的地址信息,根据目标网页的地址信息获取目标网页的内容数据。
[0152]内容比较模块12,用于将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据。[0153]结果提供模块13,用于将目标网页与参考网页的内容差异数据提供给客户端,以便客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
[0154]优选的,上述数据获取模块11,还用于获取客户端选择的参考网页的内容数据,提供给内容比较模块12。
[0155]优选的,上述数据获取模块11,具体用于获取客户端发送的参考网页的地址信息,根据参考网页的地址信息,获取参考网页的内容数据;或接收客户端发送的参考网页的内容数据。
[0156]优选的,上述内容比较模块12,还用于若目标网页的内容数据和/或参考网页的内容数据为压缩数据,则对压缩数据进行解压缩。
[0157]优选的,上述内容比较模块12,具体用于:生成目标网页的内容数据对应的目标网页数据文本文件,以及生成参考网页的内容数据对应的参考网页数据文本文件;比较目标网页数据文本文件和参考网页数据文本文件的文本内容差异,得到目标网页和参考网页的文本内容差异文件;或根据目标网页的内容数据,构造目标网页的文档模型树;以及根据参考网页的内容数据构造参考网页的文档模型树;比较目标网页的文档模型树和参考网页的文档模型树的树形数据结构差异,得到目标网页和参考网页的文档模型树差异数据。
[0158]上述网页数据加载系统中包括的客户端的结构如图7所示,包括:信息发送模块21、信息接收模块22和数据提取模块23。
[0159]信息发送模块21,用于发送用户请求的目标网页的地址信息给网络侧装置。
[0160]信息接收模块22,用于接收网络侧装置返回的目标网页与参考网页的内容差异数据,其中目标网页与参考网页的内容差异数据为网络侧装置根据目标网页的地址信息获取目标网页的内容数据,将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较后得到的。
[0161]数据提取模块23,用于根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
[0162]优选的,上述信息发送模块21,还用于发送参考网页的地址信息给网络侧装置,或发送参考网页的内容数据给网络侧装置。
[0163]优选的,上述数据提取模块23,具体用于:根据参考网页数据文本文件和网络侧装置返回的目标网页与参考网页的文本内容差异文件,得到目标网页数据文本文件;根据目标网页数据文本文件,得到目标网页的内容数据;或根据参考网页的文档模型树和网络侧装置返回的目标网页与参考网页的文档模型树差异数据,得到目标网页的文档模型树;根据目标网页的文档模型树,得到目标网页的内容数据。
[0164]基于同一发明构思,本发明实施例还提供网页数据加载系统的一种具体架构,该具体架构如图8所示,包括:客户端2、中转服务器3和网络服务器4。其中,中转服务器3中设置如图6所示的网络侧装置,网络服务器4,用于提供网页内容数据。网络服务器4可以有多个。
[0165]基于同一发明构思,本发明实施例还提供网页数据加载系统另一种将具体架构,该系统结构如图9所示,包括:客户端2和网络服务器4。其中,网络服务器4中设置如图6所示的网络侧装置,并用于提供网页内容数据。此处的网络服务器4也可以有多个。
[0166]本发明实施例提供的上述网页数据加载方法、系统及装置,通过比较目标网页和客户端已拥有的参考网页的内容数据之间的差异,仅为客户端提供差异数据,从而避免了网页中冗余数据的传输,减少了数据传输量,提高了网页数据的加载速度,改善了用户体验效果。
[0167]除非另外具体陈述,术语比如处理、计算、运算、确定、显示等等可以指一个或更多个处理或者计算系统、或类似设备的动作和/或过程,所述动作和/或过程将表示为处理系统的寄存器或存储器内的物理(如电子)量的数据操作和转换成为类似地表示为处理系统的存储器、寄存器或者其他此类信息存储、发射或者显示设备内的物理量的其他数据。信息和信号可以使用多种不同的技术和方法中的任何一种来表示。例如,在贯穿上面的描述中提及的数据、指令、命令、信息可以用电压、电流、电磁波、磁场或粒子、光场或粒子或者其任意组合来表示。
[0168]应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
[0169]在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
[0170]本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。
[0171]结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。对于软件实现,本申请中描述的技术可用执行本申请所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。
[0172]上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
【权利要求】
1.一种网页数据加载方法,其特征在于,包括: 获取客户端发送的用户请求的目标网页的地址信息,根据所述目标网页的地址信息获取目标网页的内容数据; 将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据; 将所述内容差异数据提供给客户端,以便客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
2.如权利要求1所述的方法,其特征在于,所述将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较之前,还包括:获取客户端选择的参考网页的内容数据。
3.如权利要求2所述的方法,其特征在于,所述获取客户端选择的参考网页的内容数据,具体包括: 获取客户端发送的参考网页的地址信息,根据所述参考网页的地址信息,获取参考网页的内容数据;或 接收客户端发送的参考网页的内容数据。
4.如权利要求1所述的方法,其特征在于,所述将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较之前,还包括: 若所述目标网页的内容数据和/或所述参考网页的内容数据为压缩数据,则对压缩数据进行解压缩。
5.如权利要求1-4任一所述的方法,其特征在于,所述将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据,具体包括: 生成目标网页的内容数据对应的目标网页数据文本文件,以及生成参考网页的内容数据对应的参考网页数据文本文件;比较目标网页数据文本文件和参考网页数据文本文件的文本内容差异,得到目标网页和参考网页的文本内容差异文件; 相应的,所述客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据,具体包括: 根据目标网页与参考网页的文本内容差异文件和参考网页数据文本文件,得到目标网页数据文本文件;根据目标网页数据文本文件,得到目标网页的内容数据。
6.如权利要求1所述的方法,其特征在于,所述将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据,具体包括: 根据目标网页的内容数据,构造目标网页的文档模型树;以及根据参考网页的内容数据构造参考网页的文档模型树;比较目标网页的文档模型树和参考网页的文档模型树的树形数据结构差异,得到目标网页和参考网页的文档模型树差异数据; 相应的,所述客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据,具体包括: 根据目标网页与参考网页的文档模型树差异数据和参考网页的文档模型树,得到目标网页的文档模型树;根据目标网页的文档模型树,得到目标网页的内容数据。
7.—种网络侧装置,其特征在于,包括: 数据获取模块,用于获取客户端发送的用户请求的目标网页的地址信息,根据所述目标网页的地址信息获取目标网页的内容数据; 内容比较模块,用于将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较,得到目标网页与参考网页的内容差异数据; 结果提供模块,用于将所述内容差异数据提供给客户端,以便客户端根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
8.如权利要求7所述的装置,其特征在于,所述数据获取模块,还用于: 获取客户端选择的参考网页的内容数据,提供给所述内容比较模块。
9.如权利要求8所述的装置,其特征在于,所述数据获取模块,具体用于: 获取客户端发送的参考网页的地址信息,根据所述参考网页的地址信息,获取参考网页的内容数据;或接收客户端发送的参考网页的内容数据。
10.如权利要求7所述的装置,其特征在于,所述内容比较模块,还用于: 若所述目标网页的内容数据和/或所述参考网页的内容数据为压缩数据,则对压缩数据进行解压缩。
11.如权利要求7-10任一所述的装置,其特征在于,所述内容比较模块,具体用于: 生成目标网页的内容数据对应的目标网页数据文本文件,以及生成参考网页的内容数据对应的参考网页数据文本文件;比较目标网页数据文本文件和参考网页数据文本文件的文本内容差异,得到目标网页和参考网页的文本内容差异文件;或根据目标网页的内容数据,构造目标网页的文档模型树;`以及根据参考网页的内容数据构造参考网页的文档模型树;比较目标网页的文档模型树和参考网页的文档模型树的树形数据结构差异,得到目标网页和参考网页的文档模型树差异数据。
12.—种客户端,其特征在于,包括: 信息发送模块,用于发送用户请求的目标网页的地址信息给网络侧装置; 信息接收模块,用于接收网络侧装置返回的目标网页与参考网页的内容差异数据,其中所述内容差异数据为网络侧装置根据目标网页的地址信息获取目标网页的内容数据,将获取的目标网页的内容数据与客户端选择的参考网页的内容数据进行比较后得到的;数据提取模块,用于根据内容差异数据和参考网页的内容数据,得到目标网页的内容数据。
13.如权利要求12所述的客户端,其特征在于,所述信息发送模块,还用于: 发送参考网页的地址信息给网络侧装置,或发送参考网页的内容数据给网络侧装置。
14.如权利要求12或13所述的客户端,其特征在于,所述数据提取模块,具体用于: 根据参考网页数据文本文件和网络侧装置返回的目标网页与参考网页的文本内容差异文件,得到目标网页数据文本文件;根据目标网页数据文本文件,得到目标网页的内容数据;或 根据参考网页的文档模型树和网络侧装置返回的目标网页与参考网页的文档模型树差异数据,得到目标网页的文档模型树;根据目标网页的文档模型树,得到目标网页的内容数据。
15.一种网页数据加载系统,其特征在于,包括如权利要求7-11任一所述的网络侧装置和如权利要求12-14任一所述的客户端。
16.一种网页数据加载系统,其特征在于,包括如权利要求12-14任一所述的客户端、中转服务器和网络服务器; 所述中转服务器中包括如权利要求7-11任一所述的网络侧装置; 所述网络服务器,用于提供网页内容数据。
17.—种网页数据加载系统,其特征在于,包括如权利要求12-14任一所述的客户端和网络服务器; 所述网络服务器中包括如权利要求7-11任一所述的网络侧装置,并用于提供网页内容数 据。
【文档编号】H04L29/06GK103678330SQ201210324596
【公开日】2014年3月26日 申请日期:2012年9月4日 优先权日:2012年9月4日
【发明者】郑清芳 申请人:北京新岸线移动多媒体技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1