网页离线浏览方法及装置与流程

文档序号:12748172阅读:1147来源:国知局
网页离线浏览方法及装置与流程

本发明涉及互联网技术领域,尤其涉及一种网页离线浏览方法及装置。



背景技术:

目前,互联网应用已经成为人们生活中一部分,人们生活中经常需要通过移动终端的浏览器访问互联网资源,例如:看新闻、阅读、通过客户端浏览公众号信息等。

用户在浏览网页时,网页浏览器与万维网服务器(WWW)的数据交互采用超文本传输协议(HTTP)。WWW服务器向终端发送的网页数据包括超文本标记语言(HTML)等格式的文本文件以及相关媒体资源。终端的网页浏览器在获取上述文件和资源后,将其绘制到网页浏览器的窗口中,以供与用户进行交互。为了方便对感兴趣的网页进行再次浏览,用户通常通过离线页面保存的方法将去进行本地保存。

但是,当前网页浏览器做离线页面保存时,只能下载或缓存到该网页的网页文字,无法实现对网页已经浏览过的链接的网页素材元素的保存,如网页中的音、视频文件等,用户想要再次访问其中的链接的视频、音频等时,必须重新联网进行访问,过程十分的繁琐且容易耗费流量。而且,当网络现在异常时,即在离线的情况下,或者,当第三方取消该视频资源的播放时,用户就无法继续浏览该网页中链接的视频内容,影响用户浏览体验。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的网页离线浏览方法及装置。

本发明的一个方面,提供了一种网页离线浏览方法,包括:

建立目标网页的本地缓存模板;

监控目标网页浏览过程中存在的资源访问请求,获取所述资源访问请求对应的网页素材资源,并将获取的网页素材资源缓存在本地;

将所述网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。

可选地,所述建立目标网页的本地缓存模板,包括:

在所述目标网页加载过程中,抓取所述目标网页中的网页元素和网页样式文件;

根据所述网页元素和网页样式文件建立所述目标网页的本地缓存模板。

可选地,所述获取所述资源访问请求对应的网页素材资源,包括:

截获目标网页浏览过程中存在的所述资源访问请求,获取所述资源访问请求对应的URL地址;通过所述URL地址抓取所述网页素材资源。

可选地,所述获取所述资源访问请求对应的网页素材资源,包括:

截获所述资源访问请求对应的响应数据,从所述响应数据中提取所述网页素材资源。

可选地,所述截获所述资源访问请求对应的响应数据,包括:

采用钩子函数截获所述资源访问请求对应的响应数据。

可选地,在所述将获取的网页素材资源缓存在本地之前,还包括:

查找本地缓存列表中是否存储有所述资源访问请求对应的URL地址;

若否,则将获取的网页素材资源缓存在本地。

可选地,在所述将获取的网页素材资源缓存在本地之前,还包括:

获取终端的网络状态;

检测所述网络状态是否符合预定条件;

若检测结果为符合所述预定条件,则执行所述将获取的网页素材资源缓存在本地的步骤。

可选地,在所述将获取的网页素材资源缓存在本地之前,还包括:

获取终端的可用存储容量;

若所述可用存储容量大于预设容量阈值,则执行所述将获取的网页素材资源缓存在本地的步骤。

可选地,所述网页素材资源包括图片资源、音频资源、视频资源中的至少一种。

可选地,该方法还包括:

在对缓存在本地的视频资源、音频资源进行播放时,去除广告部分。

本发明的另一个方面,提供了一种网页离线浏览装置,包括:

配置模块,适于建立目标网页的本地缓存模板;

缓存模块,适于监控目标网页浏览过程中存在的资源访问请求,获取所述资源访问请求对应的网页素材资源,并将获取的网页素材资源缓存在本地;

生成模块,适于将所述网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。

可选地,所述配置模块,包括:

抓取单元,适于在所述目标网页加载过程中,抓取所述目标网页中的网页元素和网页样式文件;

配置单元,适于根据所述网页元素和网页样式文件建立所述目标网页的本地缓存模板。

可选地,所述缓存模块,具体适于截获目标网页浏览过程中存在的所述资源访问请求,获取所述资源访问请求对应的URL地址;通过所述URL地址抓取所述网页素材资源。

可选地,所述缓存模块,具体适于截获所述资源访问请求对应的响应数据,从所述响应数据中提取所述网页素材资源。

可选地,所述缓存模块,具体适于采用钩子函数截获所述资源访问请求对应的响应数据。

可选地,该装置还包括:

查找模块,适于在所述缓存模块将获取的网页素材资源缓存在本地之前,查找本地缓存列表中是否存储有所述资源访问请求对应的URL地址;

所述缓存模块,适于在所述本地缓存列表中没有存储所述资源访问请求对应的URL地址时,将获取的网页素材资源缓存在本地。

可选地,该装置还包括:

获取模块,适于在所述缓存模块将获取的网页素材资源缓存在本地之前,获取终端的网络状态;

检测模块,适于检测所述获取模块获取的终端的网络状态是否符合预定条件;

所述缓存模块,适于在所述检测模块的检测结果为符合所述预定条件时,将获取的网页素材资源缓存在本地。

可选地,所述获取模块,还适于在所述缓存模块将获取的网页素材资源缓存在本地之前,获取终端的可用存储容量;

所述缓存模块,适于在所述可用存储容量大于预设容量阈值时,将获取的网页素材资源缓存在本地。

可选地,所述网页素材资源包括图片资源、音频资源、视频资源中的至少一种。

可选地,该装置还包括:

播放模块,适于在对缓存在本地的视频资源、音频资源进行播放时,去除广告部分。

本发明实施例提供的网页离线浏览方法及装置,通过将资源访问请求对应的网页素材资源缓存在本地,并将网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。本发明实施例使得用户可以在离线状态下,实现对目标网页中链接的已经浏览过的网页素材资源的离线浏览,节约网络流量和页面加载时间,提升用户体验。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一个实施例的一种网页离线浏览方法的流程图;

图2示出了根据本发明实施例一种网页离线浏览方法中步骤S11的细分流程图

图3示出了根据本发明另一实施例的一种网页离线浏览方法的流程图;

图4示出了根据本发明一个实施例的一种网页离线浏览装置的结构示意图;

图5示出了根据本发明实施例的网页离线浏览装置中配置模块的内部结构示意图;

图6示出了根据本发明另一实施例的一种网页离线浏览装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。

本发明实施例在通过浏览器对网页实现离线访问的过程中,能够将资源访问请求对应的网页素材资源缓存在本地,并将网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页,使得浏览器在对该网页进行离线访问时,能够对目标网页中链接的已经浏览过的网页素材资源的离线浏览,节约网络流量和页面加载时间,提升用户体验。

需要说明的是,在本发明实施例中,实现网页离线访问的浏览器可以为运行于个人计算机(Personal Computer,PC)中的浏览器客户端,还可以为运行于智能手机、平板电脑、掌上电脑(Personal Digital Assistant,PDA)等智能移动终端设备上的浏览器客户端。

图1示意性示出了本发明一个实施例的网页离线浏览方法的流程图。参照图1,本发明实施例的网页离线浏览方法具体包括以下步骤:

S11、建立目标网页的本地缓存模板。

本实施例中,所述目标网页为预进行离线浏览的网页。目标网页的本地缓存模板中具有与目标网页相同的网页元素和网页样式。

在实际应用中,可以通过从第三方服务器中下载所述目标网页的本地缓存模板实现本地缓存模板的建立,也可以通过提取浏览器对所述目标网页的访问历史,根据目标网页的访问历史在浏览器本地生成。其中,第三方服务器可以为浏览器的服务端,也可以为目标网页所在网站的服务端。

S12、监控目标网页浏览过程中存在的资源访问请求,获取所述资源访问请求对应的网页素材资源,并将获取的网页素材资源缓存在本地。

其中,网页素材资源包括图片资源、音频资源、视频资源和文字资源中的至少一种。本实施例中的本地缓存模板对应的脚本文件中包含有与所述资源访问请求对应的URL地址。

本实施例中,资源访问请求具体可以是用户在对目标网页浏览过程中,通过点击或者触摸等操作输入的用于浏览目标网页中存在的链接内容的请求命令。

在实际应用中,当用户通过用户终端进行目标网页浏览时,通过点击或者触摸等操作触发浏览目标网页中存在的链接内容的资源访问请求,本实施例,通过监控目标网页浏览过程中存在的所有资源访问请求,获取每一资源访问请求对应的网页素材资源,并将获取的各个网页素材资源缓存在本地,以便使得用户可以在离线状态下实现对目标网页链接的网页内容的浏览。具体的,监控目标网页浏览过程中存在的资源访问请求的操作可通过现有技术实现,例如,可通过钩子函数实现或其他网络监控工具实现,对此本发明不作具体限定。

S13、将所述网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。

本实施例中,通过将本地缓存模板中与所述资源访问请求对应的URL地址替换为网页素材资源的本地缓存地址,生成目标网页对应的离线网页,当用户在离线状态下访问生成的离线网页时,根据网页素材资源在本地缓存的地址生成访问路径,获取相应的网页素材资源,实现目标网页中链接的已经浏览过的网页素材资源的离线浏览。

本发明实施例提供的网页离线浏览方法,通过将资源访问请求对应的网页素材资源缓存在本地,并将网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。本发明实施例使得用户可以在离线状态下,实现对目标网页中链接的已经浏览过的网页素材资源的离线浏览,节约网络流量和页面加载时间,提升用户体验。

在本发明的一个可选实施例中,通过提取浏览器对所述目标网页的访问历史,根据目标网页的访问历史在浏览器本地建立目标网页的本地缓存模板。具体的,步骤S11中的所述建立目标网页的本地缓存模板,如图2所示,进一步地包括以下步骤:

S111、在所述目标网页加载过程中,抓取所述目标网页中的网页元素和网页样式文件。

其中,目标网页中的网页元素包括图片、文字、视频、音频中的至少一个,网页样式文件是指用于定义网页元素布局的文件,包括CSS样式文件、JS文件等。

S112、根据所述网页元素和网页样式文件建立所述目标网页的本地缓存模板。

本实施例中,通过在所述目标网页加载过程中,采用抓取工具抓取所述目标网页中的图片、文字、视频、音频等网页元素和CSS样式文件、JS文件等网页样式文件,并根据抓取到的网页元素和网页样式文件建立所述目标网页的本地缓存模板。本实施例中的本地缓存模板对应的脚本文件中包含有与所述资源访问请求对应的URL地址,以便后续将上述URL对应网页素材资源的本地缓存地址作为该URL在网页中所处位置的路径,实现对目标网页中上述指定URL对应网页素材资源的离线浏览。

在本发明的一个可选实施例中,步骤S12中记载的所述获取所述资源访问请求对应的网页素材资源,进一步包括以下步骤:

截获目标网页浏览过程中存在的所述资源访问请求,获取所述资源访问请求对应的URL地址;通过所述URL地址抓取所述网页素材资源。

其中,网页素材资源包括图片资源、音频资源、视频资源中的至少一种。

本实施例中,通过监控目标网页浏览过程中存在的所述资源访问请求,即监控目标网页浏览过程中触发的下载网页内链接的事件。当监控到资源访问请求时,截获并解析所述资源访问请求,获取所述资源访问请求对应的URL地址,并通过所述URL地址抓取请求访问的如图片资源、音频资源、视频资源等网页素材资源,实现对已经浏览过的网页素材资源的获取,以便后续对其进行缓存。

进一步地,在本发明的另一实施例中,还可以通过解析网页的脚本,同时获取目标网页内的所有链接,获取每一链接对应的URL地址;通过各个URL地址抓取目标网页内的所有链接对应的网页素材资源,以便后续对其进行缓存。以HTML编码格式的网页为例,HTML通过在文本文件中加入一系列的标签(tag)实现浏览器的网页显示。标签时HTML语法的基本元素,由“<”和“>”成对组成,两者之间是标签的内容。例如<a href=“http://www.sina.com.cn”>新浪网</a>,表示用鼠标点击网页上显示的“新浪网”时,浏览器会自动打开http://www.sina.com.cn指向的网页。也就是说,网页的链接会包括有http、https、ftp、www等这些标识,通过解析网页的脚本,可以获取包含这些标识的所有链接。

在本发明的一个可选实施例中,步骤S12中记载的所述获取所述资源访问请求对应的网页素材资源,进一步包括以下步骤:

截获所述资源访问请求对应的响应数据,从所述响应数据中提取所述网页素材资源。

本示例性实施例中,所述截获所述资源访问请求对应的响应数据,具体包括:采用钩子函数截获所述资源访问请求对应的响应数据。

从所述响应数据中提取所述网页素材资源,具体包括:根据所述响应数据的数据特征和/或位置特征,从所述响应数据中提取图片资源、音频资源、视频资源等网页素材资源。其中,所述数据特征包括文件格式和文件大小。

为了快速、准确地实现网页素材资源的抓取,本发明实施例中通过分析确定响应数据的数据特征和/或位置特征,例如,不同的网页素材资源对应的文件格式和文件大小,如,视频资源的文件格式为.MP4文件,以及通常设置在数据中的位置等特征,根据这些特征,快速、准确地从响应数据中抓取出网页元素文件和网页形态文件。

例如,实际应用中,视频资源通常采用三段式资源访问请求的形式实现,前两段作为前续广告部分,最后一段才是真正的视频资源的资源访问请求内容,因此,可通过提取响应数据中对应第三段资源访问请求的数据,实现视频资源的获取。

图3示意性示出了本发明另一个实施例的网页离线浏览方法的流程图。参照图3,本发明实施例的网页离线浏览方法具体包括以下步骤:

S31、建立目标网页的本地缓存模板。

S32、监控目标网页浏览过程中存在的资源访问请求,获取所述资源访问请求对应的网页素材资源。

其中,步骤S31~S32与上述实施例中步骤S11~S12相同,本实施例对此不做具体限定。

S33、查找本地缓存列表中是否存储有所述资源访问请求对应的URL地址。

S34、若所述本地缓存列表中没有存储所述资源访问请求对应的URL地址,则将获取的网页素材资源缓存在本地。

S35、将所述网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。

其中,步骤S35与上述实施例中步骤S13相同,本实施例对此不做具体限定。

此外,若所述本地缓存列表中存储有所述资源访问请求对应的URL地址则,直接加载目标网页对应的离线网页,进行网页离线浏览。

本发明实施例,通过在查找本地缓存列表中是否存储有所述资源访问请求对应的URL地址,若本地缓存列表中已经存储有所述资源访问请求对应的URL地址,即该资源访问请求对应的网页素材资源已经进行本地缓存,可直接加载目标网页对应的离线网页,进行浏览,避免对网页素材资源进行重复缓存,不仅能够减少缓存资源的浪费,还能够降低缓存过多对系统性能的影响,有效地提升用户体验。

在本发明实施例中,在所述将获取的网页素材资源缓存在本地之前,进一步还包括以下附图中未示出的步骤:

获取终端的网络状态,所述网络状态包括网络类型、网络信号强度以及网络剩余量。

检测所述网络状态是否符合预定条件;

若检测结果为符合所述预定条件,则执行所述将获取的网页素材资源缓存在本地的步骤。

为了保证网页素材资源能够有效地进行缓存,避免由于网络不符合预定条件造成的用户利益受损问题,本发明实施例中,在将获取的网页素材资源缓存在本地之前,还包括对当前网络状态进行判断的步骤。其中,所述预定条件包括如下条件中的至少一种:

使用无线网络;

网络信号强度高于第一阈值;

流量套餐中的剩余流量大于第二阈值。

进一步地,本发明实施例中,在所述将获取的网页素材资源缓存在本地之前,还包括以下附图中未示出的步骤:

获取终端的可用存储容量;

若所述可用存储容量大于预设容量阈值,则执行所述将获取的网页素材资源缓存在本地的步骤。

本发明实施例中,通过获取当前终端的可用存储容量,对所述可用存储容量进行判断,若可用存储容量大于预设容量阈值,则执行所述将获取的网页素材资源缓存在本地的步骤,若可用存储容量小于或等于预设容量阈值,则提示用户当前存储容量不足,稍后再尝试存储或进行内存清除操作,以预留足够空间进行响应数据的缓存,进而避免由于内存不足造成的无效存储或系统错误等问题。

可理解的,所述容量阈值可根据预缓存数据的大小动态生成,也可以根据用户需要进行设置,例如,设置最大上限值等,对此本发明不作具体限定。

在本发明的一个可选实施例中,该网页离线浏览方法还包括以下附图中未示出的步骤:在对缓存在本地的视频资源、音频资源进行播放时,去除广告部分。

实际应用中,视频资源通常采用三段式资源访问请求的形式实现,前两段为前续广告部分,最后一段才是真正的视频资源的资源访问请求内容,因此,本发明实施例,可通过提取响应数据中对应第三段资源访问请求的数据,实现视频资源的获取,以在对缓存在本地的视频资源或音频资源进行播放时,去除前续广告部分的操作,进一步提升用户的离线浏览体验。

对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

图4示意性示出了本发明一个实施例的网页离线浏览装置的结构示意图。

参照图4,本发明实施例的网页离线浏览装置具体包括配置模块401、缓存模块402以及生成模块403,其中,配置模块401,适于建立目标网页的本地缓存模板。缓存模块402,适于监控目标网页浏览过程中存在的资源访问请求,获取所述资源访问请求对应的网页素材资源,并将获取的网页素材资源缓存在本地。其中,网页素材资源包括图片资源、音频资源、视频资源和文字资源中的至少一种。本实施例中的本地缓存模板对应的脚本文件中包含有与所述资源访问请求对应的URL地址。生成模块403,适于将所述网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。

本实施例中,所述目标网页为预进行离线浏览的网页。目标网页的本地缓存模板中具有与目标网页相同的网页元素和网页样式。

在实际应用中,配置模块401可以通过从第三方服务器中下载所述目标网页的本地缓存模板实现本地缓存模板的建立,也可以通过提取浏览器对所述目标网页的访问历史,根据目标网页的访问历史在浏览器本地生成。其中,第三方服务器可以为浏览器的服务端,也可以为目标网页所在网站的服务端。生成模块403,通过将本地缓存模板中与所述资源访问请求对应的URL地址替换为网页素材资源的本地缓存地址,生成目标网页对应的离线网页,当用户在离线状态下访问生成的离线网页时,根据网页素材资源在本地缓存的地址生成访问路径,获取相应的网页素材资源,实现目标网页中链接的已经浏览过的网页素材资源的离线浏览。

本发明实施例提供的网页离线浏览装置,通过缓存模块402将资源访问请求对应的网页素材资源缓存在本地,并通过生成模块403将网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。本发明实施例使得用户可以在离线状态下,实现对目标网页中链接的已经浏览过的网页素材资源的离线浏览,节约网络流量和页面加载时间,提升用户体验。

在本发明的一个可选实施例中,如图5所示,所述配置模块401,进一步包括抓取单元4011和配置单元4022,其中,所述的抓取单元4011,适于在所述目标网页加载过程中,抓取所述目标网页中的网页元素和网页样式文件;所述的配置单元4022,适于根据所述网页元素和网页样式文件建立所述目标网页的本地缓存模板。

其中,目标网页中的网页元素包括图片、文字、视频、音频中的至少一个,网页样式文件是指用于定义网页元素布局的文件,包括CSS样式文件、JS文件等。

在本发明的一个可选实施例中,所述缓存模块402,具体适于截获目标网页浏览过程中存在的所述资源访问请求,获取所述资源访问请求对应的URL地址;通过所述URL地址抓取所述网页素材资源。其中,网页素材资源包括图片资源、音频资源、视频资源中的至少一种。

本实施例中,缓存模块402通过监控目标网页浏览过程中存在的所述资源访问请求,即监控目标网页浏览过程中触发的下载网页内链接的事件。当监控到资源访问请求时,截获并解析所述资源访问请求,获取所述资源访问请求对应的URL地址,并通过所述URL地址抓取请求访问的如图片资源、音频资源、视频资源等网页素材资源,实现对已经浏览过的网页素材资源的获取,以便后续对其进行缓存。

在本发明的一个可选实施例中,所述缓存模块402,具体适于截获所述资源访问请求对应的响应数据,从所述响应数据中提取所述网页素材资源。

在实际应用中,所述缓存模块402,具体适于采用钩子函数截获所述资源访问请求对应的响应数据。

在实际应用中,所述缓存模块,具体根据所述响应数据的数据特征和/或位置特征,从所述响应数据中提取图片资源、音频资源、视频资源等网页素材资源。其中,所述数据特征包括文件格式和文件大小。

为了快速、准确地实现网页素材资源的抓取,本发明实施例中缓存模块402通过分析确定响应数据的数据特征和/或位置特征,例如,不同的网页素材资源对应的文件格式和文件大小,如,视频资源的文件格式为.MP4文件,以及通常设置在数据中的位置等特征,根据这些特征,快速、准确地从响应数据中抓取出网页元素文件和网页形态文件。

图6示意性示出了本发明另一个实施例的网页离线浏览装置的结构示意图。

参照图6,本发明实施例的网页离线浏览装置具体包括配置模块601、缓存模块602、查找模块603以及生成模块604,其中,配置模块601,适于建立目标网页的本地缓存模板。缓存模块602,适于监控目标网页浏览过程中存在的资源访问请求,获取所述资源访问请求对应的网页素材资源。其中,网页素材资源包括图片资源、音频资源、视频资源和文字资源中的至少一种。本实施例中的本地缓存模板对应的脚本文件中包含有与所述资源访问请求对应的URL地址。查找模块603,适于在所述缓存模块将获取的网页素材资源缓存在本地之前,查找本地缓存列表中是否存储有所述资源访问请求对应的URL地址。所述缓存模块602,适于在所述本地缓存列表中没有存储所述资源访问请求对应的URL地址时,将获取的网页素材资源缓存在本地。生成模块604,适于将所述网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。

本发明实施例,通过在查找本地缓存列表中是否存储有所述资源访问请求对应的URL地址,若本地缓存列表中已经存储有所述资源访问请求对应的URL地址,即该资源访问请求对应的网页素材资源已经进行本地缓存,可直接加载目标网页对应的离线网页,进行浏览,避免对网页素材资源进行重复缓存,不仅能够减少缓存资源的浪费,还能够降低缓存过多对系统性能的影响,有效地提升用户体验。

在本发明的一个可选实施例中,该装置还包括附图中未示出的获取模块和检测模块,其中,该获取模块,适于在所述缓存模块将获取的网页素材资源缓存在本地之前,获取终端的网络状态;该检测模块,适于检测所述获取模块获取的终端的网络状态是否符合预定条件。

相应地,所述缓存模块,适于在所述检测模块的检测结果为符合所述预定条件时,将获取的网页素材资源缓存在本地。

为了保证网页素材资源能够有效地进行缓存,避免由于网络不符合预定条件造成的用户利益受损问题,本发明实施例中,获取模块在将获取的网页素材资源缓存在本地之前,对当前网络状态进行。其中,所述预定条件包括如下条件中的至少一种:

使用无线网络;

网络信号强度高于第一阈值;

流量套餐中的剩余流量大于第二阈值。

进一步地,所述获取模块,还适于在所述缓存模块将获取的网页素材资源缓存在本地之前,获取终端的可用存储容量。

所述缓存模块,适于在所述可用存储容量大于预设容量阈值时,将获取的网页素材资源缓存在本地。

本发明实施例中,获取模块通过获取当前终端的可用存储容量,对所述可用存储容量进行判断,若可用存储容量大于预设容量阈值,则执行所述将获取的网页素材资源缓存在本地的步骤,若可用存储容量小于或等于预设容量阈值,则提示用户当前存储容量不足,稍后再尝试存储或进行内存清除操作,以预留足够空间进行响应数据的缓存,进而避免由于内存不足造成的无效存储或系统错误等问题。

在本发明的一个可选实施例中,该网页离线浏览装置还包括附图中未示出的播放模块,该播放模块,适于在对缓存在本地的视频资源、音频资源进行播放时,去除广告部分,以进一步提升用户的离线浏览体验。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

在本发明实施例提供的网页离线浏览方法及装置,通过将资源访问请求对应的网页素材资源缓存在本地,并将网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。本发明实施例使得用户可以在离线状态下,实现对目标网页中链接的已经浏览过的网页素材资源的离线浏览,节约网络流量和页面加载时间,提升用户体验。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的网关、代理服务器、系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

本发明提供下列技术方案:

A1、一种网页离线浏览方法,包括:

建立目标网页的本地缓存模板;

监控目标网页浏览过程中存在的资源访问请求,获取所述资源访问请求对应的网页素材资源,并将获取的网页素材资源缓存在本地;

将所述网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。

A2、根据A1所述的方法,所述建立目标网页的本地缓存模板,包括:

在所述目标网页加载过程中,抓取所述目标网页中的网页元素和网页样式文件;

根据所述网页元素和网页样式文件建立所述目标网页的本地缓存模板。

A3、根据A1或A2所述的方法,所述获取所述资源访问请求对应的网页素材资源,包括:

截获目标网页浏览过程中存在的所述资源访问请求,获取所述资源访问请求对应的URL地址;通过所述URL地址抓取所述网页素材资源。

A4、根据A1或2所述的方法,所述获取所述资源访问请求对应的网页素材资源,包括:

截获所述资源访问请求对应的响应数据,从所述响应数据中提取所述网页素材资源。

A5、根据A4所述的方法,所述截获所述资源访问请求对应的响应数据,包括:

采用钩子函数截获所述资源访问请求对应的响应数据。

A6、根据A1-5任一项所述的方法,在所述将获取的网页素材资源缓存在本地之前,还包括:

查找本地缓存列表中是否存储有所述资源访问请求对应的URL地址;

若否,则将获取的网页素材资源缓存在本地。

A7、根据A1-6任一项所述的方法,在所述将获取的网页素材资源缓存在本地之前,还包括:

获取终端的网络状态;

检测所述网络状态是否符合预定条件;

若检测结果为符合所述预定条件,则执行所述将获取的网页素材资源缓存在本地的步骤。

A8、根据A1-7任一项所述的方法,在所述将获取的网页素材资源缓存在本地之前,还包括:

获取终端的可用存储容量;

若所述可用存储容量大于预设容量阈值,则执行所述将获取的网页素材资源缓存在本地的步骤。

A9、根据A1-8任一项所述的方法,其中,所述网页素材资源包括图片资源、音频资源、视频资源中的至少一种。

A10、根据A9所述的方法,还包括:

在对缓存在本地的视频资源、音频资源进行播放时,去除广告部分。

B11、一种网页离线浏览装置,包括:

配置模块,适于建立目标网页的本地缓存模板;

缓存模块,适于监控目标网页浏览过程中存在的资源访问请求,获取所述资源访问请求对应的网页素材资源,并将获取的网页素材资源缓存在本地;

生成模块,适于将所述网页素材资源的本地缓存地址作为本地缓存模板中与所述资源访问请求对应的URL地址,生成目标网页对应的离线网页。

B12、根据B11所述的装置,所述配置模块,包括:

抓取单元,适于在所述目标网页加载过程中,抓取所述目标网页中的网页元素和网页样式文件;

配置单元,适于根据所述网页元素和网页样式文件建立所述目标网页的本地缓存模板。

B13、根据B11或12所述的装置,所述缓存模块,具体适于截获目标网页浏览过程中存在的所述资源访问请求,获取所述资源访问请求对应的URL地址;通过所述URL地址抓取所述网页素材资源。

B14、根据B11或12所述的装置,所述缓存模块,具体适于截获所述资源访问请求对应的响应数据,从所述响应数据中提取所述网页素材资源。

B15、根据B14所述的装置,所述缓存模块,具体适于采用钩子函数截获所述资源访问请求对应的响应数据。

B16、根据B11-15任一项所述的装置,还包括:

查找模块,适于在所述缓存模块将获取的网页素材资源缓存在本地之前,查找本地缓存列表中是否存储有所述资源访问请求对应的URL地址;

所述缓存模块,适于在所述本地缓存列表中没有存储所述资源访问请求对应的URL地址时,将获取的网页素材资源缓存在本地。

B17、根据B11-16任一项所述的装置,还包括:

获取模块,适于在所述缓存模块将获取的网页素材资源缓存在本地之前,获取终端的网络状态;

检测模块,适于检测所述获取模块获取的终端的网络状态是否符合预定条件;

所述缓存模块,适于在所述检测模块的检测结果为符合所述预定条件时,将获取的网页素材资源缓存在本地。

B18、根据B11-17任一项所述的装置,所述获取模块,还适于在所述缓存模块将获取的网页素材资源缓存在本地之前,获取终端的可用存储容量;

所述缓存模块,适于在所述可用存储容量大于预设容量阈值时,将获取的网页素材资源缓存在本地。

B19、根据B11-18任一项所述的装置,其中,所述网页素材资源包括图片资源、音频资源、视频资源中的至少一种。

B20、根据B19所述的装置,还包括:

播放模块,适于在对缓存在本地的视频资源、音频资源进行播放时,去除广告部分。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1