一种网页离线访问方法及装置制造方法

文档序号:6503203阅读:92来源:国知局
一种网页离线访问方法及装置制造方法
【专利摘要】本发明适用于网络【技术领域】,提供了一种网页离线访问方法及装置,包括:获取第一网页的本地缓存模板,所述本地缓存模板中预存储了用于指向指定URL在网页中所处位置的路径,所述指定URL为所述网页中需要实现网页离线访问的URL;根据所述第一网页的本地缓存模板中预存储的路径,对所述第一网页中的所述指定URL对应的第二网页进行本地缓存,以当浏览器访问所述第一网页中的所述指定URL时,由本地载入所述第二网页。本发明对实现网页离线访问的整个操作过程进行简化,提高了操作效率。
【专利说明】一种网页离线访问方法及装置

【技术领域】
[0001]本发明属于网络【技术领域】,尤其涉及一种网页离线访问方法及装置。

【背景技术】
[0002]随着移动互联网的广泛普及,移动终端可以随时随地地实现网络连接,通过安装在移动终端的浏览器实现网页访问,及时获取到用户所需的各类信息资讯。
[0003]通常,移动终端在通用分组无线服务技术(General Packet Rad1 Service,GPRS)、宽带码分多址(Wideband Code Divis1n Multiple Access, WCDMA)等非无线保真技术(Wireless Fidelity, Wi_Fi)方式下进行网络连接时,消耗的网络流量会产生相应的流量费用,因此,目前的浏览器支持对网页的离线访问,当移动终端在W1-Fi方式下进行网络连接时,能够通过浏览器对网页进行本地缓存,以在非W1-Fi的网络环境下甚至离线环境下由本地载入该网页,实现该网页的离线访问。
[0004]目前的浏览器仅能够支持对当前显示的网页进行本地缓存,若希望同时对该网页中包含的各式各样的网页链接所对应的网页也实现离线访问,则需要一一载入这些网页链接所对应的网页,依次对这些网页进行本地缓存,操作过程十分繁琐。


【发明内容】

[0005]本发明实施例的目的在于提供一种网页离线访问方法,以简化实现网页离线访问的操作过程,提高操作效率。
[0006]本发明实施例是这样实现的,一种网页离线访问方法,包括:
[0007]获取第一网页的本地缓存模板,所述本地缓存模板中预存储了用于指向指定URL在网页中所处位置的路径,所述指定URL为所述网页中需要实现网页离线访问的URL ;
[0008]根据所述第一网页的本地缓存模板中预存储的路径,对所述第一网页中的所述指定URL对应的第二网页进行本地缓存,以当浏览器访问所述第一网页中的所述指定URL时,由本地载入所述第二网页。
[0009]本发明实施例的另一目的在于提供一种网页离线访问装置,包括:
[0010]获取单元,用于获取第一网页的本地缓存模板,所述本地缓存模板中预存储了用于指向指定URL在网页中所处位置的路径,所述指定URL为所述网页中需要实现网页离线访问的URL ;
[0011]本地缓存单元,用于根据所述第一网页的本地缓存模板中预存储的路径,对所述第一网页中的所述指定URL对应的第二网页进行本地缓存,以当浏览器访问所述第一网页中的所述指定URL时,由本地载入所述第二网页。
[0012]本发明实施例在通过浏览器对网页实现离线访问的过程中,能够同时对一个网页以及该网页中包含的网页链接进行本地缓存,使得浏览器在对该网页进行离线访问时,能够同时对该网页中包含的网页链接也进行离线访问。本发明实施例对实现网页离线访问的整个操作过程进行简化,提高了操作效率。

【专利附图】

【附图说明】
[0013]图1是本发明实施例提供的网页离线访问方法的实现流程图;
[0014]图2是本发明实施例提供的网页离线访问方法S102的具体实现流程图;
[0015]图3是本发明实施例提供的网页离线访问方法SlOl的具体实现流程图;
[0016]图4是本发明另一实施例提供的网页离线访问方法的实现流程图;
[0017]图5是本发明实施例提供的网页离线访问装置的结构框图。

【具体实施方式】
[0018]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0019]本发明实施例在通过浏览器对网页实现离线访问的过程中,能够同时对一个网页以及该网页中包含的网页链接进行本地缓存,使得浏览器在对该网页进行离线访问时,能够同时对该网页中包含的网页链接也进行离线访问。本发明实施例对实现网页离线访问的整个操作过程进行简化,提高了操作效率。
[0020]在本发明实施例中,实现网页离线访问的浏览器可以为运行于个人计算机(Personal Computer,PC)中的浏览器客户端,还可以为运行于智能手机、平板电脑、掌上电脑(Personal Digital Assistant, PDA)等智能移动终端设备上的浏览器客户端。
[0021]图1示出了本发明实施例提供的网页离线访问方法的实现流程,详述如下:
[0022]在SlOl中,获取第一网页的本地缓存模板,所述本地缓存模板中预存储了用于指向指定URL在网页中所处位置的路径,所述指定URL为所述网页中需要实现网页离线访问的 URL。
[0023]其中,第一网页可以为当前显示在浏览器中的网页,也可以为用户端在浏览器的书签、导航栏或者当前显示网页中选择的页面统一资源定位符(Uniform ResourceLocator,URL)所对应的网页。在实现网页离线访问的操作过程中,第一网页作为所有需要进行本地缓存的网页的根节点,其余在该过程中需要进行本地缓存的网页均是与该第一网页具备链接或者间接链接关系的网页。
[0024]在本实施例中,浏览器内预置了第一网页的本地缓存模板,在第一网页页面内的所有需要同时实现网页离线访问的URL,其在第一网页页面内所处的位置均是通过路径的方式存储在第一网页的本地缓存模板中的,因此,通过本地缓存模板中预存储的路径,能够在第一网页的页面结构中准确地定位出需要实现网页离线访问的URL,从而获取到该URL。
[0025]在具体实现中,通常来说,每个网页都会拥有一个可扩展标记语言(ExtensibleMarkup Language, XML)文档,其用于通过树状结构标记该网页,使该网页具有结构性的标记语言,而XML路径语言(XML Path Language, XPath)则为一种用来确定XML文档中某部分位置的语言,其提供在数据结构树中找寻节点的能力。因此,可以利用XPath来指向需要实现离线访问的URL在第一网页的页面内的所处位置,并将第一网页中所有需要实现离线访问的URL的XPath均统一存储在第一网页的本地缓存模板中。
[0026]在本实施例中,所述指定URL即为第一网页中所有需要实现离线访问的URL,其可以为第一网页中的全部或者部分URL。而对于第一网页的本地缓存模板的获取方式将在后续实施例中进行详细说明,在此不再赘述。
[0027]在S102中,根据所述第一网页的本地缓存模板中预存储的路径,对所述第一网页中的所述指定URL对应的第二网页进行本地缓存,以当浏览器访问所述第一网页中的所述指定URL时,由本地载入所述第二网页。
[0028]在本实施例中,通过遍历第一网页的本地缓存模板中预存储的所有路径,依次在第一网页的相应位置上获取到需要实现离线访问的指定URL,从而一一访问获取到的指定URL,以对这些指定URL对应的第二网页进行本地缓存。
[0029]具体地,S102可以如图2所示:
[0030]在S201中,根据所述第一网页的本地离线缓存模板中预存储的路径,获取所述第一网页中的所述指定URL。
[0031]例如,第一网页的其中一条XPath 为:/html/body/div/div[2]/hl/p/b/a,则可以在第一网页的XML文档中按照该XPath在相应位置寻找到a,按照此原理,能够根据第一网页的本地离线缓存模板中预存储的路径,在第一网页的相应位置寻找并获取到需要实现网页离线访问的指定URL。
[0032]在S202中,访问该指定URL,将该指定URL对应的所述第二网页保存为本地网页文件。
[0033]在本实施例中,通过访问该指定URL,从该指定URL指向的服务器下载到该指定URL对应的第二网页,并将该第二网页保存为本地网页文件。其中,本地网页文件可以以Webarchive文件的形式被保存,该Webarchive文件为一种能够在离线状态下被浏览器打开的网页文件,能够将第二网页保存为Webarchive文件,在后续浏览器访问该第二网页的URL时,不需要再从该URL指向的服务器下载数据,而是直接在本地调用该第二网页的Webarchive文件,即可实现浏览器对第二网页的加载。
[0034]在S203中,关联该指定URL与所述本地网页文件,以当浏览器访问该指定URL时,由本地载入所述本地网页文件。
[0035]在将第二网页保存为本地网页文件之后,可以将该指定URL与该本地网页文件在本地进行关联,由此,当在浏览器中通过点击指令或者选择指令访问该指定URL时,可以直接在本地载入该本地网页文件,从而实现对该指定URL对应的第二网页的离线访问。
[0036]作为本发明的一个实施例,在S102执行本地缓存之前,可以先对浏览器当前所处的网络环境进行判断,例如,判断浏览器当前是否处在W1-Fi等网络流量不产生相应的流量费用环境下,是则再执行本地缓存,否则等到浏览器处于W1-Fi环境下时再执行本地缓存,从而达到节约网络流量成本的目的。
[0037]需要说明的是,在本实施例中,第一网页作为需要实现离线访问的所有第二网页的根节点,其可以直接通过S202和S203的步骤进行本地缓存,或者依据现有的网页本地缓存方式进行本地缓存,在此不用于限定本发明。
[0038]以下,对SlOl中第一网页的本地缓存模板的获取方式进行详细说明:
[0039]作为本发明的一个实施例,SlOl具体为:
[0040]从第三方服务器中下载所述第一网页的本地缓存模板。
[0041]在本实施例中,第三方服务器可以为浏览器的服务端,也可以为第一网页所在网站的服务端。当第三方服务器为浏览器的服务端时,第三方服务器可以通过其大量浏览器客户端的访问数据,统计并生成一些常用网站或者常用网页的本地缓存模板;当第三方服务器为第一网页所在网站的服务端时,该服务端也可以通过其网站的大量用户访问数据,统计并生成第一网页的本地缓存模板。
[0042]因此,在本实施例中,可以将第一网页的URL作为第一网页的唯一标识,根据该标识从第三方服务器中下载到第一网页的本地缓存模板,通过该本地缓存模板,能够基本覆盖到用户感兴趣的网页链接,同时,也能够预先过滤掉网页中的广告链接,避免无效或者无用信息的下载。
[0043]作为本发明的另一实施例,第一网页的本地缓存模板也可以在浏览器本地生成,具体地,SlOl如图3所示:
[0044]在S301中,提取所述浏览器对所述第一网页的访问历史,所述访问历史中记录了所述第一网页中被所述浏览器访问过的URL。
[0045]通过查询浏览器的访问历史,可以得到浏览器访问过第一网页中的哪些URL,从而提取到浏览器对第一网页的访问历史。
[0046]在S302中,将所述访问历史中记录的URL确定为所述第一网页的所述指定URL。
[0047]在本实施例中,将第一网页中被浏览器访问过的URL确定为需要实现网页离线访问的URL。
[0048]在S303中,获取用于指向所述第一网页的所述指定URL在所述第一网页中所处位置的路径。
[0049]根据第一网页的指定URL在第一网页的XML文档中的位置,能够确定出该位置在该XML文档中的路径。
[0050]在S304中,根据获取到的路径生成所述第一网页的本地缓存模板。
[0051]将S303中获取到的路径逐一存储至第一网页的本地缓存模板中,由此,即生成了符合浏览器访问习惯的本地缓存模板。
[0052]进一步地,还可以在S302中,对访问历史中的URL进行进一步筛选,例如,对于访问次数超过预设阈值的URL,才将其确定为指定URL,由此提高了本地缓存模板中指向的URL的准确性,避免因浏览器误访问过广告等网页而也将这些网页的URL作为需要实现网页离线访问的指定URL。
[0053]在本实施例中,通过在浏览器本地生成第一网页的本地缓存模板,使得本地缓存模板中指向的URL符合浏览器用户端的浏览习惯,浏览器用户端也可以对生成的本地缓存模板进行重新定义或者筛选,以修订出更加符合自身浏览习惯的本地缓存模板。
[0054]进一步地,作为本发明的一个实施例,在第一网页的本地缓存模板中,还可以嵌套其他本地缓存模板,以实现多级网页的同时本地缓存,由此进一步提高了网页本地缓存的操作效率。如图4所示,所述方法还包括:
[0055]在S401中,检测是否存在所述第二网页的本地缓存模板。
[0056]对于第一网页中的指定URL所对应的第二网页,可以根据该指定URL向第三方服务器或者浏览器本地发起查询请求,检测是否存在第二网页的本地缓存模板。
[0057]在S402中,若存在所述第二网页的本地缓存模板,则根据该本地缓存模板中预存储的路径,对所述第二网页中的所述指定URL对应的网页进行本地缓存,以当浏览器访问所述第二网页中的所述指定URL时,由本地载入相应的网页。
[0058]同样地,第二网页的本地缓存模板中预存储了第二网页中的指定URL对应的网页,若检测到存在第二网页的本地缓存模板,则可以根据第二网页的本地缓存模板中预存储的路径,按照图2实施例的相同原理,对第二网页中的指定URL所对应的网页进行本地缓存,从而在浏览器访问第二网页中的指定URL时,能够直接由本地载入相应的网页。
[0059]例如,在网站A的首页中又将网站B作为友情链接进行展示,则可以在对网站A首页中的指定URL实现网页离线访问的同时,通过调用网站B的本地缓存模板,也对网站B中的指定URL实现网页离线访问,由此,若浏览器在载入网站A首页后对该首页中链接的网站B进行了离线访问,则浏览器也可以在载入了网站B的首页后,继续点击网站B的首页中的链接,对该链接进行离线访问。
[0060]在本实施例中,同时进行网页本地缓存的网页链接的级数可以为系统默认或者用户自定义。
[0061]进一步地,所述方法还包括:
[0062]更新已进行了本地缓存的所述指定URL对应的网页。
[0063]例如,若第一网页为某个门户网站的首页,而该第一网页中的某个指定URL为该门户网站的新闻频道,则该新闻频道对应的URL实际上是不会变化的,但其内容却会随着新闻事件的发生而实时地进行更新,因此,在本实施例中,可以定时或者通过指令触发更新过程,对已进行了本地缓存的网页内容进行更新,从而保证浏览器离线访问的是网页的最新内容。
[0064]本发明实施例在通过浏览器对网页实现离线访问的过程中,能够同时对一个网页以及该网页中包含的网页链接进行本地缓存,使得浏览器在对该网页进行离线访问时,能够同时对该网页中包含的网页链接也进行离线访问。本发明实施例对实现网页离线访问的整个操作过程进行简化,提高了操作效率。
[0065]图5示出了本发明实施例提供的网页离线访问装置的结构框图,该装置可以用于运行本发明图1至图4实施例所述的网页离线访问方法。为了便于说明,仅示出了与本实施例相关的部分。
[0066]参照图5,该装置包括:
[0067]获取单元51,获取第一网页的本地缓存模板,所述本地缓存模板中预存储了用于指向指定URL在网页中所处位置的路径,所述指定URL为所述网页中需要实现网页离线访问的URL ;
[0068]本地缓存单元52,根据所述第一网页的本地缓存模板中预存储的路径,对所述第一网页中的所述指定URL对应的第二网页进行本地缓存,以当浏览器访问所述第一网页中的所述指定URL时,由本地载入所述第二网页。
[0069]可选地,所述获取单元51具体用于从第三方服务器中下载所述第一网页的本地缓存模板。
[0070]可选地,所述获取单元51包括:
[0071]提取子单元,提取所述浏览器对所述第一网页的访问历史,所述访问历史中记录了所述第一网页中被所述浏览器访问过的URL。
[0072]确定子单元,将所述访问历史中记录的URL确定为所述第一网页的所述指定URL。
[0073]路径获取子单元,获取用于指向所述第一网页的所述指定URL在所述第一网页中所处位置的路径。
[0074]生成子单元,根据获取到的路径生成所述第一网页的本地缓存模板。
[0075]可选地,所述本地缓存单元52包括:
[0076]URL获取子单元,根据所述第一网页的本地离线缓存模板中预存储的路径,获取所述第一网页中的所述指定URL。
[0077]保存子单元,访问该指定URL,将该指定URL对应的所述第二网页保存为本地网页文件。
[0078]关联子单元,关联该指定URL与所述本地网页文件,以当浏览器访问该指定URL时,由本地载入所述本地网页文件。
[0079]可选地,所述装置还包括:
[0080]检测单元,检测是否存在所述第二网页的本地缓存模板。
[0081]若存在所述第二网页的本地缓存模板,则所述本地缓存单元52还用于根据该本地缓存模板中预存储的路径,对所述第二网页中的所述指定URL对应的网页进行本地缓存,以当浏览器访问所述第二网页中的所述指定URL时,由本地载入相应的网页。
[0082]可选地,所述装置还包括:
[0083]更新单元,用于更新已进行了本地缓存的所述指定URL对应的网页。
[0084]本发明实施例在通过浏览器对网页实现离线访问的过程中,能够同时对一个网页以及该网页中包含的网页链接进行本地缓存,使得浏览器在对该网页进行离线访问时,能够同时对该网页中包含的网页链接也进行离线访问。本发明实施例对实现网页离线访问的整个操作过程进行简化,提高了操作效率。
[0085]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种网页离线访问方法,其特征在于,包括: 获取第一网页的本地缓存模板,所述本地缓存模板中预存储了用于指向指定统一资源定位符URL在网页中所处位置的路径,所述指定URL为所述网页中需要实现网页离线访问的 URL ; 根据所述第一网页的本地缓存模板中预存储的路径,对所述第一网页中的所述指定URL对应的第二网页进行本地缓存,以当浏览器访问所述第一网页中的所述指定URL时,由本地载入所述第二网页。
2.如权利要求1所述的方法,其特征在于,所述获取第一网页的本地缓存模板包括: 从第三方服务器中下载所述第一网页的本地缓存模板。
3.如权利要求1所述的方法,其特征在于,所述获取第一网页的本地缓存模板包括: 提取所述浏览器对所述第一网页的访问历史,所述访问历史中记录了所述第一网页中被所述浏览器访问过的URL ; 将所述访问历史中记录的URL确定为所述第一网页的所述指定URL ; 获取用于指向所述第一网页的所述指定URL在所述第一网页中所处位置的路径; 根据获取到的路径生成所述第一网页的本地缓存模板。
4.如权利要求1?3任一项所述的方法,其特征在于,所述根据所述第一网页的本地缓存模板中预存储的路径,对所述第一网页中的所述指定URL对应的第二网页进行本地缓存包括: 根据所述第一网页的本地离线缓存模板中预存储的路径,获取所述第一网页中的所述指定URL ; 访问该指定URL,将该指定URL对应的所述第二网页保存为本地网页文件; 关联该指定URL与所述本地网页文件,以当浏览器访问该指定URL时,由本地载入所述本地网页文件。
5.如权利要求1?3任一项所述的方法,其特征在于,所述方法还包括: 检测是否存在所述第二网页的本地缓存模板; 若存在所述第二网页的本地缓存模板,则根据该本地缓存模板中预存储的路径,对所述第二网页中的所述指定URL对应的网页进行本地缓存,以当浏览器访问所述第二网页中的所述指定URL时,由本地载入相应的网页。
6.如权利要求1?3任一项所述的方法,其特征在于,所述方法还包括: 更新已进行了本地缓存的所述指定URL对应的网页。
7.—种网页离线访问装置,其特征在于,包括: 获取单元,用于获取第一网页的本地缓存模板,所述本地缓存模板中预存储了用于指向指定URL在网页中所处位置的路径,所述指定URL为所述网页中需要实现网页离线访问的 URL ; 本地缓存单元,用于根据所述第一网页的本地缓存模板中预存储的路径,对所述第一网页中的所述指定URL对应的第二网页进行本地缓存,以当浏览器访问所述第一网页中的所述指定URL时,由本地载入所述第二网页。
8.如权利要求7所述的装置,其特征在于,所述获取单元具体用于从第三方服务器中下载所述第一网页的本地缓存模板。
9.如权利要求7所述的装置,其特征在于,所述获取单元包括: 提取子单元,用于提取所述浏览器对所述第一网页的访问历史,所述访问历史中记录了所述第一网页中被所述浏览器访问过的URL ; 确定子单元,用于将所述访问历史中记录的URL确定为所述第一网页的所述指定URL ; 路径获取子单元,用于获取用于指向所述第一网页的所述指定URL在所述第一网页中所处位置的路径; 生成子单元,用于根据获取到的路径生成所述第一网页的本地缓存模板。
10.如权利要求7?9任一项所述的装置,其特征在于,所述本地缓存单元包括: URL获取子单元,用于根据所述第一网页的本地离线缓存模板中预存储的路径,获取所述第一网页中的所述指定URL ; 保存子单元,用于访问该指定URL,将该指定URL对应的所述第二网页保存为本地网页文件; 关联子单元,用于关联该指定URL与所述本地网页文件,以当浏览器访问该指定URL时,由本地载入所述本地网页文件。
11.如权利要求7?9任一项所述的装置,其特征在于,所述装置还包括: 检测单元,用于检测是否存在所述第二网页的本地缓存模板; 若存在所述第二网页的本地缓存模板,则所述本地缓存单元还用于根据该本地缓存模板中预存储的路径,对所述第二网页中的所述指定URL对应的网页进行本地缓存,以当浏览器访问所述第二网页中的所述指定URL时,由本地载入相应的网页。
12.如权利要求7?9任一项所述的装置,其特征在于,所述装置还包括: 更新单元,用于更新已进行了本地缓存的所述指定URL对应的网页。
【文档编号】G06F17/30GK104182408SQ201310196199
【公开日】2014年12月3日 申请日期:2013年5月23日 优先权日:2013年5月23日
【发明者】豆宁军 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1