一种网页资源处理方法、装置及设备的制作方法

文档序号:6380308阅读:335来源:国知局
专利名称:一种网页资源处理方法、装置及设备的制作方法
技术领域
本发明涉及信息处理技术领域,更具体地,涉及一种网页资源处理方法、装置及设 备。
背景技术
随着互联网的发展,以及个人电脑、手持设备(如手机、平板电脑)等终端的智能化 程度越来越高,人们越来越多地使用这些终端访问网页。目前,网页可内嵌的元素种类也越 来越多,例如图片、视频、动画等。目前,由于网络推广的范围广,网页中除了正文外,广告也越来越多,因此,用户在 查看网页时,会下载大量的广告和无用信息,这就带来了以下技术问题(1)当用户通过WiFi (无线保真,Wireless-Fidelity)网络访问网页时,虽然WiFi 网速较快,但是由于网页中包含的大量的广告和无用信息,仍会占用大部分带宽、增加CPU 处理时间、占用很多内存、消耗很多电量、显示网页的速度慢等问题;(2)当用户通过移动通信网络,例如通过2G (2rd_generation,第二代手机通信技 术规格)(如CDMA (Code Division Multiple Access,码分多址)、GSM(global system for mobile communications,全球移动通信系统))、3G(3rd_generation,第三代移动通信技术) (如WCDMA (Wideband Code Division Multiple Access,宽带码分多址)、TD_SCDMA (Time Division-Synchronous Code Division Multiple Access,时分同步码分多址)、CDMA 2000 (Code Division Multiple Access 2000,码分多址 2000))或 4G (4th_generation,第四代 移动通信技术)等付费网络访问网页时,由于需要下载大量的广告和无用信息,因此会耗费 流量,导致资费上升,同时也存在需要更多的CPU处理时间、占用很多内存、消耗很多电量、 显示网页的速度慢等问题。综上所述,目前的网页由于包含大量的无用信息,导致用户在浏览网页时,要加载 很多对于用户无用的资源,导致网页显示速度慢,增大终端的信息处理量,占用多余的带 宽,且用户体验差。

发明内容
本发明实施例的提出一种网页资源处理方法、装置及设备,能够对网页资源进行 分析,避免下载无用的子文档。本发明实施例提出一种网页资源处理方法,包括以下步骤根据网页的访问请求获取所述网页对应的页面主文档;根据预设输出内容确定所述页面主文档中的第一资源链接;下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。本发明实施例通过分析源文件中的资源链接,仅下载用于显示网页的预设输出内 容的资源链接对应的子文档,可以使浏览器过滤掉广告等无用的部分,提升访问速度,节省 流量。
作为上述技术方案的优选,所述下载所述第一资源链接对应的子文档以用于输出 所述网页的预设输出内容之前,所述方法还包括确定所述页面主文档中的第二资源链接,所述第二资源链接包括指向用于规定 所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。本方案针对有可能需要下载用于规定所述网页的运行逻辑的子文档和/或指向 用于规定所述网页的布局的子文档,增加了确定第二资源链接的步骤。作为上述技术方案的优选,下载所述第一资源链接对应的子文档以用于输出所述 网页的预设输出内容,采用如下方式下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页 的预设输出内容。作为上述技术方案的优选,所述根据预设输出内容确定所述页面主文档中的第一 资源链接,采用如下方式确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所 述页面主文档中的资源链接候选队列;确定所述资源链接候选队列中指向的子文档类型不符合所述预设输出内容中的 子文档类型的资源链接;删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。作为上述技术方案的优选,所述根据预设输出内容确定所述页面主文档中的第一 资源链接,采用如下方式根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选 队列;确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接 候选队列中的资源链接是否存在于所述节点中;删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源 链接。作为上述技术方案的优选,所述确定在所述页面主文档中与所述预设输出内容对 应的节点,采用如下方式根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为 在所述页面主文档中与所述预设输出内容对应的节点。本发明实施例还提出一种网页资源处理装置,包括获取模块,用于根据网页的访问请求获取所述网页对应的页面主文档;第一确定模块,用于根据预设输出内容确定所述页面主文档中的第一资源链接;下载子文档模块,用于下载所述第一资源链接对应的子文档以用于输出所述网页 的预设输出内容。作为上述技术方案的优选,所述装置还包括第二确定模块,用于确定所述页面主文档中的第二资源链接,所述第二资源链接 包括指向用于规定所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的 布局的子文档的链接。
作为上述技术方案的优选,所述下载子文档模块用于下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页 的预设输出内容。作为上述技术方案的优选,所述第一确定模块用于确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所 述页面主文档中的资源链接候选队列;确定所述资源链接候选队列中指向的子文档类型不符合所述预设输出内容中的 子文档类型的资源链接;删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。作为上述技术方案的优选,所述第一确定模块用于根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选 队列;确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接 候选队列中的资源链接是否存在于所述节点中;删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源 链接。作为上述技术方案的优选,所述第一确定模块用于根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为 在所述页面主文档中与所述预设输出内容对应的节点。本发明实施例还提出一种设备,所述设备包括一个或多个处理器;存储器;和一个或多个模块,所述一个或多个模块存储于所述存储器中并被配置成由所述一 个或多个处理器执行,其中,所述一个或多个模块具有如下功能根据网页的访问请求获取所述网页对应的页面主文档;根据预设输出内容确定所述页面主文档中的第一资源链接;下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。本发明实施例的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明 书中变得显而易见,或者通过实施本发明实施例而了解。本发明实施例的目的和其他优点 可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本发明实施例的技术方案做进一步的详细描述。


附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发 明的实施例一起用于解释本发明实施例,并不构成对本发明实施例的限制。在附图中图I是本发明优选实施例提出的网页资源处理方法的流程图;图2是本发明一具体实施例提出的网页资源处理方法的流程图;图3是本发明优选实施例提出的网页资源处理装置的结构示意图;图4是本发明优选实施例提出的网页资源处理装置的第二种结构示意图。
具体实施例方式以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实 施例仅用于说明和解释本发明实施例,并不用于限定本发明实施例。如图1所示为本发明优选实施例提出的网页资源处理方法的流程图,该方包括以 下步骤步骤S101 :根据网页的访问请求获取所述网页对应的页面主文档;步骤S102 :根据预设输出内容确定所述页面主文档中的第一资源链接;步骤S103 :下载所述第一资源链接对应的子文档以用于输出所述网页的预设输 出内容。本发明实施例通过分析源文件中的资源链接,仅下载用于显示网页的预设输出内 容的资源链接对应的子文档,可以使浏览器过滤掉广告等无用的部分,提升访问速度,节省流量。下面通过具体实施例来对本发明实施例提出的用于显示网页的方法进行详细说 明。具体实施例一如图2所示,是以在手机浏览器中实现本方法实施例提出的网页资 源处理方法为例,具体地,该方法包括以下步骤步骤S201 :用户在手机浏览器中输入请求访问的网址,并发出访问请求。在本实施例中,以以下网址为例进行说明http://news. sina. com. cn/c/2012-09-04/093225096490, shtml。步骤S202 :服务器在接收到访问请求后,将该网页的页面主文档发送至浏览器。在相关技术中,页面主文档包括但不限于超文本标记语言(Hypertext Markup Languagehtml, HTML)文件、超文本预处理(Hypertext Preprocessor, PHP)文件和使用服 务器端嵌入(Server Side Include, SSI)的 html,即 SHTML 文件等;步骤S203 :浏览器对页面主文档进行解析,获取全部资源链接。较佳地,本步骤S203可以为浏览器将页面主文档中的资源进行排列,依次放入资源列表中,在资源列表中,记 录有每一个资源链接以及这个资源链接所指向的子文档的类型。其中,资源链接通常以统一资源定位符(Uniform/Universal Resource Locator, URL)的形式出现。在本实施例中,子文档指的是页面主文档中的每个资源链接对应的资源,或网页 中的元素,例如欲显示的网页中的视频、图片等。浏览器建立资源列表时确定每个资源链接所指向的子文档的类型的方法可以如 下,以下以HTML文档为例进行说明,在大多数HTML网页中(1) 一部分URL会在HTML文档中指明其所指向的子文档的类型例如从〈linkrel="alternate"type="application/rss+xml"title="新浪体育_焦 点新闻 〃href = 〃http://rss. sina. com. cn/news/allnews/sports. xml〃/> 可知,资源链接 〃http://rss. sina. com. cn/news/al lnews/sports. xml〃 的类型为
type=//application/rss+xml// ;从〈script type=//text/javascript//src=//http ://i 1. sinaimg. cn/home/ sinaflash. js">〈/script)可知,资源链接"http://il. sinaimg. cn/home/sinaflash, js" 指向的子文档的类型为type="text/javascript";从〈img src=//http://i2. sinaimg. cn/c. gif 〃 width=//l//height=//l//alt=// 到路径导航栏"/>可知,资源链接"http://i2. sinaimg. cn/c. gif"所指向的文档类型为 图片。(2)另外一部分,可通过URL的后缀名得到其类型例如资源链接“http://i3. sinaimg. cn/ty/main/logo/logo_home_sports_nonike. gif”的后缀名为“gif”,通过该后缀名可知其指向的子文档的类型为图像互换格式 (Graphics Interchange Format, GIF);资源链接“http://news.sina. com. cn/js/694/2012/0713/build. 1. 0. js”的后缀 名为“js”,该资源链接对应的子文档为JAVA脚本(Java Script)文件;资源链接“http://news.sina. com. cn/css/87/20120625/247/style, css”的后缀 为“css”,该资源链接对应的子文档为级联样式表(Cascading Style Sheet, CSS)文件。(3)作为另一种优选的实施方式,获取资源链接对应的子文档的类型的方式也可 以为通过浏览器为该页面主文档建立的文档对象模型(Document Object Model,简称 D0M)树,获取每个资源链接的对应的子文档的类型。在D0M树中,指明有每个子文档的多功 能网际邮件扩充协议(Multipurpose Internet Mail Extensions,简称 MIME)类型。步骤S204 :建立队列A和队列B。较佳地,队列A用于保存全部资源链接中指向必须要下载的子文档的第二资源链 接。队列B用于保存全部资源链接中除了第二资源链接外的暂时不需要下载的子文档对应 的其他资源链接。在该实施例中,必须要下载的子文档是显示网页所必需的子文档,例如包括但不 限于用于规定网页的运行逻辑的文档,例如JS文件;用于规定网页风格、外观等的文档, 例如CSS文件。应当注意的是,该第二资源链接不一定是必然存在的,在有的html文字中,网页 逻辑较简单的情况下,会直写在页面主文档中,而无需下载资源链接。较佳地,队列A中的资源链接对应的子文档因为是必需的,故可实时进行下载,因 此,在本步骤之后,还可以包括实时下载队列A中的资源链接对应的子文档并存入缓存。较佳地,建立队列B的方式为确定全部资源链接中除了第二资源链接之外的其他资源链接中对应的子文档类 型符合预设输出内容中的子文档类型的资源链接,将确定的资源链接一资源链接放入队列 B中。其中,预设输出内容为预先设置的浏览当前网页所需的信息部分,通常包括标题和正文。其中,正文中可能会包括文字、图片、视频、音频等,因此,预设输出内容中还可以设 置要输出的子文档的类型。当预设输出内容中限定了子文档类型时,只有指向的子文档类 型符合预设输出内容的子文档类型的资源链接才被放入队列B中。步骤S205 :确定在所述页面主文档中与预设输出内容对应的节点。较佳地,所述预设输出内容为用户浏览当前网页所需的信息部分,通常,关键部分 包括标题和正文,其中,正文中可能会包括文字与新闻内容附带的图片、视频、音频等。确定在所述页面主文档中与预设输出内容对应的节点的方法可选用多种方式,例 如可采用以下方法根据预先设置的关键词对页面主文档中的节点的标识进行匹配,匹配成功的节点 即为在所述页面主文档中与所述预设输出内容对应的节点。例如,当前网页为新闻时,预设输出内容设置为包括标题和正文,设置的关键词为 “hi” 和 “div”。在通常情况下,开发人员在对页面主文档进行编辑时,习惯上使用标识为hi的节 点标识题目,使用标识为div的节点标识正文内容。例如,对于该网址对应的页面主文档中的以下代码〈hi id="artibodyTitle"pid="l"tid="l " did="25096490"fid = 〃1666"> 火箭
胜活塞</hl>当解析到上述节点时,得到该节点的标识为“hl”,与预先设置的关键词匹配,则该 节点的内容“火箭胜活塞”为预设输出内容的标题;当解析到节点的标识为“div”,并且节点内的文本内容满足一定模式(比如文字 长度符合一定条件,或者符合某个模板等)时,则该元素的内容为预设输出内容的正文;其中,模板指的是网站提供的网页所使用的HTML模板、SHTML模板等。较佳地,对于实际实施时,关键词并不限定于上述关键词,而是取决于开发人员对 于关键词的词库的设定,关键词的词库应适用于大多数网址的网页的关键部分的提取。步骤S206 :确定队列B中中不存在于与预设输出内容对应的节点中的资源链接。步骤S207 :删除队列B中不存在于与预设输出内容对应的节点中的资源链接。经过上述步骤处理后的队列B中的资源链接即为根据预设输出内容确定的页面 主文档中的第一资源链接。优选地,在本发明的另一实施例中,得到第一资源链接的方式还可以为确定在页面主文档中与预设输出内容对应的节点,根据所述节点确定所述页面主 文档中的资源链接候选队列;确定所述资源链接候选队列中指向的子文档类型不符合所述预设输出内容中的 子文档类型的资源链接;删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。步骤S208 :根据队列B中的资源链接下载相应的子文档并存入缓存。步骤S209 :从缓存中读取根据队列A和队列B中的资源链接下载的子文档,显示 当前网页。以浏览器访问网址http://news. sina. com. cn/c/2012-09-04/093225096490, shtml 为例
该文档的主页面文档为343K,根据该网页的预设输出内容,发现预设输出内容中 不包括图片、视频等文件,则显示该网页时不需要再下载子文档。而在完全下载该网页的情 况下,则需要耗费流量1. 15M,通过本实施例所提供的方法,节省了至少814K的流量和大量 的内存与CPU处理时间,加快了网页显示速度。相应地,本发明实施例还提出一种网页资源处理装置,如图3所示,包括获取模块301,用于根据网页的访问请求获取所述网页对应的页面主文档;第一确定模块302,用于根据预设输出内容确定所述页面主文档中的第一资源链 接;下载子文档模块303,用于下载所述第一资源链接对应的子文档以用于输出所述 网页的预设输出内容。优选地,如图4所示,本装置还可以包括第二确定模块304,用于确定所述页面主文档中的第二资源链接,所述第二资源链 接包括指向用于规定所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页 的布局的子文档的链接。下载子文档模块303用于下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页 的预设输出内容。优选地,所述第一确定模块302用于确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所 述页面主文档中的资源链接候选队列;确定所述资源链接候选队列中指向的子文档类型不符合所述预设输出内容中的 子文档类型的资源链接;删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。优选地,所述第一确定模块302用于根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选 队列;确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接 候选队列中的资源链接是否存在于所述节点中;删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源 链接。优选地,所述第一确定模块302用于根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为 在所述页面主文档中与所述预设输出内容对应的节点。本发明实施例还提出一种设备,包括一个或多个处理器;存储器;和一个或多个模块(programs),所述一个或多个模块存储于所述存储器中并被配置 成由所述一个或多个处理器执行,其中,所述一个或多个模块具有如下功能根据网页的访问请求获取所述网页对应的页面主文档;
根据预设输出内容确定所述页面主文档中的第一资源链接;下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。较佳地,所述一个或多个模块还具有如下功能在所述下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内 容之前,确定所述页面主文档中的第二资源链接,所述第二资源链接包括指向用于规定所 述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。较佳地,下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内 容,采用如下方式下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页 的预设输出内容。较佳地,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如 下方式确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所 述页面主文档中的资源链接候选队列;确定所述资源链接候选队列中指向的子文档的类型不符合所述预设输出内容中 的子文档的类型的资源链接;删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。较佳地,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如 下方式根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选 队列;确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接 候选队列中的资源链接是否存在于所述节点中;删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源 链接。较佳地,所述确定在所述页面主文档中与所述预设输出内容对应的节点,采用如 下方式根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为 在所述页面主文档中与所述预设输出内容对应的节点。另外,本发明实施例还提供了一种非易失性可读存储介质,该存储介质中存储有 一个或多个模块(programs),该一个或多个模块被应用在具有一个或多个处理器的设备 时,可以使得该设备执行如下步骤的指令(instructions)根据网页的访问请求获取所述网页对应的页面主文档;根据预设输出内容确定所述页面主文档中的第一资源链接;下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。较佳地,所述一个或多个模块还使得该设备执行如下步骤的指令在所述下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内 容之前,确定所述页面主文档中的第二资源链接,所述第二资源链接包括指向用于规定所 述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。
较佳地,下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内 容,采用如下方式下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页 的预设输出内容。较佳地,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如 下方式确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所 述页面主文档中的资源链接候选队列;确定所述资源链接候选队列中指向的子文档的类型不符合所述预设输出内容中 的子文档的类型的资源链接;删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。较佳地,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如 下方式根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选 队列;确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接 候选队列中的资源链接是否存在于所述节点中;删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源 链接。较佳地,所述确定在所述页面主文档中与所述预设输出内容对应的节点,采用如 下方式根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为 在所述页面主文档中与所述预设输出内容对应的节点。本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序 产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实 施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机 可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形 式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一 流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算 机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理 器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生 用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能 的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的步骤。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含这些改动和变型在内。
权利要求
1.一种网页资源处理方法,其特征在于,包括以下步骤 根据网页的访问请求获取所述网页对应的页面主文档; 根据预设输出内容确定所述页面主文档中的第一资源链接; 下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
2.根据权利要求I所述的方法,其特征在于,所述下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容之前,所述方法还包括 确定所述页面主文档中的第二资源链接,所述第二资源链接包括指向用于规定所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。
3.根据权利要求2所述的方法,其特征在于,下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容,采用如下方式 下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页的预设输出内容。
4.根据权利要求I所述的方法,其特征在于,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如下方式 确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所述页面主文档中的资源链接候选队列; 确定所述资源链接候选队列中指向的子文档的类型不符合所述预设输出内容中的子文档的类型的资源链接; 删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。
5.根据权利要求I所述的方法,其特征在于,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如下方式 根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选队列; 确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接候选队列中的资源链接是否存在于所述节点中; 删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源链接。
6.根据权利要求4或5所述的方法,其特征在于,所述确定在所述页面主文档中与所述预设输出内容对应的节点,采用如下方式 根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为在所述页面主文档中与所述预设输出内容对应的节点。
7.一种网页资源处理装置,其特征在于,包括 获取模块,用于根据网页的访问请求获取所述网页对应的页面主文档; 第一确定模块,用于根据预设输出内容确定所述页面主文档中的第一资源链接; 下载子文档模块,用于下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括 第二确定模块,用于确定所述页面主文档中的第二资源链接,所述第二资源链接包括指向用于规定所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。
9.根据权利要求8所述的装置,其特征在于,所述下载子文档模块用于 下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页的预设输出内容。
10.根据权利要求7所述的装置,其特征在于,所述第一确定模块用于 确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所述页面主文档中的资源链接候选队列; 确定所述资源链接候选队列中指向的子文档的类型不符合所述预设输出内容中的子文档的类型的资源链接; 删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。
11.根据权利要求7所述的装置,其特征在于,所述第一确定模块用于 根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选队列; 确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接候选队列中的资源链接是否存在于所述节点中; 删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源链接。
12.根据权利要求10或11所述的装置,其特征在于,所述第一确定模块用于 根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为在所述页面主文档中与所述预设输出内容对应的节点。
13.一种设备,其特征在于,所述设备包括 一个或多个处理器; 存储器;和 一个或多个模块,所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,其中,所述一个或多个模块具有如下功能 根据网页的访问请求获取所述网页对应的页面主文档; 根据预设输出内容确定所述页面主文档中的第一资源链接; 下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
全文摘要
本发明实施例公开了一种用于网页资源处理方法、装置及设备,其中,方法包括以下步骤根据网页的访问请求获取所述网页对应的页面主文档;根据预设输出内容确定所述页面主文档中的第一资源链接;下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。本发明实施例通过分析源文件中的资源链接,仅下载用于显示网页的预设输出内容的资源链接对应的子文档,可以使浏览器过滤掉广告等无用的部分,节省流量。
文档编号G06F17/30GK102955852SQ20121043185
公开日2013年3月6日 申请日期2012年11月1日 优先权日2012年11月1日
发明者张少伟, 徐国市, 曹双喜 申请人:北京小米科技有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1