一种在浏览器中将网页内容聚合展现的方法及装置的制作方法

文档序号:6364629阅读:288来源:国知局
专利名称:一种在浏览器中将网页内容聚合展现的方法及装置的制作方法
技术领域
本发明提供了一种在浏览器中将网页内容聚合展现的方法及装置,属于网页内容聚合技术领域。
背景技术
在用户在上网的时候,经常会关注多个网站的内容,如果没有网页信息聚合,那么当用户在想要查看他关注的信息的时候,只能去浏览每个网站,直到浏览结束,整个过程如图1所示。为了解决这个问题,现在的浏览器一般都引入了聚合的功能,通过订阅网站提供的RSS(Really Simple Syndicatio,简易信息聚合)或者Atom(基于XML的文档格式以及基于HTTP的协议,用于为 站点和客户工具提供聚合网络内容),将用户关注的信息拉取到本地并组合在一起,聚合的过程如图2所示。但是通过这种方式去聚合资源时,如果网站没有提供RSS或者ATOM的订阅,那么就没有办法将这些信息聚合在浏览器中,必须访问相应的网站才能浏览相应的内容。

发明内容
本发明为解决现有的浏览器的网页内容聚合技术中存在的若没有将访问的内容聚合在浏览器中,则必须访问相应的网站才能浏览相应的内容的问题,进而提供了一种在浏览器中将网页内容聚合展现的方法及装置。一种在浏览器中将网页内容聚合展现的方法,包括:根据用户选定的信息源生成信息源标识符;通过预定的方法对所述信息源标识符对应的网页内容进行分析,提取相应的网页内容并保存,当用户打开浏览器的信息聚合页时,读取并显示所述相应的网页内容。一种在浏览器中将网页内容聚合展现的装置,包括:标识符生成模块,用于根据用户选定的信息源生成信息源标识符;聚合展现模块,用于通过预定的方法对所述信息源标识符对应的网页内容进行分析,提取相应的网页内容并保存,当用户打开浏览器的信息聚合页时,读取并显示所述相应的网页内容。由上述本发明提供的技术方案可以看出,通过对网页内容进行分析,提取相应的网页内容保存及为用户显示,即使相应的网站没有提供RSS或者ATOM的订阅,也能够实现将相应的网页内容聚合在浏览器,而无需用户访问每一个网站。


图1是现有技术中用户浏览每个网站直至浏览结束的流程示意图;图2是现有技术中通过内容订阅将网页内容聚合的流程示意图;图3是本发明具体实施方式
提供的在浏览器中将网页内容聚合展现的方法的流程不意图;图4是本发明具体实施方式
提供的腾讯首页中各个区域的标识示意图;图5是本发明具体实施方式
提供的加入爬虫分析之后的生成聚合页的流程示意图;图6是本发明具体实施方式
提供的在浏览器中将网页内容聚合展现的装置的结构示意图。
具体实施例方式本发明具体 实施方式提供了一种在浏览器中将网页内容聚合展现的方法,包括根据用户选定的信息源生成信息源标识符;通过预定的方法对信息源标识符对应的网页内容进行分析,提取相应的网页内容并保存,当用户打开浏览器的信息聚合页时,读取并显示相应的网页内容。下面以对某不支持内容订阅的网站的内容聚合展现方法为例并结合说明书附图对本具体实施方式
作具体说明,如图3所示,相应的在浏览器中将网页内容聚合展现的方法包括:步骤31,根据用户选定的信息源生成信息源标识符。由于现有的一些网站没有提供RSS或者ATOM的订阅,那么就没有办法将这些信息聚合在浏览器中,当用户在想要查看关注的信息的时候,只能去浏览每个网站。例如腾讯首页的今日新闻,这个信息由于没有提供订阅,所以如果用户想要查看这个信息,只有访问腾讯首页才可以查看其内容。具体的,现有的大部分网页都由多个区域嵌套而成,而这些区域都会有一个自己的名称或者标识,这个标识可以是网页元素的id、className甚至是在这个区域内的元素序号。以腾讯网为例,如图4所示,在腾讯网页面中每一个小区域都有一个标识,所以一旦用户选定了网页中一个自己关注的网页区域,那么就可以通过这个标识来唯一表示这一个区域。每个区域中都有若干个包括链接或地址的信息源。例如,腾讯网第一行的标识是STextNav,第二行搜索的标识是#S0S0,左下角新闻中心的标识是#NeWSInfo,右侧今日话题的标识是#txArea。在用户选定了腾讯网的某个信息源之后,例如用户选定了左下角的新闻中心,腾讯网的服务器则需要根据用户选择的新闻中心生成一个网络上可以唯一标识这个信息源的标识符,即新闻中心的SNewsInf0标识,这个标识符可以使用URL加元素路径来标识,但是并不局限于这种方式,这里只是一个举例。例如,需要保存新闻区域时,就可以建立一个这样的对应关系:
权利要求
1.一种在浏览器中将网页内容聚合展现的方法,其特征在于,包括: 根据用户选定的信息源生成信息源标识符; 通过预定的方法对所述信息源标识符对应的网页内容进行分析,提取相应的网页内容并保存,当用户打开浏览器的信息聚合页时,读取并显示所述相应的网页内容。
2.根据权利要求1所述的方法,其特征在于,所述信息源标识符通过URL与元素路径相结合进行标识。
3.根据权利要求1或2所述的方法,其特征在于,对所述信息源标识符对应的网页内容进行分析包括: 通过在HTML网页中相应的网页内容的链接或列表中查找相应的标签,以提取相应的网页内容。
4.根据权利要求1或2所述的方法,其特征在于,对所述信息源标识符对应的网页内容进行分析包括: 根据所述信息源标识符配置相应的网页内容抓取方法,通过所述抓取方法对所述相应的网页内容进行分析,以提取相应的网页内容。
5.根据权利要求1所述的方法,其特征在于,所述读取并显示所述相应的网页内容包括: 显示所述相应的网页内容,或者,显示全部网页内容并将所述相应的网页内容以外的网页内容隐藏或删除。
6.一种在浏览器中将网页`内容聚合展现的装置,其特征在于,包括: 标识符生成模块,用于根据用户选定的信息源生成信息源标识符; 聚合展现模块,用于通过预定的方法对所述信息源标识符对应的网页内容进行分析,提取相应的网页内容并保存,当用户打开浏览器的信息聚合页时,读取并显示所述相应的网页内容。
7.根据权利要求6所述的装置,其特征在于,在标识符生成模块中,所述信息源标识符通过URL与元素路径相结合进行标识。
8.根据权利要求6或7所述的装置,其特征在于,在聚合展现模块中包括: 第一内容提取子模块,用于通过在HTML网页中相应的网页内容的链接或列表中查找相应的标签,以提取相应的网页内容。
9.根据权利要求6或7所述的装置,其特征在于,在聚合展现模块中还包括: 第二内容提取子模块,用于根据所述信息源标识符配置相应的网页内容抓取方法,通过所述抓取方法对所述相应的网页内容进行分析,以提取相应的网页内容。
10.根据权利要求1所述的装置,其特征在于,在聚合展现模块中还包括: 信息显示子模块,用于显示所述相应的网页内容,或者,显示全部网页内容并将所述相应的网页内容以外的网页内容隐藏或删除。
全文摘要
本发明提供了一种在浏览器中将网页内容聚合展现的方法,包括根据用户选定的信息源生成信息源标识符;通过预定的方法对所述信息源标识符对应的网页内容进行分析,提取相应的网页内容并保存,当用户打开浏览器的信息聚合页时,读取并显示所述相应的网页内容。本发明通过对网页内容进行分析,提取相应的网页内容保存及为用户显示,即使相应的网站没有提供RSS或者ATOM的订阅,也能够实现将相应的网页内容聚合在浏览器,而无需用户访问每一个网站。
文档编号G06F17/30GK103246680SQ20121003148
公开日2013年8月14日 申请日期2012年2月13日 优先权日2012年2月13日
发明者蒋进舟, 滕跃龙 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1