可视化页面内容订阅处理方法及系统的制作方法

文档序号:6604694阅读:184来源:国知局
专利名称:可视化页面内容订阅处理方法及系统的制作方法
技术领域
本发明涉及一种可视化页面内容订阅处理方法及系统,特别是一种针对未提供 RSS服务的网站的页面内容订阅方法及系统。
背景技术
在门户网站大行其道,人们已经习惯通过搜索引擎来获取新闻资讯的今天,一种 全新的资讯传播方式——页面内容订阅技术,已经得到越来越广泛的应用。通过页面内容订阅技术,用户可以从网站上订阅自己感兴趣的内容,订阅后,就可 以不用再花费大量的时间冲浪和从新闻网站下载,页面内容订阅技术可以收集和组织用户 定制的网站内容,按照用户希望的格式、地点、时间和方式,直接传送到用户的计算机上。目前的页面订阅技术主要是RSS (Really Simple Syndication),然而国内的大部 分网站都没有提供RSS,因此这些网站无法实现页面内容的订阅。目前也有一些公司使用了 一些技术可以把页面的主要内容提取出来,但需要开发 人员编写代码,普通用户却无法参与。

发明内容
本发明的目的是为了克服现有的页面内容订阅处理方法中的缺点,尤其是对没有 实现RSS技术的网站,提供了一种可根据用户的选择进行个性化内容订阅的方法及系统。本发明提供了一种可视化页面内容订阅处理方法,包括页面内容订阅步骤,通过 向与所输入的URL相对应的网页中插入Javascript脚本,提取用户所选取的订阅内容和生 成相应的查询规则,并将所述查询规则和所述网页的URL存储在服务器上;订阅内容展现 步骤,根据所述订阅内容的查看请求,获得相应的页面数据,并根据所述服务器存储的所述 查询规则,获取并展现所述订阅内容。其中,在所述页面内容订阅步骤中,通过订阅服务器向与所输入的URL相对应的网页中插入Javascript脚本或通过 浏览器插件或修改浏览器来提取客户端接收到的用户所选取的订阅内容。其中,在所述页面内容订阅步骤中,在浏览器根据要订阅的网页的URL加载相应的页面内容的同时,向所述网页中插 A Javascript IPP^S,所述Javascript脚本响应鼠标事件,提取所要订阅内容,所述Javascript脚本对整个所述页面内容的D0M树进行分析,所述Javascript脚本根据对所述D0M树的分析结果以及所述选取的订阅内容生 成查询规则。其中,所述订阅内容展现步骤包括根据所述服务器存储的所述网页的URL,获取所述相应的页面数据,对所述页面数 据的D0M树进行解析;
4
根据所述服务器存储的所述查询规则,从所述页面数据的DOM树的解析结果中获 取所述订阅内容;所述服务器对所述订阅内容进行重新排版,整合成符合客户端需求的页面形式;所述服务器将整合后的所述订阅内容返回给客户端展现。其中,所述Javascript脚本能够提供选择界面,所述选择界面能让用户通过鼠标 来选择所述订阅内容。其中,所述服务器能够通过定时检查所述订阅内容来检查更新,并且当服务器检 测到所述订阅内容更新时通知所述用户。本发明还提供一种可视化页面内容订阅处理系统,包括页面内容订阅模块,提取客户端接收到的用户所选取的订阅内容生成相应的查询 规则,并将所述查询规则和所述网页的URL存储在服务器上;订阅内容展现模块,根据客户端对所述订阅内容的查看请求,获得相应的页面数 据,并根据所述服务器存储的所述查询规则,获取并展现所述订阅内容;存储单元模块,用于存储所述服务器所接收的所述查询规则和所述URL。其中,所述页面内容订阅模块进一步包括订阅内容提取模块,用于响应鼠标事件,提取所要订阅内容;订阅内容解析模块,用于对整个所述页面内容的D0M树进行解析;查询规则生成模块,用于根据对所述D0M树的解析结果,生成查询规则;所述订阅内容展现模块进一步包括信息提取模块,用于当接收到查看所述订阅内容的请求后,提取出所述查询规则 和所述网页URL ;页面数据获取模块,用于根据所述信息提取模块中所提取的网页URL,获取页面数 据,并对所述页面数据的D0M树进行解析;订阅内容获取模块,用于根据所述信息提取模块中所提取的所述查询规则,从所 述页面数据获取模块对D0M树解析结果中获取所述订阅内容;订阅内容整合模块,用于对所述订阅内容进行重新排版,整合成符合客户端需求 的页面数据形式;订阅内容返回模块,用于将整合后的所述订阅内容以所述页面数据形式返回给客户端。其中,所述页面内容订阅模块设置在完全支持HTML和javascript的浏览器里;所 述订阅内容展现模块设置在任何浏览器里。通过实施本发明的上述技术方案,用户可以在没行提供RSS的网站进行内容订 阅,而且也不需要如开发人员一样通过编写代码提取页面主要内容。在本发明中,用户只需 打开需要订阅内容的网站,然后使用鼠标选择自己感兴趣的部分,服务器便会记下用户选 择的部分,并提供订阅页面。


图1为可视化页面内容订阅处理系统的结构框图;图2为页面内容订阅的流程图3为订阅内容展现的流程图。
具体实施例方式当用户要订阅某个网页页面的内容时,输入该网页的URL并载入页面,然后通过 订阅服务器或浏览器插件向该页面插入相应的脚本,例如JAVASCRIPT脚本或使用其他编 程语言(如C++)形成的脚本,即可以提供一个界面让用户通过鼠标选择内容。用户选择好 所要订阅的内容之后,被插入到该页面的上述相应的脚本提取这部分内容和生成相应的查 询规则,把上述查询规则和上述网页的URL保存到服务器后即可完成这部分内容的订阅。当要查看订阅内容时,用户通过输入上述网页的URL来发送查看上述订阅内容的 请求,服务器根据用户在客户端输入的上述网页的URL获得上述网页的相应的页面数据, 并根据存储在上述服务器上的上述查询规则把上述网页中被订阅的内容提取出来,并生成 订阅内容页面。所谓客户端,是指移动通讯设备终端,如手机、PDA (个人数字助理)等,因 此本发明的保护范围不应限定为某种特定类别的移动终端。下面结合附图详细说明本发明的具体实施方式
。图1示出了一种可视化页面内容订阅处理系统的结构框图。如图1所示,处理系统 包括页面内容订阅模块1,订阅内容展现模块2和存储单元模块3。其中,上述页面内容订 阅模块1设置在完全支持HTML和javascript的浏览器里,该页面内容订阅模块1可以是 JAVASCRIPT脚本或使用其他编程语言(如C++)形成的脚本,并可以用于提取客户端接收到 的用户所选取的订阅内容生成相应的查询规则,及将该查询规则和上述网页的URL(统一 资源定位符,UniformResource Locator)存储在服务器上;上述订阅内容展现模块2设置 在任何浏览器里,可以根据客户端对上述订阅内容的查看请求,获得相应的页面数据,并根 据上述服务器存储的所述查询规则,获取并展现上述订阅内容;上述存储单元模块3位于 服务器端,可以存储来自所述页面内容订阅模块1的所述查询规则和所述URL。以下对上述页面内容订阅模块1和订阅内容展现模块2的结构和功能分别作详细 的说明。上述页面内容订阅模块1包括订阅内容提取模块12、订阅内容解析模块13和查 询规则生成模块14。上述订阅内容提取模块12可以响应鼠标事件,提取用户所要订阅的 内容。订阅内容提取模块12可以通过订阅服务器向与所输入的URL相对应的网页中插入 Javascript脚本或通过浏览器插件或修改浏览器来提取客户端接收到的用户所选取的订 阅内容。上述订阅内容解析模块13可以对整个所述页面内容的D0M树进行解析。上述查 询规则生成模块14可以根据对所述D0M树的解析结果,生成查询规则。上述订阅内容展现模块2包括信息提取模块21、页面数据获取模块22、订阅内容 获取模块23、订阅内容整合模块24及订阅内容返回模块25。当上述信息提取模块21接收 到查看订阅内容的请求后,从上述存储单元模块3中提取出所存储的上述查询规则和网页 URL。上述页面数据获取模块22根据上述信息提取模块21中所提取的网页URL,获取页面 数据,并对所述页面数据的D0M树进行解析上述订阅内容获取模块23根据上述信息提取模 块21中所提取的查询规则,从上述页面数据获取模块22对D0M树解析结果中获取订阅内 容;上述订阅内容整合模块24对订阅内容进行重新排版,整合成符合客户端需求的页面数 据形式。上述订阅内容返回模块25将整合后的所述订阅内容以上述页面数据形式返回给客户端。图2示出了页面内容订阅的流程。如图2所示,在步骤S11,当用户想要订阅某个 页面的内容时,在客户端的浏览器中输入该网页的相关网站的URL,上述浏览器根据输入的 上述URL载入相应网站的网页页面内容。步骤S12,在上述浏览器加载上述页面内容的同 时,向上述页面插入相应的脚本,该相应的脚本可以是JAVASCRIPT脚本或使用其他编程语 言(如C++)形成的脚本,在本实施例中优选Javascript脚本。向网页页面插入上述相应 的脚本的动作可以由订阅服务器来完成,或也可以由浏览器插件来完成。其中,上述的订阅 服务器可以是客户端安装的具有订阅功能的阅读器,该订阅服务器可以向相应的网页页面 插入上述相应的脚本。由上述相应的脚本所提供的上述选择界面可以让用户通过鼠标来选 择上述网页上需要订阅的内容(步骤S13)。当用户通过鼠标选定需要订阅的内容之后,在上述步骤S12中所插入的上述相应 的脚本能够响应鼠标事件,分析并提取出用户所选择的页面内容(步骤S14)。在步骤S15 中,上述相应的脚本对整个上述网页页面内容的D0M树(Document Object Model,文档对象 模型)进行解析,然后根据对上述网页页面内容的DOM树进行解析的结果,生成一种查询规 则(步骤S16),其中上述查询规则是一种类似于XPATH(XML Path Language,XML路径语言) 的查询规则,可以使服务器在相应的网页中查找出用户所要订阅的内容。在步骤S17中,上 述相应的脚本把上述查询规则和相应的URL发送到服务器,所述的查询规则和相应的URL 被存储至服务器上的相应的数据库中。图3示出了订阅内容展现的流程。如图3所示,在步骤S21中,当用户想要查看所 订阅的内容时,在浏览器中输入相应的URL,浏览器根据用户输入的URL信息向服务器发送 查看所订阅内容的请求。服务器根据来自浏览器的请求,从数据库中取出相应的网页URL 信息及其查询规则信息(步骤S22)。在步骤S23中,服务器根据所述提取出来的网页URL从互联网中获取相应网页的 页面数据。同时,该页面数据获取模块22将在步骤S23中得到的页面数据解析成相应的 D0M树(步骤S24)。在步骤S25中,服务器根据在步骤S22中得到的查询规则从在上述步骤24中解析 得到的D 0M树中获取用户所订阅的页面内容。在步骤S26中,服务器将在步骤S25中所获取的页面内容进行重新排版,整合成符 合客户端需求的页面数据形式。其中,对于页面数据的处理技术没有特别的要求,只要通过 对相关页面内容的处理能够适用于客户端的需求即可。在步骤S27中,服务器将最终获取的经整合后的所述订阅内容以上述页面数据形 式返回给客户端,客户端将接收到的上述页面数据通过浏览器予以展现。在上述实施方式中,服务器可以通过定时检查订阅内容来检查更新,当服务器检 测到订阅内容更新时,将订阅内容更新信息反馈至客户端,通知相应的用户该订阅内容更
新{曰息。前述的详细说明及附图是通过文字解释和图示来进行的,其目的不在于限定权利 要求的保护范围。本说明书中的具体实施方式
的各个变种对于普通技术人员来说显而易 见,并处于权利要求及其等同技术的保护范围内。
权利要求
一种可视化页面内容订阅处理方法,包括页面内容订阅步骤,提取客户端接收到的用户所选取的订阅内容生成相应的查询规则,并将所述查询规则和所述网页的URL存储在服务器上;订阅内容展现步骤,根据客户端对所述订阅内容的查看请求,获得相应的页面数据,并根据所述服务器存储的所述查询规则,获取并展现所述订阅内容。
2.根据权利要求1所述的处理方法,其特征在于,在所述页面内容订阅步骤中,通过订阅服务器向与所输入的URL相对应的网页中插入Javascript脚本或通过浏览 器插件或修改浏览器来提取客户端接收到的用户所选取的订阅内容。
3.根据权利要求2所述的处理方法,其特征在于, 在所述页面内容订阅步骤还包括,在浏览器根据要订阅的所述网页的URL加载相应的页面内容的同时,向所述网页中插 AljfjS Javascript P^;所述Javascript脚本响应鼠标事件,提取所述所选取的订阅内容; 所述Javascript脚本对整个所述页面内容的D0M树进行分析, 所述Javascript脚本根据对所述D0M树的分析结果以及所述选取的订阅内容生成查 询规则。
4.根据权利要求3所述的处理方法,其特征在于, 所述订阅内容展现步骤还包括根据所述服务器存储的所述网页的URL,获取所述相应的页面数据,对所述相应的页面 数据的D0M树进行解析;根据所述服务器存储的所述查询规则,从所述页面数据的D0M树的解析结果中获取所 述订阅内容;所述服务器对所述订阅内容进行重新排版,整合成符合客户端需求的页面数据形式; 所述服务器将整合后的所述订阅内容以所述页面数据形式返回给客户端展现。
5.根据权利要求2所述的处理方法,其特征在于,所述Javascript脚本能够提供选择 界面,所述选择界面能让用户通过鼠标来选择所述订阅内容。
6.根据权利要求1-5任一所述的处理方法,其特征在于,所述服务器能够通过定时检 查所述订阅内容来检查更新,并且当服务器检测到所述订阅内容更新时通知所述用户。
7. —种可视化页面内容订阅处理系统,其特征在于,包括页面内容订阅模块,提取客户端接收到的用户所选取的订阅内容生成相应的查询规 则,并将所述查询规则和所述网页的URL存储在服务器上;订阅内容展现模块,根据客户端对所述订阅内容的查看请求,获得相应的页面数据,并 根据所述服务器存储的所述查询规则,获取并展现所述订阅内容;存储单元模块,用于存储所述服务器所接收的所述查询规则和所述URL。
8.根据权利要求7所述的处理系统,其特征在于, 所述页面内容订阅模块进一步包括订阅内容提取模块,用于响应鼠标事件,提取所要订阅内容;订阅内容分析模块,用于对整个所述页面内容的D0M树进行分析;查询规则生成模块,用于根据对所述D0M树的分析结果以及所述选取的订阅内容,生成查询规则;所述订阅内容展现模块进一步包括信息提取模块,用于当接收到查看所述订阅内容的请求后,所述服务器提取出所述查 询规则和所述网页URL ;页面数据获取模块,用于根据所述信息提取模块中所提取的网页URL,获取页面数据, 并对所述页面数据的D0M树进行解析;订阅内容获取模块,用于根据所述信息提取模块中所提取的查询规则,从所述页面数 据获取模块对D0M树解析结果中获取所述订阅内容;订阅内容整合模块,用于对所述订阅内容进行重新排版,整合成符合客户端需求的页 面数据形式;订阅内容返回模块,用于将整合后的所述订阅内容以所述页面数据形式返回给客户端。
9.根据权利要求7或8所述的处理系统,其特征在于,所述页面内容订阅模块设置在完 全支持HTML和javascript的浏览器里;所述订阅内容展现模块设置在任何浏览器里。
全文摘要
本发明提供一种可视化页面内容订阅处理方法,包括页面内容订阅步骤和订阅内容查看步骤,其中,所述页面内容订阅步骤包括脚本插入步骤、订阅内容提取步骤、订阅内容解析步骤、查询规则生成步骤、存储步骤;所述订阅内容查看步骤包括、信息提取步骤、页面数据获取步骤、订阅内容获取步骤、订阅内容整合步骤、订阅内容返回步骤。本发明还提供一种可视化页面内容订阅处理系统。
文档编号G06F17/30GK101894138SQ20101020967
公开日2010年11月24日 申请日期2010年6月25日 优先权日2010年6月25日
发明者周志明, 梁捷 申请人:优视科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1