网络文档资源提供方法、平台及系统的制作方法

文档序号:6581021阅读:183来源:国知局
专利名称:网络文档资源提供方法、平台及系统的制作方法
技术领域
本发明涉及文档处理领域,尤其涉及一种网络文档资源的提供方法、平台及系统。
背景技术
随着互联网和移动互联网的普及,用户对各类网络资源的需求也越来越多样,因此互联网和移动互联网的网络运营商和内容提供商为用户提供了各种常用格式的文档资源,以便满足用户的需求。但用户
在获取文档资源时,需要在终端(PC或手机等)上安装多种与各种格式相匹配的文档处理程序才能够阅读或编辑这些获取的文档资源,也就是说,用户为了能够阅读网络提供的多种格式的文档资源,例如PDF文档,Microsoft Word文档和WPS文档,则需要同时在终端上安装PDF阅读软件、Office软件和WPS软件才能够实现这些文档的全部阅读,在使用上给用户带来很大不便。
网络的文档资源提供通常有两种方式。其中一种方式是需要用户将整个文档全部下载后阅读,这种方式要求终端对整个文档全部下载并緩存,这种方式对终端的要求比较高,而且如果文档比较大的时候,可能会耗费用户很多的时间和费用。另 一种方式是预先将各种格式的文档资源分页转换为图像格式的多个图片,并存在网络侧的服务器,当接收到用户的访问请求后,逐页的将图片传输到终端,这种方式的文档在转换成图像后,传输的数据量就增大很多,如果用户采用窄带或者移动应用,则需要很长的传输时间和很大的网络流量,增加了用户的使用成本,使用体验也比较差
发明内容
本发明的目的是提出 一种网络文档资源提供方法、平台及系统,能够使用户在不需要耗费大量的传输时间和网络流量的情况下,方便的获取网络的文档资源。
为实现上述目的,本发明提供了一种网络文档资源提供方法,包

接收终端发送的获取文档列表的列表获取请求,并根据该列表获
取请求将相应的文档列表返回给所述终端;
接收所述终端发出的获取所述文档列表中被选文档的文档获取请求,并根据所述文档获取请求查找所述被选文档,然后对查找到的
所述被选文档进行解析;
将解析得到的文档元素转换为分页的矢量格式文档并按页緩存,然后根据所述文档获取请求中的页码指定将指定页面的緩存内容发送给所述终端,以便所述终端通过所述阅读客户端或浏览器的阅读插件显示所述页面。
进一步的,还包括安装所述阅读客户端或阅读插件的操作,具体

具获取请求,将用于阅读所述矢量格式文档的所述阅读客户端的安装软件包或阅读插件发送给所述终端,以便所述终端进行安装。
进一步的,所述对查找到的所述被选文档进行解析的操作具体为根据所述被选文档的文档类型选择相应的应用程序接口对所述被选文档进行解析,获得多个文档元素。
进一步的,所述将解析得到的文档元素转换为分页的矢量格式文档的操作具体为将解析得到的多个文档元素按页进行重新整理和排序,转换为分页的矢量格式文档,其中所述矢量格式文档包括文档头、页头、页面数据、页尾和文档尾,所述文档头用于记录所述被选文档的概括性信息和通用型信息,所述页头用于记录每一 页的概括性信息,所述页面数据记录每一页的文档元素的数据,所述页尾用于标志当前页的结束,所述文档尾用于标志整个文档的结束。进一步的,还包括对所述文档列表中的文档进行统计,并判断所述文档是否超过预设访问量,如果超过,则对所述文档转换后的矢量格式文档进行保存,当接收到所述终端发出的获取所述文档的文档获取请求时,直接读取已保存的矢量格式文档,并发送给所述终端。
进一步的,在根据所述文档获取请求中的页码指定将指定页面的緩存内容发送给所述终端时,还根据所述终端的緩存页数设置将包括所述指定页面的相邻页的緩存内容也发送给所述终端。
为实现上述目的,本发明还提出了一种网络文档资源提供平台,
包括
文档列表提供模块,用于接收终端发送的获取文档列表的列表获取请求,并根据该列表获取请求将相应的文档列表返回给所述终端;
文档定位模块,用于接收所述终端发出的获取所述文档列表中被选文档的文档获取请求,并根据所述文档获取请求查找所述被选文档;
文档解析模块,用于对查找到的所述被选文档进行解析;
文档转换模块,用于将解析得到的文档元素转换为分页的矢量格式文档并按页緩存;
文档发送模块,用于根据所述文档获取请求中的页码指定将指定页面的緩存内容发送给所述终端,以便所述终端通过所述阅读客户端或浏览器的阅读插件显示所述页面。
进一步的,还包括阅读工具提供模块,用于根据所述终端发送的获取所述阅读客户端或阅读插件的阅读工具获取请求,将用于阅读所述矢量格式文档的所述阅读客户端的安装软件包或阅读插件发送给所述终端,以便所述终端进行安装。
进一步的,还包括
访问量统计模块,用于对所述文档列表中的文档的访问量进行统
计;
文档存储模块,用于对超过预设访问量的文档转换后的矢量格式文档进行保存;
文档直发模块,用于在接收到所述终端发出的获取所述文档的文档获取请求时,直接读取已保存的矢量格式文档,并发送给所述终端。 为实现上述目的,本发明还提出了一种包括前述的网络文档资源
提供平台的网络文档资源提供系统,还包括终端,所述终端具体包括 文档列表获取模块,用于向所述网络文档资源提供平台发送的获
取文档列表的列表获取请求;
文档选择模块,用于根据用户从所述网络文档资源提供平台返回
的所述文档列表中选择的文档的命令启动阅读客户端或阅读插件,并
所述文档获取请求中还包括所述被选文档的指定页码;
文档展示模块,用于根据所述网络文档资源提供平台发送的指 定页面的緩存内容通过所述阅读客户端或浏览器的阅读插件显示所述 页面。
基于上述技术方案,本发明对网络侧的各种格式的文档进行按页 的矢量格式转换,并根据用户的请求发送相应页码的文档,从而既实 现了用户对多种格式的文档资料的获取和阅读,也节省了传输时间和 网络流量。


此处所说明的附图用来提供对本发明的进一步理解,构成本申请 的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构 成对本发明的不当限定。在附图中
图1为本发明网络文档资源提供方法的一实施例的流程示意图。 图2为本发明网络文档资源提供方法中的一种格式转换方式的示意图。
图3为本发明网络文档资源提供方法的另一实施例的流程示意图。
图4为本发明网络文档资源提供方法中的 一种转换文档资源实例 的流程示意图。
图5为本发明网络文档资源提供方法中PDF格式文档转换后的
8一种页内容格式实例的示意图。
图6为本发明网络文档资源提供平台的一实施例的结构示意图。 图7为本发明网络文档资源提供系统的一实施例的结构示意图。
具体实施例方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
现有的各种格式的文档资源(如PDF文档,Microsoft Word文 档,Excel文档,PPT文档等)的在线浏览之所以不能实现文档的实 时分页传输,而要先完整下载文档,才能打开整个文档浏览,是因为 当前文档存储格式不是按内容顺序分页存储的,是按照文档元素分类 存储,整体格式以矢量形式存储,如果仅仅从文档获取某部分数据是 无法还原文档,必须获取全部文档数据,才能解析到完整的信息从而 还原文档。
基于上述分析,为了实现在终端荻取和阅读网络侧的多种格式文 档资源,并实现分页传输文档内容,则需要在网络侧对文档资源进行 处理,使得文档资源转换成适合于分页传输的数据。如图1所示,为 本发明发明网络文档资源提供方法的 一 实施例的流程示意图。在本实 施例中,网络侧业务平台实现网络文档资源的提供的流程包括
步骤IOI、接收终端发送的获取文档列表的列表获取请求,并根 据该列表获取请求将相应的文档列表返回给所述终端;
步骤102、接收所述终端发出的获取所述文档列表中被选文档的 文档获取请求,并根据所述文档获取请求查找所述被选文档;
步骤103、对查找到的所述被选文档进行解析,并将解析得到的 文档元素转换为分页的矢量格式文档并按页緩存;
步骤104、根据文档获取请求中的页码指定将指定页面的緩存内 容发送给所述终端,以便所述终端通过所述阅读客户端或浏览器的阅 读插件显示所述页面。
在本实施例中,网络侧平台在提供各种格式的文档资源的同时,还可以设置有对应于各种格式的文档资源的应用程序接口
(Application Programming Interface,简称API)、文档编辑软件或 者文档阅读软件。网络侧平台在定位了被选文档后,可以根据被选文 档的格式选择相应的应用API、文档编辑软件或者文档阅读软件,并 利用应用API、文档编辑软件或者文档阅读软件对被选文档进行解析, 获得被选文档中的多个文档元素,以便进行重新组合。
在步骤103的转换过程中,将解析得到的多个文档元素按页进行 重新整理和排序,转换为分页的矢量格式文档,参见图2,为本发明 网络文档资源提供方法中的一种格式转换方式的示意图。从图2中可 以看出原文档格式的文档中的各个部分的文档元素被提取出,并被安 排到新的矢量格式文档中的页面数据中。其中,矢量格式文档至少包 括文档头、页头、页面数据、页尾和文档尾,所述文档头用于记录所 述被选文档的概括性信息和通用型信息,所述页头用于记录每一 页的 概括性信息,所述页面数据记录每一页的文档元素的数据,所述页尾 用于标志当前页的结束,所述文档尾用于标志整个文档的结束。
在步骤104的根据文档获取请求中的页码指定将指定页面的緩存 内容发送给终端时,终端可以利用自身安装的阅读工具进行阅读,如 果缺少可以阅读该矢量格式文档的阅读工具,则可向网络侧平台发出 获取阅读客户端或阅读插件的阅读工具获取请求,网络侧平台则可以
根据该阅读工具获取请求,将用于阅读矢量格式文档的阅读客户端的 安装软件包或阅读插件发送给终端,以便终端进行安装。终端也可以 通过其他途径获取阅读工具,例如从其他设备上复制安装软件包或阅 读插件的方式、从存储介质上复制安装软件包或阅读插件的方式等。
本实施例通过对用户选择的文档进行相应格式的解析,并将其转 换为适合分页传输的矢量格式文档,然后^l据用户的需求将相应页码 的文档内容发送给终端,以便用户阅读。这种方式可以实现文档的按 页实时传输,同时由于传输的内容是重新组织过的文档数据,在数据 量上没有明显变化,而非如现有技术中转换成位图的方式而导致数据 量变大,从而避免传输内容体积变大而带来的传输时间增加和网络流
10量浪费。
用户在终端可以方便的根据需要预先或即时获取用于阅读矢量 格式文档的阅读客户端的安装软件包或阅读插件,而不需要预先安装 各种文档格式的阅读软件,从而既方便了用户的操作,也节约了各种 软件购买的成本。
在实际网络环境中,有些文档由于内容比较受欢迎,可能会被频 繁访问,根据这一特点,网络侧平台可以对其所提供的文档列表中的 各个文档的访问量进行统计,并判断其中是否有文档超过预设访问量, 如果存在超过预设访问量的文档,则对该文档转换后的矢量格式文档
进行保存。对于这种情况,如图3所示,为本发明网络文档资源提供 方法的另一实施例的流程示意图。与上一实施例相比,本实施例在步 骤102和步骤103之间可以增加以下步骤
步骤102a、判断被选文档是否是已转换的文档资料,是则执行步 骤102b,否则执行步骤103;
步骤102b、直接读取已保存的由被选文档所转换的矢量格式文 档,并发送给终端,然后结束操作。
在本实施例中,网络侧平台可以将频繁访问的文档资源直接提供 给终端,而不需要进行频繁的转换,从而减轻了网络侧平台的处理负 荷。
在另 一个实施例中,网络侧平台在根据从所述终端接收到的页码 指定请求将指定页面的緩存内容发送给终端时,还可以根据终端的緩 存页数设置将包括指定页面的相邻页的緩存内容也发送给终端。本实 施例考虑到用户可能会根据终端能力的大小和网络环境来设置每次请 求获取文档的緩存页数,终端能力越强,网络环境越好,则用户可以 设置每次请求的緩存页数越大;相反,如果终端能力越弱,网络环境 越差,则用户可以设置每次请求的緩存页数越小。举例来说,用户采 用处理能力较强的PC通过宽带来访问文档资源,则可以设置为较高 的緩存页数,例如设为5,即每次网络侧平台可以将当前页以及相邻 的5页緩存到终端,用户在阅读时就可以不需要等待网络传输而进行连续阅读。
下面对文档资源的转换过程进行详细说明,这里给出了其中PDF 格式文档的转换流程,其他例如WORD、 EXCEL等文档的转换流程 均可参考该PDF格式文档的转换流程,这里就不一^"赘述了 。
如图4所示,为本发明网络文档资源提供方法中的一种转换文档 资源实例的流程示意图。该实例包括
201:调用PDF API函数加载被用户选择的PDF文档;
202:根据用户指定的要阅读的页面范围的调用PDFAPI设置需 要读取内容的起始页面;
203:根据用户指定的要阅读的页面范围调用PDFAPI设置需要 读取内容的结束页面;
204:调用PDF API指定当前页为设置的起始页面;
205:调用PDF API指定当前文档元素为该页第一个文档元素;
206:调用PDF API读取该页面内容指定元素;
207:检测是否是本页面最后一个文档元素,如果返回否则执行 208,返回是则执4亍209;
208:调用PDF API指定当前文档元素为该页下一个文档元素;
209:转换并緩存本页读取的所有文档元素,转换的页内容格式 参见图5,在页面数据中包括了多个页文档元素;
210:检测是否是所设置的结束页面?如果返回否则执行211, 返回是则执行212;
211:调用PDF API指定当前页面为下一个页面;
212:传输新的页面数据到客户端播放器解析。
在转换时,可以选择对整个文档全部转换后,再根据用户指定按 页传输,也可以根据用户的指定范围对一部分文档进行转换,并将该 部分文档按页传输给用户,本实例给出的是对用户指定范围的文档部 分进行转换,在整个文档全部转换的实现步骤方面,与本实例的实现 方式也是近似的,只是在步骤202和203中直接将起始页面设置为文 档的起始页,结束页面设置为文档的结束页。这里就不展开叙述了。在本实例中对PDF格式文档资源进行转换时,根据用户要求分 页传输给终端,而不是一次完全将文档下载给终端,从而避免了传送 过程数据量过大,用户等待时间过长等问题。
本领域普通技术人员可以理解实现上述方法实施例的全部或部 分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于 一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实 施例的步骤;而前述的存储介质包括ROM、 RAM、磁碟或者光盘 等各种可以存储程序代码的介质。
如图6所示,为本发明网络文档资源提供平台的一实施例的结构 示意图。本实施例包括文档列表提供模块ll、文档定位模块12、文 档解析模块13、文档转换模块14和文档发送模块15。其中文档列表 提供模块11用于接收终端发送的获取文档列表的列表获取请求,并根 据该列表获取请求将相应的文档列表返回给所述终端。文档定位模块 12用于接收所述终端发出的获取所述文档列表中被选文档的文档获 取请求,并根据所述文档获取请求查找所述被选文档。文档解析模块 13用于对查找到的所述被选文档进行解析。文档转换模块14用于将 解析得到的文档元素转换为分页的矢量格式文档并按页緩存。文档发 送模块15用于根据所述文档获取请求中的页码指定将指定页面的緩 存内容发送给所述终端,以便所述终端通过所述阅读客户端或浏览器 的阅读插件显示所述页面。
在网络文档资源提供平台的另一实施例中,还可以包括阅读工具 提供模块,用于根据所述终端发送的获取所述阅读客户端或阅读插件 的阅读工具获取请求,将用于阅读所述矢量格式文档的所述阅读客户 端的安装软件包或阅读插件发送给所述终端,以便所述终端进行安装。
在网络文档资源提供平台的另一实施例中,还包括访问量统计 模块,用于对所述文档列表中的文档的访问量进行统计;文档存储模 块,用于对超过预设访问量的文档转换后的矢量格式文档进行保存; 文档直发模块,用于在接收到所述终端发出的获取所述文档的文档获 取请求时,直接读取已保存的矢量格式文档,并发送给所述终端。如图7所示,为本发明网络文档资源提供系统的一实施例的结构 示意图。在本实施例中网络文档资源提供系统的结构参见前述网络文 档资源提供平台的结构,这里就不赘述了。在网络文档资源提供系统 中还包括终端,终端具体包括以下模块文档列表获取模块21、文档 选择模块22和文档展示模块23。其中,文档列表获取模块21用于向 所述网络文档资源提供平台发送的获取文档列表的列表获取请求。文 档选捧模块22用于根据用户从所述网络文档资源提供平台返回的所 述文档列表中选择的文档的命令启动阅读客户端或阅读插件,并将获 取被选文档的文档获取请求发送给所述网络文档资源提供平台,所述 文档获取请求中还包括所述被选文档的指定页码。文档展示模块23 用于根据所述网络文档资源提供平台发送的指定页面的緩存内容通过 所述阅读客户端或浏览器的阅读插件显示所述页面。
本实施例通过对用户选择的文档进行相应格式的解析,并将其转 换为适合分页传输的矢量格式文档,然后根据用户的需求将相应页码 的文档内容发送给终端,以便用户阅读。这种方式可以实现文档的按 页实时传输,同时由于传输的内容是重新组织过的文档数据,在数据 量上没有明显变化,而非如现有技术中转换成位图的方式而导致数据 量变大,从而避免传输内容体积变大而带来的传输时间增加和网络流 量浪费。
用户在终端可以方便的根据需要预先或即时获取用于阅读矢量 格式文档的阅读客户端的安装软件包或阅读插件,而不需要预先安装 各种文档格式的阅读软件,从而既方便了用户的操作,也节约了各种 软件购买的成本。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而 非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属
领域的普通技术人员应当理解依然可以对本发明的具体实施方式
进 行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案 的精神,其均应涵盖在本发明请求保护的技术方案范围当中。
权利要求
1、一种网络文档资源提供方法,包括接收终端发送的获取文档列表的列表获取请求,并根据该列表获取请求将相应的文档列表返回给所述终端;接收所述终端发出的获取所述文档列表中被选文档的文档获取请求,并根据所述文档获取请求查找所述被选文档,然后对查找到的所述被选文档进行解析;将解析得到的文档元素转换为分页的矢量格式文档并按页缓存,然后根据所述文档获取请求中的页码指定将指定页面的缓存内容发送给所述终端,以便所述终端通过所述阅读客户端或浏览器的阅读插件显示所述页面。
2、 根据权利要求1所述的网络文档资源提供方法,其中还包括 安装所述阅读客户端或阅读插件的操作,具体为根据所述终端发送的获取所述阅读客户端或阅读插件的阅读工 具获取请求,将用于阅读所述矢量格式文档的所述阅读客户端的安装 软件包或阅读插件发送给所述终端,以便所述终端进行安装。
3、 根据权利要求1所述的网络文档资源提供方法,其中所述对 查找到的所述被选文档进行解析的操作具体为根据所述被选文档的文档类型选择相应的应用程序接口对所述 被选文档进行解析,获得多个文档元素。
4、 根据权利要求3所述的网络文档资源提供方法,其中所述将 解析得到的文档元素转换为分页的矢量格式文档的操作具体为将解析得到的多个文档元素按页进行重新整理和排序,转换为分 页的矢量格式文档,其中所述矢量格式文档包括文档头、页头、页面 数据、页尾和文档尾,所述文档头用于记录所述被选文档的概括性信 息和通用型信息,所述页头用于记录每一页的概括性信息,所述页面 数据记录每一页的文档元素的数据,所述页尾用于标志当前页的结束, 所述文档尾用于标志整个文档的结束。
5、 根据权利要求l所述的网络文档资源提供方法,其中还包括: 对所述文档列表中的文档进行统计,并判断所述文档是否超过预设访 问量,如果超过,则对所述文档转换后的矢量格式文档进行保存,当 接收到所述终端发出的获取所述文档的文档获取请求时,直接读取已 保存的矢量格式文档,并发送给所述终端。
6、 根据权利要求1所述的网络文档资源提供方法,其中在根据 从所述文档获取请求中的页码指定将指定页面的緩存内容发送给所述 终端时,还根据所述终端的緩存页数设置将包括所述指定页面的相邻 页的緩存内容也发送给所述终端。
7、 一种网络文档资源提供平台,包括文档列表提供模块,用于接收终端发送的获取文档列表的列表获 取请求,并根据该列表获取请求将相应的文档列表返回给所述终端;文档定位模块,用于接收所述终端发出的获取所述文档列表中被 选文档的文档获取请求,并根据所述文档获取请求查找所述被选文档;文档解析模块,用于对查找到的所述被选文档进行解析;文档转换模块,用于将解析得到的文档元素转换为分页的矢量格 式文档并按页緩存;文档发送模块,用于根据所述文档获取请求中的页码指定将指定 页面的緩存内容发送给所述终端,以便所述终端通过所述阅读客户端 或浏览器的阅读插件显示所述页面。
8、 根据权利要求7所述的网络文档资源提供平台,其中还包括 阅读工具提供模块,用于根据所述终端发送的获取所述阅读客户端或阅读插件的阅读工具获取请求,将用于阅读所述矢量格式文档的 所述阅读客户端的安装软件包或阅读插件发送给所述终端,以便所述 终端进行安装。
9、 根据权利要求7所述的网络文档资源提供平台,其中还包括 访问量统计模块,用于对所述文档列表中的文档的访问量进行统计;文档存储模块,用于对超过预设访问量的文档转换后的矢量格式文档进行保存;文档直发模块,用于在接收到所述终端发出的获取所述文档的文 档获取请求时,直接读取已保存的矢量格式文档,并发送给所述终端。
10、 一种包括权利要求7~9任一所述的网络文档资源提供平台的 网络文档资源提供系统,还包括终端,所述终端具体包括文档列表获取模块,用于向所述网络文档资源提供平台发送的获 取文档列表的列表获取请求;文档选择模块,用于根据用户从所述网络文档资源提供平台返回 的所述文档列表中选择的文档的命令启动阅读客户端或阅读插件,并 将获取被选文档的文档获取请求发送给所述网络文档资源提供平台, 所述文档获取请求中还包括所述被选文档的指定页码;文档展示模块,用于根据所述网络文档资源提供平台发送的指 定页面的緩存内容通过所述阅读客户端或浏览器的阅读插件显示所述 页面。
全文摘要
本发明涉及一种网络文档资源提供方法,包括接收终端发送的获取文档列表的列表获取请求,并将相应的文档列表返回给终端;接收终端发出的获取文档列表中被选文档的文档获取请求,并查找被选文档,然后对查找到的被选文档进行解析;将解析得到的文档元素转换为分页的矢量格式文档并按页缓存,然后根据文档获取请求中的页码指定将指定页面的缓存内容发送给终端,以便终端通过阅读客户端或浏览器的阅读插件显示页面。本发明还涉及一种网络文档资源提供平台及系统。本发明对网络侧的各种格式的文档进行按页的矢量格式转换,并根据用户的请求发送相应页码的文档,从而既实现了用户对多种格式的文档资料的获取和阅读,也节省了传输时间和网络流量。
文档编号G06F17/22GK101661459SQ20091018053
公开日2010年3月3日 申请日期2009年10月19日 优先权日2009年10月19日
发明者明 冯, 盛 包, 吕冠中, 孟建庭, 王爱宝 申请人:中国电信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1