一种终端文档显示方法及系统的制作方法

文档序号:6336550阅读:174来源:国知局

专利名称::一种终端文档显示方法及系统的制作方法一种终端文档显示方法及系统
技术领域
:本发明涉及互联网领域,特别涉及一种基于互联网的终端文档显示方法及系统。
背景技术
:随着互联网技术的不断发展,用户可以通过各种终端从互联网获取信息。以手机为例,用户在通过手机在线阅读文档时,由于一般的手机只支持WAP格式的页面浏览,且手机屏幕较小,因此进行页面浏览须将网页客制化成WAP格式,才能为用户提供较好的浏览体验。对于一般的在线阅读网站,均是将所有格式的文档转化为Flash格式供PC进行在线阅读。由于多数手机不支持Flash阅读,仅支持单一格式的文件浏览,因此大部分的手机须客制化阅读网站的文档格式,一旦阅读网站不支持客制化,将造成手机和PC的在线阅读内容不一致,未能实现数据同步,降低了个人阅读体验。综上,如何避免由于客制化带来的移动终端与PC的在线阅读内容不一致,降低了用户阅读体验的问题,是互联网
技术领域
研究的方向之一。
发明内容本发明所要解决的技术问题是提供一种终端文档显示方法和系统,以避免由于客制化带来的显示终端与PC的在线阅读内容不一致的问题,提高用户阅读体验。本发明为解决技术问题而采用的技术方案是提供一种终端文档显示方法,所述方法包括以下步骤获取待显示文档;判断所述待显示文档是否为纯文本格式文档;若所述待显示文档不是纯文本格式文档,则从所述待显示文档中提取纯文本信息;发送所述纯文本信息至终端,以使所述终端显示所述纯文本信息。根据本发明一优选实施例,在发送所述纯文本信息至终端时,所述方法还包括以下步骤根据所述终端的请求将所述纯文本信息的部分发送至所述终端。根据本发明一优选实施例,从所述待显示文档中提取纯文本信息的步骤包括将待显示文档转换为系统设置的中间文档;从所述转换后的中间文档中抽取所述纯文本信息。根据本发明一优选实施例,所述中间文档为PDF格式的文档。根据本发明一优选实施例,从所述待显示文档中提取纯文本信息的步骤包括使用光学符号识别抽取所述中间文档中的所述纯文本信息。根据本发明一优选实施例,从所述待显示文档中提取纯文本信息的步骤包括将所述纯文本信息按照所述待显示文档的版式进行排版。根据本发明一优选实施例,从所述待显示文档中提取纯文本信息的步骤包括根据所述终端的配置参数对纯文本信息进行分页,其中,每个分页的数据量不超过系统设定的容量阈值;对分页后的纯文本信息进行排版。根据本发明一优选实施例,从所述待显示文档中提取纯文本信息的步骤进一步包括记录配置参数;将记录的配置参数与相应的排版后的纯文本信息建立关联后存储。根据本发明一优选实施例,所述配置参数包括所述终端的屏幕大小、显示字体的字号大小以及每页显示页面的显示字符数。本发明为解决技术问题而采用的技术方案是提供一种终端文档显示系统,包括服务器和至少一个终端,其中,所述服务器包括文档获取模块,用于获取待显示文档;文档判断模块,用于判断所述待显示文档是否为纯文本格式文档;纯文本信息提取模块,用于从所述待显示文档中提取纯文本信息;以及纯文本信息发送模块,用于发送所述纯文本信息至终端。根据本发明一优选实施例,所述纯文本信息发送模块还用于,根据所述终端的请求将所述纯文本信息的部分发送至所述终端。根据本发明一优选实施例,所述纯文本信息提取模块具体包括文档转换模块,用于将待显示文档转换为系统设置的中间文档;纯文本信息抽取模块,用于从所述文档转换模块转换后的中间文档中抽取所述纯文本信息。根据本发明一优选实施例,所述中间文档为PDF格式的文档。根据本发明一优选实施例,所述纯文本信息提取模块通过光学符号识别抽取所述中间文档中的所述纯文本信息。根据本发明一优选实施例,所述纯文本信息提取模块还包括排版模块,用于将所述纯文本信息按照所述待显示文档的版式进行排版。根据本发明一优选实施例,所述纯文本信息提取模块还包括分页模块,用于根据所述终端的配置参数对纯文本信息进行分页,其中,每个分页的数据量不超过系统设定的容量阈值;所述排版模块对分页后的纯文本信息进行排版。根据本发明一优选实施例,所述纯文本信息提取模块还包括配置参数记录模块,用于记录配置参数;存储模块,用于将记录的配置参数与相应的排版后的纯文本信息建立关联后存储。根据本发明一优选实施例,所述配置参数包括所述终端的屏幕大小、显示字体的字号大小以及每页显示页面的显示字符数。通过以上实施例,本发明极大的避免由于客制化带来的终端与PC的在线阅读内容不一致的问题,很好的提高了用户的阅读体验,利于显示终端的推广。图1是本发明的终端文档显示方法的流程图;图2是本发明从待显示文档中提取纯文本信息步骤的流程图;图3是本发明的终端文档显示系统的结构图;图4是本发明的终端文档显示系统中服务器的结构图;图5是本发明的终端文档显示系统中服务器的纯文本信息提取模块的结构图;图6是本发明的终端文档显示系统中终端的结构图。具体实施方式下面结合附图和实施例对本发明进行详细说明。请参阅图1,图1示出了本发明实施例提供的终端文档显示方法的流程。在步骤SlOl中,获取待显示文档。在具体实施过程中,用户可通过PC等终端上传待显示文档至服务器,服务器在获取待显示文档后统一进行处理。在步骤S102中,判断待显示文档是否为纯文本格式文档,若待显示文档不是纯文本格式文档,则进行步骤S103;若待显示文档是纯文本格式文档,则进行步骤S104。其中,纯文本格式就是没有任何文本修饰的,没有任何粗体,下划线,斜体,图形,符号或特殊字符及特殊打印格式的文本,只保存文本,不保存其格式设置。纯文本格式例如可以是txt文档。在步骤S103中,从待显示文档中提取纯文本信息。具体的关于步骤S103的详细描述请参阅图2以及关于图2的相关描述。在步骤S104中,接收终端的下载请求,将相应的纯文本信息发送至终端。在具体实施过程中,终端在发送下载请求时,往往只需要下载文档中的其中一部分或者几页内容,本发明实施例根据终端的下载请求将已经提取的纯文本信息的部分或者其中的几页内容发送至终端,配合终端实现分页下载,无需将所有的纯文本信息进行发送,不仅很好的保证了终端下载的成功率,还提高了终端下载的效率。在步骤S105中,终端将接收到的纯文本信息显示。本发明实施例通过将用户上传的待显示文档进行处理,获取待显示文档的纯文本信息,并根据终端的下载请求发送至终端,终端直接将纯文本信息显示,不必再考虑终端支持的文档格式,极大的避免了由于客制化带来的移动终端与PC的在线阅读内容不一致的问题,很好的提高了用户的阅读体验。请参阅图2,图2为上述步骤S103中从待显示文档中提取纯文本信息步骤的详细描述。在步骤S201中,将待显示文档转换为系统设置的中间文档。优选的,本发明实施例提供的中间文档为便携式文件格式(PortableDocumentFormat,PDF)的文档,当然也可以是其他格式的文档,只要能够方便从中间文档提取文本信息即可,此处不一一列举。在具体实施过程中,本发明实施例还判断待显示文档是否加密,以及判断待显示文档以何种方式加密,在转换为中间文档时,首先解密,然后再转换为中间文档,同时,记录本次解密的方式。在步骤S202中,从转换后的中间文档中抽取纯文本信息。优选的,本发明实施例使用光学符号识别(OpticalCharacterRecognition,OCR)抽取中间文档中的纯文本信息,当然也可以使用其它方式来抽取,此处不一一列举。在具体实施过程中,在从中间文档中抽取纯文本信息时,本发明实施例还针对中间文档中的图像进行文字识别,抽取图像中的文字信息,具体的包括通过分析中间文档的类型、尺寸以及纯文本数据的大小来判断是否需要对中间文档中的图像进行文字辨识,若需要,则对图像中的文字进行辨识;通过分析中间文档中的图像及属性判断是否需要对该图像进行文字辨识,若需要,则对图像中的文字进行辨识,并提取。在步骤S203中,存储抽取后的纯文本信息。在具体实施过程中,本发明实施例将纯文本信息与该纯文本信息对应的待显示文档建立索引,使得用户在下一次阅读时,可直接根据待显示文档获取已经提取的纯文本fe息。在步骤S204中,根据终端的配置参数对纯文本信息进行分页,其中,每个分页的数据量不超过系统设定的容量阈值。优选的,系统设置的容量阈值为300Kb,本发明实施例通过设置一300Kb的容量阈值,若当前显示页面的容量超过300Kb时,即进行分页显示,使得终端能够实现分页下载,减少单次下载的纯文本信息的容量,极大的提高了下载的成功率。其中,配置参数包括终端的屏幕大小、显示字体的字号大小以及每页显示页面的显示字符数,当然还可以包括其他参数,此处不一一列举。在具体实施过程中,本发明实施例根据终端下载请求对应的纯文本信息的总长度,终端的屏幕大小、显示字体的字号大小以及每页显示页面的显示字符数,对发送至终端的纯文本信息进行分页。在具体实施过程中,本发明实施例还对终端下载请求对应的纯文本信息的页码进行有效性判断,判断是否落在当前显示页面正常展现的区间内,若当前显示页面过小,则展现纯文本信息的第一页;若当前显示页面过大,则展现纯文本信息的最后一页。在具体实施过程中,本发明实施例还按字节数对纯文本信息进行分页切割,去除用户浏览时超出当前页面的基本数据,对去除的基本数据进行首尾两端的半个汉字处理,避免某个汉字被分开在两个显示页面,从而提升用户的阅读体验感。在步骤S205中,将纯文本信息按照待显示文档的版式进行排版。即按照未提取纯文本信息之前的待显示文档进行排版,从而保证转换后的真实度,提升用户阅读体验。在步骤S206中,记录配置参数。在步骤S207中,将记录的配置参数与相应的排版后的纯文本信息建立关联后存储。本发明实施例通过在将纯文本信息显示时记录配置参数,在下一次用户通过终端访问时,根据下载请求的标头参数对终端进行识别,若为已记录的终端,则直接根据终端对应的配置参数对纯文本信息进行分页显示,若为初次登录的终端,则显示一推荐配置参数,供用户选择。在具体实施过程中,在记录配置参数的同时,还记录用户参数,用户参数包括用户阅读文档、当前阅读页码、背景颜色等,通过记录用户参数,在下次显示页面时,可以直接根据记录的用户参数获取相应的排版模式。在具体实施过程中,本发明实施例还接收终端的排版指令,根据排版指令变更纯文本信息的分页方式并重新分页,譬如变更纯文本信息的分页字数,或者改变纯文本信息中每页的容量。在图1中的步骤S105中,终端将接收到的纯文本信息显示时,包括以下功能a、纯文本信息按照字数进行分页,每页字数可选;b、显示页面的字号可选,方便不同的终端、不同习惯的阅读人群;C、显示页面的背景颜色可选,适合不同光亮环境;d、显示页面的显示尺寸可选,譬如大、中、小三种显示页面,满足不同终端。在具体实施过程中,本发明实施例还在终端接收用户的收藏指令,将终端当前阅读的纯文本信息保存,在用户下次阅读时,可快速查找所收藏的纯文本信息。本发明实施例的终端可支持多格式的文档阅读,极大的丰富了终端在线阅读的内容,而且,可通过对纯文本信息显示页面进行分页,使得纯文本信息能够根据终端的显示屏的规格自动调节显示页面,减少了纯文本信息一次性下载的传输量,提高纯文本信息下载的成功率,增强了用户的阅读体验。图3示出了本发明实施例提供的文档显示系统的结构,包括服务器31和多个终端32。其中,服务器31获取用户上传的待显示文档,并判断待显示文档是否为纯文本格式文档,若不是,从待显示文档中提取纯文本信息,并根据终端32的下载请求、终端32的配置参数以及数据阈值等将相应的纯文本信息进行分页处理后发送至终端32;终端32接收服务器31发送的纯文本信息后显示。本发明实施例提供的文档显示系统,通过将用户在服务器上传的待显示文档进行处理,获取待显示文档的纯文本信息,并根据终端的下载请求发送至终端,终端直接将纯文本信息显示,不必再考虑终端支持的文档格式,极大的避免了由于客制化带来的终端与PC的在线阅读内容不一致的问题,很好的提高了用户的阅读体验。请参阅图4,图4示出了本发明实施例提供的文档显示系统中服务器的结构。其中,文档获取模块311,用于获取待显示文档;文档判断模块312,用于判断待显示文档是否为纯文本格式文档;若文档判断模块312判断待显示文档不是纯文本格式文档,纯文本信息提取模块313从待显示文档中提取纯文本信息,之后,纯文本信息发送模块314根据终端的下载请求发送相应的纯文本信息至终端;若文档判断模块312判断待显示文档是纯文本格式文档,则纯文本信息发送模块314根据终端的下载请求发送相应的纯文本格式的文档至终端;在具体实施过程中,纯文本信息发送模块314还根据终端的下载请求将纯文本信息的部分发送至终端,配合终端实现分页下载。请参阅图5,图5示出了服务器中纯文本信息提取模块313的结构。其中,文档转换模块3131,用于将待显示文档转换为系统设置的中间文档;优选的,中间文档为PDF格式的文档,当然也可以是其他格式的文档,只要能够方便从中间文档提取文本信息即可,此处不一一列举。纯文本信息抽取模块3132,用于从文档转换模块转换后的中间文档中抽取纯文本信息;在具体实施过程中,本发明实施例通过OCR抽取中间文档中的纯文本信息,当然也可以使用其它方式来抽取,此处不一一列举。分页模块3133,用于根据终端的配置参数对纯文本信息进行分页,其中,每个分页的数据量不超过系统设定的容量阈值;优选的,系统设置的容量阈值为300Kb,本发明实施例通过设置一300Kb的容量阈值,即对容量超过300Kb的纯文本信息,进行分页,使得终端能够实现分页下载,减少单次下载的文档容量,极大的提高了下载的成功率。排版模块3134,用于对分页后的纯文本信息进行排版;在具体实施过程中,在对纯文本信息进行排版时,还按照待显示文档的版式进行排版。配置参数记录模块3135,用于记录终端的配置参数;存储模块3136,用于将记录的配置参数与相应的排版后的纯文本信息建立关联后存储。优选的,配置参数包括终端的屏幕大小、显示字体的字号大小以及每页显示页面的显示字符数,当然还可以包括其他参数,此处不一一列举。本发明实施例根据纯文本信息的总长度,终端的屏幕大小、显示字体的字号大小以及每页显示页面的显示字符数,对纯文本信息的页数进行计算并分页,使得每个分页的数据量不超过系统设定的容量阈值,譬如300Kb。请参阅图6,图6示出了本发明实施例提供的文档显示系统中终端的结构。其中,传输模块321实现终端与服务器之间的通信,包括将用户的下载请求发送至服务器,以及在服务器发送纯文本信息时,接收服务器发送的纯文本信息;纯文本信息显示模块322,用于将传输模块321接收到的的纯文本信息显示。关于终端32的具体的功能在前文已有详细的描述,此处不再赘述。待显示文档待显示文档本发明极大的避免由于客制化带来的显示终端与PC的在线阅读内容不一致的问题,很好的提高了用户的阅读体验,利于显示终端的推广。在上述实施例中,仅对本发明进行了示范性描述,但是本领域技术人员在阅读本专利申请后可以在不脱离本发明的精神和范围的情况下对本发明进行各种修改。权利要求1.一种终端文档显示方法,其特征在于,所述方法包括以下步骤获取待显示文档;判断所述待显示文档是否为纯文本格式文档;若所述待显示文档不是纯文本格式文档,则从所述待显示文档中提取纯文本信息;发送所述纯文本信息至终端,以使所述终端显示所述纯文本信息。2.如权利要求1所述的终端文档显示方法,其特征在于,发送所述纯文本信息至终端的步骤包括根据所述终端的请求将所述纯文本信息的部分发送至所述终端。3.如权利要求1所述的终端文档显示方法,其特征在于,从所述待显示文档中提取纯文本信息的步骤包括将待显示文档转换为系统设置的中间文档;从所述转换后的中间文档中抽取所述纯文本信息。4.如权利要求3所述的终端文档显示方法,其特征在于,所述中间文档为PDF格式的文档。5.如权利要求3所述的终端文档显示方法,其特征在于,从所述待显示文档中提取纯文本信息的步骤包括使用光学符号识别抽取所述中间文档中的所述纯文本信息。6.如权利要求1所述的终端文档显示方法,其特征在于,从所述待显示文档中提取纯文本信息的步骤包括将所述纯文本信息按照所述待显示文档的版式进行排版。7.如权利要求1所述的终端文档显示方法,其特征在于,从所述待显示文档中提取纯文本信息的步骤包括根据所述终端的配置参数对纯文本信息进行分页,其中,每个分页的数据量不超过系统设定的容量阈值;对分页后的纯文本信息进行排版。8.如权利要求7所述的终端文档显示方法,其特征在于,从所述待显示文档中提取纯文本信息的步骤进一步包括记录配置参数;将记录的配置参数与相应的排版后的纯文本信息建立关联后存储。9.如权利要求7或8所述的终端文档显示方法,其特征在于,所述配置参数包括所述终端的屏幕大小、显示字体的字号大小以及每页显示页面的显示字符数。10.—种终端文档显示系统,其特征在于,包括服务器,所述服务器包括文档获取模块,用于获取待显示文档;文档判断模块,用于判断所述待显示文档是否为纯文本格式文档;纯文本信息提取模块,用于从所述待显示文档中提取纯文本信息;以及纯文本信息发送模块,用于发送所述纯文本信息至终端。11.如权利要求10所述的终端文档显示系统,其特征在于,所述纯文本信息发送模块还根据所述终端的请求将所述纯文本信息的部分发送至所述终端。12.如权利要求10所述的终端文档显示系统,其特征在于,所述纯文本信息提取模块包括文档转换模块,用于将待显示文档转换为系统设置的中间文档;纯文本信息抽取模块,用于从所述文档转换模块转换后的中间文档中抽取所述纯文本fe息。13.如权利要求12所述的终端文档显示系统,其特征在于,所述中间文档为PDF格式的文档。14.如权利要求12所述的终端文档显示系统,其特征在于,所述纯文本信息抽取模块通过光学符号识别抽取所述中间文档中的所述纯文本信息。15.如权利要求10所述的终端文档显示系统,其特征在于,所述纯文本信息提取模块还包括排版模块,用于将所述纯文本信息按照所述待显示文档的版式进行排版。16.如权利要求15所述的终端文档显示系统,其特征在于,所述纯文本信息提取模块还包括分页模块,用于根据所述终端的配置参数对纯文本信息进行分页,其中,每个分页的数据量不超过系统设定的容量阈值;所述排版模块对分页后的纯文本信息进行排版。17.如权利要求16所述的终端文档显示系统,其特征在于,所述纯文本信息提取模块还包括配置参数记录模块,用于记录配置参数;存储模块,用于将记录的配置参数与相应的排版后的纯文本信息建立关联后存储。18.如权利要求17所述的终端文档显示系统,其特征在于,所述配置参数包括所述终端的屏幕大小、显示字体的字号大小以及每页显示页面的显示字符数。全文摘要本发明提供了一种终端文档显示方法和系统,该方法包括以下步骤获取待显示文档;判断待显示文档是否为纯文本格式文档;若待显示文档不是纯文本格式文档,则从待显示文档中提取纯文本信息;发送纯文本信息至终端,以使终端显示纯文本信息。本发明极大的避免由于客制化带来的移动终端与PC的在线阅读内容不一致的问题,很好的提高了用户的阅读体验,利于终端阅读的推广。文档编号G06F17/21GK102012894SQ20101055548公开日2011年4月13日申请日期2010年11月19日优先权日2010年11月19日发明者孙鹤飞,曹羽申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1