一种文档识别和显示方法及其移动终端与流程

文档序号:12719563阅读:158来源:国知局
一种文档识别和显示方法及其移动终端与流程

本发明涉及电子文档排版及显示技术领域,尤其涉及一种文档识别和显示方法及其移动终端。



背景技术:

随着互联网技术的发展,使得消费者对终端设备的要求越来越高,例如,需要手机、电脑、电视等终端具备电子文档的识别和功能。

现有技术中,首先终端对电子文档进行识别,之后将识别后的电子文档显示在终端中。但是,现有的识别功能需要终端具有较强的计算能力,如果终端的计算能力差,则存在识别速度缓慢,电子文档的识别精度差等问题,进一步地,由于现有的排版显示形式是基于大屏幕的显示装置,并不适合移动终端显示文档,最终都会影响移动终端对电子文档的显示。



技术实现要素:

本发明的目的在于提供一种文档识别和显示方法及其识别装置,用于快速准确地识别电子文档并清晰地显示在移动终端。

为达到上述目的,本发明采用如下技术方案:

本发明的第一方面提供一种文档识别和显示方法,该文档识别和显示方法包括识别电子文档和显示电子文档,其中识别电子文档包括:

S11、移动终端获取电子文档的图像数据。

S12、根据获得的图像数据,将图像数据中的文字数据和图片数据进行分离。

S13、将图像数据发送至多个处理器,分别进行文字数据、图片数据、格式数据以及定位数据的处理。

S14、根据处理后的文字数据、图片数据、格式数据以及定位数据,分别生成文字信息、图片信息、格式信息以及定位信息。

S15、将文字信息、图片信息、格式信息以及定位信息分别进行打包,发送给上述移动终端。

进一步识别电子文档包括:

S16、上述移动终端解析文字信息、图片信息、格式信息以及定位信息。

S17、根据解析后的格式信息以及移动终端的显示信息生成显示框架。

S18、在显示框架内,根据定位信息,对文字信息以及图片信息进行显示,得到能够显示的电子文档。

格式信息包括页面布局和页面属性,根据每一个特定的显示终端对格式信息进行调整,用于显示该电子文档中的所有信息。

文字信息能够根据格式信息进行调整;图像信息能够根据格式信息进行调整。

页面属性包括:页面的大小、总页数、分辨率、页边距、背景以及屏幕的使用状态。

屏幕的信息,包括屏幕尺寸和屏幕分辨率。

定位信息包括:文字定位信息、图片定位信息以及文字与图片之间的定位信息;其中,文字定位信息包括,同一页面上的文字之间的前后顺序、同一页面上不同行之间的前后顺序、以及页面之间的前后顺序;图片定位信息包括,同一页面上的图片之间的前后顺序以及不同页面之间的前后顺序;文字与图片之间的定位信息包括,锁定特定图片环绕或前或后的文字,并根据锁定的环绕或前或后的文字,确定该图片的位置。

文档识别和显示方法可知,由于采用并行处理方式,从而大幅度提升处理速度;另外,依据格式信息以及移动终端的显示信息动态生成显示框架,从而使得移动终端对文档的显示能力显著提升。

本发明的第二方面提供一种移动终端,该移动终端用于识别和显示电子文档,其中,该移动终端包括:扫描单元,用于扫描电子文档,并获取电子文档的图像数据;与扫描单元相连的分离单元,用于根据获得的图像数据,将图像数据中的文字数据和图片数据进行分离;与分离单元相连的处理单元,用于将图像数据发送至多个处理器,分别进行文字数据、图片数据、格式数据以及定位数据的处理;与处理单元相连的接收单元,用于接收处理后的根据文字数据、图片数据、格式数据、以及定位数据生成的文字信息、图片信息、格式信息以及定位信息;与接收单元相连的打包单元,用于将文字信息、图片信息、格式信息以及定位信息分别进行打包,发送给上述移动终端。

该移动终端还包括:

与打包单元相连的解析单元,用于解析文字信息、图片信息、格式信息以及定位信息;与解析单元相连的框架单元,用于根据解析后的格式信息以及移动终端的显示信息生成显示框架;与框架单元相连的显示单元,用于在显示框架内,根据定位信息,对文字信息以及图片信息进行显示,得到能够显示的电子文档。

处理单元包括定位模块,用于确定同一页面上的文字之间的前后顺序、同一页面上不同行之间的前后顺序、以及页面之间的前后顺序;用于确定同一页面上的图片之间的前后顺序以及不同页面之间的前后顺序;用于锁定特定图片环绕或前或后的文字,并根据锁定的环绕或前或后的文字,确定该图片的位置。

由于本发明中的移动终端,可显示根据上述本发明的第一方面所形成的电子文档,因此,该移动终端可以通过并行处理方式处理获得的图像数据,从而大幅提高处理文档的速度;进一步地,提升了该移动终端的处理能力。并且,依据格式信息以及移动终端的显示信息动态生成显示框架,从而使得移动终端对文档显示能力显著提升。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为实施例中识别电子文档的流程图;

图2为实施例中显示电子文档的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

本实施例提供一种文档识别和显示方法,该文档识别和显示方法包括识别电子文档和显示电子文档,如图1所示,其中识别电子文档包括:

S11、移动终端获取电子文档的图像数据。

获取电子文档的方式有多种,示例性地,通过移动终端配置扫描仪获得电子文档,或者通过直接将电子文档与扫描仪器进行连接扫描获得电子文档,或者通过其他途径,例如网络下载获得电子文档。

S12、根据获得的图像数据,将图像数据中的文字数据和图片数据进行分离。

将文字数据和图片数据进行分离的方式有很多种,示例性地,通过在移动终端中置入OCR(Optical Character Recognition,光学字符识别)软件,或者在移动终端的CPU中设置OCR等,将电子文档中的文字和图片进行分离。

S13、将图像数据发送至多个处理器,分别进行文字数据、图片数据、格式数据以及定位数据的处理。

示例性地,图像数据通过无线或有线的传输方式发送至多个处理器,例如,通过蓝牙等,多个处理器并行的进行处理,从而有效地提高处理速度。

S14、根据处理后的文字数据、图片数据、格式数据以及定位数据,分别生成文字信息、图片信息、格式信息以及定位信息。

为了使本领域技术人员更加清楚地理解本方案,下面对多个处理器的并行处理过程进行详细的描述:

将文字数据发送至处理器一进行文字处理,将图片数据发送至处理器二进行图片处理,将图像数据发送至处理器三进行格式处理,将图像数据发送至处理器四进行定位处理。接收处理器一处理后的文字数据,接收处理器二处理后的图片数据,接收处理器三处理后的格式数据,以及接收处理器四处理后的定位数据,并根据处理后的文字数据、图片数据、格式数据以及定位数据,生成文字信息、图片信息、格式信息,以及定位信息。

S15、将文字信息、图片信息,格式信息以及定位信息分别进行打包,发送给上述移动终端。打包过程中,只是对所占空间进行压缩,并不改变信息的前后顺序,具体地,以文字信息为例,文字信息中的每一字符的前后顺序并不会在打包过程中进行改变。其余图片信息、格式信息以及定位信息也是同样的道理。

以上是如何识别文档,以下说明如何显示文档。具体的,如图2所示,显示文档包括:

S16、上述移动终端解析文字信息、图片信息、格式信息以及定位信息;

移动终端接收各种打包信息之后,对这些信息进行解析,解析的过程可包括解压,识别信息。

S17、根据解析后的格式信息以及移动终端的显示信息生成显示框架。

该显示框架可预先生成,并根据格式信息和显示信息进行调整,或者动态生成。在调整或动态生成时,可读取格式信息,例如显示页数以及移动终端的显示信息中的移动终端的屏幕尺寸,从而构造与屏幕尺寸和显示页数相配合的显示框架。例如移动终端是6寸屏,而格式信息中标准尺寸为5寸的显示页数是10页,这时需要构造一个总页数为小于10页,例如8页的框架,以容纳文字信息的显示,并进一步需要考虑图像信息等内容。

根据生成的显示框架,可在显示框架内添加解析之后的文字信息以及图片信息,从而生成该电子文档。

S18、在显示框架内,根据定位信息,对文字信息以及图片信息进行显示,得到能够显示的电子文档。

该电子文档不仅能够在显示框架内添加文字信息以及图片信息,也可对显示的文字信息以及图片信息进行排版。示例性地,格式信息包括页面布局和页面属性,根据每一个特定的显示终端对格式信息进行调整,用于显示该电子文档中的所有信息。该页面属性包括:页面的大小、总页数、分辨率、页边距、背景以及屏幕的使用状态。屏幕的使用状态包括,是否全屏;是否半屏;屏幕亮度的选择;是否横屏。另外,文字信息能够根据格式信息进行调整;图像信息能够根据格式信息进行调整。

示例性地,如果某电子文档包括多个格式信息,首先,可从中随机选择一个,作为当前使用的格式信息。接着,在选定格式信息之后,需要显示的电子文档,则会显示在该移动终端中。

另外,也可根据用户自身喜好对格式信息进行选择,选择之后,相应的格式信息所包含的内容,则会相应地改动,从而在该格式信息下显示电子文档。

也可在该格式信息下对电子文档中所显示的字体、字号、颜色以及背景等页面属性进行设置。设置完成后,该电子文档即可显示在搭建好的显示框架中。

需要提及的是,若改变该页面的显示格式,则使得内容多于页面所承受,则该页面被排满,则按照页面的先后顺序,在接下来的一页当中将剩余的内容显示,以此类推,直至全部内容被排满。在具体显示时,可以直接按照排版的结果在对应位置上显示对应的显示内容。并且,在显示之后,还可以提供调整入口,如果用户想要修改页边距、页面的大小等,则可以通过具体的调整入口进行调整。相应的,阅读器在接收到用户的调整请求后,就可以对页面样式进行修改。

由本实施例中的文档识别和显示方法可知,将文字数据以及图片数据发送至不同的处理器,由于不同处理器同时工作,从而可快速的识别电子文档,进一步地,将生成的电子文档显示在显示框架内,从而将电子文档清晰地显示在终端中。

显然地,本实施例中涉及的移动终端可为手机、电脑、电视、Pad等可用于显示电子文档的设备。

在实际使用过程中,用户可根据自身的用户体验,对页面属性进行调整。例如,最初利用横屏进行浏览,可以按照横屏对应的页面属性进行排版及显示。之后,如果用户将移动终端设置成竖屏,则可以切换至竖屏对应的页面属性进行排版及显示。在设备旋转时,移动终端可以在当前浏览页面添加电子标记或电子书签,用于记录下当前位置。切换页面属性之后,可以直接跳转到该部分内容所在的页面,从而完成横竖屏的切换,也不影响用户体验。

为了更清楚地阐述格式信息,下面以具体的实例详细的对格式信息进行描述:

用户根据自身屏幕的大小以及阅读习惯,对页面属性进行调节,例如,每页显示的数字为500字;也可将总页数进行设置,例如总页数为300页;调节屏幕的分辨率等,从而制定适合每一位用户的参数。

对于对文字信息或者图片信息的调整,都不能改变字符之间、图片之间以及字符与图片直接的顺序,示例性地,本实施例中的定位信息包括:文字定位信息、图片定位信息以及文字与图片之间的定位信息;

其中,文字定位信息包括,同一页面上的文字之间的前后顺序、同一页面上不同行之间的前后顺序、以及页面之间的前后顺序;图片定位信息包括,同一页面上的图片之间的前后顺序以及不同页面之间的前后顺序;文字与图片之间的定位信息包括,锁定特定图片环绕或前或后的文字,并根据锁定的环绕或前或后的文字,确定该图片的位置。

文字定位信息、图片定位信息以及文字与图片之间的定位信息,从而保证电子文档中的文字和图片的先后顺序,从而使得用户更好的使用该电子文档。

本实施例最终生成的电子文档,可为PDF格式,还可为word格式,或终端可支持的格式,具体格式可根据用户的需要,以及移动终端可支持的格式进行选择。

实施例二

本实施例提供一种显示装置,该显示装置用于显示上述实施例一所提及的识别和显示电子文档,其中,该显示装置包括:

扫描单元,用于扫描电子文档,并获取电子文档的图像数据;与扫描单元相连的分离单元,用于根据获得的图像数据,将图像数据中的文字数据和图片数据进行分离;与分离单元相连的处理单元,用于将图像数据发送至多个处理器,分别进行文字数据、图片数据、格式数据以及定位数据的处理;与处理单元相连的接收单元,用于接收处理后的根据文字数据、图片数据、格式数据、以及定位数据生成的文字信息、图片信息、格式信息以及定位信息;与接收单元相连的打包单元,用于将文字信息、图片信息、格式信息以及定位信息分别进行打包,发送给上述移动终端。

该移动终端还包括:与打包单元相连的解析单元,用于解析文字信息、图片信息、格式信息以及定位信息;与解析单元相连的框架单元,用于根据解析后的格式信息以及移动终端的显示信息生成显示框架;与框架单元相连的显示单元,用于在显示框架内,根据定位信息,对文字信息以及图片信息进行显示,得到能够显示的电子文档。

处理单元包括定位模块,用于确定同一页面上的文字之间的前后顺序、同一页面上不同行之间的前后顺序、以及页面之间的前后顺序;用于确定同一页面上的图片之间的前后顺序以及不同页面之间的前后顺序;用于锁定特定图片环绕或前或后的文字,并根据锁定的环绕或前或后的文字,确定该图片的位置。

根据本实施例中的显示装置,可快速地将识别电子文档,并将该电子文档清晰地显示在终端。需要注意的是,该显示装置还可与外部网络(通信网络)连接,其连接方法可为有线连接,也可为无线连接。

另外,由于定位模块的存在,保证了文字之间、图片之间以及图片与文字之间的先后顺序,进一步地,使用户更好的阅读或对电子文档进行处理。

进一步地,该显示装置可为图像形成装置。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1