电子文档生成系统以及电子文档生成装置的制造方法

文档序号:9506800阅读:447来源:国知局
电子文档生成系统以及电子文档生成装置的制造方法【
技术领域
】[0001]本发明涉及生成电子文档的电子文档生成系统以及与此相关的技术。【
背景技术
】[0002]在MFP(多功能一体机(Mult1-Funct1nalPeripheral))等的图像形成装置中,存在扫描原稿来制作电子文档的技术。[0003]在这种电子文档生成技术中,存在通过将扫描图像内的字符区域和非字符区域(照片区域等)分离,以比较高的压缩率压缩非字符区域,并且以比较低的压缩率压缩字符区域,来生成电子文档(例如紧凑roF)的技术(参照专利文献1等)。由此,能够维持字符的容易观看性并且减少电子文档文件的容量(紧凑化)。[0004]另外,也存在生成带文本数据电子文档(下述)的技术(参照专利文献2等)。具体而言,对于原稿的扫描图像(特别是表示字符的图像)实施了光学字符识别处理(以下,也称为OCR(OpticalCharacterRecognit1n)处理),该扫描图像内的字符的文本数据被自动识别,该文本数据以非显示状态重叠嵌入该扫描图像。这样一来,例如,生成了被称为带透明文本H)F(PortableDocumentFormat)(或者可检索的FOF)等的规定形式的电子文档(带文本数据电子文档)。[0005]另外,也存在生成被紧凑化(高压缩化)并且可检索化的电子文档(例如,也称为可检索的紧凑PDF文件等)的技术。在该技术中,进行了由用于紧凑化的一系列的子处理(区域分离处理以及压缩处理等)构成的处理(也称为紧凑化处理)和用于可检索化的OCR处理(也称为可检索化处理),并基于两处理的结果生成了电子文档。[0006]专利文献1:日本特开2008-193234号公报[0007]专利文献2:日本特开2012—073749号公报[0008]然而,基于扫描图像生成电子文档的装置(电子文档生成装置)并不是除了上述的由一系列的子处理构成的处理(紧凑化处理)以外还进行OCR处理(可检索化处理),而是考虑使与该电子文档生成装置不同的其它的装置(也称为协作目标装置)执行OCR处理。更详细而言,考虑有电子文档生成装置首先执行该一系列的子处理,之后使协作目标装置(云服务器等)进行OCR处理,利用从该协作目标装置接收到的OCR结果生成电子文档。[0009]然而,在这样的处理中,在一系列的子处理被连续执行完成之后,才进一步执行与该一系列的子处理不同的其它的处理亦即OCR处理。因此,直至该一系列的子处理结束为止,协作目标装置无法执行OCR处理,无法进行高效的处理。【
发明内容】[0010]因此,该发明的课题在于,提供在由多个装置协作生成电子文档的技术中,能够更高效地生成电子文档的技术。[0011]为了解决上述课题,第一方面的发明是生成电子文档的电子文档生成系统,其特征在于,具备:第一装置,其执行用于根据原稿的扫描图像生成电子文档的第一处理;以及第二装置,其基于来自上述第一装置的委托,执行用于生成上述电子文档的第二处理,并将该第二处理的处理结果发送至上述第一装置,上述第一装置具备:处理执行单元,其是执行上述第一处理的处理执行单元,若在构成上述第一处理的多个子处理中的任意一个中生成在上述第二处理中利用的数据,则在上述多个子处理中未执行的残余的处理存在的阶段将上述数据发送至上述第二装置,并且继续执行上述多个子处理中的残余的处理;接收单元,其从上述第二装置接收由上述第二装置对于上述数据执行的上述第二处理的处理结果;以及生成单元,其基于上述处理执行单元的上述第一处理的处理结果和由上述接收单元接收到的上述第二处理的处理结果,生成上述电子文档。[0012]第二方面的发明的特征在于,在第一方面的发明的电子文档生成系统中,上述第二处理与由上述第一装置的上述处理执行单元执行的上述残余的处理的至少一部分并行地由上述第二装置执行。[0013]第三方面的发明的特征在于,在第一方面或者第二方面的发明的电子文档生成系统中,若上述第一装置的上述处理执行单元在是上述多个子处理中的任意一个的规定的处理中生成上述数据,则将上述数据发送至上述第二装置并使上述第二装置执行上述第二处理,并且使用上述规定的处理的处理结果继续执行上述残余的处理。[0014]第四方面的发明的特征在于,在第三方面的发明的电子文档生成系统中,上述规定的处理是从上述扫描图像分离字符区域的字符区域分离处理。[0015]第五方面的发明的特征在于,在第四方面的发明的电子文档生成系统中,上述第二处理包括关于上述字符区域的光学字符识别处理。[0016]第六方面的发明的特征在于,在第一方面的发明的电子文档生成系统中,上述第一处理包括:从上述扫描图像分离字符区域的字符区域分离处理、从上述扫描图像分离非字符区域的非字符区域分离处理、针对上述字符区域的第一压缩处理、以及针对上述非字符区域的第二压缩处理,上述第二处理包括关于上述字符区域的光学字符识别处理,若上述处理执行单元在上述多个子处理中的上述字符区域分离处理中生成在上述第二处理中利用的字符区域图像数据,则将上述字符区域图像数据发送至上述第二装置,并且继续执行上述多个子处理中上述字符区域分离处理之后进行的残余的处理,上述接收单元从上述第二装置接收与由上述处理执行单元执行的上述残余的处理的至少一部分并行地由上述第二装置执行的上述第二处理的处理结果,上述生成单元基于上述处理执行单元的上述第一处理的处理结果和由上述接收单元接收到的上述第二处理的处理结果,生成上述电子文档,其中,上述电子文档具有分别以相互不同的压缩率压缩上述字符区域和上述非字符区域而得到的各图像,并且具有上述光学字符识别处理的处理结果的文本数据。[0017]第七方面的发明的特征在于,在第一方面的发明的电子文档生成系统中,上述第一处理包括从上述扫描图像分离字符区域的字符区域分离处理和从上述扫描图像分离照片区域来生成照片区域图像数据的照片区域分离处理,上述第二处理包括关于上述字符区域的光学字符识别处理,若上述处理执行单元在上述多个子处理中的上述字符区域分离处理中生成在上述第二处理中利用的字符区域图像数据,则将上述字符区域图像数据发送至上述第二装置,并且继续执行上述多个子处理中上述字符区域分离处理之后进行的残余的处理,上述接收单元从上述第二装置接收与由上述处理执行单元执行的上述残余的处理的至少一部分并行地由上述协作目标装置执行的上述第二处理的处理结果,上述生成单元基于上述处理执行单元的上述第一处理的处理结果和由上述接收单元接收到的上述第二处理的处理结果生成上述电子文档,其中,上述电子文档具有上述照片区域和上述光学字符识别处理的处理结果的文本数据。[0018]第八方面的发明的特征在于,在第七方面的发明的电子文档生成系统中,还具备第三装置,其基于来自上述第一装置的委托,执行用于生成上述电子文档的第三处理,并将该第三处理的处理结果发送至上述第一装置,上述第一处理还包括从上述扫描图像分离与上述字符区域和上述照片区域都不同的特定种类的区域的特定区域分离处理,上述第三处理包括从包括多个个别照片区域的上述照片区域图像数据分别剪切出上述多个个别照片区域的个别区域剪切处理,若上述处理执行单元在上述多个子处理中的上述照片区域分离处理中生成在上述第三处理中利用的上述照片区域图像数据,则将上述照片区域图像数据发送至上述第三目标装置,并且继续执行上述多个子处理中上述照片区域分离处理之后进行的残余的处理,上述接收单元从上述第三装置接收与上述照片区域分离处理之后进行的上述残余的处理的至少一部分并行地由上述第三装置执行的上述第三处理的处理结果,上述生成单元基于上述处理执行单元的上述第一处理的处理结果、由上述接收单元接收到的上述第二处理的处理结果、以及由上述接收单元接收到的上述第三处理的处理结果生成上述电子文档,其中,上述电子文档具有上述特定种类的区域、上述多个个别照片区域、以及上述光学字符识别处理的处理结果的文本数据。[0019]第九方面的发明的特征在于,在第一方面至第八方面的任意一项的发明的电子文档生成系统中,上述第一装置是信息终端,上述第二装置是服务器。[0020]第十方面的发明的特征在于,在第一方面至第八方面的任意一项的发明的电子文档生成系统中,上述第一装置是图像形成装置,上述第二装置是服务器。[0021]第十一方面的发明的特征在于,在第一方面至第八方面的任意一项的发明的电子文档生成系统中,上述第一装置是图像形成装置,上述第二装置是信息终端。[0022]第十二方面的发明是与协作目标装置协作来生成电子文档的电子文档生成装置,其特征在于,具备:处理执行单元,其是执行用于根据原稿的扫描图像生成电子文档的第一处理的处理执行单元,若在构成上述第一处理的多个子处理中的任意一个中生成在由上述协作目标装置执行的第二处理中利用的数据,则在上述多个子处理中未执行的残余的处理存在的阶段将上述数据发送至上述协作目标装置,并且继续执行上述多个子处理中的残余的处理;接收单元,其从上述协作目标装置接收由上述协作目标装置对于上述数据执行的上述第二处理的处理结果;以及生成单元,其基于上述处理执行单元的上述第一处理的处理结果和由上述接收单元接收到的上述第二处理的处理结果,生成上述电子文档。[0023]第十三方面的发明的特征在于,在第十二方面的发明的电子文档生成装置中,上述接收单元从上述协作目标装置接收与由上述处理执行单元执行的上述残余的处理的至少一部分并行地由上述协作目标装置执行的上述第二处理的处理结果。[0024]第十四方面的发明的特征在于,在第十二方面或者第十三方面的发明的电子文档生成装置中,若上述处理执行单元在是上述多个子处理中的任意一个的规定的处理中生成上述数据,则将上述数据发送至上述协作目标装置并使上述协作目标装置执行上述第二处理,并且使用上述规定的处理的处理结果继续执行上述残余的处理。[0025]第十五方面的发明的特征在于,在第十四方面的发明的电子文档生成装置中,上述规定的处理是从上述扫描图像分离字符区域的字符区域分离处理。[0026]第十六方面的发明的特征在于,在第十五方面的发明的电子文档生成装置中,上述第二处理包括关于上述字符区域的光学字符识别处理。[0027]第十七方面的发明的特征在于,在第十二方面的发明的电子文档生成装置中,上述第一处理包括:从上述扫描图像分离字符区域的字符区域分离处理、从上述扫描图像分离非字符区域的非字符区域分离处理、针对上述字符区域的第一压缩处理、以及针对上述非字符区域的第二压缩处理,上述第二处理包括关于上述字符区域的光学字符识别处理,若上述处理执行单元在上述多个子处理中的上述字符区域分离处理中生成在上述第二处理中利用的字符区域图像数据,则将上述字符区域图像数据发送至上述协作目标装置,并且继续执行上述多个子处理中上述字符区域分离处理之后进行的残余的处理,上述接收单元从上述协作目标装置接收与由上述处理执行单元执行的上述残余的处理的至少一部分并行地由上述协作目标装置执行的上述第二处理的处理结果,上述生成单元基于上述处理执行单元的上述第一处理的处理结果和由上述接收单元接收到的上述第二处理的处理结果,生成上述电子文档,其中,上述电子文档具有分别以相互不同的压缩率压缩上述字符区域和上述非字当前第1页1 2 3 4 5 6 
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1