电子文档生成系统以及电子文档生成装置的制造方法_5

文档序号:9506800阅读:来源:国知局
而言,生成了具有照片区域(多个个别照片区域)和文本数据(OCR处理的处理结果)的电子文档(00XML形式的电子文档)500。在该生成处理中,利用了处理P1的处理结果(字符区域210的图像数据、照片区域220A的图像数据、以及表区域220D的图像数据等)和OCR处理P2的处理结果(文本数据)。
[0138]根据以上所述的方式,与第一实施方式相同地,在OCR处理P2中利用的数据(字符区域图像数据)在紧凑化处理P1的中途被发送至云服务器90,所以由云服务器90执行的OCR处理P2不需要等待紧凑化处理P1的结束就能够开始。因此,能够实现处理的效率化。换言之,在由多个装置协作来生成电子文档的技术中,能够更高效地生成电子文档。
[0139]另外,由云服务器90执行的OCR处理P2不需要等待处理P1的结束,就对于处理P1的至少一部分的处理并行执行,所以能够实现处理的进一步的效率化。
[0140]< 3.第三实施方式>
[0141]第三实施方式是第二实施方式的变形例。以下,以与第二实施方式的不同点为中心进行说明。
[0142]在该第三实施方式中,不仅是OCR处理P2,处理P1中的一部分的处理(个别区域剪切处理以及个别区域压缩处理)也在与外部终端50不同的装置中执行。这里,OCR处理P2在云服务器90A中执行,该一部分的处理(个别区域剪切处理以及个别区域压缩处理)在云服务器90B中执行。
[0143]在云服务器90B安装有执行从照片区域剪切个别区域的个别区域剪切处理和将该个别区域分别以JPEG形式压缩的个别区域压缩处理的应用程序130。云服务器90B通过该应用程序130执行个别区域剪切处理和个别区域压缩处理(JPEG压缩处理)。
[0144]在第三实施方式中,也执行了与图4相同的动作(但是,除了步骤S21以外)。详细而言,外部终端50执行到图4的步骤S16为止的处理,云服务器90执行对应的处理(步骤S31?S33)。另外,在步骤S16之后执行了图9所示的动作。
[0145]图9是表示外部终端50以及云服务器90(90B)中的动作的流程图。外部终端50通过执行电子文档生成应用程序110,来接着图4的步骤S16的处理继续执行如图9的左侧所示的处理。另外,云服务器90B通过执行应用程序130,来执行如图9的右侧所示的处理。另外,图10是表示第三实施方式的动作的概略的概念图。
[0146]第三实施方式中的处理P1是由如下的多个子处理构成的处理。该多个子处理包含有字符区域分离处理、照片区域分离处理、其他区域分离处理(表区域分离处理)。第三实施方式的处理P1未包含有个别区域剪切处理以及个别区域压缩处理。
[0147]在步骤S14中,若处理P1中的最初的子处理(具体而言,从扫描图像分离提取字符区域210的字符区域分离处理)结束,则作为其处理结果的图像数据(字符区域210的图像数据)被发送至云服务器90A。
[0148]另外,在步骤S14中的发送后的步骤S15中,外部终端50继续执行该多个子处理中的(未执行的)残余的处理(照片区域分离处理等)。
[0149]之后,若外部终端50在步骤S17中结束处理P1中的规定的子处理(具体而言,从扫描图像分离提取照片区域的照片区域分离处理),则将作为其处理结果的照片区域图像数据(照片区域的图像数据)发送至云服务器90B。该照片区域图像数据与应该实施处理P3(个别区域剪切处理以及个别区域压缩处理)的主旨(处理委托)一起被从外部终端50发送至云服务器90B。
[0150]在步骤S17中的发送处理后,外部终端50继续执行该多个子处理中的(未执行的)残余的处理(步骤S18)。
[0151]其中,处理P1中字符区域分离处理之后进行的残余的处理的全部或者一部分(例如,照片区域分离处理)对于云服务器90中的OCR处理P2并行执行。
[0152]另外,处理P1中照片区域分离处理之后进行的残余的处理的全部或者一部分(例如,表区域分离处理)对于云服务器90中的处理P3并行执行。
[0153]另一方面,若由云服务器90B执行中的应用程序130接受(接收)在步骤S17中由外部终端50发送的上述的处理指示和照片区域的图像数据(步骤S41),则进入步骤S42。在步骤S42中,云服务器90B (应用程序130)基于该处理指示以及图像数据执行处理P3 (个别区域剪切处理以及个别区域压缩处理)。然后,应用程序130将处理P3的处理结果的图像数据(各个别区域的压缩后的图像数据)朝向电子文档生成应用程序110输出(步骤S43)。换言之,从云服务器90B (应用程序130)朝向外部终端50 (电子文档生成应用程序110)送出(发送)了处理P3的处理结果。
[0154]之后,在步骤S22中,外部终端50基于在步骤S16中从云服务器90A接收到的处理结果(OCR处理P2的处理结果)、在步骤S19中从云服务器90B接收到的处理结果(处理P3的处理结果)、以及在外部终端50自身执行的处理P1的处理结果(表区域的图像数据等),生成电子文档500。详细而言,生成了具有表区域、多个个别照片区域、以及文本数据(OCR处理的处理结果)的电子文档(00XML形式的电子文档)500。
[0155]根据以上所述的方式,由云服务器90执行的OCR处理P2以及处理P3分别不需要等待处理P1的结束并且对于处理P1的至少一部分的处理并行执行,所以能够实现处理的效率化。
[0156]此外,在图9中,为了图示的方便,在步骤S17之前接收到OCR处理P2的处理结果(图4的步骤S16),但并不局限于此,也可以在步骤S17以后的适当的时刻(例如,步骤S19之后的时刻等)接收OCR处理P2的处理结果。特别是,处理P2、P3分别由多个不同的云服务器90A、90B并行地处理,由此能够实现处理的进一步的效率化。
[0157]< 4.变形例等>
[0158]以上,对该发明的实施方式进行了说明,但该发明并不局限于上述说明的内容。
[0159]例如,在上述各实施方式中,OCR处理用的图像数据以页单位从外部终端50发送至云服务器90,但并不局限于此。具体而言,也可以每次利用外部终端50使用图像处理等提取出比页单位小的单位(例如,段落单位或者行单位等)的部分图像数据,该各部分图像数据都分别从外部终端50发送至云服务器90。而且,也可以OCR处理等以这些单位由云服务器90实施,该OCR的处理结果从云服务器90发送至外部终端50。
[0160]图11是表示这样的改变例的图。图11示出了对于字符区域210内的多个部分区域(例如多个行区域)230按照每个部分区域由云服务器90执行了 OCR处理的方式。而且,作为每个部分区域的OCR结果的文本数据250配置在电子文档500中的对应区域510 (与字符区域210对应的区域)内。特别是,外部终端50检测扫描图像200内的各行区域的位置(检测位置)(X,Y),将各行区域的OCR结果配置在电子文档500中与该检测位置(X,Y)对应的位置。因此,能够将各行的OCR结果配置在正确的位置。此时,优选,对关于多个部分区域230的多个图像数据文件,赋予了具有相互识别各部分区域的标识符的文件名,在外部终端50与云服务器90之间授受。对于表示关于该多个图像数据文件的OCR处理的处理结果的文本文件也相同,优选赋予了具有相互识别各部分区域的标识符的文件名,在外部终端50与云服务器90之间授受。由此,能够相互并行执行针对多个部分区域的OCR处理,并且相互区别多个部分区域(以及各个的OCR处理结果)。
[0161]另外,在上述各实施方式中,OCR处理在云服务器90 (90A)中被作为处理P2执行,但并不局限于此,也可以代替OCR处理(或者除了 OCR处理以外)翻译处理被作为处理P2在云服务器90(90A)中执行。更详细而言,也可以使针对扫描图像的OCR处理由外部终端50 (或者MFP10)执行,作为其处理结果的文本数据从外部终端50发送至云服务器90,针对该文本数据的翻译处理由云服务器90执行。而且,也可以基于该翻译处理的处理结果,在外部终端50中生成电子文档。或者,也可以在云服务器90中执行OCR处理和翻译处理的双方,外部终端50基于其处理结果生成电子文档。
[0162]或者,图像检索处理也可以在云服务器90中被作为处理P2执行。更详细而言,也可以使针对扫描图像的OCR处理由外部终端50 (或者MFP10)执行,作为其处理结果的文本数据中的一部分(指定字符串等)从外部终端50发送至云服务器90,将该指定字符串作为检索关键词的图像检索处理由云服务器90执行。而且,也可以基于该图像检索处理的处理结果,在外部终端50中生成电子文档。更详细而言,也可以生成将作为该图像检索处理的处理结果从云服务器90发送来的图像配置在该检索关键词附近的位置的电子文档。
[0163]或者,字符图像的压缩处理也可以被作为处理P2执行。
[0164]或者,处理P2既可以是作为OCR处理的前处理的图像处理(例如,边缘强调处理以及/或者浓度调整处理)等,也可以是与OCR处理无关地进行的图像处理等。并且,处理P2也可以包括(压缩发送来的)字符图像的伸长处理等。
[0165]或者,处理P2既可以是针对照片图像的图像处理(平滑化处理、颜色变换处理、色调再现处理等),也可以是照片图像的压缩处理等。另外,处理P2也可以包括(压缩发送来的)照片图像的伸长处理等。
[0166]另外,在上述各实施方式中,例示了在MFP10中生成的扫描图像被发送至外部终端50,从外部终端50对于其他的云服务器90,委托了关于扫描图像的处理P2 (、P3)的方式,但并不局限于此。
[0167]例如,在不具备外部终端50而具备MFP10和云服务器90而构成的系统1(参照图
12)中,上述各实施方式的外部终端50的动作也可以由MFP10执行。更详细而言,也可以在MFP10中执行处理P1,在云服务器90中执行处理P2(、P3)。
[0168]或者,在不具备云服务器90而具备MFP10和外部终端50而构成的系统1(参照图
13)中,也可以使上述各实施方式的外部终端50的动作由MFP10执行,上述各实施方式的云服务器90的动作(OCR处理等)由外部终端50执行。更详细而言,也可以在MFP10中执行处理P1,在外部终端50中执行处理P2(、P3)。
[0169]符号说明
[0170]1...电子文档生成系统;10...MFP(图像形成装置);50...外部终端;90、90A、90B...云服务器;200...扫描图像;210...字符区域;220...非字符区域;500...电子文档;510...对应区域;520...图像数据。
【主权项】
1.一种电子文档生成系统,是生成电子文档的电子文档生成系统,其特征在于,具备: 第一装置,其执行用于根据原稿的扫描图像生成电子文档的第一处理;以及 第二装置,其基于来自所述第一装置的委托来执行用于生成所述电子文档的第二处理,并将该第二处理的处理结果发送至所述第一装置, 所述第一装置具备: 处理执行单元,其是执行所述第一处理的处理执行单元,若在构成所述第一处理的多个子处理中的任意一个中生成在所述第二
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1