电子文件生成装置及其控制方法、电子文件生成系统的制作方法_4

文档序号:9649152阅读:来源:国知局
,例示外部终端50执行对扫描图像200内的多个行区域400的相互间的行间区域分别附加分割线L(图12)的处理作为“图像加工处理”的方式。外部终端50通过实施这样的“图像加工处理”,来(有意图地)使云服务器90判定为该多个行区域400是相互不同的单位识别区域,从云服务器90取得所希望的处理结果(在针对各行区域400的文字识别结果的末尾分别附加了分割码的文本数据550)。
[0151]在第2实施方式中,也与第1实施方式同样地分别进行图4的各处理。
[0152]但是,第2实施方式的图像加工处理(步骤S14)的处理内容与第1实施方式的图像加工处理(步骤S14)的处理内容不同。
[0153]具体如图12所示,外部终端50 (图像生成部66)针对扫描图像201实施对扫描图像201内的行区域401?407的相互间的行间区域分别附加分割线L(L1?L6)的处理作为“图像加工处理”(步骤S14),来生成识别对象图像502(步骤S15)。其中,这里遍布识别对象图像500(502)的水平方向的整个宽度附加该分割线L(L1?L6)。
[0154]另外,第2实施方式的步骤S17的详细内容与第1实施方式的步骤S17的详细内容不同。
[0155]具体而言,云服务器90基于从外部终端50接收到的识别对象图像502内的分割线L1?L6,将识别对象图像502内的行区域401?407的每一个判定为相互不同的单位识别区域。而且,云服务器90针对识别对象图像502实施OCR处理,生成在针对行区域401?407的文字识别结果的末尾分别附加了分割码的文本数据551 (图9)作为针对识别对象图像502的OCR处理结果(步骤S17)。
[0156]其中,步骤S14以及S17以外的处理与上述第1实施方式同样地进行。
[0157]根据这样的方式,能够获得与上述第1实施方式同样的效果。
[0158]<3.第3实施方式〉
[0159]第3实施方式是第1实施方式的变形例。以下,以与第1实施方式的不同点为中心来进行说明。
[0160]在该第3实施方式中,云服务器90基于OCR处理的处理对象图像内的末尾识别图像(表示是单位识别区域的末尾的图像)来判定(识别)单位识别区域。具体而言,当在处理对象图像内的某一行区域存在末尾识别图像时,云服务器90将到该某一行区域为止的1个或者2个以上的行区域与下一行区域以后的1个或者2个以上的行区域分别判定为单位识别区域。而且,云服务器90生成在针对各单位识别区域的文字识别结果的末尾分别附加了分割码的文本数据550。基于这样的判定基准,云服务器90将处理对象图像内的文字区域划分为多个单位识别区域。
[0161]另外,在第3实施方式中,例示外部终端50执行在扫描图像200内的多个行区域400各自的末尾附加末尾识别图像430 (图13)的处理作为“图像加工处理”的方式。外部终端50通过实施这样的“图像加工处理”,来(有意图地)使云服务器90判定为该多个行区域400是相互不同的单位识别区域,从云服务器90取得所希望的处理结果(在针对各行区域400的文字识别结果的末尾分别附加了分割码的文本数据550)。
[0162]在第3实施方式中,也与第1实施方式同样地分别进行图4的各处理。
[0163]但是,第3实施方式的图像加工处理(步骤S14)的处理内容与第1实施方式的图像加工处理(步骤S14)的处理内容不同。
[0164]具体而言,外部终端50 (图像生成部66)将在扫描图像201内的行区域401?407中最终行(行区域407)以外的行区域401?406各自的末尾附加末尾识别图像430的处理作为“图像加工处理”并对扫描图像201实施(步骤S14),来生成识别对象图像500 (503)(步骤S15)。这里,如图13所示,使换行码可视化后的图像(“Yn”)作为末尾识别图像430(431?436)被附加在行区域401?406各自的末尾而生成识别对象图像503。此外,这里将使换行码可视化后的图像(“Υη”)例示为末尾识别图像430,但并不局限于此,末尾识别图像430例如也可以是表示图形(三角形、四边形等)的图像(包括:图标等)。
[0165]另外,第3实施方式的步骤S17的详细内容与第1实施方式的步骤S17的详细内容不同。
[0166]具体而言,云服务器90从该识别对象图像503内的文字区域提取多个行区域((为了与原来的行区域401?407进行区别)也称为“新的行区域”)。例如,云服务器90从该识别对象图像503内的文字区域提取第一行的新的行区域。在该第一行的新的行区域中包括:原来的行区域401以及末尾识别图像431。同样,云服务器90分别提取第2行以后的新的行区域(分别包括:原来的各行区域402?407以及各末尾识别图像432?436 (最终行区域仅为行区域407))。而且,云服务器90识别为在新的行区域各自的末尾(除了最终行之外)存在末尾识别图像431?436,将被末尾识别图像431?436划分了的行区域(即原来的行区域401?407)的每一个判定为相互不同的单位识别区域。然后,云服务器90对识别对象图像503实施OCR处理,生成在针对行区域401?407的文字识别结果的末尾分别附加了分割码的文本数据551 (图9)作为针对识别对象图像503的OCR处理结果(步骤S17)。
[0167]其中,步骤S14以及S17以外的处理与上述第1实施方式同样地进行。
[0168]根据这样的方式,能够获得与上述第1实施方式同样的效果。
[0169]<4.第4实施方式>
[0170]第4实施方式是第1实施方式的变形例。以下,以与第1实施方式的不同点为中心来进行说明。
[0171]在该第4实施方式中,云服务器90基于OCR处理的处理对象图像内的各行区域的文字颜色将各行区域判定(识别)为单位识别区域。具体而言,在处理对象图像内的某一行区域(整体)的文字颜色与下一行区域(整体)的文字颜色不同的情况下,云服务器90将处理对象图像内的到该某一行区域为止的1个或者2个以上的行区域与下一行区域以后的1个或者2个以上的行区域分别判定为单位识别区域。而且,云服务器90生成在针对各单位识别区域的文字识别结果的末尾分别附加了分割码的文本数据550。基于这样的判定基准,云服务器90将处理对象图像内的文字区域划分为多个单位识别区域。
[0172]另外,在第4实施方式中,例示外部终端50执行将各行区域400的文字颜色设定为与和各行区域400分别邻接的邻接行区域的文字颜色不同的文字颜色的处理作为“图像加工处理”的方式。外部终端50通过实施这样的“图像加工处理”,来(有意图地)使云服务器90判定为该多个行区域400是相互不同的单位识别区域,从云服务器90取得所希望的处理结果(在针对各行区域400的文字识别结果的末尾分别附加了分割码的文本数据550)。
[0173]在第4实施方式中,也与第1实施方式同样地分别进行图4的各处理。
[0174]但是,第4实施方式的图像加工处理(步骤S14)的处理内容与第1实施方式的图像加工处理(步骤S14)的处理内容不同。
[0175]具体而言,外部终端50 (图像生成部66)将扫描图像201内的行区域401?407的文字颜色设定为与和行区域401?407分别邻接的行区域(邻接行区域)的文字颜色不同的文字颜色的处理作为“图像加工处理”来对扫描图像201实施(步骤S14),生成识别对象图像500 (504)(步骤S15)。
[0176]例如,如图14所示,图像生成部66将第奇数行的行区域401、403、405以及407的文字颜色设定为“黑色”,将第偶数行的行区域402、404以及406的文字颜色设定为“红色”。这样,图像生成部66将行区域401?407的文字颜色交替设定为不同的(两种颜色的)文字颜色来生成识别对象图像504。换言之,图像生成部66生成将相邻接的行区域的文字颜色设定为相互不同的文字颜色的识别对象图像504。
[0177]另外,第4实施方式的步骤S17的详细内容与第1实施方式的步骤S17的详细内容不同。
[0178]具体而言,云服务器90对从外部终端50接收到的识别对象图像504内的行区域401?407的文字颜色进行识别,基于该行区域401?407的文字颜色与各邻接行区域不同,来将识别对象图像504内的行区域401?407的每一个判定为相互不同的单位识别区域。而且,云服务器90对识别对象图像504实施OCR处理,生成在针对行区域401?407的文字识别结果的末尾分别附加了分割码的文本数据551 (图9)作为针对识别对象图像504的OCR处理结果(步骤S17)。
[0179]其中,步骤S14以及S17以外的处理与上述第1实施方式同样地进行。
[0180]根据这样的方式,能够获得与上述第1实施方式同样的效果。
[0181]此外,在第4实施方式中,例示了将行区域401?407的文字颜色交替设定为不同的(两种颜色的)文字颜色的方式,但并不局限于此,也可以将行区域401?407的文字颜色分别设定为不同的文字颜色。
[0182]例如,也可以是行区域401的文字颜色被设定为“红色”,行区域402的文字颜色被设定为“黑色”,行区域403的文字颜色被设定为“蓝色”,行区域404的文字颜色被设定为“黄色”,行区域405的文字颜色被设定为“绿色”,行区域406的文字颜色被设定为“淡蓝色”,行区域407的文字颜色被设定为“黄绿色”。
[0183]<5.第5实施方式>
[0184]第5实施方式是第1实施方式的变形例。以下,以与第1实施方式的不同点为中心来进行说明。
[0185]在该第5实施方式中,云服务器90基于OCR处理的处理对象图像内的各行区域的行头位置(字符串排列方向(这里为水平方向)上的位置)来将各行区域判定(识别)为单位识别区域。具体而言,在处理对象图像内的某一行区域的行头位置与下一行区域的行头位置较大幅度不同的(详细而言为偏离规定量的文字数(例如4个文字)以上)情况下,云服务器90将处理对象图像内的到该某一行区域为止的1个或者2个以上的行区域与下一行区域以后的1个或者2个以上的行区域分别判定为单位识别区域。而且,云服务器90生成在针对各单位识别区域的文字识别结果的末尾分别附加了分割码的文本数据550。基于这样的判定基准,云服务器90将处理对象图像内的文字区域划分为多个单位识别区域。
[0186]另外,在第5实施方式中,例示外部终端50执行将各行区域400的行头位置分别设定在与和各行区域400分别邻接的邻接行区域的行头位置不同的位置的处理作为“图像加工处理”的方式。外部终端50通过实施这样的“图像加工处理”,来(有意图地)使云服务器90判定为该多个行区域400是相互不同的单位识别区域,从云服务器90取得所希望的处理结果(在针对各行区域400的文字识别结果的末尾分别附加了分割码的文本数据550)。
[0187]在第5实施方式中,也与也与第1实施方式同样地分别进行图4的各处理。
[0188]但是,第5实施方式的图像加工处理(步骤S14)的处理内容与第1实施方式的图像加工处理(步骤S14)的处理内容不同。
[0189]具体而言,外部终端50 (图像生成部66)将扫描图像201内的行区域401?407的行头位置设定在与和行区域401?407分别邻接的行区域(邻接行区域)的行头位置不同的位置的处理作为“图像加工处理”来对扫描图像201实施(步骤S14),生成识别对象图像 500 (505)。
[0190]例如,图像生成部66如图15所示,将第奇数行的行区域401、403、405以及407的行头位置(这里为左端的坐标位置)设定在识别对象图像505内的比较左侧的位置。另外,图像生成部66将第偶数行的行区域402、404以及406的行头位置分别设定在比较远离该行区域401、403、405以及407的行头位置的位置(这里为从行区域401、403、405以及407的各行头位置向右侧远离4个文字以上的位置)。这样,图像生成部66生成将相邻接的行区域的行头位置设定在相互不同的位置的识别对象图像505。
[0191]另外,第5实施方式的步骤S17的详细内容与第1实施方式的步骤S17的详细内容不同。
[0192]具体而言,云服务器90基于从外部终端50接收到的识别对象图像505内的行区域401?407的行头位置与各邻接行区域的行头位置不同,来将识别对象图像505内的行区域401?407的每一个判定为相互不同的单位识别区域。而且,云服务器90对识别对象图像505实施OCR处理,生成在针对行区域401?407的文字识别结果的末尾分别附加了分割码的文本数据551 (图9)作为针对识别对象图像505的OCR处理结果(步骤S17)。
[0193]其中,步骤S14以及S17以外的处理与上述第1实施方式同样地进行。
[0194]根据这样的方式,能够获得与上述第1实施方式同样的效果。
[0195]<6.第6实施方式>
[0196]第6实施方式是第1实施方式的变形例。以下,以与第1实施方式的不同点为中心来进行说明。
[0197]在该第6实施方式中,云服务器90基于OCR处理的处理对象图像内的各行区域的文字尺寸来将各行区域判定(识别)为单位识别区域。具体而言,在处理对象图像内的某一行区域(整体)的文字尺寸与下一行区域(整体)的文字尺寸不同的(详细而言,差异规定镑以上的)情况下,云服务器90将处理对象图像内的到该某一行区域为止的1个或者2个以上的行区域与下一行区域以后的1个或者2个以上的行区域分别判定为单位识别区域。而且,云服务器90生成在针对各单位识别区域的文字识别结果的末尾分别附加了分割码的文本数据550。基于这样的判定基准,云服务器90将处理对象图像内的文字区域划分为多个单位识别区域。
[0198]另外,在第6实施方式中,例示外部终端50执行将各行区域400的文字尺寸设定为与和各行区域400分别邻接的邻接行区域的文字尺寸不同的文字尺寸的处理作为“图像加工处理”的方式。外部终端50通过实施这样的“图像加工处理”,(有意图地)使云服务器90判定为该多个行区域400是相互不同的单位识别区域,从云服务器90取得所希望的处理结果(在针对各行区域400的文字识别结果的末尾分别附加了分割码的文本数据550)。
[0199]在第6实施方式中,也与第1实施方式同样地分别进行图4的各处理。
[0200]但是,第6实施方式的图像加工处理(步骤S14)的处理内容与第1实施方式的图像加工处理(步骤S14)的处理内容不同。
[0201]具体而言,外部终端50 (图像生成部66)将扫描图像201内的行区域401?407的文字尺寸设定为与和行区域401?407分别邻接的行区域(邻接行区域)的文字尺寸不同的文字尺寸的处理作为“图像加工处理”来对扫描图像201实施(步骤S14),生成识别对象图像500 (506)(步骤S15)。
[0202]例如,图像生成部66如图16所示,将第奇数行的行区域401、403、405以及407的文字尺寸设定为比较大的文字尺寸(例如32镑)。另外,图像生成部66将第偶数行的行区域402、404以及406的文字尺寸设定为比该401、403、405以及407较小的文字尺寸(例如16镑)。这样,图像生成部66生成将相邻接的行区域的文字尺寸设定为相互不同的文字尺寸的识别对象图像506。
[0203]另外,第6实施方式的步骤S17的详细内容与第1实施方式的步骤S17的详细内容不同。
[0204]具体而言,云服务器90对从外部终端50接收到的识别对象图像506内的行区域401?407的文字尺寸进行识别,基于该行区域401?407的文字尺寸与各邻接行区域的文字尺寸不同,来将识别对象图像506内的行区域401?407的每一个判定为相互不同的单位识别区域。而且,云服务器90对识别对象图像506实施OCR处理,生成在针对行区域401?407的文字识别结果的末尾分别附加了分割码的文本数据551 (图9)作为针对识别对象图像506的OCR处理结果(步骤S17)。
[0205]其中,步骤S14以及S17以外的处理与上述第1实施方式同样地进行。
[0206]根据这样的方式,能够获得与上述第1实施方式同样的效果。
[0207]< 7.第7实施方式>
[0208]在上述各实施方式中,例示了以由云服务器90在单位识别区域的判定中使用的判定手法(例如,基于行区域间的分离间隔来判定单位识别区域的手法)被外部终端50的程序的设计者等知晓为前提,对扫描图像200实施与该判定手法对应的图像加工处理的方式。
[0209]在该第7实施方式中,例示在该判定手法不被外部终端50的程序的设计者等知晓的情况(譬如外部终端50不知晓该判定手法的情况)下,通过向云服务器90进行查询来获知该判定手法,对扫描图像200实施与从云服务器90获知的判定手法对应的图像加工处理的方式。
[0210]图17是表示第7实施方式涉及的电子文件生成系统1中的动作例的时序图。
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1