电子文件生成装置及其控制方法、电子文件生成系统的制作方法_6

文档序号:9649152阅读:来源:国知局
测所述多个行区域各自的高度,并将所述多个行区域中最终行以外的各行区域与该各行区域各自的下一行区域的相互间的分离间隔,分别设定为所述各行区域各自的高度以上的大小的处理。5.根据权利要求1或2所述的电子文件生成装置,其特征在于, 所述图像加工处理包括:对所述多个行区域的相互间的行间区域分别附加分割线的处理。6.根据权利要求1或2所述的电子文件生成装置,其特征在于, 所述图像加工处理包括:在所述多个行区域中至少最终行以外的各行区域各自的末尾附加表示是所述单位识别区域的末尾的末尾识别图像的处理。7.根据权利要求1或2所述的电子文件生成装置,其特征在于, 所述图像加工处理包括:将各行区域的文字颜色设定为与和所述各行区域分别邻接的邻接行区域的文字颜色不同的文字颜色的处理。8.根据权利要求1或2所述的电子文件生成装置,其特征在于, 所述图像加工处理包括:将各行区域的行头位置设定在与和所述各行区域分别邻接的邻接行区域的行头位置不同的位置的处理。9.根据权利要求1或2所述的电子文件生成装置,其特征在于, 所述图像加工处理包括:将各行区域的文字尺寸设定为与和所述各行区域分别邻接的邻接行区域的文字尺寸不同的文字尺寸的处理。10.根据权利要求1或2所述的电子文件生成装置,其特征在于, 所述发送单元在所述识别对象图像的生成之前向所述云服务器查询由所述云服务器在所述单位识别区域的判定中使用的判定手法, 所述接收单元从所述云服务器接收与所述判定手法相关的信息, 所述图像生成单元针对所述扫描图像实施与所述判定手法对应的图像加工处理来生成所述识别对象图像。11.根据权利要求1或2所述的电子文件生成装置,其特征在于, 所述图像生成单元生成相互不同的多个测试图像,所述多个测试图像被分别实施了相互不同的多个图像加工处理且分别包含所述多个行区域中的一部分的行区域, 所述发送单元将所述多个测试图像发送给所述云服务器, 所述接收单元从所述云服务器接收作为针对所述多个测试图像分别执行的所述光学文字识别处理的处理结果的多个测试结果, 所述图像生成单元基于所述多个测试结果的每一个所含的分割码,来检测所述多个测试结果的每一个所含的字符串数据的个数即字符串数据数, 所述图像生成单元针对所述多个测试结果的每一个求出其字符串数据数与所述一部分的行区域的个数之差即个数差,并且求出所述多个测试结果中所述个数差最小的测试结果作为最佳测试结果,将所述多个图像加工处理中与所述最佳测试结果对应的图像加工处理决定为最适加工处理, 所述图像生成单元关于所述多个行区域中除了所述一部分的行区域之外的剩余的行区域,实施所述最适加工处理来生成所述识别对象图像, 所述文件生成单元基于所述最佳测试结果所含的分割码和所述文本数据所含的分割码,来将由所述最佳测试结果和所述文本数据构成的数据划分为多个字符串数据,并且决定所述多个行区域与所述多个字符串数据的对应关系,在与各字符串数据对应的各行区域分别配置该各字符串数据来生成所述电子文件。12.根据权利要求1或2所述的电子文件生成装置,其特征在于, 所述发送单元将针对样本图像分别实施相互不同的多个图像加工处理而生成的多个测试图像发送给所述云服务器, 所述接收单元从所述云服务器接收作为针对所述多个测试图像分别执行的所述光学文字识别处理的处理结果的多个测试结果, 所述图像生成单元基于所述多个测试结果的每一个所含的分割码,来检测所述多个测试结果的每一个所含的字符串数据的个数即字符串数据数, 所述图像生成单元针对所述多个测试结果的每一个求出其字符串数据数与所述样本图像所含的行区域的个数之差即个数差,并且求出所述多个测试结果中所述个数差最小的测试结果作为最佳测试结果,将所述多个图像加工处理中与所述最佳测试结果对应的图像加工处理决定为最适加工处理, 所述图像生成单元针对所述扫描图像实施所述最适加工处理来生成所述识别对象图像。13.一种电子文件生成装置的控制方法,是与云服务器合作来生成电子文件的电子文件生成装置的控制方法,所述云服务器将光学文字识别处理的处理对象图像内的文字区域划分为能分别包含比一行的行区域大的区域的多个单位识别区域,并且针对所述多个单位识别区域的每一个执行所述光学文字识别处理,所述云服务器生成包括针对所述多个单位识别区域的每一个的文字识别结果并且在针对各单位识别区域的文字识别结果的末尾分别附加了分割码的文本数据来作为针对所述处理对象图像的所述光学文字识别处理的处理结果,该电子文件生成装置的控制方法的特征在于,具备: a)从原稿的扫描图像的文字区域分别提取多个行区域的步骤; b)以所述多个行区域的每一个被所述云服务器判定为单位识别区域的方式,针对所述扫描图像实施图像加工处理来生成识别对象图像的步骤; c)将所述识别对象图像作为所述光学文字识别处理的所述处理对象图像发送给所述云服务器的步骤; d)从所述云服务器接收作为针对所述识别对象图像的所述光学文字识别处理的处理结果的所述文本数据的步骤; e)基于所述文本数据所含的所述分割码来将所述文本数据划分为多个字符串数据,并且决定所述多个行区域与所述多个字符串数据的对应关系的步骤;以及 f)在与各字符串数据对应的各行区域分别配置该各字符串数据来生成所述电子文件的步骤。14.根据权利要求13所述的电子文件生成装置的控制方法,其特征在于, 所述电子文件生成装置的控制方法还具备: g)分别检测所述多个行区域的在所述扫描图像内的位置的步骤, 在所述步骤f)中,基于所述步骤g)中的检测位置,在与所述各字符串数据对应的所述各行区域的检测位置分别配置所述各字符串数据来生成所述电子文件。15.根据权利要求13或14所述的电子文件生成装置的控制方法,其特征在于, 所述图像加工处理包括:检测所述多个行区域各自的高度,并将所述多个行区域的相互间的分离间隔分别设定为所述多个行区域中最高的行区域的高度以上的大小的处理。16.根据权利要求13或14所述的电子文件生成装置的控制方法,其特征在于, 所述图像加工处理包括:检测所述多个行区域各自的高度,并将所述多个行区域中最终行以外的各行区域与该各行区域各自的下一行区域的相互间的分离间隔,分别设定为所述各行区域各自的高度以上的大小的处理。17.根据权利要求13或14所述的电子文件生成装置的控制方法,其特征在于, 所述图像加工处理包括:对所述多个行区域的相互间的行间区域分别附加分割线的处理。18.根据权利要求13或14所述的电子文件生成装置的控制方法,其特征在于, 所述图像加工处理包括:在所述多个行区域中至少最终行以外的各行区域各自的末尾附加表示是所述单位识别区域的末尾的末尾识别图像的处理。19.根据权利要求13或14所述的电子文件生成装置的控制方法,其特征在于, 所述图像加工处理包括:将各行区域的文字颜色设定为与和所述各行区域分别邻接的邻接行区域的文字颜色不同的文字颜色的处理。20.根据权利要求13或14所述的电子文件生成装置的控制方法,其特征在于, 所述图像加工处理包括:将各行区域的行头位置设定在与和所述各行区域分别邻接的邻接行区域的行头位置不同的位置的处理。21.根据权利要求13或14所述的电子文件生成装置的控制方法,其特征在于, 所述图像加工处理包括:将各行区域的文字尺寸设定为与和所述各行区域分别邻接的邻接行区域的文字尺寸不同的文字尺寸的处理。22.根据权利要求13或14所述的电子文件生成装置的控制方法,其特征在于, 所述电子文件生成装置的控制方法还具备: h)在所述步骤b)之前向所述云服务器查询由所述云服务器在所述单位识别区域的判定中使用的判定手法的步骤;和 i)从所述云服务器接收与所述判定手法相关的信息的步骤, 在所述步骤b)中,针对所述扫描图像实施与所述判定手法对应的图像加工处理来生成所述识别对象图像。23.根据权利要求13或14所述的电子文件生成装置的控制方法,其特征在于, 所述电子文件生成装置的控制方法还具备: h)在所述步骤b)之前,生成相互不同的多个测试图像的步骤,所述多个测试图像被分别实施了相互不同的多个图像加工处理且分别包含所述多个行区域中的一部分的行区域; i)将所述多个测试图像发送给所述云服务器的步骤; j)从所述云服务器接收作为针对所述多个测试图像分别执行的所述光学文字识别处理的处理结果的多个测试结果的步骤; k)基于从所述云服务器接收到的所述多个测试结果的每一个所含的分割码,来检测所述多个测试结果的每一个所含的字符串数据的个数即字符串数据数的步骤;以及 1)针对所述多个测试结果的每一个求出其字符串数据数与所述一部分的行区域的个数之差即个数差,并且求出所述多个测试结果中所述个数差最小的测试结果作为最佳测试结果,将所述多个图像加工处理中与所述最佳测试结果对应的图像加工处理决定为最适加工处理的步骤, 在所述步骤b)中,关于所述多个行区域中除了所述一部分的行区域之外的剩余的行区域,实施所述最适加工处理来生成所述识别对象图像, 在所述步骤e)中,基于所述最佳测试结果所含的分割码和所述文本数据所含的分割码,来将由所述最佳测试结果和所述文本数据构成的数据划分为多个字符串数据,并且决定所述多个行区域与所述多个字符串数据的对应关系。24.根据权利要求13或14所述的电子文件生成装置的控制方法,其特征在于, 所述电子文件生成装置的控制方法还具备: h)在所述步骤b)之前,将针对样本图像分别实施相互不同的多个图像加工处理而生成的多个测试图像发送给所述云服务器的步骤; i)从所述云服务器接收作为针对所述多个测试图像分别执行的所述光学文字识别处理的处理结果的多个测试结果的步骤; j)基于从所述云服务器接收到的所述多个测试结果的每一个所含的分割码,来检测所述多个测试结果的每一个所含的字符串数据的个数即字符串数据数的步骤;以及 k)针对所述多个测试结果的每一个求出其字符串数据数与所述样本图像所含的行区域的个数之差即个数差,并且求出所述多个测试结果中所述个数差最小的测试结果作为最佳测试结果,将所述多个图像加工处理中与所述最佳测试结果对应的图像加工处理决定为最适加工处理的步骤, 在所述步骤b)中,针对所述扫描图像实施所述最适加工处理来生成所述识别对象图像。25.—种电子文件生成系统,其特征在于, 该电子文件生成系统具备:生成原稿的扫描图像的图像形成装置、和与云服务器合作来生成基于所述扫描图像的电子文件的电子文件生成装置, 所述云服务器将光学文字识别处理的处理对象图像内的文字区域划分为能分别包含比一行的行区域大的区域的多个单位识别区域,并且针对所述多个单位识别区域的每一个执行所述光学文字识别处理, 所述云服务器生成包括针对所述多个单位识别区域的每一个的文字识别结果并且在针对各单位识别区域的文字识别结果的末尾分别附加了分割码的文本数据来作为针对所述处理对象图像的所述光学文字识别处理的处理结果, 所述图像形成装置具有将所述扫描图像发送给所述电子文件生成装置的通信单元, 所述电子文件生成装置具有: 提取单元,其从自所述图像形成装置接收到的所述扫描图像的文字区域分别提取多个行区域; 图像生成单元,其以所述多个行区域的每一个被所述云服务器判定为单位识别区域的方式,针对所述扫描图像实施图像加工处理来生成识别对象图像; 发送单元,其将所述识别对象图像作为所述光学文字识别处理的所述处理对象图像发送给所述云服务器; 接收单元,其从所述云服务器接收作为针对所述识别对象图像的所述光学文字识别处理的处理结果的所述文本数据;以及 文件生成单元,其基于所述文本数据所含的所述分割码来将所述文本数据划分为多个字符串数据并且决定所述多个行区域与所述多个字符串数据的对应关系,在与各字符串数据对应的各行区域分别配置该各字符串数据来生成所述电子文件。26.根据权利要求25所述的电子文件生成系统,其特征在于, 所述电子文件生成装置还具备对所述多个行区域的在所述扫描图像内的位置分别进行检测的检测单元, 所述文件生成单元在与所述各字符串数据对应的所述各行区域的检测位置分别配置所述各字符串数据来生成所述电子文件。27.根据权利要求25或26所述的电子文件生成系统,其特征在于, 所述图像加工处理包括:检测所述多个行区域各自的高度,并将所述多个行区域的相互间的分离间隔分别设定为所述多个行区域中最高的行区域的高度以上的大小的处理。28.根据权利要求25或26所述的电子文件生成系统,其特征在于, 所述图像加工处理包括:检测所述多个行区域各自的高度,并将所述多个行区域中最终行以外的各行区域与该各行区域各自的下一行区域的相互间的分离间隔,分别设定为所述各行区域各自的高度以上的大小的处理。29.根据权利要求25或26所述的电子文件生成系统,其特征在于, 所述图像加工处理包括:对所述多个行区域的相互间的行间区域分别附加分割线的处理。30.根据权利要求25或26所述的电子文件生成系统,其特征在于, 所述图像加工处理包括:在所述多个行区域中至少最终行以外的各行区域各自的末尾附加表示是所述单位识别区域的末尾的末尾识别图像的处理。31.根据权利要求25或26所述的电子文件生成系统,其特征在于, 所述图像加工处理包括:将各行区域的文字颜色设定为与和所述各行区域分别邻接的邻接行区域的文字颜色不同的文字颜色的处理。32.根据权利要求25或26所述的电子文件生成系统,其特征在于, 所述图像加工处理包括:将各行区域的行头位置设定在与和所述各行区域分别邻接的邻接行区域的行头位置不同的位置的处理。33.根据权利要求25或26所述的电子文件生成系统,其特征在于, 所述图像加工处理包括:将各行区域的文字尺寸设定为与和所述各行区域分别邻接的邻接行区域的文字尺寸不同的文字尺寸的处理。34.根据权利要求25或26所述的电子文件生成系统,其特征在于, 所述发送单元在所述识别对象图像的生成之前向所述云服务器查询由所述云服务器在所述单位识别区域的判定中使用的判定手法, 所述接收单元从所述云服务器接收与所述判定手法相关的信息, 所述图像生成单元针对所述扫描图像实施与所述判定手法对应的图像加工处理来生成所述识别对象图像。35.根据权利要求25或26所述的电子文件生成系统,其特征在于, 所述图像生成单元生成相互不同的多个测试图像,所述多个测试图像被分别实施了相互不同的多个图像加工处理且分别包含所述多个行区域中的一部分的行区域, 所述发送单元将所述多个测试图像发送给所述云服务器, 所述接收单元从所述云服务器接收作为针对所述多个测试图像分别执行的所述光学文字识别处理的处理结果的多个测试结果, 所述图像生成单元基于所述多个测试结果的每一个所含的分割码,来检测所述多个测试结果的每一个所含的字符串数据的个数即字符串数据数, 所述图像生成单元针对所述多个测试结果的每一个求出其字符串数据数与所述一部分的行区域的个数之差即个数差,并且求出所述多个测试结果中所述个数差最小的测试结果作为最佳测试结果,将所述多个图像加工处理中与所述最佳测试结果对应的图像加工处理决定为最适加工处理, 所述图像生成单元关于所述多个行区域中除了所述一部分的行区域之外的剩余的行区域,实施所述最适加工处理来生成所述识别对象图像, 所述文件生成单元基于所述最佳测试结果所含的分割码和所述文本数据所含的分割码,来将由所述最佳测试结果和所述文本数据构成的数据划分为多个字符串数据,并且决定所述多个行区域与所述多个字符串数据的对应关系,在与各字符串数据对应的各行区域分别配置该各字符串数据来生成所述电子文件。36.根据权利要求25或26所述的电子文件生成系统,其特征在于, 所述发送单元将针对样本图像分别实施相互不同的多个图像加工处理而生成的多个测试图像发送给所述云服务器, 所述接收单元从所述云服务器接收作为针对所述多个测试图像分别执行的所述光学文字识别处理的处理结果的多个测试结果, 所述图像生成单元基于所述多个测试结果的每一个所含的分割码,来检测所述多个测试结果的每一个所含的字符串数据的个数即字符串数据数, 所述图像生成单元针对所述多个测试结果的每一个求出其字符串数据数与所述样本图像所含的行区域的个数之差即个数差,并且求出所述多个测试结果中所述个数差最小的测试结果作为最佳测试结果,将所述多个图像加工处理中与所述最佳测试结果对应的图像加工处理决定为最适加工处理, 所述图像生成单元针对所述扫描图像实施所述最适加工处理来生成所述识别对象图像。
【专利摘要】本发明涉及电子文件生成装置及其控制方法、电子文件生成系统。电子文件生成装置与云服务器合作来生成电子文件,该云服务器生成在针对OCR处理的处理对象图像内的各单位识别区域(能分别包含比一行大的区域的区域)的文字识别结果的末尾分别附加了分割码的OCR处理结果。电子文件生成装置以扫描图像内的各行区域分别被云服务器判定为单位识别区域的方式,实施图像加工处理(例如将各行区域的相互间的分离间隔分别设定为最大高度H1以上的大小的处理)来生成识别对象图像。电子文件生成装置将识别对象图像发送给云服务器,基于来自云服务器的OCR处理结果内的分割码将针对各行区域的文字识别结果分别配置在该各行区域来生成电子文件。
【IPC分类】G06K9/00, H04N1/00, G06K9/34
【公开号】CN105407245
【申请号】CN201510562906
【发明人】中村哲平
【申请人】柯尼卡美能达株式会社
【公开日】2016年3月16日
【申请日】2015年9月7日
【公告号】US20160072968
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1