图像处理装置及其控制方法与流程

文档序号:11412352阅读:130来源:国知局
图像处理装置及其控制方法本申请基于2012年2月17日向日本专利局递交的日本专利申请第2012-032672号,该申请的全部内容在此通过引用被并入。
技术领域
:本发明涉及一种图像处理装置,特别是涉及一种取得图像并生成与所取得的图像对应的文件的图像处理装置。
背景技术
::以往,公开了各种用于处理通过扫描仪等而取得的图像的技术。例如在日本特开2005-157905号公报中公开了在图像处理装置中将所读取的图像数据变换为矢量数据的技术。在向该矢量数据进行变换时,按照由用户指定的文件形式、例如字处理形式、表格形式、演示文稿形式等而进行变换。然而,根据以往的技术,在变换时需要由用户指定文件形式,因此用户有时感到复杂。技术实现要素:本发明是鉴于这样的实际情况而作出的,其目的在于提供一种使用于生成与图像对应的文件的操作变得容易的图像处理装置。根据一个方面,图像处理装置具备:取得部,适合于取得图像;解析部,适合于通过对取得部所取得的图像的特征进行分析从而选择与图像对应的文件的形式;以及生成部,适合于按照解析部所选择的形式针对每个特征生成图像的文件。优选为,解析部根据取得部所取得的图像的特征,从该图像抽取图形、分格线、缩进或者字符,根据它们的数量或者位置关系来选择与该图像对应的文件的形式。优选为,在取得部所取得的图像中,在字符、图形收敛于由分格线构成的框内的情况下,解析部选择表格形式作为与该图像对应的文件的形式,在取得部所取得的图像中,在图形、字符以及表格混合存在的情况下,进而在字符部分通过缩进而使开头位置一致时或者在字符部分中开头有1个字符量的空格时,解析部选择文档形式作为与该图像对应的文件的形式,在取得部所取得的图像中,在所有的页面的相同的位置包括相同的图形或者相同的字符的情况下,解析部选择演示文稿形式作为与该图像对应的文件的形式,在取得部所取得的图像中,在仅包括图形的情况下,解析部选择图形形式作为与该图像对应的文件的形式。优选为,在取得部所取得的图像中,在所有页面的相同的位置有相同的图形或者相同的字符这样的第1条件成立的情况下,解析部选择演示文稿形式作为与该图像对应的文件的形式,在取得部所取得的图像中,在第1条件不成立的情况下、且该图像中包含的所有的字符、图形全部收敛于由分格线构成的框内这样的第2条件成立的情况下,解析部选择表格形式作为与该图像对应的文件的形式,在取得部所取得的图像中,在第1条件以及第2条件不成立的情况下、且图像仅由字符构成且被缩进这样的第3条件成立的情况下,解析部选择文档形式作为与该图像对应的文件的形式,在取得部所取得的图像中,在第1条件、第2条件以及第3条件中的任一个都不成立的情况下,解析部选择预先确定的形式作为与该图像对应的文件的形式。优选为,图像处理装置还具备存储部,该存储部用于存储与文件形式有关的设定内容。在由生成部生成的文件存储在存储部中的情况下,并非选择由解析部所选择的形式,而是选择与存储在存储部中的设定内容对应的形式作为该文件的形式。优选为,生成部对于取得部所取得的图像,针对每个页面生成与各页面对应的形式的文件。优选为,生成部对于取得部所取得的图像,针对具有特征的每个部分生成与各部分对应的形式的文件。优选为,解析部从取得部所取得的图像中抽取分格线,解析部判断取得部所取得的图像中包含的字符、图形是否收敛于由所抽取的分格线包围的区域内,解析部判断图章的图像是否位于由分格线包围的区域内或者分格线附近,解析部在判断为在由分格线包围的区域内或者分格线附近有图章的图像的情况下,从是否收敛于由分格线包围的区域内的判断对象中排除该图章图像。优选为,生成部将针对每个特征生成的文件的链接信息嵌入到生成的文件的图像中。优选为,生成部生成取得的图像的各页面的缩略图图像,生成将缩略图图像与所取得的图像关联起来的信息。根据其它方面,提供一种用于控制图像处理装置的方法。该方法包括:图像处理装置取得图像的步骤;图像处理装置通过对所取得的图像的特征进行分析从而选择与图像对应的文件的形式的步骤;以及图像处理装置按照所选择的形式生成图像的每个特征的文件的步骤。优选为,选择的步骤包括如下步骤:根据所取得的图像的特征,从该图像抽取图形、分格线、缩进或者字符,根据它们的数量或者位置关系来选择与该图像对应的文件的形式。优选为,选择的步骤包括:在所取得的图像中,在字符、图形收敛于由分格线构成的框内的情况下,选择表格形式作为与该图像对应的文件的形式的步骤;在所取得的图像中,在图形、字符以及表格混合存在的情况下,进而在字符部分通过缩进而使开头位置一致时或者在字符部分中开头有1个字符量的空格时,选择文档形式作为与该图像对应的文件的形式的步骤;在所取得的图像中,在所有的页面的相同的位置包括相同的图形或者相同的字符的情况下,选择演示文稿形式作为与该图像对应的文件的形式的步骤;以及在所取得的图像中,在仅包括图形的情况下,选择图形形式作为与该图像对应的文件的形式的步骤。优选为,选择的步骤包括:在所取得的图像中,在所有页面的相同的位置有相同的图形或者相同的字符这样的第1条件成立的情况下,选择演示文稿形式作为与该图像对应的文件的形式的步骤;在所取得的图像中,在第1条件不成立的情况下、且该图像中包含的所有的字符、图形全部收敛于由分格线构成的框内这样的第2条件成立的情况下,选择表格形式作为与该图像对应的文件的形式的步骤;在所取得的图像中,在第1条件以及第2条件不成立的情况下、且图像仅包括字符且被缩进这样的第3条件成立的情况下,选择文档形式作为与该图像对应的文件的形式的步骤;以及在所取得的图像中,在第1条件、第2条件以及第3条件中的任一个都不成立的情况下,选择预先确定的形式作为与该图像对应的文件的形式的步骤。优选为,图像处理装置包括存储装置。上述方法还包括:图像处理装置在存储装置中储存与文件的形式有关的设定内容的步骤;以及图像处理装置将所生成的文件储存到存储装置中的步骤。选择的步骤包括如下步骤:并非选择所选择的形式,而是选择与储存在存储装置中的设定内容对应的形式作为储存在存储装置中的文件的形式。优选为,生成文件的步骤包括如下步骤:对于所取得的图像,针对每个页面生成与各页面对应的形式的文件。优选为,选择形式的步骤包括:针对所取得的图像的每个部分取得特征的步骤;以及针对每个部分选择与该部分对应的形式的步骤。生成文件的步骤包括:针对每个部分生成与该部分的特征对应的形式的文件的步骤。优选为,选择形式的步骤包括:从所取得的图像中抽取分格线的步骤;判断所取得的图像中包含的字符、图形是否收敛于由所抽取的分格线包围的区域内的步骤;以及判断图章的图像是否位于由所抽取的分格线包围的区域或者该分格线的附近的步骤。判断字符、图形是否收敛于由分格线包围的区域内的步骤包括将位于由所抽取的分格线包围的区域或者该分格线的附近的图章的图像从该判断的对象中排除的步骤。优选为,生成文件的步骤包括将针对每个特征生成的文件的链接信息嵌入到生成的文件的图像中的步骤。优选为,生成文件的步骤包括:生成所取得的图像的各页面的缩略图图像的步骤;以及生成将缩略图图像与所取得的图像关联起来的信息的步骤。从结合附图对本发明进行的以下详细的描述,本发明的上述及其他的目的、特征、方面和优点将变得更加清楚。附图说明图1是示意性地示出包括本实施方式的图像处理装置的图像处理系统的结构的图。图2是示意性地示出图像处理装置的硬件结构的一个例子的图。图3是示意性地示出图像处理装置的功能结构的一个例子的图。图4是示意性地示出在图像处理装置中取得的图像的一个例子的图。图5是示出分割图4的各页面的图像而得到的结果的一个例子的图。图6A~图6C是示出在图像处理装置中通过图像的扫描而生成的文件的一个例子的图。图7是示出关于扫描数据针对每个特征所生成的文件的一个例子的图。图8是用于说明在扫描数据中嵌入的链接信息的数据的内容的图。图9是在图像处理装置中执行的文件生成处理的流程图。图10是图9的一部分处理的子流程的流程图。图11是示出扫描数据的一个例子的图。图12是示出针对图11所示的分析结果的其它分析结果的例子的图。图13是示出针对图11所示的分析结果的另外其它分析结果的例子的图。图14A~图14B是用于说明图像处理装置中的处理内容的图。图15是示出关于与各特征对应的格式为了选择优先利用的应用程序而在显示部中显示的画面的一个例子的图。图16A以及图16B是用于说明图像处理装置中的处理内容的图。图17是用于说明图像处理装置中的处理内容的图。图18是示出在图像处理装置的显示部中显示的接受对图像进行编辑的信息的输入的画面的一个例子的图。图19是用于说明在图像处理装置中生成的数据的内容的图。图20是在图1的图像处理装置的变形例中执行的处理的流程图。图21是在图1的图像处理装置的变形例中执行的处理的流程图。具体实施方式下面,参照附图来说明本发明的实施方式的图像处理装置。此外,在各图中对起到相同功能的要素附加相同的参考符号,不重复其说明。[图像处理系统的结构]图1是示意性地示出包括本实施方式的图像处理装置的图像处理系统的结构的图。在图像处理系统中,图像处理装置100通过扫描原稿而生成扫描数据900。扫描数据900是指PDF(PortableDocumentFormat:便携式文档格式)数据等使原稿原样地成为图像的数据。另外,图像处理装置100根据该原稿中的图像的特征来选择文件的形式,对于该图像,生成所选择的形式的文件(电子数据910)。电子数据910相当于对扫描数据900的文件形式进行变换得到的数据。然后,图像处理装置100将电子数据910与扫描数据900一起提供给用户。[图像处理装置的硬件结构]图2是示意性地示出图像处理装置100的硬件结构的一个例子的图。参照图2,图像处理装置100包括:CPU(CentralProcessingUnit:中央处理单元)20,是用于对该装置整体地进行控制的运算装置;ROM(ReadOnlyMemory:只读存储器)21,用于存储由CPU20执行的程序;RAM(RandomAccessMemory:随机存取存储器)22,用于作为由CPU20执行程序时的工作区域而发挥功能;非易失性存储器26和存储部42,存储图像数据等各种数据;传真控制部29,用于利用公用线路向外部的终端发送图像数据;操作面板25,接受用于输入信息的操作;显示部41,用于显示信息;以及网络连接部28,由作为与外部装置之间进行通信的接口的网卡等构成。由CPU20执行的程序也可以存储在存储部42中。存储部42能够由针对图像处理装置100的主体可安装和拆卸的存储介质构成。作为存储介质,可举出CD-ROM(CompactDisc-ReadOnlyMemory:光盘只读存储器)、DVD-ROM(DigitalVersatileDisk-ReadOnlyMemory:数字多功能盘只读存储器)、USB(UniversalSerialBus:通用串行总线)存储器、存储卡、FD(FlexibleDisk:软盘)、硬盘、磁带、盒式磁带、MO(MagneticOpticalDisc:磁光盘)、MD(MiniDisc:迷你盘)、IC(IntegratedCircuit:集成电路)卡(存储卡除外)、光卡、掩模ROM、EPROM、EEPROM(ElectronicallyErasableProgrammableRead-OnlyMemory:电可擦除可编程只读存储器)等非易失性地储存程序的介质。CPU20作为其功能而包括判别部31、删除部32、控制部33、以及通知部34。如后所述,判别部31在图像中对其每个部分的特征进行分类。如后所述,在图像中,图章的图形从由分格线构成的框露出的情况下,删除部32从规定的判断的对象中排除该图形的部分。此外,在本说明书中,有时将由分格线构成的框简单称为“分格线”。控制部33执行图像读取部23、图像形成部24等的动作的控制。通知部34在指定了外部的存储装置作为在图像读取部23中生成的扫描数据的储存场所时,在扫描数据以及与其对应的文件的生成完成了的情况下,对该存储装置通知发送这些数据。图像处理装置100还具备:图像处理部40,用于执行针对图像的压缩、解析等;图像形成部24,用于执行向纸张印刷图像的图像形成动作;图像读取部23,用于读取原稿而生成图像数据;以及图像输出部27,用于将在图像读取部23中生成的图像数据发送给外部装置。在图像处理装置100中处理的图像既可以是在图像读取部23中生成了数据的图像,也可以是在传真控制部29的接收部中接收了数据的图像,还可以是在网络连接部28中接收了数据的图像。[图像处理装置的功能结构]图3是示意性地示出图像处理装置100的功能结构的一个例子的图。图像处理装置100作为其功能而包括用于接受来自用户的信息的输入操作的操作部50。操作部50例如通过构成操作面板25的操作按钮等来实现。另外,图像处理装置100包括数据储存部51、图像读取部52、图像解析部53、数据变换部54、数据保存部55、数据发送部56、以及数据接收部57。数据储存部51存储上述的图像数据(图像文件)。另外,在数据储存部51中,除了图像文件等的文件数据以外,还储存对进行了文件变换的页面数进行计数的计数器值、表示作为通过文件变换而生成的文件的发送目的地来指定的目的地的目的地数据、以及以逻辑单元(在存储部42中定义的多个存储区域)为单位来表示变换优先顺序的数据。计数器51A储存上述计数器值。目的地储存部51B储存上述目的地数据。变换优先顺序储存部51C储存表示上述优先顺序的数据。数据储存部51通过存储部42来实现。图像读取部52对应于图像读取部23,例如通过扫描仪来实现。图像解析部53例如通过CPU20执行适当的程序来实现,执行参照图9等进行后述的图像的特征的分析。另外,图像解析部53包括:图章图像判断部53A,执行关于图章的图像的判断;以及图表有无判断部53B,判断图像中的图表的有无。数据变换部54包括:格式变换部54A,根据在图像读取部52(图像读取部23)等中取得的图像,生成规定的形式的文件;以及缩略图生成部54B,用于生成该图像的缩略图图像。[文件生成处理的概要]图4是示意性地示出在图像处理装置100中取得的图像的一个例子的图。这里,“取得的图像”相当于图1的扫描数据900。参照图4,在本实施方式中,扫描数据900如页面901~904中所示那样包括多个页面。此外,扫描数据900有时也由1个页面构成。图像解析部53通过解析页面901~904各自的图像的特征,将各页面的图像针对其每个特征进行分割。图5是示出分割了图4的各页面的图像的结果的一个例子的图。图像解析部53根据1)字符、2)表格、3)图形、4)模板这4种特征,对图像进行分类。在图5中,图4的页面901~904分别针对每个特征被分割并示出。页面901包括模板801以及字符802。页面902包括模板811、字符812、814、以及表格813。页面903包括模板821、表格822、824、以及字符823、825。页面904包括模板831、图形832、以及字符833、834。模板是指在扫描数据900的所有页面中在相同的位置配置的字符、图形(或者仅包括这样的字符、图形的页面)。模板811、模板821、以及模板831都由与模板801共同的字符和图像构成。此外,在后面叙述针对图像(扫描数据900)的各特征的分析的方法。如上所述,图像处理装置100在根据特征对图像的各页面进行了分割之后,根据该图像的特征来选择文件形式,通过将图像变换为该形式而生成新的文件。这样生成的文件是后述的变换数据750。进而,图像处理装置100生成图像的各页面的缩略图图像。更具体地说,图像处理装置100在生成了图像的扫描数据900之后,生成使扫描数据900全体变换为规定的形式的文件,进而生成扫描数据900的各页面的缩略图图像。图6A~图6C是示出在图像处理装置100中通过图像的扫描而生成的文件的一个例子的图。在图像处理装置100中,通过图像的扫描,生成图6A的扫描数据900、图6B的变换数据750、以及图6C的缩略图数据700。此外,图像处理装置100有时也针对在扫描数据900中检测出特征的每个部分生成文件。如上所述,图像处理装置100根据1)字符、2)表格、3)图形、4)模板这4种特征,对扫描数据900的图像进行分类。之后,图像处理装置100对于扫描数据900,与变换数据750不同地,针对每个特征生成文件。图7是示出关于扫描数据900针对每个特征所生成的文件的一个例子的图。在图7中示出了文件710、720、730、740。文件710是与作为特征而检测出“字符”的部分对应的文件,包括图5的字符802、812、814、823、825、833、834。此外,在图7中,由于作图的原因,作为文件710仅示出字符802部分。文件720是与作为特征而检测出“表格”的部分对应的文件,包括图5的表格813、822、824。文件730是与作为特征而检测出“图形”的部分对应的文件,包括图5的图形832。文件740是与作为特征而检测出“模板”的部分对应的文件,包括与图5的模板801对应的图像。模板801、811、821、831由共同的字符和图形的组合构成,因此仅对于它们中的一个,制作成文件。文件710、720、730、740是分别与其特征对应的形式的文件。即,文件710的形式是与“字符”这样的特征对应的例如微软公司的MicrosoftWord(注册商标)等的文档制作形式。文件720的形式是与“表格”这样的特征对应的例如微软公司的MicrosoftExcel(注册商标)等的表格制作形式。文件730的形式是与“图形”这样的特征对应的例如微软公司的MicrosoftVisio(注册商标)等的绘图制作形式。文件740的形式是与“模板”这样的特征对应的例如微软公司的MicrosoftPowerPoint(注册商标)等的演示文稿形式。即,在图像处理装置100中,通过对图像进行扫描,有时除了该图像的扫描数据900之外,如图7所示那样还生成变换数据750、缩略图数据700、以及上述的文件710、720、730、740。在文件710、720、730、740中,构成各自的部分优选按照扫描数据900中的页面顺序进行排列。即,例如关于“表格”这样的特征,如图5所示那样在扫描数据900中按照页面901、902、903、904的顺序排列了页面的情况下,会按照表格813、822、824的顺序出现。因而,在文件720中也优选按照表格813、822、824的顺序排列各部分。另外,图8是用于说明在扫描数据900中嵌入的链接信息的数据的内容的图。参照图8,对于扫描数据900的各页面,优选将与缩略图数据700的各页面对应的缩略图数据关联起来。在图8所示的例子中,针对缩略图数据700的每个页面,附加“Thumb-1.jpeg”、“Thumb-2.jpeg”、“Thumb-3.jpeg”、“Thumb-4.jpeg”这样的文件名。并且,在图8中示出了针对扫描数据900的各页面将所对应的缩略图数据700的页面的文件名关联起来的状态。此外,关联起来是指,例如对扫描数据900的各页面的数据,作为标签信息或者以在印刷了的情况下也看不到这样的颜色来记述那样地编入。当然,也可以并非编入到扫描数据900,而是另行地制作将扫描数据900和缩略图数据700关联起来的信息并存储到存储部42中。另外,在此关联起来的数据不仅是文件名,有时也包括保存各缩略图图像的保存场所。CPU20也可以在印刷扫描数据900的各页面时,如上述那样生成将扫描数据900和缩略图数据700关联起来的信息(链接信息)。并且,CPU20也可以结合该链接信息来印刷扫描数据900的各页面。在这种情况下,链接信息既可以与扫描数据900的各页面的图像一起以与印刷纸张同类的颜色或者与印刷纸张接近的颜色被印刷成不显眼,或者也可以印刷在与扫描数据900的各...当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1