图像数据处理装置和方法及存储图像数据处理的存储介质的制作方法

文档序号:6554135阅读:137来源:国知局
专利名称:图像数据处理装置和方法及存储图像数据处理的存储介质的制作方法
技术领域
本发明涉及一种对图像数据进行处理的图像数据处理装置,具体地,涉及一种进行图像处理以分离共同图像和非共同图像的图像数据处理装置。
背景技术
近来,对于在公司办公室、行政机关、学校处理的许多文件,除了打印或复印在纸上的文件之外,已经越来越多地使用电子图像数据,例如个人计算机等制备和保存的文件数据、以及通过用扫描器等读取原稿图像而输入的文件数据。
当打印出包括数十页的这种图像数据时,或者当传送该图像数据的文件时,图像数据量太大,导致打印图像数据的读取和传送时间长的问题或网络拥塞的问题。
日本特开2002-27228号公报中公开的技术被构造为当打印出图像数据时去除并输出共同部分。
日本特开平9-106450号公报中公开的另一技术被构造为如果在各页之间图像数据的背景颜色具有共同的浓度则设置共同的背景数据。
然而,上述现有技术具有下列问题。由于从包括多页的图像中去除共同图像,因此存在未保存包括多页的图像的共同部分和必须进行个别地制备共同部分的操作的问题。
此外,存在不能在多页上将共同图案或字符作为共同部分来识别和管理的问题。

发明内容
考虑到以上情况作出本发明,本发明提供了一种图像数据处理装置,该图像数据处理装置通过识别包括多页的输入图像数据中的各页的图像数据的共同图像和非共同图像、并且对非共同图像进行处理并还对共同图像进行处理作为共同图像,从而使得能够显著减小数据量。
根据本发明的一方面,用于对输入的包括多页的图像数据进行预定处理的图像数据处理装置包括图像识别单元,用于根据输入的包括多页的图像数据,识别各页共同的共同图像和各页不同的非共同图像;以及文件生成单元,用于生成图像识别单元识别出的各页共同的共同图像和各页不同的非共同图像的各自的文件。


根据以下附图来详细说明本发明的实施例,在附图中图1是表示根据本发明一方面的图像数据处理装置的框图;图2是表示应用了根据本发明一方面的图像数据处理装置的图像处理系统的配置图;图3是表示作为应用了根据本发明一方面的图像数据处理装置的图像输出装置的彩色多功能机的配置图;图4是表示作为应用了根据本发明一方面的图像数据处理装置的图像输出装置的彩色多功能机的图像形成部的配置图;图5是表示可以应用根据本发明一方面的图像数据处理装置的图像读取装置的配置图;图6是表示其图像由根据本发明一方面的图像数据处理装置进行处理的文件的说明图;图7A和7B是表示根据本发明一方面的图像数据处理装置的图像处理的操作的说明图;图8是表示根据本发明一方面的图像数据处理装置的图像处理的操作的说明图;图9是表示根据本发明一方面的图像数据处理装置的图像处理的操作的说明图;图10是表示根据本发明一方面的图像数据处理装置的图像处理的操作的说明图;图11是表示根据本发明一方面的图像数据处理装置的图像处理的操作的说明图;图12是表示根据本发明一方面的图像数据处理装置的图像处理的操作的说明图;图13是表示根据本发明一方面的图像数据处理装置的图像处理的操作的说明图;图14是表示根据本发明一方面的图像数据处理装置的图像处理的操作的说明图;以及图15是表示根据本发明一方面的图像数据处理装置制备的文件的图。
具体实施例方式
以下,参照附图来说明本发明的实施例。
图2表示应用了根据本发明一方面的图像数据处理装置的图像处理系统。
当进行图像处理时,有时发生图像的位置偏离或歪斜。因此,首先,说明图像处理系统的示例,然后说明根据本发明一方面的图像数据处理装置。
如图2所示,该图像处理系统1包括作为单独安装的图像读取装置的扫描仪2,作为图像输出装置的彩色多功能机3,作为数据库的服务器4,作为图像产生装置的个人计算机5,以及包括互相通信的LAN、电话线等的网络6。在图2中,标号7表示将扫描仪2连接到网络6以使得能够通信的通信调制解调器。
当将包括多页的文件8等转换为电子数据时,扫描仪2顺序地读取文件8的图像并输出经转换的文件8。将文件8的图像数据发送到彩色多功能机3。在设置在彩色多功能机3内的图像处理装置对该图像数据进行了预定的图像处理之后,将图像数据打印出来或者通过附于图像处理装置的图像数据处理装置对其进行希望的处理。除了设置在彩色多功能机3内之外,图像数据处理装置也可以作为用于图像数据处理的软件安装在个人计算机5中,并且个人计算机5自身也可以用作图像数据处理装置。
彩色多功能机3本身具有作为图像读取装置的扫描仪9。彩色多功能机3用作如下的传真机对扫描仪9读取的文件的图像进行复印,根据从个人计算机5发送的或从服务器4读出的图像数据进行打印,并且通过电话线等发送并接收图像数据。
服务器4直接存储文件8的电子图像数据,或者存储并保持扫描仪2和9读取并由图像数据处理装置用预定图像处理进行了处理并文件化的数据。
图3表示作为应用了根据本发明一方面的图像数据处理装置的图像输出装置的彩色多功能机。
在图3中,标号10表示彩色多功能机的本体。在彩色多功能机的顶部,设置有作为图像读取装置的扫描仪9,其包括自动地逐一馈送文件8的各页的自动原稿馈送器(ADF)11以及对自动原稿馈送器11馈送的文件8的图像进行读取的图像输入装置(IIT)12。扫描仪2与扫描仪9具有相同的构造。在图像输入装置12中,光源16照亮设置在压板玻璃15上的文件8,来自文件8的返回光像经由包括全率镜(full-rate mirror)17、半率镜(half-rate mirror)18和19、以及成像透镜20的缩小光学系统被扫描并曝光于由CCD等构成的图像读取元件21上。然后,图像读取元件21按预定的点密度(例如,16点/mm)读取文件8的彩色返回光像。
图像输入装置12读取的文件8的返回光像发送到图像处理装置13(IPS),例如作为红色(R)、绿色(G)和蓝色(B)(各8比特)的三色的反射率数据。如稍后所述,图像处理装置13根据需要对文件8的图像数据进行预定的图像处理,即,诸如遮光校正、偏移校正、亮度/颜色空间转换、伽马校正、边框消除、以及颜色/变换编辑的处理。图像处理装置13也对从个人计算机5等发送的图像数据进行预定的图像处理。根据本实施例,图像处理装置13并入了图像数据处理装置。
图像处理装置13将其进行了预定图像处理的图像数据转换为黄色(Y)、品红色(M)、青色(C)和黑色(K)(各8比特)的四色的色调数据。如稍后所述,将色调数据发送到针对黄色(Y)、品红色(M)、青色(C)和黑色(K)的各色的图像形成单元23Y、23M、23C和23K所共用的光栅输出扫描器(ROS)24。作为图像曝光装置的该ROS 24根据预定颜色的色调数据用激光束LB进行图像曝光。图像不限于彩色图像,可以仅形成黑色白图像。
同时,如图3所示,在彩色多功能机3内设置有图像形成部A。在该图像形成部A中,针对黄色(Y)、品红色(M)、青色(C)和黑色(K)的四个图像形成单元23Y、23M、23C和23K沿水平方向按预定间隔平行排列。
这四个图像形成单元23Y、23M、23C和23K全部具有相同的构造。通常,其各自具有作为图像载体的感光鼓25,受到预定速度旋转驱动;用于一次充电的充电辊26,均匀地对感光鼓25的表面进行充电;作为图像曝光装置的ROS 24,将与预定颜色对应的图像曝光到感光鼓25的表面上并由此在其上形成静电潜像;显影单元27,用预定颜色的调色剂对形成在感光鼓25上的静电潜像进行显影;以及清洁装置28,对感光鼓25表面进行清洁。感光鼓25和布置在其周边的图像形成部件整体地构造为一个单元,可以从打印机和多功能机本体10单独地替换该单元。
如图3所示,ROS 24被构造为由四个图像形成单元23Y、23M、23C和23K所公用。它根据各颜色的色调数据来调制四个半导体激光器(未示出),并根据色调数据从这些半导体激光器发射激光束LB-Y、LB-M、LB-C和LB-K。可以为多个图像形成单元中的每一个单独地构造ROS 24。从半导体激光器发射的激光束LB-Y、LB-M、LB-C和LB-K经由f-θ透镜(未示出)投射到多面镜(polygon mirror)29,通过该多面镜29使其偏转以进行扫描。使得通过多面镜29而偏转以进行扫描的激光束LB-Y、LB-M、LB-C和LB-K经由成像透镜和多个镜(未示出)对感光鼓25上的曝光点进行扫描以从斜下方进行曝光。
由于ROS 24用于从下方对感光鼓25上的图像进行扫描和曝光(如图3所示),因此存在从位于上方的四个图像形成单元23Y、23M、23C和23K的显影单元27落下的调色剂等污染或损坏ROS 24的风险。因此,ROS24的周边由矩形立体框30密封。同时,在框30的顶部设置有作为保护部件的透明玻璃窗31Y、31M、31C和31K,以使四个激光束LB-Y、LB-M、LB-C和LB-K在图像形成单元23Y、23M、23C和23K的感光鼓25上曝光。
从图像数据处理装置13将各颜色的图像数据顺序地输出到被设置为针对黄色(Y)、品红色(M)、青色(C)和黑色(K)的图像形成单元23Y、23M、23C和23K所共用的ROS 24。使得从ROS 24根据图像数据发射的激光束LB-Y、LB-M、LB-C和LB-K在对应的感光鼓25的表面上扫描并曝光,由此在其上形成静电潜像。显影单元27Y、27M、27C和27K将形成在感光鼓25上的静电潜像显影为黄色(Y)、品红色(M)、青色(C)和黑色(K)的调色剂图像。
通过四个一次转印辊36Y、36M、36C和36K将顺序形成在图像形成单元23Y、23M、23C和23K的感光鼓25上的黄色(Y)、品红色(M)、青色(C)和黑色(K)的调色剂图像以多重方式转印到设置在图像形成单元23Y、23M、23C和23K上方的转印单元32的中间转印带35上。这些一次转印辊36Y、36M、36C和36K设置在中间转印带35的与图像形成单元23Y、23M、23C和23K的感光鼓25对应的背侧部分。本实施例中的一次转印辊36Y、36M、36C和36K的体积电阻值被调整为105到108Ωcm。转印偏压电源(未示出)连接到一次转印辊36Y、36M、36C和36K,并且,在预定定时向其施加具有预定调色剂极性的相反极性(在本实施例中,转印偏压具有正极性)的转印偏压。
如图3所示,中间转印带35被设置为以预定张力围绕驱动辊37、张紧辊34和支承辊38,受到具有优异的恒速特性的专用驱动电机(未示出)旋转驱动的驱动辊37将中间转印带35驱动为沿箭头方向以预定速度旋转。中间转印带35例如由不引起充电的带材料(橡胶或树脂)制成。
如图3所示,以多重方式转印在中间转印带35上的黄色(Y)、品红色(M)、青色(C)和黑色(K)的调色剂图像二次转印到作为被二次转印辊39压为与支承辊38接触的纸张材料的纸40上。其上转印有这些颜色的调色剂图像的纸40传送到位于上方的定影单元50。二次转印辊39与支承辊38的侧面压力接触,并适于进行各颜色的调色剂图像到从下向上传送的纸40上的二次转印。
作为纸40,进纸辊45和延迟辊46逐一地分离来自设置在彩色多功能机本体10下部的多级进纸盘41、42、43和44之一的预定尺寸的纸,经由具有传送辊47的纸传送路径48送入各张分离的纸。然后,对准辊49使从进纸盘41、42、43和44之一送入的纸40暂时停止,然后对准辊49使其与中间转印带35上的图像同步地送入中间转印带35上的二次转印位置。
如图3所示,定影单元50用热和压力对转印有各颜色的调色剂图像的纸40进行定影。之后,传送辊51将纸张40传送通过用于将纸以其图像形成面向下的方式排出到作为第一排纸盘的面向下的盘52的第一纸传送路径53,然后通过设置在第一纸传送路径53的出口的排出辊54将其排出到设置在装置本体10上部的面向下的盘52上。
在将如上所述的其上形成有图像的纸40以其图像形成面向上的方式排出的情况下,如图3所示,将纸40传送通过用于将纸以其图像形成面向上的方式排出到作为第二排纸盘的面向上的盘55的第二纸传送路径56,然后通过设置在第二纸传送路径56的出口的排出辊57将其排出到设置在装置本体10侧部的面向上的盘55上。
在彩色多功能机3中,当进行全彩色等的双面复印时,通过切换门(未示出)对在其一面定影有图像的记录纸40的传送方向进行切换,而不是通过排出辊54直接将纸40排出到面向下的盘52,并且,使排出辊54暂时停止,然后反转为通过排出辊54将纸40传送到双面纸传送路径58,如图3所示。然后,通过此双面纸传送路径58,通过沿着传送路径58设置的传送辊59将其表面和背面反转的记录纸40再次传送到对准辊49。此时,将图像转印并定影在记录纸40的背面上。之后,记录纸40经由第一纸传送路径53或第二纸传送路径56排出到面向下的盘52或面向上的盘55。
在图3中,60Y、60M、60C和60K表示向针对黄色(Y)、品红色(M)、青色(C)和黑色(K)的显影单元27提供各预定颜色的调色剂的调色剂盒。
图4表示彩色多功能机3的各个图像形成单元。
针对黄色(Y)、品红色(M)、青色(C)和黑色(K)的颜色的全部四个图像形成单元23Y、23M、23C和23K的构造相同,如图4所示。在这四个图像形成单元23Y、23M、23C和23K中,如上所述,在预定定时顺序地形成黄色、品红色、青色和黑色的颜色的调色剂图像。如上所述,针对这些颜色的图像形成单元23Y、23M、23C和23K具有感光鼓25,用于一次充电的充电辊26对这些感光鼓25的表面均匀地进行充电。之后,使从ROS 24根据图像数据发射的图像形成激光束LB在感光鼓25的表面上扫描以进行曝光,由此形成与各颜色对应的静电潜像。在感光鼓25上扫描以进行曝光的激光束LB被设置为从感光鼓25正下方稍右的位置(即斜下方)投射。图像形成单元23Y、23M、23C和23K的显影单元27的显影辊27a使用黄色、品红色、青色和黑色的调色剂,将形成在感光鼓25上的静电潜像显影为可见的调色剂图像。通过一次转印辊36的充电以多重方式将这些可见调色剂图像顺序转印到中间转印带35上。
清洁装置28从调色剂图像转印处理结束之后的感光鼓25的表面去除剩余的调色剂、纸颗粒等,由此为下一图像形成处理做好准备。清洁装置28具有清洁片28a。该清洁片28a从感光鼓25的表面去除剩余的调色剂、纸颗粒等。如图3所示,清洁装置61从调色剂图像转印处理结束之后的中间转印带35的表面去除剩余的调色剂、纸颗粒等,由此为下一图像形成处理做好准备。清洁装置61具有清洁刷62和清洁片63。这些清洁刷62和清洁片63从中间转印带35的表面去除剩余的调色剂、纸颗粒等。
图5表示作为单独安装的图像读取装置的扫描仪2。
该扫描仪2具有与彩色多功能机3的扫描仪9相同的构造。然而,在扫描仪2内安装有图像处理装置13。
根据本发明一方面的图像数据处理装置是用于对输入的包括多页的图像数据进行预定处理的图像数据处理装置。该装置包括图像识别单元,用于根据输入的包括多页的图像数据来识别各页共同的共同图像和各页不同的非共同图像;以及文件生成单元,用于生成图像识别单元识别出的各页共同的共同图像和各页不同的非共同图像的各自的文件。
在本实施例中,图像识别单元包括共同图像辨认单元,用于根据输入的包括多页的图像数据辨认各页共同的共同图像;共同图像提取单元,用于从输入的各页图像数据提取共同图像辨认单元辨认出的共同图像;以及共同图像去除单元,用于从输入的各页图像数据去除共同图像提取单元提取的共同图像并由此获得各页不同的非共同图像。
此外,在本实施例中,共同图像辨认单元对输入的各页图像数据所附的用于位置调整的辨认标记进行检测,并根据对辨认标记的检测结果来调整输入的各页图像数据的位置。
此外,在本实施例中,共同图像辨认单元对输入的各页图像数据进行位扩展处理,并由此辨认共同图像。
此外,在本实施例中,共同图像辨认单元对输入的各页图像数据的第n页与第(n+1)页的图像数据所共同的共同图像进行辨认,然后对该辨认结果与第(n+2)页的图像数据所共同的共同图像进行辨认,并类似地对直到先前页的辨认结果与当前页的图像数据所共同的共同图像进行辨认。
在本实施例中,图像数据处理装置还包括分离单元,用于将图像识别单元识别出的共同图像和非共同图像分离为文本部分和图像部分;以及切片单元,用于切出分离单元分离的文本部分的至少一个矩形部分。根据页数、辨认标记的位置信息、以及表示矩形部分的x和y方向上的长度信息,对切片单元切出的矩形部分进行管理。
此外,在本实施例中,通过使用字符识别软件来进行对切片单元切出的矩形部分的文本图像的字符识别,并将识别出的字符图像数据转换为字符码。
在本实施例中,图像数据处理装置还包括选择单元,该选择单元用于选择将切片单元切出的矩形部分的图像生成为位图数据还是字符码。
例如,如图3所示,根据本实施例的图像数据处理装置100被设置为作为图像处理装置13的一部分并入在作为图像输出装置的彩色多功能机3内。也可以通过在个人计算机5等中安装用于图像数据处理的软件来构造该图像数据处理装置100。此外,如图5所示,图像数据处理装置100也可以被设置为作为图像处理装置13的一部分并入在作为图像读取装置的扫描仪2内。
如图1所示,该图像数据处理装置100大致包括图像处理部110,作为从作为图像读取装置的扫描仪2、9向其输入图像数据并对输入的图像数据进行预定图像处理的图像处理单元;以及存储部120,用于存储向其输入的图像数据以及图像处理部110进行了预定图像处理的图像数据等。图像处理部110具有共同图像辨认部111、共同图像提取部112、共同图像去除部113、T/I分离部114、矩形切片部115、OCR部116、以及文件生成部117。存储部120具有第一存储器121、第二存储器122、以及第三存储器123。共同图像辨认部111、共同图像提取部112以及共同图像去除部113一起形成图像识别单元。在本实施例中,虽然使用如在“文件生成部117”中的术语“部”,但是应该认为术语“部”与“单元”同义。
从图像读取装置2、9输入的多页的图像数据经由共同图像辨认部111临时存储在第一存储器121的输入图像存储部124。共同图像辨认部111用于根据从图像读取装置2、9输入并临时存储在第一存储器的输入图像存储部124中的多页图像数据来辨认各页共同的共同图像。该共同图像辨认部111被构造为将各页的图像数据进行互相比较,例如,将第一页的图像数据与第二页的图像数据进行比较,由此辨认各页共同的共同图像。
图像读取装置2、9读取的包括多页的文件8没有具体限制。例如,如图6所示,它可以是在学校或强化学校使用的试卷,或者在公司办公室或行政机关等使用的固定形式的文件。然而,文件不限于这些,可以是其他类型的文件。在形成为试卷的该文件8中,如图6所示,通过印刷、打印等预先记载诸如生产试卷的公司的标记的图案801,表示文件标题(例如期末考试或科目)的字符图像802,记载于应试者要写入他/她的名字的区域的“姓名”的字符803,包括表示问题号(例如“Q1”,“Q2”等)的字符的问题文本804、805,表示围绕“姓名”区域和问题文本区域的矩形框的直框图像806等。在试卷的文件8中,应试者通过手写来记述他/她的姓名807、作为答案的数字808、或者作为答案的句子809或诸如柱状图的图形810。
此外,在试卷的文件8中,如图6所示,通过印刷、打印等在预定位置(例如左上角)预先记载形成为预定形状(例如矩形或十字形)的用于位置调整的辨认标记811。
共同图像辨认单元111对输入的各页图像数据所附的用于位置调整的辨认标记811进行检测。共同图像辨认单元111根据对辨认标记811的检测结果对输入的各页图像的位置进行调整。因此,即使对文件8各页的打印记载了偏离纸张8边缘的图案801、字符图像802等,也参照辨认标记811的位置对输入的各页图像数据的位置进行调整,从而使得能够无任何误差地辨认各页共同的图像。
更具体地,如图7A和7B所示,即使通过读取各页的图像而获得的图像数据与纸8的边缘具有整体的位置未对准,共同图像辨认单元111也例如通过参照从辨认标记811到字符图像803等的x方向和y方向上的距离Dx和Dy来求出字符图像803的外接矩形在x方向的宽度W和在y方向的高度H,从而对各页的图像数据的位置进行调整。然后,如图8所示,该共同图像辨认部111对输入的各页图像数据的第一页和第二页的图像数据所共同的共同图像进行辨认,对先前的辨认结果与第三页的图像数据所共同的共同图像进行辨认,并类似地对直到先前页的辨认结果与当前页的图像数据所共同的共同图像进行辨认。
在这种情况下,共同图像辨认单元111对输入的各页图像数据进行位扩展处理,由此辨认共同图像。简言之,在各页的图像是如图6所示的框状图像806的情况下,如果第一页的图像数据与第二页的图像数据仅仅互相偏离大约一位,则可能不将框状图像806辨认为共同图像。
在该实施例中,特别地,如图9所示,对于像框状图像806那样位数小的图像,在进行位扩展处理以将框状图像806的位数在垂直和水平方向上从一位增加几位之后辨认共同图像。
共同图像提取部112从输入的各页图像数据提取共同图像辨认单元111辨认出的各页共同的共同图像。然后,将共同图像提取部112提取的共同图像存储到第一存储器121的共同图像存储部125。
此外,共同图像去除部113进行处理以从输入的各页图像数据去除共同图像提取部112提取的共同图像,并找出图像数据的各页不同的非共同图像。将共同图像去除部113找出的非共同图像存储到第二存储器122的非共同图像存储部126。
T/I分离部114用于将输入的各页图像数据分离为由字符图像等组成的文本部分以及由图案等图像组成的图像部分。T/I分离部114由公知的文本/图像分离单元形成。将T/I分离部114分离的各页图像数据的文本部分的信息和图像部分的信息作为T/I分离结果127以使得能够在适当场合读出该信息的方式分别地存储到第三存储器123中。
矩形切片部115被构造为从各页的共同图像和非共同图像中的由T/I分离部114分离的文本部分图像和图像部分图像切出至少一个或更多个矩形部分。如图8所示,矩形切片部115的对矩形图像的切片是如下进行的例如通过使用设置在彩色多功能机的用户接口上的触摸板或鼠标,对角地在左上角841和右下角842指定输入图像数据的共同图像和非共同图像中的图像部分的图像和文本部分的图像。如图10所示,矩形切片部115的对矩形图像的切片也可以如下进行自动地切出文本部分(例如“姓名”的字符803)的图像或图像部分的图像的外接矩形部分843之外预定位数的矩形区域844。即使对于彼此邻接的“姓名”等的字符,如果字符之间的间隔小于预定位数,则也将它们切出为同一矩形区域844。
OCR部116对切片部115切出的矩形图像中的由T/I分离部114分离为文本部分的图像数据进行字符识别,并将该图像数据转换为字符码。
此外,文件生成部117将输入图像数据的共同图像的图像数据和非共同图像的图像数据分别地转换为电子数据,并由此生成诸如PDF文件或PostScript的文件数据。
在根据本实施例的图像数据处理装置中,通过对图像数据的各页所共同的图像和非共同图像进行识别并以如下方式分别地处理它们,可以显著减小数据量。具体地,在应用了根据本实施例的图像数据处理装置100的图像处理系统1中,如图2所示,作为图像读取装置的扫描仪2或扫描仪9读取包括多页的文件8等的图像。如图1所示,扫描仪2、9读取的包括多页的文件8等的图像数据输入到作为安装有图像数据处理装置100的图像输出装置的彩色多功能机3。如图6所示,扫描仪2、9读取的包括多页的文件8例如可以是在学校或强化学校使用的试卷、在公司办公室或行政机关使用的固定形式的文件等。如图1所示,作为图像读取装置的扫描仪2、9读取的包括多页的文件8的图像数据输入到图像数据处理装置100,共同图像辨认部111根据输入的多页图像数据来辨认输入图像数据的各页所共同的共同图像。作为共同图像辨认部111辨认出的文件8的图像数据,例如使用二值化的图像数据,但是可以使用多值图像数据而不是二值化。对于彩色图像,认为具有图像数据的部分是图像,而不管它的颜色。
例如,当如图8所示地输入包括其上写有姓名和答案的期末考试试卷8的多页的图像数据800时,共同图像辨认部111如图11所示地逐位比较各页的图像数据800(例如第一页的图像数据和第二页的图像数据),并如图12所示地识别出共同图像821、822等。将共同图像辨认部111辨认出的共同图像临时存储在第一存储器121的共同图像存储部125。随后,共同图像辨认部111将存储在共同图像存储部125的第一页图像数据与第二页图像数据所共同的共同图像与第三页图像数据进行比较。由此识别出共同图像,并将其临时存储在第一存储器121的共同图像存储部125中。
以这种方式,共同图像辨认部111对输入的各页图像数据中的第一页与第二页的图像数据所共同的共同图像进行辨认。如图8所示,由此识别出第一页与第二页的图像数据所共同的共同图像。接下来,共同图像辨认部111辨认对第一页和第二页的图像数据的共同图像的识别结果与第三页的图像数据所共同的共同图像。以这种方式,共同图像辨认部111识别出输入的各页图像数据的第n页与第(n+1)页的图像数据所共同的共同图像,然后识别出该识别结果与第(n+2)页的图像数据所共同的共同图像,并类似地识别出直到先前页的识别结果与当前页的图像数据所共同的共同图像。在这种情况下,由于顺序地进行对共同图像的识别,因此存在可以简单地构造共同图像辨认部111的优点。结果,共同图像辨认部111识别出各页的图像所共同的共同图像,将这些共同图像存储到第一存储器121的共同图像存储部125。共同图像辨认部111可以同时对所有页的图像数据进行比较并由此识别出共同图像。
随后,共同图像提取部112根据对共同图像的辨认结果(其为如图8所示的共同图像辨认部111对各页的图像数据进行比较的结果)提取共同图像831。将共同图像提取部112提取的共同图像831存储到第一存储器121的共同图像存储部125。
随后,共同图像去除部113从存储在第一存储器121的输入图像存储部124中的各页图像数据去除由共同图像提取部112提取并存储在共同图像存储部125的共同图像831,由此提供各页不同的非共同图像832,如图8所示。将这些非共同图像832存储到第二存储器122的非共同图像存储部126。
之后,如图1所示,T/I分离部114将共同图像831和非共同图像832分为文本部分和图像部分。如图8所示,共同图像具有分离的文本部分和图像部分,文本部分包括表示文件标题(例如期末考试)的字符图像802、记载在应试者要写入他/她的姓名的区域的“姓名”的字符803、以及包括表示问题号(例如“Q1”、“Q2”等)的字符的问题文本804和805,图像部分包括诸如表示生产该试卷的公司或者科目的标记的图案801、以及表示围绕“姓名”区域和问题文本区域的矩形框的直框图像806。将对文本部分和图像部分的分离结果存储到第三存储器123作为T/I分离结果。
将非共同图像832的文本部分和图像部分分离并存储到第三存储器123作为T/I分离结果。如图8所示,文本部分具有应试者的姓名807、作为答案的数字808、或者作为答案的句子809,图像部分具有诸如柱状图的图形810。
随后,如图8、13和14所示,矩形切片部115从由T/I分离部114分离为文本部分和图像部分的共同图像831和非共同图像832将文本部分和图像部分的各个图像数据切出到矩形切片框851、852等等。
指示图像数据处理装置100的处理操作的彩色多功能机3等的用户接口(选择单元)118(参见图1)可以选择将按矩形切出的图像生成为位图的形式还是通过使用OCR部116将其生成为字符码。
然后,例如,通过OCR部116对矩形切片部115按矩形切出的文本部分的各个图像数据进行字符识别并且将其转换为字符码。
最后,文件生成部117根据包括从文本图像识别出的字符码、字符尺寸和字符位置的数据,以及包括图像部分的图像的内容和位置的数据,使输入的图像数据文件化。由此,生成了文件,包括共同部分的第一头部(header)和作为第一共同部分的图像1的数据,接着,共同部分的第二头部和作为第二共同部分的文本1的数据,…,第一页的非共同部分的第一头部和作为第一非共同部分的数据,接着,非共同部分的第二头部和作为第二非共同部分的数据,…,第二页的非共同部分的第一头部和作为第一非共同部分的数据,接着,非共同部分的第二头部和作为第二非共同部分的数据,等等,如图15所示。这些文件的类型可以是任意的,如PDF文件或者PostScript文件。
因此,由于即使在包括数十页的文件等中对于共同图像仅仅一个图像数据也足够了,因此可以以少量数据并在短时间内执行对包括数十页的文件等的图像数据的存储、打印和传送。
以这种方式,在根据本实施例的图像数据处理装置100中,对包括多页的输入图像数据中的各页的图像数据所共同的共同图像831和非共同图像832进行区分并独立地进行处理。因此,仅仅一个共同图像831就足够了,在各页中不需要提供共同图像作为数据,因此使得能够显著减小数据量。
如上所述,下面对本发明的一些实施例进行概述。
根据本发明的一方面,用于对输入的包括多页的图像数据进行预定处理的图像数据处理装置包括图像识别单元,用于根据输入的包括多页的图像数据来识别各页共同的共同图像和各页不同的非共同图像;以及文件生成单元,用于生成图像识别单元识别出的各页共同的共同图像和各页不同的非共同图像的各自的文件。
在该图像数据处理装置中,图像识别单元包括共同图像辨认单元,用于根据输入的包括多页的图像数据来辨认各页共同的共同图像;共同图像提取单元,用于从输入的各页图像数据提取共同图像辨认单元辨认出的共同图像;以及共同图像去除单元,用于从输入的各页图像数据去除共同图像提取单元提取的共同图像,并由此获得各页不同的非共同图像。
此外,在该图像数据处理装置中,共同图像辨认单元对输入的各页图像数据所附的用于位置调整的辨认标记进行检测,并根据对辨认标记的检测结果来调整输入的各页图像数据的位置。
此外,在该图像数据处理装置中,共同图像辨认单元对输入的各页图像数据进行位扩展处理,由此辨认共同图像。
此外,在该图像数据处理装置中,共同图像辨认单元对输入的各页图像数据中的第n页和第(n+1)页的图像数据所共同的共同图像进行辨认,然后对该辨认结果与第(n+2)页的图像数据所共同的共同图像进行辨认,并类似地对直到先前页的辨认结果与当前页的图像数据所共同的共同图像进行辨认。
该图像数据处理装置还包括分离单元,用于将由图像识别单元识别出的共同图像和非共同图像分离为文本部分和图像部分;以及切片单元,用于切出由分离单元分离的文本部分的至少一个矩形部分;其中,根据页数、辨认标记的位置信息以及表示矩形部分的x方向和y方向上的长度信息来管理切片单元切出的矩形部分。
此外,在该图像数据处理装置中,通过使用字符识别软件进行对切片单元切出的矩形部分的文本图像的字符识别,并将识别出的字符图像数据转换为字符码。
该图像数据处理装置还包括选择单元,该选择单元用于选择将切片单元切出的矩形部分的图像形成为位图数据还是字符码。
根据本发明的一方面,可以提供一种图像数据处理装置,其通过对包括多页的输入图像数据中的各页的图像数据的共同图像和非共同图像进行识别、并且对非共同图像进行处理并还对共同图像进行处理作为共同图像,使得能够显著减小数据量。
对本发明实施例的上述说明是为了例示和说明的目的而提供的。其并非旨在穷举或将本发明限制为所公开的确切形式。显然,许多修改和变化对本领域技术人员是显而易见的。选择并说明实施例是为了最佳地说明发明的原理及其实际应用,从而使得本领域其他技术人员能够理解本发明以进行各种实施例和适于预期的特定用途的各种变型例。本发明的范围旨在由以下权利要求及其等同物限定。
在此通过引用整体并入2005年1月19日提交的日本专利申请No.2005-011540的全部公开内容,包括说明书、权利要求书、附图和摘要。
权利要求
1.一种图像数据处理装置,包括图像识别单元,用于根据输入的包括多页的图像数据来识别各页共同的共同图像和各页不同的非共同图像;以及文件生成单元,用于生成共同图像和非共同图像的各自的文件。
2.根据权利要求1所述的图像数据处理装置,其中,图像识别单元包括共同图像辨认单元,用于根据输入的包括多页的图像数据来辨认各页共同的共同图像;共同图像提取单元,用于从输入的各页图像数据提取共同图像辨认单元辨认出的共同图像;以及共同图像去除单元,用于从输入的各页图像数据去除共同图像提取单元提取的共同图像,并由此获得各页不同的非共同图像。
3.根据权利要求2所述的图像数据处理装置,其中,共同图像辨认单元对输入的各页图像数据所附的用于位置调整的辨认标记进行检测,并根据对辨认标记的检测结果来调整输入的各页图像数据的位置。
4.根据权利要求2所述的图像数据处理装置,其中,共同图像辨认单元对输入的各页图像数据进行位扩展处理,并由此辨认共同图像。
5.根据权利要求2所述的图像数据处理装置,其中,共同图像辨认单元对输入的各页图像数据中的第n页与第(n+1)页的图像数据所共同的共同图像进行辨认,然后对该辨认结果与第(n+2)页的图像数据所共同的共同图像进行辨认,并类似地对直到先前页的辨认结果与当前页的图像数据所共同的共同图像进行辨认。
6.根据权利要求1所述的图像数据处理装置,进一步包括分离单元,用于将图像识别单元识别出的共同图像和非共同图像分离为文本部分和图像部分;以及切片单元,用于切出分离单元分离的文本部分的至少一个矩形部分,其中,根据页数、辨认标记的位置信息以及表示矩形部分的x方向和y方向上的长度信息来管理切片单元切出的矩形部分。
7.根据权利要求6所述的图像数据处理装置,其中,通过使用字符识别软件进行对切片单元切出的矩形部分的文本图像的字符识别,并将识别出的字符图像数据转换为字符码。
8.根据权利要求7所述的图像数据处理装置,进一步包括选择单元,用于选择将切片单元切出的矩形部分的图像生成为位图数据或是字符码。
9.一种图像数据处理方法,包括以下步骤从输入的图像数据识别共同图像和非共同图像,共同图像是各页共同的,非共同图像是各页不同的,所述输入图像数据具有多页;.以及分别地生成共同图像和非共同图像的文件。
10.根据权利要求9所述的图像数据处理方法,进一步包括以下步骤从输入的各页图像数据提取共同图像;以及从输入的各页图像数据去除提取的共同图像,并由此获得各页不同的非共同图像。
11.根据权利要求9所述的图像数据处理方法,进一步包括以下步骤检测输入的各页图像数据所附的用于位置调整的辨认标记,根据对辨认标记的检测结果来调整输入的各页图像数据的位置。
12.根据权利要求9所述的图像数据处理方法,进一步包括以下步骤对输入的各页图像数据进行位扩展处理;以及根据进行了位扩展处理的输入图像数据来辨认共同图像。
13.根据权利要求9所述的图像数据处理方法,进一步包括以下步骤将共同图像和非共同图像分离为文本部分和图像部分;以及切出分离的文本部分的至少一个矩形部分,其中,根据页数、辨认标记的位置信息以及表示矩形部分的x方向和y方向上的长度信息来管理切出的矩形部分。
14.根据权利要求13所述的图像数据处理方法,进一步包括以下步骤通过使用字符识别软件进行对切出的矩形部分的文本图像的字符识别;以及将识别出的字符图像数据转换为字符码。
15.根据权利要求14所述的图像数据处理方法,进一步包括以下步骤选择将切出的矩形部分的图像生成为位图数据或是字符码。
16.一种计算机可读的存储介质,该存储介质存储计算机可以执行以进行用于进行图像数据处理的功能的指令程序,所述功能包括从输入的图像数据识别共同图像和非共同图像,共同图像是各页共同的,非共同图像是各页不同的,所述输入图像数据具有多页;以及分别地生成共同图像和非共同图像的文件。
全文摘要
图像数据处理装置和方法及存储图像数据处理的存储介质。图像数据处理装置具有图像识别单元和文件生成单元。图像识别单元根据输入的包括多页的图像数据识别各页共同的共同图像和各页不同的非共同图像。文件生成单元生成共同图像和非共同图像的各自的文件。
文档编号G06K9/00GK1812473SQ200610001118
公开日2006年8月2日 申请日期2006年1月13日 优先权日2005年1月19日
发明者大西步, 井上伸夫, 袖浦稔, 神谷昌孝, 神成淳二, 古尾谷贞夫, 长谷川记央 申请人:富士施乐株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1