图像处理装置和图像处理方法

文档序号:6470192阅读:96来源:国知局

专利名称::图像处理装置和图像处理方法
技术领域
:本发明涉及一种图像处理装置和图像处理方法。
背景技术
:存在一种适合于显示诸如便携式文档格式(PDF:PortableDocumentFormat(注册商标))等打印图像的电子文档的文档格式。经常进行这样的处理即,将利用文字处理软件等的应用软件创建的文档转换为这种电子文档,然后通过邮件对这种电子文档进行发布,或者打印这种电子文档。对于电子文档而言,可以将文档内的文本信息复制并粘贴到另一个应用文件中。例如,通过复制(拷贝)PDF形式的电子文档内的文本信息的字符代码并且将其粘贴到文字处理软件中的文件上,从而可以在文字处理软件上使用具有与该电子文档内的文件的内容相同的文件。.作为与此相关的技术,例如,为了解决需要将字符图像转换为可编辑数据的数据转换处理这一非常麻烦的问题,JP-A-2003-085164(在此使用的术语"JP-A"是指"未经审查的已公布日本专利申请")披露了这样一种技术如果指示检测部分检测到利用对于预定便携式文档格式文档的单个指令操作而得到的转换指令,则文本转换部分将包括在该便携式文档格式文档内的字符图像转换为文本,并且显示控制部分生成所转换的文本文档的屏幕显示。
发明内容本发明的目的是提供这样一种图像处理装置和图像处理方法在从所显示的图像中复制基于该图像的电子文档内的字符的字符代码时,该图像处理装置和图像处理方法生成能够再现字符颜色的电子文档。(1)根据本发明的第一方面,'提供一种图像处理装置,该图像处理装置包括图像接收单元,其接收图像;字符信息添加单元,其将用于唯一地识别字符的字^H只别符、用于表示字符在图像内的位置的字符位置、用于表示字符的大小的字符大小以及用于表示字符的颜色的字符颜色作为字符信息添加到由所述图像接收单元接收到的图像中;字体分配单元,其分配不具有描绘要素的字体作为与由所述字符信息添加单元添加的字符信息内的字符识别符相对应的字体;以及电子文档生成单元,其基于由所述字符信息添加单元添加到图像中的字符信息来生成可参照由所述字体分配单元分配的字体信息的电子文档。(2)如第(1)项中所描述的图像处理装置,其中,所述电子文档生成单元通过将由所述字体分配单元分配的字体信息添加到由所述字符信息添加单元添加了字符信息的图像中来生成电子文档。(3)根据本发明的第二方面,提供一种图像处理装置,该图像处理装置包括图像接收单元,其接收图像;字符信息添加单元,其将用于唯一地识别字符的字符识别符、用于表示字符在图像内的位置的字符位置、用于表示字符的大小的字符大小以及用于表示字符的颜色的字符颜色作为字符信息添加到由所述图像接收单元接收到的图像中;字体信息存储器,其存储不具有描绘要素的字体已分配给字符识别符的字体信息;以及电子文档生成单元,其基于由所述字符信息添加单元添加到图像中的字符信息来生成可参照由所述字体信息存储器存储的字体信息的电子文档。(4)如第(3)项所描述的图像处理装置,其中,所述电子文档生成单元通过将由所述字体信息存储器存储的字体信息添加到由所述字符信息添加单元添加了字符信息的图像中来生成电子文档。(5)如第(1)至第(4)项中任一项所描述的图像处理装置,其中,由所述图像接收单元接收到的图像是彩色图像,所述图像处理装置还包括字符颜色确定单元,所述字符颜色确定单元基于由所述图像接收单元接收到的彩色图像内的字符的颜色来确定作为字符信息的字符颜色,并且所述字符信息添加单元添加由所述字符颜色确定单元确定的字符颜色作为所述字符信息。(6)根据本发明的第三方面,提供一种图像处理方法,该图像处理方法包括接收图像;将用于唯一地识别字符的字符识别符、用于表示字符在图像内的位置的字符位置、用于表示字符的大小的字符大小以及用于表示字符的颜色的字符颜色作为字符信息添加到所接收到的图像中;分配不具有描绘要素的字体作为与所添加的字符信息内的字符识别符相对应的字体;以及基于添加到图像中的字符信息来生成可参照所分配的字体信息的电子文档。(7)根据本发明的第四方面,提供一种图像处理方法,该图像处理方法包括接收图像;将用于唯一地识别字符的字符识别符、用于表示字符在图像内的位置的字符位置、用于表示字符的大小的字符大小以及用于表示字符的颜色的字符颜色作为字符信息添加到所接收到的图像中;存储不具有描绘要素的字体已分配给字符识别符的字体信息;以及基于添加到图像中的字符信息来生成可参照所存储的字体信息的电子文档。根据第(1)项所描述的图像处理装置,在从所显示的图像中复制基于该图像的电亍文档内的字符的字符代码时,可以生成能够再现字符颜色的电子文档。根据第(2)项所描述的图像处理装置,在仅仅使用所生成的电子文档以从所显示的该电子文档的图像中复制字符代码时,可以生成能够再现字符颜色的电子文档。根据第(3)项所描述的图像处理装置,在从所显示的图像中复制基于该图像的电子文档内的字符的字符代码时,可以生成能够再现字符颜色的电子文档。根据第(4)项所描述的图像处理装置,在仅仅使用所生成的电子文档以从所显示的该电子文档的图像中复制字符代码时,可以生成能够再现字符颜色的电子文档。根据第(5)项所描述的图像处理装置,在通过基于图像内的字符确定字符颜色以复制字符代码时,可以生成能够再现字符颜色的电子文档。根据第(6)项或第(7)项所描述的图像处理方法,在从所显示的图像中复制基于该图像的电子文档内的字符的字符代码时,可以生成能够再现^符颜色的电子文档。'基于下列附图对本发明的示例性实施例进行详细说明,其中图1是根据第一实施例的构造实例的概念模块框图2是示出根据第一实施例的处理实例的流程图3是示出从基于图像的电子文档中获取字符代码的方案实例的说明图4是根据第二实施例的构造实例的概念模块框图;图5是示出根据第二实施例的处理实例的流程图;图6是示出对背景图像的处理的说明图;图7是示出对背景图像的处理的说明图8是示出字符颜色确定处理模块内的N层分离模块的说明图;图9是示出字符颜色确定处理模块的另一处理实例的说明以及《图IO是示出实现第一和第二实施例的计算机的硬件构造实例的框图。具体实施例方式首先,将对利用适合于显示以PDF为代表的打印图像的电子文档的文档格式从基于图像的电子文档中复制字符代码的处理进行说明。如先前在
背景技术
部分中所述,对于能够从PDF形式的电子文档中获取文本信息的电子文档是有限制的。即,如果PDF形式的电子文档最初是在文字处理软件等中使用字符代码由具有文本信息的应用软件创建的,则该电子文档包含字符代码,并且可以从该电子文档中获取文本信息。然而,在PDF形式的电子文档内仅仅包含位像的情况下,在该电子文档内不具有字符代码。因此,不能从这种电子文档中获取文本信息。于是,提出了这样一种技术即,通过对位像内的字符进行字符识别以获取作为字符识别结果的字符代码,并将该字符代码包含在电子文档中,从而从电子文档中获取字符代码(文本信息)。利用该技术,通过对输入图像内的字符图像进行字符识别以获取字符代码。并且使用所获取的字符代码,将字符书写为与图像的字符位置对准的透明字符。下面将使用图3对具体实例进行说明。电子文档字符代码310是位像320内的字符识别的结果。通过字符识别获得的字符(电子文档字符代码310)叠加在位像320上,并且用与字符代码相对应的字体以尽可能地与位像的字符位置和字符大小相符合的方式显示该获得的字符。该显示是通过创建其中字符为透明色的叠加显示字符315并将该叠加显示字符叠加在原始的位像320上而实现的。通过执行该处理,尽管一看就像图像并且是没有包含字符代码的电f文档,但是,可以创建通过复制和粘贴就可从其中获取字符代码的电子文档。如前所述,通过叠加和显示透明色的字符可以获取字符代码,而不管表面上看起来是位像。然而,并不一定总是需要准备与字符代码相对应的字体。艮P,所显示的字符是透明色的,并且如果仅仅是为了复制的目的,即,为了可以选择所需的字符,则需要字符位置和字符大小与原始图像相适合°此外,由于不能将颜色信息给予透明色的字符(或者,判定颜色信息是透明色或不存在颜色信息),因此,当复制并粘贴透明色的字符时,不能从电子文档中获取字符的颜色信息。当位像内的字符具有颜色时,尽管字符具有颜色,但是可获取的文本信息是单色的二值文本信息。对于单色的二值文本信息而言,在多数情况下将字符颜色自动地判断为黑色。下面将说明本实施例的概要。在本实施例中,生成具有两种字符数据的电子文档,这两种字^数据包括仅仅具有视觉字符形状的字符(图像内的字符,或者没有添加字符代码的表观字符)以及透明色的字符(添加有字符代码的字符,虽然在视觉上没有显示为电子文档,但是可以通过复制和粘贴将文本信息复制到另一个应用程序),在该电子文档中,将不具有描绘要素的字体作为字符而分配给透明色的字符。此外,即使在将字符颜色给予以透明色显示的字符且复制并粘贴以透明色显示的字符时,也可生成能够在粘贴目标的应用程序中再现字符颜色的电子文档。下面将对本实施例的概要的下位概念进行说明。在本实施例中,以如下方式实现透明字符。透明字符通过不具有描绘要素的字体,即,作为该字体的一个实例的空白字体来实现。例如,以黑色和白色两种颜色表示字符。黑色是表示字符形状的颜色,白色是表示背景的颜色。于是,表示空白的字体全部以白色来表示。在本实施例中,与空白一样,透明字符全部以白色来表示。将以此方式形成的透明字符记录为字体。在记录字体时,给予合适的字符代码。合适的字符代码是指图像内的字符的字符代码,当复制和粘贴时,该字符代码可以在粘贴目标的应用程序中使用。即,字符代码与字体之间并不存在常用的关系,并且字符代码与普通对应字体并不一定一致。即,空白字体对应于任意的字符代码。使用该空白字体来记述电子文档。记述电子文档或字符信息是指生成电子文档的内容。如果利用通过复制和粘贴而获取的字符代码并使用空白字体来记述电子文档,则由于空白与空格(space)相同,因此字符可以实现为不可见的透明字符。于是,将基于原始图像内的字符颜色的字符颜色给予与空白字体相对应的字符代码。由于是空白字体,因此,即使被给予字符颜色,字符也是不可见的透明字符。然而,所给予的字符代码是合适的字符代码。结果,如果通过复制和粘贴而获取空白字符的文本信息,则可以-获取与空白字符相对应的字符代码和字符颜色两者。并且空白字符被实现为不可见的透明字符。被记录为字体的空白字符可以为电子文档内出现的字符准备。或者,可以针对全部的字符代码(例如,ns第一级和jis第二级的全部字符代码)而预先准备被记录为空白字符的字体。这些字体可以嵌入电子文档中,或者将这些字体安装为在显示电子文档时使用的系统字体。下面,将参照附图对实现本发明的优选实施例进行说明。图1是根据第一实施例的构造实例的概念模块框图。模块一般是指可以在逻辑上分离的软件(计算机程序)或硬件等部件。因此,在本实施例中的模块不仅是计算机程序中的模块,而且是硬件构造中的模块。因此,本实施例提供对计算机程序、系统和方法的说明。尽管为了说明起见使用了"存储"、"被存储"或与它们等同的用语,但是,当本实施例由计算机程序来实现时,这些用语是指正存储或正被存储在存储装置中,或者进行控制以存储或被存储在存储装置中。此外,模块几乎在一对一的基础上对应于功能,但是,在实施过程中,一个模块可以由一个程序构造而成,或者多个模块可以由一个程序构造而成,或者反之,一个模块也可以由多个程序构造而成。此外,多个模块可以由一台计算机执行,或者一个模块可以由分布或并行计算环境下的多台计算机执行。一个模块可以包括另一个模块。在下列说明中,所使用的术语"连接"是指物理连接和逻辑连接(例如数据的交换、指示、或者数据之间的参照关系)两者。此外,系统或装置由借助于例如网络(包括一一对应的通信连接)等通信装置连接的多台计算机、硬件、装置等构成,或者是由一台计算机、硬件、装置等构成。"装置"和"系统"用作同义术语。字符信息包括下述信息用于唯一地识别字符的字符代码、用于表示字符在目标彩色图像内的位置的字符位置、用于表示字符的大小的字符大小以及字符颜色。字符信息可以包括上述信息中的一个或多个。在本实施例中,如图1所示,设置有字符颜色确定处理模块110、字体记录处理模块120、字符记述处理模块130以及字体嵌入处理模块140。首先,通过对目标彩色图像进行字符识别处理来获取目标彩色图像内的每一个字符的字符代码、字符位置以及字符大小。可以采用字符矩形大小和字符矩形位置作为字符位置和字符大小。字符识别处理可以为任意的处理,只要可以获取字符代码、字符位置和字符大小即可。例如,虽然在JP-A-53-10930、JP-A-53-49917和JP-A-57-189277中描述了多种字符识别处理,但是也可以采用这些处理中的任何一种。作为用于获取字符位置和大小的字符切出处理(charactercut-outprocess),已经提出了各种方法。例如,可以采用下述专利文献中描述的方法中的任何一种:JP-A-5-28301、JP-A-5-120481、JP-A-5-143776、JP-A-5-174185、JP-A-6-44406、JP-A-6-187489、JP-A-6-348911、JP-A-7-13994、JP-A-7-160810、JP-A-8-161432、JP-A-8-297718、JP-A-10-69524、JP-A-10-134145、JP-A-10-261047、JP-A-2000-57261、JP-A-2001-43314以及JP-A-2004-78531。字符颜色确定处理模块110与字符记述处理模块130连接,以接收彩色图像、字符位置和字符大小,并且基于彩色图像内的目标字符的颜色来确定作为字符信息的字符颜色。该字符颜色被发送到字符记述处理模块130中。该目标字符由接收到的字符位置和字符大小指定。字体记录处理模块120与字体嵌入处理模块140连接,以接收字符代码并分配不具有描绘要素的字体作为与字符信息内的字符代码相对应的字体,并且将所分配的结果的字体信息发送到字体嵌入处理模块140中。该用于将字体分配给字符代码的处理称为字体记录处理。在此,目标字符代码是由字符记录处理模块130所添加的字符信息的一部分。字符记述处理模块130与字符颜色确定处理模块110和字体嵌入处理模块140连接,以接收彩色图像和字符信息,并且将字符信息添加给彩色图像。添加有字符信息的彩色图像被发送到字体嵌入处理模块140中。字符信息可以是字符代码、字符在目标彩色图像内的字符位置和字符大小的组合,或者可以包括由字符颜色确定处理模块110所确定的字符颜色。字体嵌入处理模块140与字体记录处理模块120和字符记述处理模块130连接,并且基于由字符记述处理模块130添加给彩色图像的字符信息,来生成并输出可参照由字体记录处理模块120所分配的字体信息的电子文档。此外,字体嵌入处理模块140可以通过将由字体记录处理模块120所分配的字体信息添加给其中已由字符记述处理模块130添加了字符信息的彩色图像,从而生成电子文档。下面将对第一实施例的作用和功能(操作)进行说明。图2是示出根据第一实施例的处理实例的流程图。在步骤S202中,字符颜色确定处理模块UO基于目标彩色图像内的字符颜色来确定字符颜色。在步骤S204中,字体记录处理模块120针对字符代码而记录空白字体的字体信息。步骤S202和S204中的任何一个步骤都可以在前执行。或者这两个步骤可以并行执行。在步骤S206中,字符记述处理模块130记述各字符的字符信息。,在步骤S208中,字体嵌入处理模块140使用步骤S204和步骤S206中的处理结果来执行字体信息嵌入处理。在步骤S210中,字体嵌入处理模块140使用彩色图像、字符信息和字体信息来生成并输出电子文档。字符位置、字符大小和目标彩色图像被输入到字符颜色确定处理模块110中。字符颜色确定处理模块IIO确定所输入的位置处的字符的字符颜色。获取R、G和B的三原色的值作为字符颜色。所获取的颜色空间可以是任意的。例如,字符颜色确定处理模块110可以执行用于获取所输入的字符矩形内除背景颜色以外的平均颜色的处理。后面将使用图8等来对字符颜色获取处理的另一实例进行说明。接收到的字符代码的字体由字体记录处理模块120记录。在此所使用的字体是指如果输入字符代码则可以输出字符形状的数据。在本实施例中,以如下方式记录字体。首先,记录输入字符代码。记录全部背景颜色(即,OFF'颜色作为字符形状)的形状以作为与字符代码相对应的字符形状。换言之,记录与空白字符相同的字符形状。更具体而言,将1X1像素的白色像素记录为字符形状。像素数可以是1X1,或者是任何其他的大小。但是,1X1的像素数具有最高效率。然后,字符记述处理模块130记述如下字符信息。如果有与字符代码相对应的字符位置、字符大小、字体(即,由字体记录处理模块120所记录的字体)和字符颜色这四条信息,则可以再现目标彩色图像中存在的彩色字符。最后,字体嵌入处理模块140将受到字体记录处理模块120的字体记录处理的字体添加到由字符记述处理模块130所获得的字符信息的记述结果中,并输出电子文档。尽管在上面主要对字符信息的记述进行了说明,但是,所输出的电子文档实际上包括目标彩色图像。艮口,如果显示所输出的电子文档,则目标彩色图像被显,示为背景图像,而且,在该背景图像上显示使用空白字符的字符。背景图像可以直接使用目标彩色图像,或者使用通过任何其他的处理将目标彩色图像所转换成的图像。下面将使用图6来对目标彩色图像的各种转换方法进行说明。字体信息不一定需要嵌入电子文档中。字体信息可以与电子文档分开保存。或者,字体信息可以安装在系统(操作系统)中。在这种情况下,用于显示电子文档的应用程序使用与电子文档分开保存的字体信息或安装在系统中的字体信息来显示该电子文档。图4是根据第二实施例的构造实例的概念模块框图。在本实施例中,如图4所示,设置有字符颜色确定处理模块410、字体保存模块420、字符记述处理模块430以及字体嵌入处理模块440。待接收的目标彩色图像、字符代码、字符位置和字符大小与第一实施例的相同。此外,字符颜色确定处理模块410等同于字符颜色确定处理模块110,字符记述处理模块430等同于字符记述处理模块130,并且字体嵌入处理模块440等同于字体嵌入处理模i央140。艮P,第二实施例与第一实施例的不同之处在于使用字体保存模块420以代替字体记录处理模块120。下面将主要对字体保存模块420进行说明。字体保存模块420与字体嵌入处理模块440连接,以存储其中不具有描绘要素的字体被分配给字符代码的字体信息,并且受到字体嵌入处理模块440的访问。在第二实施例中,可以不为每一个输入彩色图像记录字体。艮P,可以预先准备包括被认为出现的全部字符代码的字体。即,在字体保存模块420中准备与全部字符代码相对应的字符形状是空白字符的字体。字符集可以对应于各国语言。对于英语圈而言,与能够支持ASCII码的字符代码集相对应地准备全部字符代码是空白字符的字体。对于日本语而言,与JIS第一级和JIS第二级的全部字符代码相对应地准备字符形状是空白字符的字体。或者,与全部UNICODE相对应地准备字符形状是空白字符的字体。,这样,即使预先在字体保存模块420中准备好字体,每一个空白字符所占用的文件容量也小。即,由于表示各字符的形状的数据量非常小,因此,与嵌入字体后的电子文档的文件大小或字体保存模块420的存储容量有关的负担也小。下面将对第二实施例的作用和功能(操作)进行说明。图5是示出根据第二实施例的处理实例的流程图。在步骤S502中,字符颜色确定处理模块410基于目标彩色图像内的字符颜色来确定字符颜色。在步骤S504中,字符记述处理模块430记述各字符的字符信息。在步骤S506中,字体嵌入处理模块440使用步骤S504的处理结果和字体保存模块420来执行字体信息嵌入处理。在步骤S508中,字体嵌入处理模块440使用彩色图像、字符信息和字体信息来生成并输出电子文档。在第二实施例中,与第一实施例一样,字体信息并不一定需要嵌入电子文档中。字体信息可以与电子文档分开保存。或者,字体信息可以安装在系统(操作系统)中。在这种情况下',用于显示电子文档的应用程序使用与电子文档分开保存的字体信息或安装在系统中的字体信息来显示该电子文档。<在字体嵌入处理模块140、440中对背景图像的处理>尽管在前述实施例中,直接采用目标彩色图像作为待生成的电子文档的背景图像(例如,如图3所示的位像320),但是,也可以采用另一种形式。<1〉作为获得比传统JPEG压縮高的图像压縮比的方法,例如,存在如JP-A-2000-196893和JP-A-2005-228331中所描述的多层结构的图像格式,可以采用该图像格式用于背景图像。为了避免这样的现象即,JPEG图像畸变主要发生在具有非常高的频率成分电力的图像的边缘部分,上述专利文献采取了下述策略将输入图像分解为具有非常高的频率成分*力的字符/线画部分和除了字符/线画部分以外的背景部分,并且以JPEG中的高压縮比压縮该背景部分,以可逆编码压縮该字符/线画部分。其中,如JP-A-2000-196893中描述的技术采取了三层方法。如图6所示,图像610被划分为绘画图案部分614和字符/线画部分612。此外,作为最终的输出图像,保存选择绘画图案部分614或选择字符/线画部分612的选择信息616。使用该三层数据来表现图像。在此,选择信息616可以以二值图像的形式记录字符形状。此外,作为前景图像的字符/线画部分612可以记录字符颜色。这样,当选择信息616表示字符的内部时,可以由作为前景图像的字符/线画部分612表示字符颜色。此外,在如图7所示的实例中,如JP-A-2005-228331中描述的技术处理在背景图像(背景图像710)中具有一层多值图像和N层二值图像(二值图像720780)的结构,该多层图像和二值图像是由不同的压縮方法进行压缩的。该结构是一种具有彩色信息的二值图像叠加在作为背景图像的多值JPEG图像上的'结构。在如图7所示的实例中,位于底层的背景图像710利用JPEG等的多值图像格式进行压縮。其他层(二值图像720780)利用二值图像编码方法进行压縮。由于将颜色信息添加到各二值图像编码层的图像中,因此,在解码时通过添加颜色以对图像进行解码。<2>根据如JP-A-2000-196893和JP-A-2005-228331中描述的技术,利用二值图像编码方法(MMR、JBIG等)将二值图像直接压縮为位图信息。在另一种形式中,可以对二值图像进行轮廓化。轮廓化是利用贝塞尔曲线以与字符(或者是除字符之外,可以以二值信息表示的图像)的轮廓形状近似的方法。作为该方法的实例,可以给出如JP-A-2006-253892中描述的技术。轮廓化方法并不限于此,而是可以为任何其他的技术。<在字符颜色确定处理模块110、410中的另一种形式的处理><1>在前述实施例的字符颜色确定处理模块110、410中,将字符矩形内除背景颜色以外的平均颜色作为字符颜色。而且,可以提取字符矩形内的字符部分,以将该部分的平均颜色作为字符颜色。己提出了用于提取字符部分的各种方法。例如,可以采用如JP-A-2000-196893和JP-A-2005-228331中描述的技术。<2>字符颜色确定处理模块110、410也可以不获取各字符的字符颜色。目标彩色图像被分离成N种颜色的层,以将各颜色作为字符颜色。艮P,在如图8所示的实例中,字符颜色确定处理模块110、410可以包括N层分离模块810。N层分离模块810接收目标彩色图像并输出N个二值图像。例如,利用N层分离模块810进行的处理可以使用如JP-A-2005-228331中描述的技术。此外,N层的各颜色由N层分离模块810确定。字符颜色确定处理模块110和410使用接收到的字符大小和字符位置来检测字符存在于哪一层。并且采用各字符的字符矩形内具有最大像素数的层的颜色作为字符颜色。此外,可以将字符的像素设为0N、将非字符的像素设为OFF来定义N个二值图像,从而可以生成N个图像的OR(总和)图像,并且可以通过对该OR图像进行字符识别以获取字符代码、字符位置和字符大小。<3>可以采用如JP-A-2000-196893中描述的选择信息。例如,可以获取用于提取字符部分的信息作为选择信息。选择信息获取方法包括使用高通滤波器提取输入图像的边缘部分,并且使用该边缘部分形成封闭区域以将该封闭区域的内部作为字符部分。在此,可以将字符的像素设为ON、非字符的像素设为OFF来定义选择信息(二值信息),并且可以通过对该二值信息进行字符识别来获取字符代码、字符位置和字符大小。此外,基于字符位置、字符大小和选择信息来从目标彩色图像中获取字符颜色。艮P,在如图9所示的实例中,获取存在于字符矩形910内的ON的选择信息的像素位置。从目标彩色图像中获取该像素位置处的颜色值。此外,将该颜色值的平均颜色(或中值颜色、最频繁颜色(modecolor)等)确定为字符颜色。从而,由于字符并不是由一种颜色构成,因此,可以应对字符是由多种颜色构成的情况。可以使用如JP-A-2005-39771、JP-A-2005-63445、JP-A-2005-175641、JP-A-2005-184402和JP-A-2005-184404中描述的技术作为获取选择信息的技术。此外,如前所述,尽管如图9所示仅仅获取字符"A"的黑色像素位置处的平均值,但是,由于无法保证用于形成字符"A"的选择信息的方法与字符边缘准确地匹配,因此存在这样的担心即,颜色可能会改变(颜色可能会变为'不同于目标彩色图像内的字符颜色)。在这种情况下,可以在字符的中心附近获取字符颜色。为此,可以使字符形状縮退以获取平均值。例如,可以通过变换距离并从1递减以执行縮退的方法。用于变换距离的方法在ToshiyaMinami,"Imageengineering",第——版,Corona陽sha,96页103页中进《亍了描述。<字体的其他形式>在前述实施例中己示出了从字符代码获取字符形状的字体的形式。除此之外,例如,当从字符代码获取字符形状时,可以使用参数。作为这种参数,例如,可以采用CID关键字指定字体。即,由称为CID的号码指定字符形状。此外,单独地准备用于输入字符代码并输出CID的代码转换模块,以使字符代码与CID相关联。或者,也可以准备用f输入CID并输出字符代码的CID转换模块以进行相同的操作。<其他形式>尽管在前述实施例中具有字符代码的全部字符都是空白字体,但是,全部字符可以不一定是空白字体。也可以以合适的形状(除了空白字体以外的任何其他形状)对一部分字符进行字体记录。尽管在前述实施例中记述了各字符的字符代码、字体、字符大小和字符位置,但是,如果字符具有等同于在前字符的字符信息,则根据电子文档的规格,在一些情况下也可以不需要再次记述这些信息。即,在这种情况下,当这些信息改变时可以对这些信息进行记述。此外,也可以采用其他压縮方法。此外,可以组合前述实施例的形式。尽管在前述实施例中彩色图像作为处理目标,但是,除了彩色图像之外,还可以处理多值图像和二值图像。此外,也可以是包含字符图像的图像。如果二值图像作为处理目标,则字符颜色确定处理模块110和410可以总是'输出黑色作为字符颜色。'参照图10,下面将对前述实施例中的硬件构造实例进行说明。如图IO所示的硬件构造实例由例如个人计算机(PC)等构成,并具有诸如扫描仪等数据读取单元1017和诸如打印机等数据输出单元1018。CPU(中央处理单元)1001是控制部件,该控制部件根据下述计算机程序来执行处理,所述计算机程序用于记述如前述实施例中所描述的各种模块,即,字符颜色确定处理模块110、字体记录处理模块120、字符记述处理模块130以及字体嵌入处理模块140,的执行顺序。ROM(只读存储器)1002存储CPU1001使用的程序和运算参数等。RAM(随机存取存储器)1003对在CPU1001的执行中使用的程序和在执行时适当地变化的参数进行存储。CPU1001、ROM1002和RAM1003通过由CPU总线等构成的主机总线1004彼此连接。,主机总线1004通过桥接器1005与诸如PCI(外围组件互连/接口)总线等外部总线1006连接。诸如键盘1008或鼠标等指示装置(指点装置)1009是由用户操作的输入装置。显示器1010由液晶显示单元、或CRT(阴极射线管)等构成,并显示各种信息作为文本或图像信息。HDD(硬盘驱动器)1011包括硬盘并驱动该硬盘,以记录或再现将由CPU1001执行的程序或信息。硬盘存储目标彩色图像和字体。而且,该硬盘还存储其他的各种数据处理程序等和各种计算机程序。驱动器1012读取记录在所安装的诸如磁盘、光盘、磁光盘或半导体存储器等可移动记录介质1013中的数据或程序,并将数据或程序经由接口1007、外部总线1006、桥接器1005和主机总线1004提供给所连接的RAM1003。可移动记录介质1013可以以与硬盘相同20的方式用作数据记录区域。连接端口1014与外部连接装置1015连接并具有诸如USB或IEEE1394等连接部。连接端口1014经由接口1007、外部总线1006、桥接器1005和主机总线1004与CPUIODI连接。通信单元1016与网络连接并且执行与外部的数据通信处理。数据读取单元1017例如是扫描仪并执行文档读取处理。数据输出单元1018例如是打印机并执行文档数据的输出处理。如图IO所示的硬件构造是一个构造实例,前述实施例并不限于如图IO所示的构造,而可以是可执行前述实施例所描述的模块的任何构造。例如,一些模块可以由专用硬件(例如,特定用途集成电路ASIC)来构造;而另一些模块可以位于外部系统中以经由通信线路彼此连接;或者,多个如图IO所示的系统可以经由通信线路彼此连接,从而使这些系统以相互协作的方式工作。另外,这些模块可以并入复印机、传真机、扫描仪、打印机或多功能装置(具有扫描仪、打印机、复印机和传真机中的两种或两种以上功能的图像处理装置)中。可以通过将上述程序存储在记录介质中以提供程序,或者也可以经由通信装置来分发上述程序。在这种情况下,例如,可以把上述程序实施为记录程序的计算机可读记录介质"的发明。"记录程序的计算机可读记录介质"是指可由计算机读取的程序记录在其上的记录介质,该记录介质用于安装、执行或分发程序。记录介质的实例可以包括数字通用光盘(DVD),例如,由DVD论坛制定的标准的"DVD-R、DVD-RW禾口DVD-RAM"以及由DVD+RW制定的标准的"DVD+R或DVD+RW等";致密光盘(CD)、只读存储器(CD-ROM)、可记录CD(CD-R)、可重写CD(CD-RW);磁光盘(MO);软盘(FD);磁带;硬盘;只读存储器(ROM);电可擦写只读存储器(EEPROM);闪存;以及随机存取存储器(RAM)等。上述程序的一部分或全部可以记录在记录介质中,并且进行保存和分发。此外,上述程序可以借助于通信而使用传输介质进行发送,该传输介质例如是无线网络或在局域网(LAN)、城域网(MAN)、广域网(WAN)、互联网、内联网以及外联网等中使用的有线网络,或者是有线网络和无线网络的组合等,或者上述程序也可以加载在载波上。此外',上述程序可以是其他程序的一部分,或者可以与单独程序一起记录在记录介质中。可以对上述程序进行分割以记录在多个记录介质中。此外,上述程序可以以压縮或编码等任何形式记录,只要该程序可恢复即可。出于解释和说明的目的提供了本发明的示例性实施例的上述说明。其本意并不是穷举或将本发明限制在所公开的确切形式。显然,对于本
技术领域
的普通技术人员可以进行许多修改和变型。选择和说明上述示例性实施例是为了更好地解释本发明的原理及其实际应用,因此使得本
技术领域
的其他技术人员能够理解本发明所适用的各种实施例并预见到适合于特定应用的各种修改。目的在于通过所附权利要求书及其等同内容限定本发明的范围。权利要求1.一种图像处理装置,包括图像接收单元,其接收图像;字符信息添加单元,其将用于唯一地识别字符的字符识别符、用于表示字符在图像内的位置的字符位置、用于表示字符的大小的字符大小以及用于表示字符的颜色的字符颜色作为字符信息添加到由所述图像接收单元接收到的图像中;字体分配单元,其分配不具有描绘要素的字体作为与由所述字符信息添加单元添加的字符信息内的字符识别符相对应的字体;以及电子文档生成单元,其基于由所述字符信息添加单元添加到图像中的字符信息来生成可参照由所述字体分配单元分配的字体信息的电子文档。2.根据权利要求1所述的图像处理装置,其中,所述电子文档生成单元通过将由所述字体分配单元分配的字体信息添加到由所述字符信息添加单元添加了字符信息的图像中来生成电子文档。3.—种图像处理装置,包括图像接收单元,其接收图像;字符信息添加单元,其将用于唯一地识别字符的字符识别符、用于表示字符在图像内的位置的字符位置、用于表示字符的大小的字符大小以及用于表示字符的颜色的字符颜色作为字符信息添加到由所述图像接收单元接收到的图像中;字体信息存储器,其存储不具有描绘要素的字体己分配给字符识别符的字体信息;以及电子文档生成单元,其基于由所述字符信息添加单元添加到图像中的字符信息来生成可参照由所述字体信息存储器存储的字体信息的电子文档。4.根据权利要求3所述的图像处理装置,其中,*所述电子文档生成单元通过将由所述字体信息存储器存储的字体信息添加到由所述字符信息添加单元添加了^符信息的图像中来生成电子文档。5.根据权利要求1所述的图像处理装置,其中,由所述图像接收单元接收到的图像是彩色图像,所述图像处理装置还包括字符颜色确定单元,所述字符颜色确定单元基于由所述图像接收单元接收到的彩色图像内的字符的颜色来确定作为字符信息的字符颜色,并且所述字符信息添加单元添加由所述字符颜色确定单元确定的字符颜色作为所述字符信息。6.—种图像处理方法,包括接收图像;将用于唯一地识别字符的字符识别符、用于表示字符在图像内的位置的字符位置、用于表示字符的大小的字,大小以及用于表示字符的颜色的字符颜色作为字符信息添加到所接收到的图像中;分配不具有描绘要素的字体作为与所添加的字符信息内的字符识别符相对应的字体;以及基于添加到图像中的字符信息来生成可参照所分配的字体信息的电子文档。7.—种图像处理方法,包括接收图像;将用于唯一地识别字符的字符识别符、用于表示字符在图像内的位置的字符位置、用于表示字符的大小的字符大小以及用于表示字符的颜色的字符颜色作为字符信息添加到所接收到的图像中;存储不具有描绘要素的字体已分配给字符识别符的字体信息;以及基于添加到图像中的字符信息来生成可参照所存储的字体信息的电子文档。全文摘要本发明公开了一种图像处理装置和图像处理方法,该图像处理装置包括图像接收单元,其接收图像;字符信息添加单元,其将用于唯一地识别字符的字符识别符、用于表示字符在图像内的位置的字符位置、用于表示字符的大小的字符大小以及用于表示字符的颜色的字符颜色作为字符信息添加到由所述图像接收单元接收到的图像中;字体分配单元,其分配不具有描绘要素的字体作为与由所述字符信息添加单元添加的字符信息内的字符识别符相对应的字体;以及电子文档生成单元,其基于由所述字符信息添加单元添加到图像中的字符信息来生成可参照由所述字体分配单元分配的字体信息的电子文档。文档编号G06T11/60GK101520901SQ200810215598公开日2009年9月2日申请日期2008年9月18日优先权日2008年2月26日发明者关野雅则,木村俊一申请人:富士施乐株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1