图像处理装置的制作方法

文档序号:6354393阅读:134来源:国知局
专利名称:图像处理装置的制作方法
技术领域
本发明涉及图像处理装置。
背景技术
日本特开(JP-A) 2001-358925号公报公开一种技术,该技术在文档处理中根据输入的多值图像数据来创建二值图像数据,根据创建的二值图像数据识别字符码和字符位置,使用识别的字符位置数据从多值图像中去除字符,并输出其中在去除了字符的图像数据上叠加了编码后的字符数据的合成图像。

发明内容
根据上述情形而作出本发明,本发明提供一种图像处理装置。根据本发明的第一方面,提供一种图像处理装置。该图像处理装置包括字符识别部件,其基于通过将包含其中混合了字符的构成要素的文档作为图像来读取而获取的图像数据,对混合在构成要素中的字符执行字符识别;确定部件,当生成表示所述文档并且包含第一数据和第二数据的文档数据时,其中所述第一数据表示混合了所述字符的所述构成要素,所述第二数据包含由所述字符识别部件识别出的字符的字符码数据并表示显示该字符码数据表示的所述字符的字符块,该确定部件基于所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、所述构成要素中的所述字符的尺寸、或所述构成要素的类型中的至少一个,来确定在显示由所述文档数据表示的文档时,是将所述第二数据表示的字符块隐藏在所述第一数据表示的所述构成要素的后面,还是将所述第二数据表示的字符块显示在所述第一数据表示的所述构成要素的前面;以及生成部件,其生成所述文档数据,对于所述文档数据,已经根据所述确定部件的确定结果而设置了当显示所述文档时在所述字符块与所述构成要素之间的显示的前/后关系。根据本发明的第二方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述构成要素的所述字符周围的背景区域的亮度小于第一阈值、或者所述字符周围的背景区域的亮度的分散度等于或大于第二阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。根据本发明的第三方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述构成要素中的所述字符的字符数量等于或大于第三阈值,或者如果所述构成要素中的所述字符的行数量等于或大于第四阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。根据本发明的第四方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述构成要素的所述字符的区域的亮度等于或大于第五阈值,则所述确定部件确定将所述字符块显示在所述构成要素的前面。
根据本发明的第五方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述字符识别部件的所述字符识别的精度小于第六阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。根据本发明的第六方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述构成要素中的所述字符的尺寸等于或大于第七阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。根据本发明的第七方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述构成要素的类型是被指定为隐藏所述字符块的类型的类型,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。根据本发明的第八方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,所述确定部件基于所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、或所述构成要素中的所述字符的尺寸中的至少一个与对应的阈值的比较结果,来确定将所述字符块隐藏在所述构成要素的后面还是将所述字符块显示在所述构成要素的前面,并且,如果所述构成要素的类型是被指定为隐藏所述字符块的类型的类型,则预先改变所述阈值,使得与确定了所述构成要素的类型不是被指定为隐藏所述字符块的类型的类型时的情况相比,确定将所述字符块隐藏在所述构成要素的后面的概率高。根据本发明的第九方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,所述确定部件将所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、所述构成要素中的所述字符的尺寸、或所述构成要素的类型中的至少一个与存储在存储部件中的阈值或设置信息进行比较,并且基于比较结果来确定将所述字符块隐藏在所述构成要素的后面还是将所述字符块显示在所述构成要素的前面。所述图像处理装置还包括第一改变部件,该第一改变部件根据来自用户的指示而改变存储在所述存储部件中的所述阈值或所述设置信息,其中,改变所述阈值或所述设置信息的指示是从用户经由指示部件发出的。根据本发明的第十方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,如果所述确定部件确定了将所述字符块隐藏在所述构成要素的后面,则所述生成部件生成表示如下的字符块的数据作为所述第二数据所述字符块分别按照预定的字符颜色和背景颜色,来显示所述字符码数据表示的所述字符和所述字符周围的背景区域,并且, 如果所述确定部件确定了将所述字符块显示在所述构成要素的前面,则所述生成部件生成表示如下的字符块的数据作为所述第二数据所述字符块分别按照与处于混合在所述构成要素中的状态下的所述字符的字符颜色或者所述背景区域的背景颜色相同或相似的颜色, 来显示所述字符码数据表示的所述字符和所述字符周围的背景区域。根据本发明的第十一方面,提供本发明的第十方面的图像处理装置。在该图像处理装置中,指定当所述确定部件确定了将所述字符块隐藏在所述构成要素的后面时所述字符块的所述字符颜色和所述背景颜色的颜色指定信息预先存储在所述存储部件中;并且所述图像处理装置还包括第二改变部件,在所述确定部件确定了将所述字符块隐藏在所述构成要素的后面之后,在从用户经由指示部件发出了改变所述字符块的所述字符颜色或所述背景颜色中的至少一个的指示的情况下,该第二改变部件根据来自用户的指示而改变所述颜色指定信息。根据本发明的第十二方面,提供本发明的第一方面的图像处理装置。该图像处理装置还包括输入接收部件,当所述确定部件的确定结果是特定的确定结果时,该输入接收部件从用户接收去除指示信息的输入,所述去除指示信息指示从所述文档数据中去除所述第二数据。在该图像处理装置中,当通过所述输入接收部件接收到所述去除指示信息的输入并且所述确定部件的确定结果与所述去除指示信息中设置的特定确定结果相匹配时,所述生成部件生成去除了所述第二数据的数据作为所述文档数据。根据本发明的第十三方面,提供本发明的第十二方面的图像处理装置。在该图像处理装置中,当生成去除了所述第二数据的数据作为所述文档数据时,所述生成部件生成将混合在所述构成要素中的状态下的所述字符表示为图像的字符图像数据,并且生成如下的数据作为所述文档数据所述数据包含生成的所述字符图像数据,并将在显示所述文档时在表示所述字符图像数据的字符图像与所述构成要素之间的显示的前/后关系设置为, 使得在显示所述文档时将所述字符图像显示在所述构成要素的前面。根据本发明的第十四方面,提供本发明的第一方面的图像处理装置。在该图像处理装置中,至少所述第一数据具有能够设置任何信息作为所述构成要素的属性信息的格式。所述图像处理装置还包括属性设置部件,该属性设置部件将由所述字符识别部件识别出的字符的字符码数据设置到所述第一数据,作为所述构成要素的属性信息。


基于下面附图,详细地描述本发明的示例性实施方式,在附图中图1是示出根据示例性实施方式的计算机系统的概略构造的框图;图2是示出读取/文件编制处理的内容的流程图;图3是示出前/后确定处理的内容的流程图;图4是文档文件生成处理的内容的流程图;图5是示出设置改变处理的内容的流程图;图6是示出在字符识别处理中的字符颜色和背景颜色的确定的图像的图;图7是示出基于混合了字符的对象的对象类型的字符框的前面/后面确定(阈值变化)的概念图;图8A和图8B是示出基于字符识别的精度的字符框的前面/后面确定的概念图;图9是示出基于字符的字体尺寸的字符框的前面/后面确定的概念图;图IOA和图IOB是基于字符数量/行数量的字符框的前面/后面确定的概念图;图11是示出基于字符的亮度的字符框的前面/后面确定的概念图;以及图12A至12D是示出基于字符的背景颜色的亮度和背景亮度的分散度的字符框的前面/后面确定的概念图。
具体实施例方式下面参考附图将详细地描述本发明示例性实施方式的示例。图1示出根据本示例性实施方式的计算机系统10的概略构造。计算机系统10由连接到由LAN等构成的网络12 的图像读取/打印装置14和由PC(个人计算机)等构成的多个终端装置M构成。图像读取/打印装置14可以由组合了作为复印机的功能、作为打印机的功能和作为扫描仪的功能的装置构成,并包括本体控制器16,本体控制器16由微计算机等构成并包含CPU 16A、存储器16B、非易失性存储单元16C(由HDD(硬盘驱动器)、闪存等构成)和网络接口单元16D。另外,图像读取器18光学读取所设置的待读取文档(纸质原始文档)并输出读取的图像数据,图像打印单元20在记录纸上打印由输入的打印图像数据表示的图像,操作面板22设置有由LCD等构成的显示单元22A和由数字键、触摸板等构成的操作单元22B,它们各自连接到本体控制器16。本体控制器16的网络接口单元16D连接到网络12以控制经由网络与终端装置M 的通信。通过控制图像读取/打印装置14的各个单元的操作而向用户提供各种服务(例如,文档的复制和打印(从终端装置M接收的文档数据所表示的文档的打印))的本体控制程序、以及用于由CPU 16A执行稍后描述的读取/文件编制处理的读取/文件编制程序各自安装在本体控制器16的存储单元16C中,作为由CPU 16A执行的程序。上述读取/文件编制程序是根据本发明的示例性图像处理程序,在本示例性实施方式中,通过由图像读取/打印装置14的本体控制器16的CPU 16A执行读取/文件编制程序,图像读取/打印装置14充当根据本发明的图像处理装置。各个终端装置M包括CPU 24、存储器MB、由HDD (硬盘驱动器)或闪存等构成的非易失性存储单元24C以及网络接口单元MD,并经由网络接口单元24D连接到网络12。另外,显示器26、键盘28和鼠标30连接到终端装置对。下面,作为本示例性实施方式的操作,将参考图2来描述通过由图像读取/打印装置14的本体控制器16的CPU 16A执行读取/文件编制程序而实现的读取/文件编制处理。 在待读取的原始文档(文档)设置到图像读取器18时,当用户经由操作面板22的操作单元22B发出读取原始文档(文档)并基于读取结果生成/输出原始文档(文档)的文档文件(“扫描到文件”服务的执行)的指示时,执行读取/文件编制处理。在读取/文件输出处理中,首先,在步骤S40,设置到图像读取器18的原始文档 (文档)由图像读取器18读取为图像,并且将表示通过读取而获得的文档读取结果的图像数据(例如按照位图格式的图像数据)存储在存储单元16C中。在随后的步骤42中,执行对象分离处理,所述对象分离处理基于存储在存储单元16C中的图像数据,从所读取的文档的图像中分离/提取各种对象(构成要素),如字符、照片、图例(CG)、表格和划线。如日本特开(JP-A) 2006-203582号公报或特开(JP-A) 2006-203583号公报所公开的,对象分离处理例如可以通过应用如下的技术实现将图像分为多个块,基于针对各个块创建的LW颜色空间中的!;乂和b*的直方图的形状、或者各个块的ΙΛ 和b*的方差或平均值,将各个块分类为多种块中的一种(例如,“彩色图案块”、“彩色字符和周边基底块”、 “单色图案块”、“单色字符和周边基底块”、“单色基底块”和“未知属性块”),并将分为相同类的相邻块整合为单个区域,以将读取的文档的图像分为类别相互不同的多个区域(构成要素)。在步骤44中,进行字符识别处理,所述字符识别处理通过搜索由步骤42的对象分离处理从读取的文档的图像中分离出的多个个体对象中的一个对象中存在的字符、并对根据搜索而提取出的字符执行模式匹配,从而确定所提取的字符的字符码数据、字体类型、字体尺寸、位置等。因此,不仅识别出在对象类型为“字符”(对象仅由字符构成)的对象的对象类型“字符”中存在的字符,而且识别出在对象类型并非“字符”、例如为“照片”、“CG” 和“表格”的对象中混合的字符,从而确定它们的字符码数据、字体类型、字体尺寸等。在字符识别处理中,如图6所示,作为示例,也针对各个字符确定字符的颜色和背景区域的颜色 (包围各个字符的矩形区域内的除了字符以外的区域的颜色)。在步骤46,基于在步骤44中的字符识别处理的结果,确定是否存在对象类型并非 “字符”并且混合了字符的对象(在字符识别处理中从其中提取了字符的对象)。如果该确定结果是否定的,则处理进行到步骤50,并且如果在步骤46中的确定结果是肯定的,则处理进行到步骤48。在该情况下,当显示文档文件表示的文档时,在进行到步骤50之前,执行前/后确定处理,该前/后确定处理确定混合了字符的对象和显示在字符识别处理中识别出的字符的字符框(根据本发明的字符块的示例)中的哪一个设置在前面。稍后将描述前/后确定处理。在步骤50,执行文档文件生成处理,该处理生成表示所读取的文档的文档文件,稍后还将描述文档文件生成处理。接着,在步骤52,在读取/文件输出处理终止之前,将在文档文件生成处理中生成的文档文件传输给用户预先指定的传输目的地(例如由用户操作的终端装置24),或在附加到电子邮件之后发送输出。顺便提及,根据日本特开2001-358925号公报中描述的技术,执行对混合在图像中的字符的字符识别,并从图像中去除这些字符,接着输出如下的合成图像其中,将通过字符识别而识别出的字符码表示的字符设置在已经从其中去除了字符的图像的前面。但是,根据该技术,如果去除了字符的部分的图像(混合了字符的对象)是照片图像,则难以按照在照片图像中不出现不自然的方式来设置去除了字符的部分的颜色和浓度,这使得混合了字符的对象(照片图像)的可用性降低。而且,根据在图像(混合了字符的对象)中混合的字符的尺寸、字符的数量、行的数量、或字符的字符识别的精度,设置在混合了字符的对象(照片图像)的前面的字符和已经去除混合了字符的对象(照片图像)的字符的部分可能不对齐。在根据本示例性实施方式的前/后确定处理中,当显示由文档文件表示的文档时,考虑上述情况来确定混合了字符的对象和字符框中的哪一个设置在前面,下面参考图3 描述根据本示例性实施方式的前/后确定处理。首先,在步骤90,从在读取/文件编制处理(图幻的步骤42中的对象分离处理中从读取的文档分离/提取出的多个对象中,选择作为混合了字符的对象(在文件编制处理(图2、的步骤44中的字符识别处理中从其中提取了字符的对象)并且没有执行步骤90以及此后的处理的单个对象,作为混合了字符的处理对象。在随后的步骤92中,确定混合了字符的处理对象是否为隐藏字符框的对象类型。 在本示例性实施方式中,表示在前/后确定处理中用于前/后确定(确定混合了字符的对象和字符框中的哪一个设置在前面)的确定标准的确定标准信息存储在存储单元16C中, 并且确定标准信息包含设置规则信息,该设置规则信息针对各个对象类型、针对字符框的设置位置,提供混合了字符的对象的后面和前面中的哪一个是所希望的。通过将混合了字符的处理对象的对象类型与设置规则信息进行核对,以确定对于混合了字符的处理对象的对象类型来说字符框的希望设置位置是否为“后面”,从而实现步骤92中的确定。
作为示例,如图7所示,对象类型为“CG”的混合了字符的对象经常具有单个颜色作为字符的背景颜色,并且,如果字符块(例如,如图7所示,显示“2008/08/12”的字符串的字符块和显示“今天的主题”的字符串的字符块)设置在该类型的混合了字符的对象的前面,则其外观不会变差,由此,通过将字符块设置在前面,在字符块中显示的字符串的字符码数据的可再用性提高。另一方面,如类似地在图7中所示的,对象类型为“照片”的混合了字符的对象具有各种颜色/亮度(浓度)作为字符的背景颜色,并且,如果字符块(例如,如图7所示,显示“8月11日,在花园拍摄”的字符串的字符块)设置在该类型的混合了字符的对象的前面,则其外观将变差。因此,设置规则信息的初始值(缺省值)按照以下方式设置例如,对于对象类型为“CG”的混合了字符的对象,字符框的希望设置位置是“前面”,并且,对于对象类型为“照片”的混合了字符的对象,字符框的希望设置位置是“后面”。在本示例性实施方式中,设置规则信息的内容可以由用户改变(稍后将描述细节)。上述确定标准信息包含八种确定阈值thl至th8,如果在步骤92中的确定结果是否定的,处理进行到步骤94,以从存储单元16C读取确定阈值thl至th8,并在进行到步骤 98之前使得存储器16B存储确定阈值thl至th8。另一方面,如果在步骤92中的确定结果是肯定的,则处理进行到步骤96,以从存储单元16C读取确定阈值thl至th8,并使存储器 16B存储确定阈值thl至th8。接着,在进行到步骤98之前,将确定阈值thl至th8中的当一些参数的值等于或大于确定阈值时确定为“后面”的确定阈值的值减小,并且将当一些参数的值小于确定阈值时确定为“后面”的确定阈值的值增加。因此,改变确定阈值thl至 th8的值,使得字符框隐藏在混合了字符的处理对象的后面的概率高于当步骤92中的确定结果为否定时的情况。步骤92至步骤96是根据第八方面的由确定单元进行的处理的示例。替代上述步骤94和步骤96的处理,如果在设置规则信息中提供的字符框的希望设置位置是“后面”,则存储在存储单元16C中的确定阈值thl至th8可以按照原样使用,而如果在设置规则信息中提供的字符框的希望设置位置是“前面”,则存储在存储单元16C中的确定阈值thl至th8 的值可以按照如下的方式改变使得字符框设置在混合了字符的处理对象的前面的概率变高,并且,如果在设置规则信息中提供的字符框的希望设置位置是“后面”和“前面”,则存储在存储单元16C中的确定阈值thl至th8的值可以分别地变化(在相反的方向上变化)。在步骤98,获取对混合了字符的处理对象中混合的字符在字符识别处理(图2中的步骤44)中计算出的字符识别的精度。字符识别的精度是针对各个字符分别计算的,因此,在步骤98,分别地获取对混合了字符的处理对象中混合的全部字符的字符识别的精度, 接着,计算获取的精度的平均值,或者计算获取的精度的最小值,作为对混合了字符的处理对象的字符识别的精度。在随后的步骤100,确定在步骤98中获取的对混合了字符的处理对象的字符识别的精度是否小于在存储器16B中存储的8个确定阈值thl至th8中的与字符识别的精度相关的确定阈值th6。在示例性实施方式中,可选地,确定阈值th6也可以由用户改变(稍后将描述细节)。在字符块中显示字符识别处理中识别出的字符码数据所表示的字符(串)的同时,如果在步骤100中的确定结果是肯定的,作为示例,如图8B所示,在字符块中显示的字符(串)可能不同于混合了字符的处理对象中混合的字符(串)(在图8B中示出的示例中,例如,在混合了字符的处理对象中混合了字符串“ABCDE”,而在字符块中显示字符串 “ARCDE”,这两个字符串不同)。因此,如果在步骤100的确定结果是肯定的,则处理进行到步骤124,确定字符框的设置位置是混合了字符的处理对象的“后面”,之后进行到步骤 128。另一方面,如果在步骤100的确定结果是否定的,作为示例,如图8A所示,在字符块中显示的字符(块)很可能与混合了字符的处理对象中混合的字符(串)匹配,因此,处理进行到步骤102,而不确定字符框的设置位置是混合了字符的处理对象的“后面”。上述步骤98和100是根据第五方面的由确定单元进行的处理的示例。在步骤102,对混合在混合了字符的处理对象中的字符,获取在字符识别处理(图 2中的步骤44)中识别的字符的尺寸。也是针对各个字符分别地计算字符的尺寸,因此在步骤102,针对混合在混合了字符的处理对象中的全部字符,分别地获取字符的尺寸,接着, 计算所获取的尺寸中的最大尺寸,作为混合在混合了字符的处理对象中的字符的尺寸。在随后的步骤104中,确定在步骤102中获取的混合在混合了字符的处理对象中的字符的尺寸是否为存储在存储器16B中的8个确定阈值thl至th8中的与字符尺寸相关的确定阈值 (在大尺寸侧的确定阈值)th7或更大。作为示例,如图9所示,如果混合在混合了字符的处理对象中的字符的尺寸很大 (作为示例,如果为18pt或更大),则由于在字符识别处理中的识别结果的轻微偏差或字体类型的差别,在字符块中显示的字符(串)可能相对于混合在混合了字符的处理对象中的字符(串)不对齐。因此,如果在步骤104中的确定结果是肯定的,则处理进行到步骤124, 确定字符框的设置位置是混合了字符的处理对象的“后面”,之后进行到步骤128。步骤104 是根据第六方面的由确定单元进行的处理的示例。如果在步骤104中的确定结果是否定的,则处理进行到步骤106,确定在步骤102 中获取的混合在混合了字符的处理对象中的字符的尺寸是否小于存储在存储器16B中的8 个确定阈值thl至th8中的与字符尺寸相关的确定阈值(小尺寸侧的确定阈值)th8。作为示例,如图9所示,如果混合在混合了字符的处理对象中的字符的尺寸很小(作为示例,如果为6pt或更小),则在字符块中显示的字符(串)不太可能相对于混合在混合了字符的处理对象中的字符(串)不对齐,因此,如果在步骤106中的确定结果是肯定的,则处理进行到步骤126,确定字符框的设置位置是混合了字符的处理对象的“前面”,之后进行到步骤 129。如果在步骤104和106中的确定结果都是否定的,则处理进行到步骤108。在本示例性实施方式中,可选地,确定阈值th7和th8也可以由用户改变(稍后将描述细节)。上述步骤102至106是根据第六方面的由确定单元进行的处理的示例。在步骤108,获取在字符识别处理(图2中的步骤44)中识别的、混合在混合了字符的处理对象中的字符的字符数量和行数量。在随后的步骤Iio中,确定在步骤108获取的、混合在混合了字符的处理对象中的字符的数量是否为存储在存储器16B中的8个确定阈值thl至th8中的与字符数量相关的确定阈值th3或更大。如果在步骤110中的确定结果是否定的,则处理进行到步骤112,确定在步骤108中获取的、混合在混合了字符的处理对象中的字符的行数量是否为存储在存储器16B中的8个确定阈值thl至th8中的与行数量相关的确定阈值th4或更大。
作为示例,如图IOA所示,如果混合在混合了字符的处理对象中的字符的字符数量和行数量很大(例如,如果字符的数量是50个字符或更大,或者行的数量是5行或更大),那么,由于在行间的字体尺寸或字体类型的轻微差别的影响,在字符块中显示的字符串的行的宽度或字符的宽度可能相对于混合在混合了字符的处理对象中的字符串不对齐, 并且,由于从混合了字符的处理对象的范围偏离的字符块与另一对象的部分重叠,所以这种不对齐可能导致外观变差。因此,如果步骤110和112之一的确定结果是肯定的,则处理进行到步骤124,确定字符框的设置位置为混合了字符的处理对象的“后面”(也参见图 10B),之后进行到步骤128。如果在步骤110和112中的确定结果都是否定的,则处理进行到步骤114。在本示例性实施方式中,可选地,确定阈值th3和th4也可以由用户改变(稍后将描述细节)。上述步骤108至112是根据第三方面的由确定单元进行的处理的示例。在步骤114,获取在字符识别处理(图2中的步骤44)中确定的混合在混合了字符的处理对象中的字符的字符颜色,并且基于获取的字符颜色来计算混合在混合了字符的处理对象中的字符颜色的亮度。字符颜色的亮度可以在字符之间有所不同,因此在步骤114 中,针对混合在混合了字符的处理对象中的全部字符分别地计算字符颜色的亮度,并计算针对各个字符而计算的亮度的平均值,作为混合在混合了字符的处理对象中的字符颜色的亮度。在随后的步骤116中,确定在步骤114中计算出的混合在混合了字符的处理对象中的字符颜色的亮度是否为存储在存储器16B中的8个确定阈值thl至th8中的与字符亮度相关的确定阈值th5或更大。作为示例,如图11所示,如果在对象类型是CG的对象中混合的字符的矢量化中字符的亮度高于其背景的亮度,则由于损坏了字符边缘的可再现性,例如字符边缘上的缺口,所以外观经常变差。如果字符的背景颜色是单色,即,混合了字符的对象的对象类型是 “CG”,在字符识别中识别具有高亮度的字符,并且如果在步骤116中的确定结果是肯定的, 则可以确定混合在混合了字符的对象中的字符的边缘的可再现性的概率高。因此,如果在步骤116中的确定结果是肯定的,则处理进行到步骤126,确定字符框的设置位置为混合了字符的处理对象的“前面”,之后进行到步骤128。如果在步骤116中的确定结果是否定的,则处理进行到步骤118。在本示例性实施方式中,可选地,确定阈值th5也可以由用户改变(稍后将描述细节)。上述步骤114和 116是根据第四方面的由确定单元进行的处理的示例。在步骤118,获取在字符识别处理(图2中的步骤44)中确定的、混合在混合了字符的处理对象中的字符的背景颜色,并且基于获取的背景颜色,各自计算混合在混合了字符的处理对象中的字符的背景颜色的亮度及其分散度。背景颜色的亮度也可以随字符而不同,因此在步骤118中,针对混合在混合了字符的对象中的全部字符分别地计算背景颜色的亮度,并计算针对各字符计算出的亮度的中值(当按照升序或降序重新排列各个字符的背景颜色的亮度时位于中间的亮度值),作为混合在混合了字符的处理对象中的字符的背景颜色的亮度。替代上述中值,还可以使用平均值。背景颜色的亮度的分散度例如可以通过使用下面的公式(1)来计算
权利要求
1.一种图像处理装置,该图像处理装置包括字符识别部件,其基于通过将包含其中混合了字符的构成要素的文档作为图像来读取而获取的图像数据,对混合在所述构成要素中的所述字符执行字符识别;确定部件,当生成表示所述文档并且包含第一数据和第二数据的文档数据时,其中所述第一数据表示混合了所述字符的所述构成要素,所述第二数据包含由所述字符识别部件识别出的字符的字符码数据并表示显示所述字符码数据表示的所述字符的字符块,该确定部件基于所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、所述构成要素中的所述字符的尺寸、或所述构成要素的类型中的至少一项,来确定在显示所述文档数据表示的文档时,是将所述第二数据表示的字符块隐藏在所述第一数据表示的所述构成要素的后面,还是将所述第二数据表示的字符块显示在所述第一数据表示的所述构成要素的前面;以及生成部件,其生成所述文档数据,对于所述文档数据,已经根据所述确定部件的确定结果而设置了在显示所述文档时在所述字符块与所述构成要素之间的显示的前/后关系。
2.根据权利要求1所述的图像处理装置,其中,如果所述构成要素的所述字符周围的背景区域的亮度小于第一阈值、或者所述字符周围的背景区域的亮度的分散度等于或大于第二阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
3.根据权利要求1所述的图像处理装置,其中,如果所述构成要素中的所述字符的字符数量等于或大于第三阈值,或者如果所述构成要素中的所述字符的行数量等于或大于第四阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
4.根据权利要求1所述的图像处理装置,其中,如果所述构成要素的所述字符的区域的亮度等于或大于第五阈值,则所述确定部件确定将所述字符块显示在所述构成要素的前
5.根据权利要求1所述的图像处理装置,其中,如果所述字符识别部件的所述字符识别的精度小于第六阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
6.根据权利要求1所述的图像处理装置,其中,如果所述构成要素中的所述字符的尺寸等于或大于第七阈值,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
7.根据权利要求1所述的图像处理装置,其中,如果所述构成要素的类型是被指定为隐藏所述字符块的类型的类型,则所述确定部件确定将所述字符块隐藏在所述构成要素的后面。
8.根据权利要求1所述的图像处理装置,其中,所述确定部件基于所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、或所述构成要素中的所述字符的尺寸中的至少一个与对应的阈值的比较结果,来确定是将所述字符块隐藏在所述构成要素的后面还是将所述字符块显示在所述构成要素的前面,并且,如果所述构成要素的类型是被指定为隐藏所述字符块的类型的类型,则预先改变所述阈值,使得与确定了所述构成要素的类型不是被指定为隐藏所述字符块的类型的类型时的情况相比,将所述字符块确定为隐藏在所述构成要素的后面的概率高。
9.根据权利要求1所述的图像处理装置,其中所述确定部件将所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度、 所述构成要素中的所述字符的字符数量或行数量、所述构成要素中的所述字符的区域的亮度、所述字符识别部件的所述字符识别的精度、所述构成要素中的所述字符的尺寸、或所述构成要素的类型中的至少一项与存储在存储部件中的阈值或设置信息进行比较,并且基于比较结果来确定是将所述字符块隐藏在所述构成要素的后面还是将所述字符块显示在所述构成要素的前面;并且所述图像处理装置还包括第一改变部件,该第一改变部件根据来自用户的指示而改变存储在所述存储部件中的所述阈值或所述设置信息,其中,改变所述阈值或所述设置信息的指示是从用户经由指示部件发出的。
10.根据权利要求1所述的图像处理装置,其中,如果所述确定部件确定了将所述字符块隐藏在所述构成要素的后面,则所述生成部件生成表示如下的字符块的数据作为所述第二数据所述字符块分别按照预定的字符颜色和背景颜色,来显示所述字符码数据表示的所述字符和所述字符周围的背景区域,并且,如果所述确定部件确定了将所述字符块显示在所述构成要素的前面,则所述生成部件生成表示如下的字符块的数据作为所述第二数据所述字符块分别按照与处于混合在所述构成要素中的状态下的所述字符的字符颜色或者所述背景区域的背景颜色相同或相似的颜色,来显示所述字符码数据表示的所述字符和所述字符周围的背景区域。
11.根据权利要求10所述的图像处理装置,其中如下的颜色指定信息预先存储在存储部件中所述颜色指定信息指定在所述确定部件确定了将所述字符块隐藏在所述构成要素的后面时所述字符块的所述字符颜色和所述背景颜色;并且所述图像处理装置还包括第二改变部件,在所述确定部件确定了将所述字符块隐藏在所述构成要素的后面之后从用户经由指示部件发出了改变所述字符块的所述字符颜色或所述背景颜色中的至少一个的指示的情况下,该第二改变部件根据来自用户的指示而改变所述颜色指定信息。
12.根据权利要求1所述的图像处理装置,该图像处理装置还包括输入接收部件,当所述确定部件的确定结果是特定的确定结果时,该输入接收部件从用户接收去除指示信息的输入,所述去除指示信息指示从所述文档数据中去除所述第二数据,其中,当所述输入接收部件接收到所述去除指示信息的输入并且所述确定部件的确定结果与在所述去除指示信息中设置的特定的确定结果相匹配时,所述生成部件生成去除了所述第二数据的数据作为所述文档数据。
13.根据权利要求12所述的图像处理装置,其中,当生成去除了所述第二数据的数据作为所述文档数据时,所述生成部件生成将处于混合在所述构成要素中的状态下的所述字符表示为图像的字符图像数据,并且生成如下的数据作为所述文档数据所述数据包含生成的所述字符图像数据,并将在显示所述文档时在表示所述字符图像数据的字符图像与所述构成要素之间的显示的前/后关系设置为,使得在显示所述文档时将所述字符图像显示在所述构成要素的前面。
14.根据权利要求1所述的图像处理装置,其中至少所述第一数据具有能够设置任何信息作为所述构成要素的属性信息的格式;并且所述图像处理装置还包括属性设置部件,该属性设置部件将由所述字符识别部件识别出的字符的字符码数据作为所述构成要素的属性信息设置到所述第一数据。
全文摘要
本发明涉及图像处理装置。该图像处理装置包括字符识别部件、确定部件和生成部件。当生成包含第一数据和第二数据的文档数据时,其中所述第一数据表示所述文档并表示混合了所述字符的所述构成要素,所述第二数据包含由所述字符识别部件识别出的字符的字符码数据并表示显示该字符码数据表示的所述字符的字符块,确定部件基于所述构成要素的所述字符周围的背景区域的亮度或亮度的分散度,来确定在显示由所述文档数据表示的文档时,是将所述第二数据表示的字符块隐藏在所述第一数据表示的所述构成要素的后面,还是将所述第二数据表示的字符块显示在所述第一数据表示的所述构成要素的前面。
文档编号G06K9/40GK102375981SQ20111003693
公开日2012年3月14日 申请日期2011年2月12日 优先权日2010年8月12日
发明者上条裕义, 大谷和宏, 安达真太郎, 小柳胜也, 松隈千紘 申请人:富士施乐株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1