电子文档生成系统和电子文档生成方法

文档序号:6439736阅读:254来源:国知局
专利名称:电子文档生成系统和电子文档生成方法
技术领域
本发明涉及生成电子文档的电子文档生成系统和与其相关的技术。
背景技术
在生成电子文档的技术中,存在提高压缩率的同时提高字符的识别性的技术。例如,存在基于扫描图像而生成高压缩HF (可移植文档格式)的电子文档的技术(参照专利文献I等)。在高压缩PDF文档中,并非对图像数据整体应用相同的压缩方法,例如将扫描图像划分为字符区域和非字符区域,对该各个区域应用不同的压缩方法。更详细地说,关于字符区域的图像数据,保持高的分辨率的状态进行二值化,而关于非字符区域的图像数据,为确保色调性而不进行二值化,进行了低分辨率化之后,以高的压缩率进行压缩(高压缩)。 由此,生成维持字符的辨认性的同时降低了数据量(文件大小)的电子文档文件(高压缩 PDF文件)。专利文献I日本特开2009-141597号公报但是,存在如下问题在这样的高压缩的HF的字符区域的字符中还存在已被二值化的字符,在利用稍微降低的分辨率的情况下,在该字符的轮廓中明显出现锯齿(M 々'一)。此外,在监视器上扩大该字符而视觉确认的情况下,也存在同样的问题。

发明内容
因此,本发明的课题在于,提供一种能够抑制文件大小的增大的同时减轻字符的锯齿的电子文档生成技术。为解决上述课题,技术方案I的发明是一种电子文档生成系统,基于扫描图像而生成电子文档,其特征在于,包括第一层生成部件,生成由规定比特值表现扫描图像中的字符图像的字符图像层;边缘图像生成部件,生成所述字符图像的边缘图像;第二层生成部件,生成抗锯齿(anti alias)层,该抗锯齿层具有基于所述边缘图像而生成的二值化图像且以半透状态重叠到所述字符图像层;文件生成部件,生成具有所述字符图像层和所述抗锯齿层的所述电子文档;以及衬底颜色判定部件,判定所述字符图像的衬底颜色,所述第二层生成部件对所述抗锯齿层设定与所述衬底颜色相同的颜色。技术方案2的发明在技术方案I的发明的电子文档生成系统中,其特征在于,还包括字符颜色判定部件,判定所述扫描图像中的各个字符图像区域的字符颜色,所述第二层生成部件将所述抗锯齿层生成为对具有相同的衬底颜色且具有互不相同的字符颜色的多个字符图像区域共同应用的层。技术方案3的发明在技术方案I的发明的电子文档生成系统中,其特征在于,所述二值化图像使用所述字符图像的内侧边缘区域的像素而构成。技术方案4的发明在技术方案3的发明的电子文档生成系统中,其特征在于,所述第一层生成部件基于对所述字符图像施加了粗化处理的图像,生成所述字符图像层。
技术方案5的发明在技术方案I的发明的电子文档生成系统中,其特征在于,所述第二层生成部件仅将在具有互不相同的衬底颜色的多个衬底区域中具有最大面积的衬底区域决定为所述抗锯齿层的生成对象区域。技术方案6的发明在技术方案I的发明的电子文档生成系统中,其特征在于,所述第二层生成部件使用基于所述边缘图像的倾斜部分的所述二值化图像,生成所述抗锯齿层。技术方案7的发明在技术方案I的发明的电子文档生成系统中,其特征在于,所述规定比特值为I。技术方案8的发明是一种电子文档生成系统,基于扫描图像而生成电子文档,其特征在于,包括第一层生成部件,生成由规定比特值表现扫描图像中的字符图像的字符图像层;边缘图像生成部件,生成所述字符图像的边缘图像;第二层生成部件,生成抗锯齿层,该抗锯齿层具有基于所述边缘图像而生成的二值化图像且以半透状态重叠到所述字符图像层;文件生成部件,生成具有所述字符图像层和所述抗锯齿层的所述电子文档;以及字符颜色判定部件,判定所述字符图像的字符颜色,所述第二层生成部件对所述抗锯齿层设定与所述字符颜色相同的颜色,且将所述抗锯齿层生成为对具有相同的字符颜色且具有互不相同的字符颜色的多个字符图像区域共同应用的层。技术方案9的发明在技术方案8的发明的电子文档生成系统中,其特征在于,所述二值化图像使用所述字符图像的边缘区域的外侧相邻像素而构成。技术方案10的发明在技术方案8的发明的电子文档生成系统中,其特征在于,所述第二层生成部件仅将在具有互不相同的字符颜色的多个字符图像区域中具有最大面积的字符图像区域决定为所述抗锯齿层的生成对象区域。技术方案11的发明是一种电子文档生成系统,基于扫描图像而生成电子文档,其特征在于,包括第一层生成部件,生成由规定比特值表现扫描图像中的字符图像的字符图像层;边缘图像生成部件,生成所述字符图像的边缘图像;第二层生成部件,生成抗锯齿层,该抗锯齿层具有基于所述边缘图像而生成的二值化图像且以半透状态重叠到所述字符图像层;以及文件生成部件,生成具有所述字符图像层和所述抗锯齿层的所述电子文档,所述第二层生成部件决定作为在具有互不相同的衬底颜色的多个衬底区域中具有最大面积的衬底区域的最大衬底区域,且决定作为在具有互不相同的字符颜色的多个字符图像区域中具有最大面积的字符图像区域的最大字符图像区域,对所述最大衬底区域和所述最大字符图像区域中面积较大的区域,生成所述抗锯齿层。技术方案12的发明在技术方案11的发明的电子文档生成系统中,其特征在于,所述第二层生成部件在所述最大衬底区域的面积大于所述最大字符图像区域的面积的情况下,仅对所述最大衬底区域生成所述抗锯齿层,在所述最大衬底区域的面积小于所述最大字符图像区域的面积的情况下,仅对所述最大字符图像区域生成所述抗锯齿层。技术方案13的发明是一种电子文档生成方法,基于扫描图像而生成电子文档,其特征在于,包括a)生成由规定比特值表现扫描图像中的字符图像的字符图像层的步骤; b)判定所述字符图像的衬底颜色的步骤;c)生成所述字符图像的边缘图像的步骤;d)生成抗锯齿层的步骤,该抗锯齿层具有基于所述边缘图像而生成的二值化图像且以半透状态重叠到所述字符图像层;以及e)生成具有所述字符图像层和所述抗锯齿层的所述电子文档的步骤,所述步骤d)包括d-Ι)对所述抗锯齿层设定与所述衬底颜色相同的颜色的步骤。根据在技术方案I至技术方案13中记载的发明,作为具有基于字符的边缘图像的二值化图像且以半透状态重叠到字符图像层的层,生成抗锯齿层。因此,通过将字符图像层和抗锯齿层重叠而在字符的边缘部分附近产生半色调值,从而能够实现锯齿的降低且能够抑制文件大小的增大。尤其,根据在技术方案2中记载的发明,对于与具有相同的衬底颜色且具有互不相同的字符颜色的多个字符图像区域有关的多个字符图像层,共同应用一个抗锯齿层。因此,由于不需要对每个字符图像层设置抗锯齿层,所以能够抑制伴随抗锯齿层数的增加所引起的抗锯齿层的首标信息的增大。此外,尤其,根据在技术方案3中记载的发明,由于在字符图像的内侧边缘区域中,生成衬底颜色对字符颜色透过合成的像素,所以能够减轻字符的锯齿。此外,尤其,根据在技术方案4中记载的发明,在字符的细线部分中,也能够良好地减轻锯齿。此外,尤其,根据在技术方案5、技术方案10以及技术方案11中记载的发明,能够
进一步抑制数据量。此外,尤其,根据在技术方案8中记载的发明,对于与具有相同的字符颜色且具有互不相同的衬底颜色的多个字符图像区域有关的多个字符图像层,共同应用一个抗锯齿层。因此,由于不需要对具有不同的衬底颜色的每个衬底区域设置抗锯齿层,所以能够抑制伴随抗锯齿层数的增加所引起的抗锯齿层的首标信息的增大。


图I是表不第一实施方式的电子文档生成系统的概略图。图2是表示控制器的功能块的图。图3是表示文件生成处理的概要的流程图。图4是表示构成字符区域的三个层的图。图5是表示有关字符区域的处理的流程图。图6是表示有关抗锯齿层生成的处理的流程图。图7是表示边缘图像的概念图。图8是表示了除去了水平部分的抗锯齿图像的图。图9是表示字符图像的一部分的图。图10是表示边缘图像等的图。图11是抗锯齿图像以半透状态重叠的情况的图。图12是表示倾斜检测文件夹的图。图13是表示字符的细线部分的图。图14是表示其他例子(对白色的衬底层重叠4种不透明且有色的字符图像层而显示的例子)的图。图15是表不抗锯齿层的图。图16是表示图15的抗锯齿层重叠到图14的状态的图。图17是表示对多个字符图像层应用共同的抗锯齿层的情况的图。
图18是表示第二实施方式的有关抗锯齿层生成的处理的流程图。
图19是表示字符图像的一部分的图。
图20是表示边缘图像等的图。
图21是表示抗锯齿图像以半透状态重叠的情况的图。
图22是表示对4个衬底层重叠I个字符图像层而显示的例子的图。
图23是表示抗锯齿层重叠到图22的状态的图。
图24是表示第三实施方式的动作的一部分的流程图。
图25是表示扫描图像的其他一例的图。
图26是表示使用了个人计算机等的系统结构例子的图。
标号说明
IMFP
9控制器
90计算机
91记录介质
100、100A、100B电子文档生成系统
FL文件
GA抗锯齿图像
GC字符图像
GE边缘图像
LA抗锯齿层
LC字符图像层
LU衬底层具体实施方式
以下,基于

本发明的实施方式。
〈I.第一实施方式>
<1-1.结构>
图I是表示第一实施方式的电子文档生成系统IOO(IOOA)的概略图。这里,电子文档生成系统100包括多功能一体机(也简称为MFP) I (IA)而构成。
该电子文档生成系统100是将光学方式读取原稿(纸文档等)而获得的图像(也
称为原稿图像或扫描图像)进行电子数据化的系统。详细地说,通过MFPl生成原稿图像且执行对于该原稿图像的图像处理等,从而原稿被进行电子数据化。MFPl是具有扫描仪功能、打印机功能、复印功能以及传真功能等的装置(也称为复合机)。具体地说,MFPl包括图像读取部2、印刷输出部4、通信部5、输入输出部6、存储部8以及控制器9,通过将这些各个部件混合而动作,从而实现上述的各个功能。图像读取部2是光学方式读取在MFPl的规定位置上放置的原稿,从而生成该原稿的图像(也称为原稿图像)的处理部。图像读取部2也被称为扫描仪部。印刷输出部4是基于有关对象图像的图像数据而在纸等的各种介质上印刷输出图像的输出部。
通信部5是可进行经由公共线路等的传真通信的处理部。此外,通信部5可进行经由了通信网络NW的网络通信。通过利用该网络通信,MFPl能够在与期望的对方之间交换各种数据。此外,MFPl还能够利用该网络通信,进行电子邮件的收发。输入输出部6包括接受对于MFPl的输入的操作输入部61和进行各种信息的显示输出的显示部62。存储部8由硬盘驱动器(HDD)等的存储装置构成。在该存储部8中,存储在图像读取部2等中生成的原稿图像等。控制器9是统一控制MFPl的控制装置,包括CPU、各种半导体存储器(RAM和ROM 等)而构成。通过各种处理部在控制器9的控制下进行动作,从而实现MFPl的各种功能。图2是表示控制器9的功能块的图。如图2所示,控制器9包括文件生成部21、衬底层生成部31、字符层生成部33、抗锯齿层生成部35。文件生成部21具有对通过图像读取部2生成的扫描图像施加各种图像处理而生成规定格式的文件(例如,HF(可移植文档格式)文件)FL的功能。文件生成部21与衬底层生成部31、字符层生成部33和抗锯齿层生成部35等协作而生成基于扫描图像的文件 (电子文档)FL。衬底层生成部31是进行衬底层LU的生成处理的处理部,字符层生成部33是进行字符图像层LC的生成处理的处理部,抗锯齿层生成部35是进行抗锯齿层LA的生成处理的处理部。关于各个层LU、LC、LA (参照图4等)在后面叙述。此外,控制器9还包括衬底颜色判定部41、字符颜色判定部42、字符图像提取部 43、粗化处理部44、边缘图像生成部45以及倾斜部分提取部46等。关于这些各个处理部的处理在后面叙述。〈1-2.图像处理的概要〉如上所述,MFPl具有对扫描图像施加规定的图像处理而生成规定格式的文件 (PDF文件等)FL的功能。以下,说明这样的文件生成处理。另外,通过控制器9等实现该文件生成功能。图3是表示文件生成处理的概要的流程图。如图3所示,首先,对通过图像读取部2取得的扫描图像施加规定的预处理(步骤 Sn)。在该预处理中,可包括例如图像格式的变换处理以及分辨率的调整处理等。接着,执行将作为有关字符的区域的字符区域和其他区域(也称为非字符区域) 区分的区域判别处理(步骤S13)。之后,施加对应于各个区域的特征的处理,从而能够维持字符的辨认性的同时降低文件容量。另外,作为非字符区域,可例示包括照片或图表等的区域。关于字符区域的图像,施加对于字符区域的处理(步骤S15)和可逆压缩处理(步骤S16)。关于字符区域,为了确保字符的辨认性,保持高分辨率的状态施加二值化处理等而生成数据DT。此外,该数据DT以规定格式进行可逆压缩之后保存。根据可逆压缩,能够避免字符的辨认性降低的情况。另一方面,关于字符区域以外的区域(非字符区域)的图像,为了保持色调性的同时降低文件容量,不施加二值化处理而施加低分辨率化处理而生成数据DG (步骤S17、 S18)。此外,该数据DG以规定格式(JPEG等)进行不可逆压缩之后保存。根据不可逆压缩,能够将生成的文件FL的文件大小减小至非常小。并且,通过两个数据DT、DG进行合成等,生成规定格式的文件FL (步骤S19)。<1-3.有关字符区域的处理>图4是表示构成字符区域的3个层LU、LC、LA的图。如图4所示,文件FL内的字符区域由这些3个层(具体地说,衬底层LU、字符图像层LC、抗锯齿层LA)构成。衬底层LU 是规定衬底的颜色等的层,字符图像层LC是包括字符图像的层。如后所述,抗锯齿层LA是基于字符的边缘图像等而生成的层。此外,图5和图6是表不有关字符区域的处理的流程图。以下,参照图5和图6说明有关字符区域的处理(具体地说,衬底层LU的生成处理、字符图像层LC的生成处理、抗锯齿层LA的生成处理等)。首先,在步骤S21 (图5)中,通过衬底层生成部31等而执行各页的衬底层LU的生成处理。具体地说,在字符区域中作为一个衬底区域而提取同一颜色的区域,对提取出的每个衬底区域生成衬底层LU。换言之,对该每个衬底颜色划分字符区域,生成一个或多个衬底层LU。更详细地说,在某一页的字符区域的整体具有同一颜色(例如,白色)的衬底颜色的情况下,字符区域的整体被当作一个衬底区域,生成特定颜色(例如,白色)的单一的衬底层LU。或者,在字符区域的整体划分为具有4个不同的颜色的衬底颜色的部分的情况下, 各个划分区域分别被当做衬底区域,生成4个衬底层。各个衬底层LU作为首标信息,具有有关其衬底区域的位置和大小的信息以及该衬底颜色的信息等。另外,通过衬底颜色判定部41判定字符区域的衬底颜色(各个字符图像的衬底颜色)。例如根据(R、G、B)的各个元素值来判定衬底的“颜色”即可。换言之,根据“色相”、 “彩度”、“亮度”的各个元素值的组合来判定衬底的“颜色”即可。此外,也可以根据对应的各个元素值是否分别完全一致来决定2个“颜色”的异同,但并不限定于此,也可以根据各个对应元素值之间的差是否分别收敛于规定的容许幅度之内来决定2个“颜色”的异同。例如,在各个对应元素值之间的差收敛于百分之几以内时,也可以判定为是同一个颜色。接着,在步骤S22中,通过字符层生成部33等执行各页的字符图像层(也简称为 “字符层”)LC的生成处理。具体地说,在各个衬底区域内,包括同一颜色的字符图像GC(表示字符的线画(更详细地说,表示字符的线的像素的集合))的区域通过字符图像提取部43作为一个同一颜色字符图像区域而提取。然后,对提取出的每个同一颜色字符图像区域,生成字符图像层 LC。更详细地说,在全部字符由同一颜色(例如,黑色)的字符颜色构成的情况下,字符区域的整体被当作一个同一颜色字符图像区域,生成单一的字符图像层LC。另一方面,在字符区域的整体划分为具有多个(例如,4个)不同颜色的字符颜色的部分的情况下,各个划分区域分别被当作同一颜色字符图像区域,生成多个(例如,4个)字符图像层LC。另外,通过字符颜色判定部42判定各个字符图像的字符颜色。此外,与衬底的“颜色”相同地判定字符的“颜色”即可。字符层生成部33基于扫描图像的字符区域内的字符图像GC,生成字符图像层LC。 字符图像层LC是由规定比特值(这里是I比特(二值))表现字符图像(详细地说是字符图像的各个像素)的层。另外,各个像素由I比特(“O”或“I”)表现的字符图像GC也被
表现为二值化图像。字符图像层LC作为其主体信息,具有有关该字符图像的信息(二值化图像数据)。 此外,字符图像层LC作为首标信息,具有有关该同一颜色字符图像区域的位置和大小的信息(字符图像层LC的左上坐标和右下坐标等)以及该字符颜色的信息等。例如,字符图像层LC作为主体信息而具有如图4所示的字符图像GC的信息(二值化图像数据等),且作为其首标信息而具有字符图像层LC的字符颜色信息(例如,黑色)等。由此,字符图像层LC 包括“颜色”和“二值化图像”等而构成。根据作为二值化图像而生成字符图像层LC,则能够抑制数据量。另外,在图4中,为了表示字符的存在,概念性地在字符图像层LC中表示了 I个字符“A”,但实际上,通常,字符图像层LC具有有关多个字符的字符图像。关于抗锯齿层LA也是相同的。接着,在步骤S23中,通过抗锯齿层生成部35等执行各页的抗锯齿层LA的生成处理。在该第一实施方式中,抗锯齿层生成部35对由同一颜色的衬底构成的I个衬底层LU生成I个抗锯齿层LA。更详细地说,假设在同一页内存在由互不相同的颜色构成的多个衬底层LU (衬底区域)的情况下,仅对在这些多个衬底层LU中具有最大面积的衬底层 LU(也称为最大衬底层或最大衬底区域)内的字符图像生成抗锯齿层LA。例如,仅对占据某页的90%的面积的白色的衬底层LU生成抗锯齿层LA,对占据剩余的10%的面积的其他颜色的衬底层LU不生成抗锯齿层LA。由此,能够限制抗锯齿层LA的生成数和生成范围。 因此,能够进一步抑制数据量。具体地说,如图6所示,首先,在步骤S31中,抗锯齿层生成部35使用衬底颜色判定部41检索同一颜色的衬底区域,决定抗锯齿层LA的生成区域(生成对象区域)。更详细地说,抗锯齿层生成部35仅将在由互不相同的颜色构成的I个或多个衬底区域(这里是衬底层LU)中具有最大面积的衬底层(“最大衬底层”)LU决定为抗锯齿层LA的生成区域。 此外,抗锯齿层生成部35判定所选择的衬底层LU的衬底颜色(换言之,该衬底层LU内的字符图像的衬底颜色)。如后所述,该衬底颜色设定为抗锯齿层LA的颜色信息。接着,在步骤S32中,边缘图像生成部45从抗锯齿层LA的生成区域(特定颜色的衬底区域)内的字符图像GC(参照图4)中提取并生成边缘图像GE。例如,提取如图7所示的边缘图像GE。如图10所示,边缘图像GE是在构成如图9所示的字符图像GC的像素中使用字符图像的内侧边缘区域的像素而构成的图像,且作为二值化图像而被提取。这里,图 9 图11是放大表示了字符图像的一部分(斜线部分)的图。详细地说,图9是表示原始的字符图像的图,图10是表示提取边缘图像GE的情况的图。此外,图11是表示抗锯齿层 LA重叠到字符图像层LC的状态(后述)的图。然后,在步骤S33中,倾斜部分提取部46从所提取的边缘图像GE中仅提取倾斜部分。例如,倾斜部分提取部46使用如图12所示的滤波器FTl等而提取斜线部分。滤波器 FTl是M像素XM像素的尺寸的滤波器,其中央像素和存在于该中央像素的右上方和左下方的像素具有像素值“1”,其他像素具有像素值“O”。该滤波器FTl是对沿着规定角度(这里是+45度)的倾斜方向延伸的线计算较大的值的图像处理滤波器。在字符图像内的各个位
10置,滤波器FTl的运算结果具有规定值以上的值的情况下,检测出斜线的存在。另外,在图 12中仅例示了检测规定角度(+45度)的斜线的滤波器,但实际上,使用多个角度(例如, +45度、-45度、+30度、-30度、+60度、-60度等)的滤波器来检测斜线。此外,在步骤S34中,抗锯齿层生成部35基于由边缘图像生成部45生成的边缘图像GE,生成抗锯齿图像GA。这里,抗锯齿层生成部35从边缘图像GE中仅提取使用倾斜部分提取部46而检测出的“斜线部分”,生成抗锯齿图像GA。换言之,从由边缘图像生成部45生成的边缘图像GE 中,除去“水平部分”(具有像素值“I”且在水平方向上连续的像素组)和“垂直部分”(具有像素值“I”且在垂直方向上连续的像素组),生成抗锯齿图像GA。例如,从如图7所示的边缘图像GE中主要除去水平部分,生成如图8所示的抗锯齿图像GA。由此,能够降低在抗锯齿图像GA中从像素值“O”变化为像素值“I”的部位。因此,在数据压缩(步骤S16(图4))处理中使用游程(run length)压缩等的压缩技术的情况下,能够特别提高压缩率来降低数据量。另外,若除去“水平部分”,则在纵向(垂直方向) 进行游程压缩时压缩率特别大幅提高,若除去“垂直部分”,则在横向(水平方向)进行游程压缩时压缩率特别大幅提高。通过除去“水平部分”和“垂直部分”的双方,在纵向和横向的任一个方向进行游程压缩时都能够稳定地提高压缩率。另外,这里,例示了抗锯齿图像GA仅由边缘图像GE中的“斜线部分”构成的情况, 但并不限定于此。例如,也可以是由边缘图像生成部45生成的边缘图像GE直接被决定为抗锯齿图像GA。抗锯齿层生成部35对抗锯齿图像(二值化图像)GA,将与在步骤S31中检测出的衬底颜色相同的颜色设定为抗锯齿层LA的颜色信息。例如,在衬底颜色为“青”的情况下, 抗锯齿层LA的颜色信息被设定为“青”。或者,在衬底颜色为“白”的情况下,抗锯齿层LA 的颜色信息被设定为“白”。此外,抗锯齿层LA的抗锯齿图像GA被设定为是具有规定的透过率α (这里是 50% )的半透图像。另外,透过率α并不限定于50%,也可以是其他值(例如,30%或者 70%等)。透过率α只要是大于0%且小于100%的值α即可。“半透图像”是设定了这样的透过率α的图像,并不限定于是具有50%的透过率的图像。由此,抗锯齿层生成部35基于抗锯齿图像而生成抗锯齿层LA。由于抗锯齿层LA 是以半透状态重叠到字符图像层LC的层,所以也被表现为“半透层”。并且,使用这样的抗锯齿层LA、字符图像层LC以及衬底层LU等,生成表示字符区域的数据DT。然后,使用该数据DT而生成文件FL(也参照图3的步骤S16、S19等)。此外,在显示所生成的文件FL时,抗锯齿层LA重叠到衬底层LU和字符图像层LC 而显示。例如,在图4(也参照图9和图10)中,对“青”的衬底层LU重叠不透明且黑色的字符图像层LC,且对两个层LU、LC进一步重叠“青”且半透的抗锯齿层LA。在图4等所示的例子中,抗锯齿层LA的抗锯齿图像GA的青像素(R、G、B) = (0,255,255)以规定的透过率 α (这里是50%)重叠到字符图像GC的内侧边缘区域的黑色像素(R、G、B) = (0、0、0)。其结果,如图11所示,字符图像GC的内侧边缘区域的像素GM具有(R、G、B) = (0、128、128)。 即,在字符图像GC的内侧边缘区域中,生成衬底颜色“青”以透过率α对字符颜色“黑”透过合成的像素GM。换言之,被描画在字符的倾斜部分中的两侧部分具有半色调值的像素GM。 由此,在字符的倾斜部分中减轻了锯齿。此外,图14 图16表示其他例子的图。此外,图17是表示在同一个例子中的各个层LU、LC、LA的关系的图。另外,图14 图16中的各个字符图像层LCll LC14的字符 “AB⑶EFG”是分别概念性地表示显示了 “字符”的情况。图17中的各个层LCll LC14的字符“AB⑶EFGHIJK......”也是相同的。图14是表示对白色的衬底层LUll重叠4种不透明且有色的字符图像层LCll LC14而显示的例子的图。这些字符图像层LC11、LC12、LC13、LC14是基于具有相同的衬底颜色(白色)且具有互不相同的字符颜色(这里是黑色、红色、绿色、蓝色)的多个字符图像区域而生成。此外,对这些字符图像层LC11、LC12、LC13、LC14分别设定互不相同的字符颜色。这里,假设4种字符图像层LC11、LC12、LC13、LC14分别具有黑色、红色、绿色、蓝色的字符颜色。此外,图15是表示如上生成的抗锯齿层LA的图。在图15中,为了便于说明,抗锯齿层LA内的抗锯齿图像GA表示为具有不同于白色的颜色(淡色)的点的集合体,但实际上,由于与衬底颜色(这里是白色)设定为相同的颜色,所以抗锯齿层LA的“颜色”是白色。图16是表示对白色的衬底层LUll重叠4种不透明且有色的字符图像层LCll LC14,且进一步重叠白色且半透的抗锯齿层LAll (图15)而显示的例子的图。即,表示文件 FL的显示状态的图。在图16中,与图14比较可知,通过抗锯齿层LA的作用,被描画在字符的倾斜部分中的两侧部分具有半色调值的像素(参照图15),在字符的倾斜部分中减轻了锯齿。如上所述,根据上述实施方式,抗锯齿层LA作为具有基于字符的边缘图像的二值化图像且以半透状态重叠到字符图像层LC的层而生成。因此,在字符图像层LC和抗锯齿层LA的重叠状态中,能够在字符的边缘部分附近中产生半色调值,能够实现锯齿的降低。 尤其,由于作为基于字符的边缘图像的“二值化图像”而生成抗锯齿层LA,所以能够抑制数据量的增大。此外,尤其如图14和图17所示,在共同的衬底颜色(例如,白色)的衬底层 LU(LUll)上存在不同的字符颜色的多个字符图像层LC(LC11 LC14)的情况下,优选对多个字符图像层LC共同应用I个抗锯齿层LA(LAll)。换言之,优选对关于具有相同的衬底颜色且具有互不相同的字符颜色的多个字符图像区域的多个字符图像层,共同应用I个抗锯齿层。详细地说,优选对多个字符图像层LC,生成并应用具有共同的颜色(衬底颜色)的共同的I个抗锯齿层LA(LAll)。由此,也能够获得上述的效果。此外,此时,不需要对多个字符图像层LC分别设置抗锯齿层LA ( S卩,设置多个抗锯齿层LA)。因此,与设置多个抗锯齿层 LA的情况相比,能够抑制抗锯齿层LA的首标信息的增大。即,能够抑制数据量的增大。另外,在上述实施方式中,例示了一律施加步骤S32 S34的处理而不依据字符图像GC的线宽的情况,但并不限定于此。例如,在如图13(或者图19)所示那样字符图像GC 具有细线(具有I个像素宽度或者2个像素宽度左右的宽度的细线)的情况下,也可以施加用于对原始的字符图像GC施加“粗化处理”而将字符的线宽粗大的处理,从而生成新的字符图像GC(参照图9)。此外,也可以对施加了这样的粗化处理的新的字符图像GC施加步骤S32、S33、S34的处理。通过粗化处理部44(参照图2)等进行这样的粗化处理等即可。
假设若在没有施加粗化处理的情况下,抗锯齿层LA重叠到字符图像层LC,则字符的细线部分仅由半色调值构成,可产生字符的线看起来更细(有的状况下,看起来像消失) 的情况。另一方面,根据伴随粗化处理的上述的变形例,在字符的细线部分中,也能够残留字符的原来的色调值的像素的同时在其相邻位置配置半色调值的像素(参照图11),能够良好地减轻锯齿。此外,在上述实施方式中,例示了作为仅具有特定颜色的二值化图像(涂满图像) 而生成衬底层LU的情况,但并不限定于此。例如,也可以由多值图像(加入图案的图像等) 构成衬底层LU。此时,抗锯齿层生成部35将字符的衬底(背景)中的主要的颜色判定为衬底颜色,并将该衬底颜色决定为抗锯齿层LA的颜色即可。此外,表现字符的衬底的多值图像等也可以作为JPEG格式等的压缩图像而构成。此外,在上述实施方式中,例示了仅对由互不相同的颜色构成的多个衬底层LU中具有最大面积的衬底层LU内的字符图像,生成抗锯齿层LA的情况,但并不限定于此。例如,也可以对由互不相同的颜色构成的多个衬底层LU分别生成抗锯齿层LA。其中,如上述实施方式所示,通过限制生成的抗锯齿层LA的数目和范围,能够进一步抑制数据的增大。〈2.第二实施方式〉在上述第一实施方式中,例示了作为抗锯齿层LA的颜色(层色)而设定与衬底颜色相同的颜色的情况。在该第二实施方式中,例示作为抗锯齿层LA的颜色(层色)而设定与字符颜色相同的颜色的情况。以下,以与第一实施方式的不同点为中心进行说明。另外,如第一实施方式所示,由于将与衬底颜色相同的颜色设定为层色的抗锯齿层LA的层色依赖衬底颜色,所以也被称为“依赖衬底颜色型抗锯齿层”。此外,如第二实施方式所示,由于将与字符颜色相同的颜色设定为层色的抗锯齿层LA的层色依赖字符颜色, 所以也被称为“依赖字符颜色型抗锯齿层”。在该第二实施方式中,在步骤S23(图5)中,代替图6的处理而执行图18的处理。在该第二实施方式中,抗锯齿层生成部35对由同一颜色的字符构成的I个字符图像层LC生成I个抗锯齿层LA。更详细地说,在存在由互不相同的颜色构成的多个字符图像层LC(字符图像区域)的情况下,假设仅对这些多个字符图像层LC中具有最大面积的字符图像层LC(也被称为最大字符图像层或最大字符图像区域)内的字符图像,生成抗锯齿层 LA。因此,首先,在步骤S51(图18)中,抗锯齿层生成部35使用字符颜色判定部42检索同一颜色的字符图像区域,决定抗锯齿层LA的生成区域。更详细地说,抗锯齿层生成部 35在由互不相同的颜色构成的I个或多个字符图像层LC中,选择具有最大面积的字符图像层LC( “最大字符图像层”)。然后,仅将选择的字符图像层LC决定为抗锯齿层LA的生成区域(生成对象区域)。此外,抗锯齿层生成部35判定所选择的字符图像层LC的字符颜色 (换言之,该字符图像层LC内的字符图像的字符颜色)。如后所述,该字符颜色(例如,黑色)设定为抗锯齿层LA的颜色信息。接着,边缘图像生成部45基于抗锯齿层LA的生成区域(特定颜色的字符图像区域)内的字符图像GC,生成边缘图像GE(步骤S52)。如图20所示,在第二实施方式中,边缘图像GE是由与字符图像GC(参照图19)的像素相邻的外侧的像素(图中画上斜线的像素)、即由字符图像GC的边缘区域的外侧相邻像素构成的图像,且作为二值化图像而生成。
在接下来的步骤S53中,执行与步骤S33相同的处理。之后,抗锯齿层生成部35基于由边缘图像生成部45生成的边缘图像GE,生成抗锯齿图像GA(步骤S54)。另外,如上所述,优选,抗锯齿层生成部35从由边缘图像生成部45 生成的边缘图像GE中,使用倾斜部分提取部46而进一步仅提取“斜线部分”,从而生成抗锯齿图像GA。在该第二实施方式中,抗锯齿层生成部35对抗锯齿图像(二值化图像)GA,将与在步骤S51中检测出的字符颜色相同的颜色设定为抗锯齿层LA的颜色信息(层色)。例如, 在字符颜色为黑色的情况下,抗锯齿层LA的颜色信息设定为“黑”。此外,抗锯齿层LA的抗锯齿图像GA被设定为是具有规定的透过率α (这里是 50% )的半透图像。由此,抗锯齿层生成部35基于抗锯齿图像,生成抗锯齿层LA(依赖字符颜色型抗锯齿层)。然后,使用这样的抗锯齿层LA、字符图像层LC以及衬底层LU等,生成文件FL。在显示所生成的文件FL时,抗锯齿层LA重叠到衬底层LU和字符图像层LC而显
/Jn ο图21是表示对“青”的衬底层LU重叠不透明且黑色的字符图像层LC,且进一步重叠黑色且半透的抗锯齿层LA而显示的例子的图。在图21所示的例子中,抗锯齿层LA的抗锯齿图像GA的黑色像素(R、G、B) = (0、0、0)以规定的透过率α (这里是50% )重叠到字符图像GC的边缘区域的外侧相邻像素(“青”像素)(R、G、B) = (0,255,255)(在图20中画上斜线的像素)。其结果,如图21所示,字符图像GC的边缘区域的外侧相邻像素具有(R、 G、B) = (0、128、128)。即,在字符图像GC的边缘区域的外侧相邻部分,生成字符颜色“黑” 以透过率α对衬底颜色“青”透过合成的像素。换言之,在字符的倾斜部分中的两侧部分描画具有半色调值的像素GM。由此,在字符的倾斜部分中减轻了锯齿。另外,与第一实施方式不同,在该第二实施方式中,通过抗锯齿层LA的重叠而产生的半色调值的像素描画在字符图像GC的外部(详细地说,字符图像GC的边缘区域的外部)。因此,即使不伴随“粗化处理”,在字符的细线部分中也能够良好地减轻锯齿。此外,图22和图23是表示其他例子的图。图22是表示对4个衬底层LU21 LU24重叠I个不透明且有色(黑色)的字符图像层LC21而显示的例子的图。假设4种衬底层LU21、LU22、LU23、LU24分别具有红色、 绿色、蓝色、灰色的衬底颜色。图23是表示进一步重叠了如上生成的抗锯齿层LA的状态的图。在图23中,对4 个衬底层LU21 LU24重叠I个不透明且有色(黑色)的字符图像层LC21,并在此基础上, 进一步重叠黑色且半透的抗锯齿层LA21。在图23中,与图22比较可知,通过抗锯齿层LA的作用,在字符的倾斜部分中的两侧部分描画具有半色调值的像素,在字符的倾斜部分中减轻了锯齿。如上所述,根据上述第二实施方式,抗锯齿层LA作为具有基于字符的边缘图像GE 的二值化图像且以半透状态重叠到字符图像层LC的层而生成。因此,在字符图像层LC和抗锯齿层LA的重叠状态中,能够在字符的边缘部分附近中产生半色调值,能够实现锯齿的降低。尤其,由于作为二值化图像而生成抗锯齿层LA,所以能够抑制数据量的增大。
此外,尤其如图23所示,在互不相同的衬底颜色的衬底层LU(LU21 LU24)上存在某一字符颜色的字符图像层LC(LC21)的情况下,优选对多个衬底层LU生成并应用具有共同的颜色(字符颜色)的共同的I个抗锯齿层LA(LA21)。换言之,优选对具有相同的字符颜色且具有互不相同的衬底颜色的多个字符图像区域(详细地说,字符图像层LC21内 (对应于各个衬底层)的多个字符图像区域),共同应用I个抗锯齿层。由此,也能够获得上述的效果。此外,此时,不需要对具有不同的衬底颜色的每个衬底区域设置抗锯齿层。换言之,不需要对多个衬底层LU分别设置抗锯齿层LA (即,设置多个抗锯齿层LA)。因此,与设置多个抗锯齿层LA的情况相比,能够抑制抗锯齿层LA的首标信息的增大。即,能够抑制数据量的增大。另外,在上述实施方式中,例示了仅对在由互不相同的颜色构成的多个字符图像层LC中具有最大面积的字符图像层LC内的字符图像,生成抗锯齿层LA的情况,但并不限定于此。例如,也可以对由互不相同的颜色构成的多个字符图像层LC分别生成抗锯齿层 LA。其中,如上述实施方式所示,通过限制生成的抗锯齿层LA的数目和范围,能够进一步抑制数据的增大。〈3.第三实施方式〉在上述第三实施方式中,例示选择性地利用“依赖衬底颜色型抗锯齿层”(参照第一实施方式)和“依赖字符颜色型抗锯齿层”(参照第二实施方式)的两种抗锯齿层LA的情况。在该第三实施方式中,抗锯齿层生成部35对文件FL的每页选择性地生成上述两种抗锯齿层LA中的一个。具体地说,在步骤S23(图5)中,代替图6的处理而执行图24的处理。图24是表示第三实施方式的动作的一部分的流程图。首先,在步骤S61中,抗锯齿层生成部35判定字符区域(字符图像区域)的衬底颜色并检索特定颜色的衬底区域,且决定在I个或多个衬底区域中最大的同一颜色衬底区域(最大衬底区域)。接着,在步骤S62中,抗锯齿层生成部35判定字符图像区域的字符颜色并检索特定颜色的字符图像区域,且决定在I个或多个字符图像区域中最大的同一颜色字符图像区域(最大字符图像区域)。之后,在步骤S63中,比较最大衬底区域和最大字符图像区域,并决定应生成与在最大衬底区域和最大字符图像区域中面积比较大的区域对应的类型的抗锯齿层LA的意旨。例如,在最大衬底区域大于最大字符图像区域时,决定应生成“依赖衬底颜色型抗锯齿层”的意旨。另一方面,在最大字符图像区域大于最大衬底区域时,决定应生成“依赖字符颜色型抗锯齿层”的意旨。然后,在步骤S65中,生成抗锯齿层LA。详细地说,在步骤S63中,“依赖衬底颜色型”决定为抗锯齿层LA的类型时,进行与第一实施方式相同的处理(尤其是步骤S32 S34),生成“依赖衬底颜色型抗锯齿层”。具体地说,仅对字符区域中“最大衬底区域”生成“依赖衬底颜色型抗锯齿层”。另一方面,在步骤S63中,“依赖字符颜色型”决定为抗锯齿层LA的类型时,进行与第二实施方式相同的处理(尤其是步骤S52 S54),生成“依赖字符颜色型抗锯齿层”。具体地说,仅对字符区域中“最大字符图像区域”生成“依赖字符颜色型抗锯齿层”。如图25所示,在页图像(扫描图像)SG内的最大衬底区域LU60(例如,白色的衬底区域)大于最大字符图像区域LC70(黑色的字符图像区域)时,与第一实施方式相同地, 生成依赖衬底颜色型抗锯齿层LA。具体地说,仅对在字符区域中最大衬底区域LU60生成 “依赖衬底颜色型抗锯齿层”LA(LA60)。由此,由于未对最大字符图像区域LC70生成抗锯齿层LA,所以能够抑制文件容量。另外,这里,例示了选择性地生成“依赖衬底颜色型抗锯齿层”和“依赖字符颜色型抗锯齿层”的情况,但并不限定于此。例如,也可以同时生成“依赖衬底颜色型抗锯齿层”和 “依赖字符颜色型抗锯齿层”。具体地说,也可以对图25的最大衬底区域LU60(白色的衬底区域)生成“依赖衬底颜色型抗锯齿层” LA1,对同图的最大字符图像区域LC70(黑色的字符图像区域)生成“依赖字符颜色型抗锯齿层”LA2。详细地说,作为对3个字符图像区域 LC61、LC62、LC63共同的白色的抗锯齿层而生成“依赖衬底颜色型抗锯齿层”LAl即可。此外,作为对2个衬底区域LU71、LU72共同的黑色的抗锯齿层LA而生成“依赖字符颜色型抗锯齿层”LA2即可。<4.其他〉以上,说明了本发明的实施方式,但本发明并不限定于在上述说明的内容。例如,在上述各个实施方式中,例示了字符图像层LC构成为由二值表现其字符图像的层的情况,但并不限定于此,字符图像层LC也可以构成为由3值以上的多值表现其字符图像的各个像素的层。此外,在上述各个实施方式中,例示了 MFPl单独构成电子文档生成系统的情况, 但并不限定于此,也可以由多个设备构成电子文档生成系统。图26是表示这样的变形例的电子文档生成系统IOO(IOOB)的概略图。这里,电子文档生成系统100B包括扫描仪装置80和计算机(个人计算机等)90。另外,扫描仪装置 80既可以是扫描仪专用设备,或者也可以是如上述的MFPl的复合机等。此外,计算机90经由通信网络NW可通信地连接到扫描仪装置80。计算机90经由通信网络NW接收由扫描仪装置80生成的扫描图像,并对该扫描图像施加如上所述的图像处理。详细地说,计算机90从记录了规定的程序PG的记录介质91 (例如,USB存储器设备、CD-ROM、DVD-ROM等)中读出该程序PG,并使用其CPU等而执行该程序PG,从而实现与上述的计算机9相同的功能。另外,该程序PG既可以由记录介质来提供,也可以通过经由因特网下载等来提供。由此,计算机90能够实现与上述各个实施方式相同的图像处理等。尤其,该计算机90能够基于从扫描仪装置80发送的图像而生成如上所述的文件FL(例如,PDF文件)。
权利要求
1.一种电子文档生成系统,基于扫描图像而生成电子文档,其特征在于,包括第一层生成部件,生成由规定比特值表现扫描图像中的字符图像的字符图像层;边缘图像生成部件,生成所述字符图像的边缘图像;第二层生成部件,生成抗锯齿层,该抗锯齿层具有基于所述边缘图像而生成的二值化图像且以半透状态重叠到所述字符图像层;文件生成部件,生成具有所述字符图像层和所述抗锯齿层的所述电子文档;以及衬底颜色判定部件,判定所述字符图像的衬底颜色,所述第二层生成部件对所述抗锯齿层设定与所述衬底颜色相同的颜色。
2.如权利要求I所述的电子文档生成系统,其特征在于,还包括字符颜色判定部件,判定所述扫描图像中的各个字符图像区域的字符颜色,所述第二层生成部件将所述抗锯齿层生成为对具有相同的衬底颜色且具有互不相同的字符颜色的多个字符图像区域共同应用的层。
3.如权利要求I所述的电子文档生成系统,其特征在于,所述二值化图像使用所述字符图像的内侧边缘区域的像素而构成。
4.如权利要求3所述的电子文档生成系统,其特征在于,所述第一层生成部件基于对所述字符图像施加了粗化处理的图像,生成所述字符图像层。
5.如权利要求I所述的电子文档生成系统,其特征在于,所述第二层生成部件仅将在具有互不相同的衬底颜色的多个衬底区域中具有最大面积的衬底区域决定为所述抗锯齿层的生成对象区域。
6.如权利要求I所述的电子文档生成系统,其特征在于,所述第二层生成部件使用基于所述边缘图像的倾斜部分的所述二值化图像,生成所述抗锯齿层。
7.如权利要求I至6的任一项所述的电子文档生成系统,其特征在于,所述规定比特值为I。
8.一种电子文档生成系统,基于扫描图像而生成电子文档,其特征在于,包括第一层生成部件,生成由规定比特值表现扫描图像中的字符图像的字符图像层;边缘图像生成部件,生成所述字符图像的边缘图像;第二层生成部件,生成抗锯齿层,该抗锯齿层具有基于所述边缘图像而生成的二值化图像且以半透状态重叠到所述字符图像层;文件生成部件,生成具有所述字符图像层和所述抗锯齿层的所述电子文档;以及字符颜色判定部件,判定所述字符图像的字符颜色,所述第二层生成部件对所述抗锯齿层设定与所述字符颜色相同的颜色,且将所述抗锯齿层生成为对具有相同的字符颜色且具有互不相同的字符颜色的多个字符图像区域共同应用的层。
9.如权利要求8所述的电子文档生成系统,其特征在于,所述二值化图像使用所述字符图像的边缘区域的外侧相邻像素而构成。
10.如权利要求8所述的电子文档生成系统,其特征在于,所述第二层生成部件仅将在具有互不相同的字符颜色的多个字符图像区域中具有最大面积的字符图像区域决定为所述抗锯齿层的生成对象区域。
11.一种电子文档生成系统,基于扫描图像而生成电子文档,其特征在于,包括第一层生成部件,生成由规定比特值表现扫描图像中的字符图像的字符图像层;边缘图像生成部件,生成所述字符图像的边缘图像;第二层生成部件,生成抗锯齿层,该抗锯齿层具有基于所述边缘图像而生成的二值化图像且以半透状态重叠到所述字符图像层;以及文件生成部件,生成具有所述字符图像层和所述抗锯齿层的所述电子文档,所述第二层生成部件决定作为在具有互不相同的衬底颜色的多个衬底区域中具有最大面积的衬底区域的最大衬底区域,且决定作为在具有互不相同的字符颜色的多个字符图像区域中具有最大面积的字符图像区域的最大字符图像区域,对所述最大衬底区域和所述最大字符图像区域中面积较大的区域,生成所述抗锯齿层。
12.如权利要求11所述的电子文档生成系统,其特征在于,所述第二层生成部件在所述最大衬底区域的面积大于所述最大字符图像区域的面积的情况下,仅对所述最大衬底区域生成所述抗锯齿层,在所述最大衬底区域的面积小于所述最大字符图像区域的面积的情况下,仅对所述最大字符图像区域生成所述抗锯齿层。
13.一种电子文档生成方法,基于扫描图像而生成电子文档,其特征在于,包括a)生成由规定比特值表现扫描图像中的字符图像的字符图像层的步骤;b)判定所述字符图像的衬底颜色的步骤;c)生成所述字符图像的边缘图像的步骤;d)生成抗锯齿层的步骤,该抗锯齿层具有基于所述边缘图像而生成的二值化图像且以半透状态重叠到所述字符图像层;以及e)生成具有所述字符图像层和所述抗锯齿层的所述电子文档的步骤,所述步骤d)包括d-D对所述抗锯齿层设定与所述衬底颜色相同的颜色的步骤。
全文摘要
提供一种能够抑制文件大小的增大的同时减轻字符的锯齿的电子文档生成技术。电子文档生成系统生成由规定比特值(例如,1比特)表现扫描图像中的字符图像的字符图像层LC,且生成该字符图像的边缘图像。此外,电子文档生成系统生成抗锯齿层(LA),该抗锯齿层(LA)具有基于该边缘图像而生成的二值化图像(GA)且以半透状态重叠到字符图像层(LC)。并且,电子文档生成系统生成具有字符图像层(LC)和抗锯齿层(LA)的电子文档(文件FL)。
文档编号G06K9/20GK102592120SQ20111039106
公开日2012年7月18日 申请日期2011年11月30日 优先权日2010年12月1日
发明者堤隆弘 申请人:柯尼卡美能达商用科技株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1