图像处理装置和方法、图像形成装置、图像读取装置的制作方法

文档序号：6465864阅读：139来源：国知局

专利名称：图像处理装置和方法、图像形成装置、图像读取装置的制作方法
技术领域：
本发明涉及用于判定输入困像数据与预先登记的困像数据之间的相似度的困像处理装置及具有该装置的围像形成装置、困像读取装置和困像处理方法.
背景技术：
作为通过扫描仪来读取原稿困像、将读取原稿而取得的困像数据与预先登记的困像数据进行对照，并判定这些困像数据的相似度的困像处
理，例如已提出有如下方法，即通过OCR (Optical Character Reader) 从原稿图像中抽取关鍵词，利用抽取出的关鍵词来判定困像数据的相似
度的方法；以及将进行相似度判定的图像限定于带有线条的文档图像，并抽取线条的特征来判定图像数据的相似度的方法等。
在日本特开平7-282088号公报中，公开有匹配装置，该匹配装置根据输入文档的特征生成描述符，使用该描述符和描述符数据库，来进行输入文档和文档数据库中的文档的匹配。
在这里，描述符数据库中，记录有描述符，并且表示包含抽取描述符的特征的文档列表.此外，描述符按如下方式被逸择，即相对于由文档的数字化而产生的失真、或输入文档和文档数据库中的匹配文档之间的差异不产生变化。
在扫描描述符数据库时，累计对文档数据库中的各文档的投票，并将得票数最高的1个文档或得票数超过某个阈值的文档作为匹配文档。
日本特开平7-282088号公报记栽的匹配装置中，以利用黑色字符、彩色字符在白色或低浓度背景上构成的原稿图像为对象，而对于在着色了的背景上形成白色字符、即所谓的反转字符构成的原稿困像，則不能进行抽取，因此，在以包括反转字符的原稿困像为反转的对象时，判定精度下降。

发明内容
本发明目的是提供一种即使是包括反转字符的图像数据，也能高精度地判定其与预先登记的图像数据之间的相似度的图像处理装置及具有该图像处理装置的图像形成装置、图像读取装置和图像处理方法。
本发明为一种图像处理装置，其特征在于，具有第一特征点计算部，其基于原稿图像数据来确定联结像素的联结区域，抽取所确定的联结区域的特征点；反转处理部，其求出反转原稿图像数据的像素值所得的图像数据；第二特征点计算部，其基于反转原稿图像数据所得的图像数据来确定联结像素的联结区域，抽取所确定的联结区域的特征点；特征点相加部，其将由上述第一特征点计算部计算出的特征点、和由上述第二特征点计算部计算出的特征点相加；特征量计算部，其基于由上述特征点相加部相加所得的特征点来求出原稿图像数据的特征量；存储部，其将所计算出的特征量与原稿图像相对应地预先登记；相似度判定部，其基于由上述特征量计算部求出的特征量、和预先登记的原稿图像的特征量，来判定原稿图像和已登记的原稿图像是否相似。
根据本发明，第一特征点计算部，基于原稿图像数据来确定联结像素的联结区域，抽取所确定的联结区域的特征点。另一方面，反转处理部，求出反转原稿图像数据的像素值所得的图像数据，第二特征点计算
部基于反转原稿图像数据所得的图像数据来确定联结像素的联结区域，并抽取所确定的联结区域的特征点。
在特征点相加部中，将由上述第一特征点计算部计算出的特征点、和由上述第二特征点计算部计算出的特征点相加；特征量计算部基于由上述特征点相加部相加所得的特征点来求出原稿图像数据的特征量。将所计算出的特征量与原稿图像相对应地预先登记到存储部中，相似度判定部基于由上述特征量计算部求出的特征量、和预先登记的原稿图像的特征量，来判定原稿图像数据和已登记的原稿图像是否相似。原稿图像，既可以作为表示该原稿图像的索引来登记，此外还可以将表示原稿图像的索引和原稿图像的图像数据相对应地进行登记。
由此，即使是包括反转字符的图像数据，也能高精度地判定其与预先登记的图像的相似度。
此外，在本发明中，上述存储部优选是，将原稿图像数据的特征点、与由反转原稿图像数据所得的图像数据计算出的特征点进行相加而求出的特征量，与基于未反转原稿图像数据所求出的特征量而计算出的特征量分开进行存储。
根据本发明，上述存储部中，将原稿图像数据的特征点、与由反转原稿图像数据所得的图像数据而计算出的特征点进行相加而求出的特征量、与基于未反转原稿图像数据所求出的特征量而计算出的特征量分开进行存储。
由此，由于能够对相似度判定时的检索对象进行缩选，所以能够提高处理速度。
此外，在本发明中，上述相似度判定部优选是，基于表示是否使用反转上述原稿图像数据所得的图像数据的信号来进行判定。
根据本发明，上述相似度判定部基于表示是否使用反转上述原稿图像数据所得的图像数据的信号来进行判定。
由此，由于仅对包含反转字符的原稿图像进行处理，所以对不包含反转字符的原稿图像不进行不必要的处理，能够迅速地进行相似度判定处理。
再有，在本发明中，优选具有控制部，其基于上述相似度判定部的判定结果，对包括上述原稿图像数据的复印、电子分发、传真发送、归档这些针对上述原稿图像数据的处理内容进行控制。
根据本发明，能够基于相似度判定的结果来进行原稿图像的复印、电子分发禁止、传真发送禁止、原稿图像的归档等的控制。
还有，本发明为一种图像形成装置,其特征在于，具有上述的图像处理装置。
根据本发明，在数字复印机、复合机等图像形成装置中，即使在所读取的原稿图像、或由主机发送的图像数据中包含反转字符，也能够高精度地判定其与预先登记的原稿图像的相似度，能够进行原稿图像的复印和打印、电子分发禁止、传真发送禁止、原稿图像的归档等的控制。
此外，本发明为一种图像读取装置，其特征在于，具有上述的图像处理装置。
根据本发明，在扫描仪、数码照相机等图像读取装置中，即使在所读取的原稿图像、或所拍摄的图像数据中包含反转字符，也能够高精度地判定其与预先登记的图像的相似度，能够进行原稿图像的发送(向计
算机、打印机等的发送)、电子分发禁止、传真发送禁止、原稿图像的归档等的控制。
这样，由于即使对于包含反转字符的原稿图像也能够进行相似度判定处理，所以能够提供通用性优越的图像形成装置和图像读取装置。
另外，本发明为一种图像处理方法，其特征在于，包括第一特征点计算步骤，其基于原稿图像数据来确定联结像素的联结区域，抽取所确定的联结区域的特征点；反转处理步骤，其求出反转原稿图像数据的像素值所得的图像数据；第二特征点计算步骤，其基于反转原稿图像数据所得的图像数据来确定联结像素的联结区域，抽取所确定的联结区域的特征点；特征点相加步骤，其将在上述第一特征点计算步骤中计算出的特征点、和在上述第二特征点计算步骤中计算出的特征点相加；特征
量计算步骤，其基于在上述特征点相加步骤中相加所得的特征点来求出原稿图像数据的特征量；相似度判定步骤，其基于在上述特征量计算步骤中求出的特征量、和预先登记的原稿图像的特征量，来判定原稿图像和已登记的原稿图像是否相似。
根据本发明，在第一特征点计算步骤中，基于原稿图像数据来确定联结像素的联结区域，抽取所确定的联结区域的特征点。另一方面，在反转处理步骤中，求出反转原稿图像数据的像素值所得的图像数据，在第二特征点计算步骤中，基于反转原稿图像数据所得的图像数据来确定
联结像素的联结区域，抽取所确定的联结区域的特征点。
在特征点相加步骤中，将在上述第一特征点计算步骤中计算出的特征点、和在上述第二特征点计算步骤中计算出的特征点相加，在特征量
计算步骤中，基于在上述特征点相加步骤中相加所得的特征点来求出原稿图像数据的特征量。在相似度判定步骤中，基于在上述特征量计算步骤中求出的特征量、和预先登记的原稿图像的特征量，来判定原稿图像和已登记的原稿图像是否相似。
由此，即使是包含反转字符的图像数据，也能够高精度地判定其与预先登记的图像的相似度。
此外，提供一种图像处理程序，其使计算机作为上述的图像处理装置发挥功能。
另外，提供一种计算机可读的存储介质，其记录有用于使计算机作为上述的图像处理装置发挥功能的图像处理程序。
本发明的目的、特点、以及优点，将通过下述的详细说明和附图而变得更加明确。

图l是表示具有作为本发明的一实施方式的图像处理装置的图像形成装置的构成的框图。
图2是表示文档对照处理部的构成的框图。图3是表示特征点计算部的构成的框图。图4是表示混合滤色器的一个例子的图。图5是表示特征点计算部的其他构成的框图。图6是表示特征点计算部的其他构成的框图。图7是表示第一计算部的构成的框图。
图8是表示用于说明关注像素和与之邻接的4个像素的位置的图。图9是表示标签等价表的一个例子的图。
图10A 图IOE是表示显示在操作面板上的对话形式的询问的例子的图。
图11是表示联结区域的特征点的例子的图。
图12是表示针对字符串抽取特征点的结果的例子的说明图。
图13是表示关注特征点和周围特征点的一个例子的图。
图14A 图14F是表示根据关注特征点的不变量的计算例子的图。图15A 图15H是表示根据关注特征点的不变量的其他计算例子的图。
图16A和图16B时表示散列表的一个例子的图。图17是表示文档对照处理的流程图。图18是表示特征点计算处理的流程图。
图19是表示作为本发明的一实施方式的图像读取装置的构成的框图。
具体实施例方式
以下，参照附图，对本发明的优选实施方式进行详细说明。
图l是表示图像形成装置1的构成的框图，该图像形成装置l具有作为本发明的一实施方式的图像处理装置3。
图像形成装置1具有彩色图像输入装置2、彩色图像处理装置3、彩色图像输出装置4以及用于进行各种操作的操作面板5等。将通过彩色图像输入装置2读入原稿而获得的RGB (R:红、G:绿、B:蓝) 的模拟信号的图像数据，输入到彩色图像处理装置3，由彩色图像处理装置3进行规定的处理，并作为CMYK(C:青色、M:品红色、Y: 黄色、K:黑色)的数字彩色信号被输出到彩色图像输出装置4。
彩色图寸象输入装置2,例如为具有CCD ( Charged Coupled Decice ) 图像传感器的扫描仪，其将来自原稿图像的反射光学图像作为RGB的模拟信号进行读取，并向彩色图像处理装置3输出所读取的RGB信号。此外，彩色图像输出装置4，是向记录纸上输出原稿图像的图像数据的电子照相式或喷墨式等的打印机。另外，彩色图像输出装置4也可以是液晶显示器等的显示装置。
彩色图像处理装置3具有后述的各处理部，且由ASIC (Application Specific—Integrated Circuit)等来实现。
彩色图像处理装置3具有A/D (模拟/数字)转换部10、阴影修正
部ll、文档对照处理部12、输入灰度等级修正部13、区域分离处理部 14、颜色修正部15、黑生成底色除去部16、空间滤色处理部17、输出灰度等级修正部18、以及灰度等级再现处理部19。
由彩色图像输入装置2读取的模拟彩色信号，按照A/D(模拟/数字) 转换部IO、阴影修正部ll、文档对照处理部12、输入灰度等级修正部 13、区域分离处理部14、颜色修正部15、黑生成底色除去部16、空间滤色处理部17、输出灰度等级修正部18、以及灰度等级再现处理部19 的顺序在彩色图像处理装置3内传送，并作为CMYK(C:青色、M: 品红色、Y:黄色、K:黑色)的数字彩色信号向彩色图像输出装置4 输出。
A/D转换部10，将所输入的RGB的模拟彩色信号转换为作为图像数据的数字彩色信号。阴影修正部11，对由A/D转换部10传送来的 RGB数字彩色信号实施去除在彩色图像输入装置2的照明系统、成像系统、拍摄系统中产生的各种失真的处理。阴影修正部ll还对RGB信号(RGB的反射率信号)的彩色平衡进行调整，同时转换为浓度信号等彩色图像处理装置3易于处理的信号。
文档对照处理部12，将所输入的图像二值化，基于二值图像来计算所确定的联结区域的特征点，使用其结果来判定所输入的图像与预先登记的图像(包含文档图像)的相似度。文档对照处理部12，在判断为图像相似的情况下，输出预先设定的、确定了针对相似原稿的处理的分类信号，并进行规定的处理。
在判断为相似的情况下，进行原稿图像的输出控制。例如，禁止原稿图像的复印、图像数据的电子分发以及传真发送，或者许可图像数据的归档。或者，也可以许可图像数据的复印、电子分发以及传真发送，不过要记录处理记录并通知管理员。再有，文档对照处理部12,直接将所输入的RGB信号输出给后级的输入灰度等级修正部13。
输入灰度等级修正部13，从由阴影修正部11处理的RGB信号中除去基底的颜色(基底的浓度成分基底浓度)，并进行对比度等画质调整。
区域分离处理部14,基于RGB信号，将输入图像数据的各像素，
分离为例如属于字符区域、网点区域、照片(连续灰度等级)区域及基底区域等多个区域中的像素。
然后，区域分离处理部14,基于上述分离结果，向黑生成底色除去部16、空间滤色处理部17、以及灰度等级再现处理部19输出表示像素属于哪个区域的区域识别信号，并且，直接向后级的颜色修正部15输出输入信号。
作为区域分离处理，例如，通过计算包含关注像素的nxm的块(例如15 x 15 )中的最小浓度值(最小像素值)和最大浓度值(最大像素值) 的差分即最大浓度差、以及邻接像素的浓度差的绝对值的总和即总和浓度复杂度，并与预先决定的多个阈值进行比较，从而可以分离为基底区域、照片区域、字符区域、和网点区域。在本发明中，将各^^素分离成上述各区域之后，如果在基底区域或照片区域则判断为属于非边缘区域，而如果在字符区域或网点区域则判断为属于边缘区域。作为具体的区域分离处理的例子，例如，记载在日本特开2002-232708号公报等中。
基底区域的浓度分布，通常浓度变化很少，因此最大浓度差及总和浓度复杂度都变得非常小。照片区域的浓度分布，呈平滑的浓度变化，最大浓度差及总和浓度复杂度都变小，但是比基底区域稍微大些。网点区域的浓度分布，最大浓度差根据网点而多种多样，但是总和浓度复杂度却产生网点数量的浓度变化，因此，总和浓度复杂度相对于最大浓度差的比例增大。
从而，当总和浓度复杂度大于最大浓度差和字符/网点判定阈值(上述多个阈值之一)之积的情况下，判别为是网点区域。字符区域的浓度分布，最大浓度差增大，总和浓度复杂度也随之增大，但是浓度变化比网点区域小，因此，总和浓度复杂度也小于网点区域。从而，当总和浓度差复杂度小于最大浓度差和字符/网点判定阈值之积的情况下，判别为是字符区域。
由此，进行所计算出的最大浓度差和最大浓度差阈值之间的比较、以及所计算出的总和浓度复杂度和总和浓度复杂度阈值之间的比较，在最大浓度差比最大浓度差阈值小、并且总和浓度复杂度比总和浓度复杂度阈值小的情况下，判定为关注像素在基底/照片区域，除此以外的情况下判定为在字符/网点区域，
再有，当判断为在基底/照片区域的情况下，对所计算的最大浓度差与基底/照片判定阈值进行比较，当最大浓度差的一方小的情况下，判定为在基底区域，当最大浓度差的一方大的情况下判定为在照片区域。在判定为在字符/网点区域的情况下，对计算出的总和浓度复杂度、和对最大浓度差乘以字符/网点判定阈值所得的值进行比较，并在总和浓度复杂度的一方小的情况下判定为是字符区域，在总和浓度复杂度的一方大的情况下判定为是网点区域。
颜色修正部15，是为了忠实地再现颜色而进行去除基于包含不需要吸收成分的CMY色材的分光特性的颜色浑浊的处理的部件。作为处理方法，有将输入RGB信号和输出CMY信号的对应关系作为LUT (检查表)的方法、和使用以下转换矩阵的彩色蒙版法等。
(式l)
<formula>formula see original document page 12</formula>例如，在4吏用彩色蒙版法(colour masking)的情况下，准备多组 RGB数据和提供给图像输出装置24的CMY数据的组，利用这些组合计算出式1的au到a33的转换矩阵的系数，使用所计算出的系数进行颜色修正处理，上述RGB数据是向图像输入装置22读入了具有与将某个 CMY数据提供给图像输出装置24时所输出的颜色的1^&*1)*值 (CIE1976L^a，信号(CIE: Commission International de l'Ecleirage; 国际照明委员会，另外，L*:亮度，a*、 b*:色度)相同的1^3*1)*值的色标时的RGB数据。也可以在希望进一步提高精度的情况下，将二次以上的高次项相加。
黑生成底色除去部16,进行根据颜色修正后的CMY的3色信号来生成黑(K)信号的黑生成、减掉原来的CMY信号重叠的部分并生成新的CMY信号的处理，并将CMY的3色信号转换为CMYK的4色信号。
空间滤波处理部17，基于区域识别信号，对从黑生成底色除去部
16输入的CMYK信号的图像数据，利用数字滤波器进行空间滤波处理。通过修正空间频率特性，能够防止输出图像的模糊和粒状劣化。
例如，在由区域分离处理部14分离为字符区域的区域，特别是为了提高字符或彩色字符的再现性，在空间滤波处理部17的空间滤波处理中利用鲜锐强调处理来强调高频成分。另外，由区域分离处理部14 分离为网点区域的区域，在空间滤波处理部17中，进行用于去除网点成分的低通滤波处理。
输出灰度等级修正部18进行输出灰度等级修正处理，即将浓度信号等的信号转换为作为彩色图像输出装置4的特征值的网点面积率。灰度等级再现处理部19,基于区域识别信号，对CMYK信号的图像数据进行灰度等级再现处理，以使图像能够再现灰度等级。
将实施了上述各处理的图像数据，暂存到存储部(未图示)中，在规定的时刻读出并输出到彩色图像输出装置4。彩色图像输出装置4, 是将图像输出到记录介质(例如纸等)上的装置，例如，可以例举电子照相方式、喷墨方式等的输出方式，但是不做特别限定。
操作面板5,例如，由液晶显示器等的显示部与设定按钮等的操作部一体化的触摸屏等构成，基于由用户通过操作面板输入的信息来控制彩色图像处理装置3、彩色图像输入装置2、彩色图像输出装置4的动作。并且，以上的各处理由未图示的CPU (Central Processing Unit: 控制部)来控制。
图2是表示文档对照处理部12的构成的框图。文档对照处理部12 具有特征点计算部20、特征量计算部21、投票处理部23、相似度判定处理部23、登记处理部26以及控制部(CPU) 24、和存储器25、
特征点计算部20抽取字符串和线条的联结部分，以联结部分的重心作为特征点进行计算。
特征量计算部21,使用由特征点计算部计算出的特征点，并计算作为相对于旋转、放大、缩小不变的量(相对于包括原稿图像的旋转、平行移动、放大缩小的几何学变化不变的参数)的特征量(特征矢量)。在后将对计算方法的一个例子进行说明。
投票处理部22使用所计算出的特征量(散列值)，对登记在散列表中的原稿图像进行投票。
相似度判定处理部23，基于投票处理部22的投票处理结果，抽取获得最大投票数的原稿图像以及得票数。将所抽取的得票数与预先决定的阈值进行比较，判定相似度。或者，将所抽取的得票数用该原稿图像所具有的最大得票数进行除法计算来进行标准化，将其结果与预先决定的阔值进行比较。作为此时的阈值的例子，例如，最好为0.8左右。如果在0.8以上，则判断为相似。并且，如果有手写部分，则有时投票数比最大投票数还大，因此也可能有相似度大于1的情况。
关于最大得票数，利用特征点的数量x根据l个特征点(关注特征点)计算出的散列值的数量来表示。在后述的例子中，作为最简单的例子，表示由l个特征点计算出l个散列值的例子，但是如果改变选择关注特征点的周围特征点的方法，则可以根据1个特征点计算出多个散列值。
例如，作为关注特征点周围的特征点抽取6点，存在6种从这6点中抽取5点的组合。并且，还能够分别针对这6种组合，由5点抽取3 点，以求出不变量，计算散列值。
登记处理部26，依次将特征量计算部21计算出的关于各特征点的散列值、和表示原稿(登记图像)的索引(原稿ID)存储到设置在存储器中的散列表中(参照后述的图16)。当已登记有散列值的情况下，与该散列值对应地登记原稿ID。进行登记处理时，不进行投票处理部 22、相似度判定处理部23的处理而回避。另外，相反地，在进行文档对照处理的情况下，不进行登记处理部26的处理而回避。
控制部(CPU) 24,对上述各处理部以及对存储器25的访问进行控制。此外，控制部24既可以是与控制彩色图像处理装置3的整体的控制部相同的控制部，也可以是文档对照处理专用的控制部。
图3是表示特征点计算部20的构成的框图。
特征点计算部20具有信号变换处理部30、析像度转换部31、 MTF 修正处理部32、二值化处理部33以及重心计算部34。
信号变换处理部30,在输入图像数据为彩色图像的情况下，对其进行无彩化，而转换为明度或亮度信号。
例如，基于RGB图像数据，利用下式(1)来求出亮度Y。
Yj:各像素的亮度值，Rj、 Gj、 Bj:各像素的颜色成分
此外，也可以将RGB图像数据转换为CIE1976I^a^A图像数据，并求出明度L、
析像度转换部31，当输入图像数据在彩色图像输入装置2中被光学放大了的情况下，为了变为规定的析像度而进行再次放大。另外，在析像度转换部31中，为了在后级处理中提高解题量，还进行析像度转换，以便比彩色图像输入装置2在等倍时进行读入的析像度进一步降低析像度。
MTF修正处理部32,是为了补偿彩色图像输入装置2的空间频率特性因机种而不同的情况所使用的部件，并通过实施适当的滤波处理 (强调处理)，来进行修复由MTF的劣化产生的模糊的处理。另夕卜，还用于对特征点抽取处理中不需要的高频成分进行抑制。即，使用图4所示的混合滤波器来进行强调和平滑化处理。
二值化处理部33由下述部件构成，即第一个二值化处理部33a，其根据被无彩化的图像数据，制作在重心计算中适用的二值化图像数据；反转处理部33b，其对被无彩化的图像数据进行反转；第二个二值化处理部33c，其针对反转后的图像数据制作二值化图像数据。
通过将二值化对象线段区块(line block)的各像素作为进行二值化的阈值使用，仅在受限的存储区域中实现作为对象的宽范围区域的像素值的平均。对被无彩化后的图像数据(以下称为非反转图像数据)进行反转而得到的图像数据(以下称为反转图像数据)的亮度Yj'，在图像数据为8比特(256灰度等级)的情况下，通过Yj' =255-Yj来计算。
第一个和第二个二值化处理部33a、 33b的处理内容相同，将非反转、反转图像数据的亮度值或明度值与阈值进行比较，由此来对图像数据进行二值化。
图5和图6是表示特征点计算部20的其他构成的框图。除二值化处理部33的构成以外，与图3所示的构成相同，故说明省略。图5所示的特征点计算部20的其他构成中，是由二值化处理部33d进行二值化后，由反转处理部33b进行反转处理的构成。另外，图6所示的特征点计算部20的其他构成中，也可以替代图3所示的反转处理部33b和第二个二值化处理部33c，而设置生成反转字符用的特征信号的特征信号生成处理部35。
重心计算部34根据二值化后的图像数据，求出联结成分的重心，并将其作为特征点输出到特征量计算部21。
重心计算部34由以下部分构成，即对非反转图像数据计算重心的第一计算部34a;对反转图像数据计算重心的第二计算部34b;对由第一计算部34a和第二计算部34b计算出的重心进行合计(相加)的重心合计处理部34c。
图7是表示第一计算部34a的构成的框图。在这里，第一计算部34a 和第二计算部34b的构成为相同构成，故以下对第一计算部34a进行说明。
第一计算部34a具有标签处理部40、阈值处理部41、重心计算处理部42、控制部43以及存储器44。
标签处理部40，例如，抽取2行的图像数据，并以行为单位利用下述程序对关注像素标记标签。
首先，如图8所示，针对关注像素，检查与关注像素X邻接的4个像素(左、左上、上、右上)。当关注像素的邻接像素都没有标记标签时，对关注像素标记未使用的标签。当关注像素的邻接像素标记有相同的标签时，对关注像素标记与之相同的标签。在关注像素的邻接像素上标记有不同的标签时，对关注像素标记(归并)其中最早的标签，并将这些标签为相同标签的情况记录到图9所示的标签等价表中。
另外，在标记标签的同时，将关注像素的坐标值累加到与所接收的标签对应的緩存器中。并且，緩存器中存储有x坐标的相加结果、y坐标的相加结果、加到各标签的次数(像素数)、以及判定中使用的每个标签的标志。在这里，标志的种类中有"空"、"无更新"、"有更新"。
在某一行的处理结束而进行下一行的处理时，将各标签的标志初始化为 "无更新"。在行的处理结束时，当某个标签的标志为"无更新"的情况下，意味着联结部分结束。此时，上述标签被释放掉，而可以再次使用，即标志为"空"。
在结束了 l行的处理的阶段，未进行坐标值加法运算的标签(标志为"无更新"的标签)，由于不存在对其之后行的联结成分继续的情况，
所以由阈值处理部41进行重心计算判定。
阈值处理部41，进行对象标签的像素数与阈值之间的比较，进行是否进行重心计算的判定。当对象标签的像素数在下述式范围内时，进行重心计算。在下述式范围外时，不进行重心计算。
TH—L_LIMIT< (对象标签的像素数)<TH—HLIMIT
作为阈值TH_L—LIMIT的例子，为了去除孤立点等噪声成分而例如设定为100。此外，尽量设定为检测不出反转字符中的小联结区域的值。
作为阈值TH_H_LIMIT的例子，例如，当是析像度为300dpi的原稿的情况下，设￡为4096。上限侧的阈值取决于析像度、字符的大小。设定为检测不出反转字符的宽范围区域的值。
另外，这些阈值只要能够采用各种图像样本，而预先设定为适当地检测出反转字符的值即可。
重心计算处理部42,通过将累加所得的坐标值用加法运算所得的像素数进行除法运算，来求出重心。
关于整个原稿图像，也可以不求出反转图像数据，而是在进行原稿图像读入时，进行处理模式的选择(反转字符原稿模式)。处理模式的选择，也可以构成为利用操作面板5来进行。
也可以替代进行处理模式的选择，而在放置原稿(原稿台和ADF (Auto Document Feeder )任意一个均可)时，在操作面板的显示部上显示原稿是否包含白色字符(反转字符)等的对话形式的询问，提醒用户进行处理。
图10A 图10E是表示在操作面板5上显示的对话形式的询问的例子的图。对于将原稿模式显示为普通字符原稿还是反转字符原稿，通过仅显示字符(图IOA)、或者例图(图10B)来进行询问。
另外，作为例子的图像，也可以设为仅在选择了 "详细"时进行显示(图IOC)。在选择了普通字符的详细时，显示普通字符的例子，并询问是否包含如例子所示的字符(图IOD)。在选择了反转字符的详细时，显示反转字符的例子，并询问是否包含如例子所示的字符(图10E )。
再有，也可以通过自动检测原稿模式，来自动设置普通字符原稿模式或者反转字符模式等处理模式。
图ll是表示联结区域的特征点的例子的图。图中，所确定的联结区域为字符"A"，并被确定为标记有相同标签的像素的集合。该字符"A" 的特征点(重心)为图中以黑圏表示的位置(x坐标、y坐标)。
图12是表示相对于字符串的特征点的抽取结果的例子的说明图。当为由多个字符构成的字符串的情况下，根据字符的种类，抽取多个分别具有不同坐标的特征点。
特征量计算部21，从多个抽取出的特征点中选择规定的特征点，计算散列值。例如，如图13所示，从距离关注特征点C1近的特征点开始依次抽取出周围的4个特征点，并从所抽取出的周围的4个特征点中选择3个点，利用下述式求出余数，将余数作为散列值Hi(i-l, 2， ...,N; N为特征点的数量)。
在图14A 图14F所示的例子的情况下，分别对关注特征点C1、 C2 求出3种图14A 图14C、图14D 图14F的不变量。在本实施方式中，不变量是存在于规定特征点的周围的、联结周围特征点彼此的线段的长度中的2个之比，设表示为不变量Hlj、 H2j (j=l， 2， 3)。基于各个周围特征点的坐标值来计算上述线段的长度。例如，在图14A的例子中，设联结特征点c和特征点d的线段的长度为All、联结特征点c和特征点b的线段的长度为Bll时，不变量Hll为H11=A11/B11。在图14B、图14C、图14D 图14F中也可以如本图所示地定义线段，并同样地求出不变量。
(式2)
所=(别x 102+所2 x 101 +朋x 100)/Z> D:由将余数设定为何种程度而决定的常数 i:自然数
例如，设D为"10"时，余数为"0" ~ "9"，这就是计算出的散列值的取值范围。
另外，作为计算关注特征点C1、 C2的不变量的方法，例如，也可以设为如图15A 图15H所示，分别求出4种图15A 图15D,图15E 图15H的不变量Hlj、 H2j (j=l， 2， 3, 4)。在这种情况下，散列值 Hi，利用Hi = ( Hil x 103 + Hi2 x 102 + Hi3 x 101 + Hi4 x 10°) /E来i十算。
在登记原稿图像时，利用操作面板来选择登记模式，如图16A和图 16B所示，将散列值和表示原稿的索引(IDk)登记到散列表中。并且，如图16B所示，在散列值相等的情况下(H1=H5)，可以将散列表的2 个表列值整理为1个。
对于包含反转字符的原稿图像，也可以设为登记到与不包含反转字符的原稿图像不同的散列表中。由此，在进行对照判定时，可以根据原稿的模式(普通字符原稿、反转字符原稿)来对检索的对象进行缩选，因此能够提高处理速度并且能提高判定精度。
投票处理部22，基于特征量计算部21计算出的散列值(特征量)，对存储在存储器25中的散列表进行检索，并对登记在该散列值中的索引的原稿进行投票。向相似度判定处理部23输出累加投票的结果。
相似度判定处理部23,基于由投票处理部22输入的投票结果，来判定原稿(图像、文档图像)的相似度，并输出判定结果(分类信号)。更具体而言，相似度判定处理部23，对从投票处理部22输入的投票数 (得票数)与预先决定的阈值相进行比较，只要投票数在阔值以上，就判定为输入图像与预先登记的原稿的图像相似，并且将被判定为相似的之中的得票数最高的原稿判定为一致的原稿。输出分类信号，以便根据
判定结果进行对应于所登记的原稿而决定的处理(例如，禁止复印、存储到规定的文件夹中等)。另外，相似度判定处理部23，在从投票处理部22输入的投票数比阈值小时，判定为没有相似的原稿，并输出该结果。上述的判定方法为一个例子，作为其他列子，例如，也可以在将得票数用每张原稿的最大得票数(每张原稿所求出的特征点的数量等)进行除法运算并标准化之后，再进行相似度判定和一致的判定。
图17是表示文档对照处理的流程图。
在步骤S1中，特征点计算部20,对所输入的图像执行特征点计算处理，在步骤S2中，特征量计算部21基于从特征点计算部20输入的特征点，计算规定的不变量，基于计算出的不变量来计算作为特征量的散列值。
在步骤S3中，判断是否所有行的处理已结束，若结束则进入到步骤S4，若未结束则返回到步骤S1。
在步骤S4中，投票处理部22，基于特征量计算部21计算出的散列值，检索散列表，对与散列值对应地被登记的索引的原稿进行投票，并累加投票。
在步骤S5中，相似度判定处理部23，将从投票处理部22输入的投票数与预先决定的阈值进行比较，若投票数在阈值以上则判定为输入图像与预先登记的原稿的图像类似，若低于阈值则判定为不相似。
在步骤S6中，对判定结果进行判断，若存在相似图像则进入到步骤S7，并输出判定信号'T，。若不存在相似图像，则在步骤S8中输出判定信号"0"。
图18是表示特征点计算处理的流程图。
对于普通字符，在步骤S21中进行二值化处理，在步骤S22中进行标示。在步骤S23的阈值处理中若标签数在阔值范围以外则进入到步骤 S30,若在阈值范围内则进入到步骤S24。在步骤S24中进行重心计算。
对于反转字符，在步骤S25中进行反转处理，在步骤S26中进行二值化，在步骤S27中进行标示。在步骤S28的阈值处理中若标签数在阈值范围以外则进入到步骤S30,若在范围内则进入到步骤S29。在步骤 S29中进行重心计算。在步骤S30中对分别求出的重心进行合计。
图19是表示作为本发明的一实施方式的图像读取装置6(平板式扫描仪)的构成的框图。
如图19所示，图像读取装置6包括彩色图像输入装置2和彩色图像处理装置7。
彩色图像处理装置7由A/D转换部10、阴影修正部11、文档对照处理部12构成。
由彩色图像输入装置2读取的模拟信号，按照A/D转换部10、阴影修正部11、文档对照处理部12的顺序在彩色图像处理装置7内被传送。各部位与上述实施方式相同，故说明省略。
将所读取的原稿图像的数据和判定信号(或特征量)，经由网络传送给打印机、或复合机、服务器。或者，经由计算机输入到打印机、或者直接输入到打印机。在这种情况下，打印机、复合机及服务器、计算机侧，需要被设为能够处理上述原稿图像的数据、判定信号(或者特征量)。
作为本发明其他的实施方式，也可以为如下方式，即在记录有用于使计算机执行的程序的程序代码(可执行程序、中间代码程序、源程
序)的计算机可读记录介质上，记录进行如上所述的文档对照以及输出控制的图像处理方法。由此，能够携带自由地提供记录有进行图像处理方法的程序代码的记录介质，该图像处理方法进行文档对照和输出控制。
作为记录介质，既可以是在微处理器中执行处理用的存储器、例如 ROM本身就可以为记录介质，另外也可以是作为计算机的外部存储部 74而设置程序读取装置、且可通过插入到其中而进行读取的记录介质。
在任何情况下，所记录的程序，既可以通过微处理器访问记录介质来执行，也可以由微处理器从记录介质读出程序代码，将所读出的程序代码下载到程序存储区域后执行。并且，设该下载用的程序预先保存在规定的存储装置中。CPU等微处理器，对计算机的各部分进行统括控制，以便按照所下载的程序代码来进行规定的图像处理。
另外，作为可利用程序读取装置读取的记录介质，可以为如下的固定记录程序代码的介质，即磁带和盒装磁带等磁带系列、软盘和硬盘等磁盘以及CD-ROM (Compact Disc-Read Only Memory) /MO (Magneto Optical disc )/MD( Mini Disc)/DVD ( Digital Versatile Disc ) 等光盘的盘系列、IC (Integrated Circuit)卡(包含存储器卡)/光卡等的卡系列、或者掩模只读存储器(MASK ROM)、 EPROM (Erasable Programmable Read Only Memory )、 EEPROM ( Electrically Erasable Programmable Read Only Memory )、闪存ROM等半导体存储器。
另外，也可以是将计算机构成为可与包括因特网的通信网络连接的构成，以从通信网路下载程序代码的方式流动性地承载程序代码的介质。而且，当像这样地从通信网络下载程序时，该下载用的程序既可以预先存储在计算机中，也可以从其他记录介质调入。并且，本发明，上述程序代码也可以以通过电子传输来具体化的、包含于载波中的计算机数据信号的方式来实现。
执行从记录介质读取的图像处理程序的计算机系统的一个例子，是如下装置相互连接而构成的系统，即平板式扫描仪、底片扫描仪、数字照相机等图像读取装置；通过执行各种程序来进行包括上述图像处理方法的各种处理的计算机；对该计算机的处理结果等进行显示的CRT (Cathode Ray Tube )显示器、液晶显示器等图像显示装置；以及将计算机的处理结果输出到纸张等的打印机等图像输出装置。此外，该计算机系统中还具备通过通信网络而连接到服务器等，且用于收发包括图像处理程序的各种程序代码和图像数据等各种数据的网卡、调制解调器等。
本发明，只要不脱离其主旨或主要特征，可以以其他各种方式来实施。因此，上述实施方式在所有方面仅是简单的例示，本发明的范围由权利要求书表示，不受说明书正文的任何约束。此外，属于权利要求书的变形和变更应全部属于本发明范围内。
权利要求
1. 一种图像处理装置，其特征在于，具有:第一特征点计算部，其基于原稿图像数据来确定联结像素的联结区域，抽取所确定的联结区域的特征点；反转处理部，其求出反转原稿图像数据的像素值所得的图像数据；第二特征点计算部，其基于反转原稿图像数据所得的图像数据来确定联结像素的联结区域，抽取所确定的联结区域的特征点；特征点相加部，其将由上述第一特征点计算部计算出的特征点、和由上述第二特征点计算部计算出的特征点相加；特征量计算部，其基于由上述特征点相加部相加后的特征点，来求出原稿图像数据的特征量；存储部，其将所计算出的特征量与原稿图像相对应地预先登记；相似度判定部，其基于由上述特征量计算部求出的特征量、和预先登记的原稿图像的特征量，来判定原稿图像与已登记的原稿图像是否相似。
2. 根据权利要求l所述的图像处理装置，其特征在于，将原稿图像数据的特征点、和根据反转原稿图像数据所得的图像数据而计算出的特征点相加，上述存储部，分开存储根据相加所得的特征点而求出的特征量、和基于未反转原稿图像数据所求出的特征量而计算出的特征量。
3. 根据权利要求l所述的图像处理装置，其特征在于，上述相似度判定部，基于表示是否使用反转上述原稿图像数据所得的图像数据的信号，来进行判定。
4. 根据权利要求l所述的图像处理装置，其特征在于，具有控制部，其基于上述相似判定部的判定结果，来控制包括上述原稿图像数据的复印、电子分发、传真发送、归档这些针对上述原稿图像数据的处理内容。
5. —种图像形成装置，其特征在于，具有权利要求l所述的图像处理装置。
6. —种图像读取装置，其特征在于，具有权利要求l所述的图像处理装置。
7. —种图像处理方法，其特征在于，包括第一特征点计算步骤，其基于原稿图像数据来确定联结像素的联结区域，抽取所确定的联结区域的特征点；反转处理步骤，其求出反转原稿图像数据的像素值所得的图像数据；第二特征点计算步骤，其基于反转原稿图像数据所得的图像数据来确定联结像素的联结区域，抽取所确定的联结区域的特征点；特征点相加步骤，其将在上述第一特征点计算步骤中计算出的特征点、和在上述第二特征点计算步骤中计算出的特征点相加；特征量计算步骤，其基于在上述特征点相加步骤中相加所得的特征点，来求出原稿图像数据的特征量；相似度判定步骤，其基于在上述特征量计算步骤中求出的特征量、和预先登记的原稿图像的特征量，来判定原稿图像与已登记的原稿图像是否相似。
全文摘要
本发明提供图像处理装置和具有该图像处理装置的图像形成装置、图像读取装置及图像处理方法。特征点计算部(20)对图像数据进行二值化，并作为特征点求出联结像素的联结成分的重心，且对图像数据进行反转，同样地作为特征点，由反转所得的图像数据中求出重心，将它们相加而作为图像数据的特征点。特征量计算部(21)基于包含由反转图像数据中求出的特征点的上述特征点，来计算规定的不变量，并基于该不变量来计算散列值。投票处理部(22)基于所计算出的散列值，检索散列表，对与散列值对应地被登记的索引的原稿进行投票，并累加投票。相似度判定处理部(23)对由投票处理部(22)计算出的投票数与预先决定的阈值进行比较来判定相似度。
文档编号G06F17/30GK101382944SQ20081013501
公开日2009年3月11日申请日期2008年7月24日优先权日2007年7月24日
发明者早崎真, 芳野大树申请人:夏普株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：芳野大树;早崎真
技术所有人：夏普株式会社
我是此专利的发明人

上一篇：基于数据挖掘的新业务市场预测系统及其方法
上一篇：一种计算机文件检测的方法及装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。