基于文件特征用多级图像比较认证打印文件的方法和装置的制作方法

文档序号:6341316阅读:126来源:国知局
专利名称:基于文件特征用多级图像比较认证打印文件的方法和装置的制作方法
技术领域
本发明涉及一种用于通过比较文件的扫描图像和文件的原始数字版本来检测打 印文件中的更改的方法。具体地,本发明涉及一种使用基于文件特性的多级比较的图像比 较方法。
背景技术
闭环处理指的是打印原始数字文件(其可包括文本、图形、图像等),使用该文件 的打印的硬副本(诸如分送、复制等),并且随后将文件的硬副本扫描回数字形式。对扫描 的数字文件进行认证指的是确定扫描文件是否是原始数字文件的可信副本,即具有硬副本 的形式的文件是否已被更改。已经提出了各种类型的文件认证和更改检测方法。许多文件 认证方法中的目的在于检测进行了什么更改(添加、删除)。可替选地,一些文件认证方法 确定文件是否已被更改,而不确定进行了什么更改。一种类型的文件认证方法执行扫描文件与原始数字文件的图像比较。这有时被称 为基于像素的更改检测方法。在另一类型的文件认证方法中,表示文件内容或者与其相关 的数据被编码为条形码,并且这种条形码被打印在文件自身上以在以后协助文件认证。在传统的基于像素的更改检测方法中,逐个像素地比较原始数字图像和扫描图像 以确定扫描图像中是否存在更改。打印机和扫描仪的高空间分辨率导致了高分辨率的扫描 图像。传统的更改检测方法中的整个图像的详尽的图像比较处理是计算密集的。

发明内容
本发明涉及一种改进的用于通过执行扫描文件与原始数字文件的多级比较来对 文件进行认证的方法。本发明的目的在于提供一种具有改进的性能的基于图像比较的更改检测方法。在后面的描述中将阐述本发明的另外的特征和优点,并且其中一部分通过该描述 而是明显的,或者可以通过实施本发明来被认识到。通过所撰写的说明书及其权利要求以 及附图中具体指出的结构,将实现和达到本发明的这些目的和其他优点。为了实现这些和/或其他目的,如所实施的和广泛描述的,本发明提供了一种在 数据处理装置中实现的用于通过将目标文件图像与原始文件图像进行比较来对目标文件 图像进行认证的方法,其包括在第一级上将目标文件图像与原始文件图像进行比较,包括 (a)将目标文件图像分割成多个第一级单元,(b)将原始文件图像分割成多个第一级单元, (c)将目标文件图像中的多个第一级单元与原始文件图像中的多个第一级单元进行比较以 检测目标文件图像中的更改,并且如果在步骤(c)中未检测到更改,则在第二级上将目标 文件图像与原始文件图像进行比较,包括(d)将目标文件图像分割成多个第二级单元,其 中第二级单元小于第一级单元,(e)将原始文件图像分割成多个第二级单元,其中第二级单 元小于第一级单元,以及(f)将目标文件图像中的多个第二级单元与原始文件图像中的多 个第二级单元进行比较以检测目标文件图像中的更改。
此外,步骤(C)可以包括(Cl)将目标文件图像中的第一级单元的计数与原始文件 图像中的第一级单元的计数进行比较以检测目标文件图像中的更改,以及(^)如果在步 骤(Cl)中未检测到更改,则将目标文件图像中的每个第一级单元的尺寸和位置与原始文 件图像中的相应的第一级单元的尺寸和位置进行比较以检测目标文件图像中的更改。步骤 (f)可以包括(fl)将目标文件图像中的第二级单元的计数与原始文件图像中的第二级单 元的计数进行比较以检测目标文件图像中的更改,以及( )如果在步骤(fl)中未检测到 更改,则将目标文件图像中的每个第二级单元的尺寸和位置与原始文件图像中的相应的第 二级单元的尺寸和位置进行比较以检测目标文件图像中的更改。目标文件图像和原始文件图像中的第一级单元可以是块单元,每个块单元包含文 本段落、图形对象或图像对象,并且其中目标文件图像和原始文件图像中的第二级单元可 以是行单元,每个行单元包含文本行;或者可以是词单元,每个词单元包含文本词;或者可 以是字符单元,每个字符单元包含文本字符。在另一方面,本发明提供了一种计算机程序产品,其包括具有嵌入在其中的使数 据处理装置执行以上方法的计算机可读程序代码的计算机可用介质(例如存储器或存储 设备)。将理解,前面的一般描述和后面的详细描述是示例性的和解释性的,意在提供对 要求保护的本发明的进一步的解释。


图la、lb和Ic分别示意性地图示了被分割成块单元、行单元和词单元的文件图像。图加图示了根据本发明的实施例的使用多级比较的文件认证方法。图2b图示了文件认证方法的另外的处理步骤。
具体实施例方式这里描述的更改检测方法可以由软件或固件实现,该软件或固件存储在存储器中 并且由诸如计算机、具有数据处理部分的打印机或扫描仪等的任何适当的数据处理装置执 行。在这一点上,被编码为用于实现以下描述的方法的计算机可执行软件可以被存储在由 适当的数据处理装置的中央处理单元(CPU)或微处理单元(MPU)访问的计算机存储器中。 计算机连接到用于存储文件和其他数据的大容量存储设备。打印和扫描步骤可以由任何打 印机和扫描仪或者在单个设备中组合了打印部分和扫描部分的全能设备执行。这些设备和 装置的结构是公知的并且在这里不做详细描述。本发明的实施例提供了一种基于图像比较方法的文件更改检测方法(还被称为 文件认证方法),其在多个级别上执行图像比较。更具体地,该文件认证方法从高级别的比 较(即较粗糙的比较)到较低级别的比较(即较精细的比较)逐步地在多个级别上将扫描 的数字文件图像(在这里被称为目标文件图像)与原始的数字文件图像(在这里被称为原 始文件图像)比较,以检测目标文件图像中的更改。例如,高级别的比较可以是块级别上的 比较,以确定目标文件图像是否具有与原始文件图像相同的块数目以及目标文件图像和原 始文件图像中的块是否具有大致相同的尺寸和位置。每个块单元可以包含文本段落、图像或图形对象等。较低级别的比较可以是行级别上的比较,以确定目标文件图像和原始文件 图像是否具有相同的行数目以及目标文件图像和原始文件图像中的行是否具有大致相同 的尺寸和位置。更低级别的比较可以是词级别、字符级别等上的比较。认证处理可以被设计为,一旦在某一级别上检测到更改,则处理停止并且向用户 提供已检测到更改的消息,从而不会执行较低级别上的进一步的比较。可替选地,该处理可 以被设计为交互式的,从而当检测到更改时,数据处理装置向用户通知结果,并且用户可以 选择继续进一步的比较还是停止。多级图像比较方法基于如下假定文件结构通常是分级的,并且文件的版面结构 通常也是分级的。该方法利用了文件的分级特性来提供不同级别的认证解决方案。为了执行多级图像比较,目标文件图像和原始文件图像在不同的级别上被分割成 不同级别的单元,包括块单元、行单元、词单元和字符单元。每个这样分割的单元由其边界 框定义,该边界框是从所有的侧边来确定单元的界限的框(优选地是矩形的)。该处理被称 为图像分割。通常,较低级别的单元的边界框小于较高级别的单元的边界框,并且较高级别 的单元的边界框将完全包围许多个较低级别的单元的边界框。图la、lb和Ic示意性地图示了图像分割。在图Ia中,所示出的文件图像的页面 (由实线边界表示)被分割成多个块单元,每个块单元由虚线矩形表示。在图Ib中,所示出 的文件图像的页面被分割成多个行单元,每个行单元由虚线矩形表示。在图Ic中,所示出 的文件图像的页面(仅示出了几行文本)被分割成多个词单元,每个词单元由虚线矩形表
7J\ ο许多方法可用于实现图像分割。在一种方法中,通过沿竖直轴绘制每行像素中的 非白色像素的数目的图线,生成了水平直方图(或者水平投影)。该水平直方图将趋向于具 有对应于文本行之间的白色空间的具有低值的分区,以及对应于文本行的具有较高值的分 区(宽度大致相等)。因此这些直方图可以用于识别文件分割的行单元。此外,如果在文件 中段落间距不同于行间距,则可以根据这些直方图来识别块(例如段落)单元(其中直方 图中的较大的间隙将指出段落中断并且直方图中的较小的间隙将指出行中断)。行的另外 的开始和结束信息可以有助于块提取。此外,在多个对象以及复杂的版面设计的情况中,可 以通过分析直方图的分布来识别一些区域中的不同类型的对象的存在,并且随后可以通过 分析该区域中的竖直投影来提取数据块。此外,对于已识别的每个行单元,可以通过沿水平轴绘制每列像素中的非白色像 素的数目的图线来生成竖直直方图(或者竖直投影)。该竖直投影将趋向于具有对应于文 本字符之间的白色空间的具有低值的分区,以及对应于字符的具有较高值的分区。此外,竖 直直方图中的较大的白色空间可以对应于词之间的白色空间并且可以用于识别词。因此, 使用竖直和水平直方图,文件中的文本可以被分割成块(例如段落)单元、行单元、词单元 和字符单元。在另一文件分割方法中,对图像执行形态学膨胀操作,从而邻近的字符合并成对 应于词单元的阴暗块。膨胀是形态学图像处理中的公知的技术,其通常导致图像的阴暗 区域的扩大。一旦字符被合并成词单元,则可以进一步对它们进行分组以形成行单元和块 (例如段落)单元。在另一文件分割方法中,连接的图像成分(例如二值图像的情况中的连接的像素组)可以被识别为对应于字符,并且根据这些连接的图像成分形成字符单元。一旦形成了 字符单元,则它们可以被分组以形成词单元、行单元和块(例如段落)单元。还存在其他文件分割方法。一些这种方法是基于知识的,其使用文件结构的知识 来分割图像。根据本发明的实施例,多级认证方法将目标文件图像和原始文件图像分割成不同 级别的单元,并且比较这两个图像中的每个级别的单元的数目(计数)以及这两个图像中 的每个单元的边界框尺寸和位置。该处理开始于较高级别的单元(块单元、行单元等),并 且一旦找到更改,则可以在任何级别上停止。更具体地,如图加中所示,该处理首先将目标文件图像和原始文件图像分割成块 单元,每个块单元由边界框定义(步骤S201)。比较目标文件图像和原始文件图像中的块单 元的计数。如果计数不同(步骤S202中的“否”),则判断目标文件已被更改,并且可以显 示适当的消息或者可以执行另外的处理(后面描述的步骤A)。如果目标文件图像和原始文 件图像中的块单元的计数是相同的(步骤S202中的“是”),则比较目标文件图像和原始文 件图像中的相应的边界框的尺寸和位置(步骤S203)。如果目标文件图像和原始文件图像 中的任何相应的边界框的尺寸和位置不同(步骤S204中的“否”),则判断目标文件已被更 改,并且可以显示适当的消息或者可以执行另外的处理(步骤A)。当比较目标文件图像和原始文件图像中的相应的边界框的尺寸和位置时,可以给 出例如几个像素的公差,从而如果尺寸差或者位置差在该公差内,则出于比较的目的,两个 边界框被视为具有相同的尺寸和位置。步骤S201至S204可以被共同称为“将目标文件图像和原始文件图像分割成块单 元并且比较这些块单元以检测更改”的步骤。如果目标文件图像和原始文件图像中的所有相应的边界框具有相同的尺寸和位 置(步骤S204中的“是”),则该处理继续,并且将目标文件图像和原始文件图像分割成行 单元,每个行单元由边界框定义(步骤S205)。与块级别的比较相似,在行级别上,该处理首 先确定目标文件图像和原始文件图像中的行单元的数目(计数)是否相同(步骤S206), 并且随后比较目标文件图像和原始文件图像中的相应的边界框的尺寸和位置(步骤S207、 S208)。如果行单元的计数不同(步骤S206中的“否”)或者如果任何相应的边界框的尺寸 和位置不同(步骤S208中的“否”),则判断目标文件已被更改,并且可以显示适当的消息 或者可以执行另外的处理(步骤A)。步骤S205至S208可以被共同称为“将目标文件图像和原始文件图像分割成行单 元并且比较这些行单元以检测更改”的步骤。在行级别的比较之后并且如果未检测到更改(步骤S208中的“是”),则在步骤 S209至S212中执行词级别的比较。在词级别的比较之后并且如果未检测到更改(步骤 S212中的“是”),则在步骤S213至S216中执行字符级别的比较。这两个级别的比较包括 与块级别和行级别的比较相似的步骤,并且它们的详细描述被省略。步骤S209至S212可 以被共同称为“将目标文件图像和原始文件图像分割成词单元并且比较这些词单元以检测 更改”的步骤。步骤S213至S216可以被共同称为“将目标文件图像和原始文件图像分割 成字符单元并且比较这些字符单元以检测更改”的步骤。如果在块级别、行级别、词级别和字符级别的检测步骤中均未检测到更改(步骤S216中的“是”),则该处理继续执行另外的更改检测步骤(精细检查)(步骤S217)。精细 检查步骤按非分级的方式执行目标文件图像和原始文件图像或者它们的选定部分的全面 比较。精细检查步骤可以使用已知的图像比较方法,诸如两个位像的直接的逐个像素 的比较,使用每个文本字符的中心线(骨架)的骨架比较,边缘提取和边缘图比较,相似度 检查,竖直和水平方向上的直方图的比较,分解方法(执行傅立叶变换或余弦变换并且对 变换形式进行比较)等。可以被用作精细检查步骤的一种图像比较方法是如2009年6月 30日提交的本申请人共同所有的共同未决的题为“Method for Detecting Alterations in Printed Document UsingImage Comparison Analyses'^tJ^ffl^^J ^it No. 12/495749 中描述的比较质心位置的方法。可以使用其他适当的图像比较方法用于精细检查步骤,包 括在未来开发的方法。精细检查步骤S217包括显示适当的消息以指出比较结果,例如是否 检测到任何更改、更改的区域的位置等。在任何级别上,如果检测到更改,即步骤S202、S204、S206、S208、S210、S212、S214 和S216中的“否”,则如图2b中所示执行后继的处理。根据实现方案,图2b中的一些步骤 是可选的。在简单的实现方案中,该处理显示消息(S218)并且终止。该消息可以是指出已 检测到更改的普通消息,或者另外指出诸如“块计数不同”的更改类型的特定消息。该消息 还可以包括用于指出检测到的更改在文件图像中所处的位置的图像。例如,如果目标文件 图像中的第三个块具有不同于原始文件图像中的第三个块的尺寸,则可以显示如下图像, 其示出了指出目标文件图像或原始文件图像中的第三个块的突出显示的框。当然,为了生 成这些特定消息,图加中的更改检测步骤将需要使用不同的标志或其他手段来指出已检 测到的不同类型的更改。在另一实现方案中,该处理可以尝试进一步确定更改的性质。在一个示例中,如果 目标文件图像和原始文件图像中的块的计数是不同的,则该处理可以尝试通过比较块单元 的尺寸和位置来确定是否删除或添加了整个块。例如,如果确定目标文件图像和原始文件 图像中的块单元1至3具有相同的尺寸和位置,并且目标文件图像中的块单元4至6具有 与原始文件图像中的块单元5至7相同的尺寸,则该处理向用户显示如下消息,其表明原始 文件图像中的块单元4可能在目标文件图像中已被删除。在更具交互性的实现方案中,步骤S218中显示的消息包括提示用户输入指令,诸 如终止处理或者执行进一步的检测(精细检查)。如图2b中所示,如果接收到执行精细检 查的用户指令(步骤S219中的“是”),则执行精细检查处理(步骤S220),其可能与精细检 查步骤S217相似或相同。可替选地,精细检查步骤S217和S220可以是可选的,并且用户可以设定安全级别 参数以确定用于执行精细检查的条件。例如,安全参数可以被设定在如下级别如果块级 别、行级别、词级别和字符级别的检测未检测到更改,则不执行精细检查。或者,安全参数可 以被设定在如下级别如果检测到块级别、行级别和词级别的更改,则将执行精细检查,但 是当仅检测到字符级别的更改等时,将不执行精细检查。图加和2b中的流程图将据此进 行修改以适应这种灵活性。可以实现可替选的检测标准。例如,根据检测到的更改的性质,认证处理可以被设 计为生成两种类型的消息,诸如“警报”和“错误”。在一个示例中,当对块进行分组时,较严 格或者较宽容的阈值可以导致不同的分组结果。因此,当在较宽容的阈值下找到分组差异时,生成错误消息,但是当在较严格的阈值下找到分组差异时,生成警报消息。在另一示例 中,当在目标文件中检测到额外的块,但是其尺寸是小的并且其位置处于页面的边缘时,由 于其是噪声的可能性较大,因此仅生成警报消息。当使用两个级别的消息(“警报”和“错 误”)时,该处理可以被设计为在检测到错误时停止,但是在仅检测到警报时继续(同时显 示适当的消息)。在图加中示出的处理中,可以预先执行原始文件图像的分割并且将结果与原始 文件图像关联地存储在数据库中。因此,如果请求针对同一原始文件图像对多个目标文件 图像进行认证时,从数据库取回所存储的分割信息,并且不需要重复原始文件图像的分割 处理。可替选地,如图加中所示,在认证处理时,对于目标文件图像和原始文件图像独立地 执行文件分割。此外,如果原始文件的诸如Word或PDF版本的源版本是可用的,则可以利用该源 版本来完成原始文件图像的分割。而且,当原始文件图像的文件分割已经可用时,目标文件图像的分割可以利用原 始文件图像的已知分割。因此,该处理可以尝试在原始文件图像的已知单元的位置处寻找 目标文件图像中的相同的块单元、行单元等,而非尝试通过刻划来分割目标文件图像。换言 之,该处理尝试验证原始文件图像中的同一分割是否也存在于目标文件图像中。关于原始文件图像的分割信息可以被存储为允许解析的文件格式,诸如XML、SGML 等。因此,如果仅请求针对文件的特定区域的认证,则可以解析存储分割信息的文件并且可 以找到相应的戳记以便于执行指定区域的认证。根据以上描述,可以看出,根据本发明的实施例的多级比较方法利用文件版面的 分级性质,从而可以在不执行全面的图像比较的情况下快速地检测某些更改。这提高了文 件认证的性能。上述文件认证处理是相对鲁棒性的并且可抵抗由打印和扫描处理引起的文件图 像质量的劣化。这是因为块单元、行单元、词单元和字符单元的数目在打印和扫描过程中不 应改变,即使字符因打印和扫描而变宽或变窄。此外,如果字符因打印和扫描而变宽或变 窄,则这些改变趋向于在整个图像中是一致的。因此,因字符变宽或变窄引起的边界框的尺 寸的任何改变在整个图像中是相对一致的。此外,即使打印机或扫描仪具有不均勻的特性, 其导致了图像中的不一致的尺寸改变,但是预期仍不会出现相邻单元之间的突然的尺寸改 变。对于本领域的技术人员将明显的是,在不偏离本发明的精神或范围的情况下,可 以对本发明的使用多级图像比较的文件认证方法进行各种修改和变化。因此,本发明旨在 涵盖落入所附权利要求及其等同物的范围内的修改和变化。
权利要求
1.一种在数据处理装置中实现的用于通过将目标文件图像与原始文件图像进行比较 来对所述目标文件图像进行认证的方法,包括在第一级上将所述目标文件图像与所述原始文件图像进行比较,包括a、将所述目标文件图像分割成多个第一级单元,b、将所述原始文件图像分割成多个第一级单元,C、将所述目标文件图像中的多个第一级单元与所述原始文件图像中的多个第一级单 元进行比较以检测所述目标文件图像中的更改,以及如果在步骤c中未检测到更改,则在第二级上将所述目标文件图像与所述原始文件图 像进行比较,包括d、将所述目标文件图像分割成多个第二级单元,其中所述第二级单元小于所述第一级 单元,e、将所述原始文件图像分割成多个第二级单元,其中所述第二级单元小于所述第一级 单元,以及f、将所述目标文件图像中的多个第二级单元与所述原始文件图像中的多个第二级单 元进行比较以检测所述目标文件图像中的更改。
2.根据权利要求1所述的方法,其中步骤c包括Cl、将所述目标文件图像中的第一级单元的计数与所述原始文件图像中的第一级单元 的计数进行比较以检测所述目标文件图像中的更改,以及c2、如果在步骤Cl中未检测到更改,则将所述目标文件图像中的每个第一级单元的尺 寸和位置与所述原始文件图像中的相应的第一级单元的尺寸和位置进行比较以检测所述 目标文件图像中的更改,以及其中步骤f包括fl、将所述目标文件图像中的第二级单元的计数与所述原始文件图像中的第二级单元 的计数进行比较以检测所述目标文件图像中的更改,以及f2、如果在步骤fl中未检测到更改,则将所述目标文件图像中的每个第二级单元的尺 寸和位置与所述原始文件图像中的相应的第二级单元的尺寸和位置进行比较以检测所述 目标文件图像中的更改。
3.根据权利要求1所述的方法,其中所述目标文件图像和所述原始文件图像中的第一 级单元是块单元,每个块单元包含文本段落、图形对象或图像对象,以及其中所述目标文件 图像和所述原始文件图像中的第二级单元是行单元,每个行单元包含文本行;或者是词单 元,每个词单元包含文本词;或者是字符单元,每个字符单元包含文本字符。
4.根据权利要求1所述的方法,其中所述目标文件图像和所述原始文件图像中的第一 级单元是行单元,每个行单元包含文本行,以及其中所述目标文件图像和所述原始文件图 像中的第二级单元是词单元,每个词单元包含文本词;或者是字符单元,每个字符单元包含 文本字符。
5.根据权利要求1所述的方法,其中所述目标文件图像和所述原始文件图像中的第一 级单元是词单元,每个词单元包含文本词,以及其中所述目标文件图像和所述原始文件图 像中的第二级单元字符单元,每个字符单元包含文本字符。
6.根据权利要求1所述的方法,进一步包括如果在步骤f中未检测到更改,则执行所述目标文件图像和所述原始文件图像或者它 们的选定部分的全面比较以检测所述目标文件图像中的更改。
7.根据权利要求1所述的方法,其中如果在步骤c或步骤f中检测到更改,则显示指出 已检测到更改的消息。
8.根据权利要求7所述的方法,其中所述消息进一步指出更改的类型。
9.一种计算机程序产品,包括具有嵌入在其中的用于控制数据处理装置的计算机可读 程序代码的计算机可用介质,所述计算机可读程序代码被配置为使所述数据处理装置执行 用于通过将目标文件图像与原始文件图像进行比较来对所述目标文件图像进行认证的处 理,所述处理包括在第一级上将所述目标文件图像与所述原始文件图像进行比较,包括a、将所述目标文件图像分割成多个第一级单元,b、将所述原始文件图像分割成多个第一级单元,C、将所述目标文件图像中的多个第一级单元与所述原始文件图像中的多个第一级单 元进行比较以检测所述目标文件图像中的更改,以及如果在步骤c中未检测到更改,则在第二级上将所述目标文件图像与所述原始文件图 像进行比较,包括d、将所述目标文件图像分割成多个第二级单元,其中所述第二级单元小于所述第一级 单元,e、将所述原始文件图像分割成多个第二级单元,其中所述第二级单元小于所述第一级 单元,以及f、将所述目标文件图像中的多个第二级单元与所述原始文件图像中的多个第二级单 元进行比较以检测所述目标文件图像中的更改。
10.根据权利要求9所述的计算机程序产品,其中步骤c包括Cl、将所述目标文件图像中的第一级单元的计数与所述原始文件图像中的第一级单元 的计数进行比较以检测所述目标文件图像中的更改,以及c2、如果在步骤cl中未检测到更改,则将所述目标文件图像中的每个第一级单元的尺 寸和位置与所述原始文件图像中的相应的第一级单元的尺寸和位置进行比较以检测所述 目标文件图像中的更改,以及其中步骤f包括fl、将所述目标文件图像中的第二级单元的计数与所述原始文件图像中的第二级单元 的计数进行比较以检测所述目标文件图像中的更改,以及f2、如果在步骤fl中未检测到更改,则将所述目标文件图像中的每个第二级单元的尺 寸和位置与所述原始文件图像中的相应的第二级单元的尺寸和位置进行比较以检测所述 目标文件图像中的更改。
11.根据权利要求9所述的计算机程序产品,其中所述目标文件图像和所述原始文件 图像中的第一级单元是块单元,每个块单元包含文本段落、图形对象或图像对象,以及其 中所述目标文件图像和所述原始文件图像中的第二级单元是行单元,每个行单元包含文 本行;或者是词单元,每个词单元包含文本词;或者是字符单元,每个字符单元包含文本字 符。
12.根据权利要求9所述的计算机程序产品,其中所述目标文件图像和所述原始文件 图像中的第一级单元是行单元,每个行单元包含文本行,以及其中所述目标文件图像和所 述原始文件图像中的第二级单元是词单元,每个词单元包含文本词;或者是字符单元,每个 字符单元包含文本字符。
13.根据权利要求9所述的计算机程序产品,其中所述目标文件图像和所述原始文件 图像中的第一级单元是词单元,每个词单元包含文本词,以及其中所述目标文件图像和所 述原始文件图像中的第二级单元字符单元,每个字符单元包含文本字符。
14.根据权利要求9所述的计算机程序产品,进一步包括如果在步骤f中未检测到更改,则执行所述目标文件图像和所述原始文件图像或者它 们的选定部分的全面比较以检测所述目标文件图像中的更改。
15.根据权利要求9所述的计算机程序产品,其中如果在步骤c或步骤f中检测到更 改,则显示指出已检测到更改的消息。
16.根据权利要求15所述的计算机程序产品,其中所述消息进一步指出更改的类型。
全文摘要
本发明涉及一种用于使用多级图像比较来对打印文件进行认证的方法和装置。该文件认证方法包括在诸如块(例如段落、图形、图像)、行、词和字符级别的多个级别上将目标文件图像(扫描图像)与原始文件图像进行比较。段落级别的比较确定目标和原始图像是否具有相同的段落数目以及段落是否具有相同的尺寸和位置,行级别的比较确定目标和原始图像是否具有相同的行数目以及行是否具有相同的尺寸和位置,等等。出于比较的目的,对目标和原始图像执行文件分割以将它们分割成段落单元、行单元等。可以预先分割原始文件并且存储分割信息以备以后使用。认证处理被设计为当在较高级别上检测到更改时停止,因此不执行较低级别的比较。
文档编号G06K9/68GK102117414SQ20101062263
公开日2011年7月6日 申请日期2010年12月28日 优先权日2009年12月29日
发明者明伟, 田宜彬 申请人:柯尼卡美能达系统研究所公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1