一种基于纹理合成的打印文件鉴别方法

文档序号:8413192阅读:156来源:国知局
一种基于纹理合成的打印文件鉴别方法
【技术领域】
[0001] 本发明涉及打印机文档的源机认定技术领域,提出一种基于纹理合成的打印文件 鉴别方法,目的是为了实现两份打印文档的一对一鉴别。
【背景技术】
[0002] 由于每台打印机在生产时的参数配置和使用中的损耗情况都是独一无二的,因此 打印出的文档也都不相同,这也是打印文件可区分鉴定的客观基础,所谓打印文件鉴别就 是鉴定两份打印文档是否来自同一打印机的技术。
[0003] 随着计算机和打印机的普及,打印文件也逐渐取代手写文件成为承载信息的主要 媒介,与此同时,有关打印文件篡改、伪造等犯罪行为也日益增多,因此越来越多的人投入 打印文件鉴别的相关研宄领域。目前的打印文件鉴别主要都是在两份打印文档有相同字的 情况下才能做到,因为在不同字符做匹配鉴别时,其形态结构的影响会覆盖打印机特征的 影响,无法获得正确结论;其次,为了获得好的正确率,相同字符重复次数不能太少,因为重 复越多其表现出的打印机特性越稳定。而以上所说的这两点在实际应用中很难得到满足, 尤其在中文打印文档鉴别中更难做到,因此本发明提出了一种基于纹理合成的打印文件鉴 别方法,以解决在没有相同字符匹配或者相同字符重复很少的情况下而无法进行鉴别的问 题。

【发明内容】

[0004] 为解决打印文档相同字符稀缺情况下的打印文件鉴别问题,本发明利用纹理合成 的方法,将打印文档的单个字符图像中的空白部分修复,得到完整纹理图像从而消除不同 字符间的形态结构影响。文档图像的纹理信息承载了其打印机的特性,利用纹理特征鉴别 两份打印文档是否来自同一打印机。
[0005] 本发明采用如下技术方案:
[0006] -种基于纹理合成的打印文件鉴别方法,具体包括以下步骤:
[0007] (1)利用图像整体高倍放大扫描系统采集打印文档的单个字符图像;
[0008] (2)通过纹理合成方法将残缺的单个字符图像中的空白区域修补为完整的纹理图 像;
[0009] (3)计算修补后的完整纹理图像的灰度共生矩阵,并提取对比度、一致性、自相关 和熵四个统计特征;
[0010] (4)对所提特征做归一化处理和特征融合,计算打印文档的鉴别特征,并以一份打 印文档所有图像的特征均值作为所属打印机的特征;
[0011] (5)通过分类器分类,判别两份打印文档是否来自同一台打印机。
[0012] 所述步骤(5)中,计算两份打印文档的特征距离,当距离小于经验阈值时,判定两 份文档来自相同打印机。
[0013] 所述经验阈值采用贝叶斯估计的方法计算得到:首先采取100台打印机的打印文 档样本,分别计算相同打印机文档间的距离分布与不同打印机文档间的距离分布,以两类 错误率之和最小为准则,找到经验阈值T。
[0014] 所述纹理合成方法包括基于样图的纹理合成方法和过程修复方法以及所有可将 残缺纹理修补为完整纹理的方法。
[0015] 所述纹理合成方法采用基于样本块的纹理修复方法,先要标记出图像的待修补区 域:
[0016] 首先,利用大津算法对原图像做二值化处理,初步区分开纹理区域和背景区域;
[0017] 其次,通过中值滤波去除背景区域中的噪点,但中值滤波无法去除纹理区域边缘 部分比较密集的噪点,所以需要通过膨胀腐蚀操作来保证纹理区域的纯粹性;
[0018] 最后,将膨胀腐蚀后的背景区域在原图像相应的位置修改成纯白色,所得到的白 色部分即为待修补区域。
[0019] 所述纹理合成方法利用源区域中与待填充块最相似的匹配块填充待填充区域,设 待修补区域为Ω,已知区域为Φ,δ Ω为待修补区域的边缘;主要步骤如下:
[0020] (2. 1)优先级计算,决定修补顺序:优先级计算方法采用了两个指标:像素点的置 信度C(p)和边缘强度的数据项D(p);
[0021] P(P) = C(P)*D(P) ⑴其中,
[0022]
【主权项】
1. 一种基于纹理合成的打印文件鉴别方法,其特征是:具体包括以下步骤: (1) 利用图像整体高倍放大扫描系统采集打印文档的单个字符图像; (2) 通过纹理合成方法将残缺的单个字符图像中的空白区域修补为完整的纹理图像; ⑶计算修补后的完整纹理图像的灰度共生矩阵,并提取对比度、一致性、自相关和熵 四个统计特征; (4) 对所提特征做归一化处理和特征融合,计算打印文档的鉴别特征,并以一份打印文 档所有图像的特征均值作为所属打印机的特征; (5) 通过分类器分类,判别两份打印文档是否来自同一台打印机。
2. 根据权利要求1所述的一种基于纹理合成的打印文件鉴别方法,其特征是:所述步 骤(5)中,计算两份打印文档的特征距离,当距离小于经验阈值时,判定两份文档来自相同 打印机。
3. 根据权利要求2所述的一种基于纹理合成的打印文件鉴别方法,其特征是:所述经 验阈值采用贝叶斯估计的方法计算得到:首先采取100台打印机的打印文档样本,分别计 算相同打印机文档间的距离分布与不同打印机文档间的距离分布,以两类错误率之和最小 为准则,找到经验阈值T。
4. 根据权利要求1所述的一种基于纹理合成的打印文件鉴别方法,其特征是:所述纹 理合成方法包括基于样图的纹理合成方法和过程修复方法以及所有可将残缺纹理修补为 完整纹理的方法。
5. 根据权利要求4所述的一种基于纹理合成的打印文件鉴别方法,其特征是:所述纹 理合成方法采用基于样本块的纹理修复方法,先要标记出图像的待修补区域: 首先,利用大津算法对原图像做二值化处理,初步区分开纹理区域和背景区域; 其次,通过中值滤波去除背景区域中的噪点,但中值滤波无法去除纹理区域边缘部分 比较密集的噪点,所以需要通过膨胀腐蚀操作来保证纹理区域的纯粹性; 最后,将膨胀腐蚀后的背景区域在原图像相应的位置修改成纯白色,所得到的白色部 分即为待修补区域。
6. 根据权利要求4所述的一种基于纹理合成的打印文件鉴别方法,其特征是:所述纹 理合成方法利用源区域中与待填充块最相似的匹配块填充待填充区域,设待修补区域为 Ω,已知区域为Φ,δ Ω为待修补区域的边缘;主要步骤如下: (2. 1)优先级计算,决定修补顺序:优先级计算方法采用了两个指标:像素点的置信度 C(p)和边缘强度的数据项D(p); P (P) = C (ρ) *D (ρ) (1) 其中,
其中,Ψρ为以P点为中心的待修补目标块,^和%分别为Ψρ中分属Ω和Φ区域 的部分,表示P点处的等照度线向量,\为单位法向量;α为归一化参数,ε为扰动常 数;C(p)越大说明ρ点周围具有高置信度的像素越多,D(p)越大说明ρ点处是已知区域等 照度线与待修补区域边界的交汇点;P(P)值高的地方应该优先修补; (2.2) 设优先值最高的点为ρ,根据目标块Ψρ*Ψ$部分的纹理在已知区域Φ中搜索 最佳匹配块,即匹配距离最小的块,记为; (2.3) 将I中与%对应的部分复制到 '中,并更新待修补区域的边缘δ Ω ; (2. 4)以上3个步骤不断循环操作,直到所有待修补区域都被填充,完成纹理修补。
7.根据权利要求1所述的一种基于纹理合成的打印文件鉴别方法,其特征是:所述步 骤(3)中,对比度、一致性、自相关和熵四个统计特征计算公式分别为:
【专利摘要】本发明提出一种基于纹理合成的打印文件鉴别方法,解决打印文档之间相同字符稀缺甚至没有相同字符的情况下的鉴别问题。利用整体高倍放大采集打印文档的单个字符图像,通过纹理合成的方法将残缺的打印文档字符图像修补为完整的纹理图像,从而消除不同字符形态结构的干扰,因此一台打印机合成后的所有图像可以进行特征融合,使得打印机的特征描述更加准确。计算合成图像灰度共生矩阵的四个统计特征,包括对比度、一致性、自相关和熵,以所有图像的特征均值作为一台打印机的特征描述,以两台打印机之间的特征距离作为匹配分类的依据。基于纹理合成的打印文件鉴别方法,不需要打印机文档之间有相同字符,提高了打印文件鉴别方法的适用范围和准确率。
【IPC分类】G06T7-00, G06K9-54
【公开号】CN104732548
【申请号】CN201510161664
【发明人】陈庆虎, 熊海亚, 周前进, 鄢煜尘
【申请人】武汉大学
【公开日】2015年6月24日
【申请日】2015年4月7日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1