一种利用字符边缘特征进行打印机类型取证的方法

文档序号:6359525阅读:358来源:国知局
专利名称:一种利用字符边缘特征进行打印机类型取证的方法
技术领域
本发明属于信号与信息处理技术领域,涉及到打印机类型的取证方法。
背景技术
目前日常办公中使用的打印机类型主要是激光打印机和喷墨打印机。在文书鉴定过程中,需要判断打印文档的打印机来源,在确定打印机的品牌及型号之前若能区分打印机类型,可以提高检测效率,缩小侦查范围。
由于激光打印机和喷墨打印机的机械构造、打印原理、墨的性状均不相同,导致打印效果和质量不同。因此可从多个角度考虑两种打印机类型的鉴别问题。刘宁在《喷墨打印机种鉴别方法及流程》中提出利用打印文件的墨迹特征、机械压痕特征、墨水成分三方面对喷墨打印机打印的文档进行分析,并使用综合压痕显现法、墨水成分分析法及显微镜检验法对喷墨打印机进行鉴别。该方法需要专业的人员和设备进行检测。Jack Tchan在〈〈Classifying Digital Prints According to Their ProductionProcess Using Image Analysis and Artificial Neural Networks》中利用专门打印的方形黑色区块进行打印机的类型鉴别,提取黑色区块的边缘特征,并使用神经网络进行鉴别。该方法鉴别打印机类型必须使用预先的打印图像,不能应用于字符或普通图像的检测。Christian Schulze 等在((Using DCT Features for Printing Technique andCopy Detection))中针对整幅文档利用DCT变换,分析DCT系数的分布特征,能够对激光打印机、喷墨打印机及复印机产生的文档进行有效区分。该方法只能针对整幅扫描的文档图像进行检测,不能检测单个字母或汉字。

发明内容
本发明的目的是在打印文档中,如何判断每个打印字符的打印机类型,其中打印机类型包括激光打印机和喷墨打印机。由打印原理不同导致打印字符的效果和质量不同,研究如何利用每个字符的边缘特征进行打印机类型的鉴别。本发明解决了自动检测打印机类型问题,以帮助文件检验工作人员更准确的检验文档的来源及其真实性,这将为文件检验工作提供一种新的方法。本发明的技术方案如下I.利用字符边缘特征进行打印机类型取证的方法框图本方法的框图如图I所示,首先对扫描图像进行预处理,然后提取字符边缘区域平均梯度和边缘离散测度两维特征。提取边缘区域平均梯度特征时,首先要进行倾斜校正和字符分割的预处理操作,然后针对每个字符图像提取边缘区域并计算平均梯度;提取边缘离散测度特征时,首先要进行倾斜校正、字符分割和二值化的预处理操作,然后针对每个字符图像进行轮廓提取、单位法向量计算、旋转变换,最后计算边缘离散测度;最后进行综合判决,将每个字符的两维特征表示在二维直角坐标系中,利用决策线区分不同类型打印机的打印字符。2.文档图像预处理
使用平板扫描仪对打印文档进行扫描,利用Hough变换估计文档图像的倾斜角度,然后将图像旋转进行倾斜校正以便于字符分割,在Hough变换中选择角度范围为Θ e [-30。,30。] ο使用投影方法对倾斜校正后的图像进行字符分割,先进行行向投影,获取单行字符图像,再对单行字符图像进行列向投影获得单个字符图像。字符分割之后对每个字符图像进行二值化,由于字符图像为灰度图像且直方图会出现明显的两个峰值,因此选取两峰值所对应像素值的均值作为二值化的阈值,小于该阈值的像素值为0,大于或等于该阈值的像素值为I。3.字符边缘区域平均梯度特征提取(I)边缘区域选择在计算字符边缘的平均梯度之前,要确定边缘区域的位置,利用直方图的阈值分割确定字符边缘位置,图2为打印字符“O”的直方图。在上述将图像二值化过程中,取直方图的两峰值点对应像素值的均值Th,以Th为中心向两边扩展一定宽度以获得打印字符的边缘区域,本发明选取的边缘区域像素值范围为O. SXTh I. 2XTh,即将像素值在此范围内的点作为计算平均梯度的边缘区域集合,设为集合为M。集合M在字符图像中的位置如图3所示,字符边缘的纯白区域的像素为边缘集合M。(2)梯度图像计算假设图像I的尺寸为mXn,0jP On表示长度为m和η元素值为O的列向量,计算图像四个方向的差分分量,分别为水平差分分量H,垂直差分分量V,主对角差分分量D1,次对角差分分量D2。为方便计算,计算时去掉图像相应的行或列并补0,计算方法如式(I) - (4)所示H= I [I (I m,2 n)0m]-
(I)
「/(2:w,l: )~|「 Or ]V=T-(2)a = [,(2D』U0 C1 j(3)
L 0 — 0」L0HA = [”-卜 1{2mtn~l)\(4)利用这四个方向的差分分量,最终得到图像I的梯度图像为I0mdwnt =抑+ (D1 +D2)/2f+(V+ (D1 -D2)!!)2(5)平均梯度用Gwage表示,如式(6)所示^Average _ ι , r i^Gradient (,+ ,·/)(6)
I M I (iJ)eM其中|M|表示集合M中元素的个数。4.字符边缘离散测度特征提取
(I)字符外层边缘提取为获得字符图像边缘像素的坐标以及相互位置关系,本发明提出一种边缘像素搜索方法,按照先行后列的方式搜索初始边缘点,记录该点坐标后按照固定搜索方向逐个像素搜索,直到返回初始边缘像素点,这样便得到一个连通区域的边缘像素集合。在搜索过程中记录边缘点坐标,得到完整的连通区域之后将该连通区域内所有像素进行标记,再按照上述方式对下一个连通区域的边缘像素进行搜索,直到标记除图像块中所有的连通区域为止。这样便得到了整个字符的轮廓坐标集合。在确定初始边缘点之后,假设像素初始移动方向为垂直向下,如图4(a)所示,初始搜索方向为沿着像素初始移动方向右侧垂直方向(位置“I”),如果位置“I”不是边缘点,则在与点D相邻的像素中按照逆时针方向进行搜索(搜索方向为1 — 2 — 3 —…一7),直到搜索到下一个边缘点为止,然后以下一个边缘点为中心,记录中心点D移动方向,按照上 述规则,沿着中心点移动方向右侧垂直方向搜索边缘点,以此类推,直到中心点回到初始边缘点,此时该连通区域的边缘点提取完毕,图4(b) (c)为两种边缘像素不同移动方向初始搜索方向的选取示意图。对汉字“人”的边缘像素搜索结果如图5所示。(2)单位法向量计算本发明提出一种基于边缘搜索的方法计算单位法向量。在求取汉字图像边缘坐标过程中,已按照顺序记录了边缘像素的坐标值,利用边缘搜索方法寻找计算单位法向量的边缘点坐标,使用两个边缘点坐标即确定该两点之间边缘的单位法向量,并继续搜索下一个边缘点,以此类推求出字符各个边缘区域的单位法向量。字符边缘的法向量方向是任意方向,如图6所示,箭头方向表示字符边缘的法向量方向。使用边缘搜索方法搜索计算单位法向量的边缘点并求出单位法向量,初始条件为设定初始搜索步进L长度为1/5字符图像高度,对于每个连通域,初始点设为0,搜索起止点为A和B,且j y!6|=L,A, B两点间任意一点为C(如图7(a)所示)。区域法相向量的计算步骤如下I).计算A,B两点间每个边缘点到直线AB的距离d,若max(d) >5,则转入4);2).计算由AC顺时针旋转至与AB同向时的角度α,若α > 180°,则转入4);3).计算AC与BC夹角3,若1^11(3) >90°,转入(5),否则转入4);4).L = L-I ;5)计算沿AB方向右侧与AB垂直的单位向量尤,尤为AB区域内边缘像素的单位法向量,记录尤和Α, B点的坐标,若B为初始搜索点,转入7);6).搜索下一个与B点距离为L的像素点并定义为B,将原始B的位置定义为Α,查看AB区间内是否有初始搜索点0,如果有将初始搜索点定义为B,返回I);7)算法结束。步骤I)中计算边缘点到直线AB的距离,目的是防止AB两点间跨度过大,两点间有笔画交汇或较大弧度如图7(a)所示,步骤2)中计算AC顺时针旋转至AB的角度,防止由于步进过大而导致的边缘点分属AB的两侧,如图7(b)所示,步骤3)计算AC与BC的夹角,为防止AB间边缘点有笔画相交使单位法向量计算错误,如图7(c)所示。(3)旋转变换
计算单位法向量时,每个区间的边缘点都对应一个单位法向量I,利用旋转变换将所有单位法向量旋转至相同方向,与单位法向量对应的边缘点也随之旋转,这样能使字符边缘的二维图像投影成一维曲线。设旋转变换后的单位法向量为<2=
。为了将字符边缘旋转并投影到另一个坐标系,需要计算向量I逆时针旋转到<2时的角度
Θ。首先计算两向量间的夹角α,计算公式为
权利要求
1.一种利用字符边缘特征进行打印机类型取证的方法,其特征是对单个字符图像提取字符边缘区域平均梯度特征和边缘离散测度特征,通过字符边缘区域提取和字符梯度图像计算来提取平均梯度特征,通过对字符图像的轮廓图像提取、单位法向量计算、旋转变换来获取离散测度特征;综合判决时,将每个字符的两维特征表示在二维直角坐标系中,利用决策线区分不同类型打印机的打印字符。
2.根据权利要求I所述的一种利用字符边缘特征进行打印机类型取证的方法,其特征是提取字符边缘区域,利用字符直方图会出现两个峰值的特点,取两峰值点像素值的均值Th,设定在O. 8 X Th I. 2 X Th范围内的像素值为边缘像素。
3.根据权利要求I所述的一种利用字符边缘特征进行打印机类型取证的方法,其特征是对字符图像边缘提取单位法向量,根据已经记录的边缘像素坐标值,利用边缘搜索方法寻找计算单位法向量的边缘点坐标,两个边缘点即确定该两点之间边缘的单位法向量。
4.根据权利要求I所述的一种利用字符边缘特征进行打印机类型取证的方法,其特征是利用旋转变换将所有边缘区域的单位法向量旋转至相同方向,与法向量对应的边缘点也 随之旋转,使字符边缘的二维图像投影成一维曲线。
全文摘要
一种利用字符边缘特征进行打印机类型取证的方法,属于信号与信息处理技术领域。其特征是利用打印字符边缘特征判断打印机的类型,包括激光打印机和喷墨打印机两种。对文档的扫描图像进行预处理获得单个字符图像,针对每个字符图像提取字符边缘区域平均梯度特征和字符边缘离散测度特征。将此二维特征表示在二维直角坐标系中,利用决策线对打印字符进行区分,能够对每个字符的打印机类型进行判断。本发明的效果益处主要针对文档来源鉴定过程中,自动检测出每个打印字符的打印机类型来源。本发明适用于信息安全领域,可以有效地帮助文件检验人员检验文档的打印机类型。
文档编号G06K9/46GK102646194SQ20121004105
公开日2012年8月22日 申请日期2012年2月22日 优先权日2012年2月22日
发明者孔祥维, 尚士泽 申请人:大连理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1