一种利用近红外光谱法鉴定印章印迹的方法

文档序号:10722280阅读:709来源:国知局
一种利用近红外光谱法鉴定印章印迹的方法
【专利摘要】本发明具体涉及一种利用近红外光谱法鉴定印章印迹的方法。本发明利用近红外光谱法对文本或字画的印章印迹进行鉴定,整个鉴定过程不需要对待鉴定样品进行前处理,只需对待鉴定印章采集近红外光谱,不破坏待鉴定样品,具有操作简便、对样品无损、鉴定快速等特点;此外,本发明利用近红外光谱法鉴定印章印迹的方法,结合聚类分析法,通过计算待鉴定印章和已经考证年代的印章之间的距离或相似度,进而推断待鉴定印章的所属时代信息;结果表明,该方法鉴定准确度较高。
【专利说明】
一种利用近红外光谱法鉴定印章印迹的方法
技术领域
[0001] 本发明具体涉及一种利用近红外光谱法鉴定印章印迹的方法。
【背景技术】
[0002] 文物鉴定是指运用传统方法或现代科学技术来分析辨识文物的真伪、年代、质地、 用途和价值等等。古代字画是文物的重要组成部分,是文物鉴定的重要对象。古代字画的艺 术文化价值不仅体现在创作者独特的艺术风格和高超的艺术表现手法,而且体现在字画中 的印章所赋予其的时代特征和历史气息等艺术文化内涵。因此,字画中的印章是古代字画 的重要组成部分,字画中印章的鉴定具有重要的意义。
[0003] 印章和印迹也是文件的重要组成部分,是证明文件真实性的重要证据。文件中印 章的鉴定对于文件真伪的鉴别具有重要的实际应用价值。根据刑法第167条规定,伪造或变 造公文、印章,属于犯罪行为。比如,经济领域的违法和犯罪常常伴随着伪造或变造公文、印 章等行为。因此,文件中的印章印迹鉴定是刑侦学的重要组成部分,也具有重要的意义。 [0004]通常,古代字画的印章的考证主要通过古籍文献来确定印章中的文字的年代信 息,进而确定印章的年代等相关信息。然而由于印章中的文字的字体难以辨认、印章不完 整、从古籍文献中难以查阅到相关年代信息等原因,这导致并非所有的印章都能通过该方 法进行鉴定或考证其年代信息。因此,提供一种利用非接触式的、无损检测方法鉴定印章印 迹的方法具有重要的意义。
[0005] 近红外光是介于紫外-可见光和中红外之间的电磁波,其波长范围为700~2500nm (14286~4000CHT1)。由于近红外光谱吸收强度弱、近红外波段电磁辐射能量低,对样品不会 造成电离损害,因此,大多数类型的样品不需要进行任何处理便可直接进行近红外光谱的 测量。由于近红外光谱中存在大量的重叠的宽谱带,与中红外相比,很少有明显的特征稀吸 收锐锋,且存在严重的斜坡背景,因此不能直接采用传统光谱学方法对其进行分析和解释。 随着化学计量学方法的发展与应用,多元校正和模式识别等方法的引入为近红外光谱的分 析提供了新的思路,也使得近红外光谱技术被广泛地应用在农业、食品、药品等领域中。比 如,中国专利文献CN102636452A公开了一种近红外光谱无损鉴别山参真伪的方法,将近红 外光谱法用于鉴别山参的真伪。
[0006] 目前,未见利用近红外光谱法鉴定印章印迹的报道。因此,建立一种利用近红外光 谱法鉴定印章印迹的方法具有重要意义。

【发明内容】

[0007] 为此,本发明提出一种利用近红外光谱法鉴定印章印迹的方法。
[0008] 为解决上述技术问题,本发明是通过以下技术方案来实现的:
[0009] 本发明提供一种利用近红外光谱法鉴定印章印迹的方法,包括如下步骤:
[0010] (1)将待鉴定样品的每个待鉴定印章至少取3个位置采集近红外光谱,作为待鉴定 印章的原始近红外光谱;
[0011] (2)以空气为参考物质,在相同的条件下,对空气采集近红外光谱,作为参考近红 外光谱;
[0012] (3)将所述待鉴定印章的原始近红外光谱和所述参考近红外光谱经过傅里叶变换 计算,分别得到所述待鉴定印章的光强度谱1 8_和参考光强度谱Irrf,按照如下公式:A = -log1Q(Isam/Iref)计算每个待鉴定印章不同位置的吸光度,即得所述待鉴定印章的最终近红 外光谱;
[0013] (4)根据每个待鉴定印章在待鉴定样品上的位置,对每个待鉴定印章设置类别标 签;
[0014] (5)对每个待鉴定印章的最终近红外光谱进行主成分分析,绘制每个待鉴定印章 的主成分得分图;
[0015] (6)在选定的波数范围内,将所有待鉴定印章的近红外光谱划分为校正集样本和 测试集样本;
[0016] (7)用校正集样本建立线性模型和非线性模型,并用预测集样本进行光谱验证;
[0017] (8)计算每个待鉴定印章的平均光谱,计算出每个待鉴定印章相互之间的欧几里 德距离;
[0018] (9)根据欧几里德距离,计算出系统聚类法中不同聚类准则的Cophenetic相关系 数,绘制所述待鉴定印章的聚类树形图。
[0019] 优选地,本发明上述利用近红外光谱法鉴定印章印迹的方法,所述待鉴定样品为 文本或字画。
[0020] 进一步优选地,本发明上述利用近红外光谱法鉴定印章印迹的方法,所述步骤(6) 中,所述选定的波数范围为4000~lOOOOcnf 1。
[0021] 进一步优选地,本发明上述利用近红外光谱法鉴定印章印迹的方法,所述步骤(6) 中,所述校正集样本和所述预测集样本的划分采用自助拉丁配分法,选择配分数为4,取其 中3/4作为校正集样本,1/4作为预测集样本。
[0022] 进一步优选地,本发明上述利用近红外光谱法鉴定印章印迹的方法,所述步骤(4) 和所述步骤(5)之间,还包括以下步骤:向待鉴定印章的每条原始近红外光谱分别添加1 %、 2%、3%、4%、5 %的高斯白噪声,所述高斯白噪声的均值为0、方差为0.01。高斯白噪声的幅 度分布服从高斯分布,而它的功率谱密度又是均匀分布的。因为实际大多数电子系统中的 主要噪声来源是热噪声,而热噪声是典型的高斯白噪声,因此研究信号和系统仿真时经常 采用高斯白噪声来模拟仪器噪声的干扰。
[0023] 进一步优选地,本发明上述利用近红外光谱法鉴定印章印迹的方法,
[0024] 所述步骤(7)中,建立所述线性模型采用偏最小二乘判别模型,建立所述非线性模 型采用支持向量机模型。
[0025] 进一步优选地,本发明上述利用近红外光谱法鉴定印章印迹的方法,
[0026]所述步骤(8)中,每个所述待鉴定印章相互之间的相似度采用欧几里德距离表示。
[0027] 进一步优选地,本发明上述利用近红外光谱法鉴定印章印迹的方法,所述系统聚 类法的聚类准则选自类平均法、重心法、最长距离法、中间距离法、最短距离法、离差平方和 法、可变类平均法中的至少一种。
[0028] 进一步优选地,本发明上述利用近红外光谱法鉴定印章印迹的方法,
[0029] 所述步骤(9)中,所述待鉴定印章的聚类树形图的绘制采用类平均法。
[0030] 本发明还提供上述方法在印章印迹鉴定中的应用。
[0031 ]本发明的上述技术方案相比现有技术具有以下优点:
[0032] (1)本发明利用近红外光谱法对文本或字画的印章印迹进行鉴定,整个鉴定过程 不需要对待鉴定的印章印迹进行前处理,只需对待鉴定印章采集近红外光谱,不破坏待鉴 定样品,具有操作简便、对样品无损、鉴定快速等特点;
[0033] (2)本发明利用近红外光谱法鉴定印章印迹的方法,结合聚类分析法,通过计算待 鉴定印章和已经考证年代的印章之间的距离或相似度,进而推断待鉴定印章的所属时代信 息;结果表明,该方法鉴定准确度较高。
【附图说明】
[0034] 为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合 附图,对本发明作进一步详细的说明,其中:
[0035] 图1是本发明实施例中待鉴定印章的原始近红外光谱和不同白噪声的模拟光谱;
[0036] 图2是本发明实施例中第一主成分-第二主成分的2维主成分得分图;
[0037]图3是本发明实施例中第一主成分-第二主成分-第三主成分的3维主成分得分图;
[0038] 图4是本发明实施例中每个待鉴定印章的平均光谱;
[0039] 图5是本发明实施例中待鉴定样品的聚类树状图。
【具体实施方式】
[0040] 实施例1
[0041]本实施例提供一种利用近红外光谱法鉴定印章印迹的方法,以某著名古代字画为 待鉴定样品,包括如下步骤:
[0042] (1)每个待鉴定印章取3个位置采集近红外光谱,每个位置采集1次近红外光谱,获 得同一待鉴定印章上的3个近红外干涉光谱,总共5个待鉴定印章,采集得15个近红外光谱, 作为待鉴定印章的原始近红外光谱;
[0043] (2)以空气为参考物质,在相同的条件下,对空气采集近红外光谱,作为参考近红 外光谱;
[0044] (3)将待鉴定印章的原始近红外光谱和所述参考近红外光谱经过傅里叶变换计 算,分别得到所述待鉴定印章的光强度谱1 8_和参考光强度谱Irrf,按照如下公式:A = -log10 (Isam/Iref)计算每个待鉴定印章不同位置的吸光度,即得待鉴定印章的最终近红外光谱;
[0045] (4)根据5个待鉴定印章在待鉴定样品上的位置,对每个待鉴定印章设置类别标 签,分别描述为"ΥΓ、"Y2"、"Y3"、"Y4"、"Y5",并依次定义其类别标签为Y1、Y2、Y3、Y4、Y5;
[0046] 向待鉴定印章的每条原始近红外光谱分别添加1 %、2 %、3 %、4%、5 %的高斯白噪 声(均值为〇,方差为0.01),模拟外界噪声的影响。这里所述高斯白噪声的幅度分布服从高 斯分布,而它的功率谱密度又是均匀分布的。因为实际大多数电子系统中的主要噪声来源 是热噪声,而热噪声是典型的高斯白噪声,因此研究信号和系统仿真时常采用高斯白噪声 来模拟仪器噪声的干扰。每个位置的光谱可添加出5条噪声模拟光谱,与原始近红外光谱组 合,可得到6条原始近红外光谱,由于每个待鉴定印章测量3处不同的位置,因而,每个待鉴 定印章最后获得18条近红外光谱,通过噪声模拟可以检验线性模型和非线性模型的鲁棒 性,其原始近红外光谱和各噪声模拟光谱如图1所示;
[0047] (5)对每个待鉴定印章的最终近红外光谱进行主成分分析,绘制每个待鉴定印章 的主成分得分图,第一主成分-第二主成分的2维主成分得分图如图2所示,第一主成分-第 二主成分-第三主成分的3维主成分得分图如图3所示;
[0048]由图2可知,所有待鉴定印章在第一主成分-第二主成分的2维得分图都可以相互 分辨开;由图3可知,所有待鉴定印章在第一主成分-第二主成分-第三主成分的3维得分图 都可以相互分辨开;
[0049] (6)在4000~lOOOOcnf1内,采用自助拉丁配分法将所有待鉴定印章的近红外光谱 划分为校正集样本和测试集样本,选择配分数为4,取其中3/4作为校正集样本,1/4作为预 测集样本;
[0050] (7)用校正集样本建立线性模型和非线性模型,建立所述线性模型采用偏最小二 乘判别模型,建立所述非线性模型采用支持向量机模型,并用预测集样本进行光谱验证; [0051 ]应用偏最小二乘判别模型时,需要确定最佳主因子数。本实施例中,每次建立偏最 小二乘判别模型前,利用校正集数据进行5折交叉验证,计算出不同主因子数下模型的交叉 验证均方误差,选取最小误差所对应的主因子数作为建模参数,用于构建偏最小二乘判别 模型,从而确保每次建模都可以在最优的参数下进行,最后用所划分的预测集验证模型的 分析性能。
[0052]应用支持向量机模型时,需要确定惩罚函数C和核函数参数g。本实施例中,核函数 采用了高斯径向基核函数,核函数参数选取1,惩罚函数选取20。
[0053]偏最小二乘判别模型和支持向量机模型对印章的鉴别正确率分别为9 7.8 %和 100.0%,这表明,非线性模型的分析性能优于线性模型的分析性能。
[0054] 为了更清楚地表示线性方法和非线性方法的判别结果,这里采用混淆矩阵来描述 模型将某一待鉴定印章被正确判别和错误判别的次数以及被判别为哪一类。偏最小二乘判 别模型的混淆矩阵如表1所示,支持向量机模型的混淆矩阵如表2所示。
[0055] 表1偏最小二乘判别模型的混淆矩阵
[0057]表2支持向量机模型的混淆矩阵
[0059]由表1可知,采用偏最小二乘判别模型待鉴定时,印章Y1共有18条近红外光谱,其 中有16条被正确判别,有2条被错误判别为Y3,其余4个待鉴定印章¥2、¥3、¥4、¥5全部正确判 别。
[0060]由表2可知,采用支持向量机模型,5个待鉴定印章均可以被正确判别。
[00611偏最小二乘判别的原理如下:
[0062]偏最小二乘法首先对光谱矩阵X和性质矩阵Y进行分解,其模型为:
[0065] 上述两式中,T和U分别是光谱矩阵X和性质矩阵Y的得分矩阵,P和Q分别是光谱矩 阵X和性质矩阵Y的载荷矩阵;tk(nXl)是含有η条光谱(样品)的光谱矩阵X的第k个主因子 得分;Pk(nXl)是含有η条光谱(样品)的光谱矩阵X的第k个主因子载荷;u k(nXl)是含有η条 光谱(样品)的性质矩阵Υ的第k个主因子的得分;qk(nXl)是含有η条光谱(样品)的性质矩 阵Υ的第k个主因子的载荷;Ex和Ευ分别是光谱矩阵X和性质矩阵Υ的偏最小二乘拟合残差矩 阵。
[0066] 随后,偏最小二乘法将Τ和U做线性回归:
[0067] U = TB,B=(TtT)_1TtY,
[0068] 在预测时,根据载荷矩阵Ρ求出未知样品光谱矩阵X赖的得分矩阵1??,然后按照 Y#n= I^aBQ求解得到未知样品的性质预测值矩阵妇轴;
[0069] 支持向量机模型的主要思想是建立一个分类超平面作为决策面,使得不同类之间 的隔离边缘最大化,更准确地说,支持向量机是结构风险最小化的近似实现。
[0070] 对于二分类的支持向量机模型,其具体形式如下:假设已知的训练集τ={(χι, yi),···,(xi,yi)} e (χχγ)1,其中Xiex = Rn,yieY= {1 ,-1} (i = l,2,···,1) ;xi为特征向量。 当选取适当的核函数K(Xl,Xj)和适当的惩罚参数C,构造并求解最优化问题:

,这个式子服从于条件 0 S (? S C (i = 1, · · · /D,并得到最优解:α* = ? ' · · Α α『)τ。选取α *的一个正分量 K ct丨S C,并根据这个正分量计算阈值b* = Yj - Σ?=ιΚα? K(Xi-Xj);最后构造决策 函数= + b],并求解出预测值。所采用的核函数为径向基核
[0071]本实施例中所用的支持向量机模型是一对一模式与上述二分类支持向量机的结 合,主要的做法是将任意两类样本之间设计一个二分类支持向量机,因此,k类样本会设计 出k(k-l )/2个支持向量机模型,当对一个未知样本进行分类时,通过模型投票的方式进行 判别,最后得票最多的类别即为该位置样本的类别。
[0072] (8)计算每个待鉴定印章的平均光谱,具体结果如图4所示,采用欧几里德距离表 示出每个待鉴定印章相互之间的相似度;
[0073]欧几里德距离可以表征样本之间的相似度,距离越近,说明待鉴定印章之间的相 似度越高,所属年代等信息越相近。所述的欧几里德距离是在η维空间内两个点之间的真实 距离,反映信号的相似程度。在11维空间内,点口=(口142..4 11)和点9=(91,92...911)两点的 欧几里德距离dPq的计算如下:
[0075]每个待鉴定印章相互之间的欧几里德距离如表3所示。
[0076]表3每个待鉴定印章相互之间的欧几里德距离
[0078] (9)根据欧几里德距离,计算出系统聚类法的Cophenetic相关系数,系统聚类法包 括类平均法、重心法、最长距离法、中间距离法、最短距离法、离差平方和法、可变类平均法。 [0079]各系统聚类法的Cophene t i c相关系数如表4所示。
[0080]表4各系统聚类法的Cophenetic相关系数 [0081]
[0082] Cophenetic相关系数放映了聚类效果的好坏,Cophenetic相关系数越接近于1,说 明聚类效果越好,可通过Cophenetic相关系数对比各种不同的系统聚类方法的聚类效果。 Cophenetic相关系数指的是两两样品间的欧几里德距离y和两样品初次并类时的并类距离 d之间的线性相关系数。
[0084]其中yk是第k对样品之间的欧几里德距离,y是所有样品对的欧几里德距离的平均 值,
;dk是第k对样品之间的并类距离,d为所有样品对中两样品初 次并类时的并类距离的平均值,
[0085]选择Cophenetic相关系数最好的系统聚类法,绘制待鉴定印章的聚类树形图。由 表4可知,类平均法的Cophenetic的相关系数最高,这表明采用类平均法的聚类效果最好, 其对应的聚类树状图如图5所示。
[0086]系统聚类法的基本思想如下:
[0087]聚类开始时将η个样品各自为1类,并规定样品之间的距离和类与类之间的距离, 然后将距离最近的两类合并成一个新类,计算新类和其他类之间的距离,重复进行两个近 类的合并,每次减少一类,直至所有的样品合并为一类。在聚类分析中,通常用G表示类,假 设类G中有m个样品,可用列向量xi(i = l,2,…,m)表示,dij表示样本xi和样本xj之间的距 离,Dkl表示类GK和类Dl之间的距离。类与类之间用不同的方法定义距离,也就产生不同的系 统聚类法,包括了最短距离法、最长距离法、中间距离法、类平均法、离差平方和法(Ward 法)。
[0088]所述类平均法将类与类之间的平方距离定义为样品对之间平方距离的平均值。假 定类Gk和类Dl中分别有nk和nL个样本,Gk和类Dl之间的距离为:
[0091]类平均法很好地利用了所有样品之间的信息,很多情况下被认为是一种比较好的 系统聚类法。
[0092]对于该待鉴定样品中的待鉴定印章,可以通过图5的聚类树状图进行合理的估计 和推断。根据图5的聚类树状图,若将5个印章划分为2类,则可以分为Y4和其他(Y1、Y2、Y3和 Υ5作为一类);若5个印章划分3类,则有Υ1和Υ2为一类,Υ3和Υ5为一类,Υ4单独成一类。现已 考证印章Υ1和Υ2属于明代泰昌年间,Υ5属于明初。而Υ3和Υ4的年代未知。由于印章Υ1和印章 Υ2同为明代泰昌年间,两者就非常接近,并为1类;印章Υ3和印章Υ5被并为一类,说明两者年 代可能接近,Υ5属于明代初期,在缺少文献古籍信息的情况下,可推测Υ3所属年代也可能处 于明代初期前后。Υ4独立成一类,其大致所属年代仍需要更多的印章的信息进行推测。
[0093] 综上,本发明利用近红外光谱法对文本或字画的印章印迹进行鉴定,整个鉴定过 程不需要对待鉴定样品进行前处理,只需对待鉴定印章采集近红外光谱,不破坏待鉴定样 品,具有操作简便、对样品无损、鉴定快速等特点;本发明利用近红外光谱法鉴定印章印迹 的方法,结合聚类分析法,通过计算待鉴定印章和已经考证年代的印章之间的距离或相似 度,进而推断待鉴定印章的所属时代信息;结果表明,该方法鉴定准确度较高。
[0094] 显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对 于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或 变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或 变动仍处于本发明创造的保护范围之中。
【主权项】
1. 一种利用近红外光谱法鉴定印章印迹的方法,其特征在于,包括如下步骤: (1) 将待鉴定样品的每个待鉴定印章至少取3个位置采集近红外光谱,作为待鉴定印章 的原始近红外光谱; (2) 以空气为参考物质,在相同的条件下,对空气采集近红外光谱,作为参考近红外光 谱; (3) 将所述待鉴定印章的原始近红外光谱和所述参考近红外光谱经过傅里叶变换计 算,分别得到所述待鉴定印章的光强度谱18_和参考光强度谱Irrf,按照如下公式:A = -log10 (Isam/Iref)计算每个待鉴定印章不同位置的吸光度,即得所述待鉴定印章的最终近红外光 谱; (4) 根据每个待鉴定印章在待鉴定样品上的位置,对每个待鉴定印章设置类别标签; (5) 对每个待鉴定印章的最终近红外光谱进行主成分分析,绘制每个待鉴定印章的主 成分得分图; (6) 在选定的波数范围内,将所有待鉴定印章的近红外光谱划分为校正集样本和测试 集样本; (7) 用校正集样本建立线性模型和非线性模型,并用预测集样本进行光谱验证; (8) 计算每个待鉴定印章的平均光谱,计算出每个待鉴定印章相互之间的欧几里德距 离; (9) 根据欧几里德距离,计算出系统聚类法中不同聚类准则的Cophenetic相关系数,绘 制所述待鉴定印章的聚类树形图。2. 根据权利要求1所述的利用近红外光谱法鉴定印章印迹的方法,其特征在于,所述待 鉴定样品为文本或字画。3. 根据权利要求1或2所述的利用近红外光谱法鉴定印章印迹的方法,其特征在于,所 述步骤(6)中,所述选定的波数范围为4000~lOOOOcnf 1。4. 根据权利要求1-3任一项所述的利用近红外光谱法鉴定印章印迹的方法,其特征在 于,所述步骤(6)中,所述校正集样本和所述预测集样本的划分采用自助拉丁配分法,选择 配分数为4,取其中3/4作为校正集样本,1/4作为预测集样本。5. 根据权利要求1-4任一项所述的利用近红外光谱法鉴定印章印迹的方法,其特征在 于,所述步骤(4)和所述步骤(5)之间,还包括以下步骤:向待鉴定印章的每条原始近红外光 谱分别添加1 %、2 %、3 %、4 %、5 %的高斯白噪声,所述高斯白噪声的均值为0、方差为0.01。6. 根据权利要求1-5任一项所述的利用近红外光谱法鉴定印章印迹的方法,其特征在 于, 所述步骤(7)中,建立所述线性模型采用偏最小二乘判别模型,建立所述非线性模型采 用支持向量机模型。7. 根据权利要求1-6任一项所述的利用近红外光谱法鉴定印章印迹的方法,其特征在 于, 所述步骤(8)中,每个所述待鉴定印章相互之间的相似度采用欧几里德距离表示。8. 根据权利要求7所述的利用近红外光谱法鉴定印章印迹的方法,其特征在于,所述系 统聚类法的聚类准则选自类平均法、重心法、最长距离法、中间距离法、最短距离法、离差平 方和法、可变类平均法中的至少一种。9. 根据权利要求1-8任一项所述的利用近红外光谱法鉴定印章印迹的方法,其特征在 于, 所述步骤(9)中,所述待鉴定印章的聚类树形图的绘制采用类平均法。10. 权利要求1-9任一项所述的方法在印章印迹鉴定中的应用。
【文档编号】G01N21/359GK106092956SQ201610370963
【公开日】2016年11月9日
【申请日】2016年5月30日
【发明人】张卓勇, 陈泽炜, 张欣
【申请人】首都师范大学, 北京远大恒通科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1