一种基于多光谱的物质识别方法与流程

文档序号:16630672发布日期:2019-01-16 06:32阅读:465来源:国知局

本发明涉及物质识别技术领域,尤其是一种基于多光谱的物质识别方法。



背景技术:

目前针对伪造文书、古籍文件等进行识别鉴定时,多通过专家肉眼观察、笔迹鉴定等方式,但这些鉴定方式的准确性较低,严重地影响了对伪造文书、古籍文件等准确识别。



技术实现要素:

本发明提供一种基于多光谱的物质识别方法,能够通过对物质多光谱图像的采集处理,提高鉴别效果。

为实现上述目的,本发明的技术方案如下:

一种基于多光谱的物质识别方法,包括:

标准样本特征建立,采集所收集到的标准样本的多光谱图像,并提取多光谱图像的特征;

待检样本的图像采集,采集到待检样本的多光谱图像,其光谱波长与标准样本特征建立时的波长相同;

对上述采集到的待检样本进行处理,提取出待检样本的图像特征,该图像特征的类别与标准样本相同;

物质识别,通过标准样本特征与待检样本特征的比较,判断待检样品具备哪些属性。

在其中一实施例中,标准样本特征建立包括标准样本数据收集、标准样本图像采集、标准样本的图像特征提取,其中标准样本数据收集时分别标注每个样本的属性。

在其中一实施例中,标准样本特征建立时,在标准样本的图像特征提取后,还包括标准样本库的分类与建库,建立标准样本的属性数据库。

在其中一实施例中,待检样本的图像采集时,控制待检样本和标准样本的收集环境类似,或/和通过摄像机补光单元进行弥补。

在其中一实施例中,对上述采集到的待检样本进行处理,在提取图像特征时,还包括图像标准化,使得待检样本与标准样本的尺寸、亮度一致。

在其中一实施例中,物质识别采用基于样本距离的方式,每一类光谱得到多个距离,分别对应不同属性;对每一个光谱图像的每一个属性,取其中k个最靠前的结果,且赋予这k个结果排序不同的权值,越靠前权值越大,每一次比较的排名都乘以一个权值,最终的得分等于所有光谱图像比较结果中前k个排名中出现了结果的加和,即其中,dij表示光谱mi的排序j的距离,ej为排序j的权值,最终待测样本的属性的判定结果为对应的最大分值的类别。

在其中一实施例中,物质识别采用基于属性识别的方式,识别待检样品的属性。

在其中一实施例中,物质识别:多光谱图像融合,以获得特征向量或图片;模型训练,输入特征向量或图片,输出识别或者分类的结果;目标识别,最终判断样本具备哪些属性。

在其中一实施例中,物质识别采用“手工特征提取+传统机器学习方法”的方法,其中多光谱图像融合采用前向融合,包括:设提取到的图像特征用f来表示,其中f=[f1,f2,…,fn]表示提取到的一个光谱图像特征,将所有光谱的特征排成一个矩阵,ff(i,j)=[f1,f2,…,fj]t,利用空间投射或者降维方法对ff矩阵进行降维和特征值提取,取降维后的特征用来进行模型训练。

在其中一实施例中,物质识别采用深度学习的方法,其中多光谱图像融合采用后向融合,包括每一个图像经过卷积神经网络的运算后,得到一类比对结果,所有的光谱都比对一遍,将出现次数最多的结果作为最终比对结果。

本发明的有益效果是:本发明基于多光谱的物质识别方法通过物质的多光谱图像特征来识别物质,在鉴别文件写作(打印)时间、签名真假等检测时,分析和鉴别准确率高,并且操作十分简单,经济。

具体实施方式

下面结合实例,对本发明做进一步说明。

本实施例基于多光谱的物质识别方法,是根据不同的化学成分在光谱上表现出不同的光谱信息,从物质的多光谱数据中选取不同波长的图像,这些图像分别对应突出了不同的化学材料,从而可以从这些图像上方便鉴定各种墨水、颜料(印章印油)、纸张或者其他材料。通过将这些材料的光谱信息与同时期同品种材料的光谱信息进行比较,就可以鉴定出文书或古籍文件的真伪。而如果有各材料的光谱数据库,则还可以将观测到的光谱信息和已知材料的光谱数据库信息对比,更可以鉴定文书文件产出的品牌、产地、年代等信息。

具体而言,本实施例基于多光谱的物质识别方法可以包括如下步骤。

步骤s1,标准样本特征建立。这一步骤具体实施时根据应用的不同进行收集,下面进行详细阐述。

步骤s11,样本数据的收集:根据任务的不同进行收集,例如要鉴别文书材料的一致性等,可以设计从墨水、纸张等方面进行多层识别,在收集材料时,分别对每个样本进行标注,内容包括:材料a的书写年份,使用的墨水品牌等,用y来表示对每一份材料的标注,其中y=[y1,y2,…,yn],yn表示每一个对应的属性取值。

步骤s12,样本图像的采集:采集每一份样本的光谱图像,基于多光谱摄像头对样本进行拍摄取样(使用的光谱波长可选择300纳米、500纳米、700纳米等多种),如此每一种光谱可采集一副图像,将其设为m,其中m=[m1,m2,m3,…,mn],mn为某个光谱图像;

步骤s13,标准样本的图像特征提取:由于是基于图像的特征比对来实现鉴别或识别,因此,提取每一个光谱图像的特征,这些特征可以根据使用场景选择:边缘特征,hog柱状图,gabor小波,haar小波,sift特征等等;

步骤s14,标准样本库的分类与建库:与rgb,灰度或者深度图像等不同,对于每一个目标都有n种不同光谱图像进行描述,以文书材料的识别为例,首先对于某一类文书材料,收集了很多样本,其次的目的是从墨水材质、书写时间、纸张年代等方面进行分析,然而,收集的样本中,可能会存在纸张材质一致,但是书写笔墨不一致;或者书写笔墨一致,而纸张材质不一样的样本。如果以每一类样本作为主体来描述,会存在很多不同的组合,样本的描述不清晰,使得后续数据处理过程更复杂;因此,本实施例从更细粒度的样本属性(如墨水材质、书写时间、纸张年代)进行分类建库。

步骤s2,待检样本的图像采集。如果能控制待检样本和标准样本在同一光源环境中收集,会简化后期的数据处理过程,有利于提高识别精度。然而做到这一点难度比较大,从几方面进行改善:1)尽可能的沿用和标准样本收集类似的环境;2)通过摄像机补光单元进行弥补。

步骤s3,对待检样本的图像进行处理。可包括如下步骤:

步骤s31,图像标准化:首先样本尺寸和标准样本库的一致,其次通过亮度归一化(其中亮度是像素点r,g,b三色的平均值)和对比度调整算法(平均亮度*对比度系数)对图像进行归一化。其中亮度归一化的操作是:将每个像素点减去图像的平均亮度,对比度调整是通过乘以对比度系数进行调节。

步骤s32,待检图像特征的提取,这个过程同标准样本的处理过程。

步骤s4,物质识别。本实例提供两种识别方式:基于样本距离与基于属性识别,下面分别进行叙述。

首先介绍基于样本距离的鉴别过程。鉴别过程实际上就是在标准样本中寻找和待检样本最相近的样本。可以采用如下方法:

步骤s411,基于样本特征的距离进行比较:数学上的距离有很多表示方法,例如欧式距离,余弦距离等等,其中欧式距离为:

步骤s412,以文书材料的识别为例,每一类光谱可以得到三个距离,分别是笔墨材质,纸张年代和纸张材质,当然对于不同任务,可能还有更多的其他描述,这里每一类光谱的距离比较结果为:r=[r1,r2,r3];

步骤s413,对于每一个属性r1-r3,如果只取一个距离最近的结果,容易受到采集过程的干扰,导致比对结果的置信度较低,因此,这里借用k-nn的思路,但不完全是k-nn方法,每一个光谱图像的每一个属性,例如r1,r2,r3,都取k个最相近的距离,例如:光谱图像mi的纸张年代比较结果(r2),取{d1,d2,…,dk}个最靠前的结果,不同于k-nn方法,赋予这k个排序结果不同的权值,距离越相近(排序越靠前),取得的权值越大,假设取的权值系数为:{e1,e2,…,ek},最终将所有的光谱图像与该属性相关的距离比较结果的加权:

其中,dij表示光谱mi的排序j的距离,ej为排序j的权值。最终待测样本的r2属性的判定结果为:对应的最大分值的类别。例如,待测样本的r2属性(纸张年代)对应2015年的分值最大,那么判定结果为:待测样本的纸张年代为2015年。

基于属性识别的鉴别过程,可以采用“手工特征提取+传统机器学习方法”的方法进行进一步的鉴定,也可以基于深度学习方法进行辨别,这些方法都是相对比较成熟的。然而,由于有多种不同光谱图像来描述目标,处理过程会有所不一样。最终的识别结果是多种光谱图像的融合结果。

步骤s421,多光谱图像的融合

图像融合有两种分类方法,一种是前向融合,即在图像比对前先进行融合,另一是后向融合,即每一个图像用来得到一个比对结果,最后将比对结果进行融合。

“手工特征提取+传统机器学习方法”的方法采用前向融合,具体实现时,本方案设提取到的图像特征用f来表示,其中f=[f1,f2,…,fn]表示提取到的一个光谱图像特征,将所有光谱的特征排成一个矩阵,ff(i,j)=[f1,f2,…,fj]t,利用空间投射或者降维方法(pca,lda)等对ff矩阵进行降维和特征值提取,取降维后的特征输入给传统的机器学习模型,进行训练;这里,手工提取的图像特征可以是:二值化图像的边缘特征,hog柱状图特征,haar小波特征,sift特征点等等;机器学习算法可以是:svm,神经网络,决策树等等;

对于深度学习方法,采用后向融合方法,每一个图像经过卷积神经网络的运算后,得到一类比对结果,所有的光谱都比对一遍,将出现次数最多的结果作为最终比对结果;这里,深度学习网络可以通过迁移学习或者自己设计并逐步迭代拟合得到;

步骤s422,模型训练:“手工特征提取+传统机器学习方法”的输入是提取的特征向量,“深度学习”的输入是图片;输出就是识别或者分类的结果。关于模型的训练,由于采用更细粒化的特征来描述样本,因此,样本的标注是针对它的每一个属性;训练过程依赖于选择了多少个样本属性y=[y1,y2,…,yn],每一个yn都需要训练一个分类模型;

步骤s423,目标识别:综上,最终的识别结果是以样本属性来描述的,例如:该样本具备什么样的y1属性,什么样的y2属性,…,什么样的yn属性。以上述纸张为例,某纸张样本可能判断为具备2015年的生产年代,2017年的书写墨水时间,英雄品牌的墨水材质等等。

本发明基于多光谱的物质识别方法通过物质的多光谱图像特征来识别物质,在鉴别文件写作(打印)时间、签名真假等检测时,分析和鉴别最高准确率达99%以上,并且操作十分简单,经济。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1