基于红外光谱检测技术的纺织品分类识别方法与流程

文档序号:21369113发布日期:2020-07-04 04:45阅读:547来源:国知局
基于红外光谱检测技术的纺织品分类识别方法与流程
本发明涉及纺织品检测识别
技术领域
,尤其是涉及一种基于红外光谱检测技术的纺织品分类识别方法。
背景技术
:不同物质的分子结构不同,其近红外光谱也不同。采用模式识别方法,根据样品近红外光谱特征差异,可以实现样品分类与判别,主要依靠化学信息上的差异。红外光谱判别分析过程包括光谱预处理,特征提取和模式识别等步骤,通过比较待测样品到已知不同类别样品的光谱距离进行分类识别。对于在光谱上具有明显差异的不同类样品,红外光谱检测识别方法是有效的,已被广泛用于诸多领域。但是,对于纺织品中化学组成极其接近的不同类样品,其光谱间差异较小。纺织品样品形态或环境因素变化会产生较大的光谱测量误差,对不同类样品近红外光谱中化学信息差异具有湮灭作用,使用现有判别方法,难以获得满意效果。例如,羊绒与羊毛都是蛋白纤维,它们在化学组成上都非常相似,其近红外光谱差异也很小。由于实际纺织品的多样性和复杂性,不同类样品在捻度、质地结构、染整工艺等方面的差异都很明显,由此产生的噪声对其有用的光谱差异信息具有严重的淹没作用。将常用的微分、多元散射校正(msc)或者标准正态变换(snv)等光谱预处理方法、主成分分析(pca)、簇类独立软模式识别(simca)、偏最小二乘判别分析法(pls-da)、支持向量机(svm)等用于这类样品,分类效果满足往往不了实际要求,难以实现山羊绒纺织品和山羊绒羊毛混纺纺织品有效分类。因此,目前传统的红外光谱分析手段对于纺织品中成分复杂、组成高度相似的不同类样品不能有效识别和分类。技术实现要素:本发明的目的是提供一种基于红外光谱检测技术的纺织品分类识别方法,解决传统的红外光谱检测手段对于纺织品中成分复杂、组成高度相似的不同类样品不能有效识别和分类的技术问题。为了达到上述目的,本发明提供如下技术方案:基于红外光谱检测技术的纺织品分类识别方法,包括如下步骤:s1、首先将不同类纺织品样品干燥后进行吸潮,并在吸潮过程中的不同时期,得到不同含水量的子样品;s2、采集所有样品子样品的近红外光谱;s3、对每个样品子样品近红外光谱进行二维相关光谱分析,得到同步二维相关光谱图和异步二维相关光谱图,将同步二维相关光谱图和异步二维相关光谱图融合,构造混合二维相关光谱图;s4、使用googlenet深度人工神经网络图像识别模型结合迁移学习方法,由s3的得到的所有样品光谱图像,建立图像分类模型,实现对不同类纺织样品的分类与识别。进一步地,s4中,仅对googlenet网络最后4层结构进行训练,并且保留其它层结构不变。进一步地,s4中,对googlenet图像识别模型的迁移学习过程中,第141dropout层的输入元素以65%的概率随机设置为零,以防止过拟合。进一步地,s4中,对googlenet图像识别模型的迁移学习过程中,第142全链接层和第144分类输出层包含了将网络提取的特征组合为类概率、损失值和预测类别的信息,调整全连接层的滤波数量和分类层的分类数等于当前光谱图像的种类数,同时增大全连接层的学习率因子以获得更快的学习速率。本发明的基于红外光谱检测技术的纺织品分类识别方法,提出一种通过构造光谱图像,采用基于深度学习的googlenet图像模型,结合迁移学习算法,对近红外光谱差异小的不同类纺织品进行分类与识别的方法。深度人工神经网络通常需要使用大数据样本进行训练,而红外光谱分析中的样品数量(一般少于一千)通常属于小样本数据,难以满足其训练要求。因此,本发明提出将googlenet已有的图像识别模型(在1000多类图像大数据库中学习到的特征提取能力)向光谱图像数据识别迁移。使用小样本的光谱图像数仅对googlenet网络最后4层全链接层结构进行训练,并且保留其它层结构不变,使迁移后的googlenet适应当前的特定任务,从而实现化学组成高度相近且形态复杂的不同类样品的红外光谱识别。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为羊绒纺织品近红外光谱;图2为羊绒-羊毛混纺织物近红外光谱;图3为纯棉纺织品近红外光谱;图4为丝光棉纺织品近红外光谱;图5为光谱图;其中,a1-d1为同步二维相关光谱图;a2-d2为异步二维相关光谱图;a3-d3为同步二维相关光谱图和异步二维相关光谱图的融合图谱;图6为googlenet网络结构图;图7为山羊绒纺织品与山羊绒+羊毛混纺及纯羊毛纺织品分类模型的训练和验证过程;图8为纯棉纺织品与丝光棉分类模型的训练和验证过程;图9为本发明实施例的识别方法流程图。具体实施方式下面将结合本发明的附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明的基于红外光谱检测技术的纺织品分类识别方法,包括如下步骤:s1、首先将不同类纺织品样品干燥后进行吸潮,并在吸潮过程中的不同时期,得到不同含水量的子样品;s2、采集所有样品子样品的近红外光谱;s3、对每个样品子样品近红外光谱进行二维相关光谱分析,得到同步二维相关光谱图和异步二维相关光谱图,将同步二维相关光谱图和异步二维相关光谱图融合,构造了一种混合二维相关光谱图;s4、使用googlenet图像识别模型结合迁移学习方法,由s3中不同类样品的光谱图像获得图像分类模型,实现对不同类样品的分类与识别。对于化学组成高度相近的不同类样品,如羊绒纺织品与羊毛纺织品,其近红外光谱差异较小,而且也容易受样品形态和环境等因素影响,因此,仅依靠处于“静止”状态样品光谱所包含的信息量和特征,不足以将它们区分开来。基于羊绒和羊毛纤维在吸水性上存在着差异现象,对样品施加外部(水分)变化扰动,采集其随外部扰动产生的系列“动态”光谱。这些不同类样本在组成上的微小差异及在物理结构上的差异,它们与水分子作用程度也不同,获得相应的动态光谱也有不同。本发明使用两个组分高度相近的不同类样品分类与识别案例为研究对象:(1)山羊绒纺织品与山羊绒-羊毛混纺及纯羊毛纺织品的识别,(2)纯棉纺织品和丝光棉纺织品的识别。从中国几个省份的纺织品生产企业和市场共收集了234个纺织品实际样品。其中,64个为山羊绒,20个纯羊毛,50个山羊绒+羊毛混纺(羊毛含量为51.5%-96.2%(w/w)),50个纯棉和50个丝光棉。它们在厚度,颜色和质地(机织或针织)上各不相同。每个样品的类别由显微镜分析法确定。其中,混纺样品中羊毛含量采用国标方法gbt2910.4-2009测得。根据样品的近红外光谱,采用kennard-stone方法对每类样品分集,其中训练集占80%,剩余样品作为验证模型判别能力的测试集,具体结果如表1所示。表1纺织品样品总数训练集测试集山羊绒645113羊绒-羊毛混纺705614纯棉504010丝光棉504010首先将样品在105℃真空烘箱中连续烘干3小时得到干燥样品,然后把干燥样品放入相对湿度(rh)100%、恒温20℃的密室中,样品进行吸潮。在不同吸附时间取出样品,制备不同含水量的样品。采用精确度为0.1mg的分析天平对样品称重,并根据公式1在标准条件(25℃和rh65%)下测定样品的回潮率(含水量):回潮率=(wc-wd)/wd*100%………………式(1)其中wc和wd分别是样品吸水后的重量和干重。根据国标gb/t9994-2018,样品的最大回潮率设定为16.3%。每个样品制备了4个不同的含水量,包括0、5.4、11.2和16.3(%,w/w),共得到936个不同含水量的样品。光谱采集使用配备有积分球附件的nicoletantarisiift-nir光谱仪在恒温恒湿的条件下采集样品的漫反射近红外光谱。内置的金箔用于采集背景光谱。把每块大小约0.5m2的样品折叠成4-6层,然后直接放置在积分球的窗口上并用铁块压住使其与窗口表面紧密接触,光谱采集的参数为:分辨率4cm-1,扫描数32,光谱范围10,000-4000cm-1。每次光谱采集大约需要1分钟,每个样品重复采集3张光谱,计算平均光谱作为该样品光谱。本发明对样品施加一种外部的水分扰动,以期扩大不同类样本的差异信息。以烘干样品为基础,分别制备了水分含量为5.4%、11.2%、16.3%的样品,并同步采集其近红外光谱。从每类样品中随机选一个样品,它们在不同水含量下的“动态”光谱如图1-4所示。可以看出,与干燥样品相比,潮湿样品的近红外光谱图中均出现了两个较宽的水峰。其中,7100-6800cm-1波段归属于ν1+ν3band(ν1是对称伸缩,ν3属于非对称伸缩模式),吸光度变化最大的5150-4950cm-1波段归属于ν2+ν3band(ν2是弯曲振动模式)。根据文献,ν2+ν3波段可以反映潮湿纺织品基体中氢键的状态,包含样品吸水模式的丰富信息。由此可见,水分扰动显著地增加了光谱数据量和信息量,放大了不同类样品之间的近红外光谱差异。混合二维相关光谱图二维相关光谱分析是一种提取扰动光谱变化信息的有力方法,广泛用于分析复杂体系。为此,对不同类纺织品的水分扰动光谱进行二维相关分析,得到它们同步(synchronous)二维相关光谱图(图5a1-d1)和异步(asynchronous)二维相关光谱图(图5a2-d2)。可以看出,同步二维相关光谱图是关于主对角线对称,反映了与水分扰动同相位的光谱变化信息。异步二维相关光谱图是关于主对角线反对称的,反映了与水分扰动有相位差(asynchronous)的光谱变化信息。可以看出,在视觉上,与近红外光谱相比,二维相关光谱图更加明显地反映了组成高度相近的不同纺织品的光谱信息差异。由于二维相关光谱图具有对称性,表明synchronous2dcos图(图5a1-d1)和asynchronous2dcs图(图5a2-d2)存在着冗余信息。为此,对同一个样品,取其synchronous2dcs主对角线上半部分和asynchronous2dcs主对角线下半部分,合成一张既反映同步相关变化,又包含异步相关变化的光谱化学信息图像,如图5a3至图5d3所示。可以看出,与近红外光谱图像相比,在视觉上,光谱图像能更直观地和更明显地反映山羊绒与山羊绒-羊毛混纺及纯羊毛纺织品的光谱差异。从信息量角度看,上述光谱图像数据更有利于组成高度相似样品的分类鉴别。但是,常用的光谱(向量)模式识别方法,并不适合直接处理光谱图像(矩阵)数据。近年来,基于深度卷积神经网络的图像识别方法研究方兴未艾。其中,googlenet是一种代表性的深度卷积神经网络架构,其图像识别模型涵盖了1000种类型实际图像,是当前最为成熟的深度学习图像识别方法之一。googlenet图像识别模型通过大数据训练获得的,而这里纺织品样品数量属于小样本,不足以完成对googlenet网络的训练。因此,本文提出通过迁移学习方法将googlenet图像识别模型进行迁移,使其适合组成高度相近不同类纺织品光谱图像的分类与识别。根据迁移学习理论,对最后4层网络参数进行了微调并使用新数据重新训练,如图6所示。其中第141dropout层的输入元素随机设置为零,以防止过拟合。将随机概率调整为65%。第142全链接层和第144分类输出层包含了将网络提取的特征组合为类概率、损失值和预测类别的信息。调整全连接层的滤波数量和分类层的分类数等于当前光谱图像的种类数2,同时增大全连接层的学习率因子(learningratefactor)以获得更快的学习速率。因为sigmoid激活函数比softmax激活函数更适用于二分类问题,故在output层前采用sigmoid激活函数。需要注意的是,googlenetimageinput层限定了输入图像的大小为224*224*3pixels,因此,在输入训练模型前,把光谱图像转化为对应大小的rgb(red-green-blue)三色域图像。构造混合二维相关光谱图对任何一个样本施加水分扰动,即逐步增加样品含水量。每次改变水含量时采集一张近红外光谱x。对应于m个不同水含量采集的系列动态光谱构成光谱矩阵xm*n,其中n表示波长点数。通过对xm*n进行二维相关分析处理,分别得到一张同步二维相关光谱图φ和一张异步二维相关光谱图ψ,其计算公式如下:其中,为动态光谱,是原始光谱x与参考光谱的差值,通常采用原始光谱的平均光谱作为参考光谱。n为hilbert-noda矩阵,计算公式如下:i和j分别为和的阶数。由于同步图和异步图分别关于主对角线对称和反对称,即含有一半冗余信息。同步图和异步图的维数相同。为此,提取同步图的上三角部分和异步图的下三角部分拼成一张融合的二维相关光谱图(fusionmap),得到该样品消除冗余信息后的化学信息图像,在维数上与同步图或异步图相同。需要注意的是,同步图的主对角线数据(通常称为功率谱)是有物理意义的,因此,它被保留在了融合相关图中,异步图主对角线上的数据是无物理意义的,因而被舍弃。googlenet模型迁移及训练(fine-tuning)googlenet通过前面部分的深度卷积层向图像数据学习,自动提取图像分类特征,输出分类特征(一维向量),然后被输入至后面全连接的神经元进行计算,随后由分类层通过sigmoid函数计算样品归属于每一类的概率,最后输出最终的判别结果。目前googlenet深度卷积层已经通过1000类真实图像大数据库学习获得了非常优秀的图像特征提取能力(即权重),本文提出保留它的深度卷积层不动,使用小样本光谱图像数据只对后面的全连接层和分类层部分进行训练。其中,调整全连接层的滤波数量和分类层分类数等于当前光谱图像的种类数。连接层和分类层的权重可采用反向传播算法通过迭代过程学习确定。目标函数为采用均方误差(mse)的最小化损失函数,采用l2范数进行正则化,公式如下:其中,全连接层的激活函数为relu函数,采用批量标准化(bn)加速再训练过程,反向传播算法结合sgdm优化器发现局部最小值,避免过模型拟合。模型评价指标为验证正确率,即:rc=na/nt×100%…………………式(7)其中,na和nt分别是正确识别个数和验证样品总个数。神经网络训练过程需要设置各种超参数(ultra-parameters)。其中,initiallearnrate指定了在损失函数的负梯度方向上的初始步长,minibatchsize是在每次迭代中使用的训练集子集的大小,maxepochs表示用于训练的最大epoch数。目前还没有调节神经网络超参数的通用规则。本研究中,通过trial-and-error方法确定了这些超参数,initiallearnrate,1e-4,minibatchsize,15,maxepochs,20。使用训练集样品训练模型,然后通过用fine-tunedgooglenet模型预测验证集样品来评估模型的性能。山羊绒纺织品与山羊绒+羊毛混纺及纯羊毛纺织品,和棉纺织品与丝光棉纺织分类模型的训练和验证过程分别如图7和8所示,随着epoch增大,训练集交互验证正确率不断上升,10个epoch后稳定在90%左右;而损失函数的误差值不断减小。经过20个epoch的迭代训练后,在验证集上,山羊绒纺织品与山羊绒+羊毛混纺及纯羊毛纺织品的判别正确率为92.59%,棉-丝光棉纺织品的正确率为94.62%,如图9所示,具有了实际应用的价值。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1