一种快速无损判别区分软玉产地的方法与流程

文档序号:15440238发布日期:2018-09-14 22:42阅读:184来源:国知局

本发明涉及一种宝玉石产地鉴定的方法,具体地,涉及一种快速、无损测量样品的拉曼光谱信号和支持向量机多类判别模型,以定性判别区分多产地软玉的方法。



背景技术:

软玉是应用最多和最广泛发掘的玉料之一,承载着中华古老的文明,软玉的产地主要分布在我国新疆、甘肃、青海等地。不同产地的软玉的品质以及价格具有很大的差异,因此对软玉产地进行快速无损的鉴别不但具有重大的考古意义,也具有重要的市场经济应用价值。而对于同一种类的宝玉石而言,其物理性质和光学性质往往极为相似,难以通过常规检测仪器和方法进行无损和快速的产地判别区分。

近年来现代检测技术开始被应用于玉石产地的研究中。目前激光诱导击穿光谱技术,x射线衍射技术等虽然被应用于玉石产地鉴定,但对于玉石样品都属于有损或微损测量。而拉曼光谱技术应用于玉石产地鉴定,没有形成系统的多产地鉴定方法。

经检索,中国发明专利:一种定量判别软玉产地的方法,申请号:201510659192.1,其包括:步骤1)制备已知产地的软玉样品;2)定量测试样品的微量元素含量,将测试点分为“训练组”和“测试组”;3)对微量元素含量进行显著性水平分析,以检验不同产地间是否存在统计差异;4)利用二元迭代线性判别分析法(iblda)对“训练组”数据进行两两判别,并用“测试组”检验该方法的可行性;5)用iblda预测“待测样品”的产地。该发明基于微量元素的二元迭代线性判别分析定量判别软玉产地。上述专利需要制备样品,定量测试方法为激光剥蚀电感耦合等离子质谱、激光诱导击穿光谱、辉光放电质谱、外束质子激发、二次离子质谱、x荧光光谱分析法中的一种或多种,操作复杂,时间周期长。



技术实现要素:

针对现有技术中的缺陷,本发明的目的是提供一种快速、无损的同时定性判别区分多产地软玉的方法,相较于传统的每次只能做二类判别区分的线性判别方法,将多个产地的软玉样本进行判别区分,不仅实现了多产地软玉的快速、无损、同时判别区分,而且具有较高的分类准确率。

本发明目的通过下述技术方案实现:

一种快速无损判别区分软玉产地的方法,其步骤为:

1)已知产地的软玉样品的拉曼光谱采集:

选取已知确切产地来源的软玉样品,其中产地数记为n,分别对每个产地的软玉样品进行拉曼光谱信号采集,采集的拉曼光谱数据总组数为m,保证激光功率和积分时间一致;

2)对上述采集的原始光谱数据进行预处理:

对测得的软玉原始拉曼光谱进行降低光谱数据中的噪声信号和荧光背景的光谱数据预处理,即基线校正、曲线平滑、归一化以及均值化处理,得到平均拉曼光谱;

3)将预处理完的数据分成训练集和预测集:

随机从测得的m组拉曼光谱数据中抽取p组作为训练集数据,剩下的q=m-p组数据作为测试集数据;

4)利用训练集数据建立支持向量机多分类模型:

已知p组软玉光谱数据来自n种产地,每种产地的光谱数据组数为pi,i=1,2,3,…,n,即

p1+p2+p3+…+pn=p(1)

根据它们的拉曼光谱数据,选取特征峰,得到处理后的拉曼光谱特征强度矩阵x:

其中:p表示光谱数据组数,y表示选取特征峰的数量,xi1,xi2,…,xiy表示第i个玉石样品光谱数据的各特征峰强度;

采用支持向量机方法建立模型进行定标,对这p组训练集数据按原产地两两分类;

先将来自第一个原产地的样品视作一类,剩下n-1个原产地的样品视作另一类;对于这两类样品,采用支持向量机方法,即找到一个y维的向量ω和一个常数b,选取特征值+1,使得第一个产地的每个玉石样品数据i的特征向量均满足

且存在样品使得等号成立,即第一个产地的某个玉石样品i*的特征向量满足:

另一类选取特征值-1,其中的每个玉石样品j的特征向量均满足:

且存在样品使得等号成立,即另一类中的某个玉石样品j*的特征向量满足:

这样两类样品就被一个线性平面ωtx+b=0分隔开了,且间隔距离为其中||ω||表示向量ω的模值;满足上述条件的向量ω和常数b不止一组,取其中||ω||最小,也就是使两类样品之间的间隔距离最大的那组(ω1*,b1*),作为划分第一个产地和剩下n-1个产地的玉石样品的最佳方式;

划分出第一个产地的玉石样品后,再将第二个产地的样品视作一类,剩下n-2个产地的样品视作第二类,采用上述方式进行划分,记录对应的(ω2*,b2*);依上述选择特征向量确定特征平面的方法类推,建立支持向量机多分类模型,直至最终划分出所有产地的样品;

5)采用上述支持向量机多分类模型快速无损地进行判别区分软玉产地。

优选地,对于原产地未知的玉石样品进行判别区分,具体如下:

对待判别区分的玉石样品重复步骤1)和步骤2),得到待判别区分样品的平均拉曼光谱的特征强度矩阵,利用步骤4)已经建立的支持向量机多分类模型对拉曼光谱进行判断,得出预测产地。

优选地,所述步骤4)中,对于利用svm处理线性不可分的情况,svm的处理方法是:选择一个核函数,通过将数据映射到高维空间,来解决在原始空间中线性不可分的问题。

优选地,在所述步骤5)之前,可以进一步利用测试集数据验证步骤4)得到的支持向量机多分类模型的分类准确率,具体如下:

根据测试集数据得到q组数据的特征值矩阵x,针对每个支持向量机多分类模型,代入特征值矩阵,检测支持向量机多分类模型的预测结果,将预测结果和实际结果对比,以此来验证模型最终的分类效果,测试建立的支持向量机多分类模型的可靠性。

与现有技术相比,本发明具有如下的有益效果:

本发明是一种基于拉曼光谱技术结合支持向量机的同时判别区分多产地软玉的方法,相较于目前已有的传统肉眼鉴别软玉产地、定性线性判别软玉产地以及有损的定量线性判别软玉产地方法,有很大的优势。

具体的,本发明方法利用拉曼光谱技术实现对软玉拉曼光谱信息的采集,相较于别的分析方法,这是一种快速、无损的检测技术,既能够保证玉石的完整性,又保证了鉴别方法的科学性。

具体的,本发明方法采用一种机器学习的训练算法——支持向量机,在处理高维光谱数据时可以有效解决各个特征向量之间的相关性,同时在处理大样本量的数据时具有快速、准确的优势。

具体的,本发明方法在建模过程中通过逐步增加软玉的种类,建立多个分类模型,不断的利用测试集数据去验证每个模型的判别区分结果,均有很好的分类准确率,有力地证明了利用拉曼光谱技术结合支持向量机方法建立的模型可以实现多类软玉的同时判别区分。

因此,本发明可将多个产地混合的软玉样本进行判别区分,不仅实现了多产地软玉的快速、无损、同时判别区分,而且具有较高的分类准确率。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1为本发明实施例中5个产地软玉测得的原始拉曼光谱图;

图2为本发明实施例中经过预处理后5个产地软玉的平均拉曼光谱图;

图3为本发明实施例中新疆和田软玉、甘肃软玉、青海软玉预测集样本通过三类判别区分模型预测后的预测结果;

图4为本发明实施例中新疆和田软玉、甘肃软玉、青海软玉以及台湾软玉预测集样本通过四类判别区分模型预测后的预测结果;

图5为本发明实施例中新疆和田软玉、甘肃软玉、青海软玉、台湾软玉以及韩国软玉预测集样本通过五类判别区分模型预测后的预测结果。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。

本发明提出一种利用拉曼光谱结合支持向量机算法的方法实现快速、无损的同时定性判别区分多产地软玉,既能够保证玉石的完整性,又保证了鉴别方法的科学性。

以下提供上述方法的具体实施例:

⑴样品收集和拉曼光谱采集

本实施例收集了四种不同产地的软玉样本,如图1所示,分别为新疆和田软玉20块、台湾软玉5块、韩国软玉10块、甘肃软玉9块、青海软玉8块。实验过程中无需制样,可直接检测。

测试条件为:激光输出功率设定为200mw,积分时间10~15s。每块样品取两点进行测试,每点采集两组数据。同时,为了避免杂散光对结果的影响,进行遮光测量,以保证测试条件的均一性和一致性。得到甘肃软玉14组,青海软玉12组,新疆和田玉34组、台湾软玉16、韩国软玉20组,共96组原始拉曼光谱数据,如图1所示。

⑵数据预处理

由激光拉曼光谱分析技术本身的特点可知,由于激发光强的漂移、ccd检测器热稳定噪声以及检测的玉石本身通常具有较强的荧光背景等原因,通过拉曼光谱仪直接获得的光谱数据,往往包含噪声等干扰因素,不能直接应用于数据的分析处理。

为了得到可靠、有效的数据信息,需要对得到的光谱数据进行一系列预处理,包括基线校正、曲线平滑、面积归一化。为了更加直观更清楚的了解每个产地软玉的拉曼光谱特点,将测得的五种产地软玉的拉曼光谱做一个均值化处理,得到平均拉曼光谱,如图2所示。

⑶把预处理后的拉曼数据分为训练集和预测集

本实施例随机从96组的拉曼光谱数据中取73组数据作为训练集数据,其中新疆软玉拉曼数据24组,甘肃软玉拉曼数据10组,青海软玉拉曼数据9组,台湾软玉数据12组,韩国软玉数据16组;余下的23组作为预测集数据。

已知p组软玉光谱数据来自n种产地,每种产地的光谱数据组数为pi,i=1,2,3,…,n,即

p1+p2+p3+…+pn=p(1)

根据它们的拉曼光谱数据,选取特征峰,得到处理后的拉曼光谱特征强度矩阵x:

其中:p表示光谱数据组数,y表示选取特征峰的数量,xi1,xi2,…,xiy表示第i个玉石样品光谱数据的各特征峰强度;

采用支持向量机方法建立模型进行定标,对这p组训练集数据按原产地两两分类;

先将来自第一个原产地的样品视作一类,剩下n-1个原产地的样品视作另一类;对于这两类样品,采用支持向量机方法,即找到一个y维的向量ω和一个常数b,选取特征值+1,使得第一个产地的每个玉石样品数据i的特征向量均满足

且存在样品使得等号成立,即第一个产地的某个玉石样品i*的特征向量满足:

另一类选取特征值-1,其中的每个玉石样品j的特征向量均满足:

且存在样品使得等号成立,即另一类中的某个玉石样品j*的特征向量满足:

这样两类样品就被一个线性平面ωtx+b=0分隔开了,且间隔距离为其中||ω||表示向量ω的模值;满足上述条件的向量ω和常数b不止一组,取其中||ω||最小,也就是使两类样品之间的间隔距离最大的那组(ω1*,b1*),作为划分第一个产地和剩下n-1个产地的玉石样品的最佳方式;

划分出第一个产地的玉石样品后,再将第二个产地的样品视作一类,剩下n-2个产地的样品视作第二类,采用上述方式进行划分,记录对应的(ω2*,b2*);依上述选择特征向量确定特征平面的方法类推,建立支持向量机多分类模型,直至最终划分出所有产地的样品;

⑷利用训练集数据建立支持向量机多分类模型,并用对应的测试集去验证模型效果;

先选择新疆软玉、甘肃软玉以及青海软玉的训练集数据建立支持向量机三类判别区分模型,其中新疆软玉样品类别标记为0,甘肃软玉样本的类别属性标记为1,青海软玉的类别属性标记为-1。然后利用这三种产地的测试集样本去检验模型的判别区分结果,图3展示了来自这三个产地的测试集样本经过该模型判别后的预测结果,蓝色散点(圆圈)代表甘肃软玉样本,黑色散点(三角形)代表青海软玉样本,红色散点(米字形)代表新疆和田软玉样本。从图中可以看到只有一个青海软玉样本的预测结果不正确,经计算该模型对测试集样本的分类准确率为93.3%,初步可以认为其对多种产地软玉的分类是有效的。

在以较高准确率同时判别区分上述三个产地软玉的基础上,再加入台湾软玉的样本数据,更进一步验证利用该方法建立的模型的可靠性,其中新加入的台湾软玉类别属性标记为2。利用这四种产地软玉的光谱数据建立支持向量机分类模型,再利用这四类软玉样品的测试集样本数据验证模型。图4展示了来自四种不同产地软玉测试集的预测结果,绿色散点(方形)为台湾软玉测试集的预测结果,由图可知仅有一个青海软玉样本预测结果出错,模型对四个产地软玉预测集样本的分类准确率高达94.7%。

在上述四类判别区分模型实现很好预测结果的基础上,加入了韩国软玉样本,其类别属性标记为-2,建立五类判别区分模型。同理利用这五类软玉的预测集样本进行模型分类效果的验证。如图5所示,共有3个样品预测结果出错,其中2个是韩国软玉样本,1个是青海软玉样本,整个模型的分类准确率高达87%。

(5)采用上述支持向量机多分类模型快速无损地进行判别区分软玉产地,实现快速无损区分软玉产地。

对于原产地未知的玉石样品进行判别区分,具体如下:

对待判别区分的玉石样品重复步骤(1)和步骤(2),得到待判别区分样品的平均拉曼光谱的特征强度矩阵,利用步骤(4)已经建立的支持向量机多分类模型对拉曼光谱进行判断,得出预测产地。

另外,在本发明部分实施例中,对于利用svm处理线性不可分的情况,svm的处理方法是:选择一个核函数,通过将数据映射到高维空间来解决在原始空间中线性不可分的问题。通常从一些常用的核函数中选择,根据问题和数据的不同,选择不同的参数,实际上就得到了不同的核函数,例如:多项式核、高斯核、线性核等等。

实验结果充分证明了利用支持向量机方法建立的模型可以适用于多类软玉产地的同时判别区分,并具有较高的准确率。

综上可以看出,本发明基于拉曼光谱技术和支持向量机方法实现多产地软玉的无损判别区分,相较于传统的每次只能做二类判别区分的线性判别方法,将多个产地的软玉样本进行混合判别区分,不仅实现了多产地软玉的快速、无损、同时判别区分,而且实现了较高的分类准确率。

以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1