一种基于煤炭光谱数据对煤炭分类的方法与流程

文档序号:12906509阅读:471来源:国知局
一种基于煤炭光谱数据对煤炭分类的方法与流程

本发明涉及计算机技术,特别是一种基于煤炭光谱数据对煤炭分类的方法。



背景技术:

随着工业的发展,高品质的煤对生产效率和环境污染起决定性作用,从而提高了对煤炭分类的要求。传统的煤炭分类方法有两种。一是利用人工分类方法,该方法虽然分类速度较快,但分类精度往往偏低。二是利用化学分析的方法进行分类,虽然其精度较高,但该方法存在成本高、耗时长的缺点。

上述缺陷是本领域技术人员期望克服的。



技术实现要素:

(一)要解决的技术问题

为了解决现有技术的上述问题,本发明提供一种基于煤炭光谱数据对煤炭分类的方法。本发明提供的基于煤炭光谱数据对煤炭分类的方法,效率高、成本低、且精度较高。

(二)技术方案

为了达到上述目的,本发明采用的主要技术方案包括:

一种基于煤炭光谱数据对煤炭分类的方法,包括以下步骤:

获取多个待分类的煤炭样品的光谱数据,其中,每个煤炭样品的光谱数据中包括s个光谱特征;

采用煤炭分类模型对所述光谱数据进行处理,获得所述光谱数据对应的煤炭品种,

其中,所述煤炭分类模型为预先采用煤炭品种已知的多个煤炭样品的光谱数据建立的,所述煤炭分类模型为卷积神经网络-极限学习机神经网络,所述煤炭分类模型具有经过粒子群算法优化后的最优权重矩阵和最优偏置向量,所述煤炭分类模型用于处理包括s个光谱特征的光谱数据以获得光谱数据对应的煤炭品种。

进一步地,所述的方法,所述采用煤炭分类模型对所述光谱数据进行处理之前,还包括:

采用煤炭品种已知的多个煤炭样品的光谱数据,使用粒子群算法,建立基于卷积神经网络-极限学习机神经网络的煤炭分类模型。

具体地,所述的方法中,所述采用煤炭品种已知的多个煤炭样品的光谱数据,使用粒子群算法,建立基于卷积神经网络-极限学习机神经网络的煤炭分类模型,包括:

获取煤炭品种已知的多个煤炭样品的光谱数据,其中,每个煤炭样品的光谱数据中包括s个光谱特征,煤炭品种的数量为t,s,t均为大于1的整数;

设置卷积神经网络-极限学习机神经网络的参数,其中,设置输入层的节点个数为s,设置卷积神经网络-极限学习机神经网络的输出层的节点为t;

将所述煤炭品种已知的多个煤炭样品的光谱数据作为所述卷积神经网络-极限学习机神经网络的输入数据,将所述煤炭品种已知的多个煤炭样品的煤炭样品对应地作为所述卷积神经网络-极限学习机神经网络的输出数据,使用粒子群优化算法得到所述卷积神经网络-极限学习机神经网络的最优权重矩阵和最优偏置向量;

设置所述卷积神经网络-极限学习机神经网络的权重矩阵为所述最优权重矩阵,设置所述卷积神经网络-极限学习机神经网络的偏置向量为所述最优偏置向量,得到的所述卷积神经网络-极限学习机神经网络即为用于处理包括s个光谱特征的光谱数据以获得光谱数据对应的煤炭品种的煤炭分类模型。

具体地,所述的方法中,在使用粒子群优化算法得到所述卷积神经网络-极限学习机神经网络的最优权重矩阵和最优偏置向量时,在每一轮迭代中,根据第一公式获取惯性权重ω,所述第一公式为:

ω=rand(α,β),其中,α=0.41,β=0.69,rand(α,β)为求[α,β]之间的随机数。

具体地,所述的方法中,在每一轮迭代中,获取当前的迭代轮序号ni,并根据第二公式获取粒子加速系数ci1,根据第三公式获取种群加速系数ci2;

所述第二公式为:其中,c10=0.5,c11=2.5;

所述第三公式为:其中,c20=3.5,c21=-3,nmax为预先设定的最大迭代轮数。

具体地,所述的方法中,所述卷积神经网络-极限学习机神经网络中,卷积层的激活函数为sigmoid函数,采样层的采样函数为均值采样函数。

具体地,所述的方法中,所述卷积神经网络-极限学习机神经网络中,极限学习机神经网络中的激活函数为sigmoid函数。

应当理解为,所述的方法,还包括获取煤炭样品的光谱数据的步骤:

对煤炭样品进行清洗处理后磨粉,获得煤粉样品片;

对煤粉样品片进行多次光谱测试,并将多次光谱测试的光谱数据进行算术平均后作为所述煤炭样品的光谱数据,其中,所述光谱测试中的光谱范围包括可见及近红外光光谱,所述光谱数据中包括s个光谱特征。

具体地,所述的方法中,所述煤炭样品对应的煤炭品种为以下中的任一项:无烟煤类、肥煤类、焦煤类和褐煤类。

(三)有益效果

本发明的有益效果是:本发明的基于煤炭光谱数据对煤炭分类的方法,采用经过粒子群优化后具有最优权重矩阵和最优偏置向量的卷积神经网络-极限学习机神经网络对煤炭样品的光谱数据进行处理,得到煤炭样品对应的品种分类结果效率高、成本低、且精度较高。

附图说明

图1为本发明实施例的基于煤炭光谱数据对煤炭分类的方法的示意图;

图2为本发明实施例的基于煤炭光谱数据对煤炭分类的方法中建立煤炭分类模型的方法的示意图;

图3为本发明一实施例中测试数据的煤炭分类数据与煤炭品种实际分类数据的散点分布图。

具体实施方式

为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。

本发明实施例的基于煤炭光谱数据对煤炭分类的方法,包括以下步骤:

s1:获取多个待分类的煤炭样品的光谱数据,其中,每个煤炭样品的光谱数据中包括s个光谱特征;

s2:采用煤炭分类模型对所述光谱数据进行处理,获得所述光谱数据对应的煤炭品种,

其中,所述煤炭分类模型为预先采用煤炭品种已知的多个煤炭样品的光谱数据建立的,所述煤炭分类模型为卷积神经网络-极限学习机神经网络,所述煤炭分类模型具有经过粒子群算法优化后的最优权重矩阵和最优偏置向量,所述煤炭分类模型用于处理包括s个光谱特征的光谱数据以获得光谱数据对应的煤炭品种。

进一步地,所述的方法,所述采用煤炭分类模型对所述光谱数据进行处理之前,还包括:

采用煤炭品种已知的多个煤炭样品的光谱数据,使用粒子群算法,建立基于卷积神经网络-极限学习机神经网络的煤炭分类模型。

应当理解为,建立基于卷积神经网络-极限学习机神经网络的煤炭分类模型的步骤应当在采用煤炭分类模型对所述光谱数据进行处理之前。但是,获取多个待分类的煤炭样品的光谱数据可以在建立基于卷积神经网络-极限学习机神经网络的煤炭分类模型的步骤之前,或者之后。

具体地,获取多个待分类的煤炭样品的光谱数据在建立基于卷积神经网络-极限学习机神经网络的煤炭分类模型的步骤之前,适应于在模型建立阶段。具体地,将获得的煤炭样品,采用无差异的参数得到其对应的光谱数据。并将这些煤炭样品按照煤炭品种均匀地选择出一部分作为建立模型的训练样品,将其余的样品作为验证模型的验证样品。

具体地,获取多个待分类的煤炭样品的光谱数据在建立基于卷积神经网络-极限学习机神经网络的煤炭分类模型的步骤之后,适应于在模型建立之后使用模型进行煤炭品种预测的阶段。具体地,在建立基于卷积神经网络-极限学习机神经网络的煤炭分类模型的之后,对获得的品种未知的煤炭样品,采用与训练样本和验证样本相同的参数得到其对应的光谱数据。采用建立的煤炭分类模型处理这些预测样品的光谱数据,得到预测样品的品种分类。

经过前述的训练步骤和验证步骤,预测样品的品种分类的准确率较高,可以满足生产实际需要。具体地,卷积神经网络(convolutionalneuralnetworks,以下简称cnn)主要通过卷积层和采样层来提取对象特征,并采用梯度下降法来训练找到网络的最小化全局误差。卷积神经网络能够提取更好的分类特征,不过它的感知器并不是一个很好的分类器。

极限学习机(extremelearningmachine,以下简称elm)神经网络是一个单隐含层的前馈神经网络,其优点在于网络训练速度非常快、分类精度高、泛化性能好。不过极限学习机神经网络只有在训练数据有足够好的特征的前提下才能获得高的准确率。

通常在极限学习机神经网络中,权值矩阵和偏置向量是随机给定的,导致部分权值和偏差未达到最优状态,所以每一次输出的结果存在比较大的差异。

而粒子群优化(particleswarmoptimization,以下简称pso)算法是一种全局优化算法。因此,将卷积神经网络、极限学习机神经网络、和粒子群优化算法结合起来,克服它们各自的缺点,充分利用其优点,使用粒子群算法对卷积神经网络-极限学习机神经网络的权重矩阵和偏置向量进行全局优化,获得的具有最优权重矩阵和最优偏置向量的卷积神经网络-极限学习机神经网络可用于处理光谱数据以获得光谱数据对应的煤炭品种的煤炭分类模型。

具体地,所述的方法中,所述采用煤炭品种已知的多个煤炭样品的光谱数据,使用粒子群算法,建立基于卷积神经网络-极限学习机神经网络的煤炭分类模型,包括:

获取煤炭品种已知的多个煤炭样品的光谱数据,其中,每个煤炭样品的光谱数据中包括s个光谱特征,煤炭品种的数量为t,s,t均为大于1的整数;

设置卷积神经网络-极限学习机神经网络的参数,其中,设置输入层的节点个数为s,设置卷积神经网络-极限学习机神经网络的输出层的节点为t;

将所述煤炭品种已知的多个煤炭样品的光谱数据作为所述卷积神经网络-极限学习机神经网络的输入数据,将所述煤炭品种已知的多个煤炭样品的煤炭样品对应地作为所述卷积神经网络-极限学习机神经网络的输出数据,使用粒子群优化算法得到所述卷积神经网络-极限学习机神经网络的最优权重矩阵和最优偏置向量;

设置所述卷积神经网络-极限学习机神经网络的权重矩阵为所述最优权重矩阵,设置所述卷积神经网络-极限学习机神经网络的偏置向量为所述最优偏置向量,得到的所述卷积神经网络-极限学习机神经网络即为用于处理包括s个光谱特征的光谱数据以获得光谱数据对应的煤炭品种的煤炭分类模型。

应当理解为,建立的输入层的节点个数为s、输出层的节点为t的基于卷积神经网络-极限学习机神经网络的煤炭分类模型适用于对每个煤炭样品的光谱数据中包括s个光谱特征,且对应的可能的煤炭品种的数量为t的煤炭样品的分类。一旦每个煤炭样品的光谱数据中包括的光谱特征数量发生变化,或者对应的可能的煤炭品种的数量发生变化,则需要重新建立具有变化后的输入层的节点个数、具有变化后的输出层的节点的基于卷积神经网络-极限学习机神经网络的煤炭分类模型。

对卷积神经网络说明如下:

卷积神经网络以数据为矩阵形式作为输入,隐含层包括卷积层和采样层,最后输出层是一个一维数据。如果第l层是卷积层,那么第j个的特征映射为:

这里,mj是输入数据的集合;f为非线性函数如sigmoid函数、relu函数、softplus函数等;为l-1层的第i个数据和l层的第j个数据的卷积核;为偏置。

如果第l层是采样层,那么第j个的特征映射为:

这里,do()是采样函数,有很多不同的采样函数方案可选如随机采样、求均值、最大值等;为权值;为偏置。

如果第l层为输出层,那么对应第j个特征映射为:

v为上一层的输出向量;为权值;为偏置。

对极限学习机神经网络说明如下:

对于样本量为n的样本(xi,ti),其中xi=[xi1,xi2,…,xin]t∈rn,ti=[ti1,ti2,…,tim]t∈rm,那么标准的l个隐含层神经元的单隐层前馈神经网络为:

这里,ai=[ai1,ai2,…,ain]t∈rn表示输入层神经元和隐含层第i个神经元之间的输入权值;βi为输出权值;bi为偏置;ai·xj表示ai和xj的内积。

则elm的目标函数可以另一种方式表达为:

hβ=t(5)

这里:

h是神经网络的隐含层输出的矩阵;t是期望输出。

huang教授的算法是随机选择输入权值和隐含层偏差值,训练这个网络结构相当于求解线性系统hβ=t的最小二乘解

minimize:||hβ-t||(8)

最后huang教授已经证明该线性系统最小二乘解的最小值是:

这里:h+是h的moore-penrose广义逆矩阵,并且hβ=t的最小二乘解的最小值是唯一的。

对粒子群算法说明如下:

粒子群是由kennedy和eberhart提出的一种全局优化算法,研究思想启发来自鱼群和鸟群觅食行为。由于pso算法结构简单、易实现、功能强大等,所以在优化问题上获得了普遍的应用。粒子群优化算法实现过程如下:在一个群里,每一只鸟被看成一个粒子,其它们有相应的速度vi=(vi1,vi2,...vid);和位置xi=(xi1,xi2,...,xid)其中i=1,2,...,m。

在每一代中,其粒子群通过如下公式(10)和(11)不断更新位置,以找出最优位置,并记录下来。

这里,pbesti=(pbesti1,pbesti2,...,pbestid)是粒子本身经历的最优位置;gbesti=(gbesti1,gbesti2,...gbestid)是全体种群中经过的最优位置,i=1,2,...,m;k是当前迭代数;ω是惯性权重;c1,c2是加速系数;r1,r2是在[0,1]上的均匀分布随机数。

现有的粒子群算法中,在每轮迭代中,惯性权重ω和加速系数c1,c2均是固定值。本发明实施例的方法中,采用动态更新的惯性权重和加速系数,从而更有效地避免早熟收敛,对网络增加稳定性。

具体地,所述的方法中,在使用粒子群优化算法得到所述卷积神经网络-极限学习机神经网络的最优权重矩阵和最优偏置向量时,在每一轮迭代中,根据第一公式获取惯性权重ω,所述第一公式为:

ω=rand(α,β),其中,α=0.41,β=0.69,rand(α,β)为求[α,β]之间的随机数。

发明人经过大量实验综合比较后得到:在α取值0.41及β取值0.69时,粒子群优化算法能够有效地避免早熟也即提前收敛,从而可以增加网络的稳定性。

具体地,所述的方法中,在每一轮迭代中,获取当前的迭代轮序号ni,并根据第二公式获取粒子加速系数ci1,根据第三公式获取种群加速系数ci2;

所述第二公式为:其中,c10=0.5,c11=2.5;

所述第三公式为:其中,c20=3.5,c21=-3,nmax为预先设定的最大迭代轮数。

需要说明的是,第二公式中的粒子加速系数ci1等同于上式(10)中的c1,第三公式中的种群加速系数ci2等同于上式(10)中的c2。

发明人经过大量实验综合比较后得到,在c10取值0.5,c11取值2.5,以及c20取值3.5,c21取值-3时,粒子群优化算法能够有效地避免早熟也即提前收敛,从而可以增加网络的稳定性。

具体地,所述的方法中,所述卷积神经网络-极限学习机神经网络中,卷积层的激活函数为sigmoid函数,采样层的采样函数为均值采样函数。

具体地,所述的方法中,所述卷积神经网络-极限学习机神经网络中,极限学习机神经网络中的激活函数为sigmoid函数。

应当理解为,所述的方法,还包括获取煤炭样品的光谱数据的步骤:

对煤炭样品进行清洗处理后磨粉,获得煤粉样品片;

对煤粉样品片进行多次光谱测试,并将多次光谱测试的光谱数据进行算术平均后作为所述煤炭样品的光谱数据,其中,所述光谱测试中的光谱范围包括可见及近红外光光谱,所述光谱数据中包括s个光谱特征。

具体地,所述的方法中,所述煤炭样品对应的煤炭品种为以下中的任一项:无烟煤类、肥煤类、焦煤类和褐煤类。

以下结合具体应用,对本发明实施例的基于煤炭光谱数据对煤炭分类的方法进行说明。

收集来自抚顺、伊敏和河南夹津口煤矿区的煤炭矿样品,其中包括无烟煤31个、肥煤57个、焦煤60个和褐煤58个,共有206个样品。采用美国spectravista公司的svchr-1024便携式地物光谱仪作为实验仪器。该仪器光谱范围:350-2500nm。内置存储器:500scans(扫)。重量:3kg,通道数:1024。光谱分辨率(fwhm≤8.5nm)1000~1850nm。最小积分时间:1毫秒。

首先对样品进行清洗,然后进行磨粉加工。在获取煤炭样品的光谱数据时,仪器扫描时间为1秒/次,光谱仪的探头距煤粉样品片表面300mm,并垂直于样品片表面。在实验过程中为减少周围环境对光谱测试的干扰,要求实验都在一个封闭室内完成,避免太阳和其他光源的照射,实验人员不得走动并穿着深色服装。

利用光谱仪(svchr-1024)对各样品进行五次光谱测试,然后取平均值作为该样品的光谱数据。实验中每10分钟进行一次白板测量校准。。因为煤本身是黑色,特别在可见光范围内的大部分能量都被吸收,。光谱混杂在一起,因此煤样吸光度比较高,光谱的有效信息少。因此借助cnn提取特征,elm进行分类,能够有效提高分类精度。

具体地,获得的煤炭样品及光谱数据共有206组,其中选取120组作为训练数据、86组作为测试数据。

为了便于实现数字化处理,设置无烟煤类对应数字1、肥煤类对应数字2、焦煤类对应数字3、褐煤类对应标签4。

采用120组训练数据建立具有最优权重矩阵和最优偏置向量的卷积神经网络-极限学习机神经网络的煤炭分类模型。如图2所示,本发明实施例的基于煤炭光谱数据对煤炭分类的方法中建立煤炭分类模型的方法,步骤如下:

(1)把光谱数据输入给cnn神经网络以提取特征,选择sigmoid为卷积层的激活函数,采样层选择均值采样函数。每个光谱数据有1024个光谱特征,经过特征提取后,输出数据为350个特征。

(2)初始化粒子群和elm神经网络,pso选择迭代数=50,粒子群数量=40;选择sigmoid函数作为elm神经网络的激活函数,隐含层节点数为20。

(3)使用elm算法对光谱特征数据训练、验证以得到pso适应度值,对适应度值进行判断,然后保存最优值和pso的速度和位置。

(4)当网络达到最大迭代轮数时就退出寻优,这时的卷积神经网络-极限学习机神经网络具有最优权重矩阵和最优偏置向量。

利用该煤炭分类模型处理86组测试数据,得到的煤炭品种分类结果如图3所示。

如图3所示,利用该煤炭分类模型处理86组测试数据中,第一类和第四类的分类结果分没有错误;第二类的分类结果有2个错误,第三类的分类结果有1个错误。该煤炭分类模型处理86组测试数据时,分类精度是96.51%,说明该煤炭分类模型的分类精度较高,满足实际使用需求。

表1是对206个煤样品采用人工经验方法、化学方法和cnn-elm网络模型分类的投资费用和所消耗时间的对照表。可以看出使用传统的人工经验方法虽然费用低但别精度不高。采用化学方法除了需要购买实验药品之外,一些化学实验仪器投入成本在100万以上。化学方法虽然精度高但成本很高,时间长。

本发明实施例的基于煤炭光谱数据对煤炭分类的方法包括光谱仪和计算机的投入成本在35万以内,比传统人工方法和化学方法投入更少、分类精度高、耗时更短。

表1不同识别方法对照表

综上所述,与传统的煤炭分类相比,本发明实施例的基于煤炭光谱数据对煤炭分类的方法,采用可见、近红外光谱,采用pso优化cnn-elm神经网络建立的煤炭分类模型在煤炭分类时准确,高效。本发明实施例的基于煤炭光谱数据对煤炭分类的方法可以在经济、速度、准确性具有无可比的优势和重要的实际应用价值。

最后应说明的是:以上所述的各实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或全部技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1