一种菱镁矿矿石的品级的分类方法及设备与流程

文档序号:12178128阅读:357来源:国知局
一种菱镁矿矿石的品级的分类方法及设备与流程
本发明涉及矿石检测
技术领域
,尤其涉及一种菱镁矿矿石的品级的分类方法及设备。
背景技术
:菱镁矿矿石主要用于冶金、化工等行业,其纯度直接影响产品质量。菱镁矿矿石的纯度也可以用菱镁矿矿石的品级来衡量,品级越高,纯度越高。目前对菱镁矿矿石分类的方法通常采用化学方法进行鉴别,这种方法需要专业工作人员操作,且分析周期长,工作强度大。技术实现要素:本发明实施例提供一种菱镁矿矿石的品级的分类方法及设备,用于提供一种定量分析菱镁矿矿石的品级的方式。第一方面,提供一种菱镁矿矿石的品级的分类方法,包括:对待分类的菱镁矿矿石的第一数据矩阵通过栈式自编码网络进行降维处理,得到第二数据矩阵;其中,第一数据矩阵用于指示所述待分类的菱镁矿矿石的光谱数据;对所述第二数据矩阵通过极限学习机ELM进行数据的分类,以得到所述待分类的菱镁矿矿石的品级;其中,所述极限学习机ELM为预先经训练样本训练后得到的,以第二数据矩阵为输入,以菱镁矿矿石的品级为输出的模型。可选的,所述极限学习机ELM的输入层和隐含层之间的激励函数为Sigmoid函数。可选的,所述极限学习机ELM的输入层和隐含层的节点数量为45。可选的,所述极限学习机ELM的构建过程包括:循环极限学习机ELM;其中,极限学习机ELM的循环次数不超过N,N为正整数;比较训练样本经所述极限学习机ELM训练后的输出结果;从输出结果中确定对应的一组或几组输入层和隐含层之间的输入权值及隐含层阈值;将由确定的所述输入权值和所述隐含层阈值组成的模型重新确定为所述极限学习机ELM。可选的,N小于等于200。可选的,对所述第二数据矩阵通过极限学习机ELM进行数据的分类,以得到所述待分类的菱镁矿矿石的品级,包括:将所述第二数据矩阵输入至所述极限学习机ELM中,经所述激励函数和所述输入权值运算后得到所述隐含层的目标输出矩阵;将所述目标输出矩阵与输出权重的乘积作为输出的菱镁矿矿石的品级。第二方面,提供一种菱镁矿矿石的品级的分类设备,包括:降维单元,用于对待分类的菱镁矿矿石的第一数据矩阵通过栈式自编码网络进行降维处理,得到第二数据矩阵;其中,第一数据矩阵用于指示所述待分类的菱镁矿矿石的光谱数据;输出单元,用于对所述第二数据矩阵通过极限学习机ELM进行数据的分类,以得到所述待分类的菱镁矿矿石的品级;其中,所述极限学习机ELM为预先经训练样本训练后得到的,以第二数据矩阵为输入,以菱镁矿矿石的品级为输出的模型。可选的,所述极限学习机ELM的输入层和隐含层之间的激励函数为Sigmoid函数。可选的,所述极限学习机ELM的输入层和隐含层的节点数量为45。可选的,所述设备还包括:构建模型单元,用于循环极限学习机ELM;其中,极限学习机ELM的循环次数不超过N,N为正整数;比较训练样本经所述极限学习机ELM训练后的输出结果;从输出结果中确定对应的一组或几组输入层和隐含层之间的输入权值及隐含层阈值;将由确定的所述输入权值和所述隐含层阈值组成的模型重新确定为所述极限学习机ELM。本发明实施例提出了一种新的菱镁矿矿石的品级的分类方法。首先基于近红外光谱的无损检测技术,采集矿石的光谱数据。然后利用SAE方法进行降维。最后利用精选ELM算法进行建模,准确率较高。针对精选ELM的预测稳定性不好的问题,本发明实施例进一步提出集成-精选ELM方法。集成-精选ELM不论在菱镁矿石品级分类的准确性还是稳定性上明显优于传统ELM和精选ELM,预测准确率可达98%。与传统的菱镁矿石品级分类方法相比,本文提出的菱镁矿石检测方法在经济性、准确性、以及快速性上具有一定的优势。并且,该方法可以实现矿石的大批量在线检测。可见其具有重要的实际应用价值。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本发明实施例提供的菱镁矿矿石的品级的分类的流程图;图2为本发明实施例提供的自编码网络的一种结构示意图;图3为本发明实施例提供的ELM训练集输出结果与实际期望的散点分布图;图4为本发明实施例提供的ELM测试集输出结果与实际期望的散点分布图;图5为本发明实施例提供的精选ELM训练集输出结果与实际期望的散点分布图;图6为本发明实施例提供的精选ELM测试集输出结果与实际期望的散点分布图;图7为本发明实施例提供的集成-精选ELM训练集输出结果与实际期望的散点分布图;图8为本发明实施例提供的集成-精选ELM测试集输出结果与实际期望的散点分布图;图9为本发明实施例提供的菱镁矿矿石的品级的分类设备的一种结构示意图。具体实施方式为使本发明的目的、技术方案和优点更加清楚明白,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,在不做特别说明的情况下,一般表示前后关联对象是一种“或”的关系。为了更好地理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。请参见图1,提供一种菱镁矿矿石的品级的分类方法,该方法的流程描述如下。S101:对待分类的菱镁矿矿石的第一数据矩阵通过栈式自编码网络进行降维处理,得到第二数据矩阵;其中,第一数据矩阵用于指示所述待分类的菱镁矿矿石的光谱数据;S102:对所述第二数据矩阵通过极限学习机ELM进行数据的分类,以得到所述待分类的菱镁矿矿石的品级;其中,所述极限学习机ELM为预先经训练样本训练后得到的,以第二数据矩阵为输入,以菱镁矿矿石的品级为输出的模型。第一数据矩阵可以用于表征待分类的菱镁矿矿石的特征参数,可以通过红外光谱仪对待分类的菱镁矿矿石进行测试,获取菱镁矿矿石的光谱数据。本发明实施例中,通过光谱仪对样本数量为531份的菱镁矿矿石采集光谱数据,所采集的原始光谱数据是一个维数为973的高维数据矩阵。由于第一数据矩阵的维数较高,而数据维数较高,这就导致数据具有较大的噪声,且数据之间可能存在交集,互相干扰,因此,在对光谱数据输入分类模型之前,需要对数据进行降维处理,以减小数据处理量,提高数据处理效率。本发明实施例中,对第一数据矩阵通过栈式自编码网络进行降维处理,处理后得到的数据矩阵称为第二数据矩阵。由于第一数据矩阵所包括的数据可能存在非线性结构,那么常用的数据降维方法,如PCA、ICA等适线性数据降维的方法显然不适合。因此,本发明实施例采用自编码网络(SAE)对第一数据矩阵进行降维处理,具体可以通过逐层的构造输入层等于输出层的三层神经网络来对数据进行降维和特征提取。请参见图2,图2是自编码网络的结构示意图。在图2中,自编码器尝试去学习一个恒等函数,该恒等函数用公式(1)示意.hw,b(x)≈x(1)在自编码网络的预训练阶段可以分为编码和解码两个步骤。Layer1层到Layer2层属于编码过程,在此过程中就是定义一个函数映射g(·),使得输入数据x转化为隐藏表示u,如公式(2)所示。u=g(Wx+b0)(2)其中,W,b分别是是输入层到隐含层的权值和偏差,W是一个d×d′维的权重矩阵。b是d′维偏置向量。函数g(·)是一个非线性映射。Layer2层到Layer3层属于解码过程,通过g(·)对u进行重构得到hw,b(x),如公式(3):hw,b(x)=g(WTu+b1)(3)通过最小化平均重建误差来优化自编码模型的参数W、b0和b1。平均重建误差的定义形式是多样,本发明实施例中,选用公式(4)。L(x,hW,b(x))=||x-hW,b(x)||2(4)本发明实施例中,使用梯度下降法和反向传播算法对参数W和b进行迭代更新,从而学习最优化的深度自编码网络。对于固定样集{(x(1),y(1)),····,(x(m),y(m))},它含m个样例。当设定隐含层节点数s比输入层节点数m小的时候,我们可以得到一个输入的压缩表示。我们可以定义整体代价函数如公式(5)。公式(5)中的第一项J(W,b)是一个均方差项。第二项是一个规则化项。λ为权重衰减参数,其目的是减小权重的幅度,防止过度拟合。我们用nl来表示网络的层数。其中,Wij(l)是第l层第j单元与第l+1层第i单元之间的联接参数,bi(l)是第l+1层第i单元的偏置项。当设定隐含层节点数s比输入层节点数m大的时候,通过添加一些稀疏性限制条件,得到稀疏编码的结果。此时总的代价函数可以用公式(6)表示。其中,是一个以ρ为均值和一个以为均值的两个伯努利随机变量之间的相对熵。梯度下降法中每一次迭代都按照公式(7)对参数W和b进行更新。其中,其中,α是学习速率。本发明实施例,采用栈式自编码网络(SAE)对预处理后的第一数据矩阵(维数为973)进行降维处理。其中隐含层共由有两层,第一隐含层有200个结点个数,第二隐含层有100个结点个数,也就是通过降维处理将原始的菱镁矿石近红外光谱数据降维到100个。对菱镁矿矿石的光谱数据进行降维处理后,可以通过极限学习机ELM进行数据的分类,以得到所述待分类的菱镁矿矿石的品级;所述极限学习机ELM为预先经训练样本训练后得到的,以第二数据矩阵为输入,以菱镁矿矿石的品级为输出的模型。ELM是将传统神经网络参数优化用求解线性方程组替代迭代的算法。与传统的学习算法相比,ELM克服了参数的多次迭代,故ELM具有更快的学习速度和良好的泛化能力。对于任意给定的N个不同的样本(xi,ti),xi=[xi1,xi2,…,xin]T∈Rn,ti=[ti1,ti2,…,tim]T∈Rm,则表示L个隐层节点的单隐层前馈神经网络如式(8)所示。其中,x∈R,ai∈Rn,βi∈Rm,G(ai,bi,x)表示第i个隐层节点与x的关系。g(x):R→R,得出G(ai,bi,x)=g(ai·x+bi),bi∈R(9)其中,ai=[ai1,ai2,…,ain]T∈Rn为输入层到第i个隐含层节点的输入权值向量,bi表示第i个隐含层节点的阈值,βi=[βi1,βi2,…βim]T表示第i个隐含层节点到输出层的输出权值向量。ai,bi在模型的训练中是随机取值的。选取N个样本(xi,ti)∈Rn×Rm,xi∈Rn,ti∈Rm。可将式(8)简化成:Hβ=T(10)公式(10),H是隐含层输出矩阵。是H的广义逆表达形式。下面介绍极限学习机ELM模型的建立过程。经SAE处理过的实验样本光谱数据为531×100,在531组数据中随机选择模型的训练集和测试集。训练样本共367个,其中包含特级品72、一级品73、二级品72、三级品80和废矿70。测试集样本共164个,其中特级品32、一级品36、二级品36、三级品30和废矿30。ELM菱镁矿石品级分类模型的参数选择包括激活函数和隐含层节点数。而ELM的激活函数通常有以下几种:Sigmoid函数、sin函数、hardlim函数等。本发明实施例选择Sigmoid函数作为ELM的菱镁矿石品级分类模型中的激活函数,得到的结构较为准确。由于隐含层节点数会对网络的学习和信息处理能力产生较大的影响。节点数偏多会增加网络的复杂程度,使得学习时间变长,容易发生过拟合现象。节点数偏少则会对网络的信息的学习和处理能力产生一定的限定。本发明实施例中,隐含层节点数可以位于第一范围内,第一范围使得学习时间较短,且不会发生过拟合想象,第一范围可以采用经验公式来确定一个大概范围,隐含层节点数可以是第一范围内的一个最优值,如隐含层节点数为45。由公式(11)计算获得输出权值,且能够获得唯一的最优解。ELM算法模型的训练集和测试集输出结果与实际期望的散点分布图分别如图3、图4所示。由图3和图4可以看出,传统ELM算法模型对于菱镁矿石品级分类效果不明显。由于ELM输入权值和隐含层阈值随机赋值,ELM的输出不稳定,容易陷入局部极小值导致准确率不高。鉴于此,本发明实施例提出一种ELM的改进算法,可以称为精选ELM。将极限学习机ELM循环N次,N为正整数,N的选取可以经验或者实验所得,使得极限学习机ELM输出结果更为准确。通过比较网络训练集的输出结果,找到准确率最高的一组或几组输入权值和隐含层阈值并将其保留下来。将其固定作为ELM模型参数,即得到精选ELM菱镁矿石分类模型。精选ELM模型的训练集和测试集输出结果与实际期望的散点分布图如图5、图6所示。从图5和图6中可以看出精选ELM的预测结果比传统的ELM有了明显该进。每一组精选ELM对应一组参数,每一个精选ELM模型对于同一个样本判别的结果可能会有差异,其稳定性不高。为了提高模型效果的稳定性,本文提出了集成-精选ELM算法。本文选取集成11组精选模型,集成模型的输出是11个单模型输出最多的品类。这可以进一步提高模型的预测精度。通过实验仿真并统计仿真结果中的菱镁矿石对应品级的预测值和期望值之间的数量关系,可以看出集成-精选ELM模型在菱镁矿石品级分类的稳定性和准确性取得良好的效果。集成-精选ELM模型的训练集和测试集各类样本仿真准确结果与实际样本的对比的统计图如图7、图8所示,相较于精选ELM模型输出结果更为准确。本发明实施例,针对菱镁矿石品级数据,我们分别建立了普通ELM、精取ELM以及集成-精取ELM分类模型。其仿真结果如下表1所示。表1ELM、精取ELM以及集成-精取ELM分类仿真结果模型类型训练集正确率测试集正确率模型耗时ELM(%)86.921%78.0488%0.2257s精选ELM(%)96.1853%87.8049%1.22s集成-精选ELM(%)99.7275%98.1707%48.2s从表1中可以看出,菱镁矿石品级分类的ELM模型、精取ELM模型、集成-精选ELM模型的准确度。常规的ELM模型测试集准确率不高,模型耗时少。精选ELM的精度有明显提高,其正确率通常可以达到85%以上,但其稳定性不高。集成-精选ELM在仿真精度和模型的稳定性方面具有很大的提高,精度可以达到98%。本发明实施例提出了一种新的菱镁矿矿石的品级的分类方法。首先基于近红外光谱的无损检测技术,采集矿石的光谱数据。然后利用SAE方法进行降维。最后利用精选ELM算法进行建模,准确率较高。针对精选ELM的预测稳定性不好的问题,本发明实施例进一步提出集成-精选ELM方法。集成-精选ELM不论在菱镁矿石品级分类的准确性还是稳定性上明显优于传统ELM和精选ELM,预测准确率可达98%。与传统的菱镁矿石品级分类方法相比,本文提出的菱镁矿石检测方法在经济性、准确性、以及快速性上具有一定的优势。并且,该方法可以实现矿石的大批量在线检测。可见其具有重要的实际应用价值。下面结合附图介绍本发明实施例所提供的设备。请参见图9,基于同一发明构思,本发明实施例还提供一种菱镁矿矿石的品级的分类设备,该分类设备包括降维单元901、输出单元902和构建模型单元903。降维单元901可以用于对待分类的菱镁矿矿石的第一数据矩阵通过栈式自编码网络进行降维处理,得到第二数据矩阵;其中,第一数据矩阵用于指示所述待分类的菱镁矿矿石的光谱数据;输出单元902可以用于对所述第二数据矩阵通过极限学习机ELM进行数据的分类,以得到所述待分类的菱镁矿矿石的品级;其中,所述极限学习机ELM为预先经训练样本训练后得到的,以第二数据矩阵为输入,以菱镁矿矿石的品级为输出的模型。可选的,所述极限学习机ELM的输入层和隐含层之间的激励函数为Sigmoid函数。可选的,所述极限学习机ELM的输入层和隐含层的节点数量为45。可选的,构建模型单元903可以用于循环极限学习机ELM;其中,极限学习机ELM的循环次数不超过N,N为正整数;比较训练样本经所述极限学习机ELM训练后的输出结果;从输出结果中确定对应的一组或几组输入层和隐含层之间的输入权值及隐含层阈值;将由确定的所述输入权值和所述隐含层阈值组成的模型重新确定为所述极限学习机ELM。该菱镁矿矿石的品级的分类设备可以用于执行上述图1实施例中所述的菱镁矿矿石的品级的分类方法,因此,对于该分类设备中的各模块所实现的功能等,可参考如前述方法部分的描述,不多赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:通用串行总线闪存驱动器(UniversalSerialBusflashdrive,USBflashdrive)、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。具体来讲,本申请实施例中的目标识别方法对应的计算机程序指令可以被存储在光盘,硬盘,U盘等存储介质上,当存储介质中的与菱镁矿矿石的品级的分类方法对应的计算机程序指令被一菱镁矿矿石的品级的分类设备读取或被执行时,包括如下步骤:对待分类的菱镁矿矿石的第一数据矩阵通过栈式自编码网络进行降维处理,得到第二数据矩阵;其中,第一数据矩阵用于指示所述待分类的菱镁矿矿石的光谱数据;对所述第二数据矩阵通过极限学习机ELM进行数据的分类,以得到所述待分类的菱镁矿矿石的品级;其中,所述极限学习机ELM为预先经训练样本训练后得到的,以第二数据矩阵为输入,以菱镁矿矿石的品级为输出的模型。可选的,所述存储介质中还存储有所述极限学习机ELM的输入层和隐含层之间的激励函数为Sigmoid函数。可选的,所述存储介质中还存储有所述极限学习机ELM的输入层和隐含层的节点数量为45。可选的,所述存储介质中还存储有另外一些计算机指令,这些计算机指令在步骤:在所述极限学习机ELM的构建过程时被执行,在被执行时包括如下步骤:循环极限学习机ELM;其中,极限学习机ELM的循环次数不超过N,N为正整数;比较训练样本经所述极限学习机ELM训练后的输出结果;从输出结果中确定对应的一组或几组输入层和隐含层之间的输入权值及隐含层阈值;将由确定的所述输入权值和所述隐含层阈值组成的模型重新确定为所述极限学习机ELM。可选的,所述存储介质中还存储有另外一些计算机指令,这些计算机指令在步骤:在对所述第二数据矩阵通过极限学习机ELM进行数据的分类,以得到所述待分类的菱镁矿矿石的品级时被执行,在被执行时包括如下步骤:将所述第二数据矩阵输入至所述极限学习机ELM中,经所述激励函数和所述输入权值运算后得到所述隐含层的目标输出矩阵;将所述目标输出矩阵与输出权重的乘积作为输出的菱镁矿矿石的品级。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1