一种基于小样本量快速建立煤成分定量预测模型的新方法

文档序号:34727230发布日期:2023-07-07 21:29阅读:47来源:国知局
一种基于小样本量快速建立煤成分定量预测模型的新方法

本发明涉及一种煤质成分快速建模预测的方法,具体的,是基于激光诱导击穿光谱技术,利用小样本量标准样品建立模型并对煤中固定碳、灰分、热值等成分进行定量预测的方法。属于激光诱导击穿光谱物质定量分析领域。


背景技术:

1、激光诱导击穿光谱技术,也称libs技术,因其具有快速、实时、全元素检测、绿色无辐射等技术优势已经被广泛应用于煤碳定量分析领域。该技术主要原理是利用高能脉冲激光作用于待测体表面,形成高温、高密度的等离子体,收集等离子体的光谱信号,结合机器学习、统计修正等智能算法,建立煤质成分、元素的预测模型,最终实现对未知含量煤炭样品的成分含量的定量分析。

2、利用libs技术对煤炭进行定量分析的具体步骤主要分为三个。一是通过大量的标准样品建立光谱数据库,一般需要几十个到上百个样本量;二是基于采集的大量标准样品的光谱数据进行预处理,建立预测模型,建立模型的过程主要通过各种机器学习算法实现;最后,将预测模型应用到实际环境、工况中,统计模型预测结果并定期进行模型维护。其中,对几十个至上百个标准样品的光谱采集耗时耗力,此外,在某些难以一次性获取大量标准样品的情况下,建立高精度、泛化能力强的预测模型也成为一大难题,亟待开发一种利用小样本量就能训练得到较好模型预测结果的方法来解决上述难题。

3、一般情况下,libs要求对同一个样品进行多次光谱数据采集,最后通过平均光谱数据来降低采集误差和信号的波动,进而保证用于模型训练的光谱数据具有较好的样品代表性,但在样本量较小的情况下,平均光谱的方法容易造成训练模型时交叉验证数量严重不足,造成评估结果差异和波动较大。故对样品多次采集的光谱进行随机抽取部分数据组合成新的数据集,将小样本量的训练批次扩充,增加模型训练时交叉验证次数,最终基于统计约束的方法来进行模型选择,可以实现小样本量建立预测模型的目的,该方法能够有效缩小模型建立所需要的样本数量,同时保证模型预测精度,是一种高效的建模方法。


技术实现思路

1、本发明提供了一种基于激光诱导击穿光谱技术,利用小样本量的标准煤样进行快速建立定量预测模型的新方法,具体包括如下步骤:

2、1、准备6~20个的标准煤样一批,优选样本个数v=15个,作为定标用标准煤样,采用常见的libs光谱采集装置对每个煤样品进行多个位置光谱采集,每个样品采集光谱数量不少于100个。

3、2、对采集的光谱数据进行预处理,包括有效光谱筛选、去背景、归一化、寻峰四个步骤,具体步骤如下:

4、①有效光谱筛选:由于仪器误差和激光能量波动造成采集的光谱信号强度波动较大,需要在建模前进行甄别,假设样品的光谱采集次数为n次,n≥100,光谱矩阵为:

5、

6、其中,矩阵元iij表示第i次测量中光谱仪探测器ccd第j个像素的光响应强度。计算光谱矩阵sn的平均值和平均谱强度标准差:

7、

8、

9、

10、其中sm是该组光谱的全部平均值点,是第i次测量的平均谱强度点,sσ是n次测量的平均谱强度标准差,光谱数据的选取标准服从式(5):

11、数据范围∈[sm-sσ,sm+sσ]   (5)

12、将在数据范围内的平均光谱点对应的光谱数据选取出来,作为该样品的有效光谱数据,对其余样品重复上述操作,找到该样品的k个有效光谱数据s'k,k<n。②经过有效数据筛选的光谱,利用窗口平移平滑的方法去除光谱背景,并基于光谱仪通道背景面积对光谱进行归一化,得到归一化的光谱数据。

13、③对归一化的光谱数据进行寻峰,将寻到的峰值作为模型训练的输入变量。

14、3、随机选取v×b%,b≥75个样本为训练集,对训练集中每个样品的寻峰后的有效光谱数据s'k进行数据抽取,抽取的光谱数量为d=k×c%,c≥75,抽取后的光谱矩阵为s'd,d<k,计算平均光谱最终v个样品共得到的平均光谱矩阵为

15、

16、

17、

18、其中itj为抽取出的d个光谱中的第t个光谱的第j个ccd像素的光响应值,为中第v个样品抽取光谱中第j个ccd像素光响应的平均值,v=1,2,3…v,由于步骤2中的寻峰处理,itj的值可能为0。

19、4、对得到的光谱矩阵与煤第p个成分指标进行基于主成分分析的偏最小二乘法进行建模训练,训练时采用5折或10折交叉验证对超参数进行选取,对不同的样本数,选取的超参数不一致。确定最小交叉验证预测平均方差所对应的超参数为最终模型训练输入超参数。相应的,验证集的预测均方根误差rmsev和模型系数,验证集预测结果的线性拟合系数分别计算得到。

20、5、对3中所述的抽取过程重复q次,q≥1000,共得到q个验证均方根误差rmsev和模型系数βv,以及q个验证集预测结果的线性拟合系数最优模型系数的确定遵从如下的模型选择规则:

21、①找出q个线性拟合系数的最大值并依据a≥0.9,标记并选取出对应的rmsevl,l<q;

22、②在选出的验证均方根误差rmsevl中寻找最小值rmsevl-min,并将对应的模型系数βp,即为最优模型系数。

23、其中模型系数的矩阵形式为:

24、

25、其中为系数矩阵元,为模型系数的常数项。

26、6、对测试集的所有光谱数据进行有效光谱筛选,并做平均处理,最终利用5中所述的最优模型系数βp对煤的第p个成分指标进行预测,得到预测结果:

27、yp=a1i1+a2i2+a3i3+…+ajij+b0           (10)

28、其中yp为第p个需要预测的煤质指标。

29、有益效果:

30、(1)本发明所述方法通过基于对小样本量煤质光谱进行有放回的抽样提取,充分挖掘和多次利用光谱信息,扩充建模数据变量,有利于在小训练样本量的条件下提升模型预测精度和模型泛化能力。

31、(2)基于统计方法对测试数据的误差矫正和特征微修正,利用多次测量和数据提取,对特征一致的数据进行叠加计算,获取可靠置信区间的统计平均值,弱化测量误差带来的数据波动,提升训练模型所用数据变量的有效性。

32、(3)本发明所述方法对模型定标所需样品数量较少,一般10~20个样品即可完成,有效节约测试时间和人力成本,在某些难以获取大量具有代表性样本的条件下,仍可以得到精度较高的预测模型,具有很高的实际应用前景。



技术特征:

1.一种基于小样本快速建立煤成分定量预测模型的新方法,其特征在于:所述的小样本是指样本量小于20个。

2.一种基于小样本快速建立煤成分定量预测模型的新方法,其特征在于:对成分、元素含量已知的同一煤样品进行多次采集光谱数据,并对数据进行预处理,包括:有效数据筛选、去背景、归一化、寻峰,其中有效数据筛选遵从以下规则:

3.一种基于小样本快速建立煤成分定量预测模型的新方法,其特征在于:经过预处理的光谱数据被分为训练集和测试集,对训练集中每个样品进行光谱数据选取,抽取的光谱数据个数要超过被抽取样品有效数光谱据量的75%,所述的抽取过程,样品之间是相互独立的,抽取完成后进行光谱平均。

4.一种基于小样本快速建立煤成分定量预测模型的新方法,其特征在于:对训练集中样品进行数据抽取一轮后组成一批训练数据集合,所述抽取一轮是指完成训练集中每个样品的数据抽取、光谱平均。

5.如权利要求4中所述的一种基于小样本快速建立煤成分定量预测模型的新方法,其特征在于:对一批训练数据集合,采取基于主成分分析的偏最小二乘回归法进行训练模型,训练时采用交叉验证法实现对模型调参,特别地,当训练样本数为个位数时可以采用留一交叉验证法进行模型调参,多批训练数据集分别进行训练得到多组验证集模型系数βv,验证集均方根误差rmsev和验证集线性回归系数

6.如权利要求5中所述的一种基于小样本快速建立煤成分定量预测模型的新方法,其特征在于:对得到的模型系数进行基于以下所述标准选择出最优模型,(1)最大化线性回归系数:寻找验证集线性回归系数中的最大值满足其预测结果的线性回归系数a≥0.9,标记对应的验证均方根误差为rmsevi;

7.如权利要求6中所述的一种基于小样本快速建立煤成分定量预测模型的新方法,其特征在于:应用得到的最优模型到测试集数据上,并计算测试集rmsep,评估测试结果。


技术总结
一种基于小样本快速建立煤成分定量预测模型的新方法,是基于激光诱导击穿光谱技术,也称LIBS技术,利用小样本量标准样品建立模型并对煤中固定碳、灰分、热值等成分进行定量预测的方法,对每个标准样品多次采集LIBS光谱,建模时按照一定比例随机抽取每个样品光谱的部分光谱数据,最终形成多个具有一定差异的训练批次,对每个批次进行基于主成分分析的偏最小二乘法算法的模型训练,最终通过一定的模型选取规则得到预测模型,本发明能够大大缩短利用LIBS技术对煤质分析时建模所需时间,满足小样本量情况下模型的预测精度和鲁棒性,在不需要或难以获取大量样本的情况下,为设备的快速标定提供有效的解决方法。

技术研发人员:刘瑞斌,李安,张新宇,王宪双,刘晓东
受保护的技术使用者:北京理工大学
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1