基于模糊划分和模型集成的气体传感器阵列浓度检测方法

文档序号:10576968阅读:1597来源:国知局
基于模糊划分和模型集成的气体传感器阵列浓度检测方法
【专利摘要】一种基于模糊划分和模型集成的气体传感器阵列浓度检测方法,属于气体传感器阵列信号处理技术领域,该方法借助模糊聚类方法对基线漂移数据进行时间段划分,将原始数据集划分成漂移程度不同的多个子数据集;然后建立不同训练数据集的回归模型,得到若干子回归模型;在训练集内获得每个子回归模型的最优权重集合,对聚类中心和最优权重进行拟和,得到最优权重拟和函数;在测试阶段,基于最优权重拟和函数和聚类中心时间计算拟和权重,将这些子回归模型对待测数据的预测结果进行集成,得到最终气体浓度值。此方法能自适应地改变模式识别模型,使其能跟踪漂移的变化,有效减小漂移对浓度检测性能的影响,保证浓度测量的长期准确性。
【专利说明】
基于模糊划分和模型集成的气体传感器阵列浓度检测方法
技术领域
[0001] 本发明属于气体传感器阵列信号处理技术领域,具体涉及一种基于模糊划分和模 糊加权多输出支持向量回归模型集成的长期漂移补偿的金属氧化物气体传感器阵列浓度 检测方法。
【背景技术】
[0002] 利用气体传感器装置代替传统的分析仪器是混合气体检测的新方法,金属氧化物 半导体(Metal Oxide Semiconductor,M0S)气体传感器与其他类型气体传感器(如电化学 式传感器、声表面波传感器、导电聚合物传感器等)相比具有体积小、成本低、响应恢复快、 使用寿命长等优点。随着微电子机械系统加工技术的进步,可以在Si衬底上实现阵列化,采 用这种工艺的微结构气体传感器功耗低、与半导体制造工艺兼容性好、便于集成。因此,基 于MOS气体传感器阵列的检测方法能够满足轻量化、快速、低成本的要求,易于实现多点、实 时测量。
[0003] 基于多个敏感特性不同的传感器优化组合构成传感器阵列,并结合先进的智能化 识别技术,可以形成高精度的气体辨识系统。然而,由于气敏元件存在本身固有的局限性, 其中最大缺陷之一就是存在特性漂移,使得基于MOS气体传感器的检测方法的测量精度、稳 定性和可靠性受到限制。通过改进敏感材料、器件结构和补偿电路的方法能在一定程度上 改善漂移问题,但使器件结构复杂化,提高了器件的成本,更主要的是仍不能从根本上解决 并达到理想的结果。
[0004] 目前,分类器集成的漂移补偿方法受到广泛关注,该方法的思想是利用不同数据 集合训练分类器,得到若干分类器模型,再将这些子分类器对待测数据的识别结果进行集 成,得到最终结果。然而,目前方法仍存在问题,一是数据集的时间段划分采用数据量均匀 分布的划分方法,没有考虑漂移变化的程度;二是目前的分类器的集成方法,仅用于定性分 析气体种类,而不能用于混合气体浓度的识别;三是采用的支持向量机方法中,没有考虑各 个样本点在模式识别过程中的重要程度的不同,预测精度有待提高。

【发明内容】

[0005] 针对现有技术中存在的上述问题,本发明的目的在于提供一种基于模糊划分和模 型集成的气体传感器阵列漂移补偿方法,用于单一或混合气体的浓度检测。该方法通过聚 类方法按照基线信号的漂移程度进行时间段划分,提高模型对传感器漂移变化影响的鲁棒 性;采用加权多输出支持向量回归,考虑各个样本点在回归过程中的重要程度的不同,从而 提高气体浓度测量的长期准确性和稳定性。
[0006] 为实现上述目的,本发明采用了如下的技术方案:
[0007] -种基于模糊划分和模型集成的气体传感器阵列浓度检测方法,具体步骤如下:
[0008] 步骤1:数据采集:采用样气流量系统(Sample Flow System,SFS)测量方法,采集 电子鼻检测系统中金属氧化物半导体气体传感器阵列的时间响应信号,提取在标准气体环 境下的基线响应数据和不同浓度的单一或混合气体下响应信号的特征数据;
[0009] 基线响应数据X〇(t)包含K个时间响应序列,X〇(t) = [XQl(t),XQ2(t),…,XQK(t) ],K 为气体传感器的个数,XQi ( t) = [ XQi ( tl),XQi (t2 ),…,XQi ( tN) ]Τ,tl,t2,…,tN为采样时刻,N为 样本个数,i表示第i个传感器,?ε[1,2,···,κ],[ · ]τ表示向量的转置;传感器阵列在不同 浓度的单一或混合气体下响应信号的特征数据为x(t) = [Xl(t),X2(t),…,XK(t)],其中Xi (t) = [Xil(t),Xi2(t),···,XiM(t)],M为每个传感器输出响应提取的特征数;
[0010] 步骤2:数据预处理:对步骤1采集的基线响应数据进行预处理,包括异常值剔除和 标准化两个步骤:
[0011] 异常值剔除的方法是首先计算样本均值和样本的标准偏差分别如下:
[0014] 然后判断基线响应数据与样本均值之差是否大于标准偏差的3倍,即 |%;(〇-飞1>3毛若大于,则剔除该基线数据样本,并使用样本平均值填充此数据,若小于,则 保留;
[0015] 采用阿特曼z-score方法标准化后的数据为
[0016] 步骤3:在预处理后的基线响应数据中加入对应的时间向量七=[1:132,一3~]1',得 到增广的基线矩阵数据4 W:=[i,4 (4,4 (0,…4 (0],令40切=(,则
[0017] 步骤4:采用聚类方法对步骤3得到的增广的基线矩阵数据进行分析,从时间上将 基线响应数据划分为C个不同时段的数据集DllD 2,…,DC,在同一时间段内传感器数据的漂 移程度较小,而不同时间段之间传感器数据的漂移程度差异相对较大。本发明采用的聚类 方法为一种改进的非监督模糊聚类方法,通过此方法可以将响应时间模糊划分为不同的时 间段及数据集,同时确定聚类中心(β:,^,···,^)及其隶属度函数矩阵。聚类中心是各聚类 中对象的均值所获得的"中心对象",用以计算聚类相似度及确定各类的划分范围;隶属度 函数表示每个样本点属于每个类的程度;该方法的具体步骤如下:
[0018] 步骤①:随机选取C个元素,作为C个类的中心,初始化隶属函数矩阵,给定聚类中 心改变量的阈值11ε(如11ε = 0.001);
[0019] 步骤②:确定目标函数;目标函数定义,
N为样本的个数,Ulj 为第i个数据点属于第j类的隶属度;氏是第j类的中心;Z为隶属度的加权指数, (XO(ti) ,?)为相似度度量方式;
[0020] 步骤③:确定相似度度量方式:经典的FCM方法采用欧氏距离,但是在噪音环境下, 采用欧氏度量的聚类方法有时不够稳定,且对于算法的初值、类的形状、大小都过于敏感; 本发明针对气体传感器的特性,考虑到传感器针对不同气体的敏感度不同,设计如下的相 似度度量方式:
式中ω=[ωι, ω2,···,ω κ]是与输入属性 相对应的权重向量,通过调整COk的值,数据Xlk与数据|^间的相似性会发生变化,反映了不 同传感器的影响程度,c〇ke[0,l],其值可通过实验进行选择,ω〇表示时间输入属性的向量 权重,取值为1;
[0021] 步骤④:最小化目标函数,重新计算C个类各自的中心和隶属度函数;模糊分组的 迭代过程中隶属度函数与聚类中心的更新分别为
[0022]
[0023] 步骤⑤:重复步骤④,直到聚类结果不再变化或相对上次得到的聚类中心的改变 量小于步骤①确定的阈值,得到最终确定的聚类中心&和隶属度函数U lj;
[0024] 步骤⑥:由于增广的基线矩阵数据X〇(t)的第一列元素为响应时间,因此相对应地 取每个聚类中心向量&的第一个元素按照从小到大排列构成(T 1J2r^Tc),作为每个时间 段划分的聚类中心时刻,体现了在每个时间段内传感器漂移随时间变化的程度是不同的, 然后计算与聚类中心时刻相对应的扩展宽丨
,则与聚 类中心时刻对应的时间段范围为[Τη δ」,ινιι· δ」],η为区间的重叠参数,调整η可以控 制时间段的重叠程度;
[0025] 步骤⑦:根据聚类方法得到的时间段范围[Tm · δ」,τ^ · δ」],将基线响应数据 划分为C个不同时段的数据集Di,D2,…,Dc,每个数据集的样本数为e彳iVA,TV tt,…,;
[0026] 步骤5:选取D1,D2,…,Dl作为训练集,L<C,DL+1,D L+2,…,Dc作为测试集;在每个训 练数据集内,采用加权多输出支持向量回归(WM - S V R )方法得到回归函数

[0029]通过在超球空间定义ε不敏感损失函数I(U),即定义一个能将各分量的拟合误差 都考虑进来的损失函数,使目标函数与各分量的误差&都有关,从而达到整体优化的目的; Luu〃」仕母个训班、果円,坟这个训练集的样本数为NDm,加权多输出支持向量回归方法为, 对回归函数/(.<)=丨「V(.V) + b,、目标是寻找W = [ Wi,W2,…,WQ ],b = [bi,b2,…,b0]τ,求解优化 问题:
[0028] J(W,b)为目标函数,C为惩罚因子,ε为松弛因子,yi为单一或混合气体浓度实际值,Q为输出 变量个数,即气体种类数。通过步骤4的模糊划分后,各样本点对聚类的隶属度是不同的,本 发明在标准M-SVR模型中引入权系数M,以调整各样本点在回归中的作用J 1选取的是步骤4 得到的样本点对于当前聚类的隶属度;
[0030] 具体步骤如下:
[0031 ] 步骤①:给定Ai,c,ε及回归结果误差Ui的阈值υε,设定初值κ = 〇,yK = 〇,bK = 0,i^ 迭代次数,γ = [ γ 1 γ 2··· γ q]t,γ i为线性组合系数,γ j与Wj之间的变换关系为
果误差 < 和拉格朗日乘子a ,,
[0032] 击3S?.诵付下忒i+笪徨SI vs、hs

是核函数矩阵,
[0033]
[0034]
[0035] 步骤③:计算下降方[
[0036] 步骤④:通过下式计算下一步的解γ K+1,bK+1
[0037]
[0038] 式中:步长ηκ的搜索方法为首先设ηκ=?,根据%=Φτγ」计算w K+1,判断目标函数J (WK+1,bK+1)<J(W K,bK)是否成立,如果不能,可将If乘以一个小于1的正数再计算WK+^b K+1, 直到满足 J(WK+1,bK+1)<J(WK,bK);
[0039] 步骤⑤:计算<+1和拉格朗日I
[0040] 步骤⑥:若<+1小于步骤①确定的阈值%,则输出最终确定的γ = yK+1,b=bK+1;否 贝1J,令K = K+1,返回步骤②;
[0041] 步骤⑦:得到这个训练集的回归函数
[0042]
[0043] 本发明采用的加权多输出支持向量回归方法求解的程序流程图如图3所示。
[0044] 步骤6 :在每个训练集内按步骤5计算得到的回归函数设为尺_,(勹,i = 1,2,…, L,把这些回归函数加权组合得到模型集成的回归预测模型:
[0045]
[0046] 然后确定每个训练集的权重系H
7友法为:对每个权重系数在[0, 1]区间内进行搜索,搜索间隔为0.02,计算样本浓度实际值71与预测值之间的均方根 误^
对权重系数在其搜索范围内的每一种情况得到的均方根误 差RMSE最小的那一组[名· .·,β^为最优权重系数;
[0047]步骤7:构建权重的拟和函数gj(t),j = [l,2,···,L],用以确定以下测试集的回归 预测模型的权重系数:
[0048]
[0049] 本步骤方法具体为:采用步骤6中得到的最优权重系数α1作为机器学习过程的结 果,最优权重系数α1对应的各训练集的中心时刻1\作为数据,即此学习过程的训练样本为
?于最小二乘支持向量回归的方法得到权重的拟
和函数gj(t);
[0050] 最小二乘支持向量回归方法中选取径向基核函数 P为核函数; 核参数S、惩罚因子、不敏感参数寻优算法采用基于粒子群智能全局优化算法的参数选择方 法;
[0051] 步骤8:测试阶段:根据步骤7得到的权重拟和函数gj(t)计算拟和权重S1(T1) lg2 (Ti ….m ;然后某干各子冋咁樽型与拟和叔重讲杆冋咁樽型的隼成
[0052]
[0053] 得到每个测试集内单一或混合气体的浓度预测最终值。
[0054]进一步地,步骤5中所述的采用加权多输出支持向量回归方法,核函数选取如下: 基于对局部核函数和全局核函数的综合考虑,构造基于多项式核函数1α(Χ,Χι) = (Χτ · X1+ !:穴和径向基核函!
?混合核函数k(x,xi)= γ ki(x,xi)+(l-y )k2 (x,Xl),既可实现径向基核函数在拟合优度上的优势,又可发挥多项式核函数在推广性能 上的长处。加权核函数权值的优化方法是在ki (X,Xi )、k2 (X,Xi)核参数确定的情况下,对每 个γ在区间[0,1]遍历,找出使测量均方误差最小的权值。
[0055]与现有技术相比,本发明的显著效果是:采用回归模型集成的方法进行传感器漂 移补偿,实现混合气体浓度的定量识别;按照基线信号的漂移程度进行训练子集的时间段 聚类划分,考虑了漂移变化的程度,减小子模型的建模误差,提高测量的长期准确性;采用 的加权多输出支持向量回归方法,考虑各个样本点在模式识别过程中的重要程度的不同, 提高了气体浓度测量的精度。
【附图说明】
[0056] 图1:本发明的基于模糊划分和模型集成的气体传感器阵列浓度检测方法的流程 图;
[0057] 图2:本发明所述的基于模糊划分和加权多输出支持向量回归模型集成的金属氧 化物气体传感器阵列浓度检测漂移补偿方法的流程图;
[0058] 图3:本发明中采用的加权多输出支持向量回归方法的程序流程图;
[0059] 图4:本发明实施例1中16个气体传感器在36个月内的基线信号图;
[0060] 图5:本发明实施例1中两种浓度预测方法对比:采用数据集l(batchl)作为训练集 建立模型,预测全部十个数据集的测量精度;采用前一个邻近的数据集作为训练集建立模 型,预测后一个数据集的测量精度;
[0061] 图6:本发明实施例1中采用基于模糊划分和加权多支持向量回归模型集成方法 (Fuzzy-ffMSVR method)与采用均勾划分和支持向量回归集成方法(Uniform-SVR method), 两种漂移补偿方法的误差对比图。
【具体实施方式】
[0062] 下面结合附图对本发明的具体实施方法和工作原理作进一步详细说明。
[0063] 实施例1
[0064] 本实施例中所使用的数据集是由A Vergara,S Vembu,T Ayhan,M Ryan,M Homer, R Huerta等人测量并公开的数据集,文献参见"Chemical gas sensor drift compensation using classifier ensembles.''Sensors and Actuators B:Chemical 166 (2012): 320-329。传感器阵列由Figaro公司的TGS2600、TGS2602、TGS2610和TGS26204组成, 每种4个共16个气体传感器。测试气体包括氨气、乙醛、丙酮、乙烯、乙醇和甲苯。每个传感器 对每个样本提取8个信号特征,包括两个稳态特征和6个瞬态特征。因此,每次测试可以由传 感器阵列获得一个128维的特征向量。测试历经三年(36个月),共计13910次测量。即数据集 为13910X128的矩阵。
[0065] 如图1所示,本方案提出的基于模糊划分和加权多输出支持向量回归模型集成的 金属氧化物气体传感器阵列浓度检测的漂移补偿方法,按照如下步骤进行:
[0066] 步骤1:数据采集:采用样气流量系统(Sample Flow System, SFS)测量方法 (Vergara等人测量并公开的数据集是采用这种测量方法的),采集电子鼻检测系统中金属 氧化物半导体气体传感器阵列的时间响应信号,提取在标准气体环境下的基线响应数据、 不同浓度的混合气体下响应信号的特征。
[0067] 基线响应数据X〇(t)包含K个时间响应序列,X〇(t) = [XQl(t),XQ2(t),…,XQK(t) ],K 为气体传感器的个数,XQi ( t) = [ XQi ( tl),XQi (t2 ),…,XQi ( tN) ]Τ,tl,t2,…,tN为采样时刻,N为 样本个数,i表示第i个传感器,?ε[1,2,···,κ],[ · ]τ表示向量的转置;传感器阵列在不同 浓度的单一或混合气体下响应信号的特征数据为x(t) = [Xl(t),X2(t),…,XK(t)],其中Xi (t) = [Xil(t),Xi2(t),···,XiM(t)],M为每个传感器输出响应提取的特征数;
[0068]由于数据集提取的两个稳态特征为电阻相对于基线的相对变化量△ R和电阻相对 于基线的绝对变化量
比,对于每个传 感器采集的前两个特征相除就得到了基线响应数彳
共为16维、13910次的测量 数据。采集的基线数据结果如图4所示。对被测气体的响应信号数据为128维、13910组数据。 [0069]步骤2:数据预处理:由图4可以看出,基线样本中的个别数值明显偏离所属样本的 其余观测值,即存在异常值,需要对采集的基线响应数据进行预处理,包括异常值剔除和标 准化两个步骤。异常值剔除的方法是首先在每个月内计算样本均值和样本的标准偏差分别 如下:
[0072] 然后判断基线数据与平均值之差是否大于标准偏差的3倍,即>e,:(〇-4|>Ma,,若大 于,则剔除该基线数据样本,并使用样本平均值填充此数据,若小于,则保留。
[0073] 采用阿特曼z-S core方法进行标准化后的数据为4


[0074] 步骤3:在预处理后的基线响应数据中加入对应的时间向量七=[1:132,"_3〃]1',得 到增广的基线矩阵数振
·则U时刻的基线数据可表 示为 -
_ ;如果数据采集周期是确定的(如每分钟、每小时 等),则可以具体的时间点进行划分。而本实施例中的数据集以月为单位进行实验设置和采 集,同时传感器漂移短期内变化不明显,因此以月为单位进行本实施例的模糊聚类划分是 合适的。即基线数据中的时间向量为1-36个月,而基线特征选择为每个月、每个传感器基线 响应数据的平均值、标准偏差、相对变化量和绝对变化量四个特征。
[0075] 步骤4:采用聚类方法对步骤3得到的增广的基线矩阵数据进行分析,从时间上将 基线响应数据划分为C个不同时段的数据集DllD 2,…,DC,在同一时间段内传感器数据的漂 移程度较小,而不同时间段之间传感器数据的漂移程度差异相对较大。本发明采用的聚类 方法为一种改进的非监督模糊聚类方法,通过此方法可以将响应时间模糊划分为不同的时 间段及数据集,同时确定聚类中心(?^,^,···,^)及其隶属度函数矩阵。聚类中心是各聚类 中对象的均值所获得的"中心对象",用以计算聚类相似度及确定各类的划分范围;隶属度 函数表示每个样本点属于每个类的程度;
[0076] 步骤③中ω =[ Co1, ω2,···,ωκ]是与输入属性相对应的一个权重向量,通过调整 c〇k(k=l,2,…,16)的值,反映了不同传感器的影响程度,ω 〇 = 1。通过实验选取ω = [ 1, 0.8,0.8,1.2,1.2,1.3,1.3,1,1,0.8,0.8,1,1,1.3,1.3]〇
[0077] 具体算法中,设置C=10,对36个月的13910个样本进行分组,聚类中心为,求得每 个类的扩展宽度心,通过聚类中心时刻对应的时间段范围[Tj-n · Sj,Tj-n · Sj]判断每个数 据点属于哪个子集,选取合适的重叠参数η控制子集的重叠程度。模糊分组的作用是减小各 组间边界数据的预测偏差。0=10,11=2.5时的聚类划分结果见表1。
[0078]表1:设置C= 10,η = 2.5时的模糊聚类划分结果
[0080]步骤5:选取前5个分组构成的数据集合01,02,03,04,0 5作为训练集,其余06,07,08, D9,Dio作为测试集。本实施例中由于乙烯的样本数据相对较多,且样本浓度分布广,因此选 择乙烯作为待测气体进行研究。在每个训练数据集内,采用加权多输出支持向量回归(WM-SVR)方法得到回归函数
,利用粒子群寻优算法确定算法参数。通 过步骤4的模糊划分后,各样本点对聚类的隶属度是不同的,本发明在标准M-SVR模型中引 入权系数\,以调整各样本点在回归中的作用A1选取的是步骤4得到的样本点对于当前聚 类的隶属度;
[0081 ]步骤6:在每个训练集内按步骤5计算得到的回归函数,设为/;丨胃@ (.τ),i = 1,2,…, L,把这?同丨丨=I函撒加*▽铂会犋刭爐沏隹成的同丨丨=1雨》丨爐沏.
[0082]
[0083]然后确定每个训练集的权重系藝
Γ法为:对每个权
重系数在[0,1]区间*计算样本浓度实际值71与预测值y-ew 之间的均方根误差 对权重系数在其搜索范围内的每一种情况得 到的均方根误差RMSE最小的那一纟
%最优权重系数。
[0084]步骤7:构建权重的拟和函数gj(t),j = [ 1,2,…,L],用以确定以下测试集的回归 预测模型的权重系数:
[0085]
[0086] 本步骤方法具体为:采用步骤6中得到的最优权重系数α1作为机器学习过程的结 果,最优权重系数α1对应的各训练集的中心时刻1\作为数据,即此学习过程的训练样本为
,基于最小二乘支持向量回归的方法得到权重的拟 和函数gj(t);
[0087] 最小二乘支持向量回归方法中选取径向基核函聲
乍为核函数; 核参数S、惩罚因子、不敏感参数寻优算法采用基于粒子群智能全局优化算法的参数选择方 法;
[0088] 步骤8:测试阶段:根据步骤7得到的权重拟和函数gj(t)计算拟和权重S1(T1) lg2 (T1),··· ^L(T1);然后基于各子回归模型与拟和权重进行回归模型的集成
[0089]
[0090] 得到每个测试集内单一或混合气体的浓度预测最终值。
[0091] 将数据集l(batchl)作为训练集建立模型,预测全部十个数据集的测量精度,如图 5所示,预测误差随着时间逐渐上升;采用前一个邻近的数据集作为训练集建立模型,预测 后一个数据集的测量精度,预测误差相对减小;可以看出由于传感器漂移的存在,使得模型 误差越来越大。本发明的方法与采用均匀时间划分及单支持向量回归方法进行比较,其预 测误差结果如图6所示,可以看出,本发明的方法有效地减小了预测误差,补偿了传感器长 期漂移的影响,体现了奔放明的显著效果。采用回归模型集成的方法进行传感器漂移补偿, 实现混合气体浓度的定量识别;按照基线信号的漂移程度进行训练子集的时间段聚类划 分,考虑了漂移变化的程度,减小子模型的建模误差,提高测量的长期准确性;采用的加权 多输出支持向量回归方法,考虑各个样本点在模式识别过程中的重要程度的不同,提高了 气体浓度测量的精度。
【主权项】
1.基于模糊划分和模型集成的气体传感器阵列漂移补偿方法,其步骤如下: 步骤1:数据采集:采用样气流量系统测量方法,采集电子鼻检测系统中金属氧化物半 导体气体传感器阵列的时间响应信号,提取在标准气体环境下的基线响应数据X〇(t)和不 同浓度的单一或混合气体下响应信号的特征数据义(*) = ^1(〇,义24),-,,站4)],其中,1( 为气体传感器的个数; 步骤2:数据预处理:对步骤1采集的基线响应数据进行预处理,包括异常值剔除和标准 化两个步骤: 异常值剔除的方法是首先计算样本均值和样本的标准偏差分别如下:然后判断基线响应数据与样本均值之差是否大于标准偏差的3倍,即μ。,如 若大于,则剔除该基线数据样本,并使用样本平均值填充此数据,若小于,则保留; 采用阿特曼方法标准化后的数据为如0 = 请(0,…,成W],其中步骤3:在预处理后的基线响应数据中加入对应的时间向量t=[tl,t2,…,tN]T,得到增 广的基线矩阵数据為(0 = [。;,(0,4(0,-,瑞(巧,令.冷(0=^,则*1时刻的基线数据可表示为 而(0 =[诗,(0,瑞(0,4 (0,...,端-(U]; 步骤4:采用聚类方法对步骤3得到的增广的基线矩阵数据进行分析,具体步骤如下: 步骤①:随机选取C个元素,作为C个类的中屯、,初始化隶属函数矩阵,给定聚类中屯、改 变量的阔值Ue ; 步骤②:确定目标函数;目标函数定义夫,N为样本的个数,UU为第i 个数据点属于第j类的隶属度;是第j类的中屯、;Z为隶属度的加权指数,l《z<-;d(x〇 (ti),W为相似度度量方式; 步骤③:确定相似度度量方式:设计相似度度量方式为式中ω=[ωι,ω2,…,ωκ]是与输入属性相对应的权重向 量,ω ke [0,1 ],其值可通过实验进行选择,ω 0表示时间输入属性的向量权重,取值为1; 步骤④:最小化目标函数,重新计算C个类各自的中屯、和隶属度函数;模糊分组的迭代 过程中隶属度函数与聚类中屯、的更新分别为步骤⑤:重复步骤④,直到聚类结果不再变化或相对上次得到的聚类中屯、和隶属度函 数的改变量小于预先确定的阔值,得到最终确定的聚类中屯、01和隶属度函数Uij; 步骤⑥:由于增广的基线矩阵数据X〇(t)的第一列元素为响应时间,因此相对应地取每 个聚类中屯、向量权的第一个元素按照从小到大排列构成(。,了2,-,,孔),作为每个时间段划 分的聚类中屯、时刻,体现了在每个时间段内传感器漂移随时间变化的程度是不同的,然后 计算与聚类中屯、时刻相对应的扩展宽度./ = 1,1.~,(.',则与聚类中 屯、时刻对应的时间段范围为[T广η · δ^,τ广η · ,11为区间的重叠参数,调整η可W控制时 间段的重叠程度; 步骤⑦:根据聚类方法得到的时间段范围[Τ广η · δ^,τ广η · δ^,将基线响应数据划分为 C个不同时段的数据集化,…,Dc,每个数据集的样本数为e ? iV〇,,iVA,-viVAh 步骤5:选取Di,D2,…,Dl作为训练集,L<C,Dl+1,Dl+2,…,Dc作为测试集;在每个训练数据 集内,采用加权多输出支持向量回归(W Μ - S V R )方法得到回归函数 'f WM幻化,f机拉巧' ..., fmc'常; 在每个训练集内,设运个训练集的样本数为Nd",加权多输出支持向量回归方法为,对回 归函数/(y)=矿>(、')十b,目标是寻找W = [W1,W2,…,WQ],b = [bi,b2,...,bQ]T,求解优化问 题:步骤6:在每个训练集内按步骤5计算得到的回归函数设为游胃村,j = 1,2,…,L,把运 些回归函数加权组合得到模型集成的回归预测模型:然后确定每个训练集的权重系数&' = > / = 1,2,...,五 >方法为:对每个权重系 数在[(U]区间内进行捜索,捜索间隔为0.02,计算样本浓度实际值yi与预测值ymodel,么间 的均方根误差对权重系数在其捜索范围内的每一种情况得到的 均方根误差RMSE最小的那一组[?1',《;,一,《。为最优权重系数; 步骤7:构建权重的拟和函数&(*)〇' = [1,2,一,山,用^确定^下测试集的回归预测模 型的权重系数:本步骤方法具体为:采用步骤6中得到的最优权重系数〇1作为机器学习过程的结果,最 优权重系数对应的各训练集的中屯、时刻Τι作为数据,即此学习过程的训练样本为 (7;,巧',),(7>;,),~,(7:冶,),/ = [1.2...,么],基于最小二乘支持向量回归的方法得到权重的拟 和函数gj(t); 最小二乘支持向量回归方法中选取径向基核函勤作为核函数;核参 数δ、惩罚因子、不敏感参数寻优算法采用基于粒子群智能全局优化算法的参数选择方法; 步骤8:测试阶段:根据步骤7得到的权重拟和函数g^t)计算拟和权重gi(Ti),g2 (Τι),…,gL(Ti);然后基于各子回归模型与拟和权重进行回归模型的集成 乂 (.X)=各1 (7,.)/wwsrR (.r) + g:巧)/;fMsra (.x)"! 巧)/ifMsra (.X),'·=把心..,口得到母个测试 集内单一或混合气体的浓度预测最终值。2. 如权利要求1所述的基于模糊划分和模型集成的气体传感器阵列漂移补偿方法,其 特征在于:步骤1所述的基线响应数据X〇(t)包含K个时间响应序列,X〇(t) = [XOl(t) ,X02 (t) ,··· ,X0K(t)],X0i(t) = [X0i(tl) ,X0i(t2),…,X0i(tN)]T,tl,t2,…,tN为采样时刻,N为样本 个数,i表示第i个传感器,?ε[1,2,···,κ],[ · ]τ表示向量的转置;传感器阵列在不同浓度 的单一或混合气体下响应信号的特征数据为义4) = ^1(〇,义24),-,,站4)],其中义1(〇 = [Xil(t) ,Xi2(t),…,XiM(t)],Μ为每个传感器输出响应提取的特征数,:Xij(t) = [Xij(tl) ,Xij (t2),...,Xij(tN)]T, jE [1,2,... ,Μ]。3. 如权利要求1所述的基于模糊划分和模型集成的气体传感器阵列漂移补偿方法,其 特征在于:步骤5所述的回归函数,具体步骤如下: 具体步骤如下: 步骤①:给定λι,(3,ε及回归结果误差化的阔值Ue,设定初值κ = 〇, 丫 K = 0,bK = 0,K为迭代 次数,丫 = [丫 1 丫 2…丫 Q]T,丫 J为线性组合系数,丫 J与Wj之间的变换关系为计算回归结果误差喊和拉格朗日乘子a 1,步骤②:通过下式计算得到丫 s、bS式中:丫 s= [丫 1 丫 2 …丫 Q]T,bs=[bl b2 …bQ]T,。=["1 幻2 公。=麻訪α,,α"…,α町J = 中=「<,。(.、'1 ),(φ-])?,'、一^ 步骤③:计算下降方向步骤④:通过下式计算下一步的解丫 "1,b"i式中:步长rf的捜索方法为首先设rf= 1,根据wj= Φ I 丫八十算r",判断目标函数J(WK", B"i)<J(WK,bK)是否成立,如果不能,可将rf乘W-个小于1的正数再计算W"哺b"i,直到满 足 J(W"i,b"i)<J(WK,bK); 步骤⑤:计算和拉格朗日乘子曰1 :步骤⑥:若皆+1小于步骤①确定的阔值Ue,则输出最终确定的丫二丫 "i,b = b"i;否则, 令κ = κ+1,返回步骤②; 步骤⑦:得到运个训练集的回归函数
【文档编号】G01N27/12GK105938116SQ201610438967
【公开日】2016年9月14日
【申请日】2016年6月20日
【发明人】王庆凤, 卢革宇, 孙鹏
【申请人】吉林大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1