基于半监督学习的电子鼻室内毒气智能识别方法

文档序号:9288604阅读:365来源:国知局
基于半监督学习的电子鼻室内毒气智能识别方法
【技术领域】
[0001] 本发明涉及电子鼻信号处理中的分类识别技术,具体地说,是一种基于半监督学 习的电子鼻室内毒气智能识别方法。
【背景技术】
[0002] 目前,对于室内毒气检测,为了保证检测结果的正确性,所采用的电子鼻系统在训 练阶段需采用大量的学习样本,一般来说,使用有标签数据训练得到的电子鼻对毒气的分 类正确率要高于基于无标签数据训练得到的电子鼻,但是无标签数据要比有标签数据更容 易获取。
[0003] 因此,有人提出了半监督学习技术,通过半监督学习技术可以帮助电子鼻不仅从 训练样本中学习相关模式,也可从未知标签样本中学习相关知识,从而实现对某种气味模 式的持续学习即直到识别率不再发生任何提高为止。
[0004] 但是,已提出的半监督学习技术存在的不足:一是很大一部分半监督学习技术针 对的是二分类问题,而室内毒气的种类远不止两类,因此无法满足应用需求;二是可进行多 分类的半监督学习算法,其分类器规模又被限定,导致对测试样本的学习效果不佳,分类精 度不高。

【发明内容】

[0005] 针对现有技术的不足,本发明的目的是提供一种基于半监督学习的电子鼻室内毒 气智能识别方法,该方法提高了基本分类器规模,具有更强的从未知标签样本中学习气味 模式的能力,能够使得电子鼻对每一种毒气的模式识别率达到最理想的水平。
[0006] 为达到上述目的,本发明采用的技术方案如下:
[0007] -种基于半监督学习的电子鼻室内毒气智能识别方法,其关键在于按照以下步骤 进行:
[0008] 步骤1 :获取已知标签的毒气样本数据集L与未知标签的毒气样本数据集U,预设 基本分类器的数目M = 3,当前训练次数为t ;
[0009] 步骤2 :从已知标签的毒气样本数据集L中随机产生M个规模相等的子集L1来训 练每个基本分类器C1, i = 1~M ;
[0010] 步骤3 :利用步骤2训练出的每个基本分类器对已知标签的毒气样本数据集L进 行分类识别,得到每个分类器的初始识别率,利用简单投票法对所有分类器的判别结果进 行整合,得到系统初始识别率;
[0011] 步骤4 :设第i个基本分类器C1为主分类器,采用主分类器对未知标签的毒气样本 数据集U中的数据进行分类,并采用其余的M-I个基本分类器对未知标签的毒气样本数据 集U中数据的标签进行预测,得到预测错误率 ei(t);
[0012] 步骤5 :当本次训练出的基本分类器的预测错误率ei(t)低于上一次预测错误率 ei (t-Ι)时,如果未知标签的毒气样本数据集U中的数据被其余M-I个基本分类器投票的结 果超过预设的阈值θ,则将该数据并入数据集L1U)中;
[0013] 步骤6 :判断是否满足 其中Il1U) I表示本次训练数据 集L1U)的规模,IL1U-I) I表不上一伏训珎数据果L1U-I)的规模,ejt)表示本次训练 出的基本分类器C1的预测错误率,e i (t-ι)表示上一次训练出的基本分类器C1的预测错误 率;
[0014] 如果满足,则利用步骤5所得的新的数据集L1 (t)和原始的数据子集1^对基本分 类器(^进行重新训练;
[0015] 否则,从步骤5所得的新的数据集L1⑴中随机移除s个样本后再和原始的数据 子集L1对基本分类器c i进行重新训练,其中:,int () 为取整函数;
[0016] 步骤7 :按照i = 1~M依次对M个基本分类器进行步骤4至步骤6的操作,直至 每个基本分类器的识别率不再发生变化;
[0017] 步骤8 :按照M = M+1增加基本分类器的数目,重复步骤2至步骤7的操作,直至 系统的识别率达到预期目标。
[0018] 在实施过程中,所述基本分类器使用支持向量机或人工神经网络构建,当然也可 以采用其他的分类识别算法构建基本分类器。
[0019] 作为优选,步骤4中按照/Κ/) '计算预测错误率,其中ni(t)表示在第 t次训练时,未知标签的毒气样本数据集U中被其余M-I个基本分类器预测并获得标签的样 本,n/ (t)表示未知标签的毒气样本数据集U中被其余M-I个基本分类器预测并获得正确 标签的样本。
[0020] 本发明中,采用已知标签的毒气样本数据集L的样本训练每一个基本分类器,在 每次学习循环中每一个基本分类器轮流作为主分类器,通过主分类器对未知标签样本数据 集U进行分类,并利用其余的基本分类器对样本数据集U中数据的标签进行预测,在投票表 决结果中,如果数据集U中某一数据标签的投票数超过预先设置好的阈值时,则该样本数 据连同它的标签将被用来与原始的数据集L 一起重新训练分类器,最后再通过增加分类器 的数目来判定系统的识别率是否已经达到最优,这样训练后的分类器不仅具有更多的基本 分类器规模,而且具有更强的从未知标签样本中学习气味模式的能力。
[0021] 本发明的显著效果是:相较于现有分类识别算法,不仅提高了基本分类器规模,而 且具有更强的从未知标签样本中学习气味模式的能力,使得最终获得的电子鼻对每一种毒 气的模式识别率达到最理想的水平。
【具体实施方式】
[0022] 下面对本发明的【具体实施方式】以及工作原理作进一步详细说明。
[0023] -种基于半监督学习的电子鼻室内毒气智能识别方法,按照以下步骤进行:
[0024] 步骤I :获取已知标签的毒气样本数据集L与未知标签的毒气样本数据集U,预设 基本分类器的数目M = 3,当前训练次数为t ;
[0025] 步骤2 :从已知标签的毒气样本数据集L中随机产生M个规模相等的子集L1来训 练每个基本分类器C1, i = 1~M ;
[0026] 步骤3 :利用步骤2训练出的每个基本分类器对已知标签的毒气样本数据集L进 行分类识别,得到每个分类器的初始识别率,利用简单投票法对所有分类器的判别结果进 行整合,得到系统初始识别率;
[0027] 步骤4 :设第i个基本分类器C1为主分类器,采用主分类器对未知标签的毒气样本 数据集U中的数据进行分类,并采用其余的M-I个基本分类器对未知标签的毒气样本数据 集U中数据的标签进行预测,得到预测错误率 ei(t);
[0028] 步骤5 :当本次训练出的基本分类器的预测错误率ei(t)低于上一次预测错误率 ei (t-Ι)时,如果未知标签的毒气样本数据集U中的数据被其余M-I个基本分类器投票的结 果超过预设的阈值Θ,则将该数据并入数据集L 1U)中;
[0029] 步骤6 :判断是否满{
其中I L1 (t) I表示本次训练数据 集L1U)的规模,Il1U-I) I表示上一次训练数据集L1U-I)的规模,ei(t)表示本次训练 出的基本分类器C1的预测错误率,e i (t-ι)表示上一次训练出的基本分类器C1的预测错误 率;
[0030] 如果满足,则利用步骤5所得的新的数据集L1 (t)和原始的数据子集1^对基本分 类器(^进行重新训练;
[0031] 否则,从步骤5所得的新的数据集L (t)中随机移除s个样本后再和原始的数据 子集L1对基本分类器c i进
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1