基于半监督学习的电子鼻室内毒气智能识别方法

文档序号：9288604阅读：365来源：国知局

基于半监督学习的电子鼻室内毒气智能识别方法
【技术领域】
[0001] 本发明涉及电子鼻信号处理中的分类识别技术，具体地说，是一种基于半监督学习的电子鼻室内毒气智能识别方法。
【背景技术】
[0002] 目前，对于室内毒气检测，为了保证检测结果的正确性，所采用的电子鼻系统在训练阶段需采用大量的学习样本，一般来说，使用有标签数据训练得到的电子鼻对毒气的分类正确率要高于基于无标签数据训练得到的电子鼻，但是无标签数据要比有标签数据更容易获取。
[0003] 因此，有人提出了半监督学习技术，通过半监督学习技术可以帮助电子鼻不仅从训练样本中学习相关模式，也可从未知标签样本中学习相关知识，从而实现对某种气味模式的持续学习即直到识别率不再发生任何提高为止。
[0004] 但是，已提出的半监督学习技术存在的不足：一是很大一部分半监督学习技术针对的是二分类问题，而室内毒气的种类远不止两类，因此无法满足应用需求；二是可进行多分类的半监督学习算法，其分类器规模又被限定，导致对测试样本的学习效果不佳，分类精度不高。

【发明内容】

[0005] 针对现有技术的不足，本发明的目的是提供一种基于半监督学习的电子鼻室内毒气智能识别方法，该方法提高了基本分类器规模，具有更强的从未知标签样本中学习气味模式的能力，能够使得电子鼻对每一种毒气的模式识别率达到最理想的水平。
[0006] 为达到上述目的，本发明采用的技术方案如下：
[0007] -种基于半监督学习的电子鼻室内毒气智能识别方法，其关键在于按照以下步骤进行：
[0008] 步骤1 :获取已知标签的毒气样本数据集L与未知标签的毒气样本数据集U，预设基本分类器的数目M = 3,当前训练次数为t ;
[0009] 步骤2 :从已知标签的毒气样本数据集L中随机产生M个规模相等的子集L1来训练每个基本分类器C1, i = 1~M ;
[0010] 步骤3 :利用步骤2训练出的每个基本分类器对已知标签的毒气样本数据集L进行分类识别，得到每个分类器的初始识别率，利用简单投票法对所有分类器的判别结果进行整合，得到系统初始识别率；
[0011] 步骤4 :设第i个基本分类器C1为主分类器，采用主分类器对未知标签的毒气样本数据集U中的数据进行分类，并采用其余的M-I个基本分类器对未知标签的毒气样本数据集U中数据的标签进行预测，得到预测错误率 ei(t);
[0012] 步骤5 :当本次训练出的基本分类器的预测错误率ei(t)低于上一次预测错误率 ei (t-Ι)时，如果未知标签的毒气样本数据集U中的数据被其余M-I个基本分类器投票的结果超过预设的阈值θ，则将该数据并入数据集L1U)中；
[0013] 步骤6 :判断是否满足其中Il1U) I表示本次训练数据集L1U)的规模，IL1U-I) I表不上一伏训珎数据果L1U-I)的规模，ejt)表示本次训练出的基本分类器C1的预测错误率，e i (t-ι)表示上一次训练出的基本分类器C1的预测错误率；
[0014] 如果满足，则利用步骤5所得的新的数据集L1 (t)和原始的数据子集1^对基本分类器(^进行重新训练；
[0015] 否则，从步骤5所得的新的数据集L1⑴中随机移除s个样本后再和原始的数据子集L1对基本分类器c i进行重新训练，其中：，int () 为取整函数；
[0016] 步骤7 :按照i = 1~M依次对M个基本分类器进行步骤4至步骤6的操作，直至每个基本分类器的识别率不再发生变化；
[0017] 步骤8 :按照M = M+1增加基本分类器的数目，重复步骤2至步骤7的操作，直至系统的识别率达到预期目标。
[0018] 在实施过程中，所述基本分类器使用支持向量机或人工神经网络构建，当然也可以采用其他的分类识别算法构建基本分类器。
[0019] 作为优选，步骤4中按照/Κ/) '计算预测错误率，其中ni(t)表示在第 t次训练时，未知标签的毒气样本数据集U中被其余M-I个基本分类器预测并获得标签的样本，n/ (t)表示未知标签的毒气样本数据集U中被其余M-I个基本分类器预测并获得正确标签的样本。
[0020] 本发明中，采用已知标签的毒气样本数据集L的样本训练每一个基本分类器，在每次学习循环中每一个基本分类器轮流作为主分类器，通过主分类器对未知标签样本数据集U进行分类，并利用其余的基本分类器对样本数据集U中数据的标签进行预测，在投票表决结果中，如果数据集U中某一数据标签的投票数超过预先设置好的阈值时，则该样本数据连同它的标签将被用来与原始的数据集L 一起重新训练分类器，最后再通过增加分类器的数目来判定系统的识别率是否已经达到最优，这样训练后的分类器不仅具有更多的基本分类器规模，而且具有更强的从未知标签样本中学习气味模式的能力。
[0021] 本发明的显著效果是：相较于现有分类识别算法，不仅提高了基本分类器规模，而且具有更强的从未知标签样本中学习气味模式的能力，使得最终获得的电子鼻对每一种毒气的模式识别率达到最理想的水平。
【具体实施方式】
[0022] 下面对本发明的【具体实施方式】以及工作原理作进一步详细说明。
[0023] -种基于半监督学习的电子鼻室内毒气智能识别方法，按照以下步骤进行：
[0024] 步骤I :获取已知标签的毒气样本数据集L与未知标签的毒气样本数据集U，预设基本分类器的数目M = 3,当前训练次数为t ;
[0025] 步骤2 :从已知标签的毒气样本数据集L中随机产生M个规模相等的子集L1来训练每个基本分类器C1, i = 1~M ;
[0026] 步骤3 :利用步骤2训练出的每个基本分类器对已知标签的毒气样本数据集L进行分类识别，得到每个分类器的初始识别率，利用简单投票法对所有分类器的判别结果进行整合，得到系统初始识别率；
[0027] 步骤4 :设第i个基本分类器C1为主分类器，采用主分类器对未知标签的毒气样本数据集U中的数据进行分类，并采用其余的M-I个基本分类器对未知标签的毒气样本数据集U中数据的标签进行预测，得到预测错误率 ei(t);
[0028] 步骤5 :当本次训练出的基本分类器的预测错误率ei(t)低于上一次预测错误率 ei (t-Ι)时，如果未知标签的毒气样本数据集U中的数据被其余M-I个基本分类器投票的结果超过预设的阈值Θ，则将该数据并入数据集L 1U)中；
[0029] 步骤6 :判断是否满{
其中I L1 (t) I表示本次训练数据集L1U)的规模，Il1U-I) I表示上一次训练数据集L1U-I)的规模，ei(t)表示本次训练出的基本分类器C1的预测错误率，e i (t-ι)表示上一次训练出的基本分类器C1的预测错误率；
[0030] 如果满足，则利用步骤5所得的新的数据集L1 (t)和原始的数据子集1^对基本分类器(^进行重新训练；
[0031] 否则，从步骤5所得的新的数据集L (t)中随机移除s个样本后再和原始的数据子集L1对基本分类器c i进

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贾鹏飞;段书凯;王丽丹;葛灵普;黄泰来;朱赛克;高锦程;陈祥宇;闫嘉;
技术所有人：西南大学;
我是此专利的发明人

上一篇：一种半色调图像分类方法
上一篇：一种基于视觉词汇的遥感图像地物分类方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。