基于可分离度和相异度的电子鼻信号特征融合方法与流程

文档序号:11865414阅读:209来源:国知局

本发明涉及电子鼻信号与信息处理技术领域,具体涉及一种基于可分离度和相异度的电子鼻信号特征融合方法。



背景技术:

电子鼻作为一种模仿生物嗅觉系统的智能装置能够可靠并且快速的实现对简单或者复杂气味的辨别,相对于传统的气相色谱仪等昂贵的气体分析仪器,它操作简单,分析结果可靠,且适合现场检测,因而被广泛应用于食品、农业、医疗、环境检测等领域。

现有电子鼻信号特征融合方法主要有三类:1、采用多种类型的传感器构成阵列并获取信号,然后对这些信号进行特征提取,比如在时域上的最大值、最大斜率、曲线积分、曲线拟合系数等,在变换域上的傅里叶变换系数、小波变换系数等,再将这些特征直接融合后送入分类器识别;2、在提取的原始数据的基础上进行降维处理,比如主成分分析、线性判别分析、局部保留映射等等,再将降维后的特征送入分类器识别;3、采用遗传算法、粒子群算法、蚁群算法等生物优化算法对提取的原始数据进行优化选择,优化后的数据再送入分类器识别。

以上电子鼻信号特征融合方法的不足之处:1、方法1并没有考虑到传感器阵列提取的信号可能包含的冗余信息对分类识别的影响;2、方法2只能处理一些有线性相关关系的特征且有信息损失;3、方法3所用的生物智能优化算法对提取的特征进行优化时会消耗大量的时间,而且容易陷入局部最优;4、现有的电子鼻特征提取以后都是直接作为分类器输入进行模式识别,并没有进一步提高决策层即分类器层的性能。



技术实现要素:

本申请通过提供一种基于可分离度和相异度的电子鼻信号特征融合方法,既解决现有技术中电子鼻信号特征间的冗余问题,又避免了生物优化算法的耗时的技术问题,且大大提高了电子鼻分类识别性能。

为解决上述技术问题,本申请采用以下技术方案予以实现:

一种基于可分离度和相异度的电子鼻信号特征融合方法,包括如下步骤:

S1:对电子鼻信号进行特征提取,得到原始模式样本,原始特征矩阵为:X={X1,X2,...,XM},式中,Xj(j=1,2,…,M)为矩阵X的子集,M为原始模式样本的维数,电子鼻信号总类别数为C,第n类样本的个数为Kn,n=1,2,…,C,总的样本个数第n类的第i个样本的第m维特征为Xmn(i),其中,i=1,2,…,Kn,m=1,2,…,M;

S2:特征选择:

S21:计算每个特征的可分离度CS,选择可分离度最大的特征作为最优一维特征,并计算该特征的分类识别率;

S22:从剩余的特征中任意选择一个特征与最优一维特征组成一个二维特征集,此时可得到M-1个不同的二维特征集,分别计算这M-1个二维特征集的可分离度CS和相异度DI之和,将该和最大的两个特征作为选择二维特征时的最优特征集,并计算该最优二维特征的分类识别率;

S23:从除了步骤S22选择的最优二维特征以外剩余的特征中任意选择一个新的特征,加入最优二维特征后组成一个三维特征集,此时可得到M-2个不同的三维特征集,分别计算这M-2个三维特征的平均可分离度式中D=3为将要选择的最优特征集的维度数,fi为选择的某个特征,分别计算M-2个三维特征集中两两特征组合的相异度之和DI,其中三维特征的两两组合共有6种情况,算得这六种情况的平均相异度为最后把平均可分离度CS′和平均相异度DI'相加;

S24:选择平均可分离度和平均相异度之和最大的三个特征作为选择三维特征的最优特征集,并计算该最优三维特征集的分类识别率;

S25:设置D=D+1,判断D是否大于M,如果是,则进入步骤S28,否则,跳转至步骤S26;

S26:从除了最优D-1维特征以外的剩余特征中任意选择一个新的特征,加入之前选择的最优D-1维特征组成D维特征集,可得到M-D+1个不同的D维特征集,计算这M-D+1个D维特征集的平均可分离度同时计算这M-D+1个D个特征集中两两特征组合的相异度之和DI,算得这D个特征的平均相异度为然后把平均可分离度CS′和平均相异度DI'相加,为D个特征集中两两特征组合的组合数;

S27:选择D维平均可分离度和平均相异度之和最大的D维特征作为选择D维特征的最优特征集,并计算该最优D维特征集的分类识别率,随后进入步骤S25;

S28:选择分类识别率最高的特征维数为最优维度,其对应的特征集为最优特征集;

S3:特征加权融合:设有L种基特征,C个类别:

S31:L种基特征对所有样本进行识别,得到L个分类正确率a=[a1,a2,…,aL],通过准确率计算权重w=[w1,w2,…wL],其中,

S32:对L种基特征对每个样本的分类结果进行量化编码,如果对第一种基特征分类器判别为第一类,则编码为δ1=[1,0,…0]1×C,如果判别为第二类,则编码为δ1=[0,1,…0]1×C,以此类推,如果对第L种基特征,分类器判别为第C类,则编码为δL=[0,0,…1]1×C,最后得到这L种基特征对该样本的分类结果为:

S33:对分类结果进行融合,融合后的结果如下:f=[f1,f2,…fC]=w·δ;

S34:最后的融合策略为:predict_label=max[f1,f2,…,fC],即融合结果的值最大的类别为最后融合判别的类。

进一步地,步骤S2中可分离度的具体计算方法为:

第n类第m维特征的均值向量为:

每一类样本中的每一个样本和均值向量μmn之间的欧式距离为:dmn(i)=||Xmn(i)-μmn||;

欧式距离dmn(i)的均值为:

欧式距离dmn(i)的方差为:

则特征的类内离散度为:

定义均值向量μmn和所有样本的总均值向量μm的欧式距离为:dmn=||μmnm||;其中,

dmn的均值为:

dmn的方差为:

可看作特征的类间离散度,则特征的可分离度

进一步地,相异度DI(fi,fj)=1-|ρ(fi,fj)|,式中,ρ(fi,fj)是特征fi和fj之间的相关系数,i,j=1,2,…,M。

与现有技术相比,本申请提供的技术方案,具有的技术效果或优点是:本发明在降维去除冗余的同时,最大限度的保留了分类信息,大大提高了电子鼻的分类识别率。

附图说明

图1为本发明的方法流程图。

具体实施方式

本申请实施例通过提供一种基于可分离度和相异度的电子鼻信号特征融合方法,既解决现有技术中电子鼻信号特征间的冗余问题,又避免了生物优化算法的耗时的技术问题,且大大提高了电子鼻分类识别性能。

为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式,对上述技术方案进行详细的说明。

实施例

一种基于可分离度和相异度的电子鼻信号特征融合方法,其特征在于,包括如下步骤:

S1:对电子鼻信号进行特征提取,得到原始模式样本,原始特征矩阵为:X={X1,X2,...,XM},式中,Xj(j=1,2,…,M)为矩阵X的子集,M为原始模式样本的维数,电子鼻信号总类别数为C,第n类样本的个数为Kn,n=1,2,…,C,总的样本个数第n类的第i个样本的第m维特征为Xmn(i),其中,i=1,2,…,Kn,m=1,2,…,M;

S2:特征选择:

S21:计算每个特征的可分离度CS,选择可分离度最大的特征作为最优一维特征,并计算该特征的分类识别率;

可分离度的具体计算方法为:

第n类第m维特征的均值向量为:

每一类样本中的每一个样本和均值向量μmn之间的欧式距离为:dmn(i)=||Xmn(i)-μmn||;

欧式距离dmn(i)的均值为:

欧式距离dmn(i)的方差为:

则特征的类内离散度为:

定义均值向量μmn和所有样本的总均值向量μm的欧式距离为:dmn=||μmnm||;其中,

dmn的均值为:

dmn的方差为:

可看作特征的类间离散度,则特征的可分离度

S22:从剩余的特征中任意选择一个特征与最优一维特征组成一个二维特征集,此时可得到M-1个不同的二维特征集,分别计算这M-1个二维特征集的可分离度CS和相异度DI之和,将该和最大的两个特征作为选择二维特征时的最优特征集,并计算该最优二维特征的分类识别率;

S23:从除了步骤S22选择的最优二维特征以外剩余的特征中任意选择一个新的特征,加入最优二维特征后组成一个三维特征集,此时可得到M-2个不同的三维特征集。分别计算这M-2个三维特征的平均可分离度式中D=3,为将要选择的最优特征集的维度数,fi为选择的某个特征。分别计算M-2个三维特征集中两两特征组合的相异度之和DI,其中三维特征的两两组合共有6种情况,算得这六种情况的平均相异度为最后把平均可分离度CS′和平均相异度DI'相加;

S24:选择平均可分离度和平均相异度之和最大的三个特征作为选择三维特征的最优特征集,并计算该最优三维特征集的分类识别率;

S25:设置D=D+1,判断D是否大于M,如果是,则进入步骤S28,否则,跳转至步骤S26;

S26:从除了最优D-1维特征以外的剩余特征中任意选择一个新的特征,加入之前选择的最优D-1维特征组成D维特征集,可得到M-D+1个不同的D维特征集。计算这M-D+1个D维特征集的平均可分离度同时计算这M-D+1个D个特征集中两两特征组合的相异度之和DI,最后算得这D个特征的平均相异度为为D个特征集中两两特征组合的组合数,最后把平均可分离度CS′和平均相异度DI'相加;

S27:选择D维平均可分离度和平均相异度之和最大的D维特征作为选择D维特征的最优特征集,并计算该最优D维特征集的分类识别率,随后进入步骤S25;

S28:选择分类识别率最高的特征维数为最优维度,其对应的特征集为最优特征集;

S3:特征加权融合:设有L种基特征,C个类别,

S31:L种基特征对所有样本进行识别,得到L个分类正确率a=[a1,a2,…,aL],通过准确率计算权重w=[w1,w2,…wL],其中,

S32:对L种基特征对每个样本的分类结果进行量化编码,如果对第一种基特征分类器判别为第一类,则编码为δ1=[1,0,…0]1×C,如果判别为第二类,则编码为δ1=[0,1,…0]1×C,以此类推,如果对第L种基特征,分类器判别为第C类,则编码为δL=[0,0,…1]1×C。最后得到这L种基特征对该样本的分类结果为:

S33:对分类结果进行融合,融合后的结果如下:f=[f1,f2,…fC]=w·δ

S34:最后的融合策略为:predict_label=max[f1,f2,…,fC],即融合结果的值最大的类别为最后融合判别的类。

如图1所示,为本发明的方法流程图。

为了进一步验证本发明的效果,本实施例选择14个金属氧化物传感器和1个电化学传感器构建电子鼻传感器阵列,对三种细菌感染(各20组实验)和非感染伤口(20组实验)一共做了80组实验,即样本总数N=80。对原始实验数据提取响应最大值、傅里叶系数直流分量和一阶谐波、5个小波近似系数作为原始特征,即L=8。为了验证本方法效果,我们采用K最邻近分类算法作为分类器。表1为不同特征融合方法得到的分类识别率。

表1 不同特征融合方法得到的分类识别率

从表1可以看出,特征矩阵如果不进行特征选择直接送入分类器进行模式识别的分类正确率仅为83.75%和87.50%,而进行特征选择后的识别率对应为88.75%、96.25%,说明特征之间存在很多冗余信息影响分类效果。而本专利提出的特征选择方法,在降维去除冗余的同时,最大限度的保留了分类信息,提高了分类识别率。

本申请的上述实施例中,通过提供一种基于可分离度和相异度的电子鼻信号特征融合方法,该方法步骤一对电子鼻信号进行特征提取,步骤二进行特征选择,步骤三特征加权融合,本发明在降维去冗余的同时,最大限度的保留了分类信息,大大提高了分类识别率,从而提高了电子鼻的分类识别性能。

应当指出的是,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改性、添加或替换,也应属于本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1