基于免疫克隆的手掌BIS身份识别方法与流程

文档序号:12009171阅读:338来源:国知局
基于免疫克隆的手掌BIS身份识别方法与流程
本发明属于生物特征识别技术领域,涉及一种基于免疫克隆的手掌BIS身份识别方法。

背景技术:
目前,身份识别的方法较多,最为成熟的是指纹身份识别法,指纹身份识别法虽然使用方便且可靠性高,但由于有些人或有些群体的指纹特征很少,很难成像,因此,无法进行身份识别。现有的一种基于手掌掌纹和人脸提取的身份识别方法,其使用数字图像处理技术,提取人的手掌纹理信息和脸部结构信息,将两种生物信息结合,进行人的身份识别,虽然识别率较高,但操作复杂。申请人之前提出一种基于手掌特征提取身份识别方法,通过提取手掌生物电阻抗频谱BIS特征来实现身份识别。该方法在选择特征上有一定的局限性,找到的不一定是最优的特征组合,且在分类的问题上只进行了一次决策,可能会产生误判的现象。

技术实现要素:
本发明的目的在于提供一种基于免疫克隆的手掌BIS身份识别方法,解决现有技术存在的可能会产生误判的问题。本发明的技术方案是,基于免疫克隆的手掌BIS身份识别方法,其实现过程包括手掌BIS数据归一化、手掌BIS数据特征选择和手掌BIS特征匹配步骤。本发明的特点还在于:上述手掌BIS数据归一化,其方法如下:设样本集{zi|1≤i≤N}中每一个样本为z=R+jX∈Cd,且有R=(R1,R2,...,Rd),X=(X1,X2,...,Xd),其中N为样本总数,i代表N中的第i个样本,R为数据实部,X为数据虚部,j为虚数单位,Cd为d维复数集;为了方便后续计算,需对复阻抗样本进行拉伸得到相应的实值样本zr,zr=(R1,R2,...,Rd,X1,X2,...,Xd)T;将最终的样本矩阵表示为:对样本zr的第k个特征的N个数据,有:其中为样本的均值,σk为样本的方差,为归一化后的样本特征。上述手掌BIS数据特征选择,包括:a降维,其方法如下:给定一个秩为r的l×n的矩阵X,其中r≤min{l,n},存在维数为l×l的正交矩阵U和维数为n×n的正交矩阵V,分别为其中是以为元素的r×r对角阵,而λi是相关矩阵XΤX的非零特征值,O表示为一个零元素矩阵。换言之,存在正交矩阵U和V,使得变换后的矩阵Y是对角的。由式(3)可得或或其中,Ur表示l×r矩阵,由U的第一个r列组成;Vr是r×n矩阵,由V的第一个r列组成。更精确的说,ui和vi分别是XXΤ和XΤX的特征向量,特征值λi就是X的奇异值,式(5)的展开式就是X的奇异值分解(SingularValueDecomposition,SVD)或是X的谱表示;b特征选择:①用ICSA(ImmuneClonalSelectionAlgorithm)的特性来选择寻找具有更好鉴别力的特征集;②采用二进制编码的方式;种群中每个抗体代表一种特征组合方式,表示为A(i)=(a0,a1,…am),i=0,1,…,N③用马氏距离(MahalanobisDistance)作为亲和度函数来诱导种群的进化,其中是整体样本的协方差,是第i类样本数据的均值,是整体样本的均值。各个类别的样本共享原始样本的协方差矩阵,F的值越小,则抗体所对应的特征向量越对分类有利;定义亲和度函数为:具体包括以下步骤:设归一化后的样本矩阵为X=(Xij)K×N,即共有N组数据,每组数据有K个特征;步骤1:SVD降维,求出XΤX和XXΤ的非零特征值λi,i=0,1,...,m,m≤N,和相应的特征向量V=[v0,v1,…vm],U=[u0,u1,…,um],m<N。由式(5)得到X的SVD,并取出前r个不为0的分量,将其作为输入。步骤2:初始化种群,产生种群P(0),设定种群规模大小Nc,每个抗体代表特征向量的一个组合。对抗体按(7)随机编码,抗体长度为特征向量的维数。步骤3:计算亲和度,将每个抗体解码成对应的特征向量组合,用公式(9)计算初始抗体的亲和度。步骤4:终止判断,判断是否达到了最大迭代次数。若满足条件,确定当前种群中的最佳抗体为最终解,否则继续。步骤5:克隆操作,设定的克隆规模,计算对第i个抗体的克隆个数qi,对该抗体进行克隆,得到克隆后的种群P'(k)=[P1'(k),P2'(k),…,Pn'(k)]。步骤6:克隆变异,对种群P'(k)按照变异概率pm进行变异得到种群P”(k)。步骤7:克隆选择操作,从P(k)∪P”(k)中选择出优秀个体,并替代原始种群中相应的个体,形成新的种群。步骤8:k=k+1;返步骤3。上述手掌BIS特征匹配,具体为:通过在隐空间中引入支持向量机的方法,仅要求核函数满足对称性条件,且不受Mercer条件的限制;同时,隐空间支持向量机继承了神经网络的强大非线性处理能力和支撑矢量机良好的推广能力;①令X表示输入的样本集,X={x1,x2,...,xN|xi∈Rd}。对任意一个样本x∈X,可以定义一个由一组实值函数生成的矢量:矢量将d维输入空间中的样本矢量映射到一个新的dh维空间中,由于函数集的作用与前向网络中隐节点的作用类似,故称为隐函数;相应地由隐函数集映射所得的样本空间称为隐空间或者特征空间;本质和支持向量机定义一致;对于已知的二类样本集X={(x1,y1),(x2,y2),...,(xN,yN)|xi∈Rd,yi∈{1,-1}}和核函数k(x,y),映射得到隐空间中的样本集为:{(z1,y1),(z2,y2),...,(zN,yN)|zi=[k(x1,xi),k(x2,xi),...,k(xN,xi)]T}(12)于是对隐空间中的线性分类函数f(z)=wTz+b,w∈RN,其中w是垂直于超平面的向量,b为加入的位移间隔,RN为N维实数集;相应的优化问题为:s.t.yi(wTzi+b)≥1-ξiξi≥0(i=1,...,N)其中,C为惩罚因子,用于经验风险和函数集容量控制之间平衡的调节,用交叉验证选择最佳参数C,ξi为惩罚函数;首先,训练数据将被分成几折;随后,其中一折被当作为验证集,而其余的则被当作为训练集;预测验证集而得到的准确率的平均值就是交叉验证率;实现过程是按照如下方式进行的;用户提供一个可能的C的区间来作为格点空间;然后,尝试所有的C格点来看哪一个格点给出最高的交叉验证率。然后用户用所得到的最后参数来训练整个训练集并产生最后的模型。由式(13)可以看出上述优化为凸区域上的二次规划,有唯一的最优解。通过Wolfe对偶规划求解上述线性约束二次规划得:0≤αi≤C(i=1,...,N)其中αi为拉格朗日(Lagrange)乘子。这样隐空间支撑矢量机的决策函数就为:隐空间SVM(HiddenSpaceSVM,HSSVM)本质上类似于神经网络隐层作用,通过引入非线性函数把输入样本映射到高维隐空间,然后在隐空间中引入结构风险实现隐空间支持向量机。由于引入了结构风险,比前向神经网络和径向基函数网络具有更好的推广能力,目标函数不存在局部极小。②集成机中个体HSSVM的构造:对于一个二类问题,训练集为T={(xi,yi)|i=1,2,…,l},yi∈{-1,1},假定要从K个HSSVM中选择出性能优秀的几个进行集成。用K个训练集训练得到K个HSSVM。为了使分类器具有多样性,将使用one-against-one策略将N类问题分解成N(N-1)/2个两类问题,训练得到N(N-1)/2个HSSVM,在选择和决策过程中将这些HSSVM按一个整体对待。③基于ICSA的HSSVM集成:基于免疫克隆的HSSVM集成算法步骤:步骤1:将N个类别按照one-against-one策略分解成K=N(N-1)/2个两类问题,得到K个训练样本集合;步骤2:在K训练集上对样本进行训练得到K个HSSVM;步骤3:利用免疫克隆选择算法从K个HSSVM中选择部分最优个体构成集成系统;步骤4:用集成系统中的个体HSSVM对测试样进行分类;步骤5:利用多数投票原则获得决策本发明具有如下有益效果:1、本发明依靠人体固有的特征进行身份验证,克服了传统信息安全技术的一些缺点,提供了一种更加便捷、安全、稳定的身份识别方法。2、本发明针对现有算法存在的不足,以及实际应用中的需要,提出了一种新的生物特征识别方法—基于免疫克隆的手掌生物电阻抗频谱(BIS)特征的身份识别算法。在免疫克隆算法的基础上利用人体本身所具有的物理特征的独特优势,避免了传统的身份识别方法中安全性和便捷性的问题。3、由于手掌BIS特征具有较高的稳定性,符合生物特征识别的要求,可以作为一种高效的人体身份认证技术,因此本发明基于手掌BIS特征的身份识别方法具有一定的理论和实用价值。附图说明图1是本发明身份识别方法中手掌BIS测量电极分布图;图2是本发明身份识别方法中电极间阻抗关系图;图3是本发明身份识别方法中整体框架图;图4是本发明身份识别方法数据中第一个人的Wessel(韦赛尔)图;图5是本发明身份识别方法数据中第二个人的Wessel(韦赛尔)图;图6是本发明身份识别方法对数据中欧拉距离分布图;图7是本发明身份识别方法对数据中ROC(受试者操作特性曲线)曲线图;图8是本发明身份识别方法对现有的手掌BIS六个回路的ROC曲线比较图;图9是本发明身份识别方法中数据经SVD(奇异值分解)降维后J1值图;图10是本发明身份识别方法中使用J1排序后使用不同主分量数的正确率;图11是本发明身份识别方法中经ICSA后的Euclidean(欧几里得)距离分布;图12是本发明身份识别方法中经ICSA进化100代Cosine(余弦)距离分布。具体实施方式下面结合附图和具体实施方式对本发明进行详细说明。本发明基于免疫克隆的手掌BIS身份识别方法,包括手掌BIS数据归一化、手掌BIS数据特征选择和手掌BIS特征匹配步骤。参照图3本发明方法中整体框架流程图,具体按照以下步骤实施:1、手掌BIS数据的采集:在生物组织复阻抗频谱特性测量中,为了得到多种频率下电压与电流的关系,硬件上必须有电流源、电压测量系统。采用电压驱动、电流测量的方式同样可以得到阻抗特性,但过强的电流会影响生物组织活性,所以需要控制流入电流大小;另一方面从测量技术上来讲,电压测量比电流测量更容易实现。依据图1手掌BIS测量电极分布图和图2电极间阻抗关系图,在测量手掌BIS数据时,BIS测量仪的电流激励源连接两个电流驱动电极,电压测量机构连接至两个电压测量电极。测量仪自动扫频,测量在预设频率的阻抗值。为了降低电压电极与被测组织间的接触电阻造成的影响,电极都选用Ag/AgCl材料,而且采用高输入阻抗的电压放大器进行电压测量。整个测量系统能在较宽频率范围内进行生物阻抗频谱测量并具有较高的测量精度。2、手掌BIS数据预处理:对步骤1采集来的数据进行预先处理,由于原始特征空间中的不同特征可能会有不同的动态范围,因此在分类器训练中,大值特征会影响到小值特征。通过特征归一化,可以使不同特征位于相似范围。用每个特征各自的均值和方差估计值做归一化,归一化后的特征具有零均值和单位方差。将BIS采集仪采集到的原始数据样本,可采用拉依达准则进行过滤处理。其算法过程可表示如下:2.1)求n次测量值Xi,1≤i≤n的平均值2.2)求各项的残差:2.3)计算标准偏差:2.4)剔除奇异项,对测量值Xi,如果有Vi>3σ,则将其剔除。3、手掌BIS特征归一化:由于BIS频谱样本里不同频点测得的数值具有不同的动态范围,因此为了防止大特征值对小特征值的影响,需要对数据进行归一化处理。本文采用各分量的均值和方差的估计值做归一化两部分。其算法描述如下:设样本集{zi|1≤i≤N}中每一个样本为z=R+jX∈Cd,且有R=(R1,R2,...,Rd),X=(X1,X2,...,Xd)。其中N为样本总数,i代表N中的第i个样本,R为数据实部,X为数据虚部,j为虚数单位,Cd为d维复数集。为了方便后续计算,需对复阻抗样本进行拉伸得到相应的实值样本zr,zr=(R1,R2,...,Rd,X1,X2,...,Xd)T。将最终的样本矩阵表示为:对样本zr的第k个特征的N个数据,有:归一化后的特征具有零均值和单位方差。其中为样本的均值,σk为样本的方差,为归一化后的样本特征。4、手掌BIS特征降维:采用奇异值分解SVD(Singularvaluedecomposition,SVD)对BIS特征数据进行降维分析。用SVD的目的是用较少的几个新特征,来代替原来特征集,并尽可能包含原有特征集所含信息,且新的特征间不相关。其算法描述如下:设归一化后的样本矩阵为X=(Xij)K×N,即共有N组数据,每组数据有K个特征。求出XΤX和XXΤ的非零特征值λi,i=0,1,...,m,m≤N,和相应的特征向量V=[v0,v1,…vm],U=[u0,u1,…,um],m<N。由2.1)中的式(18)得到X的SVD,并取出前r个不为0的分量,将其作为输入。5、手掌BIS特征选择因为通过SVD降维后的新特征集的分量对分类而言不是都具有鉴别性,所以,用ICSA的特性来选择寻找具有更好鉴别力的特征集。特征选择算法的主要思想、编码方式和亲和度函数构造:①算法的主要思想是:首先对原始数据进行归一化,将归一化后的数据用SVD进行降维。因为得到的新特征集的分量对分类而言不是都具有鉴别性,所以,用ICSA的特性来选择寻找具有更好鉴别力的特征集。②编码方式:在特征选择问题中,解的编码形式是很直观的。采用二进制编码的方式,在这里每个二进制位表示其相应位置的特征值向量是否选中。种群中每个抗体代表一种特征组合方式。表示为A(i)=(a0,a1,…am),i=0,1,…,N③亲和度函数构造:ICSA中整个种群的进化过程是由亲和度函数来诱导的。本算法将用马氏距离(MahalanobisDistance)作为亲和度函数来诱导种群的进化。其中是整体样本的协方差,是第i类样本数据的均值,是整体样本的均值。各个类别的样本共享原始样本的协方差矩阵,F的值越小,则抗体所对应的特征向量越对分类有利。在这里定义亲和度函数为:由于算法中用到了ICSA和SVD,所以将特征选择算法称为ICSA-SVD,ICSA-SVD算法的主要步骤:设归一化后的样本矩阵为X=(Xij)K×N,即共有N组数据,每组数据有K个特征。步骤1:SVD降维,求出XΤX和XXΤ的非零特征值λi,i=0,1,...,m,m≤N,和相应的特征向量V=[v0,v1,…vm],U=[u0,u1,…,um],m<N。由式得到X的SVD,并取出前r个不为0的分量,将其作为输入。步骤2:初始化种群,产生种群P(0),设定种群规模大小Nc,每个抗体代表特征向量的一个组合。对抗体按二进制随机编码,抗体长度为特征向量的维数。步骤3:计算亲和度,将每个抗体解码成对应的特征向量组合,用公式(9)计算初始抗体的亲和度。步骤4:终止判断,判断是否达到了最大迭代次数。若满足条件,确定当前种群中的最佳抗体为最终解,否则继续。步骤5:克隆操作,设定的克隆规模,计算对第i个抗体的克隆个数qi,对该抗体进行克隆,得到克隆后的种群P'(k)=[P1'(k),P2'(k),…,Pn'(k)]。步骤6:克隆变异,对种群P'(k)按照变异概率pm进行变异得到种群P”(k)。步骤7:克隆选择操作,从P(k)∪P”(k)中选择出优秀个体,并替代原始种群中相应的个体,形成新的种群。步骤8:k=k+1;返步骤3。6、手掌BIS特征匹配:采用在隐空间支持向量集上引入免疫克隆算法的方法,对隐空间支持向量集进行集成达到提高分类精度的目的。根据统计学习理论,隐空间支撑矢量机引入结构风险,能获得良好的推广能力,使得隐空间支持向量机同时继承了上述两者的优点。6.1)如令X表示输入的样本集,X={x1,x2,...,xN|xi∈Rd}。对任意一个样本x∈X,可以定义一个由一组实值函数生成的矢量:矢量将d维输入空间中的样本矢量映射到一个新的dh维空间中:由于函数集的作用与前向网络中隐节点的作用类似,故称为隐函数。相应地由隐函数集映射所得的样本空间称为隐空间或者特征空间。6.2)构造隐空间中的样本集:类似支持向量机定义,对于已知分类的二类样本集X={(x1,y1),(x2,y2),...,(xN,yN)|xi∈Rd,yi∈{1,-1}}和核函数k(x,y),映射得到隐空间中的样本集为:{(z1,y1),(z2,y2),...,(zN,yN)|zi=[k(x1,xi),k(x2,xi),...,k(xN,xi)]T}(11)6.3)构造隐空间中的线性分类函数:隐空间中的线性分类函数f(z)=wTz+b,w∈RN,其中w是垂直于超平面的向量,b为加入的位移间隔,RN为N维实数集。相应的优化问题为:s.t.yi(wTzi+b)≥1-ξiξi≥0(i=1,...,N)其中,C为惩罚因子,用于经验风险和函数集容量控制之间平衡的调节,用交叉验证选择最佳参数C,ξi为惩罚函数。首先,训练数据将被分成几折。随后,其中一折被当作为验证集,而其余的则被当作为训练集。预测验证集而得到的准确率的平均值就是交叉验证率。实现过程是按照如下方式进行的。用户提供一个可能的C的区间来作为格点空间。然后,尝试所有的C格点来看哪一个格点给出最高的交叉验证率。然后用户用所得到的最后参数来训练整个训练集并产生最后的模型。很明显上述(12)式的优化为凸区域上的凸二次规划,最优解是唯一的。6.4)构造Wolfe对偶规划函数:求解式(12)得Wolfe对偶规划函数,即:0≤αi≤C(i=1,...,N)其中αi为Lagrange乘子。求解隐空间模式识别支撑向量机的决策函数凸优化,即特征分类。隐空间模式识别支撑向量机的决策函数为:如令则式(18)可以简化表示如下:6.5)构造集成机中个体HSSVM对于一个二类问题,训练集为T={(xi,yi)|i=1,2,…,l},yi∈{-1,1},假定要从K个HSSVM中选择出性能优秀的几个进行集成。用K个训练集训练得到K个HSSVM。采用使用one-against-one策略将N类问题分解成N(N-1)/2个两类问题,训练得到N(N-1)/2个HSSVM,在选择和决策过程中将这些HSSVM按一个整体对待。6.6)用ICSA集成HSSVM得到N(N-1)/2个训练好的样本后,按照上述讨论,利用免疫克隆算法从N(N-1)/2个个体HSSVM中选择出部分优秀的个体组成一个新的集成系统。优秀个体的产生是需要一个准则去评价的。用集成系统在验证集上的泛化误差评价系统的性能。通过上述过程,得到HSSVM集成系统后,对测试样本的最终决策是基于多数投票的,分类的输出结果是获得最多投票的类别标签的类。基于免疫克隆的HSSVM集成算法步骤:步骤1:将N个类别按照one-against-one策略分解成K=N(N-1)/2个两类问题,得到K个训练样本集合;步骤2:在K训练集上对样本进行训练得到K个HSSVM;步骤3:利用免疫克隆选择算法从K个HSSVM中选择部分最优个体构成集成系统;步骤4:用集成系统中的个体HSSVM对测试样进行分类;步骤5:利用多数投票原则获得决策本发明提供的基于免疫克隆的手掌BIS身份识别方法,针对生物特征识别技术依靠人体固有的特征进行身份验证,克服了传统信息安全技术的一些缺点,提供了一种更加便捷、安全、稳定的身份识别方法。针对现有算法存在的不足,以及实际应用中的需要,提出了一种新的生物特征识别方法—基于免疫克隆的手掌生物电阻抗频谱(BIS)特征的身份识别算法。实施例中,实验以在校师生(年龄18~60岁)为测量对象,样本共50人,每人测量2次,6个回路,测量频率点共取23个。所有测量频率点均分布在1kHz到1MHz范围内。对数据分别进行测试,数据采用线性变换提取特征。然后使用隐空间支持向量机进行分类识别。图11是本发明方法中经ICSA后的Euclidean距离分布,参照图6-12,表1是不同算法的手掌BIS身份识别算法的错误接受率、错误拒绝率、等错误率等性能指标性能比较表。表1采用不同算法的错误拒绝率、等错误率对照表表1列举了采用不同分类方法的结果。可以看出,本发明提取的特征维数明显少于其他方法,这样不但节省了存储空间,而且提高了计算速度;分类精度也有了相应的提高。因此,本发明提出的基于免疫克隆的手掌BIS特征的身份识别算法是完全可行的。其中使用ICSA方法集成的HSSVM分类结果更加优秀,是因为HSSVM利用了数据样本的方向信息,比起作为标量的Euclidean距离,矢量包含了更加丰富的分类信息。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1