一种基于脑电快速语音呈现范式的身份识别方法与流程

文档序号:15493036发布日期:2018-09-21 21:01阅读:160来源:国知局
本发明属于机器学习和信息安全交叉领域,具体涉及对基于语音诱发的脑电波进行信号采集、信号预处理、特征提取、分类识别等操作,旨在保障用户登陆的安全性。
背景技术
:互联网的出现和普及给我们带来很大的便捷,但随着网络的快速发展,我们的一些身份信息则很容易泄露,给我们造成一定程度上的利益损失,由此可见,信息安全的保护和加强身份认证的措施是很有必要的。一些传统的身份识别和个体认证方法有:密码、pins和射频卡,但上述这些方法各有缺点;密码容易被遗忘,pins和射频卡则会被偷窃或者遗失,这些方法难以适应于安全系数要求很高的系统中,但自己的固有特征是绝不会被遗忘或丢失的,例如:人脸、虹膜、指纹、声音、脑电波等。因此,需要有一种基于人体固有特征的安全检测方法,来更加方便而安全的实现个体身份识别。个体的生物特征用于身份鉴别原则上需要满足以下条件:(1)普遍性,保证每位用户都能通过认证;(2)独特性,对某个用户的认证特征是特殊的,独一无二的;(3)可收集性,认证特征可以迅速的被收集;(4)稳定性,认证特征始终是一致的。常见的生物特征有指纹和声音,但随着时代的发展,一些独特和现代的生物测定方法是必要的,脑电波就是其中之一,脑电波有许多特殊的性质,如高时间分辨率,我们通过图像能看到脑波的实时动态;高独特性,个体的脑电波信号是稳定的和特别的,即个人脑波模式中小的内在差异,大的人际差异。技术实现要素:本发明针对用户身份登陆中存在的安全隐患提出了基于快速语音呈现范式的脑电身份识别方法,主要针对老弱病残孕等行动不便的弱势群体,尤其是对于有视觉障碍的人群,有较好的适用性。本发明包含以下步骤:步骤1:针对听觉诱发这一应用场景,设计一种认证系统。步骤2:根据该认证系统,设计具体的实现步骤。步骤3:对采集的初始脑电数据进行预处理,获得去噪后的脑电数据集。步骤4:对预处理数据集进行特征提取。步骤5:使用朴素贝叶斯分类器进行学习和分类,从而完成认证登陆。进一步,上述设计认证系统,具体包括:a:基于听觉诱发的应用场景,设计一个基于脑电波听觉诱发的实验方案,包括注册系统、登陆系统和认证服务器系统三部分,具体如附图2所示。上述具体实现步骤包含:b:首先选择合适的脑电采集设备,本专利选择了64导符合国际脑电图学会标定的10-20法的eeg放大器,采样频率为1200hz,引用参考电极为fpz,16个通道的干电极进行信号采集:fp1,fm3,c3,p3,01,f7,t3,t5,fp2,fm4,c4,p4,02,f8,t4,t6。这里我们选用干电极而不采用湿电极,虽然湿电极相比干电极有更好的信号质量,但湿电极需要插入导电凝胶,并且需要配置30分钟,登陆完成之后,还需要清洗头发;因此,湿电极对于认证系统来说不是切实可行的,所以本发明中选择干电极进行实验操作。c:选取语音素材库,考虑到同音词会影响受试者的判断和脑电波波形的不一致,例如:大雨和大禹就是一对同音词汇,在认证中很容易给受试对象造成迷惑,所以我们选取素材库时,应尽量避免出现同音词汇,本专利中,我们选取大家日常中经常接触到的水果和蔬菜的语音来作为实验素材,每个素材的播放时间设为t1ms。d:受试对象佩戴脑电采集设备,闭上眼睛安静的坐在座位上,做好准备。e:第一阶段,受试者在素材库中选择一个语音来播放,系统将该语音素材作为目标素材,该语音会有间隔的播放,持续tms,间隔为t2ms,共播放p次。t=p×(t1+t2)f:第二阶段,系统会自动随机在素材库中选取其他k个不同的素材,与受试者选取的1个素材组合在一起,在给受试者发出一个快速听觉呈现开始的语音信号后,开始快速听觉测试,系统会无时间间隔的随机播放这k+1个语音素材,持续t'ms,共播放p'次。g:第三阶段,为了能提高受试者在测试中的专注程度,要求受试者在快速听觉测试后,能够清楚的记住测试中听到的目标素材的数目,并且记录在系统中。h:为了能够获得足够多的训练样本数据,我们将上述efg三个步骤重复三次,即总共进行四次操作;利用头戴设备采集第一阶段中目标语音刺激下的诱发电位,从而获得初始脑电数据集d。上述数据预处理步骤包含:i:初始采集到的脑电信号存在非平稳性且极易受到各种噪声干扰,特别是工频干扰,因此消除原声脑电数据中的噪声是进行脑电分析的一个重要前提,本专利中先使用了低通滤波器和相干平均,然后使用快速独立分量分析来进行多次去噪。j:低通滤波是一种过滤方式,规则为低频信号能正常通过,而超过设定临界值的高频信号则被阻隔、减弱。由于脑电信号的频率一般不超过60hz,因此,我们可以设置一个60hz的低通滤波器来进行初步去噪。k:相干平均利用对齐叠加平均的原理,可获得倍信息增益。假设各次实际观测的信号xi(t)、去噪的脑电信号ei(t)和噪声信号ni(t)的关系为:xi(t)=ei(t)+ni(t)i=1,2,...,n.如果脑电信号ei(t)每次都是相同的确定性过程,而噪声信号ni(t)是每次独立的非平稳过程,那么我们可以得出:在叠加n次后,脑电诱发电位值不变,而噪声信号近似为0,即:上式中e(t)为去噪的脑电信号集,ni(t)为噪声信号,为n次观测信号的叠加平均;相干平均之后信噪比为:公式中,σ2表示各次观测信号方差,σ2/n表示n次叠加平均诱发响应方差,可见,信噪比提高了倍。l:假设有l个未知且统计独立的信号源构成一个列向量s(t),设a是m×l维矩阵,一般称为混合矩阵。s(t)=[s1(t),s2(t),...sl(t)]tz(t)=[z1(t),z2(t),...,zm(t)]t是由m个观测信号构成的列向量,它是独立信号源构成的列向量s(t)被混合矩阵a混合后所接收到的信号,矩阵形式如下:z(t)=as(t),m≥l但在实际中,我们只知道观测信号z(t),而混合矩阵a和独立信号源s(t)是未知的,快速独立分量分析能在混合矩阵a和独立信源s(t)未知的前提下,从观测信号z(t)中分离出信源s(t)的各分量,即寻找一分解矩阵w对观测信号z(t)进行分离:分离结果是对独立信号源s(t)的良好逼近。快速独立分量分析涉及三个组成部分:(1)对观测信号去均值,(2)随机信号的白化处理,(3)独立分量提取算法实现。信号去均值比较简单,使得观测信号均值为零即可;为了使快速独立分量分析算法收敛更快,获得更好的稳定性,还需要对观测信号进行白化处理,白化处理是将观测信号z(t)进行线性变换,使白化后各分量互不相关,且为单位方差,即v为白化矩阵,为经白化处理过的观测信号。快速独立分量分析是从多维统计数据中寻找内在因子或成分,该方法与其他方法不同的是,它寻找的是既统计独立又非高斯的成分,它的最优判据有峭度和负熵,本发明选用负熵作为最优判据,但因为负熵计算起来很困难,故一般采用近似负熵法,公式如下:n(yi)=k'[e(g(yi)-e(g(ygauss))]2上式中,k'为一常数,yi为待估计的一个源信号,ygauss为具有与yi相同方差的高斯变量,函数g是非二次函数,n(yi)为近似负熵。估算分离矩阵w、提取独立分量,设wi为分离矩阵w的一个列向量,待估计的一个源信号为带入近似负熵公式得:这样负熵判据可以理解为:试图寻找一个wi,使得近似负熵取得极大值。由于e(g(ygauss))是一常数,问题转化为求的极大值;在约束条件:下,构造代价函数:根据上述公式,先求令其等于0,利用牛顿迭代法求解wi,得到下面的迭代公式:公式进一步可写为:式中g和g’分别对应非二次函数g的一阶导数和二阶导数;β为一个常数;k为迭代步数;根据上式可递推求得wi,进一步计算出yi,可分离出一个独立分量;对多个独立分量的提取,须在提取每个分量后,从观测信号中减去这一独立分量,重复上述分离过程,直到所有独立分量完全分离,如此我们可以完成脑电信号的最后去噪工作,获得预处理数据集d’。上述特征提取步骤包含:m:在完成上述数据预处理之后,需要对脑电数据进行特征提取,本发明结合决策树思想来改进小波包分解,从而进行特征提取,脑电信号有5个主要的频率带:δ(0-4hz),θ(4-8hz),α(8-15hz),β(15-30hz),和γ(30-60hz),图3为改进基于决策树的小波包分解图。从分解出的5个数据集中提取出脑电信号值,然后分别求平均值uh,标准差σh和熵εh,形成特征向量,每个小数据集有3个特征值,每个对象共有15个特征值,从而获取脑电训练特征集c。εh=-∑th2(t)log(h2(t))上式中hi为各分段内的脑电信号频率值,h(t)是和时间相关的函数,表示t时刻的频率值。上述分类步骤包含:n:本专利采用朴素贝叶斯分类器进行分类,基于朴素贝叶斯公式:式中p(c)是类“先验”概率,p(d|c)是样本d相对于类标记c的类条件概率,p(d)是用于归一化的“证据”因子。估计后验概率p(c|d)的主要问题是:p(d|c)是所有属性上的联合概率,难以从有限的训练样本中直接估计而得,为避开这个障碍,朴素贝叶斯分类器采用了“属性条件独立性假设”:对已知类别,假设所有类别属性相互独立。基于属性条件独立性假设,可将上式改写为:其中j为特征数目,di为d在第i个特征上的取值。由于对于所有类别来说p(d)相同,因此基于上式的贝叶斯判定准则hnb(d)有:上式中:ζ为训练特征集可能的类别标记,argmax表示求最大值。令cc表示训练特征集c中第c类样本组成的集合,若有充足的独立同分布样本,则可容易地估计出类先验概率:由于脑电信号提取出的特征值是连续属性,所以离散属性的条件概率计算此处不做叙述。需注意一点:若某个属性值在训练集中没有与某个类同时出现过,则直接基于公式进行概率估计将出现“连乘式计算出的概率为零”问题。为了避免出现这种情况,常用“拉普拉斯修正”来校正。连续属性可考虑概率密度函数,假定p(di|c)≈n(uc,i,σ2c,i),其中uc,i和σ2c,i分别是第c类样本在第i个属性上取值的均值和方差,则有:则贝叶斯判定准则可改写为:同时考虑到对认证速度的要求较高,对给定的训练集,可将朴素贝叶斯分类器涉及的所有概率估值事先存库,这样当登陆时只需“查表”即可进行判别;若数据不断增加,则可在现有估值基础上,仅对新增样本的属性值所涉及的概率估值进行计数修正即可实现增量学习。有益效果与现有技术相比,本专利具有以下优点:1、相比传统的密码和射频卡登陆,脑电波认证技术能更加方便而安全的实现个体身份识别。2、对于有视觉障碍的人群而言,视觉诱发来进行身份认证是不现实的,所以对于该类人群,语音诱发来进行身份识别有更好的应用背景。3、相比其他的分类技术而言,虽然本发明的分类算法相对简单,但本发明在脑电波数据集的预处理中,加大了去噪强度,只要数据清楚精准,分类算法虽然相对简单,认证系统依然可以达到很高的识别精度,可以保证系统的高安全性。附图说明图1为基于脑电快速语音呈现范式的身份识别流程图。图2为基于脑电波的注册和登陆系统。图3为改进的基于决策树的小波包分解图。具体实施方式下面结合附图对本发明作进一步详细的说明。步骤1,首先选取4名受试对象,分别为甲乙丙丁4个人,4个受试对象分别从语音素材库中选择一个目标素材(受试者要记下该目标素材),接着进行语音诱发,获取采集到的初始脑电数据集d。步骤2:直接采集到的数据集d是不能使用的,需要系统对采集到的初始数据集进行预处理,本发明加大了去噪强度,通过低通滤波器、相干平均、快速独立分量分析来获得去噪数据集d'。步骤3、对去噪后的数据集d'进行小波包分解,从而获取脑电训练特征集c。步骤4、使用朴素贝叶斯分类器根据这些特征值来进行分类操作,以下实例具体说明朴素贝叶斯分类器原理。表1是注册系统阶段实验中训练的一组脑电信号特征集c,此处只选取5个特征值进行展示;受试者在测试登陆阶段,需要本人选择其在训练阶段的目标语音素材,同样需要上述的预处理、特征提取等操作,从而获取测试数据;表2是登陆系统阶段,根据训练样本对该测试例进行分类:表1编号δ波均值θ波均值α波均值β波均值γ波均值身份训12.565.269.3325.1145.58甲训23.116.2811.2119.9039.86乙训33.875.2610.9918.7538.01乙训42.455.559.8926.0143.12甲训51.997.1212.3622.0151.01丙训62.085.919.1225.6543.89甲训73.797.2514.0122.6149.05丁训82.947.5212.8921.7850.56丙训91.207.2113.9121.7950.61丁训102.875.8110.8117.5639.01乙训112.445.828.9124.6842.78甲训122.595.648.8923.7641.35甲训133.377.3113.6522.0349.78丁训140.877.1212.0322.1249.81丙训151.215.738.8624.6143.18甲表2编号δ波均值θ波均值α波均值β波均值γ波均值身份测12.005.828.8723.9841.21?首先估计类先验概率p(c),根据表1数据有:针对对象甲来进行说明,则甲类样本在δ属性上的均值为:u甲,δ=(2.56+2.45+2.08+2.44+2.59+1.21)/6≈2.22非甲类样本在δ属性上均值为:μ非甲,δ=(3.11+3.87+1.99+3.79+2.94+1.20+2.87+3.37+0.87)/9=2.67甲类样本在δ属性上的方差为:非甲类样本在δ属性上的方差为:根据测试例,为其δ属性估计条件概率:其它特征属性依次类推,于是有:p1=p(对象=甲)×pδ:2.00|甲×pθ:5.82|甲×pα:8.87|甲×pβ:23.98|甲×pγ:41.21|甲p2=p(对象=非甲)×pδ:2.00|非甲×pθ:5.82|非甲×pα:8.87|非甲×pβ:23.98|非甲×pγ:41.21|非甲若求出的概率p1>p2,则分类器将测试样本判别为甲对象,系统判定允许登陆,若p2>p1,则分类器将测试对象判别为非甲对象,系统判定拒绝登陆。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1