一种面向癫痫脑电信号迁移环境的自适应识别方法

文档序号:8210453阅读:219来源:国知局
一种面向癫痫脑电信号迁移环境的自适应识别方法
【技术领域】
[0001] 本发明属于信号识别及应用领域,具体是一种具备迀移学习能力的大间隔支持向 量机系统脑电信号识别方法。
【背景技术】
[0002] 癫痫是由大脑神经元突发性异常引起的短暂性大脑功能障碍,是人类大脑中最常 见的疾病之一,影响到大约全世界5000万的人口。脑电图检测对该病的确诊起着至关重要 的作用。特别地基于特征提取技术及智能建模技术对癫痫病进行检测和识别近年来广受关 注。
[0003] 主成分分析(PCA)是一种行之有效的特征提取与降维方法,常在数据预处理阶段 用于高维数据的降维。在主成分分析中,我们寻求将d维数据在更低的空间进行表示,这样 会减少数据的自由度,时间复杂性及空间复杂性。PCA根据对象的分布寻找一组相互正交的 基函数,使得这组基函数指向具有最大数据分布方差(即样本点散布最开)的方向。其借 助一个正交变换矩阵,将分量相关的原随机变量转换成分量不相关的新变量,进而对多维 变量系统进行降维处理。同时脑电图(EEG)信号是非稳定的高维信号,主成分分析技术忽 略了 EEG信号的医学上的时频特性,只将EEG看作是普通的高维数据,然后依据数据分布的 儿何及统计特性对信号降维。
[0004]支持向量机(Support Vector Machine,SVM)是 Cortes&Vapnik 1995 年首先提出 来的,是近年来机器学习研宄的一项重大成果。根统计学习理论,如果数据服从某个(固定 但未知的)分布,要使分类机器的实际输出与理想输出之间的偏差尽可能小,则其应当遵 循结构风险最小化原理,即应当使错误概率的上界最小化.支持向量机正是这一理论的具 体实现,与传统的人工神经网络相比,其不仅结构简单,而且各种技术性能尤其是泛化能力 明显提尚。
[0005] 尽管上述特征提取技术和智能学习方法在EEG信号识别方面显示出了一定的有 效性,但仅在训练域和测试域数据服从相同分布时方可获取良好的分类性能。对于EEG信 号而言,恰恰相反在多数场景下所获的训练和测试的癫痫EEG信号数据的分布通常不尽相 同。迀移学习被认为是一种能够解决数据分布不一致所造成模型性能下降的有效学习策 略。其借助相关场景的数据或知识以提高当前系统的泛化能力。Brian等提出一种基于特 征空间内大间隔的直推式迀移学习方法(Large margin projected transductive support vector machine,LMPROJ),此方法基于最大均值差(MMD)和正则风险最小化的思想,通过求 一个特征变换使得源域的训练数据和目标域的测试数据之间的分布距离最小化。利用迀移 学习策略来帮助迀移学习环境下的癫痫EEG信号识别。
[0006] 本发明在特征提取阶段就融合迀移学习策略,结合大间隔的直推式迀移学习方 法,提出全面面向迀移学习环境的脑电信号识别系统技术。此技术因在特征提取阶段和智 能建模阶段都具备了迀移学习能力而不再局限于训练域和测试域数据分布一致的假设,允 许两者之间存在较大的差异性,不仅在训练域与测试域数据分布相同的场景下保持良好的 性能,也大大提高了最终所获模型在迀移场景时的识别效果。

【发明内容】

[0007] 本发明的目的在于允许训练域和测试域数据两者之间存在较大的差异性,基于 PCA的特征迀移,以及大间隔直推式迀移学习智能学习模型,应对因分布不同带来的差异 性,给出了具体的EEG信号自适应工作框架,从而大大提高了最终所获模型的识别效果及 泛化能力。
[0008] 按照本发明提供的技术方案,所述具备迀移学习能力的模糊系统脑电信号识别方 法,包含如下步骤:
[0009] 1、脑电信号的预处理一特征迀移,包含如下步骤:
[0010] 步骤一:将利用按标准化的电极布置方案测量采集的脑电信号(23. 6秒长度)首 先都校正到173. 6Hz ;
[0011] 步骤二:利用主成分分析技术对上述校正后的初始EEG信号进行特征提取:PCA算 法将得到的各个主分量之间互不相关,按照能量从大到小排列。越是靠前的主分量,能量越 大,越能代表原始数据;
[0012] 步骤三:本技术提出子空间相似性度量(subspace similarity measure,SSM)来 在PCA算法计算得到的各个主分量之间完成特征提取工作。首先计算训练数据集和测试数 据集的PCA子空间,PCAjP PCA T。如果两个数据集相似,那么它们在相应的PCA子空间之间 也不会相距太远。基于这个策略SSM通过主分量之间的距离来考量源域和目标域中第d维 主分量的相似性。其在PCA子空间中计算源域和目标域第d维主分量之间的主距离,具体 如下:
[0013] dis(d) = | |PCAs-PCAt| (1)
[0014] 这里dis(d)代表第d维PCAjP PCAT之间的主距离。我们将| |PCAS-PCAT| |定义 为最小相关距离,上式中的dis (d)其值越小,表示PCAjP PCA T在第d维的主分量上就越靠 近。
[0015] 基于SSM思想来找出源域和目标域在PCA子空间中相似的主分量,并将其基于冒 泡算法重新排序。根据邻域适应的策略,源域中dis(d)越小的主分量,表示其越能指导目 标域的学习。我们将主分量按dis(d)由小到大排列,这样排列出的主分量,既能满足PCA 提取的特性(即越能表示原始数据的主分量越放置在前面),又将源域和目标域之间相似 (即能对邻域学习做出较大贡献)的主分量排列在前。
[0016] 2、大间隔直推式迀移学习识别方法,包含如下步骤:
[0017] 步骤一:利用径向基核函数将特征提取过后的数据映射到高维核空间;
[0018]
【主权项】
1. 脑电信号的预处理一特征迀移,包含如下步骤: 步骤一:将利用按标准化的电极布置方案测量采集的脑电信号(23. 6秒长度)首先都 校正到173. 6Hz ; 步骤二:利用主成分分析技术对上述校正后的初始脑电信号进行特征提取:PCA算法 将得到的各个主分量之间互不相关,按照能量从大到小排列,越是靠前的主分量,能量越 大,越能代表原始数据; 步骤三:本技术提出子空间相似性度量(subspace similarity measure,SSM)来在 PCA算法计算得到的各个主分量之间完成特征提取工作,首先计算训练数据集和测试数据 集的PCA子空间,PCAjP PCA τ,如果两个数据集相似,那么它们在相应的PCA子空间之间也 不会相距太远,基于这个策略SSM通过主分量之间的距离来考量源域和目标域中第d维主 分量的相似性,其在PCA子空间中计算源域和目标域第d维主分量之间的主距离,具体如 下: dis(d) = I IPCAs-PCAtI I (1) 这里dis(d)代表第d维PCAjP PCAt之间的主距离,我们将I IPCAs-PCAtI I定义为最小 相关距离,上式中的dis (d)其值越小,表示PCAjP PCA τ在第d维的主分量上就越靠近; 基于SSM思想来找出源域和目标域在PCA子空间中相似的主分量,并将其基于冒泡算 法重新排序,根据邻域适应的策略,源域中dis (d)越小的主分量,表示其越能指导目标域 的学习,我们将主分量按dis (d)由小到大排列,这样排列出的主分量,既能满足PCA提取的 特性(即越能表示原始数据的主分量越放置在前面),又将源域和目标域之间相似(即能对 邻域学习做出较大贡献)的主分量排列在前。
2. 如权利要求1所述面向癫痫脑电信号迀移环境的自适应识别方法,其特征是: 步骤一:利用径向基核函数将特征提取过后的数据映射到高维核空间;
(2) 步骤二:基于最大均值差(MMD)的分布距离度量来计算两个分布在再生核希尔伯特空 间内(RKHS)的距离,对于训练集Ds= {{x p yj,…,{xn,yn}}和一个测试集Ds= {z i,…, zn},则训练集与测试集之间的平均最大差异距离如式(3)所示:
一方面因为训练集和测试集的数据分布不同,我们要找到能缩小训练数据分布和测试 数据分布间距离最小化的特征变换,另一方面还要使其在处理训练集分类时的效果达到最 好(也可看作是求训练集之间的分布距离),因此,基于MMD的迀移学习方式可以表示下:
这里df,k(PY,P' γ)是分布距离函数,Ργ代表训练集样本的分布,P' γ代表测试集样 本的分布,λ是其平衡系数,df,k(PY,P' γ)则是两个分布之间的测量距离,可通过下式求 得:
(5) 步骤三:根据上面给出的决策函数式(4)和距离函数式(5),LMPROJ的优化目标最终定 义为:
其中的投影向量w为希尔伯特空间内的投影向量,根据表现定理(Representer Theorem)其可表示为:
这里设 Φ ⑶=(Φ (S1),…,Φ (sn+m) ) = Φ (X1),…,Φ (Xn),Φ (Z1),…,Φ (Zm)), Φ (S)表示训练数据和测试数据的核特征向量集,将上式代入距离函数式(5)中,则两个分 布的投影测量距离可以表示为:
上式中的KTram表示训练数据的(n+m)阶核矩阵,而KTest是测试数据的(m+n)阶核矩阵, 这里的Ω也是(n+m)乘(n+m)的对称正半定矩阵,LMPROJ的优化目标最终可表示为如下 的二次规划问题求解:
【专利摘要】一种面向癫痫脑电信号迁移环境的自适应识别方法,本发明的优点是:本发明与现有技术相比,本发明方法选用具备邻域适应能力的迁移学习策略来克服训练域和测试域之间因数据分布差异所造成的智能模型分类性能急剧下降之难题。针对癫痫检测中的脑电信号分析,选用具有邻域适应能力的主成分特征迁移(子空间性度量)及大间隔直推式迁移学习方法来构成脑电信号识别系统,构建了具体的脑电信号自适应工作框架。该方法在缺少目标域信息的情况下,采用源域中与目标域中相似的有用特征来构建智能分类系统。由于本技术在特征提取阶段即融入了迁移学习策略,因此相较于单纯的迁移分类建模技术及传统智能识别方法,泛化能力更强,性能更好。
【IPC分类】A61B5-0476
【公开号】CN104523269
【申请号】CN201510024019
【发明人】邓赵红, 杨昌健, 蒋亦樟, 王士同
【申请人】江南大学
【公开日】2015年4月22日
【申请日】2015年1月15日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1