一种基于半监督深层生成对抗网络的癫痫发作预测方法与流程

文档序号:15493085发布日期:2018-09-21 21:02阅读:340来源:国知局
本发明涉及脑电信号处理技术、深度学习领域,尤其涉及癫痫发作不同时期脑电信号分类方法。
背景技术
:癫痫是一种以反复发作为特征的常见脑部疾病,全球约有6500万人受癫痫疾病困扰,在我国现有600万~900万癫痫患者并且以每年40万左右的速度在增长。癫痫发作对于患者及患者家人的生活和精神造成很大影响,甚至会危及患者生命安全。癫痫状态是内科常见急症,若不及时治疗可因高热、循环衰竭、电解质紊乱或神经元兴奋毒性损伤导致永久性脑损害,致残率和死亡率均很高。任何类型的癫痫均可出现癫痫状态,其中全面强直-阵挛发作最常见,危害性也最大。轻度癫痫可以通过药物或手术治疗,部分难治性癫痫(约30%)无法完全治愈。因此有效的癫痫发作预测可以帮助病人、家属和医护人员及时发现病患发作情况,便于脱离危险情况和及时给药抑制癫痫发作,避免癫痫大发作。脑电波(electroencephalography,eeg)是常用的癫痫诊断手段,医护人员通过观察记录的eeg信号判断癫痫病人所处的生理状态。脑电波分为颅外脑电波eeg和颅内脑电波ieeg。癫痫病人发作前期与发作期间大量神经元族群突发性同时异常放电,典型的痫样放电现象显著。目前癫痫诊断多由经验丰富的医护人员人工观察脑电波图给出判断,工作量繁重、对人工经验依赖性高容易造成信息偏颇、主观因素影响大。因此,对于脑电的研究首要发展方向为减少人工参与,降低对有标签数据的依赖程度。研究人员的终极追求则是对医疗数据的安全可靠的无监督处理方式。由于脑电信号的高度复杂性、非线性、非平稳性等特点使得对于脑电的分析一直是国内外研究的热点与难点。虽然已有许多学者对癫痫发作预测作出研究工作,但是在临床应用中还稍显不足、目前尚未能取得理想效果。癫痫发作形式多样发作期间常伴随如肌肉收缩、肢体抽搐、眨眼伪迹等运动产生干扰脑电波,不同被试间个体发作形式差异明显,同一病人的多次发作间发作机理和发作形式也不尽相同。这使得人工筛选特征变得尤为艰难。因此,准确进行预测癫痫发作仍具有一定挑战。因此,能够对于脑电信号的自动提取深层次、高维度特征,向无监督学习逐步迈进的方法将是脑电信号处理的未来研究方向之一。技术实现要素:针对上述问题,本发明的目的在于采用了一种基于半监督对抗生成网络的癫痫发作预测方法,通过该方法对癫痫脑电信号的不同时期进行分类。本发明主要思考是:利用半监督学习方法,将有标签数据和无标签数据一同送入神经网络结构中进行学习与分类,逐步减小模型结构对有标注数据的依赖程度。此外采用半监督深层对抗生成网络,将生成对抗网络模型引入脑电识别中,利用生成器的强大功能对原始脑电信号进行深度、高维度特征学习与提取,与此同时生成学习到的伪脑电时频图用以训练判别器。最后,利用生成器与判别器之间的对抗优化和判别器自身作为神经网络对脑电时频特征的学习不断优化判别器的性能,达到准确分类的效果。首先,对有标签癫痫脑电和无标签癫痫脑电的n导原始脑电样本数据进行分段加窗分割,窗口长度为w,相邻子窗之间相互重叠进行数据增强及扩容处理,重叠率为50%,得到s段子信号;然后,分别对s段子信号进行傅立叶变换,获得频谱信号,并将频谱数据转换成32*32大小的图片形式表示。然后,将z维噪声数据送入生成器中,经过对抗与生成训练过程获得生成图像。最后将有标签数据、无标签数据和生成数据一同送入判别器中分类,得到最后的分类结果;该方法包括以下步骤:步骤一,输入原始脑电信号数据。原始脑电信号数据包括:有标签训练样本集、训练样本集标签、无标签训练样本集、测试样本集、测试样本集标签。同一组被试采集到的样本电极导数相同,样本电极导数用n表示,不同被试间n取值未必相同。训练样本标签、测试样本标签即为每个样本数据对应的数据所属类别。步骤二,将原始脑电信号数据转化成频谱形式表示。首先,采用指定长度的滑动窗口对原始脑电信号数据中每一组样本的每一导脑电信号数据进行分段加窗分割,共n导,其中滑动窗口的长度取决于原始数据的长度和采样频率,滑动窗口长度用w表示,每一次分割得到一个子窗,步长为w/2,即相邻子窗之间进行叠加扩容处理,共得到s段子窗信号;步骤三,计算对应数据傅立叶变化结果。对步骤二中所得到的每一段子窗信号计算傅里叶变换获得频谱信息,分别对步骤二中所得的s段子窗信号进行傅立叶变换计算获得二维脑电频谱数据。步骤四,将步骤三中计算出的二维脑电频谱数据转换成图片。根据获得的二维脑电频谱数据,输出成脑电频谱图。步骤五,利用半监督深层生成对抗网络生成伪样本。将维度为z的随机噪声数据输入到半监督深层生成对抗网络中的生成器g中,生成器g从噪声数据中进行随机采样,将步骤四中的脑电频谱图利用反卷积生成伪脑电频谱数据图。步骤六,对抗生成分类。将步骤四中的脑电频谱图和步骤五中的伪脑电频谱数据图一同送入判别器中进行训练与分类,得到最后的分类结果。训练的同时生成器g会根据判别器的判别结果优化自己生成能力,以生成与原始脑电频谱图像数据分布相近的伪脑电频谱数据图。判别器通过与生成器g之间的对抗训练,迭代优化后最终获得更加准确的分类效果。实验结果如下表所示。为了验证本文提出方法的有效性,与一些经典的特征提取方法做对比其中第一行为coherencemean(cm)特征,该特征对dog1效果非常好准确率达到94.99%,对于dog2、dog3、dog5效果不错都能达到超过百分之九十以上的准确率,但是对dog4的分类准确率较低88.79%。第二行为spectralentropy(se)特征,第三行为spectralrelationpower(srp)特征第四行为多种特征融合分类的对比实验。前四种特征是针对原始脑电信号数据进行的特征提取。第五行为频谱图加卷积神经网络(convolutionalneuralnetwork,cnn)的分类效果。第六行为频谱图加超限学习机(extremelearningmachine)的分类结果。最后一行即为本方法的实验结果,可以看出本方法在各个被试中的实验准确率都很高,其中对dog2、dog3、dog5的分类准确率最佳。所有方法依次在五组犬类进行实验最终获得的分类结果如上表所示。本文提出的方案优势在于:(一)本方法在各个被试上的实验结果显示,本方法对各个被试都有很高的分类准确率。(二)利用半监督学习方法,将无标注数据和有标注数据一同送入神经网络结构中进行学习与分类,逐步解放模型结构对有标注数据的依赖程度。(三)采用深层对抗生成网络,将生成对抗网络模型引入脑电识别中,利用生成器的强大功能对原始脑电信号进行深度特征学习的同时生成伪脑电时频图。利用生成器与判别器之间的对抗优化和判别器自身作为神经网络对脑电时频特征的学习不断优化判别器的性能,达到准确分类的效果。(四)采用半监督学习方法,判别器对于生成器生成的伪数据与真数据的判断使其获得先验知识,对于数据的真假有了初步的判断,初步学到一些特征,继而使用真实数据进行特征学习与训练。附图说明图1是本发明所设计方法的流程图。图2是本发明所设计的半监督深度生成对抗网络结构流程示意图。具体实施方式下面结合附图和具体实施方式对本发明做进一步的描述。步骤一,数据获取。本发明所述方法应用于由宾夕法尼亚大学和梅奥诊所联合开发的颅内脑电数据中的五组犬类癫痫被试颅内脑电数据。使用颅内脑电确定癫痫病灶在大脑中的位置以便于实施手术并防止将来的癫痫发作。该数据集采集时使用不同数量的电极,采样频率400hz,参考电极为颅外电极。该数据每十分钟划分为一段,数据类别分为癫痫发作前期和间期。数据段按时间顺序编号,测试数据随机排列。发作前期包含发作前五分钟共一小时时长的数据(发作前1:05-0:05)。取发作前五分钟数据(1)保证有足够的操作时间留给被试、医护人员作出反应,及时发出警告并用药处理;(2)保证任何保证数据完整性防止发作前预警信息被遗漏。同样发作间期数据划分为十分钟一段共计一小时时长。发作间期数据从完整数据记录中随机抽取,并有效避开发作前期与发作后期的信号影响。为避免癫痫信号的前期、间期、发作期和发作后期数据受到干扰,要求数据采集的前后一周时间内不能有其他癫痫发作情况。整个监测过程要少于一周,间期数据采集时间严格控制于癫痫发作之前或之后至少四个小时。间期数据在限制条件满足的情况下从犬类被试中随机选取。数据通道数和数量大小如表1所示。表1数据详情描述本实验共包含两类数据:有标签数据和无标签数据。其中有标签数据又分为:训练数据和测试数据。训练数据由有标签数据和无标签数据组成,用于训练分类器;测试数据仅由有标签数据组成用于验证分类器性能。训练数据和测试数据的类均分为:癫痫发作前期和癫痫发作间期,由于本实验仅用此两种类别因此实验中类别标签分别用0和1来表示。步骤二,将实验数据以矩阵形式排列表示为n*p的矩阵,其中n代表对应被试的脑电采集所用的电极导数,p代表该样本的数据点总数p=t*f,t代表采样总时间,f代表对该被试脑电数据的采样频率。步骤三,将原始数据转化成频谱形式。对每一导原始信号采用固定长度为w的滑动时间窗将n导原始脑电信号的每一导进行分割成w大小子窗,相邻子窗之间相互叠加,起到将原始数据进行冗余和扩容的效果,窗口长度w取决于原始数据的长度和采样频率,本实验中采用汉明窗。通过窗口的连续滑动与进行傅立叶变换获得二维频谱数据。步骤四,将二维频谱数据转换成图片。根据获得的二维频谱数据的矩阵,输出频谱图。将n导数据每0.5分钟生成一张图片则共生成20*n*ci张图,其中c为不同阶段数据片数量,其中i=0/1分别代表癫痫脑电数据的发作间期和前期。步骤五,利用半监督深层生成对抗网络生成伪样本。将维度为z的随机噪声数据输入到半监督深层生成对抗网络中的生成器g中,生成器g从噪声数据中进行随机采样,利用反卷积生成伪脑电时频数据图。步骤六,对抗生成分类。将频谱图和伪脑电时频数据图一同送入判别器中进行训练与分类,得到最后的分类结果。训练的同时生成器g会根据判别器的判别结果优化自己生成能力,以生成与原始图像数据分布相近的伪脑电时频数据图。判别器通过与生成器之间的对抗训练,迭代优化最终获得更加准确的分类效果。判别器为六层结构卷积神经网络,输入为input=32*32*3的矩阵,第二层卷积核大小为conv_1=64*64,第三层卷积核大小为conv_2=128*128,第四层卷积核为conv_3=256*256,第五层为全连阶层,第六层为输出output和对有标签数据的分类概率做softmax的输出结果。对于有监督学习的输出结果输入给softmax,概率的最大值位置对应为估计标签。每一层引入dropout方法以提高模型性能,dropout取值为0.5。其中生成器为六层结构反卷积神经网络,输入为100维高斯或随机噪声数据,反卷积的数据包括卷积核、stride、padding;第二层反卷积数据分别为deconv_0=[384,2,1],第三层反卷积反卷积数据为deconv_1=[128,4,2],第四层反卷积反卷积数据为deconv_2=[64,4,2],第五层反卷积反卷积数据为deconv_3=[3,6,2];第六层为输出层。实验参数具体设置如表2所示:表2训练过程实验参数设置批处理大小(batchsize):128衰减步数(decaysteps):10000学习率(learningrate):1e-4衰减率(decayrate):0.5更新率(updaterate):5dropout:0.5半监督深层生成对抗网络的loss为:loss=losssupervised+lossunsupervisedloss使用的是交叉熵损失函数,supervised代表有标签数据,unsupervised代表无标签数据。有标签数据为步骤一中的有标签训练样本集;无标签数据为无标签训练样本集中的数据和伪脑电频谱数据;上式中:其中,x,y~p(x,y)代表真实数据的概率;x代表输入样本;y代表输入样本标签;表示取期望;k代表数据类别数;pmodel代表半监督深层生成对抗网络的判别输入是假图像的概率;其中x~g代表伪脑电频谱数据的概率分布。对于无监督学习来说,主要任务为判断输入数据的真假,作为第一步的粗略划分,该部分loss可以表示为:d(x)=1-pmodel(y=k+1|x)其中pmodel表示判别是假图像的概率,d(x)则代表输出为真实图像的概率,那么无监督学习的损失函数表示为:在无监督学习的损失函数中,输出为真实图像的概率d(x)能够表示的分类结果;z~noise代表噪声数据的概率分布;g(z)代表输入为z时生成器g中的输出结果。对于上述loss的优化,在网络的优化过程中给定参数beta为0.5,使用基于一阶梯度来优化随机目标函数。训练过后将测试数据送入训练好的模型,逐层进行计算,得到预测标签,将预测标签与真实标签进行比较求出分类正确率。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1