本发明涉及疾病诊断技术领域,尤其涉及一种基于脑电图深度学习的辅助诊断方法及系统。
背景技术
癫痫是由大脑神经元突发性异常过度放电引发的大脑短暂性功能障碍,年发病率较高,脑电图信号的检测和识别是诊断癫痫病最重要的手段,脑电图是通过医学仪器脑电图扫描仪,将人体脑部自身产生的微弱生物电于头皮处收集,并放大记录而得到的曲线图,它是临床医师诊断多种脑科相关疾病的主要手段和依据,尤其是癫痫或癫痫发作。
被记录下的非源自大脑的电信号叫伪差,伪差可以有眼部肌肉活动、脑电图电极接触不良、吞咽动作和头部位移等多种因素组成,由于脑电图数据总是存在伪差,而伪差与癫痫发作时的脑电图特征有类似性,区分伪差和癫痫发作特征,是检测癫痫的一大难点。
公开号为cn106874694a的专利公开了一种面向癫痫脑电信号识别的智能诊断系统,其特征在于:它包括后台的一套脑电数字信号处理程序和一个可视化的客户端操作界面;所述的后台的一套脑电数字信号处理程序,其特征提取模块利用离散小波变换和统计方法来提取原始脑电信号片段中的特征量,其模型训练模块利用径向基函数神经网络和最小最大概率机构建可靠的癫痫诊断模型,其训练好的诊断模块利用径向基函数神经网络和分类决策树对新输入的脑电信号做出诊断;所述可视化的客户端操作界面,其数据读取模块负责读取原始脑电信号片段数据,其数据通信模块负责向后台发起请求、发送数据信息,等待接收后台的响应和数据信息,其数据呈现模块负责以图表的方式显示原始脑电信号片段和提取的脑电信号特征量,最终显示后台返回的诊断结果。通过该系统能够自动检测以及诊断癫痫疾病,提高医师的诊断效率,但是其并不能给出精确的识别结果以及患病概率,诊断的准确性较差。
技术实现要素:
本发明要解决的技术问题目的在于提供一种基于脑电图深度学习的辅助诊断方法及系统,用以解决癫痫疾病自动诊断准确度不高、诊断效率较低的问题。
为了实现上述目的,本发明采用的技术方案如下:
一种基于脑电图深度学习的辅助诊断方法,包括:
s10:获取采集的脑电图样本数据,将所述脑电图样本数据整合至预设规范化模型中,得到规范化脑电图整型数据;
s20:根据预设词嵌入模型,将所述规范化脑电图整型数据转换为词嵌入向量;
s30:根据预设深度学习模型对所述词嵌入向量进行特征提取,并对提取后的特征进行时间标记以及识别诊断;
s40:根据所述时间标记以及识别诊断,输出疾病发作概率,并对所述疾病发作概率超过预设概率的脑电图样本数据进行区分。
进一步的,所述步骤s10具体包括步骤:
s101:将所述脑电图样本数据按采集的电极数目以及记录时长转换为二维矩阵;
s102:对所述二维矩阵进行池化处理,获取池化后的池化矩阵;
s103:对所述池化矩阵进行u律非线性压缩变换,得到脑电图整型数据。
进一步的,所述步骤s20具体包括步骤:
s201:根据记录时间顺序,将所述脑电图整型数据作为语料库,并通过词袋模型以及跳跃模型进行词预测监督学习,以形成词嵌入矩阵;
s202:将所述脑电图整型数据转换得到三维数据矩阵,并与所述词嵌入矩阵相乘,得到所述词嵌入向量。
进一步的,所述步骤s30具体包括步骤:
s301:将三维卷积层进行多层叠加,作为特征提取层;
s302:通过所述特征提取层对所述词嵌入向量进行特征提取,获取脑电图数据特征;
s303:将注意力层以及递归神经网络进行叠加并对所述脑电图数据特征进行时间标记以及识别诊断。
进一步的,还包括步骤:
s11:通过预设疾病发作数据库对所述预设词嵌入模块以及预设深度学习模块进行监督训练,所述预设疾病发作数据库包括失神发作数据库、强直发作数据库、广义非特异性发作数据库、阵挛性发作数据库、焦点非特异性发作数据库、强直阵挛性发作数据库、简单部分性发作数据库、失张力发作数据库、复杂部分性发作数据库以及肌阵挛发作数据库。
一种基于脑电图深度学习的辅助诊断系统,包括:
输入规范化模块:用于获取采集的脑电图样本数据,将所述脑电图样本数据整合至预设规范化模型中,得到规范化脑电图整型数据;
词嵌入模块:用于根据预设词嵌入模型,将所述规范化脑电图整型数据转换为词嵌入向量;
深度学习模块:用于根据预设深度学习模型对所述词嵌入向量进行特征提取,并对提取后的特征进行时间标记以及识别诊断;
输出模块:用于根据所述时间标记以及识别诊断,输出疾病发作概率,并对所述疾病发作概率超过预设概率的脑电图样本数据进行区分。
进一步的,所述系统具体包括:
二维矩阵转换单元:用于将所述脑电图样本数据按采集的电极数目以及记录时长转换为二维矩阵;
池化处理单元:用于对所述二维矩阵进行池化处理,获取池化后的池化矩阵;
压缩变换单元:用于对所述池化矩阵进行u律非线性压缩变换,得到脑电图整型数据。
进一步的,所述系统具体包括:
词嵌入矩阵单元:用于根据记录时间顺序,将所述脑电图整型数据作为语料库,并通过词袋模型以及跳跃模型进行词预测监督学习,以形成词嵌入矩阵;
词嵌入向量单元:用于将所述脑电图整型数据转换得到三维数据矩阵,并与所述词嵌入矩阵相乘,得到所述词嵌入向量。
进一步的,所述系统具体包括:
叠加单元:用于将三维卷积层进行多层叠加,作为特征提取层;
特征提取单元:用于通过所述特征提取层对所述词嵌入向量进行特征提取,获取脑电图数据特征;
标记识别单元:用于将注意力层以及递归神经网络进行叠加并对所述脑电图数据特征进行时间标记以及识别诊断。
进一步的,还包括:
监督训练模块:用于通过预设疾病发作数据库对所述预设词嵌入模块以及预设深度学习模块进行监督训练,所述预设疾病发作数据库包括失神发作数据库、强直发作数据库、广义非特异性发作数据库、阵挛性发作数据库、焦点非特异性发作数据库、强直阵挛性发作数据库、简单部分性发作数据库、失张力发作数据库、复杂部分性发作数据库以及肌阵挛发作数据库。
采用本发明,通过利用预设疾病发作数据库对各个模型进行监督训练,能够对脑电图中可能存在的癫痫发作进行标记以及输出潜在的患病概率,从而快速的为临床医生提供诊断依据和诊断建议,提高癫痫病的诊断效率,而通过监督训练,也保证了诊断的准确性。
附图说明
图1是本发明一个实施方式提供的一种基于脑电图深度学习的辅助诊断方法流程图;
图2是本发明一个实施方式提供的一种基于脑电图深度学习的辅助诊断方法流程图;
图3是本发明一个实施方式提供的一种基于脑电图深度学习的辅助诊断方法流程图;
图4是本发明一个实施方式提供的一种基于脑电图深度学习的辅助诊断方法流程图;
图5是本发明一个实施方式提供的一种基于脑电图深度学习的辅助诊断系统结构图;
图6是本发明另一个实施方式提供的一种基于脑电图深度学习的辅助诊断方法流程示意图。
具体实施方式
以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
实施例一
参考图1,本实施例提供了一种基于脑电图深度学习的辅助诊断方法,包括:
s10:获取采集的脑电图样本数据,将所述脑电图样本数据整合至预设规范化模型中,得到规范化脑电图整型数据;
s20:根据预设词嵌入模型,将所述规范化脑电图整型数据转换为词嵌入向量;
s30:根据预设深度学习模型对所述词嵌入向量进行特征提取,并对提取后的特征进行时间标记以及识别诊断;
s40:根据所述时间标记以及识别诊断,输出疾病发作概率,并对所述疾病发作概率超过预设概率的脑电图样本数据进行区分。
本申请中,通过相应的医疗设备对疾病人员进行诊断,即将相应的诊断步骤以及系统设置于医疗设备中,通过医疗设备来对疾病人员进行自动诊断,其中,本申请中的疾病为癫痫。
步骤s10中,脑电图样本图像为癫痫病诊断病人的头皮脑电图,其中头皮脑电图可以通过医学仪器脑电图扫描仪,将人体脑部自身产生的微弱生物电于头皮处收集,并放大记录以形成曲线图,作为头皮脑电图。
预设规范化模型用于将扫描仪器扫描得到的脑电图数据根据格式以及数值,整合到模型规范化的输入矩阵格式中。
本实施例中,步骤s10具体还包括步骤:
s101:将所述脑电图样本数据按采集的电极数目以及记录时长转换为二维矩阵;
s102:对所述二维矩阵进行池化处理,获取池化后的池化矩阵;
s103:对所述池化矩阵进行u律非线性压缩变换,得到脑电图整型数据。
步骤s101中,在采集脑电图时,是通过在头皮上安装多个电极,以采集脑部头皮不同部位的脑电波信号,保证采集到的数据的准确性,记录时长即在采集脑电波过程中各个电极相应的采集时长。其中,癫痫或癫痫发作时,其脑电波主要表现为急波等。
通过预设规范化模型将扫描仪传入的原始脑电图数据按头皮上采集的电极数目和记录时长转换为二维矩阵。
步骤s102中,在卷积神经网络中,池化操作用于降低卷积层输出的特征向量,改善输出结果,一般池化操作包括随机池化、平均池化以及最大池化。二维矩阵进过池化操作之后,转换为16*n的矩阵,即为池化矩阵,其中n为100hz的时间记录数据长度。
步骤s103中,对池化矩阵进行u律非线性压缩变换,使得每个数据点转换为0-256的整形数据,即脑电图整型数据。
步骤s20中,预设词嵌入模型时采用自然语言处理算法,由已规范化的数据库数据作为字典向量,监督学习训练得到的,预设词嵌入模型用于将脑电图数据库数据转换压缩成低纬度并带有特征的词嵌入向量。
本实施例中,步骤s20具体包括:
s201:根据记录时间顺序,将所述脑电图整型数据作为语料库,并通过词袋模型以及跳跃模型进行词预测监督学习,以形成词嵌入矩阵;
s202:将所述脑电图整型数据转换得到三维数据矩阵,并与所述词嵌入矩阵相乘,得到所述词嵌入向量。
步骤s201中,记录时间顺序为各个电极记录脑电波的时间顺序,例如,头皮上设置有多个电极,不同电极的开始记录的时间以及记录时间长度各不相同。
按记录时间顺序,将0-256的脑电图整型数据作为语料库,通过词袋模型以及跳跃模型进行词预测监督学习,学习得到16维的词嵌入向量,形成257*16的词嵌入矩阵。
步骤s202中,再将步骤s103中的0-256脑电图整型数据点按大小转换为257维的one-hot向量,并与步骤s201中的词嵌入矩阵相乘,得到输出词嵌入后的脑电图特征数据,即词嵌入向量。
其中,上述的one-hot是一种常用的样本标记方法,对于有多个不同类别的样本,可以用一个n维向量表示其中一种类别或多种类别的组合,当这个向量表示多类组合时,可以根据向量中元素的位置确定该向量表示的是哪几种类别的组合。
步骤s30中,预设深度学习模型承接预设词嵌入模型,预设深度学习模型是由已转化成词嵌入向量的脑电图数据基于人工标注监督学习训练得来的,用于进一步的对词嵌入向量进行特征提取,并根据递归神经网络进行时间标记和识别诊断。
其中,步骤s30具体包括步骤:
s301:将三维卷积层进行多层叠加,作为特征提取层;
s302:通过所述特征提取层对所述词嵌入向量进行特征提取,获取脑电图数据特征;
s303:将注意力层以及递归神经网络进行叠加并对所述脑电图数据特征进行时间标记以及识别诊断。
步骤s301中,三维卷积层进过多层叠加后作为特征提取层,其中,多层至少为三层以上。
预设深度学习模型采用了编码器-解码器架构,将每个输入时间数据节点输出0-1的癫痫发作标记概率。
本实施例中,还包括步骤:
s11:通过预设疾病发作数据库对所述预设词嵌入模块以及预设深度学习模块进行监督训练,所述预设疾病发作数据库包括失神发作数据库、强直发作数据库、广义非特异性发作数据库、阵挛性发作数据库、焦点非特异性发作数据库、强直阵挛性发作数据库、简单部分性发作数据库、失张力发作数据库、复杂部分性发作数据库以及肌阵挛发作数据库。
在本实施例中,预设词嵌入模型以及预设深度学习模型都是通过预设疾病发作数据进行监督训练的,其中,本实施例中的预设疾病发作数据库包括有多个不同的发作数据库,从而能够精确的对各个模型进行监督训练,保证癫痫或癫痫发作能够准确的得到识别或诊断。
其中,在对深度学习模型进行训练时,采用焦点损失函数以解决癫痫发作数据集中发作标记占比较少的数据不均匀问题。
卷积神经网络采用指数线性激活函数,采用adam优化和随机失活以及l2正则化防止过度拟合,采用特异性作为第一度量指标,敏感性为第二度量指标,f1分数为评估指标,用于减少错误诊断或标记,并在特异性较高的前提下提高敏感性。
本实施例中,步骤s40中的预设概率为百分之五十,即0.5。
统计预设深度学习模型编码器-解码器所输出的时间节点的癫痫发作标记,在原有脑电图输入的基础上将标记概率大于0.5的部分标记为1,并通过不同的颜色进行区分,其中,本实施例采用红色,同时,还将根据各递归节点的输出值,以全连接网络通过sigmoid激活函数输出0-1的患病概率。
通过利用预设疾病发作数据库对各个模型进行监督训练,能够对脑电图中可能存在的癫痫发作进行标记以及输出潜在的患病概率,从而快速准确的为临床医生提供诊断依据和诊断建议,提高癫痫病的诊断效率。
实施例二
参考图2,本实施例提供了一种基于脑电图深度学习的辅助诊断系统,包括:
输入规范化模块21:用于获取采集的脑电图样本数据,将所述脑电图样本数据整合至预设规范化模型中,得到规范化脑电图整型数据;
词嵌入模块22:用于根据预设词嵌入模型,将所述规范化脑电图整型数据转换为词嵌入向量;
深度学习模块23:用于根据预设深度学习模型对所述词嵌入向量进行特征提取,并对提取后的特征进行时间标记以及识别诊断;
输出模块24:用于根据所述时间标记以及识别诊断,输出疾病发作概率,并对所述疾病发作概率超过预设概率的脑电图样本数据进行区分。
本实施例中,词嵌入模块22中包括有预设词嵌入模型转换层框架和存储的词嵌入矩阵以及词嵌入模块22数据输入输出的端口,深度学习模块23中包括有预设深度学习网络结构框架和储存的各层网络权重矩阵以及深度学习模块23数据输入输出的端口。
本实施例中,还包括:
监督训练模块25:用于通过预设疾病发作数据库对所述预设词嵌入模块以及预设深度学习模块进行监督训练,所述预设疾病发作数据库包括失神发作数据库、强直发作数据库、广义非特异性发作数据库、阵挛性发作数据库、焦点非特异性发作数据库、强直阵挛性发作数据库、简单部分性发作数据库、失张力发作数据库、复杂部分性发作数据库以及肌阵挛发作数据库。
本实施例中,输入规范化模块21还包括:
二维矩阵转换单元211:用于将所述脑电图样本数据按采集的电极数目以及记录时长转换为二维矩阵;
池化处理单元212:用于对所述二维矩阵进行池化处理,获取池化后的池化矩阵;
压缩变换单元213:用于对所述池化矩阵进行u律非线性压缩变换,得到脑电图整型数据。
本实施例中,词嵌入模块22包括:
词嵌入矩阵单元221:用于根据记录时间顺序,将所述脑电图整型数据作为语料库,并通过词袋模型以及跳跃模型进行词预测监督学习,以形成词嵌入矩阵;
词嵌入向量单元222:用于将所述脑电图整型数据转换得到三维数据矩阵,并与所述词嵌入矩阵相乘,得到所述词嵌入向量。
本实施例中,深度学习模块23还包括:
叠加单元231:用于将三维卷积层进行多层叠加,作为特征提取层;
特征提取单元232:用于通过所述特征提取层对所述词嵌入向量进行特征提取,获取脑电图数据特征;
标记识别单元233:用于将注意力层以及递归神经网络进行叠加并对所述脑电图数据特征进行时间标记以及识别诊断。
通过各个模块之间互相协作,能过将输入的脑电图数据快速的进行分析,识别出脑电图中的癫痫发作的时间区域,同时给出潜在的患病概率,从而提高诊断效率。
实施例三
参考图3,本实施例提供了一种基于脑电图深度学习的辅助诊断方法流程图,通过扫描仪扫描患者,得到脑电图样本图像,通过输入规范化模块将扫描仪输入数据的格式以及数值整合到规范化模型中,得到输入矩阵格式;再通过词嵌入模型将脑电图数据库数据转换压缩成低纬度并带有特征的词嵌入向量;并通过深度学习模型对词嵌入向量进行标记以及识别诊断;最后由输出模块给出0或1的发作标记,以及患病概率,其中,当为0时表示癫痫未发作,1表示癫痫发作。
以本实施例为例,训练集癫痫发作脑电图采集患者118例,正常背景脑电图146例,总记录时长330.08小时,测试集癫痫发作脑电图采集患者38例,正常背景脑电图12例,总时长171.42小时。mini-batch大小设置为512,训练120个epoch,训练后的测试集表现为:
模型测试roc曲线auc=0.73;
模型测试特异性95.90%,测试敏感性为53.68%,该数据集与以往的模型方法的表现指标相比,参考下表,下表为以往模型表现指标。
通过上表可知,通过本实施例的方法,较先前模型方法的性能有所提高,尤其在保证特异性及不产生误判的基础上提高了敏感性即发作检出率,且在较短时间的常规脑电图情况下性能保持相当。可以为临床医师诊断提高较为准确的诊断依据支持和辅助诊断意见。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。