基于集成模型的单通道脑电信号睡眠分期方法及系统与流程

文档序号:21269062发布日期:2020-06-26 22:49阅读:332来源:国知局
基于集成模型的单通道脑电信号睡眠分期方法及系统与流程

本发明涉及睡眠分期领域,且特别涉及一种基于集成模型的单通道脑电信号睡眠分期方法及系统。



背景技术:

睡眠是人类生理活动中最重要的昼夜节律之一,其质量会影响我们的日常行为,例如学习、记忆和注意力等。当持续缺乏睡眠时,通常会引起高血压、睡眠呼吸暂停综合征、肥胖症、心血管疾病、阿尔兹海默症及帕金森病等疾病。已有的科学研究表明脑电信号(eeg)所记录的生理信号有利于分析睡眠周期的变化规律,对于诊断和治疗与睡眠相关的疾病有着重大意义。

对于睡眠分期的研究,一般是将采集的eeg分割成30s的片段,每一个片段都由专业医师根据美国睡眠医学学会(aasm)的睡眠分期规则将睡眠分为5个时期,即清醒期(w)、非快速眼动1期(n1)、非快速眼动2期(n2)、非快速眼动3期(n3)和快速眼动期(rem)。在目前的睡眠分期方法研究中,eeg数据采集大多使用标准19导,这不仅不易于佩戴,也较为严重的影响了受试者的睡眠质量。另外,在19导eeg数据采集完成后,几乎所有的研究都集中于eeg信号的分析,提取eeg信号的时频域特征,进而通过机器学习算法(包括逻辑回归、支持向量机、随机森林等)完成睡眠分期。这些研究仅仅考虑eeg信号特征而忽视了受试者本身的一些特征,比如年龄及性别等,这在一定程度了影响了睡眠分期的识别率。此外,由于睡眠本身的一些特质导致各个时期的数据片段分布差异很大,尤其是n1期相对较少,这便导致机器学习算法产生较大的偏差,进而使n1期的召回率非常低。



技术实现要素:

本发明为了克服现有技术的不足,提供一种能大幅度提高睡眠分期准确率的基于集成模型的单通道脑电信号睡眠分期方法及系统。

为了实现上述目的,本发明提供一种基于集成模型的单通道脑电信号睡眠分期方法,其包括采集患者单通道的脑电信号和受试者的自身特征;对获取的单通道脑电信号进行预处理,将完整的单通道脑电信号分割成具有一定时长的多个片段信号;获取每个片段信号内的多段节律波;提取每个片段信号的时域特征参数和每个片段信号上的每个节律波的频域特征参数;将获得多个特征参数和用户特征输入已构建完成的集成模型以获得单通道脑电信号的睡眠分期结果,集成模型基于改进的随机森林算法和改进的lightgbm算法而建立且为每个睡眠时期赋予了可调整的权重惩罚因子。

根据本发明的一实施例,集成模型包括两层:

第一层由改进的随机森林算法和改进的lightgbm算法组成,改进的随机森林算法和改进的lightgbm算法均为每个睡眠时期赋予了可调整的权重惩罚因子;

第二层由为每个睡眠时期赋予了可调整的权重惩罚因子的改进的lightgbm算法组成;

可调整的权重惩罚因子采用以下公式确定:

其中wi表示属于第i类睡眠时期的权重系数;nt表示分割后具有一定时长的片段信号的总数目;nci表示属于每一类睡眠时期所包含的片段信号的数量;pi是可调整的权重惩罚因子。

根据本发明的一实施例,在集成模型内,改进的随机森林算法和改进的lightgbm算法均为n1期赋予了一个大于其它睡眠时期的可调整的权重惩罚因子pi。

根据本发明的一实施例,在构建并训练集成模型时,可调整的权重惩罚因子通过交叉验证方法确定最优解。

根据本发明的一实施例,在集成模型内改进的随机森林算法和改进的lightgbm算法通过stacking方式集成,睡眠分期的步骤包括:

基于输入的多个特征参数和用户特征,集成模型第一层中的改进的随机森林算法和改进的lightgbm算法分别获得第一睡眠分期结果和第二睡眠分期结果;

将第一睡眠分期结果和第二睡眠分期结果组合后输入集成模型第二层内的改进的lightgbm算法以获得最终的睡眠分期结果。

根据本发明的一实施例,时域特征参数包括每个片段信号的最小值、最大值、平均值、方差、hjorth参数以及最大-最小距离;频域特征参数包括katz分形维数、petrosian分形维数、近似熵、谱熵以及renyi’s熵。

根据本发明的一实施例,受试者的自身特征包括其年龄和性别,将获得多个特征参数和用户特征输入以构建完成的集成模型前将用户特征匹配到每一片段信号。

相对应的,本发明还提供一种基于集成模型的单通道脑电信号睡眠分期系统,其包括信号采集模块、预处理模块、节律波获取模块、特征提取模块以及睡眠分期模块。信号采集模块采集患者单通道的脑电信号和受试者的自身特征。预处理模块对获取的单通道脑电信号进行预处理,将完整的单通道脑电信号分割成具有一定时长的多个片段信号。节律波获取模块获取每个片段信号内的多段节律波。特征提取模块提取每个片段信号的时域特征参数和每个片段信号上的每个节律波的频域特征参数。睡眠分期模块将获得多个特征参数和用户特征输入已构建完成的集成模型以获得单通道脑电信号的睡眠分期结果,集成模型基于改进的随机森林算法和改进的lightgbm算法而建立且为每个睡眠时期赋予了可调整的权重惩罚因子。

综上所述,本发明提供的基于集成模型的单通道脑电信号睡眠分期方法及系统在采集单通道脑电信号的同时结合受试者的自身特征,较大程度提高睡眠分期的预测性能。而基于改进的随机森林算法和改进的lightgbm算法的集成模型很好地解决了单个模型的不足,进一步提高预测准确率的同时提高模型的泛化能力。而在该集成模型内,改进的随机森林算法和改进的lightgbm算法可为每个睡眠时期赋予了可调整的权重惩罚因子,在进行睡眠分期时可基于历史分期结果调整某一睡眠时期的权重惩罚因子以提高该睡眠时期的召回率,解决现有睡眠分期方法睡眠数据不平衡分布的问题,从而大大提高睡眠分期的准确率。

为让本发明的上述和其它目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合附图,作详细说明如下。

附图说明

图1所示为本发明一实施例提供的基于集成模型的单通道脑电信号睡眠分期方法的流程图。

图2所示为本发明一实施例提供的基于集成模型的单通道脑电信号睡眠分期方法中特征参数提取的原理框图。

图3所示为集成模型的训练示意图。

图4所示为发明一实施例提供的基于集成模型的单通道脑电信号睡眠分期系统的原理框图。

具体实施方式

图1所示为本发明一实施例提供的基于集成模型的单通道脑电信号睡眠分期方法的流程图。图2所示为本发明一实施例提供的基于集成模型的单通道脑电信号睡眠分期方法中特征参数提取的原理框图。图3所示为集成模型的训练示意图。图4所示为发明一实施例提供的基于集成模型的单通道脑电信号睡眠分期系统的原理框图。请一并参阅图1至图4。

本实施例提供一种基于集成模型的单通道脑电信号睡眠分期方法,其包括:采集患者单通道的脑电信号和受试者的自身特征(步骤s10)。对获取的单通道脑电信号进行预处理,将完整的单通道脑电信号分割成具有一定时长的多个片段信号(步骤s20)。获取每个片段信号内的多段节律波(步骤s30)。提取每个片段的时域特征参数和每个片段上的每个节律波的频域特征参数(步骤s40)。将获得多个特征参数和用户特征输入已构建完成的集成模型以获得单通道脑电信号的睡眠分期结果,集成模型基于改进的随机森林算法和改进的lightgbm算法而建立且为每个睡眠时期赋予了可调整的权重惩罚因子(步骤s50)。以下将结合图1至图3来详细介绍本实施例提供的基于集成模型的单通道脑电信号睡眠分期方法的原理。

本实施例提供的基于集成模型的单通道脑电信号睡眠分期方法始于步骤s10。在该步骤中,使用脑电采集设备以500hz的采样频率获取受试者24小时的单通道脑电信号。于此同时获取受试者的自身特征,所述自身特征包括受试者的性别和年龄等。

在获取到受试者的单通道脑电信号后执行步骤s20,对获取的单通道脑电信号进行预处理。所述预处理包括:首先,采用0.5hz到49.5hz的带通滤波器进行滤波,过滤高频信号;其次,将滤波后的完整的单通道脑电信号分割成具有一定时长的多个片段信号。于本实施例中,片段信号的时长为30秒。然而,本发明对此不作任何限定。

对于获取到的每个片段信号,执行步骤s30,采用14阶无限脉冲响应(iir)巴特沃思带通滤波器提取9段节律波,分别为0.5hz-4hz的δ节律波、4hz-8hz的θ节律波、8hz-12hz的α节律波、12hz-15hz的spindle节律波、15hz-22hz的β1节律波、22hz-30hz的β2节律波、30hz-40hz的γ1节律波、40hz-49.5hz的γ2节律波以及k-complex节律波。

之后执行步骤s40,对获取的片段信号和从该片段信号上提取的每一节律波进行特征参数提取。具体而言,所述特征参数提取包括两部分,其中一部分为对获取的每一片段信号进行时域特征参数的提取;另一部分为对每一片段信号上的每一节律波进行频域特征参数的提取。于本实施例中,时域特征参数包括最小值、最大值、平均值、方差、hjorth以及最大-最小距离参数;频域特征参数包括katz分形维数、petrosian分形维数、近似熵、谱熵以及renyi’s熵。以下将详细接收各个特征参数的提取算法。

①最小值、最大值

最小值和最大值指在30s片段信号内,脑电信号幅度的最小值和最大值。假设片段信号为x(n),采样点为n(此外n为15000),则最小值smin和最大值smax为:

smin=minx(i),i=1,2,…,n公式1

smax=maxx(i),i=1,2,…,n公式2

②平均值和方差

平均值表示不同睡眠时期脑电信号的在特定值上下波动,方差表示不同睡眠时期脑电信号的变化范围。平均值smean和方差svar计算方法如下:

③hjorth参数

hjorth参数包含hjorth移动性和hjorth复杂度:

hjorth移动性可由公式5表示:

hjorth复杂度可由公式6表示:

其中,difi=x(i)-x(i-1),x(i)是片段信号,i=1,2,...,n,n为片段信号的采样点。

④最大-最小距离

最大-最小距离是指在每个片段信号中找到最大采样点与最小采样点之间的距离,计算公式如下:

其中δx表示最大样本点与最小样本点在x轴上的差值;δy表示最大样本点与最小样本点在y轴上的差值。

⑤katz分形维数和petrosian分形维数

katz分形维数和petrosian分形维数测量片段信号的复杂度,katz分形维数可由公式8表示:

其中l表示两个连续片段信号之间的距离之和,d表示片段信号上第一个采样点与任何其它采样点之间的最大欧几里得距离,n为片段信号的采样点。

petrosian分形维数可由公式9表示:

其中m表示片段信号导数符号变化的次数。

⑥近似熵算法如下:

对于原始输入信号x(i)=[x1,x2,…,xn]构造新的子序列,x(i,l)=[xi,xi+1,…,xi+l-1],1≤i≤n-l,其中l是子序列的长度,取1,2或者3;

r定义为信号噪声等级,r=k·sd,其中sd是信号x(i)的标准差,k=0,0.1,0.2,…,0.9;

构建空间子矩阵x(j,l)={x(j,l)|j∈[1,2,…,n-l]},对矩阵中每个元素计算

c(i,l)代表矩阵x(j,l)中小于r的数目与总数n-l的比值,计算公式如下:

故近似熵可由公式12计算:

⑦renyi’s熵定义为:

其中,q是renyi’s熵的权数,当q趋近于1时,hq收敛到香农熵,当q趋近于0时,hq收敛到最小熵,x(i)是片段信号,i=1,2,...,n,n为该片段信号的长度。

⑧谱熵

谱熵被广泛用于评估声谱形状的平坦度,计算公式如14所示:

利用n点(即15000)快速傅立叶变换(fft)计算每一帧的频谱,然后对每一帧的频谱进行归一化,并将ft(i)作为帧ft的频谱中第i个频率段的归一化幅度。

在获得每一片段信号的时域特征参数和每一节律波的频域特征参数后,执行步骤s50将这些特征参数和已匹配到每一片段信号上的用户特征一并输入已构建完成的集成模型以获得单通道脑电信号的睡眠分期结果。集成模型基于改进的随机森林算法和改进的lightgbm算法而建立的且为每个睡眠时期赋予了可调整的权重惩罚因子。

本实施例提供的基于集成模型的单通道脑电信号睡眠分期方法,在提取受试者脑电时频域特征后并加入年龄和性别特征,两者结合作为集成模型的输入大大提高了睡眠分期的预测性能。在模型上通过构建基于改进的随机森林算法和改进的lightgbm算法的双层集成模型,不仅有效了避免单一模型的缺陷;更进一步的,在该集成模型中,改进的随机森林算法和改进的lightgbm算法均为改进型的,两者均为每个睡眠时期赋予了可调整的权重惩罚因子。在模型训练和测试时可通过调整每个睡眠时期的权重惩罚因子来获得该睡眠周期的召回率,从而很好地解决了现有睡眠分期方法中睡眠数据不平衡分布的问题。具体而言,现有的睡眠分期方法中n1期数据相对比较少,故于本实施例中,改进的随机森林算法和改进的lightgbm算法均为n1期赋予了一个大于其它睡眠时期的可调整的权重惩罚因子pi。

于本实施例中,集成模型包括两层:

第一层由改进的随机森林算法和改进的lightgbm算法组成,改进的随机森林算法和改进的lightgbm算法均为n1期一个大于其它睡眠时期的可调整的权重惩罚因子pi。在进行睡眠分期时,基于输入的多个特征参数和用户特征,集成模型第一层中的改进的随机森林算法和改进的lightgbm算法分别获得第一睡眠分期结果和第二睡眠分期结果。

第二层由为每个睡眠时期赋予了可调整的权重惩罚因子的改进的lightgbm算法组成。将第一睡眠分期结果和第二睡眠分期结果组合后输入集成模型第二层内的改进的lightgbm算法以获得最终的睡眠分期结果。

于本实施例中,改进的随机森林算法和改进的lightgbm算法通过stacking方式集成在一起。然而,本发明对此不作任何限定。

对于改进的随机森林算法和改进的lightgbm算法中的可调整的权重惩罚因子采用以下公式确定:

其中wi表示属于第i类睡眠时期的权重系数;nt表示分割后具有一定时长的片段信号的总数目;nci表示属于每一类睡眠时期所包含的片段信号的数量;pi是可调整的权重惩罚因子。

具体而言,可调整的权重惩罚因子pi可在集成模型训练时采用交叉验证方法确定来最优解。以下将结合图3来详细介绍本实施例提供的集成模型的训练方法。

首先,建立数据库。招募大量不同性别及不同年龄受试者并采用步骤s10来获取每个受试者的单通道脑电信号和自身特征。之后分别采用步骤s20将每个受试者的单通道脑电信号进行预处理和片段分割并请专业医师对每个片段信号进行标记,分成w期、n1期、n2期、n3期和rem期。之后,执行步骤s30至s40来获取每个受试者的单通道脑电信号内的特征参数,建立睡眠脑电数据库。

其次,构建基于改进的随机森林算法和改进的lightgbm算法的双层集成模型,改进的随机森林算法和改进的lightgbm算法均为每个睡眠时期赋予了可调整的权重惩罚因子。

接着,对集成模型进行训练。以下将结合图3来详细介绍本实施例提供的集成模型的训练过程。

在样本数据库内获取多个数据样本以形成样本数据集,将样本数据集分成样本训练集、样本验证集和样本测试集。于本实施例中,将样本训练集和样本验证集合并后输入改进的第一层内的改进随机森林算法和改进的lightgbm算法中,使用网格搜索和5折交叉验证方法分别调整两个算法中的权重惩罚因子pi和超参数。

5折交叉验证方法的具体步骤为:①首先将样本训练集和样本验证集合并,然后均分成五个大小相同的互斥子集,每个子集尽量保证数据分布一致性。②每次用四个子集的并集作为训练子集,剩下的一个子集作为验证子集,重复这个操作五次,获得五组验证集。③五个验证集结果对算法的预测结果进行投票,票数最多的作为最终预测类别。接着,使用网格搜索寻找最优的pi和超参数,其中每一次寻优都采用5折交叉验证方法。

之后,将第一层内的改进的随机森林算法和改进的lightgbm算法分别形成第一睡眠分期结果和第二睡眠分期结果输入集成模型第二层内基于网格搜索和5折交叉验证方法所调整的改进的lightgbm算法以获得每个样本信号的最终睡眠分期结果。

最后,采用样本测试集对训练好的集成模型第一层和第二层内的算法进行测试。

相对应的,本实施例还提供一种基于集成模型的单通道脑电信号睡眠分期系统,其包括信号采集模块1、预处理模块2、节律波获取模块3、特征提取模块4以及睡眠分期模块5。信号采集模块1采集患者单通道的脑电信号和受试者的自身特征。预处理模块2对获取的单通道脑电信号进行预处理,将完整的单通道脑电信号分割成具有一定时长的多个片段信号。节律波获取模块3获取每个片段信号内的多段节律波。特征提取模块4提取每个片段信号的时域特征参数和每个片段信号上的每个节律波的频域特征参数。睡眠分期模块5将获得多个特征参数和用户特征输入已构建完成的集成模型以获得单通道脑电信号的睡眠分期结果,集成模型基于改进的随机森林算法和改进的lightgbm算法而建立且为每个睡眠时期赋予了可调整的权重惩罚因子。

基于集成模型的单通道脑电信号睡眠分期系统的工作原理如本实施提供的基于集成模型的单通道脑电信号睡眠分期方法中步骤s10~步骤s50所示,在此不作赘述。

综上所述,本发明提供的基于集成模型的单通道脑电信号睡眠分期方法及系统在采集单通道脑电信号的同时结合受试者的自身特征,较大程度提高睡眠分期的预测性能;而基于改进的随机森林算法和改进的lightgbm算法的集成模型很好地解决了单个模型的不足,进一步提高预测准确率的同时提高模型的泛化能力。而在该集成模型内,改进的随机森林算法和改进的lightgbm算法可为每个睡眠时期赋予了可调整的权重惩罚因子,在进行睡眠分期时可基于历史分期结果调整某一睡眠时期的权重惩罚因子以提高该睡眠时期的召回率,解决现有睡眠分期方法睡眠数据不平衡分布的问题,从而大大提高睡眠分期的准确率。

虽然本发明已由较佳实施例揭露如上,然而并非用以限定本发明,任何熟知此技艺者,在不脱离本发明的精神和范围内,可作些许的更动与润饰,因此本发明的保护范围当视权利要求书所要求保护的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1