一种多域特征下的半监督脑电信号睡眠分期方法与流程

文档序号:12468819阅读:218来源:国知局
一种多域特征下的半监督脑电信号睡眠分期方法与流程
本发明属于脑机接口
技术领域
,涉及一种多域特征下的半监督脑电信号睡眠分期方法。
背景技术
:睡眠机制与人体的健康状况息息相关,在人类机体的众多重要的机体活动中扮演着关键的角色。随着社会的快速发展,竞争的日益加快以及生活节奏的加速,人们的生活压力逐渐增大,失眠类疾病的发病率逐年上升,引起了海内外医学界的关注。在治疗失眠过程中,睡眠脑电图可以比较客观的呈现某些睡眠过程的特征,通过对脑电信号的研究与分析,可以获取大量有关人体的有用信息,这对于研究人脑功能、疾病诊断及康复工程等方面发挥着重要作用,所以基于睡眠脑电的分睡眠分期研究也就成了脑机接口研究领域中的热点研究方向之一.传统的基于脑电信号的睡眠分期方法较为成熟,主要是使用那些能够有效表示睡眠分期各个阶段的信号变换规律的特征值来作为下一步分类器分类的属性特征,然后选择合适的分类器进行分类,其总体分期流程可以分为:信号预处理、特征提取、特征选择和分类器分类这四部分。能够用来表示信号变化规律的特征主要分为:时域特征、频域特征、时频域特征和非线性特征。一般方法基本上是使用单独某一类参数,例如信息熵、标准偏差等时域参数,使用不同频段节律波的功率谱密度等频域参数、又或者是以小波系数为代表的时频参数来作为分期特征参数。然而,由于脑电信号非稳定性、非线性的特点,可以完美表征睡眠分期变化规律的有效特征不应通过某一单一域特征参数来获取,而采用大量的不同性质的特征参数也会带来问题:大量的特征参数会导致特征维数空间的扩大,降低计算效率,导致“维度灾难”的发生。此外,当获取到有效特征参数后,使用分类器对其进行分类也存在一个缺陷:传统的睡眠分期分类方法往往专注于分类精度值,却忽略了用于训练分类器的分类样本中标记样本数量给样本采集标识工作所带来的压力,因为标记样本的类型划分需要依靠专家的人工标识,如果数据量过大的话不但会导致人工标识的成本上升,长时间作业的话也会导致分类错误的概率上升,从而影响分类精度。技术实现要素:有鉴于此,本发明的目的在于提供一种多域特征下的半监督脑电信号睡眠分期方法,主要应用于疾病诊断辅助和睡眠分期研究等。该方法不仅能够有效实现基于脑电信号的睡眠分期,避免大量冗余特征参数所导致的分类效率低下,提高模型的泛化能力和计算效率,也降低对于人工判别标志样本的需求,大大降低了人工误判的发生概率,为睡眠分期研究提供了一种新的思路。为达到上述目的,本发明提供如下技术方案:一种多域特征下的半监督脑电信号睡眠分期方法,在该方法中,结合蚁群算法和半监督贝叶斯分类方法,通过蚁群系统ACS算法从多域特征集合中提取最优特征子集,使用改进的半监督贝叶斯分类方法,以最优特征子集为分类特征,结合主动学习策略对其进行分期分类;主动学习过程中采用对称相对熵作为不确定性样本的选择依据,并使用训练的投票分类器对其进行标记分类;该方法具体步骤如下:S1:设原始脑电信号X(t),其中t表示时间,利用陷波滤波器截取特定的频带信号,使其代替X(t)成为原始脑电信号,并通过小波变换法对该信号X(t)进行处理,分解得到与X(t)对应的频带信号f(t)=[f1(t),f2(t),...,fm(t)],其中m表示频带信号个数,每个fm(t)代表一个频段的脑电信号;S2:将脑电信号X(t)以时间段T为单位样本包长度,将脑电信号X(t)划分为n个样本包F(t)=[F1(t),F2(t),...,Fn(t)],其中每个样本包Fn(t)长度为T×fsample,并计算每个样本包的多域属性特征值,得到特征值集合setl×n,其中fsample表示抽样频率,l表示属性特征类型个数,n表示样本包个数;S3:以朴素贝叶斯算法作为蚁群系统ACS算法的分类器,以分类正确率为优化指标,并设置蚁群算法的其他参数,对特征值集合setl×n进行优化,得到最优特征子集setson;S4:根据睡眠分期标准,对所述最优特征子集setson进行处理以得到训练数据和测试数据,将其作为输入数据对融合了主动学习策略的半监督朴素贝叶斯分类器进行训练和前期分类,结束后通过以下公式对余下的测试数据数据进行分类标记,完成睡眠分期分类:其中,p(ci)是类ci的先验概率,p(xs|ci)是后验概率,ei是类ci中样本数,e是样本总数,eis是特征中具有xs的类ci的样本数,σci,μci分别表示属性特征的标准差和平均值。所述的睡眠分期标准参考美国睡眠医学会(AASM)于2007年正式发布的《睡眠及其相关事件判读手册》。进一步,在该方法中,所述的原始脑电信号为根据临床神经生理学国际联合会所指定的10/20系统法,采用电极提取的方式采集的原始脑电信号,采样频率为512Hz。进一步,在步骤S1中,所述的陷波滤波器截取频带的截取范围是1-30Hz,通过小波变换分解得到f(t)=[δ波(1-4Hz),θ波(4-8Hz),α波(8-13Hz),β波(14-30Hz)]。进一步,在步骤S2中,所述的多域属性特征类型包括:时域特征参数,频域特征参数,时频域特征参数,非线性参数。进一步,在步骤S4中,所述的训练数据和测试数据分别为标记数据和无标记数据,且标记数据FL和无标记数据FUL的比例小于1。进一步,在步骤S4中,所述融合了主动学习策略的半监督朴素贝叶斯分类器分类步骤如下:S41:使用公式(1)和公式(2)对标记数据FL进行训练,得到符合AASM标准类型数量的初始分类{C1,C1,...,Cs};S42:随机从标记样本FL中抽取K个样本,抽样次数为H,分别进行朴素贝叶斯分类器训练,得到H个投票分类器,样本数量K≤FL×80%,投票分类器数量H为奇数且大于等于3;S43:使用对称相对熵SKL来检索出无标记样本FUL中所有的不确定性强的样本并交由投票分类器进行判别标记,所标记次数最多的类型则记为标记类:其中,Ψ代表定义的不确定性样本阈值,SKL代表无标记样本x到各类之间的对称相对熵距离值,小于等于阈值表示该样本不确定性最强,须用投票分类器判别;S44:所有满足上述条件的样本被标记完成后,更新样本库中标记样本FL和无标记样本FUL,然后重新使用公式(1)和公式(2)对新的样本库进行训练并进行无标记样本分类。本发明的有益效果在于:本发明提出的基于蚁群算法和半监督贝叶斯分类方法的脑电信号睡眠分期方法,不仅能够有效地实现睡眠分期,避免低效率特征属性及盲目搜索过程造成的运算资源浪费,而且可以降低标记样本的需求数量,通过与近几年提出的多种睡眠分期方法进行对比,结果表明本方法不但可以实现主流算法的分期精度效果,而且可以大大降低标记样本的需求量,避免了人工误判情况的发生。附图说明为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:图1为本发明所述方法的总体流程示意图;图2为结合了主动学习策略的半监督朴素贝叶斯分类方法的流程示意图。具体实施方式下面将结合附图,对本发明的优选实施例进行详细的描述。图1为本发明所述方法的流程示意图,如图所示,本发明提供的一种多域特征下的半监督脑电信号睡眠分期方法包括以下步骤:S1:设原始脑电信号X(t),其中t表示时间,利用陷波滤波器截取特定的频带信号,使其代替X(t)成为原始脑电信号,并通过小波变换法对该信号X(t)进行处理,分解得到与X(t)对应的频带信号f(t)=[f1(t),f2(t),...,fm(t)],其中m表示频带信号个数,每个fm(t)代表一个频段的脑电信号;S2:将脑电信号X(t)以时间段T为单位样本包长度,将脑电信号X(t)划分为n个样本包F(t)=[F1(t),F2(t),...,Fn(t)],其中每个样本包Fn(t)长度为T×fsample,并计算每个样本包的多域属性特征值,得到特征值集合setl×n,其中fsample表示抽样频率,l表示属性特征类型个数,n表示样本包个数;S3:以朴素贝叶斯算法作为蚁群算法的分类器,以分类正确率为优化指标,并设置蚁群算法的其他参数,对特征值集合setl×n进行优化,得到最优特征子集setson;S4:根据睡眠分期标准,对上述最优特征子集setson进行处理以得到训练数据和测试数据,将其作为输入数据对融合了主动学习策略的半监督朴素贝叶斯分类器进行训练和前期分类,结束后通过以下公式对余下的测试数据数据进行分类标记,完成睡眠分期分类:其中,p(ci)是类ci的先验概率,p(xs|ci)是后验概率,ei是类ci中样本数,e是样本总数,eis是特征中具有xs的类ci的样本数,σci,μci分别表示属性特征的标准差和平均值。图2是结合了主动学习策略的半监督朴素贝叶斯分类方法的流程示意图,其所描述的融合了主动学习策略的半监督朴素贝叶斯分类器分类步骤如下:S41:使用公式(1)、(2)对标记数据FL进行训练,得到符合AASM标准类型数量的初始分类{C1,C1,...,Cs};S42:随机从标记样本FL中抽取K个样本,抽样次数为H,分别进行朴素贝叶斯分类器训练,得到H个投票分类器,样本数量K≤FL×80%,投票分类器数量H为奇数且大于等于3;S43:使用对称相对熵SKL来检索出无标记样本FUL中所有的不确定性强的样本并交由投票分类器进行判别标记,所标记次数最多的类型则记为标记类:其中,Ψ代表定义的不确定性样本阈值,SKL代表无标记样本x到各类之间的对称相对熵距离值,小于等于阈值表示该样本不确定性最强,须用投票分类器判别;S44:所有满足上述条件的样本被标记完成后,更新样本库中标记样本FL和无标记样本FUL,然后重新使用(1)和(2)式对新的样本库进行训练并进行无标记样本分类。本发明使用蚁群系统来从特征值集合中选择分类效果最好的最优特征子集作为下一步所涉及的半监督分类器的训练数据和测试数据。所选的特征值集合包括了时域特征参数、频域特征参数、时频域特征参数和非线性参数四大类型的20个特征参数,具体如下表1所示:表1特征值集合表为进一步验证本发明的有效性,采集了一个真实测试者的脑电信号信号,采样频率为512Hz,其中本文已对该信号进行了预处理,因此已达到睡眠分期信号要求。另外,以30s为一个样本包时间段来划分信号,对上述特征参数组成的特征集合使用蚁群算法进行优化特征子集选择,去处与睡眠分期分类相关性较低的特征,其中分类器使用朴素贝叶斯分类器,分别计算各个子集的分类精度,即正确率。最终得到最优特征子集{近似熵,分形维数值,S变换的功率谱密度值,E(α/(δ+θ)),E(δ/(α+θ)),E(θ/(α+δ)),E(δ/θ),E(α/θ),Hjorthmobility值}这9个特征组成的特征子集,其在蚁群算法优化的众多候选子集中优化效果最佳,分类正确率为91.2%。因此,将其作为分类特征,使其作为本专利设计的半监督朴素贝叶斯分类法的训练及测试数据,并将主动学习策略加入其中来测试分类效果。测试过程中,根据标记样本与无标记样本所占比例的不同来测试融合了主动学习的半监督朴素贝叶斯分类法的有效性,分类结果如下表2所示,其中τ表示样本中标记样本占总样本的比值。表2不同标记样本比例下本算法分类精度比较样本数量标记样本比值τ平均分类精度6144010%83%6144015%85.08%6144020%88.30%6144025%89%6144030%91.52%从上表可以看出,本发明所设计的方法在标记样本较低的情况下仍可以取得较为优秀的睡眠分期分类效果,而随着标记样本数量的不断增加,分类精度也是不断提高,并且在大于等于20%的情况下取得了和目前主流算法中睡眠分期分类精度的范围内(同等量级数据情况下,目前主流算法的分类精度为85%至92%)。最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1