用于识别成瘾人群的脑电特征筛选方法、成瘾评估方法及系统与流程

文档序号:26635684发布日期:2021-09-14 23:34阅读:344来源:国知局
用于识别成瘾人群的脑电特征筛选方法、成瘾评估方法及系统与流程

1.本发明涉及医疗诊断技术领域,尤其涉及一种用于识别成瘾人群的脑电 特征筛选方法、成瘾人群识别方法及系统。


背景技术:

2.药物依赖的病因学及病理机制非常复杂,在药物依赖发展过程中,中枢 神经系统在分子、细胞、环路等水平发生一系列神经适应性改变,疾病不同 阶段具有不同神经生物学基础。其中,甲基苯丙胺具有很强的神经毒性,慢 性甲基苯丙胺使用出现认知功能损害,出现脑功能结构及脑功能异常等,这 些病理改变导致对毒品相关注意偏倚、冲动性及抑制功能下降等,使吸毒者 陷入吸毒

戒断

复吸的恶性循环。在治疗ma依赖方面,国际上尚缺乏高效的 客观诊断物质依赖的系统。随着科技发展,采用大数据分析与机器学习模型 等研究用于甲基苯丙胺患者的筛查和诊断评估,包括从分子、电生理、神经 认知及临床等多维度研发甲基苯丙胺依赖的客观指标体系,并基于此开发新 型干预将是重要的发展方向。
[0003][0004]
但目前已有的诊断评估模型主要基于临床评估或认知行为特征进行预测, 如2016年ahn等利用人口学特征和行为学指标等开发了苯丙胺类物质成瘾和 阿片类成瘾的一款诊断模型,两种物质成瘾的诊断准确率达到71.2%和86.3%, 虽然该工具具备一定的诊断效力,但这项工具缺乏外部验证,也使得分类的 准确性存在过拟合的风险。在既往开发的工具中,这是一个非常常见的问题, 也导致许多工具难以进一步应用于临床。另外,主观性大是临床评估的常见 问题,尤其是在许多国家非法物质滥用属于违法问题,患者多难以配合完成 诊断和评估,这导致不同时间和环境下获得的结果存在差异,模型的准确性 和可应用性受到很大影响。
[0005]
基于客观指标开发辅助诊断评估模型是另一重要思路,脑电生理数据是 精神科广泛使用的临床检测项目,具有评估操作简易,携带便捷等优点。脑 电能够反映大脑在不同状态下的生理活动。相较于临床量表信息,脑电生理 数据具有高维度特征,具备挖掘当前还不被发现的疾病病理生理特征并提高 诊断准确率的潜力。在临床工作中,静息态是最为常用到脑电检测范式。传 统上多关注频域特征,包括α、β、ε、δ、γ等频段。研究发现物质依赖 患者表现出特定频段下能量的异常,这在酒精、甲基苯丙胺等物质依赖人群 中均被发现,为临床提供了辅助诊疗的意义。此外,在研究中还发现物质依 赖人群在功能连接和脑电信号复杂度等特征上存在异常。这些表现出显著差 异的特征是我们开发高准确率的辅助诊断预测模型的方向。然而目前这些指 标并没有真正在临床中有所应用,且极少研究整合这些指标共同反映物质依 赖的疾病特异性。在传统脑电生理数据分析中,这些指标的挖掘为我们理解 物质依赖提供了帮助,然而,脑电指标具备高时间分辨率,能够转化成更为 广泛的指标来反映疾病特点,这些复杂多样的指标难以被人脑直接理解,但 通过大数据分析和机器学习的方法可能为有效辅助诊断物质成瘾提供重要帮 助,并推动客观指标
在精神科临床中的应用。


技术实现要素:

[0006]
本发明的目的在于提供一种用于识别成瘾人群的脑电特征筛选方法、成 瘾人群识别方法及系统,能够从众多脑电特征中筛选出能够用户识别成瘾人 群的脑电特征,提升成瘾人群识别的准确率。
[0007]
为了实现上述目的,本发明的第一方面提供一种用于识别成瘾人群的脑 电特征筛选方法,包括:
[0008]
从包括成瘾个体和正常个体的人群中采集多份样本数据,所述样本数据 中包括多个特征的原始脑电数据;
[0009]
针对每份原始脑电数据进行去干扰和滤波处理,提取预设频率范围的脑 电数据;
[0010]
分别从每份脑电数据中提取出多个有效特征,所述有效特征包括每个导 联位置用于反映脑电趋势的特征指标、每个导联位置上不同波段对应的脑电 变化数据以及任意两个导联位置每个波段上的加权相位滞后指数;
[0011]
依次计算移除任一个或多个种类的有效特征得到的特征组合方案,并分 别计算每个所述特征组合方案在多份样本数据中对应的模型复杂度得分,最 终基于所述模型复杂度得分从中筛选出一个所述特征组合方案将其中的有效 特征作为用于识别成瘾人群的脑电筛选特征。
[0012]
优选地,分别从每份脑电数据中提取出多个有效特征之后还包括:
[0013]
每份所述脑电数据中包括在睁眼状态和闭眼状态下分别提取的多个特征;
[0014]
将睁眼状态下的特征值与闭眼状态下的特征值一一对应相减,得到包括 多个导联位置用于反映脑电趋势的特征指标、不同波段对应的脑电变化数据 以及任意两个导联位置每个波段上的加权相位滞后指数的多个所述有效特征。
[0015]
优选地,针对每份原始脑电数据进行去干扰和滤波处理,提取预设频率 范围的脑电数据的方法包括:
[0016]
采用mne软件工具对每份原始脑电数据进行预处理,通过陷波操作去除 交流电干扰;
[0017]
通过带通滤波操作提取预设频率范围为0.1hz

70hz的脑电数据。
[0018]
优选地,分别从每份脑电数据中提取出多个有效特征的方法包括:
[0019]
从预设频率范围内获取每个导联位置的用于反映脑电趋势的特征指标, 不同波段对应的脑电变化数据以及任意两个导联位置每个波段上的加权相位 滞后指数;其中,
[0020]
所述特征指标包括dfa指标、hfd指标、pfd指标、均值、标准差和变异 系数中的一种或多种;
[0021]
所述不同波段对应的脑电变化数据包括利用短时傅里叶变换计算得到的 1

4hz的delta波段、4

8hz的theta波段、8

13hz的alpha波段、13

30hz的 beta波段、30

44hz的gamma波段以及44

70hz的high

gamma波段的脑电变 化数据;
[0022]
所述任意两个导联位置每个波段上的加权相位滞后指数是指在任意两个 不同导联位置上处于每个相同波段的加权相位滞后指数。
[0023]
较佳地,依次计算移除任一个或多个种类的有效特征得到的特征组合方 案,并分
别计算每个所述特征组合方案在多份样本数据中对应的模型复杂度 得分,最终基于所述模型复杂度得分从中筛选出一个所述特征组合方案将其 中的有效特征作为用于识别成瘾人群的脑电筛选特征的方法包括:
[0024]
s1,利用非参数检验方法对有效特征进行初筛过滤,获取脑电数据中剩 余的有效特征;
[0025]
s2,统计脑电数据中的剩余有效特征,依次移除其中一个有效特征对应 得到一组特征组合方案,直至全部的有效特征均被轮询移除后对应得到多组 特征组合方案;
[0026]
s3,采用预先训练的机器学习模型对每组特征组合方案进行概率预测的 计算;
[0027]
s4,将每组特征组合方案对应的计算结果利用贝叶斯信息准则计算当前 轮每一组特征组合方案对应的模型复杂度得分;
[0028]
s5,筛选出此轮中模型复杂度得分最小的特征组合方案,获取其中被移 除的有效特征;
[0029]
s6,将筛选出的被移除的有效特征从剩余有效特征种类中移除,并返回 步骤s2,直至移除任一个有效特征都会导致当前轮的模型复杂度得分相对于 上一轮的模型复杂度得分升高或者剩下的有效特征总数达到阈值,则结束轮 询;
[0030]
s7,统计剩余的有效特征,将对应的特征组合方案中的有效特征作为用 于识别成瘾人群的脑电筛选特征。
[0031]
与现有技术相比,本发明提供的用于识别成瘾人群的脑电特征筛选方法 具有以下有益效果:
[0032]
本发明提供的用于识别成瘾人群的脑电特征筛选方法中,首先从成瘾个 体和正常个体的人群中采集多份包括全部特征的原始脑电数据的样本数据, 然后针对每份原始脑电数据进行去干扰和滤波处理,提取预设频率范围内的 脑电数据,接着分别从每份脑电数据中提取出多个有效特征,如每个导联位 置上用于反映脑电趋势的特征指标、每个导联位置上不同波段对应的脑电变 化数据以及任意两个导联位置每个波段上的加权相位滞后指数,然后采用显 著性检验方法对多个种类的有效特征进行筛选,检验每个有效特征在成瘾人 群和健康人群中的显著性差异,进而从中筛选出能够识别成瘾人群的关键有 效特征。
[0033]
可见,本发明能够从众多脑电特征中筛选出能够用户识别成瘾人群的脑 电特征,提升成瘾人群识别的准确率。
[0034]
本发明的第二方面提供一种成瘾评估方法,应用有上述技术方案所述的 用于识别成瘾人群的脑电特征筛选方法,所述成瘾评估方法包括:
[0035]
基于筛选出的有效特征种类从多个样本人群中获取样本数据,并将多份 所述样本数据分为训练集、测试集和验证集;
[0036]
根据所述训练集和测试集分别利用预设的多个模型结构进行评估模型的 训练;
[0037]
利用验证集对各个模型结构的评估模型进行验证,筛选出准确率最高的 评估模型作为成瘾评估模型;
[0038]
基于筛选出的有效特征种类获取待测用户的检测样本,通过所述成瘾评 估模型判断待测用户为成瘾个体或正常个体。
[0039]
与现有技术相比,本发明提供的成瘾评估方法的有益效果与上述技术方 案提供
的用于识别成瘾人群的脑电特征筛选方法的有益效果相同,在此不做 赘述。
[0040]
本发明的第三方面提供一种用于识别成瘾人群的脑电特征筛选系统,应 用有上述技术方案所述的用于识别成瘾人群的脑电特征筛选方法,所述系统 包括:
[0041]
样本采集单元,用于从包括成瘾个体和正常个体的人群中采集多份样本 数据,所述样本数据中包括多个特征的原始脑电数据;
[0042]
样本处理单元,用于针对每份原始脑电数据进行去干扰和滤波处理,提 取预设频率范围的脑电数据;
[0043]
特征提取单元,用于分别从每份脑电数据中提取出多个有效特征,所述 有效特征包括每个导联位置用于反映脑电趋势的特征指标、每个导联位置上 不同波段对应的脑电变化数据以及任意两个导联位置每个波段上的加权相位 滞后指数;
[0044]
特征筛选单元,用于依次计算移除任一个或多个种类的有效特征得到的 特征组合方案,并分别计算每个所述特征组合方案在多份样本数据中对应的 模型复杂度得分,最终基于所述模型复杂度得分从中筛选出一个所述特征组 合方案将其中的有效特征作为用于识别成瘾人群的脑电筛选特征。
[0045]
优选地,所述特征提取单元用于从预设频率范围内获取每个导联位置的 用于反映脑电趋势的特征指标,每个导联位置上不同波段对应的脑电变化数 据以及任意两个导联位置每个波段上的加权相位滞后指数;
[0046]
所述特征指标包括去趋势波动分析指标(dfa指标)、higuchi分形维数 指标(hfd指标)、petrosian分形维数指标(pfd指标)、均值指标、标准差 指标和变异系数指标中的一种或多种;
[0047]
所述不同波段对应的脑电变化数据包括利用短时傅里叶变换计算得到的 1

4hz的delta波段、4

8hz的theta波段、8

13hz的alpha波段、13

30hz的 beta波段、30

44hz的gamma波段以及44

70hz的high

gamma波段的脑电变 化数据;
[0048]
所述任意两个导联位置每个波段上的加权相位滞后指数是指在任意两个 不同导联位置上处于每个相同波段的加权相位滞后指数。
[0049]
较佳地,所述特征筛选单元用于执行以下步骤:
[0050]
s1,利用非参数检验方法对有效特征进行初筛过滤,获取脑电数据中剩 余的有效特征;
[0051]
s2,统计脑电数据中的剩余有效特征,依次移除其中一个有效特征对应 得到一组特征组合方案,直至全部的有效特征均被轮询移除后对应得到多组 特征组合方案;
[0052]
s3,采用预先训练的机器学习模型对每组特征组合方案进行概率预测的 计算;
[0053]
s4,将每组特征组合方案对应的计算结果利用贝叶斯信息准则计算当前 轮每一组特征组合方案对应的模型复杂度得分;
[0054]
s5,筛选出此轮中模型复杂度得分最小的特征组合方案,获取其中被移 除的有效特征;
[0055]
s6,将筛选出的被移除的有效特征从剩余有效特征种类中移除,并返回 步骤s2,直至移除任一个有效特征都会导致当前轮的模型复杂度得分相对于 上一轮的模型复杂度得分升高或者剩下的有效特征总数达到阈值,则结束轮 询;
[0056]
s7,统计剩余的有效特征,将对应的特征组合方案中的有效特征作为用 于识别成
瘾人群的脑电筛选特征。
[0057]
与现有技术相比,本发明提供的用于识别成瘾人群的脑电特征筛选系统 的有益效果与上述技术方案提供的用于识别成瘾人群的脑电特征筛选方法的 有益效果相同,在此不做赘述。
[0058]
本发明的第四方面提供一种成瘾评估系统,应用有上述技术方案所述的 成瘾评估方法,所述系统包括:
[0059]
样本获取单元,基于筛选出的有效特征种类从多个样本人群中获取样本 数据,并将多份所述样本数据分为训练集、测试集和验证集;
[0060]
模型训练单元,用于根据所述训练集和测试集分别利用预设的多个模型 结构进行评估模型的训练;
[0061]
模型选择单元,用于利用验证集对各个模型结构的评估模型进行验证, 筛选出准确率最高的评估模型作为成瘾评估模型;
[0062]
测试评估单元,基于筛选出的有效特征种类获取待测用户的检测样本, 通过所述成瘾评估模型判断待测用户为成瘾个体或正常个体。
[0063]
与现有技术相比,本发明提供的成瘾评估系统的有益效果与上述技术方 案提供的成瘾评估方法的有益效果相同,在此不做赘述。
[0064]
本发明的第五方面提供一种计算机可读存储介质,计算机可读存储介质 上存储有计算机程序,计算机程序被处理器运行时执行上述用于识别成瘾人 群的脑电特征筛选方法,和/或,成瘾评估方法的步骤。
[0065]
与现有技术相比,本发明提供的计算机可读存储介质的有益效果与上述 技术方案提供的用于识别成瘾人群的脑电特征筛选方法,和/或,成瘾评估方 法的有益效果相同,在此不做赘述。
附图说明
[0066]
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部 分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的 不当限定。在附图中:
[0067]
图1为本发明实施例中用于识别成瘾人群的脑电特征筛选方法的流程示 意图;
[0068]
图2为本发明实施例中成瘾评估方法的流程示意图;
[0069]
图3为本发明实施例中10

20国际标准中脑电导联位置的示意图。
具体实施方式
[0070]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本 发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。 显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。 基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提 下所获得的所有其它实施例,均属于本发明保护的范围。
[0071]
实施例一
[0072]
请参阅图1和图3,本实施例提供一种用于识别成瘾人群的脑电特征筛选 方法,包括:
[0073]
从包括成瘾个体和正常个体的人群中采集多份样本数据,样本数据中包括多个特征的原始脑电数据;针对每份原始脑电数据进行去干扰和滤波处理,提取预设频率范围的脑电数据;分别从每份脑电数据中提取出多个有效特征,有效特征包括每个导联位置用于反映脑电趋势的特征指标、每个导联位置上不同波段对应的脑电变化数据以及任意两个导联位置每个波段上的加权相位滞后指数;采用显著性检验方法依次计算移除任一个或多个种类的有效特征得到的特征组合方案,并分别计算每个特征组合方案在多份样本数据中对应的模型复杂度得分,最终基于模型复杂度得分从中筛选出一个特征组合方案将其中的有效特征作为用于识别成瘾人群的脑电筛选特征。
[0074]
本实施例提供的用于识别成瘾人群的脑电特征筛选方法中,首先从成瘾个体和正常个体的人群中采集多份包括全部特征的原始脑电数据的样本数据,然后针对每份原始脑电数据进行去干扰和滤波处理,提取预设频率范围内的脑电数据,接着分别从每份脑电数据中提取出多个有效特征,如每个导联位置上用于反映脑电趋势的特征指标、每个导联位置上不同波段对应的脑电变化数据以及任意两个导联位置每个波段上的加权相位滞后指数,然后采用显著性检验方法对多个种类的有效特征进行筛选,检验每个有效特征在成瘾人群和健康人群中的显著性差异,进而从中筛选出能够识别成瘾人群的关键有效特征。
[0075]
对于样本数据的采集过程,本实施例通过采用德国brainampdc(brainproducts)脑电放大器,采集64通道的脑电数据(eeg数据)。脑电数据采集由brainvisionrecorder记录,采样带宽为0.05

200hz,采样率为1000hz。每份样本数据对睁眼状态和闭眼状态记录时间分别为5

6min,采集时所有导联位置的阻抗均需要降低到5kω以下。
[0076]
可见,本实施例能够从众多脑电特征中筛选出能够识别成瘾人群的脑电特征,提升成瘾人群识别的准确率。
[0077]
上述实施例,分别从每份脑电数据中提取出多个有效特征之后还包括:
[0078]
每份所述脑电数据中包括在睁眼状态和闭眼状态下分别提取的多个特征;将睁眼状态下的特征值与闭眼状态下的特征值一一对应相减,得到包括多个导联位置用于反映脑电趋势的特征指标、不同波段对应的脑电变化数据以及任意两个导联位置每个波段上的加权相位滞后指数的多个所述有效特征。
[0079]
具体实施时,以上脑电数据需分别计算睁眼状态和闭眼状态两种不同状态下的特征,然后通过睁眼状态的下的特征值减去闭眼状态下的特征值,得到用于进行特征筛选和建模区分成瘾个体与健康个体的有效特征,利用睁眼状态特征减去闭眼状态特征,可以除去部分个人测试过程中无意引入的噪音差异。
[0080]
上述实施例中,针对每份原始脑电数据进行去干扰和滤波处理,提取预设频率范围的脑电数据的方法包括:
[0081]
采用mne软件工具对每份原始脑电数据进行预处理,通过陷波操作去除交流电干扰;通过带通滤波操作提取预设频率范围为0.1hz

70hz的脑电数据。
[0082]
具体实施时,此过程为数据预处理过程,具体为利用开源软件工具mne,对采集的脑电数据进行预处理,通过陷波去除交流电干扰,通过带通滤波操作,提取0.1hz

70hz的脑电数据,最后进行去除1

10hz的眼电操作,利用软件包mne中自带的独立成分分析和眼电识别功能,将眼电干扰从采集的脑电中移除,经过上述操作,得到最终用于特征提取和
分析使用的脑电数据。
[0083]
需要解释的是,mne软件工具是用于探索、可视化和分析人类神经生理 学数据的开源python软件包;
[0084]
陷波操作是指过滤某一频率点的信号,本实施例中所提的陷波操作为过 滤脑电采集过程中的交流电的工频干扰,如在国内使用需过滤掉50hz附近的 工频;
[0085]
带通滤波是指只保留特定频段的波,本实施例中所提的带通滤波为只保 留0.1

70hz范围内的脑电波数据,用于分析、特征提取和建模;
[0086]
去除眼电是指利用独立成分分析ica,针对脑电信号,进行估算独立源 信号,并计算估算的独立源信号与记录的眼电模式的匹配程度,将匹配度达 到一定程度的估算的独立源信号移除,之后使用余下的独立源信号重建原始 脑电信号,此时得到的脑电信号即为移除眼电伪影的相对干净的脑电信号。
[0087]
以上所说的陷波、带通滤波和去除眼电伪影操作均通过python软件包mne 自带函数类实现,本实施例对此不做赘述。
[0088]
上述实施例中,分别从每份脑电数据中提取出多个有效特征的方法包括:
[0089]
从预设频率范围内获取每个导联位置的用于反映脑电趋势的特征指标, 每个导联位置上不同波段对应的脑电变化数据以及任意两个导联位置每个波 段上的加权相位滞后指数;其中,特征指标包括去趋势波动分析指标(dfa指 标)、higuchi分形维数指标(hfd指标)、petrosian分形维数指标(pfd指 标)、均值、标准差和变异系数中的一种或多种;不同波段对应的脑电变化 数据包括利用短时傅里叶变换计算得到的1

4hz的delta波段、4

8hz的theta 波段、8

13hz的alpha波段、13

30hz的beta波段、30

44hz的gamma波段 以及44

70hz的high

gamma波段的脑电变化数据;任意两个导联位置每个波 段上的加权相位滞后指数是指在任意两个不同导联位置上处于每个相同波段 的加权相位滞后指数。
[0090]
具体实施时,主要提取频率范围为0.1

70hz频率范围的每个脑电导联位 置上对应的dfa指标、hfd指标、pfd指标、均值指标、标准差指标、变异系 数指标等用于反映脑电趋势的特征指标、以及每个导联位置上处于不同波段 对应的脑电变化数据、以及任意两个导联位置每个波段上的加权相位滞后指 数。
[0091]
其中,dfa为趋势相关分析的指标,用于分析时间序列的长程相关性;令 h表示dfa的计算结果,当0.5<h<1时,表明时间序列具有长程相关性,越接 近于1,相关性越强;当h=0时,说明时间序列不相关,是一个独立的随机过 程;当0<h<0.5时,表明时间序列只存在负的相关性,呈现反持久性的状态, 即两个连续的时间段内的序列呈现相反的趋势,如一段为递增趋势,则相邻 一段为递减趋势。
[0092]
hfd为higuchi fractal dimension参数,也即higuchi分形维数,pfd为通 过petrosian fractal dimension计算得到的指标,也即petrosian分形维数,hfd 和pfd分别为两种脑电信号不规则性的度量。
[0093]
变异系数又称为标准离差率或单位风险,一种概率分布离散程度的归一 化度量,计算方式为均值除以标准差。
[0094]
不同波段对应的脑电变化数据包括在脑电的每个导联位置上利用短时傅 里叶变换计算出1

4hz的delta波段、4

8hz的theta波段、8

13hz的alpha波 段、13

30hz的beta波段、30

44hz的gamma波段以及44

70hz的high

gamma 波段的脑电变化数据,其中,导联位置
采用的是10

10脑电系统或者10

20脑 电系统所采用的标准电极位置点,本实施不再对具体的导联位置进行赘述。
[0095]
分别计算任意两个导联位置上处于每个相同波段上对应的加权相位滞后 指数。具体来讲,加权相位滞后指数(wpli)用于计算两个导联位置信号之 间超前或滞后的相位差,接近零相位值后的相位差赋较小的权值,以减少体 积传导的影响。
[0096]
总结来说,dfa、hfd、pfd和变异系数是针对每一个脑电导联位置进行的 计算,wpli为两个导联位置之间同一波段的计算。
[0097]
上述实施例中,依次计算移除任一个或多个种类的有效特征得到的特征 组合方案,并分别计算每个所述特征组合方案在多份样本数据中对应的模型 复杂度得分,最终基于所述模型复杂度得分从中筛选出一个所述特征组合方 案将其中的有效特征作为用于识别成瘾人群的脑电筛选特征的方法包括:
[0098]
s1,利用非参数检验方法对有效特征进行初筛过滤,获取脑电数据中剩 余的有效特征;
[0099]
s2,统计脑电数据中的剩余有效特征,依次移除其中一个有效特征对应 得到一组特征组合方案,直至全部的有效特征均被轮询移除后对应得到多组 特征组合方案;
[0100]
s3,采用预先训练的机器学习模型对每组特征组合方案进行概率预测的 计算;
[0101]
s4,将每组特征组合方案对应的计算结果利用贝叶斯信息准则计算当前 轮每一组特征组合方案对应的模型复杂度得分;
[0102]
s5,筛选出此轮中模型复杂度得分最小的特征组合方案,获取其中被移 除的有效特征;
[0103]
s6,将筛选出的被移除的有效特征从剩余有效特征种类中移除,并返回 步骤s2,直至移除任一个有效特征都会导致当前轮的模型复杂度得分相对于 上一轮的模型复杂度得分升高或者剩下的有效特征总数达到阈值,则结束轮 询;
[0104]
s7,统计剩余的有效特征,将对应的特征组合方案中的有效特征作为用 于识别成瘾人群的脑电筛选特征。
[0105]
作为一种优选的实施方案,每一轮中相同数量特征的特征组合方案对应 训练一种机器学习模型,且该机器学习模型仅适合对与之匹配数量特征的测 试数据进行概率计算,然后将每组特征组合方案对应的机器学习模型得到的 计算结果利用贝叶斯信息准则计算当前轮每一组特征组合方案对应的模型复 杂度得分。采用特征数量相同的特征组合方案对应训练一种机器学习模型的 优点在于能够提升模型识别准确率,且降低模型训练的复杂度。
[0106]
具体实施时,首先将样本数据分为训练集、测试集和验证集,其中训练 集和测试集用于挑选特征模型,验证集用检验挑选出来的模型是否发生验证 的过拟合。然后利用非参数检验方法,如利用曼

惠特尼u检验每种有效特征 在成瘾个体和健康个体中的显著性差异,以对大量的有效特征进行过滤初筛, 剔除明显无关的有效特征,在此步骤中,为了尽量减少异常值带来的影响, 每次从训练集中的样本数据中随机抽取部分数据进行显著性检验,抽取的数 据量为样本总量的50%

80%之间,如此重复数千轮,由可接受的时间范围和 计算设备的算力决定具体重复次数,取均值作为该有效特征最终的模型复杂 度得分。取上述步骤中,将具有显著性差异的特征作为备选有效特征,利用 训练集和测试集挑选用
于识别成瘾人群的有效特征作为脑电筛选特征,详细步骤如下:
[0107]
a、每次移除一个有效特征,利用余下的有效特征训练机器学习模型,并利用机器学习模型对每组特征组合方案进行概率预测计算,然后基于每组特征组合方案对应的计算结果利用贝叶斯信息准则计算该准则下的模型复杂度得分,将该得分作为移除的有效特征对模型结果的影响,得分越低影响越大,对分类的贡献度越小。如此轮询将每个特征移除一次,可以得到所有有效特征对分类结果的贡献度。
[0108]
b、将a中贡献度最小的有效特征移除;
[0109]
c、重复步骤a和步骤b,直到特征组合方案中移除任何一个有效特征,都会导致贝叶斯信息准则得分增高则结束,剩下的有效特征即为可用于区分成瘾个体和健康个体的关键有效特征。
[0110]
其中,贝叶斯信息准则是一种用来减少特征筛选带来的过拟合风险的数学方法。公式如下:
[0111][0112]
其中e表示求期望,z为经过短时傅里叶变换或者小波变换得到的结果,j(z)表示取z的虚部,|
·
|表示求绝对值。
[0113]
经过以上操作,得到58个有效特征用于区分成瘾个体和健康个体,此58个有效特征如下:
[0114]“o2_hfd”,“p8_hfd”,“po3_hfd”,“gamma_c4_ft8_wpli”,“p7_hfd”,“f4_hfd”,“gamma_cp1_ft8_wpli”,“po4_hfd”,“p4_hfd”,“oz_hfd”,“o1_hfd”,“fc2_hfd”,“p5_hfd”,“p6_hfd”,“p2_hfd”,“cp2_hfd”,“f6_hfd”,“po7_hfd”,“p1_hfd”,“gamma_p3_ft7_wpli”,“alpha_fc1_c6_wpli”,“high

gamma_p3_o1_wpli”,“po8_hfd”,“cp1_hfd”,“delta_fz_c1_wpli”,“high

gamma_c4_p5_wpli”,“cp6_hfd”,“cz_hfd”,“beta_pz_c1_wpli”,“beta_o2_cp2_wpli”,“gamma_p6_ft8_wpli”,“c6_hfd”,“beta_o2_pz_wpli”,“fc1_hfd”,“ft8_hfd”,“gamma_fp2_f4_wpli”,“beta_c4_poz_wpli”,“beta_c2_fpz_wpli”,“tp7_hfd”,“alpha_p6_po8_wpli”,“beta_o2_cp4_wpli”,“high

gamma_af4_c5_wpli”,“theta_t7_ft8_wpli”,“gamma_po4_ft8_wpli”,“gamma_p8_f5_wpli”,“beta_c4_o2_wpli”,“high

gamma_fp1_po4_wpli”,“high

gamma_p7_fc4_wpli”,“high

gamma_p5_af7_wpli”,“beta_c2_poz_wpli”,“high

gamma_f3_ft8_wpli”,“beta_p2_po4_wpli”,“c1_hfd”,“gamma_p3_t8_wpli”,“beta_p4_cp4_wpli”,“tp10_hfd”,“delta_af7_po7_wpli”,“alpha_o2_p2_wpli”。
[0115]
针对以上有效特征的数据结构解释:wpli表示加权相位滞后指数,而对于带有wpli的特征,以“_”作为分割,第一段数据结构表示脑电波段,第二段数据结构和第三段数据结构表示采集脑电的导联位置,例如,“delta_af7_po7_wpli”,“delta”表示脑电波段,“af7”表示第一个采集脑电的导联位置,“po7”表示第二个采集脑电的导联位置,“wpli”表示加权相位滞后指数。对于带有dfa指标、hfd指标、pfd指标的这类特征,以“_”作为分割,第一段为采集脑电的导联位置,第二段为相应的特征名称。
[0116]
利用以上有效特征可以在训练集和测试集上达到超过90%的准确率,而在验证集上准确率超过80%,可以用于检验一个用户是否为物质成瘾个体。
[0117]
实施例二
[0118]
请参阅图2,本实施例提供一种成瘾评估方法,包括:
[0119]
基于筛选出的有效特征种类从多个样本人群中获取样本数据,并将多份 所述样本数据分为训练集、测试集和验证集;
[0120]
根据所述训练集和测试集分别利用预设的多个模型结构进行评估模型的 训练;
[0121]
利用验证集对各个模型结构的评估模型进行验证,筛选出准确率最高的 评估模型作为成瘾评估模型;
[0122]
基于筛选出的有效特征种类获取待测用户的检测样本,通过所述成瘾评 估模型判断待测用户为成瘾个体或正常个体。
[0123]
与现有技术相比,本发明实施例提供的成瘾评估方法的有益效果与上述 实施例一提供的用于识别成瘾人群的脑电特征筛选方法的有益效果相同,在 此不做赘述。
[0124]
实施例三
[0125]
本实施例提供一种用于识别成瘾人群的脑电特征筛选系统,包括:
[0126]
样本采集单元,用于从包括成瘾个体和正常个体的人群中采集多份样本 数据,所述样本数据中包括多个特征的原始脑电数据;
[0127]
样本处理单元,用于针对每份原始脑电数据进行去干扰和滤波处理,提 取预设频率范围的脑电数据;
[0128]
特征提取单元,用于分别从每份脑电数据中提取出多个有效特征,所述 有效特征包括每个导联位置用于反映脑电趋势的特征指标、每个导联位置上 不同波段对应的脑电变化数据以及任意两个导联位置每个波段上的加权相位 滞后指数;
[0129]
特征筛选单元,用于依次计算移除任一个或多个种类的有效特征得到的 特征组合方案,并分别计算每个所述特征组合方案在多份样本数据中对应的 模型复杂度得分,最终基于所述模型复杂度得分从中筛选出一个所述特征组 合方案将其中的有效特征作为用于识别成瘾人群的脑电筛选特征。
[0130]
优选地,在特征提取单元和特征筛选单元之间还包括去燥单元;
[0131]
每份所述脑电数据中包括在睁眼状态和闭眼状态下分别提取的多个特征;
[0132]
所述去燥单元用于将睁眼状态下的特征值与闭眼状态下的特征值一一对 应相减,得到包括多个导联位置用于反映脑电趋势的特征指标、不同波段对 应的脑电变化数据以及任意两个导联位置每个波段上的加强相位同步指数的 多个所述有效特征。
[0133]
优选地,样本采集单元,用于从包括成瘾个体和正常个体的人群中采集 多份样本数据,所述样本数据中包括多个特征的原始脑电数据;
[0134]
样本处理单元,用于针对每份原始脑电数据进行去干扰和滤波处理,提 取预设频率范围的脑电数据;
[0135]
特征提取单元,用于分别从每份脑电数据中提取出多个有效特征,所述 有效特征包括每个导联位置用于反映脑电趋势的特征指标、每个导联位置上 不同波段对应的脑电变化数据以及任意两个导联位置每个波段上的加权相位 滞后指数;
[0136]
特征筛选单元,用于依次计算移除任一个或多个种类的有效特征得到的 特征组合方案,并分别计算每个所述特征组合方案在多份样本数据中对应的 模型复杂度得分,最终基于所述模型复杂度得分从中筛选出一个所述特征组 合方案将其中的有效特征作为用
于识别成瘾人群的脑电筛选特征。
[0137]
较佳地,所述特征筛选单元用于执行以下步骤:
[0138]
s1,利用非参数检验方法对有效特征进行初筛过滤,获取脑电数据中剩 余的有效特征;
[0139]
s2,统计脑电数据中的剩余有效特征,依次移除其中一个有效特征对应 得到一组特征组合方案,直至全部的有效特征均被轮询移除后对应得到多组 特征组合方案;
[0140]
s3,采用预先训练的机器学习模型对每组特征组合方案进行概率预测的 计算;
[0141]
s4,将每组特征组合方案对应的计算结果利用贝叶斯信息准则计算当前 轮每一组特征组合方案对应的模型复杂度得分;
[0142]
s5,筛选出此轮中模型复杂度得分最小的特征组合方案,获取其中被移 除的有效特征;
[0143]
s6,将筛选出的被移除的有效特征从剩余有效特征种类中移除,并返回 步骤s2,直至移除任一个有效特征都会导致当前轮的模型复杂度得分相对于 上一轮的模型复杂度得分升高或者剩下的有效特征总数达到阈值,则结束轮 询;
[0144]
s7,统计剩余的有效特征,将对应的特征组合方案中的有效特征作为用 于识别成瘾人群的脑电筛选特征。
[0145]
与现有技术相比,本实施例提供的用于识别成瘾人群的脑电特征筛选系 统的有益效果与上述技术方案提供的用于识别成瘾人群的脑电特征筛选方法 的有益效果相同,在此不做赘述。
[0146]
实施例四
[0147]
本实施例提供一种成瘾评估系统,包括:
[0148]
样本获取单元,基于筛选出的有效特征种类从多个样本人群中获取样本 数据,并将多份所述样本数据分为训练集、测试集和验证集;
[0149]
模型训练单元,用于根据所述训练集和测试集分别利用预设的多个模型 结构进行评估模型的训练;
[0150]
模型选择单元,用于利用验证集对各个模型结构的评估模型进行验证, 筛选出准确率最高的评估模型作为成瘾评估模型;
[0151]
测试评估单元,基于筛选出的有效特征种类获取待测用户的检测样本, 通过所述成瘾评估模型判断待测用户为成瘾个体或正常个体。
[0152]
与现有技术相比,本发明提供的成瘾评估系统的有益效果与上述技术方 案提供的成瘾评估方法的有益效果相同,在此不做赘述。
[0153]
与现有技术相比,本实施例提供的成瘾评估系统的有益效果与上述技术 方案提供的成瘾评估方法的有益效果相同,在此不做赘述。
[0154]
实施例五
[0155]
本实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有 计算机程序,计算机程序被处理器运行时执行上述用于识别成瘾人群的脑电 特征筛选方法,和/或,成瘾评估方法的步骤。
[0156]
与现有技术相比,本实施例提供的计算机可读存储介质的有益效果与上 述技术方案提供的用于识别成瘾人群的脑电特征筛选方法,和/或,成瘾评估 方法的有益效果相
同,在此不做赘述。
[0157]
本领域普通技术人员可以理解,实现上述发明方法中的全部或部分步骤 是可以通过程序来指令相关的硬件来完成,上述程序可以存储于计算机可读 取存储介质中,该程序在执行时,包括上述实施例方法的各步骤,而的存储 介质可以是:rom/ram、磁碟、光盘、存储卡等。
[0158]
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此, 任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变 化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应 以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1