一种解决小样本下转躁患者的识别方法与流程

文档序号:33171849发布日期:2023-02-04 02:43阅读:29来源:国知局
一种解决小样本下转躁患者的识别方法与流程

1.本发明涉及一种识别方法,尤其涉及一种解决小样本下转躁患者的识别方法。


背景技术:

2.双相障碍(bd)和抑郁障碍(mdd)是两种致残、致死率较高的精神疾病。由于两种疾病主要依靠主观的症状学进行鉴别,且具有相似的抑郁症状,因此两种疾病的鉴别一直是临床亟待解决的问题。两种疾病的早期诊断将影响治疗方案的选择、转归及预后,因此早期鉴别两种疾病,从而达到准确判断则尤为重要。
3.转躁患者(tbd)是一类早期误诊为mdd,但经过长期随访或观察,才发现躁狂或轻躁狂症状的患者。这类患者往往存在不合理的用药情况,进而导致反复住院、自杀风险增高等不良后果,对患者、家庭及社会造成沉重负担。此外,这类患者可能存在bd的早期素质性和不受疾病发病状态影响的特点,将有助于早期识别甚至预测bd,以达到与mdd之间的早期鉴别。
4.鉴于目前情感障碍个体化、精准化诊疗的迫切需求,现有方法对bd和mdd进行分类研究,但主要存在两方面局限性:
5.一是现有方法并未发掘转躁患者和与bd患者共有的素质性神经影像学特点,而这一特点正是早期识别和预测转躁患者的关键。
6.二是现有模型的建立和测试多在数据集内部进行,忽略了模型在外部数据的泛化能力,尤其是对判断不明的小样本转躁患者的泛化能力。


技术实现要素:

7.本发明就是针对现有技术存在的缺陷,提供一种解决小样本下转躁患者的识别方法。其基于诊断明确的患者数据构建模型,期望通过建立最具鉴别能力的模型,并将此模型用于识别误诊的转躁患者,辅助临床医生早期鉴别两种疾病,提示医生哪些mdd患者有潜在的转躁风险,协助医生制定精准诊治方案。
8.为实现上述目的,本发明采用如下技术方案,包括以下几个步骤:
9.步骤1、数据预处理:对将大脑影像的功能磁共振数据进行预处理。
10.步骤2、特征提取:基于预处理好的数据,提取了基于双侧杏仁核的功能连接特征fc、独立成分分析特征、fractional-alff及reho特征。
11.步骤3、特征选择与模型构建,包括:
12.步骤3.1、数据集规划。
13.步骤3.2、计算特征重要性。
14.步骤3.3、基于模型的adc曲线进行特征选择。
15.步骤3.4、在测试集中进行结果验证。
16.进一步地,所述将大脑影像的功能磁共振数据进行预处理包括:
17.步骤1.1、将dicom格式的数据转换为nifti格式。
18.步骤1.2、删除前10个时间点,保留190个时间点的数据。
19.步骤1.3、进行层间时间差异校正、头动校正及空间标准化。
20.步骤1.4、使用6mm
×
6mm
×
6mm的高斯核对图像进行平滑处理。
21.步骤1.5、进行去线性漂移及滤波处理。
22.进一步地,所述数据集划分包括:由于mdd在数据集中数量较多,按6:2:2的比例作为训练集、验证集和测试集;bd数据作为训练集;而tbd按1:1分为验证集和测试集。
23.进一步地,所述计算特征重要性包括:针对训练集数据采用数据预处理和特征提取方法,应用随机森林进行特征重要性评分计算;
24.即采用网格搜索法进行随机森林的参数设置:
25.首先传入除需要确定最佳的参数之外的其他参数;(其他参数包括:oob_score默认值为false;是否使用袋外样本来估计泛化精度。criterion度量分裂的标准。n_jobs:程序并行作业数量。random_state:随机数设置。)
26.然后将需要优化的参数的取值按列表或字典形式输入,将模型评价标准scoring设置为

roc_auc’;最后将refit设置为true,模型以交叉验证训练集得到的最佳参数,再用最佳参数结果再次fit一遍全部数据集;获取模型后,提取模型中特征重要性得分。
27.进一步地,所述基于模型的adc曲线进行特征选择包括:采用svm分类器,按网格搜索法选择重要性得分高的前n个的特征,n的范围100~500;然后在tbd和mdd验证集上进行测试,绘制adc曲线,选取最优的adc曲线对应的n值,即为关键性特征。
28.进一步地,所述在测试集中进行结果验证包括:将选定n值对应的svm分类模型应用到tbd和mdd的测试集中进行结果验证。
29.与现有技术相比本发明有益效果。
30.本发明可以在患病早期给出抑郁障碍患者可能转为双相障碍(转躁)的概率,准确率可达80%。
附图说明
31.下面结合附图和具体实施方式对本发明做进一步说明。本发明保护范围不仅局限于以下内容的表述。
32.图1是fc特征可视化示意图。
33.图2是alff特征可视化示意图。
34.图3是reho特征可视化示意图。
35.图4是分类的roc曲线图。
36.图5是解决小样本下转躁患者的识别方法的流程图。
具体实施方式
37.如图1-5所示,具体实施例:本发明在转躁患者较少,无法构建精准识别模型的情况下,基于bd患者与转躁患者存在共同的素质性神经影像特征的假设,使用经随访后明确诊断的mdd和bd数据构建模型,并应用于识别少量的转躁患者,以达到对转躁患者的早期识别及预测。该方法主要包括数据预处理、特征提取、特征选择与模型构建4个模块。
38.1.【数据预处理】本发明的大脑影像采用功能磁共振数据,预处理使用dparsfa软
件包,具体处理步骤如下:将dicom格式的数据转换为nifti格式;删除前10个时间点,保留190个时点的数据;层间时间差异校正;头动校正;空间标准化;使用6mm
×
6mm
×
6mm的高斯核对图像进行平滑处理;去线性漂移;滤波处理。
39.2.【特征提取】基于处理好的数据,本发明提取了基于双侧杏仁核的功能连接特征fc,独立成分分析(ica)特征,fractional-alff及reho特征。
40.3.【特征选择与模型构建】该步骤分为数据集规划;计算特征重要性;基于模型的adc曲线,进行特征选择;在转躁患者中进行测试。其具体步骤如下:
41.1)数据集划分:由于mdd在数据集中数量较多,因此按6:2:2的比例作为训练集、验证集和测试集。bd数据作为训练集。而tbd按1:1分为验证集和测试集。
42.2)计算特征重要性:针对训练集数据采用上述数据预处理和特征提取方法,应用随机森林进行特征重要性评分计算。具体的,采用网格搜索法进行随机森林的参数设置:首先传入除需要确定最佳的参数之外的其他参数。然后将需要优化的参数的取值按列表或字典形式输入,将模型评价标准scoring设置为

roc_auc’。最后将refit设置为true,模型以交叉验证训练集得到的最佳参数,再用最佳参数结果再次fit一遍全部数据集。获取模型后,提取模型中特征重要性得分。
43.3)基于模型的adc曲线,进行特征选择:本发明采用svm分类器,按网格搜索法选择重要性得分高的前n个的特征,n的范围100~500。然后在验证集(tbd和mdd)上进行测试,绘制adc曲线,选取最优的adc曲线对应的n值,即为关键性特征。
44.4)最后将选定n值对应的svm分类模型应用到tbd和mdd的测试集中进行结果验证。
45.可以理解的是,以上关于本发明的具体描述,仅用于说明本发明而并非受限于本发明实施例所描述的技术方案,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换,以达到相同的技术效果;只要满足使用需要,都在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1