一种精神药物治疗效果预测方法,系统和装置与流程

文档序号:22681949发布日期:2020-10-28 12:44阅读:108来源:国知局
一种精神药物治疗效果预测方法,系统和装置与流程

本发明涉及机器学习和大数据在精神分裂治疗领域的应用,具体涉及一种精神药物治疗效果预测方法,系统和装置。



背景技术:

精神分裂症由于发病机理不明,缺乏精准治疗的依据,实际临床治疗时的药物选择和预后判断除了遵守国内和国际的临床指南外,主要取决于临床医生的个人经验。而在实际诊疗过程中,临床指南的指导原则过于粗放,而临床医生的经验各有侧重,这就导致相同病人在不同医院和不同医生就诊时得到的治疗方案差别很大。

在此背景下,精神分裂症如何精准的预测不同治疗手段的症状改善情况,从而指导治疗手段的选择,成为了精神分裂症医生迫切关注的痛点。



技术实现要素:

本发明的目的是提供一种精神药物治疗效果预测方法,系统和装置,提供一个基于web平台的精神分裂症患者治疗后psp评分改善的预测工具。

为了达到上述目的,本发明一方面提供一种精神药物治疗效果预测方法,包括以下步骤:

获取患者病例数据;

基于患者病例数据进行筛选,获取最终psp评分改善相关的特征;

根据筛选过的特征训练预测模型,所述预测模型根据筛选过的特征评估患者的psp改善情况;

构建psp改善情况的文献知识库,所述文献知识库用以向患者提供各项特征的相应解释,并对预测模型的预测结果给出辅助决策信息和支持信息。

进一步的,在患者病例数据的筛选过程中,还包括以下步骤;

以单因素显著性作为筛选标准,去除与最终psp评分的差异较大的特征;

采用lasso模型对所述特征进行进一步筛选,获取与最终psp评分差异性较小的特征。

进一步的,在患者的病例数据的筛选过程后,所述筛选后的特征包括:psp基线评分,心境稳定剂的使用情况panss评分,工作情况,保肝药物使用,性别,心血管并发症情况,panss-g11得分,panss-p4得分panss-g15得分,panssg4得分。

进一步的,在预测模型的构建过程中,还包括:

以患者最终psp评分为因变量,以筛选后的特征为自变量,建立随机森林模型,以拟合患者最终的psp评分结果。

进一步的,所述随机森林模型的训练过程如下,

有放回的从特征数据集合中选取数个样本,形成样本集;

利用样本集训练一棵决策树,在训练决策树过程中,每次特征分裂时从特征矢量中随机选取数个特征元素,然后从中选择一个最优的特征作为分裂特征;

重复上述步骤,训练多棵决策树,形成随机森林;

每一棵决策树对输入的预测样本数据,均给出一个预测结果,通过投票规则得到预测模型的最终输出结果。

进一步的,在构建psp改善情况的文献知识库的步骤中,还包括:

获取psp评分预测的相关文献,所述文献包括与预测特征相关的临床解释,不同国家的精神分裂症患者;

对所述文献进行信息抽取、结构化和重组,以生成psp评分预测的知识图谱。

进一步的,所述知识图谱用以输出特征的各项信息,所述信息包括:

特征的临床解释;

特征在人群中的分布情况;

全球其他预测模型的输出结果。

另一方面,本发明还提供一种精神药物治疗效果预测系统,包括:

病例数据库单元,用以获取和存储患者病例数据;

特征筛选单元,用以基于患者病例数据进行筛选,获取最终psp评分改善相关的特征;

预测模型单元,用以根据筛选过的特征训练预测模型,所述预测模型根据筛选过的特征评估患者的psp改善情况;

知识图谱单元,用以构建psp改善情况的文献知识库,所述文献知识库用以向患者提供各项特征的相应解释,并对预测模型的预测结果给出辅助决策信息和支持信息。

另一方面,本发明还提供一种精神药物治疗效果预测装置,包括:包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述方法的步骤。

另一方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如上述方法的步骤。

本发明提供一种精神药物治疗效果预测方法,系统和设备,通过机器学习和大数据技术对数据进行分析挖掘,并结合不同专家的个体经验,开发精神分裂症治疗效果的预测模型,该模型通过筛选后的特征数据集训练预测模型得到精神分裂症患者治疗后psp评分改善的预测结果,并在此基础上构建精神分裂症治疗效果预测的知识图谱,提供了精神分裂症的治疗决策的支持。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一个实施例的精神药物治疗效果预测方法的流程图。

图2是本发明一个实施例的特征筛选的方法流程图。

图3是本发明一个实施例的精神药物治疗效果预测系统的架构图。

图4是本发明一个实施例的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。

本发明的目的是在于提供一个基于web平台的精神分裂症患者治疗后psp评分改善的预测工具。通过机器学习和大数据技术对数据进行分析挖掘,并结合不同专家的个体经验,开发精神分裂症治疗效果的预测模型,并在此基础上构建精神分裂症治疗效果预测的知识图谱,提供了精神分裂症的治疗决策的支持。

图1是本发明一个实施例的精神药物治疗效果预测方法的流程图,如图1所示,本发明的精神药物治疗效果预测方法包括以下步骤:

s1,获取患者病例数据,构建患者病例数据库。

具体的,病例数据库是经过清洗,标准化并去隐私的精神分裂症患者数据库,包括患者的基本信息、诊断信息、治疗以及随访信息。

在一些实施例中,患者的基本信息包括患者的年龄、性别、身高、体重、婚姻状况、家庭情况、病程。患者的诊断信息包括患者的精神分裂症的严重程度,合并疾病,psp评分。治疗以及随访信息包括患者使用药物的种类,用量和时长,患者治疗后1个月,3个月,6个月和1年的psp评分。

可以理解的是,psp评分量表(个人和社会功能量)是一种针对精神分裂症的高信效度的患者社会功能评估工具。psp包含四个方面:(a)对社会有益的活动,包括工作和学习;(b)人际关系和社会关系;(c)自理能力;(d)令人不安和攻击性的行为。它的总分为100分,每10分分为10个等级;根据功能障碍的严重程度,结果可分为三个等级:71至100分表示轻度损害;31至70分表示不同程度的功能障碍;1至30分表示严重功能障碍,需要加强对患者的支持或监督。psp适用于急性和稳定型精神分裂症患者,已证实相应中文版本的准确性和可靠性。最小可检测变化(mdc)是指psp连续测量中由非随机变量引起的最小变化,为10.7分。psp评分每10分也分为10个等级,以代表不同程度的功能障碍。

在一些实施例中,病例数据库的数据来源为上海市精神卫生中心所有的精神分裂症患者的数据。

s2,基于患者病例数据进行筛选,获取最终psp评分改善相关的特征。

图2是本发明一个实施例的特征筛选的方法流程图,如图2所示,筛选病人特征包括两个步骤:

s21,以单因素显著性为筛选标准的初筛。

具体的,本方法将收集到的所有病人特征和最终结局(psp得分是否改善)进行单因素差异性检验。

可以理解的是,在方差分析中,将要考察的对象的某种特征称为试验指标,影响试验指标的条件称为因素,每个因素又有若干个状态可供选择,因素可供选择的每个状态称为该因素的水平。如果在一项试验中只有一个因素在改变,则称为单因素试验。

因此,假设psp得分为指标,病人的特征为因素,病人特征的状态为该因素的水平,则通过利用组间的离差平方和比上组内离差平方和,得到不同得分的特征之间差异与相同得分的特征之间差异的大小到底有多少,如果所求参数比较大,那么说明组间差异比较大,说明这个单因素的影响很大。反之,说明组间差距很小,单因素的影响很小。

在一些实施例中,本发明将单因素差异性参数p作为筛选依据,当p值>0.05时,该特征被删除,保留p值≤0.05的特征作为初步筛选后的结果。

s22,采用lasso模型对所述特征进行进一步筛选,获取与最终psp评分差异性较小的特征。

可以理解的是,lasso模型是在普通线性模型中调整了目标函数,增加惩罚项。具体的,本方法的lasso模型可以表示为:

其中λ为调节系数,惩罚项为通过对回归系数的惩罚约束,可以得到最终存在于模型中的特征作为预测特征。

在一些实施例中,经过步骤s21的筛选,残留的特征为:年龄,性别,住院情况,病情首发时间,病程,psp基线评分,panss评分,cdss评分,cgi-s评分,msq评分,心境稳定剂的使用情况,心血管病发症情况,保肝药物使用情况。

在一些实施例中,经过步骤s22的筛选,残留的特征为:sp基线评分,心境稳定剂的使用情况panss评分,工作情况,保肝药物使用,性别,心血管并发症情况,panss-g11得分,panss-p4得分panss-g15得分,panssg4得分。

步骤s3,根据筛选过的特征训练预测模型,所述预测模型根据筛选过的特征评估患者的psp改善情况。

可以理解的是,随机森林是leobreiman提出的非参数模型,用于解决分类(两类或多类结果)和回归(连续结果)问题。随机森林是多个决策树的组合。通过每个决策树的决策点对样本进行分类,最后收集所有决策树的分类结果以计算结果出现的可能性。由于其高度的预测准确性,随机森林已被成功地用于解决生物学和医学上的各种问题,包括预测癌细胞系中的药物反应,识别dna结合蛋白以及从特定的组织中定位特定组织中的癌灶。液体活检的结果。

具体的,本发明中随机森林模型的训练步骤如下:

有放回的从训练数据集合中选取数个样本,形成样本集;

利用样本集训练一棵决策树,在训练决策树过程中,每次特征分裂时从特征矢量中随机选取数个特征元素,然后从中选择一个最优的特征作为分裂特征;

重复上述步骤,训练多棵决策树,形成随机森林;

每一棵决策树对输入的预测样本数据,均给出一个预测结果,通过投票规则得到预测模型的最终输出结果。

在建立模型后,本发明采用了auc评估模型的预测能力,当在训练和测试集中包括13个变量时,随机森林具有稳定且相对较好的预测能力。在训练和测试集中,auc分别接近0.82和0.86。表明该模型具有很高的敏感性(81.8%)和特异性(78.7%),准确度高达79.5%,尤其是当预测psp得分增加<10分时(92.6%)。

步骤s4,构建psp改善情况的文献知识库,所述文献知识库用以向患者提供各项特征的相应解释,并对预测模型的预测结果给出辅助决策信息和支持信息。

在一些实施例中,文献知识库包括了由专家仔细挑选出的全球用于psp评分预测的文献,所述文献经过信息抽取,结构化和重组生成了psp评分预测的知识图谱。

具体的,文献知识库包括:

1)文献提到的预测特征相关的临床解释。

2)不同国家的精神分裂症患者的预测特征和预测模型差异。

3)临床研究的设计和结果数据。

知识图谱的目的是配合模型工作,是增加模型可接受度和可落地性的重要组成部分。因为模型预测的数据来源收到局限,二文献中提到的患者群体更为广泛,可以在实际决策时给予医生更多参考。同时文献可以给予模型预测结果更多临床解释,弥补了机器学习模型(随机森林)预测效果好但可解释性差的缺点。

在实际工作时,当用户输入患者特征时,知识图谱会根据特征输出:

1)特征的临床解释。

2)特征在人群中的分布情况。

3)全球其他预测模型输出的结果。

由此可以增加了模型预测结果的可解释性,辅助诊断决策的科学性。

图3是本发明一个实施例的精神药物治疗效果预测系统的架构图。如图3所示,本实施例的一种精神药物治疗效果预测系统,包括:

病例数据库单元101,用以获取和存储患者病例数据;

特征筛选单元102,用以基于患者病例数据进行筛选,获取最终psp评分改善相关的特征;

预测模型单元103,用以根据筛选过的特征训练预测模型,所述预测模型根据筛选过的特征评估患者的psp改善情况;

知识图谱单元104,用以构建psp改善情况的文献知识库,所述文献知识库用以向患者提供各项特征的相应解释,并对预测模型的预测结果给出辅助决策信息和支持信息。

图4是本发明一个实施例的一种电子设备的结构示意图。如图4所示,本发明一个实施例的一种电子设备包括一个或多个输入设备1000、一个或多个输出设备1000、一个或多个处理器3000和存储器4000。

在本发明一个实施例中,处理器1000、输入设备2000、输出设备3000和存储器4000可以通过总线或其它方式连接。输入设备2000、输出设备3000可以是标准的有线或无线通信接口。

处理器1000可以是中央处理模块(centralprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器4000可以是高速ram存储器,也可为非不稳定的存储器,例如磁盘存储器。存储器4000用于存储一组计算机程序,输入设备2000、输出设备3000和处理器1000可以调用存储器4000中存储的程序代码。

存储器4000存储的计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如上述实施例中所述专利价值评估方法的步骤。

本发明的一个实施例还提供一种计算机可读存储介质。该计算机可读存储介质可以是高速ram存储器,也可为非不稳定的存储器,例如磁盘存储器。该计算机可读存储介质可通过外部计算设备或网络进行连接,以读取该计算机可读存储介质所存储的一组计算机程序。该计算机可读存储介质存储的计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如上述实施例中所述预测方法的步骤。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1