基于深度学习和知识图谱的临床路径自动生成方法及系统与流程

文档序号:23265877发布日期:2020-12-11 18:56阅读:147来源:国知局
基于深度学习和知识图谱的临床路径自动生成方法及系统与流程

本发明属于临床数据处理领域,尤其涉及一种基于深度学习和知识图谱的临床路径自动生成方法及系统。



背景技术:

本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。

目前生成临床路径的方法有两种,一种是直接使用国家标准的各类疾病临床路径,另一种是使用传统机器学习的方法简单分析医生已有的诊疗方案制定各类疾病的临床路径。

发明人发现,按照国家规范统一制定的临床路径没有结合各个医院、科室、医生、患者的实际情况,无法满足患者多种多样的情况,导致临床路径不能满足实际治疗的需要,因此难以在实际临床工作中发挥作用。基于传统机器学习方法制定的临床路径,由于其分析的范围不够广,模型复杂度不足,其生成的临床路径不够准确,无法满足医生临床使用的要求。



技术实现要素:

为了解决上述问题,本发明提供一种基于深度学习和知识图谱的临床路径自动生成方法及系统,其基于深度学习和知识图谱,基于规范化治疗数据,智能推荐适合该类患者的临床路径,能够提高制定的临床路径的准确率。

为了实现上述目的,本发明采用如下技术方案:

本发明的第一个方面提供一种基于深度学习和知识图谱的临床路径自动生成方法。

在一个或多个实施例中,基于深度学习和知识图谱的临床路径自动生成方法,包括:

将患者特征信息分别输入第一深度学习模型和第二深度学习模型,对应推荐出第一临床路径和第二临床路径;其中第一临床路径仅包含医嘱,第二临床路径包含医嘱及其执行时间;

将第一临床路径和第二临床路径中包含的所有医嘱取交集,将交集中的医嘱根据类别划分并形成医疗操作医嘱推荐集合和药品医嘱推荐集合;

将医疗操作医嘱推荐集合与医疗操作别名集合取交集,得到第一交集;将药品医嘱推荐集合与药品商品名称集合取交集,得到第二交集;其中,医疗操作别名集合和药品商品名称集合是基于知识图谱及患者特征信息中患者疾病诊断名称所对应的标准临床路径寻找到的;

对第一交集和第二交集中的每条医嘱,通过第二临床路径获得其执行时间,得到第一交集和第二交集对应临床路径每天/每阶段的医嘱分配。

本发明的第二个方面提供一种基于深度学习和知识图谱的临床路径自动生成系统。

在一个或多个实施例中,基于深度学习和知识图谱的临床路径自动生成系统,包括:

临床路径推荐模块,其用于将患者特征信息分别输入第一深度学习模型和第二深度学习模型,对应推荐出第一临床路径和第二临床路径;其中第一临床路径仅包含医嘱,第二临床路径包含医嘱及其执行时间;

第一取交模块,其用于将第一临床路径和第二临床路径中包含的所有医嘱取交集,将交集中的医嘱根据类别划分并形成医疗操作医嘱推荐集合和药品医嘱推荐集合;

第二取交模块,其用于将医疗操作医嘱推荐集合与医疗操作别名集合取交集,得到第一交集;将药品医嘱推荐集合与药品商品名称集合取交集,得到第二交集;其中,医疗操作别名集合和药品商品名称集合是基于知识图谱及患者特征信息中患者疾病诊断名称所对应的标准临床路径寻找到的;

医嘱分配模块,其用于对第一交集和第二交集中的每条医嘱,通过第二临床路径获得其执行时间,得到第一交集和第二交集对应临床路径每天/每阶段的医嘱分配。

本发明的第三个方面提供一种计算机可读存储介质。

一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于深度学习和知识图谱的临床路径自动生成方法中的步骤。

本发明的第四个方面提供一种计算机设备。

一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于深度学习和知识图谱的临床路径自动生成方法中的步骤。

与现有技术相比,本发明的有益效果是:

本发明将患者特征信息分别输入第一深度学习模型和第二深度学习模型,对应推荐出第一临床路径和第二临床路径;其中第一临床路径仅包含医嘱,第二临床路径包含医嘱及其执行时间,基于深度学习技术全面分析医生提供的患者特征信息,基于规范化治疗数据,智能推荐适合该类患者的临床路径,大大提高了制定的临床路径的准确率;

本发明还基于知识图谱及患者特征信息中患者疾病诊断名称所对应的标准临床路径寻找到,医疗操作别名集合和药品商品名称集合,分别与医疗操作医嘱推荐集合和药品商品名称集合对应取交集,得到第一交集和第二交集;对第一交集和第二交集中的每条医嘱,通过第二临床路径获得其执行时间,得到第一交集和第二交集对应临床路径每天/每阶段的医嘱分配,针对某些疾病的患者,自动推荐医生常用的治疗方案,供医生在制定临床路径时参考,针对临床路径制定了整个治疗流程,基于医院的历史规范治疗数据,能够贴合本医院的实际情况,为医生提供切实可行的临床路径,大大提高了临床路径的实用性。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。

图1是本发明实施例的基于深度学习和知识图谱的临床路径自动生成方法流程图;

图2是本发明实施例的第一深度学习模型示意图;

图3是本发明实施例的第二深度学习模型示意图;

图4是本发明实施例的基于深度学习和知识图谱的临床路径自动生成系统结构示意图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

术语解释:

结构化特征:对于患者的某特征,若该特征的表述只需结构化数据,称该特征为结构化特征,医嘱信息就是结构化特征信息;

非结构化特征:对于患者的某特征,若表述该特征需要非结构化文本数据,称该特征为非结构化特征,现病史中某疾病症状的描述信息就是非结构化特征信息。

医疗操作标准名称和医疗操作别名:医疗操作类医嘱既有标准名称,又有别名名称,例如,“左肺上叶切除术”是某手术的标准名称,“切除左肺上叶”就是该手术的别名名称,一个医嘱只有一个标准名称,可以有多个别名名称。

药物成分名称和药品商品名称:对于不同成分的药物,在国家标准临床路径中统一记录其成分名称,但在医生的临床工作中,医嘱药品的名称很多情况下是药品的商品名称而不是成分名称,例如,“奥希替尼”是一个药品成分名称,“泰瑞沙”是该成分的药品商品名称。

知识图谱s:非结构化特征信息->关键字、词,非结构化特征信息的相关数据指描述该特征的文本部分,这些文本中含有与该指标相关的关键字、词,知识图谱s记录了不同非结构化特征信息的关键字、词。

知识图谱t:疾病诊断名称->标准临床路径,针对每个疾病,记录其国家统一制定的标准临床路径中每天或每阶段的所有医嘱。

知识图谱y:药物成分名称->药品商品名称,针对不同药物成分名称,记录其所对应的不同药品商品名称,每一种药物成分名称中可以包含多个药品商品名称。

知识图谱c:医疗操作标准名称->医疗操作别名,针对不同医疗操作医嘱的标准名称,记录其所对应的不同别名名称。

实施例一

参照图1,本实施例的基于深度学习和知识图谱的临床路径自动生成方法,其包括:

步骤s101:将患者特征信息分别输入第一深度学习模型和第二深度学习模型,对应推荐出第一临床路径和第二临床路径;其中第一临床路径仅包含医嘱,第二临床路径包含医嘱及其执行时间。

在具体实施中,接收医生提供的患者特征信息,将这些信息记为集合a,将患者特征中的疾病诊断名称记为d。

特征集合a分别输入第一深度学习模型m和第二深度学习模型g,两个模型分别输出推荐的临床路径r_m和r_g。其中,临床路径r_m和r_g这两个临床路径都是全流程的治疗方案,其中r_g包含了各医嘱的执行时间。

在具体实施中,第一深度学习模型m用于接收患者各类特征信息,推出适合该患者的临床路径,即全流程的治疗方案。

如图2所示,第一深度学习模型m包括:

双向长短时记忆循环神经网络模型,其用于接收患者特征信息的非结构化文本信息词向量,将输出结果经过最大池,得到表示患者病情描述向量;

逻辑回归模型,其用于将患者特征信息结构化信息的向量和患者病情描述向量组合,组合后映射到代表患者的信息与所有医嘱之间相似关系的指数向量;其中,该指数向量中任一元素表示对应医嘱进入临床路径的概率。

具体地,将患者p的非结构化文本信息词向量(可能是多个)输入双向长短时记忆循环神经网络模型,将所有输出词向量的输出结果经过“最大池技术”,得到能表示患者p病情描述的向量c_p;将患者p的结构化信息的向量l_p和c_p组合起来定义为向量v_p=[l_p,c_p]。

利用逻辑回归的方法将向量v_p映射到代表患者p的信息与所有医嘱之间相似关系的指数向量ρ,即其中c1、c2为该逻辑回归关系中的参数张量,需要训练来确定具体数值,ρ的维度是所有可能医嘱的个数,向量ρ中的第i个元素ρ(i)代表选择第i个医嘱进入临床路径的概率。将ρ与所有医嘱结果的0-1概率分布q的交叉熵作为模型m的损失函数。

在第一深度学习模型m的训练前,对标准治疗信息库h中每个疾病所对应的的k个患者,将其中60%、20%、20%的患者所对应的信息向量分别划入训练集、验证集、测试集。利用训练集、验证集、测试集对第一深度学习模型m进行训练。

第一深度学习模型m的整个训练过程为:在训练集上每训练预设次数(比如:100次),保存一次得到的模型;保存一次模型后,使用该模型在验证集上进行一次验证,得到验证集中所有患者的损失函数的总和并保存;验证预设次数(比如:100次)后,选择验证损失函数总和最小的模型所对应的参数,作为第一深度学习模型m的最终参数。

第一深度学习模型m的构建过程为:

步骤(a1):构建本医院的标准治疗信息库h,包含本医院多年历史诊疗数据,数据涵盖不同患者的基本信息、病历、病案首页、医嘱、检查报告、检验报告、病理报告、心电报告等信息。

具体地,步骤(a1)具体实施步骤如下:

对知识图谱t中的每个疾病诊断名称,在医院历史诊疗信息库中找到k(例如,k=100)个诊断为该疾病的“不同患者”,将这些患者的基本信息、病历、病案首页、医嘱、检查报告、检验报告、病理报告、心电报告等信息存储在信息库h中。信息库h的存储结构如下,疾病诊断名称->患者编号(每个证候名称共k个患者)->某编号患者的基本信息、病历、病案首页、医嘱、检查报告、检验报告、病理报告、心电报告等所有信息。

其中:“不同患者”的定义是,每个患者的入院记录文本之间利用levenshtein距离计算出的相似度小于某个阈值,如0.5。

对患者p,其信息主要包括两类,一类是结构化信息(包括患者的性别、年龄、证候、疾病诊断名称),另一类是非结构化文本信息(包括患者的病历、检查报告、检验报告等)。

对于结构化信息,按照类别对应的0-1向量,将结构化信息转化为向量信息(称为类别向量),即可以用某个向量表示该结构化信息,举例如下:

例1:患者的性别一共两类(男和女),男性类别向量为(1,0),女性类别向量为(0,1),那么患者的性别信息就从“男或女”转化为向量“(1,0)或(0,1)”。

例2:假设信息库h中共有3000种疾病诊断名称,那么患者的疾病诊断名称所对应的类别向量共3000维,患者具有的疾病诊断所对应的维度数值为1,其余维度数值为0。

对患者p,将所有结构化信息转化为类别向量,把该患者的所有类别向量组合成一个向量,记为l_p。

此处需要说明的是,在其他实施例中,第一深度学习模型m也可采用其他现有的结构形式来实现,此处不再累述。

对于非结构化文本信息,由于文本信息量大,其中包含了大量不相关信息,首先将其中的重要相关信息筛选、提取出来(信息提取的方法见下面步骤iii),而后,完成提取出来文本信息的向量化表示,即使用分词技术(例如,结巴分词)、词向量技术(例如,word2vec、bert等方法)将病情描述中的词语用词向量表示。

将某特征f的非结构化文本信息按照冒号、逗号、分号、句号进行分割,每一小段称为一个小句。对每一个小句,将其输入第三深度学习模型k_f。对每个非结构化特征f有一个对应的第三深度学习模型k_f,判断该小句是否被提取。提取出所有与特征f有关的小句,将这些小句拼接成一段文本,输出该文本。

其中,第三深度学习模型k_f的结构为:

将某小句的词向量集合输入双向门控循环网络(bi-gru),将所有输出词向量的输出结果经过“最大池技术”得到向量m_f,再把m_f经过线性回归映射到代表是否提取该小句的概率p,即p=c1*m_f+c2,其中c1、c2为该线性回归关系中的参数张量,需要训练来确定具体数值。将p与是否提取该小句的真实0-1概率q的交叉熵作为模型k_f的损失函数。

第三深度学习模型k_f的应用过程为:

获取医院的标准治疗信息库h,将某小句输入深度学习模型k_f,输出该小句被提取的概率p,若概率p>预设阈值(比如:0.5,也可为其他数值),则判定提取该小句,否则,判定为不提取该小句。

具体地,训练第三深度学习模型k_f的过程为:

对标准治疗信息库h中每个疾病所对应的的k个患者与特征f相关的所有小句,将其中60%、20%、20%的所有小句对应的词向量集合分别划入训练集、验证集、测试集;

整个训练过程为:在训练集上每训练预设次数(比如:100次),保存一次得到的模型;保存一次模型后,使用该模型在验证集上进行一次验证,得到验证集中所有患者的损失函数的总和并保存;验证预设次数(比如:100次)后,选择验证损失函数总和最小的模型所对应的参数,作为第三深度学习模型k_f的最终参数。

此处需要说明的是,在其他实施例中,第三深度学习模型k_f也可采用其他现有的结构形式来实现,此处不再累述。

步骤(a2):将医生给出的患者特征信息输入深度学习模型m,输出所有医嘱被采纳的概率向量ρ。

步骤(a3):对于向量ρ中概率大于预设概率值(比如0.5)的维度所对应的医嘱,选择该医嘱,否则,不选择该医嘱。输出所有被选中的医嘱。

如图3所示,第二深度学习模型g用于接收患者各类特征信息,推出适合该患者的临床路径以及每个医嘱的执行时间,即全流程的治疗方案。

第二深度学习模型g是基于第一深度学习模型m的最优化模型,第二深度学习模型g的构建过程为:

步骤(b1):构建本医院的标准治疗信息库h;

步骤(b2):对标准治疗信息库h中的每个患者p,将其信息输入到训练好的模型m中,模型m的向量v_p,建立信息库h所对应的向量库v。

具体地,将患者p的非结构化文本信息词向量(可能是多个)输入双向长短时记忆循环神经网络模型,将所有输出词向量的输出结果经过“最大池技术”,得到能表示患者p病情描述的向量c_p;将患者p的结构化信息的向量l_p和c_p组合起来定义为向量v_p=[l_p,c_p]。

步骤(b3):对于医生输入的患者u的特征信息,将其输入训练好的模型m中,获得向量v_u。

其中,将患者u的非结构化文本信息词向量(可能是多个)输入双向长短时记忆循环神经网络模型,将所有输出词向量的输出结果经过“最大池技术”,得到能表示患者u病情描述的向量c_u;将患者u的结构化信息的向量l_u和c_u组合起来定义为向量v_u=[l_u,c_u]。

解决如下最优化问题:

将上述最优化问题的最优解v_p所对应患者p在信息库h中的所有医嘱以及每条医嘱的执行时间作为模型g的输出。

步骤s102:将第一临床路径和第二临床路径中包含的所有医嘱取交集,将交集中的医嘱根据类别划分并形成医疗操作医嘱推荐集合和药品医嘱推荐集合。

具体地,将r_m、r_g中包含的所有医嘱取交集得到集合b,集合b中的医嘱分两类,一类是医疗操作医嘱(例如,手术,注意此处的医疗操作医嘱名称可能是别名而不一定是标准名称),另一类是药品医嘱(例如,化疗药物培美曲塞,注意此处的药品医嘱名称是药品的商品名称而不一定是药品成分名称),将b中医疗操作、药品两类医嘱组成的集合分别记为b_1、b_2。

步骤s103:将医疗操作医嘱推荐集合与医疗操作别名集合取交集,得到第一交集;将药品医嘱推荐集合与药品商品名称集合取交集,得到第二交集;其中,医疗操作别名集合和药品商品名称集合是基于知识图谱及患者特征信息中患者疾病诊断名称所对应的标准临床路径寻找到的。

具体地,在知识图谱t中,寻找步骤1中患者疾病诊断名称d所对应的标准临床路径,将其中的医疗操作、药品两类医嘱组成的集合分别记为e_1_o、e_2_o;其中,e_1_o中包含的医疗操作名称指的是医疗操作标准名称,e_2_o中所包含的药品指的是药品成分名称而不是药品商品名称。

对于e_1_o中包含的医疗操作标准名称,在知识图谱c中寻找相对应的医疗操作别名,将所有找到的医疗操作别名组成的集合记为e_1。

对于e_2_o中包含的药品成分,在知识图谱y中寻找相对应的药品商品名称,将所有商品名称组成的集合记为e_2。

将b_1与e_1取交集,得到集合c_1;将b_2与e_2取交集,得到集合c_2。

步骤s104:对第一交集和第二交集中的每条医嘱,通过第二临床路径获得其执行时间,得到第一交集和第二交集对应临床路径每天/每阶段的医嘱分配。

具体地,对c_1、c_2中的每条医嘱,通过r_g获得其执行时间,根据该时间,得到临床路径c_1、c_2每天/每阶段的医嘱分配。

本实施例基于深度学习技术全面分析医生提供的患者特征信息,基于规范化治疗数据,智能推荐适合该类患者的临床路径,大大提高了制定的临床路径的准确率;还基于知识图谱及患者特征信息中患者疾病诊断名称所对应的标准临床路径寻找到,医疗操作别名集合和药品商品名称集合,分别与医疗操作医嘱推荐集合和药品商品名称集合对应取交集,得到第一交集和第二交集;对第一交集和第二交集中的每条医嘱,通过第二临床路径获得其执行时间,得到第一交集和第二交集对应临床路径每天/每阶段的医嘱分配,针对某些疾病的患者,自动推荐医生常用的治疗方案,供医生在制定临床路径时参考,针对临床路径制定了整个治疗流程,基于医院的历史规范治疗数据,能够贴合本医院的实际情况,为医生提供切实可行的临床路径,大大提高了临床路径的实用性。

实施例二

参照图4,本实施例提供了一种基于深度学习和知识图谱的临床路径自动生成系统,其包括:

(1)临床路径推荐模块,其用于将患者特征临床路径推荐模块,其用于将患者特征信息分别输入第一深度学习模型和第二深度学习模型,对应推荐出第一临床路径和第二临床路径;其中第一临床路径仅包含医嘱,第二临床路径包含医嘱及其执行时间;

(2)第一取交模块,其用于将第一临床路径和第二临床路径中包含的所有医嘱取交集,将交集中的医嘱根据类别划分并形成医疗操作医嘱推荐集合和药品医嘱推荐集合;

(3)第二取交模块,其用于将医疗操作医嘱推荐集合与医疗操作别名集合取交集,得到第一交集;将药品医嘱推荐集合与药品商品名称集合取交集,得到第二交集;其中,医疗操作别名集合和药品商品名称集合是基于知识图谱及患者特征信息中患者疾病诊断名称所对应的标准临床路径寻找到的;

(4)医嘱分配模块,其用于对第一交集和第二交集中的每条医嘱,通过第二临床路径获得其执行时间,得到第一交集和第二交集对应临床路径每天/每阶段的医嘱分配。

本实施例的基于深度学习和知识图谱的临床路径自动生成系统,与实施例一的基于深度学习和知识图谱的临床路径自动生成方法中的步骤一一对应,其具体实施过程如实施例一所述,此处不再累述。

实施例三

本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一所述的基于深度学习和知识图谱的临床路径自动生成方法中的步骤。

实施例四

本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例一所述的基于深度学习和知识图谱的临床路径自动生成方法中的步骤。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1