基于临床数据的药物推荐方法、推荐装置及服务器与流程

文档序号:12803169阅读:232来源:国知局
基于临床数据的药物推荐方法、推荐装置及服务器与流程

本发明涉及数据处理分析方法领域,更具体地,涉及一种一种基于临床数据的药物推荐方法、推荐装置及服务器。



背景技术:

据统计,我国的临床误诊率大约为30%,和国际医学诊断水平相近,但诸如直肠癌、肺癌等疾病的误诊率几乎大于50%。造成这么高误诊率的原因,除某些疾病的发病特殊性以外,医疗方案水平和诊治水平不高也有影响。医院医疗方案的好坏直接影响医院医疗质量,影响医疗事故的发生率。

医疗方案中起关键作用的在于用药,而目前用药主要根据药物使用说明书,但由于药物的疗效与年龄、种族及病理机制等多因素有关,药物不良事件发生率高。目前,药源性疾病已经成为第5位易导致死亡的疾病,全球约有1/3的死亡病例是由治疗药物使用不当所致。我国每年5000万住院患者中,至少有250万人因药物不良反应而住院治疗。目前,临床医生主要依据药物说明书对不良反应进行判断,但每类药物不良反应种类繁多,临床医生很难逐一进行确认,导致许多的不良反应被忽视。而且由于个体化差异,每个人对药物反应差别很大,个体化用药很有必要。

对于不同疾病状态的患者,一个好的治疗方案可以保证患者能在住院期间,病情得到好转。所以发现和学习好的医疗方案十分有必要。近年来,随着计算医学的飞速发展与应用,越来越多的研究者认为可以运用计算医学来发现好的临床医疗方案,提高疾病诊治效率。因此,如何利用患者的临床数据,通过计算医学的技术手段评估相应疾病的医疗方案,为低年资医生、基层医生推荐学习模板,为患者提供参考是一个重要的医学课题。



技术实现要素:

本发明提供一种基于临床数据的药物推荐方法、推荐装置及服务器,用于克服现有技术的缺陷,旨在根据临床数据为药物选择提供辅助决策,提高基层医生对药物使用状况的认知度,减少药源性疾病的发生。

为实现上述目的,本发明提供一种基于临床数据的药物推荐方法,包括以下步骤:

获取所有疾病患者的临床数据;

通过限定关键词建立与某一疾病患者相关的索引数据库;

建立衡量与所述某一疾病相关的药物有效性的数据指标;

根据所述索引数据库,从所述临床数据中提取每个患者的id、医生、科室、生命体征、诊断、药物、检验信息;

根据提取的信息和所述数据指标构建加权星型异构数据模型;

对所述加权星型异构数据模型进行排序,获取适合所述某一疾病患者的药物的排名信息。

在所述获取临床数据库中所有疾病患者的临床数据之后,还包括:

对所述临床数据进行清洗。

优选地,所述对所述临床数据进行清洗,包括:

在患者的记录数据的数据缺失率大于预设阈值时,去除所述患者的记录数据;

在患者的记录数据的数据缺失率小于预设阈值时,对所述患者的记录数据进行补齐;

每个患者的临床数据选择时间最近的一条记录;

将患者的检验结果的数值离散到预设的区间。

优选地,所述数据指标包括:

患者不同阶段的检验信息以及病情的转归类型。

优选地,所述根据所述关系型数据库和所述数据指标构建加权星型异构数据模型,包括:

根据提取的信息,建立以所述患者的id信息为主键,以所述患者的医生、科室、生命体征、诊断、药物、检验信息为属性对象的星型异构数据模型;

根据所述数据指标,计算所述星型异构数据模型各属性对象的权重。

优选地,所述对所述加权星型异构数据模型进行排序,获取适合所述某一疾病患者的药物的排名,包括:

采用medrank排序算法,通过第一公式进行迭代运算,直到结果收敛于稳定值,实现对所述加权星型异构数据模型的排序,从而获得适合所述某一种疾病患者的药物的排名信息;

其中,所述的第一公式为:

其中,t∈{1,…,n-1},n为大于1的正整数,x1为目标类型,代表药物信息,xt为第t次对象类型,c为中心类型,代表患者,为x1对象类型在当次迭代的排序分数,u为|x1|×|x1|的单位矩阵,|x1|为x1类型对象的总数,ɑ为决定u/|x1|项的权重,wab为对象a和b的加权邻接矩阵,表示两者之间的权重链接,为对行进行规化的对角矩阵,其中第i行的对角值为wab第i行之和。

为实现上述目的,本发明还提供一种基于临床数据的药物推荐装置,包括:

数据采集模块,用于获取所有疾病患者的临床数据;

索引数据模块,用于通过限定关键词建立与某一疾病的患者相关的索引数据库;

衡量指标模块,用于建立衡量与所述某一疾病相关的药物有效性的数据指标;

信息提取模块,用于根据所述索引数据库,从所述临床数据中提取每个患者的id、医生、科室、生命体征、诊断、药物、检验信息;

模型模块,用于根据提取的信息和所述数据指标构建加权星型异构数据模型;

排序模块,用于对所述加权星型异构数据模型进行排序,获取适合所述某一疾病患者的药物的排名信息。

优选地,所述基于临床数据的药物推荐装置还包括:

数据清洗模块,用于对所述临床数据进行清洗;

所述模型模块包括:

构建模块,用于根据提取的信息,建立以所述患者的id信息为主键,以所述患者的医生、科室、生命体征、诊断、药物、检验信息为属性对象的星型异构数据模型;

权重模块,用于根据所述数据指标,计算所述星型异构数据模型各属性对象的权重。

优选地,所述排序模块,还用于采用medrank排序算法,通过第一公式进行迭代运算,直到结果收敛于稳定值,实现对所述加权星型异构数据模型的排序,从而获得适合所述某一种疾病患者的药物的排名信息;

其中,所述的第一公式为:

其中,t∈{1,…,n-1},n为大于1的正整数,x1为目标类型,代表药物信息,xt为第t次对象类型,c为中心类型,代表患者,为x1对象类型在当次迭代的排序分数,u为|x1|×|x1|的单位矩阵,|x1|为x1类型对象的总数,ɑ为决定u/|x1|项的权重,wab为对象a和b的加权邻接矩阵,表示两者之间的权重链接,为对行进行规化的对角矩阵,其中第i行的对角值为wab第i行之和。

为实现上述目的,本发明还提供一种服务器,包括上述的基于临床数据的药物推荐装置。

本发明提供的基于临床数据的药物推荐方法、推荐装置及服务器,首先采集所有疾病患者的临床数据,然后通过限定与某一种疾病相关的关键词建立索引数据库,再建立衡量与上述疾病相关的药物有效性的数据指标;再根据索引数据库与临床数据库的映射关系,从临床数据库中提取患者的相关信息;在根据提取的信息以及数据指标构建数据模型;最后通过数学方法对数据模型分析、处理、排序,最终获得适合该疾病患者的药物的排名信息;实现了根据临床数据为药物选择提供辅助决策,从而提高基层医生对药物使用状况的认知度,减少药源性疾病的发生。

附图说明

图1为本发明实施例一提供的基于临床数据的药物推荐方法的流程图;

图2为本发明实施例二中数据模型构建步骤中星型异构数据模型的结构示意图;

图3为本发明实施例三中数据清洗步骤的细化流程图;

图4为本发明实施例提供的基于临床数据的药物推荐装置的模块示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

如图1所示,本发明提供一种基于临床数据的药物推荐方法,包括以下步骤:

步骤s10,获取所有疾病患者的临床数据;这里的临床数据来源于现有的数据,可以是一家或多家医院的临床数据。这些临床数据关于每位患者的信息均采用统一的格式。主要包括:患者id(身份编号)、诊断疾病、用药前检验结果、生命体征、医生、科室、治疗药物、用药后检验结果、转归情况等。

步骤s20,通过限定关键词建立与某一疾病患者相关的索引数据库;这里的关键词可以是与疾病的名称相关的词,针对诊断疾病信息的进行的检索,例如高血压、心脏病、冠心病等。其中,索引数据库中包含了与关键词有关的所有患者的临床数据的链接,通过索引数据库中的映射关系能够找到与关键词或与医学主题词表有关的所有患者的临床数据,索引数据库中包含的信息来自于临床数据库中的内容。

本实施例中的临床数据,从中南大学湘雅三医院医疗信息系统中采集用药时间大于5天,且用药前后有两次血压测量和生命体征、检验结果的高血压患者的就诊信息。数据中包含代表患者的id号、医生、科室、基本信息、生命体征用药前后血压、治疗药物、转归情况、年龄、性别、吸烟、血脂、血糖、bmi、egfr、crp、肌酐、微量白蛋白尿等基础信息和检查指标以及心衰、冠心病、糖尿病等诊断,其中未包含患者的隐私信息。

高血压患者所用治疗药物主要考虑利尿剂、β受体阻滞剂、α受体阻滞剂、血管紧张素转换酶抑制剂(acei)、钙通道阻滞剂(ccb)、血管紧张素受体拮抗剂(arb)、血管扩张剂、神经节阻滞剂单一药物或者组合用药。

分析医院信息系统中所有高血压患者的临床数据,采集包括患者id、用药前后舒张压/收缩压、主治医生、科室、降压药物等患者的临床数据信息。

步骤s30,建立衡量与所述某一疾病相关的药物有效性的数据指标;所述数据指标包括患者不同阶段的检验信息以及病情的转归类型,以高血压疾病患者为例:1)降压药物治疗期间舒张压/收缩压有明显降低;2)出院时病情好转。本发明中用高血压患者一次就诊期间用药前后血压的降低情况以及病情的转归情况共同来衡量就诊期间降压方案或降压药物的有效性,可以设定一个阈值,高血压患者一次就诊期间用药前后血压的降低是否达到阈值;病情好转可设定几个等级类型,例如轻微、中度、良好、痊愈等。

步骤s40,根据所述索引数据库,从所述临床数据中提取每个患者的id、医生、科室、生命体征、诊断、药物、检验信息;如果临床数据中这些信息不全,可以在步骤s10之后对临床数据进行清洗,去除缺失数据率过大的属性以及患者记录,对于缺失数据率较小的属性采取数据补齐措施。

步骤s50,根据提取的信息和所述数据指标构建加权星型异构数据模型;包括以下步骤:

步骤s51,根据提取的信息,建立以所述患者的id信息为主键,以所述患者的医生、科室、生命体征、诊断、药物、检验信息为属性对象的星型异构数据模型;参见图2;

步骤s52,根据所述数据指标,计算所述星型异构数据模型各属性对象的权重。

针对每个患者的临床数据构建以患者为中心对象,医生、科室、年龄、用药前后舒张压、收缩压、心率、血红蛋白等特征为属性对象的关系型数据结构,再根据数据指标计算各关系型数据结构的属性对象的权重,形成多个加权星型异构数据模型。

其中生命体征包括年龄、用药前收缩压/舒张压,检验结果包括egfr、尿素、血红蛋白的检验值。星型异构数据模型边缘的属性对象的权重是依靠以下两个因子的基础上计算得到:

患者血压降低情况:如果患者用药前舒张压<90且收缩压<140:

a)用药后收缩压<140且舒张压<90,weight=0;

b)用药后收缩压>=140或舒张压>=90,weight=-1;

如果用药前舒张压>=90或收缩压>=140:

a)用药后收缩压<140且舒张压<90,weight=1;

b)收缩压降低>20或舒张压降低>10,weight=0.5;

c)收缩压降低<20以及舒张压降低<10,weight=0;

d)收缩压或者舒张压上升,weight=-1;

患者病情转归情况:

如果患者病情得到好转,weight=1;

如果患者病情未愈,weight=-0.5;

如果患者死亡,weight=-1;

如果患者病情属于其他情况,weight=0;

最后病人其他指标权重:

weight=(1-a)*weight_转归+a*weight_血压降低情况

医生的权重:该医生医治的所有病人weight的平均值;

科室的权重:该科室医治的所有病人weight的平均值。

步骤s60,对所述加权星型异构数据模型进行排序,获取适合所述某一疾病患者的药物的排名信息。

采用medrank排序算法对步骤s50中构建的加权星型异构数据模型进行排序,得到各类降压方案有效性的排名。medrank算法对每个患者所构建的加权星型异构数据模型基于以下算法进行迭代运算,直到结果收敛于稳定质:

xt为第tth对象类型,x1为目标类型,在本研究中指降压方案,c为中心类型,本实施例中是指患者,wab为对象a和b的加权邻接矩阵,表示两者之间的权重链接,为对行进行规化的对角矩阵,其中第i行的对角值为wab第i行之和。下面的表1为高血压患者中降压药物有效性的排序结果:

表1

本发明的方案通过对临床数据的分析,建立降压方案推荐模型,自动生成各类降压方案有效性的排名情况;可以指导基层医生、低年资医生根据高血压患者服用的不同降压药物情况,着重监测常见的不良反应,避免发生不良预后,提高降压药物疗效。同时极大地提高了人们对降压药物的依从性,从而更好的进行自我管理,符合国家治病的社会取向,有利于提高高血压的控制率,减轻国家社会经济负担。

在本发明一实施例中,参见图3,在步骤s10之后还包括:

步骤s11,对所述临床数据进行清洗;以高血压疾病为例:清晰后的临床数据中必须有用药前后血压、医生、科室、降压药物。

步骤步骤s11包括:

步骤s111,在患者的记录数据的数据缺失率大于预设阈值时,去除所述患者的记录数据;在患者的记录数据的数据缺失率小于预设阈值时,对所述患者的记录数据进行补齐;如果临床数据中关于必须有的数据信息缺失时,判断缺失率是否大于阈值,如果大于,则去除该条患者的记录;如果小于,则数值型属性用该属性数值的中位数(平均值)补齐,标签型属性用随机生成标签值的方式补齐;

步骤s112,在每个患者的临床数据中选择时间最近的一条记录;

步骤s113,将患者的检验结果的数值离散到预设的区间。

经过清洗的数据更加完整,并且对于明显失真或具有失误的数据进行去除,采用具有普遍性的数据,能够提高计算的准确性,减小因原始数据带来的误差。

本发明实施例还提供一种基于临床数据的药物推荐装置,参见图4,包括:

数据采集模块10,用于获取所有疾病患者的临床数据;

索引数据模块20,用于通过限定关键词建立与某一疾病的患者相关的索引数据库;

衡量指标模块30,用于建立衡量与所述某一疾病相关的药物有效性的数据指标;

信息提取模块40,用于根据所述索引数据库,从所述临床数据中提取每个患者的id、医生、科室、生命体征、诊断、药物、检验信息;

模型模块50,用于根据提取的信息和所述数据指标构建加权星型异构数据模型;

排序模块60,用于对所述加权星型异构数据模型进行排序,获取适合所述某一疾病患者的药物的排名信息。

所述基于临床数据的药物推荐装置还包括:

数据清洗模块11,用于对所述临床数据进行清洗;

所述模型模块50包括:

构建模块51,用于根据提取的信息,建立以所述患者的id信息为主键,以所述患者的医生、科室、生命体征、诊断、药物、检验信息为属性对象的星型异构数据模型;

权重模块52,用于根据所述数据指标,计算所述星型异构数据模型各属性对象的权重。

所述排序模块60,还用于采用medrank排序算法,通过第一公式进行迭代运算,直到结果收敛于稳定值,实现对所述加权星型异构数据模型的排序,从而获得适合所述某一种疾病患者的药物的排名信息;

其中,所述的第一公式为:

其中,t∈{1,…,n-1},n为大于1的正整数,x1为目标类型,代表药物信息,xt为第t次对象类型,c为中心类型,代表患者,为x1对象类型在当次迭代的排序分数,u为|x1|×|x1|的单位矩阵,|x1|为x1类型对象的总数,ɑ为决定u/|x1|项的权重,wab为对象a和b的加权邻接矩阵,表示两者之间的权重链接,为对行进行规化的对角矩阵,其中第i行的对角值为wab第i行之和。

本装置的数据采集模块10根据医院患者就诊信息中患者的所有数据,采集用药时间大于5天,且用药前后有两次血压测量和生命体征、检验结果的高血压患者相关的数据,包括年龄、医生、用药前后舒张压/收缩压、降压药物等数据信息。数据清洗指标建立模块,建立衡量临床数据有效性相关的指标:所采集的患者记录中必须有医生、科室、降压治疗、基本信息(年龄、性别、bmi)、生命体征(用药前血压、心率)、检验结果、诊断、转归等属性;在清洗数据时,界定属性值的合理范围;对于缺失的数据,进行删除记录或补齐缺失数值的处理;根据采集到的临床数据,构建加权异构星型网络模型;采用medrank排序算法,对加权的异构星型网络模型进行排序,得到最常见的降压方案排名,实现了降压药物的推荐。

本发明实施例还提供一种服务器,包括上述实施例中任一所述的基于临床数据的药物推荐装置。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1