病历评估方法、装置、电子设备及存储介质与流程

文档序号:14177255阅读:671来源:国知局
病历评估方法、装置、电子设备及存储介质与流程

本发明涉及数据处理技术领域,具体而言,涉及一种病历评估方法、病历评估装置、电子设备以及计算机可读存储介质。



背景技术:

病历是医务人员对患者疾病的发生、发展、检查、诊断、治疗等医疗活动过程的记录。质量越好的病历,覆盖的信息越全面,对于医学研究的价值就越大。

目前,已经有多种病历评价准则,但是还是靠人工使用这些病历评价准则对病历进行评价。人工评估病历耗时耗力,难以满足大批量地评估病历的需要。

因此,需要提供一种能够解决上述问题中的一个或多个问题的病历评估方法、病历评估装置、电子设备以及计算机可读存储介质。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。



技术实现要素:

本发明实施例的目的在于提供一种病历评估方法、病历评估装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。

根据本发明实施例的第一方面,提供了一种病历评估方法,包括:

获取已知标注结果的多个病历,并将所述多个病历作为训练样本;

提取所述训练样本中各个病历的与预定病历评估标准对应的病历特征;

基于各个病历的所述标注结果和所述病历特征对病历评估模型进行训练;

通过训练后的所述病历评估模型对待评估病历进行评分,并基于所述评分确定所述待评估病历的评估结果。

在本发明的一些实施例中,基于前述方案,提取所述训练样本中各个病历的与预定病历评估标准对应的病历特征,包括:

通过领域特定语言表示各个病历的与预定病历评估标准对应的病历特征;

通过结构化数据处理方式提取各个病历的用所述领域特定语言表示的所述病历特征。

在本发明的一些实施例中,基于前述方案,所述病历评估模型为梯度提升决策树模型,基于各个病历的所述标注结果和所述病历特征对病历评估模型进行训练,包括:

基于各个病历的所述标注结果和所述病历特征对所述梯度提升决策树模型进行训练。

在本发明的一些实施例中,基于前述方案,所述病历评估方法还包括:

使用均方差作为损失函数对所述梯度提升决策树模型的训练结果进行评估;

基于所述评估的结果调整所述梯度提升决策树模型。

在本发明的一些实施例中,基于前述方案,基于所述评分确定所述待评估病历的评估结果,包括:

将各个病历的所述标注结果分为多个分档,并确定所述多个分档中各个分档的分档阈值;

基于各个分档的所述分档阈值以及所述评分来确定各个所述待评估病历所处的分档。

在本发明的一些实施例中,基于前述方案,所述多个分档包括5个分档。

在本发明的一些实施例中,基于前述方案,所述病历评估方法还包括:

对通过所述病历评估模型得到的各个所述待评估病历的评估结果进行排序。

根据本发明实施例的第二方面,提供了一种病历评估装置,包括:

样本获取单元,用于获取已知标注结果的多个病历,并将所述多个病历作为训练样本;

特征提取单元,用于提取所述训练样本中各个病历的与预定病历评估标准对应的病历特征;

模型训练单元,用于基于各个病历的所述标注结果和所述病历特征对病历评估模型进行训练;

评估单元,用于通过训练后的所述病历评估模型对待评估病历进行评分,确定所述待评估病历的评估结果。

根据本发明实施例的第三方面,提供了一种电子设备,包括:

处理器;以及

存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上述第一方面所述的病历评估方法。

根据本发明实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的病历评估方法。

在本发明的一些实施例所提供的技术方案中,一方面,提取训练样本中各个病历的与预定病历评估标准对应的病历特征,能够获取与预定病历评估标准对应的病历特征,便于对病历质量进行评估;另一方面,基于各个病历的标注结果和病历特征对病历评估模型进行训练,通过训练后的病历评估模型对待评估病历进行评分,能够自动地对大批量的待评估病历进行评估,从而能够降低人力成本;再一方面,由于能够实时自动地对病历进行评分,从而可以指导和监控医生的病历书写规范度,提高医院的病历数据质量。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1示出了根据本发明的示例性实施例的病历评估方法的流程示意图;

图2示出了根据本发明的示例性实施例的提取病历特征的流程示意图;

图3示出了根据本发明的示例实施例的通过dsl表示一个病历的入院记录的示意图;

图4示出了根据本发明的示例性实施例的确定待评估病历的评估结果的流程示意图;

图5示出了根据本发明的一示例性实施例的病历评估装置的示意框图;

图6示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。

附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。

图1示出了根据本发明的示例实施例的病历评估方法的流程示意图。参照图1所示,该病历评估方法可以包括以下步骤:

步骤s110,获取已知标注结果的多个病历,并将所述多个病历作为训练样本;

步骤s120,提取所述训练样本中各个病历的与预定病历评估标准对应的病历特征;

步骤s130,基于各个病历的所述标注结果和所述病历特征对病历评估模型进行训练;

步骤s140,通过训练后的所述病历评估模型对待评估病历进行评分,并基于所述评分确定所述待评估病历的评估结果。

根据本示例实施例中的病历评估方法,一方面,提取训练样本中各个病历的与预定病历评估标准对应的病历特征,能够获取与预定病历评估标准对应的病历特征,便于对病历质量进行评估;另一方面,基于各个病历的标注结果和病历特征对病历评估模型进行训练,通过训练后的病历评估模型对待评估病历进行评分,能够自动地对大批量的待评估病历进行评估,从而能够降低人力成本;再一方面,由于能够实时自动地对病历进行评分,从而可以指导和监控医生的病历书写规范度,提高医院的病历数据质量。

下面,将对本示例实施例中的病历评估方法进行详细的说明。

在步骤s110中,获取已知标注结果的多个病历,并将所述多个病历作为训练样本。

在本示例实施例中,可以从一个或多个医院选取一定数量例如8000份病历,通过医学专家按照病历评分的多个评分标准对选择的病历进行标注评分,将经过医学专家标注评分的病历作为训练样本。

举例而言,在一种病历评分标准中,设病历评分的总分为100分,入院记录可以占25分、病程记录可以占40分、出院(死亡)记录可以占10分、病案首页可以占5分、知情同意书可以占10分、医嘱单及辅助检查单可以占5分、书写基本原则可以占5分,医学专家可以通过上述评分标准对病历进行标注评分。

在步骤s120中,提取所述训练样本中各个病历的与预定病历评估标准对应的病历特征。

在本示例实施例中,预定病历评估标准可以包括:卫生部出版的《病历书写基本规范》、《电子病历基本规范》、《病历质量评价标准》,但是本发明的示例实施例不限于此,例如预定病历评估标准还可以为中国协和医科大学出版社出版的《卫生部病历评比精选:全国三级综合医院病历案例评析》、人民卫生出版社出版的《医院管理学—病案管理分册(第2版)》。

进一步地,在本示例实施例中,与预定病历评估标准对应的病历特征可以包括:入院记录、病程记录、出院(死亡)记录、病案首页、知情同意书、医嘱单及辅助检查单、书写基本原则等特征。与入院记录对应的病历特征可以包括:一般项目、主诉、现病史、既往史、个人史、家族史、体格检查、辅助检查、诊断等项。

图2示出了根据本发明的示例性实施例的提取病历特征的流程示意图。

参照图2所示,在步骤s210中,通过dsl(domain-specificlanguages,领域特定语言)表示各个病历的与预定病历评估标准对应的病历特征。dsl是针对特定应用领域而设计使用的计算机语言,可以描述复杂的逻辑运算,从而能够降低处理该特定问题的复杂度。图3示出了通过dsl表示一个病历的入院记录文档中是否包含有入院情况的信息的示意图。

在步骤s220中,通过结构化数据处理方式提取各个病历的用所述领域特定语言表示的所述病历特征。

在本示例实施例中,可以通过结构化数据处理方式例如sparksql提取各个病历的用dsl表示的病历特征,sparksql是用来处理结构化数据的spark组件。进一步地,还可以对提取的每一维的病历特征进行编号,生成一系列带编号的病历特征,可以通过该系列待编号的病历特征来表示每个病历。

继续参照图1所示,在步骤s130中,基于各个病历的所述标注结果和所述病历特征对病历评估模型进行训练。

在本示例实施例中,病历评估模型可以为gbdt(gradientboostingdecisiontree,梯度提升决策树)模型,可以基于医学专家对各个病历的标注结果和在步骤s120中提取的病历特征对gbdt模型进行训练。

需要说明的是,在本示例实施例中,文档分类模型可以为gbdt模型,但是本领域技术人员应该理解的是,还可以采用其他的模型例如支持向量机模型、决策树模型以及贝叶斯模型等,这同样在本发明的保护范围内。

进一步地,在本示例实施例中,还可以使用均方差作为损失函数对所述梯度提升决策树模型的训练结果进行评估,例如可以将各个病历的训练结果与标注结果的均方差作为损失函数来评估gbdt模型的训练结果,基于评估的结果来调整gbdt模型,使得训练结果与标注结果的均方差的值在预定范围内。

接下来,参照图1所示,在步骤s140中,通过训练后的所述病历评估模型对待评估病历进行评分,并基于所述评分确定所述待评估病历的评估结果。

在本示例实施例中,可以提取待评估病历的病历特征,将所提取的病历特征输入到训练后的gbdt模型中以对待评估病历进行评分,评分的结果可以为一个实数结果。图4示出了根据本发明的示例性实施例的确定待评估病历的评估结果的流程示意图。

参照图4所示,在步骤s410中,将各个病历的所述标注结果分为到多个分档,并确定所述多个分档中各个分档的分档阈值。

在本示例实施例中,还可以将各个病历的标注结果分为多个分档如5个分档。进一步地,还可以将5个分档映射为0至-4的数,例如:可以将5分档映射为0,将4分档映射为-1,将3分档映射为-2,将2分档映射为-3,将1分档映射为-4。将5分档映射为0,意味着5分档的缺陷很少,需要扣分的项很少;而把1分档映射为-4,则意味着分档的缺陷较多,需要扣分的项很多。通过这种映射手段,可以将确定待评估病历的评估结果的问题变成不满足某个条件(特征)就扣分的逻辑。

进一步地,可以根据各个病历的标注确定每个分档下的病历的数量,基于每个分档下的病历的数量确定各个分档的分档阈值。

在步骤s420中,基于各个分档的所述分档阈值以及所述评分来确定各个所述待评估病历所处的分档。

在本示例实施例中,通过gbdt模型对待评估病历进行评分的评分结果为一个实数,可以基于各个分档的分档阈值将该评分结果映射到某一分档下。进一步地,还可以对通过病历评估模型得到的各个待评估病历的评估结果进行排序,将排序后的各个待评估病历映射到多个分档下。

图5示出了根据本发明的一示例性实施例的病历评估装置的示意框图。参照图5所示,该病历评估装置500可以包括:样本获取单元510、特征提取单元520、模型训练单元530以及评估单元540。其中:样本获取单元510用于获取已知标注结果的多个病历,并将所述多个病历作为训练样本;特征提取单元520用于提取所述训练样本中各个病历的与预定病历评估标准对应的病历特征;模型训练单元530用于基于各个病历的所述标注结果和所述病历特征对病历评估模型进行训练;评估单元540用于通过训练后的所述病历评估模型对待评估病历进行评分,确定所述待评估病历的评估结果。

在本发明的一些实施例中,基于前述方案,特征提取单元520可以包括:病历特征表示单元,用于通过领域特定语言表示各个病历的与预定病历评估标准对应的病历特征;提取单元,用于通过结构化数据处理方式提取各个病历的用所述领域特定语言表示的所述病历特征。

在本发明的一些实施例中,基于前述方案,所述病历评估模型为梯度提升决策树模型,模型训练单元530可以被配置成:基于各个病历的所述标注结果和所述病历特征对所述梯度提升决策树模型进行训练。

在本发明的一些实施例中,基于前述方案,所述病历评估装置500还可以包括:结果评估单元,用于使用均方差作为损失函数对所述梯度提升决策树模型的训练结果进行评估;调整单元,用于基于所述评估的结果调整所述梯度提升决策树模型。

在本发明的一些实施例中,基于前述方案,所述多个分档包括5个分档。

在本发明的一些实施例中,基于前述方案,所述病历评估装置500还可以包括:排序单元,用于对通过所述病历评估模型得到的各个所述待评估病历的评估结果进行排序。

由于本发明的示例实施例的病历评估装置500的各个功能模块与上述病历评估方法的示例实施例的步骤对应,因此在此不再赘述。

在本发明的示例性实施例中,还提供了一种能够实现上述方法的电子设备。

下面参考图6,其示出了适于用来实现本发明实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备的计算机系统600仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示,计算机系统600包括中央处理单元(cpu)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。在ram603中,还存储有系统操作所需的各种程序和数据。cpu601、rom602以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。

以下部件连接至i/o接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(cpu)601执行时,执行本申请的系统中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的病历评估方法。

例如,所述电子设备可以实现如图1中所示的:步骤s110,获取已知标注结果的多个病历,并将所述多个病历作为训练样本;步骤s120,提取所述训练样本中各个病历的与预定病历评估标准对应的病历特征;步骤s130,基于各个病历的所述标注结果和所述病历特征对病历评估模型进行训练;步骤s140,通过训练后的所述病历评估模型对待评估病历进行评分,并基于所述评分确定所述待评估病历的评估结果。

应当注意,尽管在上文详细描述中提及了用于动作执行的设备或装置的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1