用于电子病历的分级预测方法、系统以及计算机设备与流程

文档序号：29737078发布日期：2022-04-21 17:48阅读：123来源：国知局

1.本发明涉及智慧医疗与信息处理技术领域，特别涉及一种用于电子病历的分级预测方法、系统以及计算机设备。

背景技术：

2.在现有的急诊服务中，通常接线员或分诊人员会根据患者情况进行初步询问，并记录患者的电子病历。这些病历中包含了患者的个人信息，现病史、既往史等信息。后送医院往往会通过医生根据这部分电子病历对患者的分诊等级进行判断。分诊等级按照严重性一般分为4级，濒危、危重、急诊、非急症。急诊科会将严重性等级作为一个参考数据再进一步的处理。安全有效的预检分诊可以确保患者安全、提高急诊效率。
3.医疗人员人工进行精确的分诊等级判断具有工作量大、对医生的专业性和经验依赖程度深等不足；利用电子病历数据，通过分类模型对急救创伤患者的分诊等级进行精确的分级预测，同样能够为医生的进一步处理提供有价值的参考依据，且能减小医疗人员的工作量，具有重要的意义；但现在未见公开可靠的方案。

技术实现要素：

4.本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种用于电子病历的分级预测方法、系统以及计算机设备。
5.为解决上述技术问题，本发明采用的技术方案是：一种用于电子病历的分级预测方法，包括以下步骤：
6.1)构建创伤患者的电子病历数据集；
7.2)将电子病历数据集进行类别标签划分，挑选部分数据作为训练集，剩余数据隐藏标签后作为无标签语料库；
8.3)利用无标签语料库对预训练的语言模型进行训练，得到进一步训练后的语言模型；
9.4)利用训练后的语言模型对训练集样本表示，进行分类训练，得到最终的分级预测模型；
10.5)将待分级的电子病历输入所述分级预测模型，得到电子病历的分级结果。
11.优选的是，所述步骤1)包括：
12.1-1)从急救信息系统中采集m份创伤患者的电子病历；
13.1-2)从电子病历中挑选文本数据形成电子病历数据，通过m份电子病历数据构建得到电子病历数据集。
14.优选的是，所述步骤1-1)中，文本数据至少包括电子病历中记载的以下信息数据：性别、年龄、呼救原因、主诉、现病史。
15.优选的是，所述步骤2)包括：
16.2-1)利用电子病历数据中记录的病情划分得到每份电子病历数据的病情等级，将
病情等级作为类别标签标记对应的电子病历；
17.2-2)挑选每类病情等级的电子病历数据各n份，作为训练集；
18.2-3)将剩余的电子病历数据的类别标签隐藏，作为无标签语料库。
19.优选的是，所述步骤2-1)中，病情等级至少划分为以下四级：濒危、危重、急诊、非急症。
20.优选的是，所述步骤3)包括：
21.3-1)将无标签语料库预处理成语言模型所需要的句子对；
22.3-2)加载预训练的语言模型，输入预处理后的无标签语料库，进行训练；
23.3-3)训练后得到含病历语料库的预训练后的语言模型，该模型具有电子病历数据内文本的语义表示信息。
24.优选的是，所述步骤4)包括：
25.4-1)将训练集输入预训练后的语言模型，预训练后的语言模型将训练集的文本转为向量表示；
26.4-2)利用lstm网络作为特征提取器，从输入训练集的文本中提取分类特征；
27.4-3)以类别标签作为训练目标对预训练后的语言模型进行训练，得到最终的分级预测模型。
28.本发明还提供一种用于电子病历的分级预测方法系统，其采用如上所述的方法对电子病历进行分级预测。
29.本发明还提供一种存储介质，其上存储有计算机程序，该程序被执行时用于实现如上所述的方法。
30.本发明还提供一种计算机设备，包括存储器、处理器以及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上所述的方法。
31.本发明的有益效果是：本发明能够充分利用创伤患者的电子病历数据，通过分类模型从电子病历数据中提取出特征信息，能够对急救创伤患者的分诊等级进行精确的分级预测，从而为医生的进一步处理提供具有参考价值的信息，能提高分级预测的精度，且能减小医疗人员的工作量，提高分级效率，具有很好的应用前景。
附图说明
32.图1为本发明的用于电子病历的分级预测方法的流程图。
具体实施方式
33.下面结合实施例对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。
34.应当理解，本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。
35.实施例1
36.参照图1，本实施例的一种用于电子病历的分级预测方法，包括以下步骤：
37.1)构建创伤患者的电子病历数据集：
38.1-1)从急救信息系统中采集m份创伤患者的电子病历；
39.1-2)从电子病历中挑选文本数据形成电子病历数据，通过m份电子病历数据构建得到电子病历数据集。其中，文本数据至少包括电子病历中记载的以下信息数据：性别、年龄、呼救原因、主诉、现病史。
40.2)将电子病历数据集进行类别标签划分，挑选部分数据作为训练集，剩余数据隐藏标签后作为无标签语料库：
41.2-1)利用电子病历数据中记录的病情划分得到每份电子病历数据的病情等级，将病情等级作为类别标签标记对应的电子病历；
42.病情等级分为以下四级：濒危、危重、急诊、非急症，病情判断按照严重性一般分为5级，已死亡、濒危、危重、急诊、非急症。由于本发明中，分级预测不包括已死亡病历，所以将其剔除，留下4中等级；
43.2-2)挑选每类病情等级的电子病历数据各n份，作为训练集；本实施例中，n＝3000；
44.2-3)将剩余的电子病历数据的类别标签隐藏，作为无标签语料库。
45.3)利用无标签语料库对预训练的语言模型进行训练，得到预训练后的语言模型：
46.3-1)将无标签语料库预处理成语言模型所需要的句子对；
47.3-2)加载预先在公开数据集上训练好的语言模型(预训练的语言模型)，输入预处理后的无标签语料库，进行训练，得到进一步训练后的语言模型；
48.3-3)训练后得到含病历语料库的进一步训练后的语言模型，该模型具有电子病历数据内文本的语义表示信息。
49.4)利用训练集对进一步训练后的语言模型进行训练，得到最终的分级预测模型：
50.4-1)将训练集输入进一步训练后的语言模型，进一步训练后的语言模型将训练集的文本转为向量表示；
51.4-2)利用lstm网络作为特征提取器，从输入训练集的文本中提取分类特征；
52.4-3)以类别标签作为训练目标对预训练后的语言模型进行训练，得到最终的分级预测模型。
53.5)将待分级的电子病历输入所述分级预测模型，得到电子病历的分级结果。
54.在一种实施例中，采用了实施例1的方法和几种常规的语言模型和分类模型(如：bert、roberta、cnn、lstm、gru等)。对急救电子病历进行分类预测，分类结果如下表1所示，可以看出，实施例1的方法能获得最高的准确率：0.67。表中第一列表示采用的方法，中级分别表示3类样本(非急症、危重、急诊)的测试集precison、recall、f1-score值，最后一列为测试集的准确率；
55.表1
[0056][0057]
实施例2
[0058]
本实施例提供一种用于电子病历的分级预测方法系统，其采用实施例1的方法对电子病历进行分级预测。
[0059]
本实施例还提供一种存储介质，其上存储有计算机程序，该程序被执行时用于实现实施例1的方法。
[0060]
本实施例还提供一种计算机设备，包括存储器、处理器以及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现实施例1的方法。
[0061]
尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用，它完全可以被适用于各种适合本发明的领域，对于熟悉本领域的人员而言，可容易地实现另外的修改，因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：戴亚康戴斌林岐耿辰王冬阳
技术所有人：苏州市急救中心
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。