医疗实体识别模型的训练方法、医疗实体识别方法及装置与流程

文档序号：32749849发布日期：2022-12-31 00:03阅读：43来源：国知局

1.本技术涉及信息处理技术领域，特别是涉及一种医疗实体识别模型的训练方法、医疗实体识别方法及装置。

背景技术：

2.随着医疗领域检测技术和疾病诊断方式的发展，日益增长的医疗数据规模使得对于医疗数据的分析处理技术需求愈加迫切。因此，医疗实体识别技术得到了越来越多的关注。医疗实体识别技术是指从医疗数据中提取医疗实体的技术。其中，医疗数据包括电子病历、医学文献、客户咨询等医疗过程中产生的非结构数据，医疗实体是指对于病情诊断有较大价值的相关信息，例如可以包括疾病名称、手术名称、药品名称和检验检查名称等。
3.医疗实体识别技术依赖医疗实体识别模型实现。目前，医疗实体识别模型需要通过特定的训练数据进行训练得到。特定的训练数据是指由医疗领域的技术人员进行了标注的医疗数据。
4.但是，对于不同的应用任务，需要识别的医疗实体可能并不相同。为此，就需要针对不同的应用任务训练不同的医疗实体识别模型。显然，训练大量的医疗实体识别模型存在效率低、成本高和数据利用率低等问题。

技术实现要素：

5.基于上述问题，本技术提供了一种医疗实体识别模型的训练方法、医疗实体识别方法及装置，可以有效利用不同任务下的各种标注数据。
6.第一方面，本技术公开了一种医疗实体识别模型的训练方法，其特征在于，所述方法包括：
7.获取待训练数据；
8.获取目标实体属性信息，所述目标实体属性信息用于指示实体的属性；
9.根据目标实体属性信息，利用所述训练数据训练实体识别模型，所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。
10.可选地，所述目标实体属性信息，包括以下任意一项或多项：
11.实体类型、实体类型的定义和实体类型的样例。
12.可选地，所述根据目标实体属性信息，利用所述训练数据训练实体识别模型，包括：
13.根据目标实体属性信息对所述待训练数据进行数据格式转换，得到数据格式转换后的待训练数据；所述数据格式转换后的待训练数据为多条具有不同目标实体属性信息标注的待训练数据；
14.利用所述格式转换后的待训练数据训练实体识别模型。
15.可选地，所述利用所述格式转换后的待训练数据训练实体识别模型，包括：
16.利用所述格式转换后的待训练数据，对于待训练数据中不存在的目标实体属性信
息对应实体，训练医疗实体识别模型生成基于目标实体属性信息识别的负样本。
17.第二方面，本技术公开了一种医疗实体识别方法，所述方法包括：
18.获取待处理的文本数据；
19.获取目标实体属性信息，所述目标实体属性信息用于指示实体的属性；
20.根据实体识别模型，基于所述目标实体属性信息，对所述待处理的文本数据进行识别，得到实体识别结果，所述实体识别结果对应的实体的属性与所述目标实体属性信息所指示的属性相匹配。
21.第三方面，本技术公开了一种医疗实体识别模型的训练装置，包括：
22.第一获取模块，获取待训练数据；
23.第二获取模块，获取目标实体属性信息，所述目标实体属性信息用于指示实体的属性；
24.训练模块，根据目标实体属性信息，利用所述训练数据训练实体识别模型，所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。
25.可选地，所述装置包括：
26.转换单元，根据目标实体属性信息对所述待训练数据进行数据格式转换，得到数据格式转换后的待训练数据；所述数据格式转换后的待训练数据为多条具有不同目标实体属性信息标注的待训练数据；
27.第一训练单元，利用所述格式转换后的待训练数据训练实体识别模型。
28.第四方面，本技术公开了一种医疗实体识别装置，包括：
29.第三获取模块，获取待处理的文本数据；
30.第四获取模块，获取目标实体属性信息，所述目标实体属性信息用于指示实体的属性；
31.识别模块，根据实体识别模型，基于所述目标实体属性信息，对所述待处理的文本数据进行识别，得到实体识别结果，所述实体识别结果对应的实体的属性与所述目标实体属性信息所指示的属性相匹配。
32.第五方面，本技术公开了一种电子设备，其特征在于，包括：处理器、存储器、系统总线；
33.所述处理器以及所述存储器通过所述系统总线相连；
34.所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述医疗实体识别模型的训练方法的任一实现方式，或者，所述处理器执行上述医疗实体识别方法任一实现方式。
35.第六方面，本技术公开了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述医疗实体识别模型的训练方法的任一实现方式，或者，使得所述终端设备执行上述医疗实体识别方法的任一实现方式。
36.相较于现有技术，本技术具有以下有益效果：
37.本技术公开了一种医疗实体识别模型的训练方法。所述训练方法包括：获取待训练数据；获取目标实体属性信息，所述目标实体属性信息用于指示实体的属性；根据目标实体属性信息，利用所述训练数据训练实体识别模型，所述实体识别模型用于对属性与所述
目标实体类型信息所指示的属性相匹配的实体的进行识别。本技术在模型训练阶段，通过引入目标实体属性信息，并且在不同任务中复用待训练数据，使得同一套训练数据可以被不同的任务使用，提升数据使用效率，并且提高模型在不同任务中识别新类型实体的能力。
附图说明
38.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
39.图1为本技术现有技术中模型训练的示意图；
40.图2为本技术实施例提供的一种医疗实体识别模型的训练方法的流程图；
41.图3为本技术实施例模型训练的一种示意图；
42.图4为本技术实施例步骤103一种可选的实现方式流程图；
43.图5为本技术实施例提供的一种医疗实体识别方法的流程图；
44.图6是本技术实施例提供的一种医疗实体识别模型的训练装置结构示意图；
45.图7是本技术实施例提供的一种医疗实体识别装置结构示意图。
具体实施方式
46.为了使本技术领域的人员更好地理解本技术方案，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
47.正如前文描述，医疗实体识别模型需要通过特定的训练数据进行训练得到。特定的训练数据是指由医疗领域的技术人员进行了标注的医疗数据。但是，对于不同的应用任务，需要识别的医疗实体可能并不相同。例如：通过序列标注的方法进行实体识别，通常采用bio标签体系，b-x表示代表实体x的开头，i-x表示代表实体x的中间，o表示非实体。其中，“b-身体”表示实体的类型为身体，且是实体的开始，“i-身体”表示实体的类型为身体，且是实体的中间位置，“o”表示不属于任何类型；对于不同任务，需要建立标注数据，通过标注数据训练与标注数据相关的实体识别模型。如图1所示，图1为现有技术中模型训练的示意图，任务a中标注的身体和疾病数据，通过序列标注的方法，甲状腺外科诊治甲状腺肿瘤通过编码器依次标注为“甲：b-身体；状：i-身体；腺：i-身体；外：o；科：o；诊：o；治：o；甲：b-疾病；状：i-疾病；腺：i-疾病；肿：i-疾病；瘤：i-疾病；”由于缺乏“科室”的标注信息，上述标注在任务b中不能复用；由于不同的任务中存在不同的实体，对于新的任务需要重新标注训练数据和训练新的模型，如任务a中，预先定义的实体类型为：身体和疾病，那在该模型中，只能识别身体和疾病实体，无法识别新的“科室”实体，对于任务b需要进行重新标注实体和训练模型，甲状腺肿大挂甲状腺外科通过编码器依次标注为“甲：b-疾病；状：i-疾病；腺：i-疾病；肿：i-疾病；大：i-疾病；挂：o；甲：b-科室；状：i-科室；腺：i-科室；外：i-科室；科：i-科室；。：o；”因此实体识别模型缺乏学习能力，无法识别新的实体。为此，就需要针对不同的应用任务训练不同的医疗实体识别模型。显然，训练大量的医疗实体识别模型存在效率低、成
本高和数据利用率低等问题。
48.经过研究发现，在模型训练阶段，可以通过引入目标实体属性信息，并且在不同任务中复用待训练数据，使得同一套训练数据可以被不同的任务使用，提升数据使用效率，并且提高模型在不同任务中识别新类型实体的能力。
49.本技术实施例提供了医疗实体识别模型的训练方法。所述方法包括：获取待训练数据；获取目标实体属性信息，所述目标实体属性信息用于指示实体的属性；根据目标实体属性信息，利用所述训练数据训练实体识别模型，所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。本技术在模型训练阶段，通过引入目标实体属性信息，并且在不同任务中复用待训练数据，使得同一套训练数据可以被不同的任务使用，提升数据使用效率，并且提高模型在不同任务中识别新类型实体的能力。
50.为了解决上述问题，本技术实施例还提供了一种医疗实体识别模型的训练方法、医疗实体识别方法及装置。其中，所述医疗实体识别模型的训练方法、医疗实体识别方法可以用于对医疗实体识别模型的训练装置进行训练或医疗实体识别装置进行实体识别。其中，所述医疗实体识别模型的训练装置或医疗实体识别装置可以运行于计算机或计算机集群。
51.参见图2，该图为本技术实施例提供的医疗实体识别模型的训练方法的流程图。结合图2所示，本技术实施例提供的医疗实体识别模型的训练方法，可以包括：
52.步骤101，获取待训练数据。
53.在本实施中，医疗实体识别模型的训练装置获取待训练的数据，所述待训练数据可以是电子病历、医学文献、客户咨询等非结构数据，例如电子病历中连续的文本信息，所述文本信息中包括医疗命名实体，所述医疗命名实体可以包括如疾病、手术、药品、检验检查等。例如，待训练数据可以是文本信息：甲状腺外科诊治甲状腺肿瘤；其中，医疗实体包括甲状腺肿瘤。
54.步骤102，获取目标实体属性信息，所述目标实体属性信息用于指示实体的属性。
55.在本实施例中，医疗实体识别模型的训练装置获取目标实体属性信息，所述目标实体属性信息用于指示实体的属性。可以理解的是，目标实体属性信息即实体的含义，例如：甲状腺的目标实体属性信息可以是身体部位，也就是说，目标实体属性信息指向某一实体具体的实体意义。
56.可选地，所述目标实体属性信息包括以下任意一项或多项：实体类型、实体类型的定义和实体类型的样例。
57.在一个具体的实施例中，所述目标实体属性信息可以包含多种形式，如实体类型、实体类型的定义或者实体类型的样例等。例如：输入语句：甲状腺外科诊治甲状腺肿瘤；目标实体属性信息包括：a、实体类型：疾病；b、疾病是与特定症状及医学征象相关的“医疗状况”或“身体疾病”；c、传染病、良性肿瘤、恶性肿瘤、神经系统疾病、呼吸系统疾病等。在本实施例中，通过多种形式目标实体属性信息，有效提高模型识别新类型实体的能力，使得模型能够真正学习到文本这种的语义信息。
58.步骤103，根据目标实体属性信息，利用所述训练数据训练实体识别模型，所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。
59.在本实施例中，根据目标实体属性信息，利用训练数据对医疗实体识别模型进行
训练。如图3所示，图3为本技术实施例模型训练的一种示意图，在医疗实体识别模型训练阶段，基于训练任务a的数据：甲状腺外科诊治甲状腺肿瘤；预先输入目标实体属性信息：身体部位和/或疾病；训练识别模型基于目标实体识别模型生成具有目标实体属性信息标识的实体语义识别结果为“身体部位：甲状腺；疾病：甲状腺肿瘤”。
60.需要说明的是，所述目标实体属性信息标识的实体语义识别结果是分别独立生成的。所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。
61.在一个具体的实施例中，所述目标实体属性信息是预先输入在模型中，一种可能的实现方式中，所述目标实体属性信息输入不受训练数据的限制，在本技术的医疗实体识别模型中可以尽可能多的列举不同训练任务中的目标实体属性信息，例如：接上述举例，如图3所示，预先输入目标实体属性信息可以包括：科室、医院等，当基于训练任务b进行训练模型时，训练识别模型基于目标实体识别模型生成具有目标实体属性信息标识的实体语义识别结果：科室：甲状腺外科；疾病：甲状腺肿大。可以理解的是，在此训练任务中，任务a中的疾病这一目标实体属性信息被复用在任务b中，提升了数据的使用效率，并且由于目标实体属性信息包括科室、医院等训练任务a中不包括的数据，因此训练在任务b中识别出基于目标实体属性信息科室、医院的新实体。
62.在上述实施例中，通过引入目标实体属性信息，可以复用在不同任务中，有效利用不同任务下的各种标注数据,提升数据使用效率，并且提高模型在不同任务中识别新类型实体的能力。
63.参见图4，图4为上述步骤103根据目标实体属性信息，利用所述训练数据训练实体识别模型一种可选的实现方式流程图。
64.步骤1031，根据目标实体属性信息对所述待训练数据进行数据格式转换，得到数据格式转换后的待训练数据；所述数据格式转换后的待训练数据为多条具有不同目标实体属性信息标注的待训练数据。
65.在本实施例中，根据目标实体属性信息对所述待训练数据进行数据格式转换，得到数据格式转换后的待训练数据；示例如下表1：
66.表1
67.待训练数据:甲状腺外科诊治甲状腺肿瘤数据格式转换后的待训练数据1:甲状腺外科诊治甲状腺肿瘤；目标实体属性信息1:身体部位数据格式转换后的待训练数据2:甲状腺外科诊治甲状腺肿瘤；目标实体属性信息2:疾病
68.参见表1，当待训练数据为“甲状腺外科诊治甲状腺肿瘤”，通过数据格式转换后的待训练数据1为“甲状腺外科诊治甲状腺肿瘤”，对应的目标实体属性信息1为“身体部位”，同理数据格式转换后的待训练数据2为“甲状腺外科诊治甲状腺肿瘤”，对应的目标实体属性信息2为“疾病”，在上述示例中，基于不同的目标实体属性信息，将训练数据转换为多条具有不同目标实体属性信息标注的待训练数据。
69.步骤1032，利用所述格式转换后的待训练数据训练实体识别模型。
70.在本实施例中，利用上述格式转换后的待训练数据训练实体识别模型。
71.表2
72.待训练数据:甲状腺外科诊治甲状腺肿瘤数据格式转换后的待训练数据1:甲状腺外科诊治甲状腺肿瘤；目标实体属性信息1:身体部位训练模型识别实体语义1:身体部位：甲状腺；数据格式转换后的待训练数据2:甲状腺外科诊治甲状腺肿瘤；目标实体属性信息2:疾病训练模型识别实体语义2:疾病：甲状腺肿瘤；
73.结合表2所示，接上述举例，基于格式转换后多条具有不同目标实体属性信息标注的待训练数据，训练医疗实体识别模型生成训练模型识别实体语义1：身体部位：甲状腺；训练模型识别实体语义2：疾病：甲状腺肿瘤。可以理解的是，上述示例只是本实施例一种可能的实现方式，对于具体的目标实体属性信息及格式本实施例中不做限定。
74.在上述实施例中，通过数据处理转换，对于不同任务数据，转为模型所需的数据格式，在提高数据利用率的同时提升模型识别新实体的能力。
75.可选地，上述利用所述格式转换后的待训练数据训练实体识别模型包括：利用所述格式转换后的待训练数据，对于待训练数据中不存在的目标实体属性信息对应实体，训练医疗实体识别模型生成基于目标实体属性信息识别的负样本；示例如下，接上述举例：
76.数据格式转换后的待训练数据3:甲状腺外科诊治甲状腺肿瘤；
77.目标实体属性信息:药品
78.训练模型识别实体语义：药品：无；
79.数据格式转换后的待训练数据4:甲状腺外科诊治甲状腺肿瘤；
80.目标实体属性信息:医院
81.训练模型识别实体语义：药品：无；
82.上述实施例中，训练模型生成基于目标实体属性信息识别的负样本，提升模型对错误属性实体的识别能力。
83.参见图5，该图为本技术实施例提供的一种医疗实体识别方法的流程图。结合图2所示，本技术实施例提供的医疗实体识别方法，可以包括：
84.步骤201，获取待处理的文本数据；
85.步骤202，获取目标实体属性信息，所述目标实体属性信息用于指示实体的属性；
86.步骤203，根据实体识别模型，基于所述目标实体属性信息，对所述待处理的文本数据进行识别，得到实体识别结果，所述实体识别结果对应的实体的属性与所述目标实体属性信息所指示的属性相匹配。
87.基于上述实施例提供的一种医疗实体识别模型的训练方法，本技术实施例还提供了一种医疗实体识别模型的训练装置。下面分别结合实施例和附图，对该医疗实体识别模型的训练装置进行描述。
88.图6是本技术实施例提供的一种医疗实体识别模型的训练装置结构示意图，结合图6所示，本技术实施例提供的医疗实体识别模型的训练装置600，可以包括：
89.第一获取模块601，获取待训练数据；
90.第二获取模块602，获取目标实体属性信息，所述目标实体属性信息用于指示实体
的属性；
91.训练模块603，根据目标实体属性信息，利用所述训练数据训练实体识别模型，所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。
92.可选地，所述装置包括：
93.转换单元，根据目标实体属性信息对所述待训练数据进行数据格式转换，得到数据格式转换后的待训练数据；所述数据格式转换后的待训练数据为多条具有不同目标实体属性信息标注的待训练数据；
94.第一训练单元，利用所述格式转换后的待训练数据训练实体识别模型。
95.基于上述实施例提供的一种医疗实体识别模型的训练方法，本技术实施例还提供了一种医疗实体识别模型的训练装置。下面分别结合实施例和附图，对该医疗实体识别模型的训练装置进行描述。
96.图7是本技术实施例提供的一种医疗实体识别装置结构示意图，结合图7所示，本技术实施例提供的医疗实体识别装置700，可以包括：
97.第三获取模块701，获取待处理的文本数据；
98.第四获取模块702，获取目标实体属性信息，所述目标实体属性信息用于指示实体的属性；
99.识别模块703，根据实体识别模型，基于所述目标实体属性信息，对所述待处理的文本数据进行识别，得到实体识别结果，所述实体识别结果对应的实体的属性与所述目标实体属性信息所指示的属性相匹配。
100.本技术实施例还提供了一种电子设备，包括：处理器、存储器、系统总线；
101.所述处理器以及所述存储器通过所述系统总线相连；
102.所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述医疗实体识别模型的训练方法的任一实现方式，或者，上述医疗实体识别方法任一实现方式。
103.本技术实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述的医疗实体识别模型的训练方法的任一实现方式，或者，上述医疗实体识别方法的任一实现方式。
104.通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者诸如媒体网关等网络通信设备，等等)执行本技术各个实施例或者实施例的某些部分所述的方法。
105.需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置及设备实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置及设备实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元提示的
部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。
106.以上所述，仅为本技术的一种具体实施方式，但本技术的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本技术揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本技术的保护范围之内。因此，本技术的保护范围应该以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：袁晟君吴汇哲
技术所有人：太保科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。