一种疾病分期识别方法以及装置与流程

文档序号：24730305发布日期：2021-04-20 13:02阅读：200来源：国知局

1.本发明属于医疗数据处理技术领域，尤其涉及一种疾病分期识别方法以及装置。

背景技术：

2.疾病分期是病人病情的一项重要信息，例如肿瘤分期是肿瘤病人病情的一项重要信息，通常只针对于恶性肿瘤。肿瘤分期根据个体内原发肿瘤以及播散程度来描述恶性肿瘤的严重程度和受累范围，是一个评价体内恶性肿瘤的数量和位置的过程，对病人的后续治疗具有重要的指导作用。
3.恶性肿瘤最常用的分期为tnm分期。其中，tnm分期是肿瘤学中对肿瘤的一种分期形式。具体地，t(tumor)是原发灶，n(lymphnode)是淋巴结，m(metastasis)是远处转移。tnm分期是由法国人pierre denoix首先于1943年至1952年间提出，后来美国癌症联合委员会(ajcc，american joint committee on cancer)和国际抗癌联盟(uicc，union for international cancer control)逐步开始建立国际性的分期标准。
4.目前，对于病人tnm分期的识别和判断，主要是基于病人的病理检查信息和影像检查信息，由有经验的肿瘤医生进行识别，这个过程不仅非常依赖于医生的经验，而且需要消耗大量的人力和时间，导致人工成本高昂，识别速度缓慢。

技术实现要素：

5.有鉴于此，本发明实施例提供了一种疾病分期识别方法以及装置，以解决现有技术中通过人工识别疾病分期存在的人工成本高昂、识别速度缓慢的技术问题。
6.本发明实施例的第一方面提供了一种疾病分期识别方法，包括：
7.获取病例信息；
8.根据预设的医学特征模型，获取所述病例信息中的实体和实体关系；
9.根据所述实体和实体关系，获取所述病例信息中的医学特征；
10.根据所述医学特征，确定疾病分期。
11.本发明实施例的第二方面提供了一种疾病分期识别装置，包括：
12.病例信息获取模块，用于获取病例信息；
13.第一获取模块，用于根据预设的医学特征模型，获取所述病例信息中的实体和实体关系；
14.第二获取模块，用于根据所述实体和实体关系，获取所述病例信息中的医学特征；
15.疾病分期确定模块，用于根据所述医学特征，确定疾病分期。
16.本发明实施例的第三方面提供了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述的疾病分期识别方法。
17.本发明实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述的疾病分期识别方法。
18.本发明实施例与现有技术相比存在的有益效果至少在于：
19.(1)通过预先建立医学特征模型，根据医学特征模型自动获取病例信息中的医学特征，并可以根据医学特征确定病人对应的疾病分期，整个过程自动完成，无需依赖医生的经验，可以大大减少人力和时间的投入，降低成本，提高识别速度。
20.(2)传统的直接通过机器学习分类文本方式需要依赖大量的标注数据，并且结果不可解释，从而无法知晓获得最终结论的原因。而本实施例提供的疾病分期识别方法可以自动阅读病例信息，给出病人的疾病分期以及得到该疾病分期的原因，疾病分期的结果可解释，并且依赖的标注数据量少，有助于降低成本。
21.(3)对于大量病人的历史病理检查和影像检查结果，本实施例提供的疾病分期识别方法可以进行批量处理，且支持回顾性研究，可以大大提高处理效率。
22.(4)本实施例提供的疾病分期识别方法给出的疾病分期可以辅助医生进行诊断，提高医生的诊断速度，减少医生的工作量；也可以支持病人自主理解病情，给出初步结论，让病人对自身病情有一个初步、概要的认识，具有广泛的使用前景。
附图说明
23.为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。
24.图1是本发明实施例提供的疾病分期识别方法的实现流程示意图一；
25.图2是本发明实施例提供的疾病分期识别方法的实现流程示意图二；
26.图3是本发明实施例提供的疾病分期识别方法中获取病例信息中的实体和实体关系的实现流程图；
27.图4是本发明实施例提供的疾病分期识别方法中识别病例信息中的实体的实现流程图；
28.图5是本发明实施例提供的疾病分期识别方法中获取实体间的实体关系的实现流程图；
29.图6是本发明实施例提供的疾病分期识别方法中二分类模型的结构示意图；
30.图7是本发明实施例提供的疾病分期识别方法中医学指南的关于乳腺癌t分期的描述示意；
31.图8是本发明实施例提供的疾病分期识别装置的示意图一；
32.图9是本发明实施例提供的疾病分期识别装置的示意图二；
33.图10是本发明实施例提供的疾病分期识别装置中第一获取模块的示意图；
34.图11是本发明实施例提供的终端设备的示意图。
具体实施方式
35.以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本发明实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中，省略对众所周知的系统、装置、电
路以及方法的详细说明，以免不必要的细节妨碍本发明的描述。
36.为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。
37.请参阅图1，本实施例提供了一种疾病分期识别方法，包括：
38.步骤s20：获取病例信息。
39.在获得病人的疾病分期之前，需要获取病人的病例信息。一份病例信息中通常可以包括很多类型的长文本信息，例如现病史、既往史、影像检查、病理检查、上级查房记录、每日查房记录以及诊疗过程等。当然，病例信息可以仅包括上述的长本文信息中的一种，也可以包括多种，还可以包括其他类型的文本信息，此处不做限制。病人的病例信息的来源可以包括多种形式，例如可以从各个医院的病例库中提取相关的病例信息，也可以是其他整合或者搜集了诸多病例的病例库中提取的病例信息。
40.步骤s30：根据预设的医学特征模型，获取所述病例信息中的实体和实体关系。
41.在本实施例中，医学特征也可称为医学概念，疾病分期的医学表示需要依赖一些特定的医学概念(例如是否原位癌、某个部位淋巴结转移个数、骨转移等)。因此在确定疾病分期时，需要首先识别病例信息中的医学特征，从而可以根据医学特征来确定疾病分期。
42.在获取医学特征时，可以根据预设的医学特征模型来确定疾病分期所依赖的医学特征，即预设的医学特征模型中包含了疾病分期与医学特征之间的对应关系。例如，肿瘤分期可以分为t分期、n分期和m分期，而上述的是否原位癌与t分期相对应，某个部位淋巴结转移个数与n分期相对应，骨转移(远处转移部位)与m分期相对应。
43.为了能够通过预设的医学特征模型来获取病例信息中的实体和实体关系,进而根据实体和实体关系来获取医学特征，需要首先获取预设的医学特征模型，因此，请参阅图2，在步骤s30之前，还包括：
44.步骤s10：根据医学指南，获取预设的医学特征模型，所述预设的医学特征模型包括疾病分期所依据的医学特征。
45.在构建预设的医学特征模型时，可以是医学专家针对特定疾病拆解最新医学指南中关于疾病分期的医学表示，该医学表示依赖特定的医学特征。以肿瘤为例，在进行拆解时，医学概念的组织形式可以是属性结果关联属性，也可以是平铺的字段信息。其中医学指南可以根据需要进行选择，例如可以是nccn(national comprehensive cancernetwork，美国国立综合癌症网络，是美国21家顶尖肿瘤中心组成的非营利性学术组织，其宗旨是为在全球范围内提高肿瘤服务水平，造福肿瘤患者)指南，nccn指南是美国国立综合癌症网络每年发布的各种恶性肿瘤临床实践指南，得到了全球临床医师的认可和遵循。当然，医学指南还可以是csco(中国抗癌协会临床肿瘤学协作专业委员会)发布的指南，此处不做限制。
46.肿瘤医学特征主要包括如下几类特征类型：
47.是否型，即是否某个结论，例如：是否原位癌，有无皮肤侵犯等；
48.数值型，即某项值是多少，例如：肿瘤大小最大径多少，某个部位淋巴结转移个数等；
49.特征型，即远处转移部位，例如：骨转移，肝转移等。
50.以乳腺癌为例，使用最新的nccn指南(2018v3)，可以拆解出容易理解的医学特征如下表一所示：
51.表一
[0052][0053]
因此，在建立了预设的医学特征模型后，可以获得疾病分期所依据的医学特征，从而可以根据该医学特征模型来获取病例信息中的医学特征。当然，这里的疾病不仅包括肿瘤，还可以包括其他类型的疾病，此处不做限制。
[0054]
请参阅图3，进一步地，步骤s30中获取所述病例信息中的医学特征时，可以包括如下步骤：
[0055]
步骤s31：根据所述预设的医学特征模型，识别所述病例信息中的实体。
[0056]
预设的医学特征模型中包含了某种疾病的疾病分期所依赖的医学特征，因此对于一个获取的病例信息，可以根据该预设的医学特征模型来识别其中包括哪些实体。此处的实体可以包括名词实体(例如原位癌)、形容词实体(例如炎症性)、动词实体(例如侵犯)、数值(例如3.5cm)以及否定词等。请参阅图4，识别病例信息中的实体可以通过如下步骤s311至步骤s313来实现。
[0057]
步骤s311：根据所述医学特征模型，确定所述病例信息所包含的特征类型。其中，特征类型至少包括是否型、数值型以及特征型中的一种。
[0058]
步骤s312：确定所述病例信息所包含的特征类型的子类型。
[0059]
具体地，可以判断病例信息中是否包含“是否型”，当特征类型包含是否型时，则确定是否型包含的子类型，是否型的子类型至少包括名词型、形容词型以及动词型中的一种。也可以判断病例信息中是否包含“数值型”，当特征类型包含数值型，则确定数值型包含的
子类型，数值型的子类型至少包括名词型以及动词型中的一种。还可以判断特征类型是否包含“特征型”，当特征类型包含特征型，则确定特征型包含的子类型，特征型的子类型至少包括关键值(key-value)型。
[0060]
步骤s313：根据特征类型的子类型，识别病例信息中的实体。
[0061]
具体地，对于特征类型为“是否型”时，需要根据是否型的子类型来识别相应的实体。当是否型的子类型包含名词型时，则根据该名词型识别病例信息中的实体，实体至少包括名词实体和否定词。当是否型的子类型包含形容词型时，则根据该形容词型识别病例信息中的实体，实体至少包括名词实体、形容词和否定词。当是否型的子类型包含动词型时，则根据动词型识别病例信息中的实体，实体至少包括名词实体、动词实体和否定词。
[0062]
对于特征类型为“数值型”时，需要根据数值型的子类型来识别相应的实体。当数值型的子类型包含名词型时，则根据该名词型识别病例信息中的实体，实体至少包括名词实体、数值和否定词。当数值型的子类型包含动词型时，则根据该动词型识别病例信息中的实体，实体至少包括动词实体、数值和否定词。对于特征类型为“特征型”时，需要根据特征型的子类型来识别相应的实体。当特征型的子类型包含关键值型时，则根据该关键值型识别病例信息中的实体，实体至少包括名词实体、动词实体和否定词。
[0063]
例如，对于病例信息中的文本“是否原位癌”，其对应的特征类型为“是否型”，对应的子类型为“名词型”，因此识别的实体包括名词实体(原位癌)和否定词。
[0064]
对于病例信息中的文本“是否炎症性乳腺癌”，其对应的特征类型为“是否型”，对应的子类型为“形容词型”，因此识别的实体包括名词实体(乳腺癌)、形容词型(炎症性)和否定词。
[0065]
对于病例信息中的文本“是否胸壁侵犯”，其对应的特征类型为“是否型”，对应的子类型为“动词型”，因此识别的实体包括名词实体(胸壁)、动词型(侵犯)和否定词。
[0066]
对于病例信息中的文本“肿瘤最大径淋巴结转移个数”，其对应的特征类型为“数值型”，对应的子类型为“名词型”，因此识别的实体包括名词实体(肿瘤部位)、数值(2.3*3.5cm)和否定词。
[0067]
对于病例信息中的文本“浸润深度”，其对应的特征类型为“数值型”，对应的子类型为“动词型”，因此识别的实体包括动词实体(浸润)、数值(3.5cm)和否定词。
[0068]
对于病例信息中的文本“远处转移部位”，其对应的特征类型为“特征型”，对应的子类型为“key-value型”，因此识别的实体包括名词实体(肝)、动词实体(转移)和否定词。
[0069]
步骤s32：根据所述实体，获取所述实体间的实体关系。
[0070]
在获取了病例信息中的实体后，需要获取实体间的实体关系，从而为后续获取医学特征提供依据。在本实施例中，依据特征类型的不同以及子类型的不同，获取实体间的实体关系的方式也不相同。实体关系的识别方法可以是人工编写的规则函数，也可以是中文依存的句法分析，还可以是分类特征的不同组合形式等。
[0071]
请参阅图5，在本实施例中，步骤s32可以具体包括：
[0072]
步骤s321：根据所述特征类型的子类型，对所述实体进行分类，以获得不同类别的实体。此处的类别可以是名词实体、形容词实体、动词实体、数值实体以及否定词等，还可以其他类型，此处不做限制。
[0073]
步骤s322：根据不同类别的所述实体，构建至少一种实体关系。
[0074]
例如，当特征类型包含“是否型”，子类型为“名词型”时，实体包括名词实体和否定词，则采用否定词修饰名词实体，以获得第一实体关系r1。例如，对于病例信息中的文本“是否原位癌”，识别的实体关系包括r1：否定词e2修饰名词实体e1。
[0075]
当特征类型包含“是否型”，子类型为“形容词型”时，实体包括名词实体、形容词实体和否定词，则采用形容词实体修饰名词实体以获得第二实体关系r2，且采用否定词修饰形容词实体以获得第三实体关系r3。例如，对于病例信息中的文本“是否炎症性乳腺癌”，识别的实体关系包括r2：形容词实体e2修饰名词实体e1，以及r3：否定词e3修饰形容词实体e2。
[0076]
当特征类型包含“是否型”，子类型为“动词型”时，实体包括名词实体、动词实体和否定词，则采用动词实体修饰名词实体以获得第四实体关系r4，且采用否定词修饰动词实体以获得第五实体关系r5。例如，对于病例信息中的文本“是否胸壁侵犯”，识别的实体关系包括r4：动词实体e2修饰名词实体e1，以及r5：否定词e3修饰动词实体e2。
[0077]
当特征类型包含“数值型”，子类型为“名词型”时，实体包括名词实体、数值和否定词，则采用数值修饰名词实体以获得第六实体关系r6，且采用否定词修饰数值以获得第七实体关系r7。例如，对于病例信息中的文本“肿瘤最大径淋巴结转移个数”，识别的实体关系包括r6：数值e2修饰名词实体e1，以及r7：否定词e3修饰数值e2。
[0078]
当特征类型包含“数值型”，子类型为“动词型”时，实体包括动词实体、数值和否定词，则采用数值修饰动词实体以获得第八实体关系r8，且采用否定词修饰数值以获得第九实体关系r9。例如，对于病例信息中的文本“浸润深度”，识别的实体关系包括r8：数值e2修饰名词实体e1，以及r9：否定词e3修饰数值e2。
[0079]
当特征类型包含“特征型”，子类型为“key-value型”时，实体包括名词实体、动词实体和否定词，则采用动词实体修饰名词实体以获得第十实体关系r10，且采用否定词修饰动词实体以获得第十一实体关系r11。例如，对于病例信息中的文本“远处转移部位”，识别的实体关系包括r10：动词实体e2修饰名词实体e1，以及r11：否定词e3修饰动词实体e2。
[0080]
请参阅图1和图2，在获得实体间的实体关系以后，可以进行下述步骤：
[0081]
步骤s40：根据所述实体和实体关系，获取所述病例信息中的医学特征。
[0082]
在本实施例中，在获取病例信息中的医学特征时，可以首先确认不同类别的实体是否存在，同时确认实体关系是否成立，并根据不同类别的实体是否存在以及实体关系是否成立，获取病例信息中的医学特征。
[0083]
在该步骤中，可以采用二分类模型来确定上述的实体关系是否成立，从而确定对应的医学特征。二分类模型可以通过训练获得，即预先通过不同的实体关系分别对二分类模型进行训练，然后通过训练好的二分类模型对实体关系是否成立进行确定。
[0084]
在本实施例中，二分类模型的训练的结构如图6所示。采用svm(support vectormachine，支持向量机，是一类按监督学习方式对数据进行二元分类的广义线性分类器)或者决策树模型，用到的特征从实体所在的上下文包含信息如下(此处考虑a是左边的实体，b是右边的实体)。
[0085]
其中：特征集合包括a/b本身特征、周边文本特征、依存分析特征以及句子形态特征等；
[0086]
a/b本身特征：a本身包含的信息，如a是否身体部位、是否病变等；b本身包含的信
息；
[0087]
a左边文本特征：原文本中a左边的文本特征，该部分文本中：
[0088]
(a)同一逗号句子内是否有否定词、是否有转折连词、是否有时间等；
[0089]
(b)同一句号句子内是否有上述信息；
[0090]
(c)之一到文本开头是否有上述信息。
[0091]
b右边文本特征：原文本中b左边的文本特征，该部分文本中：
[0092]
(a)同一逗号句子内是否有否定词、是否有转折连词、是否有时间等；
[0093]
(b)同一句号句子内是否有上述信息；
[0094]
(c)之一到文本结尾是否有上述信息。
[0095]
ab之间文本特征：a和b之间的文本特征，该部分文本中：
[0096]
句号个数、逗号个数、转折词个数、并列词个数、a同类实体个数、b同类实体个数等。
[0097]
在采用上述方式确定上述的实体关系是否成立后，需要结合实体来进行实体消歧，从而获得相应的医学特征。实体消歧的具体过程可参考下述方式：
[0098]
当特征类型包含“是否型”，子类型为“名词型”时，实体包括名词实体e1和否定词e2，且实体关系包括第一实体关系r1；实体消歧的规则为：若名词实体e1存在，且第一实体关系r1不成立，则输出是，以获得对应的医学特征(是原位癌)；当为其他情形时，则输出否，此时则没有医学特征(不是原位癌)。
[0099]
当特征类型包含“是否型”，子类型为“形容词型”时，实体包括名词实体e1、形容词实体e2和否定词e3，且实体关系包括第二实体关系r2和第三实体关系r3；实体消歧的规则为：若名词实体e1和形容词实体e2存在，第二实体关系r2成立，且第三实体关系r3不成立，则输出是，以获得对应的医学特征(是炎症性乳腺癌)；当为其他情形时，则输出否，此时则没有医学特征(不是炎症性乳腺癌)。
[0100]
当特征类型包含“是否型”，子类型为“动词型”时，实体包括名词实体e1、动词实体e2和否定词e3，且实体关系包括第四实体关系r4和第五实体关系r5；实体消歧的规则为：若名词实体e1和动词实体e2存在，第四实体关系r4成立，且第五实体关系r5不成立，则输出是，以获得对应的医学特征(是胸壁侵犯)；当为其他情形时，则输出否，此时则没有医学特征(不是胸壁侵犯)。
[0101]
当特征类型包含“数值型”，子类型为“名词型”时，实体包括名词实体、e1、数值e2和否定词e3，且实体关系包括第六实体关系r6和第七实体关系r7；实体消歧的规则为：若名词实体e1和数值e2存在，第六实体关系r6成立，且第七实体关系r7不成立，则输出数值e2，以获得对应的医学特征；当为其他情形时，则不输出，此时则没有医学特征。
[0102]
当特征类型包含“数值型”，子类型为“动词型”时，实体包括动词实体e1、数值e2和否定词e3，且实体关系包括第八实体关系r8和第九实体关系r9；实体消歧的规则为：若动词实体e1和数组e2存在，第八实体关系r8成立，且第九实体关系r9不成立，则输出数值e2，以获得对应的医学特征；当为其他情形时，则不输出，此时则没有医学特征。
[0103]
当特征类型包含“特征型”，子类型为“key-value型”时，实体包括名词实体e1、动词实体e2和否定词e3，且实体关系包括第十实体关系r10和第十一实体关系r11；实体消歧的规则为：若名词实体e1和动词实体e2存在，第十实体关系r10成立，且第十一实体关系r11
不成立，则输出名词实体e1，以获得对应的医学特征；当为其他情形时，则不输出，此时则没有医学特征。
[0104]
在一个实施例中，当病例信息中的文本信息包括至少两条文本信息(例如同时包括病例检查报告和影像检查报告)时，还需要对从各个文本信息中所获得的医学特征进行融合，从而确保后续进行疾病分期的确定时更加准确。请参阅图2，此时步骤s40后还包括：
[0105]
步骤s50：将所述病例信息中不同文本信息所对应的医学特征进行融合，以获得所述病例信息的医学特征。
[0106]
当然，当病例信息中的文本信息仅包括一条文本信息时，此时则可以不涉及文本信息多来源的融合，从而在获取了医学特征后，进行下述步骤s60。
[0107]
步骤s60：根据所述医学特征，确定疾病分期。
[0108]
在确定疾病分期时，可以根据识别的医学特征，结合对应的医学指南中疾病分期所依赖的医学特征，按图索骥，从而可以获得相应的疾病分期。例如，医学指南中关于乳腺癌t分期的描述如图7所示。
[0109]
本实施例提供的疾病分期识别方法的有益效果至少在于：
[0110]
(1)本实施例通过预先建立医学特征模型，根据医学特征模型自动获取病例信息中的医学特征，并可以根据医学特征确定病人对应的疾病分期，整个过程自动完成，无需依赖医生的经验，可以大大减少人力和时间的投入，降低成本，提高识别速度。
[0111]
(2)传统的直接通过机器学习分类文本方式需要依赖大量的标注数据，并且结果不可解释，从而无法知晓获得最终结论的原因。而本实施例提供的疾病分期识别方法可以自动阅读病例信息，给出病人的疾病分期以及得到该疾病分期的原因，疾病分期的结果可解释，并且依赖的标注数据量少，有助于降低成本。
[0112]
(3)对于大量病人的历史病理检查和影像检查结果，本实施例提供的疾病分期识别方法可以进行批量处理，且支持回顾性研究，可以大大提高处理效率。
[0113]
(4)本实施例提供的疾病分期识别方法给出的疾病分期可以辅助医生进行诊断，提高医生的诊断速度，减少医生的工作量；也可以支持病人自主理解病情，给出初步结论，让病人对自身病情有一个初步、概要的认识，具有广泛的使用前景。
[0114]
以下给出一种具体的实施例，用于对本实施例提供的疾病分期识别方法进行说明。下面以肿瘤最大径为例进行说明，肿瘤最大径可能出现在病理检查、影像检查、现病史、病程、出院小结中，通常以3.5cm*2.4cm*3.0cm等描述肿瘤尺寸形式存在。
[0115]
对于下面的病例信息：“部分乳腺切除标本，大小4.5*4*3cm，切面见一肿物，范围1.5*1*0.8cm，质稍硬，界不清。送检袋装下切缘：灰黄色脂肪样组织一枚，大小2*1.5*0.3cm，其一端扎线。”[0116]
对于上述的病例信息，首先进行文本分词，对其中的实体进行识别。其中：
[0117]
e1：肿瘤部位描述，根据肿瘤的不同可通过一个序列标注模型识别，例如如rnn(循环神经网络)、crf(条件随机场)等。
[0118]
本实施中，e1：肿物。
[0119]
e2：数值，可通过正则表达式对数值进行识别。
[0120]
本实施例中，e2：4.5*4*3cm，1.5*1*0.8cm，2*1.5*0.3cm
[0121]
e3：否定词，通过词表进行识别
[0122]
本实施例中，e3：不
[0123]
然后进行实体关系识别。本实施例中所有可能的实体关系如下：
[0124]
r1:数值修饰肿瘤部位
[0125]
(4.5*4*3cm，肿物)；
[0126]
(1.5*1*0.8cm，肿物)；
[0127]
(2*1.5*0.3cm，肿物)；
[0128]
r2:否定词修饰数值
[0129]
(不，4.5*4*3cm)；
[0130]
(不，1.5*1*0.8cm)；
[0131]
(不，2*1.5*0.3cm)；
[0132]
然后采用二分类模型预测上述修饰关系是否成立，从而可以获得实体关系分类结果。最后再进行肿瘤分期的确定。
[0133]
应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。
[0134]
请参阅图8，本实施例的目的还在于提供一种疾病分期识别装置，包括病例信息获取模块72、第一获取模块73、第二获取模块74以及疾病分期确定模块76。其中，病例信息获取模块72用于获取病例信息；第一获取模块73用于根据预设的医学特征模型，获取所述病例信息中的实体和实体关系；第二获取模块74用于根据所述实体和实体关系，获取所述病例信息中的医学特征；疾病分期确定模块76用于根据所述医学特征，确定疾病分期。
[0135]
请参阅图9，进一步地，疾病分期识别装置还包括模型获取模块71，模型获取模块71用于根据医学指南，获取预设的医学特征模型，所述预设的医学特征模型包括疾病分期所依据的医学特征。
[0136]
请参阅图9，进一步地，疾病分期识别装置还包括融合模块75，用于将所述病例信息中不同文本信息所对应的医学特征进行融合，以获得所述病例信息的医学特征。
[0137]
请参阅图10，进一步地，第一获取模块73包括实体识别单元731以及实体关系获取单元732，其中实体识别单元731用于根据所述预设的医学特征模型，识别所述病例信息中的实体，实体关系获取单元732用于根据所述实体，获取所述实体间的实体关系。实体识别单元731在识别病例信息中的实体时，首先根据所述医学特征模型，确定所述病例信息所包含的特征类型，然后确定所述病例信息所包含的特征类型的子类型，再根据特征类型的子类型，识别病例信息中的实体。
[0138]
图11是本发明一实施例提供的终端设备的示意图。如图11所示，该实施例的终端设备8包括：处理器80、存储器81以及存储在存储器81中并可在处理器80上运行的计算机程序82。处理器80执行计算机程序82时实现上述各个疾病分期识别方法实施例中的步骤，例如图1至图5所示的步骤s10至步骤s60。
[0139]
示例性的，计算机程序82可以被分割成一个或多个模块/单元，一个或者多个模块/单元被存储在存储器81中，并由处理器80执行，以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序82在终端设备8中的执行过程。
[0140]
终端设备8可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端设备8可包括，但不仅限于，处理器80、存储器81。本领域技术人员可以理解，图11仅仅是终端设备8的示例，并不构成对终端设备8的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如终端设备8还可以包括输入输出设备、网络接入设备、总线等。
[0141]
处理器80可以是中央处理单元(central processing unit，cpu)，还可以是其它通用处理器、数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现场可编程门阵列(field-programmable gate array，fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0142]
存储器81可以是终端设备8的内部存储单元，例如终端设备8的硬盘或内存。存储器81也可以是终端设备8的外部存储设备，例如终端设备8上配备的插接式硬盘，智能存储卡(smart media card,smc)，安全数字(secure digital,sd)卡，闪存卡(flash card)等。进一步地，存储器81还可以既包括终端设备8的内部存储单元也包括外部存储设备。存储器81用于存储计算机程序以及终端设备8所需的其它程序和数据。存储器81还可以用于暂时地存储已经输出或者将要输出的数据。
[0143]
所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0144]
在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。
[0145]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。
[0146]
在本发明所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。
[0147]
作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的
部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0148]
另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0149]
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，计算机程序包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。
[0150]
以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：焦增涛
技术所有人：医渡云（北京）技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。