诊断数据识别方法及装置、电子设备、存储介质与流程

文档序号：30916776发布日期：2022-07-29 22:14阅读：109来源：国知局

1.本公开涉及医疗大数据技术领域，具体而言，涉及一种诊断数据识别方法、诊断数据识别装置、电子设备以及计算机可读存储介质。

背景技术：

2.为了准确获取用户的健康状态，需要识别用户的既往症。相关技术中，可根据一个周期内已赔付的医疗记录来标识既往症人群所对应的既往症，或者是人工识别用户的既往症。
3.上述方式中，可能存在漏识别或者是误识别的问题，覆盖范围不全面，识别准确性较低；人工方式的识别标准不一致，差异性较大且识别效率较低。
4.需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现要素：

5.本公开的目的在于提供一种诊断数据识别方法及装置、电子设备、存储介质，进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的识别准确性较差的问题。
6.本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。
7.根据本公开的第一方面，提供一种诊断数据识别方法，包括：通过历史医疗数据获取待处理对象的至少一个原始诊断数据；对各所述原始诊断数据进行标准化处理，获取各所述原始诊断数据对应的标准诊断数据；结合多个参考诊断数据以及所述标准诊断数据获取各所述原始诊断数据的候选诊断结果，并对所述候选诊断结果进行优化以确定所述待处理对象的目标诊断结果。
8.在本公开的一种示例性实施例中，所述对各所述原始诊断数据进行标准化处理，获取各所述原始诊断数据对应的标准诊断数据，包括：通过数据标准化模型将各所述原始诊断数据转换为标准诊断数据；其中，所述数据标准化模型包括知识库规则模型、机器学习模型以及深度学习模型中的任意一种。
9.在本公开的一种示例性实施例中，所述结合多个参考诊断数据以及所述标准诊断数据获取各所述原始诊断数据的候选诊断结果，包括：将所述标准诊断数据与所述多个参考诊断数据进行匹配，并根据匹配成功的参考诊断数据确定所述候选诊断结果。
10.在本公开的一种示例性实施例中，所述将所述标准诊断数据与所述多个参考诊断数据进行匹配，并根据匹配成功的参考诊断数据确定所述候选诊断结果，包括：将标准诊断数据与所述参考诊断数据中包含的所有诊断数据进行匹配，并将与标准诊断数据匹配成功的诊断数据所属的参考诊断数据作为候选诊断结果。
11.在本公开的一种示例性实施例中，所述对所述候选诊断结果进行优化以确定所述待处理对象的目标诊断结果，包括：对各所述原始诊断数据的所述候选诊断结果进行聚合，
获取中间诊断结果；根据原始诊断数据的诊断状态对所述中间诊断结果进行调整，以确定所述目标诊断结果。
12.在本公开的一种示例性实施例中，所述根据原始诊断数据的诊断状态对所述中间诊断结果进行调整，以确定所述目标诊断结果，包括：根据原始诊断数据的进展状态或诊断程度，对所述中间诊断结果进行调整，以确定所述原始诊断数据对应的所述目标诊断结果。
13.在本公开的一种示例性实施例中，所述方法还包括：若原始诊断数据不完整，根据辅助诊断数据对所述原始诊断数据进行补充，以更新所述原始诊断数据。
14.根据本公开的第二方面，提供一种诊断数据识别装置，包括：诊断数据获取模块，用于通过历史医疗数据获取待处理对象的至少一个原始诊断数据；标准化处理模块，用于对各所述原始诊断数据进行标准化处理，获取各所述原始诊断数据对应的标准诊断数据；诊断结果确定模块，用于结合多个参考诊断数据以及所述标准诊断数据获取各所述原始诊断数据的候选诊断结果，并对所述候选诊断结果进行优化以确定所述待处理对象的目标诊断结果。
15.根据本公开的第三方面，提供一种电子设备，包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的诊断数据识别方法。
16.根据本公开的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任意一项所述的诊断数据识别方法。
17.本公开实施例中提供的诊断数据识别方法、诊断数据识别装置、电子设备以及计算机可读存储介质中，一方面，通过将原始诊断数据进行标准化处理，进而进行既往症识别，能够避免只根据部分医疗记录进行目标诊断结果识别所导致的局限性，能够从待处理对象的原始诊断数据进行全面地精准识别，提高识别的准确性。另一方面，通过对待处理对象的原始诊断数据进行标准化处理，将原始诊断数据转换为对应的编码，进而结合参考诊断数据以及标准诊断数据获取候选诊断结果，进一步基于候选诊断结果确定目标诊断结果，能够从多个维度进行多粒度识别，实现目标诊断结果的自动识别，减少了操作量，提高了识别效率，且避免了标准不一致而导致的差异性，能够提高通用性。
18.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
19.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
20.图1示出了可以应用本公开实施例的诊断数据识别方法的系统架构的示意图。
21.图2示意性示出本公开实施例中一种诊断数据识别方法的示意图。
22.图3示意性示出本公开实施例中获取候选诊断结果的流程示意图。
23.图4示意性示出本公开实施例中确定候选诊断结果的示意图。
24.图5示意性示出本公开实施例中获取目标诊断结果的流程示意图。
25.图6示意性示出本公开实施例中对中间诊断结果进行优化的示意图。
26.图7示意性示出本公开实施例中确定目标诊断结果的示意图。
27.图8示意性示出本公开实施例中一种诊断数据识别装置的框图。
28.图9示意性示出本公开实施例中电子设备的框图。
具体实施方式
29.现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
30.此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
31.相关技术中，对于既往症识别的常用技术方法有以下两种：方式一、根据投保日期前几年内登记或享受当地职工门诊大病或城乡居民医保大病的人群，标识为既往症人群。方式二、依赖健康告知或用户提交病历资料，依靠核保人员人工识别是否为既往症。其中，以是否享受大病医保为识别既往症的标准，可能会造成一部分新发重疾的人从累计医疗费用或治疗项目角度不满足大病医保标准，但实际上已是既往症人群，因此识别具有局限性且不全面，导致识别结果不准确。依靠人工核保方式，通过病历或健康告知识别既往症，可能会造成标准不统一、效率低下的问题。
32.医疗领域中，关于同一种诊断、手术、药品、检查、化验、症状等往往会有成百上千种不同的写法。标准化要解决的问题就是为临床上各种不同说法找到对应的标准说法。临床术语标准化任务也是语义相似度匹配任务的一种。在术语标准化的基础上，才可进行后续的统计分析。
33.为了解决相关技术中的技术问题，本公开实施例中提供了一种诊断数据识别方法，可以应用于识别每一个待处理对象的既往症的应用场景。
34.图1示出了可以应用本公开实施例的诊断数据识别方法及装置的系统架构100的示意图。
35.如图1所示，客户端101可以为具有数据处理功能的设备，例如可以为智能手机、电脑、平板电脑、智能音箱、智能手表、车载设备、可穿戴设备等智能设备。服务器102可以为多个数据源，例如医疗机构的数据库、医院的数据库。服务器102也可以为存储医疗数据的存储设备，例如存储了所有医疗数据的手机。
36.本公开实施例中，客户端101可以从服务器102获取原始诊断数据103。接下来，对
原始诊断数据进行标准化处理得到对应的标准诊断数据104。进而根据标准诊断数据确定所述待处理对象的原始诊断数据103对应的目标诊断结果105。
37.需要说明的是，本公开实施例所提供的诊断数据识别方法可以由客户端101来执行。相应地，诊断数据识别方法可通过程序等方式设置于客户端101中。本公开实施例所提供的诊断数据识别方法也可以由服务器来执行，服务器可以为提供本公开实施例中诊断数据识别相关服务的后台系统，可以包括便携式计算机、台式计算机、智能手机等具有计算功能的一台电子设备或多台电子设备形成的集群。本公开实施例中，以诊断数据识别方法由客户端来执行为例进行说明。
38.接下来，参考图2对本公开实施例中的诊断数据识别方法进行详细说明。
39.在步骤s210中，通过历史医疗数据获取待处理对象的至少一个原始诊断数据。
40.本公开实施例中，待处理对象的类型具体可以根据应用场景而确定，不同应用场景对应的待处理对象的类型则不同。举例而言，当应用场景为保险场景时，待处理对象可以为待投保用户。当应用场景为其他购物场景时，待处理对象可以为消费者。本公开实施例中以应用场景为保险场景中的投保场景，待处理对象为待投保用户为例进行说明。
41.原始诊断数据可以为待处理对象的历史医疗数据中的疾病诊断数据。历史医疗数据可以为来源于各个医疗机构的医疗数据以及网络问诊的医疗数据，例如可以为时间周期内的医疗数据，时间周期例如可以为几年内。医疗机构可以包括各种类型的医疗结构，例如诊所、医院等等。历史医疗数据具体可以包括门诊医疗数据以及住院医疗数据。疾病诊断数据用于描述对待处理对象的健康症状进行判断的结果，疾病诊断数据例如可以为高血压、糖尿病等等。
42.示例性地，可以将历史医疗数据进行聚合提取，得到至少一个原始诊断数据。具体地，可以按照预设维度将所有的历史医疗数据进行整合，得到原始诊断数据。预设维度可以为时间周期、用户维度以及来源维度等等，来源维度可以理解为医疗机构维度。每一个病历数据对应的诊断数据均可以生成一个原始诊断数据。
43.本公开实施例中，可以将历史医疗数据对应的所有病历数据中记录的疾病关联数据进行提取，获取至少一个原始诊断数据。其中，一个病历数据可以生成一个原始诊断数据。对于待处理对象而言，其可能存在一个或多个病历数据，因此可以对应一个或多个原始诊断数据，且多个原始诊断数据中可以包含相同的诊断数据，此处相同的诊断数据指的是疾病类型相同。示例性地，可运用大数据计算工具将待处理对象的历史医疗数据中的疾病诊断数据进行提取，以生成至少一个原始诊断数据，且可以通过诊断结果列表来表示。大数据计算工具例如可以为spark。具体地，可以将病历数据中的疾病关联数据进行关键词提取，从而获取原始诊断数据。疾病关联数据可以为待处理对象的住院病历的主诊断数据、辅诊断数据、门诊病历中的诊断数据、网上问诊记录的诊断数据中的至少一种或其组合。
44.在得到原始诊断数据后，可以对原始诊断数据进行预处理，以便于后续处理。预处理可以包括清洗操作以及去重操作。其中，清洗操作可以包括但不限于拆分诊断名称（适用于多个诊断名称写在一条的情况）、去除诊断名称中的诊断序号、将字母大小写统一、去除冗余的标点等。去重操作指的是将至少一个原始诊断数据中所有相同的原始诊断数据删除，以减少数据量。
45.由于一个病历数据中可能存在多种诊断结果，因此在原始诊断数据中，可能存在
多个诊断结果连接组合成一个诊断结果的情况，例如“1.高血压2.糖尿病3.冠状动脉粥样硬化性心脏病”、“肺恶性肿瘤、肝硬化”等。基于此，为了提高准确性，可运用自然语言处理方式将原始诊断数据进行切分，得到多个原始诊断词来代替原始诊断数据。示例性地，可通过多种拆分方式对所述原始诊断数据进行拆分。多种拆分方式可以包括按照序号信息进行拆分或通过序列标注模型进行序列识别，从而对原始诊断数据进行拆分，以方便进行处理，同时避免不同诊断数据之间的相互影响。
46.在一些实施例中，若所述原始诊断数据中存在序号信息，则按照序号信息进行拆分；若原始诊断数据中不存在序号信息，则可根据序列标注模型进行序列识别，实现拆分。举例而言，若原始诊断数据中明确出现各种类型的序号（如1、i、一、(1)等），可根据序号编写正则规则进行多个诊断名称的拆分。例如“1.高血压2.糖尿病3.冠状动脉粥样硬化”直接可拆分为高血压、糖尿病、冠状动脉粥样硬化性心脏病。序列标注模型可以为bilstm-crt（双向长短期记忆-条件随机场）模型，用于结合原始诊断数据的上下文关系以及依赖关联关系，以及符号标识，结合语义关系对原始诊断数据进行自动标注和自动拆分。具体可以包括以下步骤：对原始诊断数据进行标注，以得到包括实体和分隔实体的标注结果。根据所述标注结果中的分隔实体确定用于代表拆分的位置拆分标记，并按照所述拆分标记进行拆分。例如，原始诊断数据为：骨癌，肺部转移，高血压三级，很高危。拆分后得到的结果为“高血压三级，很高危”，“骨癌，肺部转移”。基于此，可以将拆分后的每一个原始诊断词作为原始诊断数据。
47.除此之外，由于可能出现多次病历数据的疾病关联数据相似的情况，因此可对原始诊断数据进行去重操作。其中，去重操作指的是将待处理对象的所有原始诊断数据中相同的原始诊断数据进行删除，只保留一个原始诊断数据，进而根据所有的原始诊断数据得到诊断结果列表。例如，原始诊断数据中包含多次高血压，则保留一次即可。基于此，可以得到包含一个或多个原始诊断数据的诊断结果列表。诊断结果列表可以为待处理对象在时间周期内的所有历史医疗数据生成的列表，时间周期内可以为3年或者是5年等等，此处不作限定。每个待处理对象的诊断结果列表可以相同或不同。诊断结果列表中可以包含一个或多个原始诊断数据，例如诊断结果列表中包括高血压、糖尿病、甲减等等。
48.需要说明的是，如果通过历史医疗数据获取的原始诊断数据不完整，可根据辅助诊断数据对原始诊断数据进行补充，以更新原始诊断数据。辅助诊断数据可以为调查数据以及记录数据。其中，调查数据可以为第三方调查数据，例如公估调查数据以及病史核查数据；记录数据可以为与待处理对象及其关联对象之间的对话数据，例如与待处理对象及其关联对象的聊天数据以及通话数据等等。举例而言，当获取的原始诊断数据不完整时，可通过公估调查、病史资料核查、患者协谈等方式，获得更多的病史、病历和医学诊断数据，以将其添加在原始诊断数据中，从而提高原始诊断数据的完整性和准确性。
49.在步骤s220中，对各所述原始诊断数据进行标准化处理，获取各所述原始诊断数据对应的标准诊断数据。
50.本公开实施例中，可以将原始诊断数据进行标准化处理得到其对应的标准诊断数据。标准化处理指的是将不同格式或者是不同名称的原始诊断数据统一成相同格式的诊断数据，以得到与icd编码对应的标准诊断数据。标准诊断数据用于描述原始诊断数据关联的icd编码诊断数据。示例性地，标准诊断数据用于表示疾病编码诊断数据，可以为疾病编码，
也可以为疾病编码对应的疾病诊断词。疾病编码指的是icd编码。需要说明的是，原始诊断数据的标准诊断数据可以为一个或多个。基于此，可以将原始诊断数据转换为对应的疾病编码，从而确定出对应的标准诊断数据。例如，原始诊断数据为：左腕玻璃刺伤，标准诊断数据可以为icd编码s61.902或者是icd编码对应的疾病诊断词次腕部开放性损伤。
51.在一些实施例中，可以通过数据标准化模型将所述原始诊断数据转换为标准诊断数据；其中，所述数据标准化模型包括知识库规则模型、机器学习模型以及深度学习模型中的任意一种。
52.示例性地，可利用自然语言处理工具将原始诊断数据及待匹配标准诊断数据中的医学概念提取出来，医学概念例如可以为部位、疾病、症状等。通过知识库规则模型，可计算原始诊断数据中的单词与待匹配标准诊断数据的单词之间的匹配程度，并根据匹配程度来查找并返回匹配的医学概念集合，将医学概念集合中匹配度最高的医学概念作为标准诊断数据。
53.也可以使用机器学习模型对原始诊断数据中的疾病名称和知识库中的实体概念进行相似度打分并排序，最终返回分数最高的候选概念或能够在词表中完全匹配的候选概念，作为原始诊断数据的标准诊断数据。
54.还可以使用深度学习模型中的卷积神经网络对原始诊断数据进行编码得到特征，将编码后的特征经过分类器映射到相应的医学概念上。或者也利用transformer模型和bert预训练模型来实现。具体地，通过bert预训练模型得到多个候选词，对候选词与原始诊断数据进行相似度计算，将相似度最高的词作为标准诊断数据。对于机器学习模型和深度学习模型而言，可通过标注的原始诊断名称和既往症类别训练机器学习或深度学习模型，机器学习或深度学习模型的预测目标为既往症类别。采用的方法可为传统多分类预测模型，或fasttext模型等。
55.本公开实施例中，以通过transformer模型和bert预训练模型来进行标准化处理为例进行说明。示例性地，通过transformer模型中的编码器，得到原始诊断数据和待匹配诊断数据的语义特征，进一步对语义特征进行相似度计算，得到原始诊断数据和待匹配诊断数据的语义相似度，若根据语义相似度提确定原始诊断数据和待匹配诊断数据匹配成功，则可以根据待匹配诊断数据确定原始诊断数据的标准诊断数据。能够基于归一模型将原始诊断数据自动进行标准化，得到其对应的标准诊断数据，即icd编码诊断词，提高了诊断数据进行标准化的效率，能够实现智能化处理。
56.需要说明的是，可以通过数据标准化模型对每一个原始诊断数据进行标准化处理，得到每个原始诊断数据对应的标准诊断数据。进行标准化后的输出结果可以为包含原始诊断数据以及标准诊断数据的表格。多个原始诊断数据进行标准化处理的方式可以相同，以减小差异，提高一致性。
57.接下来，在步骤s230中，结合多个参考诊断数据以及所述标准诊断数据获取各所述原始诊断数据的候选诊断结果，并对所述候选诊断结果进行优化以确定所述待处理对象的目标诊断结果。
58.本公开实施例中，在获取到待处理对象的原始诊断数据后，可对待处理对象的用户信息进行脱敏处理。脱敏处理指的是对某些敏感信息通过脱敏规则进行数据的变形，实现敏感隐私数据的可靠保护。用户信息可以包括但不限于身份证号、手机号、卡号、客户号
等个人信息。举例而言，可以通过非对称加密算法例如md5算法或者是其它算法进行身份证号的脱敏处理，此处不作特殊限定。
59.参考诊断数据可以为保险场景中规定的疾病类型，例如可以为保险对应的既往症集合。对于不同的保险类型而言，其对应的参考诊断数据可以相同或不同，具体根据实际需求而确定。并且，每一种保险类型都可以对应多个参考诊断数据，以通过多个参考诊断数据对保险赔付范围进行限定。若待处理对象的原始诊断数据处于参考诊断数据的范围，则待处理对象无法进行投保。若待处理对象的原始诊断数据不处于参考诊断数据的范围，则待处理对象可以进行投保。参考诊断数据可以包括疾病编码和/或对应的疾病名称。参考诊断数据可以为某一类型的疾病集合，即每个参考诊断数据可以对应一种或多种疾病类型。举例而言，疾病类型为不同部位的肿瘤时，其对应的参考诊断数据均可以为肿瘤。
60.候选诊断结果指的是对每一个原始诊断数据的标准诊断数据进行初步筛选得到的既往症结果。图3中示意性示出了获取候选诊断结果的流程图，参考图3中所示，主要包括以下步骤：在步骤s310中，判断标准诊断数据与参考诊断数据的匹配结果是否为匹配成功；若匹配成功，转至步骤s320；若匹配失败，转至步骤s330；在步骤s320中，根据匹配成功的参考诊断数据来确定候选诊断结果；在步骤s330中，停止对所述原始诊断数据进行识别。
61.本公开实施例中，可将标准诊断数据与多个参考诊断数据分别进行匹配，获取匹配结果，并根据匹配结果来确定候选诊断结果。匹配结果可以为匹配失败和匹配成功。当匹配失败时，则认为原始诊断数据不属于既往症，结束整个识别过程。当匹配成功时，可以根据匹配成功的参考诊断数据来确定候选诊断结果。示例性地，在进行匹配时，可将标准诊断数据与多个参考诊断数据中包含的所有诊断数据进行匹配，将与标准诊断数据匹配成功的诊断数据所属的参考诊断数据作为候选诊断结果。
62.在一些实施例中，参考图4中所示，参考诊断数据403中包含诊断数据a、诊断数据b、诊断数据c。参考诊断数据404中包含诊断数据d。首先将标准诊断数据402与诊断数据a、诊断数据b、诊断数据c、诊断数据d分别进行匹配。如果原始诊断数据401对应的标准诊断数据402与诊断数据a匹配成功，则原始诊断数据401的候选诊断结果405为诊断数据a所属的参考诊断数据403。如果标准诊断数据401与诊断数据d匹配成功，则原始诊断数据的候选诊断结果406为诊断数据d所属的参考诊断数据404。举例而言，原始诊断数据对应的标准诊断数据是icd编码前3位为c16的数据，与参考诊断数据恶性肿瘤中的诊断数据胃恶性肿瘤匹配成功，则可以将诊断数据胃恶性肿瘤对应的参考诊断数据作为原始诊断数据的候选诊断结果，即将恶性肿瘤作为原始诊断数据1对应的c16的候选诊断结果。
63.本公开实施例中，通过标准诊断数据与多个参考诊断数据中包含的所有诊断数据进行匹配，能够从疾病编码表示的细粒度进行初步匹配，进而根据疾病编码所属的参考诊断数据再次匹配到既往症，实现粗粒度的匹配，通过不同维度不同粒度的匹配，能够准确地确定原始诊断数据与多个参考诊断数据的匹配结果，进而准确地识别出候选诊断结果所表示的既往症。
64.需要说明的是，对于每一个原始诊断数据而言，都可以通过将原始诊断数据对应的标准诊断数据与多个参考诊断数据包含的诊断数据进行匹配的方式来确定其对应的候
选诊断结果。
65.在此基础上，还可以对候选诊断结果进行优化，以确定待处理对象的所有原始诊断数据对应的目标诊断结果。目标诊断结果可以为目标诊断标签，目标诊断标签用于表示是否属于参考诊断数据以及属于多个参考诊断数据中的哪一类型，即是否为既往症以及所属的既往症类型。既往症指的是已经出现的疾病类型。举例而言，若原始诊断数据属于参考诊断数据，则标签可以为icd编码或者是疾病类型；若不属于参考诊断数据，标签可以为0。
66.本公开实施例中，在得到每一个原始诊断数据的候选诊断结果后，可以将属于同一用户的所有原始诊断数据对应的候选诊断结果进行组合优化，以得到该用户的目标诊断结果。图5中示意性示出了确定目标诊断结果的流程图，参考图5中所示，主要包括以下步骤：在步骤s510中，对各所述原始诊断数据的所述候选诊断结果进行聚合，获取中间诊断结果。
67.在一些实施例中，由于待处理对象可以包括一个或多个原始诊断数据。在进行既往症识别时，需要进行全面识别，因此可以将所有原始诊断数据对应的候选诊断结果进行聚合拼接，得到中间诊断结果。在对所有候选诊断结果进行拼接时，可以按照原始诊断数据对应的时间顺序进行聚合，也可以随机进行聚合，此处不作具体限定。
68.举例而言，以保险产品既往症识别为例，对于待处理对象而言，可获取所有投保时间之前的所有就诊次对应的原始诊断数据。进一步可以将所有就诊次对应的原始诊断数据的既往症标签进行合并，形成待处理对象的中间诊断结果，中间诊断结果可以为聚合后的既往症标签。例如待处理对象2021年9月1日投保，在这之前包括两次就诊得到两个原始诊断数据，其中2020年1月15日就诊次包含“恶性肿瘤”既往症标签，2019年4月22日就诊次包含“终末期肾病”既往症标签，则待处理对象的中间诊断结果表示的既往症标签可以为“恶性肿瘤，终末期肾病”，也可以为“终末期肾病，恶性肿瘤”。
69.除此之外，中间诊断结果中还可以聚合显示所有原始诊断数据对应的就诊数据，就诊数据例如可以为每个就诊次的原始诊断数据对应的就诊时间以及就诊医院等等。例如，2020年1月15日就诊次包含“恶性肿瘤”既往症标签，2019年4月22日就诊次包含“终末期肾病”既往症标签，则待处理对象的中间诊断结果表示的既往症标签可以为“恶性肿瘤/2020年1月15日/医院a，终末期肾病/2019年4月22日/医院b”。需要说明的是，中间诊断结果的显示方式具体可以根据实际需求而确定。
70.通过将所有原始诊断数据的候选诊断结果进行聚合得到中间诊断结果，能够提高中间诊断结果的全面性和完整性。
71.在步骤s520中，根据原始诊断数据的诊断状态对所述中间诊断结果进行调整，以确定所述目标诊断结果。
72.本公开实施例中，由于部分原始诊断数据可能存在不同的阶段，例如初期、中期、晚期、末期等等，因此可以结合原始诊断数据的诊断状态来对上述的中间诊断结果进行调整更新，从而确定目标诊断结果。诊断状态用于描述原始诊断数据中对应的诊断结果的发展过程，即疾病的发展过程。诊断状态可以包括进展状态和诊断程度。进展状态用于描述进展速度，例如是否从初始进展到中期等等。诊断程度用于描述严重程度以及预后程度（疾病可能造成的预测后果的严重程度）。
73.基于此，可以结合进展状态或者是诊断程度来对中间诊断结果进行调整。示例性地，若某个属于中间诊断结果的原始诊断数据的诊断程度为第一程度，可以将该原始诊断数据的候选诊断结果删除；若某个不属于候选诊断结果的原始诊断数据的诊断程度为第二程度，可以将其确定为候选诊断结果，以增加至中间诊断结果中生成目标诊断结果。其中，第一程度小于第二程度，第一程度可以为轻度，第二程度为重度。除此之外，若某个属于中间诊断结果的原始诊断数据的进展状态为第一状态，可以将该原始诊断数据的候选诊断结果删除；若某个不属于中间诊断结果的原始诊断数据的进展状态为第二状态，则可以将其确定为候选诊断结果，以增加至中间诊断结果中生成目标诊断结果。进展状态指的是每个原始诊断数据对应的疾病类型的发展状态。第一状态可以为进展速度慢且无需特殊处理的状态，第二状态可以为进展快且需要特殊处理的状态。特殊处理可以为医疗处理等等。
74.本公开实施例中，参考图6中所示，通过原始诊断数据的进展状态和诊断程度来对原始诊断数据601和原始诊断数据606进行判断，若原始诊断数据601的进展状态满足第二状态或者是诊断程度满足第二程度，均可以对原始诊断数据对应的标准诊断数据602确定候选诊断结果603，以将其添加至中间诊断结果604中生成目标诊断结果605。若原始诊断数据606的进展状态满足第一状态或者是诊断程度满足第一程度，均可以将原始诊断数据606对应的标准诊断数据607的候选诊断结果3从中间诊断结果604中删除，以调整更新中间诊断结果，从而得到目标诊断结果605。
75.举例而言，腔隙性脑梗塞：一般症状轻微，预后良好，多为头部影像学检查发现，不纳入既往症。急性脑梗塞、脑出血、脑中风、脑卒中：多有明显症状，病情较重，预后差，纳入既往症。慢性肾脏病3期以前的各诊断病情较轻，疾病进展缓慢，有些无需特殊治疗，不纳入既往症；慢性肾脏病3期及以上：病情进展速度快，很快进展至终末期，需肾脏替代治疗或肾移植，需纳入既往症。本公开实施例中，结合医学知识生成轻症和重症、多次治疗多种诊断等复杂逻辑判断，对生成的中间诊断结果进行优化，增加或减少部分既往症标签，从而生成待处理对象的所有原始诊断数据对应的目标诊断结果所表示的既往症标签，能够提高目标诊断结果的准确性，以使其更符合实际情况。
76.需要说明的是，可以通过对待处理对象的所有原始诊断数据进行标准化得到其标准诊断数据，进而根据标准诊断数据得到该待处理对象的所有原始诊断数据对应的目标诊断结果，从而识别出待处理对象的所有既往症。示例性地，可以参照既往症icd（international classification of diseases）编码列表，对标准诊断数据进行匹配，以将标准诊断数据映射为既往症标签。
77.图7中示意性示出了确定目标诊断结果的示意图，参考图7中所示，原始诊断数据701的标准诊断数据702，原始诊断数据706的标准诊断数据707，分别与参考诊断数据703和参考诊断数据704中的每一个诊断数据进行匹配。标准诊断数据702与参考诊断数据703的诊断数据a匹配成功，则原始诊断数据701对应的候选诊断结果705即为参考诊断数据703。标准诊断数据707与参考诊断数据704的诊断数据d匹配成功，则原始诊断数据706的候选诊断结果708即为参考诊断数据704。接下来，可以将所有的候选诊断结果进行聚合拼接得到中间诊断结果709，进一步对中间诊断结果进行调整得到目标诊断结果710。举例而言，原始诊断数据左腕玻璃刺伤对应的候选诊断结果可以为icd编码icd10:s61.902，由于不存在其他原始诊断数据且无需删除该候选诊断结果，则目标诊断结果可以为icd编码icd10:
s61.902。
78.如果识别出目标诊断结果，可以通过提示标识对目标诊断结果进行提示。提示标识例如可以为区别性显示或者是声音提示标识等等，此处不作具体限定。
79.本公开实施例中，通过从真实世界的医疗数据提取出其中的诊断相关信息作为原始诊断数据，将原始诊断数据进行标准化处理，进而基于标准诊断数据进行既往症识别，能够避免只根据部分医疗记录进行目标诊断结果识别所导致的局限性，能够从待处理对象的所有原始诊断数据进行全面地精准识别，提高识别的准确性。通过结合参考诊断数据以及标准诊断数据获取候选诊断结果，进一步基于对候选诊断结果进行优化调整确定目标诊断结果，能够从多个层级进行多粒度匹配，从而实现目标诊断结果的自动识别，相比于相关技术中而言，减少了操作量，提高了识别效率，且避免了标准不一致而导致的差异性，能够提高通用性。除此之外，根据医学专家知识库形成的复杂规则多次判断原始诊断数据是否构成既往症，以生成既往症标签，并对生成的候选诊断结果对应的既往症标签进行优化，能够提高既往症识别的准确性和全面性，也能够提高识别的通用性和效率，并且使得目标诊断结果符合实际情况。
80.本公开实施例中提供了一种诊断数据识别装置，参考图8中所示，该诊断数据识别装置800可以包括：诊断数据获取模块801，用于通过历史医疗数据获取待处理对象的至少一个原始诊断数据；标准化处理模块802，用于对各所述原始诊断数据进行标准化处理，获取各所述原始诊断数据对应的标准诊断数据；诊断结果确定模块803，用于结合多个参考诊断数据以及所述标准诊断数据获取各所述原始诊断数据的候选诊断结果，并对所述候选诊断结果进行优化以确定所述待处理对象的目标诊断结果。
81.在本公开的一种示例性实施例中，标准化处理模块被配置为：通过数据标准化模型将各所述原始诊断数据转换为标准诊断数据；其中，所述数据标准化模型包括知识库规则模型、机器学习模型以及深度学习模型中的任意一种。
82.在本公开的一种示例性实施例中，诊断结果确定模块包括：候选结果确定模块，用于将所述标准诊断数据与所述多个参考诊断数据进行匹配，并根据匹配成功的参考诊断数据确定所述候选诊断结果。
83.在本公开的一种示例性实施例中，候选结果确定模块包括：数据匹配模块，用于将标准诊断数据与所述参考诊断数据中包含的所有诊断数据进行匹配，并将与标准诊断数据匹配成功的诊断数据所属的参考诊断数据作为候选诊断结果。
84.在本公开的一种示例性实施例中，诊断结果确定模块包括：中间结果确定模块，用于对各所述原始诊断数据的所述候选诊断结果进行聚合，获取中间诊断结果；优化模块，用于根据原始诊断数据的诊断状态对所述中间诊断结果进行调整，以确定所述目标诊断结果。
85.在本公开的一种示例性实施例中，优化模块包括：中间结果调整模块，用于根据原始诊断数据的进展状态或诊断程度，对所述中间诊断结果进行调整，以确定所述原始诊断数据对应的所述目标诊断结果。
86.在本公开的一种示例性实施例中，所述装置还包括：诊断数据补充模块，用于若原始诊断数据不完整，根据辅助诊断数据对所述原始诊断数据进行补充，以更新所述原始诊断数据。
87.需要说明的是，上述诊断数据识别装置中各模块的具体细节已经在对应的诊断数据识别方法中进行了详细描述，因此此处不再赘述。
88.本公开的示例性实施方式还提供一种电子设备。该电子设备可以是上述客户端101，也可以是服务器。一般的，该电子设备可以包括处理器与存储器，存储器用于存储处理器的可执行指令，处理器配置为经由执行可执行指令来执行上述诊断数据识别方法。
89.下面参照图9来描述根据本公开的这种实施方式的电子设备900。图9显示的电子设备900仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。
90.如图9所示，电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于：上述至少一个处理单元910、上述至少一个存储单元920、连接不同系统组件（包括存储单元920和处理单元910）的总线930以及显示单元940。
91.其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元910执行，使得所述处理单元910执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如，所述处理单元910可以执行如图2中所示的步骤。
92.存储单元920可以包括易失性存储单元形式的可读介质，例如随机存取存储单元（ram）9201和/或高速缓存存储单元9202，还可以进一步包括只读存储单元（rom）9203。
93.存储单元920还可以包括具有一组（至少一个）程序模块9205的程序/实用工具9204，这样的程序模块9205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。
94.总线930可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速接口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
95.电子设备900也可以与一个或多个外部设备1000（例如键盘、指向设备、蓝牙设备等）通信，还可与一个或者多个使得用户能与该电子设备900交互的设备通信，和/或与使得该电子设备900能与一个或多个其它计算设备进行通信的任何设备（例如路由器、调制解调器等等）通信。这种通信可以通过输入/输出（i/o）接口950进行。并且，电子设备900还可以通过网络适配器960与一个或者多个网络（例如局域网（lan），广域网（wan）和/或公共网络，例如因特网）通信。如图所示，网络适配器960通过总线930与电子设备900的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备900使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
96.在本公开的实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中，本公开的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
97.根据本公开的实施方式的用于实现上述方法的程序产品，其可以采用便携式紧凑
盘只读存储器(cd-rom)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
98.所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器（ram）、只读存储器（rom）、可擦式可编程只读存储器（eprom或闪存）、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
99.计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
100.可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、rf等等，或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等，还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网（lan）或广域网（wan），连接到用户计算设备，或者，可以连接到外部计算设备（例如利用因特网服务提供商来通过因特网连接）。
101.此外，上述附图仅是根据本公开实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。
102.本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施例。本技术旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。
103.应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭潇宇亓玉雪
技术所有人：天津幸福生命科技有限公司
我是此专利的发明人

上一篇：一种具有防护和防脱离功能的粘扣带的制作方法
上一篇：一种具有调节机构的牙科用躺椅的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。