数据处理方法、装置、电子设备及计算机可读存储介质与流程

文档序号:31414466发布日期:2022-09-03 12:18阅读:66来源:国知局
数据处理方法、装置、电子设备及计算机可读存储介质与流程

1.本技术涉及数据处理技术领域,具体而言,本技术涉及一种数据处理方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.疾病诊疗过程会产生大量电子病历、诊断记录、处方信息等临床数据,为医疗信息化、现代化、智能化发展提供了充足的数据支撑。然而,由于现有电子病历的记录方式多为线性,医疗信息数据庞杂,记录过程中积累了较多冗余和干扰信息,缺乏与当前先进算法的兼容性与适配性。如现病史、既往史、现病史、体格检查等电子病历记录内容往往篇幅较长,记录形式为非结构化自然语言,即使后续基于深度学习算法进行结构化、信息挖掘与展示等处理,没有降维、统一、简化的数据表示方式,其处理结果仍然难以适用于其他算法,难以对疾病诊疗做出实质性贡献。
3.很明显,现有电子临床数据的线性记录方式庞杂而冗余,使其缺少可计算性,难以直接参与高效的算法运算,阻碍了现存医学诊疗领域数据和先进人工智能算法之间的密切联系。如不能以合理的形式处置疾病诊断过程中涉及的临床数据,诊疗过程中积累的大量数据反而会限制人工智能算法在智慧医学诊疗领域的使用,导致庞大的逻辑计算量,阻碍医疗信息化、现代化与智能化的进程。


技术实现要素:

4.本技术实施例提供了一种数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,可以解决人工智能算法在疾病诊疗领域的有效应用问题。所述技术方案如下:
5.根据本技术实施例的第一方面,提供了一种数据处理方法,该方法包括:
6.获取目标用户的病历数据信息,确定目标用户的病例数据信息中的基础诊疗知识点;
7.获取预先建立的疾病诊疗模型;疾病诊疗模型是基于病历诊断样本构建的、包含病历诊断样本中所有诊疗知识点的围棋棋盘式的数据模型;疾病诊疗模型中的元素为病历诊断样本的诊疗知识点;各个病历诊断样本中包括样本用户的病历数据信息和/或病历对应的已进行的诊疗方法信息;
8.在疾病诊疗模型中标注基础诊疗知识点,将标注完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,目标格式包括图像格式、矩阵格式以及文本格式中的至少一种;
9.将目标格式的数据输入至预设的人工智能算法中,得到所述人工智能算法输出的至少一条诊疗路径,并从至少一条诊疗路径中确定目标诊疗路径;诊疗路径的节点表征基础诊疗知识点或后续诊疗方法信息对应的目标诊疗知识点。
10.在一个可能的实现方式中,将标注完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,包括:
11.若目标格式为图像格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为目标图像;目标图像的像素点为疾病诊疗模型的元素;
12.若目标格式为矩阵格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为目标矩阵;目标矩阵的元素为疾病诊疗模型的元素;
13.若目标格式为文本格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为文本内容,文本内容中的各个词汇为疾病诊疗模型的元素。
14.在一个可能的实现方式中,疾病诊疗模型中横轴代表诊疗知识点的不同属性,疾病诊疗模型包括至少一个属性,同一列的元素属于同一属性,疾病诊疗模型大小为n*n;在疾病诊疗模型中标注基础诊疗知识点,将标注完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,包括:
15.确定基础诊疗知识点对应的目标属性,在疾病诊疗模型中标注目标属性所对应的元素,连接标注的各个元素形成诊疗过程中的棋局数据,将棋局数据转换为目标格式的数据。
16.在一个可能的实现方式中,从至少一条诊疗路径中确定目标诊疗路径,包括:
17.调用预设先验库,基于预设先验库确定各个诊疗路径中的各个节点的节点价值;节点价值表征该节点对应的诊疗知识点对目标疾病诊断的影响力;
18.确定各个诊疗路径的深度值;
19.根据节点价值和深度值从至少一条诊疗路径中确定目标诊疗路径,先验库是基于疾病诊疗手册构建的库。
20.在一个可能的实现方式中,根据节点价值和深度值从至少一条诊疗路径中确定目标诊疗路径,包括:
21.从至少一条诊疗路径中确定至少一条参考路径;参考路径的的节点对应的总的节点价值符合第一预设条件;
22.确定各个参考路径的深度值,根据深度值从参考路径中确定目标诊疗路径。
23.在一个可能的实现方式中,根据深度值从参考路径中确定目标诊疗路径,包括:
24.将深度值最小的参考路径确定为目标诊疗路径。
25.根据本技术实施例的第二方面,提供了一种数据处理装置,该装置包括:
26.基础诊疗知识点确定模块,用于获取目标用户的病例数据信息,确定目标用户的病例数据信息中的基础诊疗知识点;
27.疾病诊疗模型获取模块,用于获取预先建立的疾病诊疗模型;疾病诊疗模型是基于病历诊断样本构建的、包含病历诊断样本中所有诊疗知识点的围棋棋盘式的数据模型;疾病诊疗模型中的元素为病历诊断样本的诊疗知识点;各个病历诊断样本中包括样本用户的病历数据信息和/或病历对应的已进行的诊疗方法信息;
28.转换模块,用于在疾病诊疗模型中标注基础诊疗知识点,将标注完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,目标格式包括图像格式、矩阵格式以及文本格式中的至少一种;
29.诊疗路径确定模块,用于将目标格式的数据输入至预设的人工智能算法中,得到人工智能算法输出的至少一条诊疗路径,并从至少一条诊疗路径中确定目标诊疗路径;诊疗路径的节点表征基础诊疗知识点或后续诊疗方法信息对应的目标诊疗知识点。
30.本技术实施例的第三方面,提供了一种电子设备,该电子设备包括存储器、处理器及存储在存储器上的计算机程序,处理器执行程序时实现如第一方面所提供的方法的步骤。
31.根据本技术实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
32.根据本技术实施例的第五方面,提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中,当计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行实现如第一方面所提供的方法的步骤。
33.本技术实施例提供的技术方案带来的有益效果是:本技术实施例构建了疾病诊断样本对应的疾病诊疗模型,大量电子病历记录的诊疗过程充分表达到诊疗模型中,形成棋局数据,诊疗手册中涉及的重要诊疗步骤成为棋局节点,将诊疗信息参与的复杂逻辑计算做简单化处理,确定出目标诊疗路径,该目标诊疗路径中对应的诊疗方法为目标用户的病例数据信息对应的最大可能性的诊疗方法。简化了诊疗领域电子病历数据复杂度,为对抗学习等算法在诊疗领域中的应用提供了数据兼容入口,有效处理海量病历信息中的变化和规律,并用此规律形成诊疗路径,提供临床诊疗服务,有效减少了医疗诊断中的试错过程,有效减少了医疗资源的浪费。
附图说明
34.为了更清楚地说明本技术实施例中的技术方案,下面将对本技术实施例描述中所需要使用的附图作简单地介绍。
35.图1为本技术实施例提供的一种数据处理方法的流程示意图;
36.图2为本技术实施例提供的疾病诊疗模型的示意图;
37.图3为本技术实施例提供的标注完基础诊疗知识点后的疾病诊疗模型对应的示意图;
38.图4为本技术实施例提供的一种数据处理装置的结构示意图;
39.图5为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
40.下面结合本技术中的附图描述本技术的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本技术实施例的技术方案的示例性描述,对本技术实施例的技术方案不构成限制。
41.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用
的术语“和/或”指示该术语所限定的项目中的至少一个,例如“a和/或b”可以实现为“a”,或者实现为“b”,或者实现为“a和b”。
42.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
43.本技术提供的数据处理方法、装置、电子设备、计算机可读存储介质以及计算机程序产品,旨在解决对抗学习、蒙特卡洛树搜索、上限置信度等人工智能领域算法在疾病诊疗领域的有效应用问题。
44.下面通过对几个示例性实施方式的描述,对本技术实施例的技术方案以及本技术的技术方案产生的技术效果进行说明。需要指出的是,下述实施方式之间可以相互参考、借鉴或结合,对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等,不再重复描述。
45.本技术实施例中提供了一种数据处理方法,如图1所示,该方法包括:
46.步骤s101,获取目标用户的病例数据信息,提取目标用户的病例数据信息中的基础诊疗知识点;
47.本技术实施例目标用户为患者,可以是任意类型疾病的患者,比如皮肤病患者、心脑血管疾病患者等等。
48.本技术实施例目标用户的病例数据信息是指从目标用户的病历中确定的,目标用户的病例一般是文本型病历,可以是纸质病历、也可以是电子病历,目标用户的病例数据信息是从目标用户的病例中提取的,包括患者的基本信息、已进行的疾病诊疗方法信息等信息,基本信息例如可以是目标患者姓名、性别等等,疾病诊疗信息可以是患者所换疾病的外在表现、医生询问的情况、以及已进行的检查项目或手术项目等。
49.病例数据信息是从病例中获取的,一般有对应的行文规则或格式,可通过预设的诊疗知识点提取算法对病例数据信息的行文规则、句式特征以及文本语义等进行分析,提取目标用户的病例数据信息中的基础诊疗知识点,其中诊疗知识点包括规范描述或规范格式的患者信息表述、规范格式的疾病症状描述以及规范的诊疗方法信息表述等。
50.本技术实施例预设的诊疗知识点提取算法包括lda(latent dirichlet allocation,文档主题生成模型)、lstm(long short-term memory,
51.长短期记忆网络)、crf(conditional random field,条件随机场)、tf-idf(term frequency

inverse document frequency,词频-逆文本频率指数)等算法,用于深度挖掘目标用户的病例数据信息中的诊疗知识点,本技术实施例对于提取诊疗知识点的方法不作限制。
52.当然,本技术实施例可直接提取基础诊疗知识点,也可确定基础诊疗知识点所对应的类别,本技术实施例对此不作限制。
53.具体而言,假设目标用户的病例数据信息中的文字有“姓名张三年龄性别中年男身上长有湿疹,主要显现于上肢,最近服用有某药物,初步判断为过敏”,针对该目标用户的病例数据信息可以确定的基础诊疗知识点为“中年男湿疹过敏上肢”,基础诊疗知识点反映了目标用户的病例数据信息的内容。
54.步骤s102,获取预先建立的疾病诊疗模型;疾病诊疗模型是基于病历诊断样本构建的、包含病历诊断样本中所有诊疗知识点的围棋棋盘式的数据模型;疾病诊疗模型中的
元素为病历诊断样本的诊疗知识点;各个病历诊断样本中包括样本用户的病历数据信息和/或病历对应的已进行的诊疗方法信息。
55.本技术实施例基础诊疗知识点是从目标用户的病例数据信息中提取的,基础诊疗知识点的数量是有限的,仅仅凭借提取到的基础诊疗知识点无法直接确定该疾病的诊疗方法,需根据提取到的基础诊疗知识点判断该目标用户对应的、可能性最大的诊疗方法或诊疗路径。
56.本技术实施例诊疗方法信息可以是诊断所需仪器、项目、确诊后的治疗药物等等,本技术实施例对此不作限制。
57.本技术实施疾病诊疗模型是基于预设的、海量的病历样本构建的、包括病历诊断样本中所有的诊疗知识点的诊疗模型,疾病诊疗模型的构造方法如下:
58.采取目标疾病领域的海量病历诊断样本,病历诊断样本中包括病历数据信息和该病历对应的诊疗方法信息,对每个病历诊断样本进行切词、分词、去除停用词、对病历诊断样本结构以及内容特征进行精准分析,从而提取患者的基本信息、疾病诊疗信息以及确诊疾病等信息,进而通过这些信息构造初始的诊疗模型。
59.本技术实施例除了提取海量病历样本中的诊疗知识点构造初步的诊疗模型之外,还可以借助专家领域知识以及相应领域的疾病诊疗手册,对初始的诊疗模型进行修正补充,得到疾病诊疗模型。另外,疾病诊疗模型可以是任何大小的围棋棋盘式的数据模型,比如16*16大小,也可为其他大小。
60.如图2所示,其示例性示出了本技术实施例所提供的疾病诊疗模型,如图2所示为皮肤病领域对应的疾病诊疗模型,该疾病诊疗模型中包括“年龄性别”、“传播与流行”、“季节”、“病程”、“疾病”、“病因”、“皮肤症状”以及“临床检查校验”等属性,其中,诊疗知识点“婴幼儿男”、“青年男”、“中年女”、“老年男”、“青春期女”等等,都属于“年龄性别”属性,其他属性包含的诊疗知识点不再一一举例。
61.步骤s103,在疾病诊疗模型中标注基础诊疗知识点,将标注完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,目标格式包括图像格式、矩阵格式以及文本格式中的至少一种。
62.本技术实施例在确定基础诊疗知识点和疾病诊疗模型后,由于疾病诊疗模型上的各个元素同样为诊疗知识点,可以在疾病诊疗模型上确定基础诊疗知识点,在该疾病诊疗模型中标注基础诊疗知识点,如图3所示,其示例性示出了在疾病诊疗模型中标注出的基础诊疗知识点,该图3中
“○”
表示基础诊疗知识点,箭头表示诊疗顺序。
63.本技术实施例在疾病诊疗模型上标注出的诊疗知识点相当于已进行的棋局,在疾病诊疗模型上标注出基础诊疗知识点后,将标注完的基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,目标格式包括图像格式、矩阵格式以及文本格式中的至少一种。
64.具体地,可以将标注完的基础诊疗知识点的疾病诊疗模型转换为目标图像,也可由将标注完的基础诊疗知识点的疾病诊疗模型转换为目标矩阵,也可将标注完的基础诊疗知识点的疾病诊疗模型转换为普通的文本格式。
65.本技术实施例将基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,使得目标格式的数据可应用于人工智能、深度学习领域相关算法模型,参与后续的计算。
66.步骤s104,将目标格式的数据输入至预设的人工智能算法中,得到人工智能算法
输出的至少一条诊疗路径,并从至少一条诊疗路径中确定目标诊疗路径;诊疗路径的节点表征基础诊疗知识点或后续诊疗方法信息对应的目标诊疗知识点。
67.本技术实施例在得到目标格式的数据后,将目标格式的数据输入至预设的人工智能算法中,得到人工智能算法输出的至少一条诊疗路径,预设的人工智能算法以各个病例诊断样本在疾病诊疗模型中标注后生成的目标格式的数据为训练样本,对训练样本进行处理后,能够输出至少一条诊疗路径,诊疗路径包含基础诊疗节点和目标诊疗节点,即诊疗路径的节点表征所述基础诊疗知识点或后续诊疗方法信息对应的目标诊疗知识点。
68.本技术实施例预设的人工智能算法可以是预先训练的神经网络模型,也可以是其他算法,例如uct(upper confidence bound apply to tree,上限置信区间)算法,本技术实施例对此不作限制。
69.以一具体实施例而言,若目标格式的数据是目标图像,对应的预先训练的神经网络模型即为图像处理模型,将目标格式的数据输入至该预先训练的神经网络模型中,可以得到该预设的神经网络模型输出的至少一条诊疗路径,该诊疗路径对应的节点表征所述基础诊疗知识点或后续诊疗方法信息对应的目标诊疗知识点,目标诊疗知识点例如可以式后续进行的诊疗方法、诊疗项目或者诊疗器材等,在一些情况下,也可以为诊疗结果,诊疗结果例如治愈、死亡。
70.本技术实施例在得到至少一条诊疗路径后,从至少一条诊疗路径中确定出目标诊疗路径。
71.可以理解的是,目标用户的病例数据信息是有限的,根据目标用户的病例数据信息确定的诊疗路径可能是多条,需进一步从多条诊疗路径中确定出目标诊疗路径,目标诊疗路径中的诊疗方法是当下可选择的最佳诊疗方法。
72.本技术实施例目标诊疗知识点是后续的诊疗方法信息,可以是诊疗所需项目或治疗药物等,本技术实施例对此不作限制。
73.本技术实施例中提供了一种可能的实现方式,将标注完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,包括:
74.若目标格式为图像格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为目标图像;目标图像的像素点为疾病诊疗模型的元素;
75.若目标格式为矩阵格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为目标矩阵;目标矩阵的元素为疾病诊疗模型的元素;
76.若目标格式为文本格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为文本内容,文本内容中的各个词汇为疾病诊疗模型的元素。
77.本技术实施例在得到疾病诊疗模型以及目标用户的病例数据信息对应的基础诊疗知识点后,将基础诊疗知识点标注于疾病诊疗模型,可将标注完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,具体地,若目标格式为图像格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为目标图像,目标图像的像素点为疾病诊疗模型的元素;若目标格式为矩阵格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为目标矩阵,目标矩阵的元素为疾病诊疗模型的元素,若目标格式为文本格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为文本内容,文本内容中的各个词汇为疾病诊疗模型的元素。
78.可以理解的是,目标用户的病例数据信息中的内容有限的,医师根据目标用户的
病例数据信息中的内容提取到的诊疗知识点并不能准确无误地判定目标患者的疾病和该疾病对应的诊疗方法,需根据目标用户的病例数据信息中的诊疗知识点确定可能性最大的疾病以及对应的诊疗方法,以此来减少判断出错的可能性。
79.本技术实施例中提供了一种可能的实现方式,疾病诊疗模型中横轴代表诊疗知识点的不同属性,疾病诊疗模型包括至少一个属性,同一列的元素属于同一属性,疾病诊疗模型大小为n*n;在疾病诊疗模型中标注基础诊疗知识点,将标注完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,包括:
80.确定基础诊疗知识点对应的目标属性,在疾病诊疗模型中标注目标属性所对应的元素,连接标注的各个元素形成诊疗过程中的棋局数据,将棋局数据转换为目标格式的数据。
81.本技术实施例疾病诊疗模型可以是任意的n*n的诊疗模型,n为正整数,比如16*16、32*32等,该疾病诊疗模型可以容纳该领域的所有诊疗知识点。
82.本技术实施例在确定疾病诊疗模型和基础诊疗知识点之后,在疾病诊疗模型中标注出基础诊疗知识点,基础诊疗知识点构成的棋局是已进行的棋局,连接标注的各个元素形成诊疗过程中的棋局数据,将所述棋局数据转换为目标格式的数据。
83.本技术实施例提供了一种可能的实现方式,从至少一条诊疗路径中确定目标诊疗路径,包括:
84.调用预设先验库,基于预设先验库确定各个诊疗路径中的各个节点的节点价值;节点价值表征该节点对应的诊疗知识点对目标疾病诊断的影响力;
85.确定各个诊疗路径的深度值;
86.根据节点价值和深度值从至少一条诊疗路径中确定目标诊疗路径,先验库是基于预设的疾病诊疗手册构建的库。
87.本技术实施例预设的先验库是基于疾病诊疗手册构建的库,先验库中存储有疾病诊疗手册中的诊疗知识点,在确定出诊疗路径后,确定出诊疗路径中各个节点所表示的诊疗知识点,通过查询预设的先验库确定各个诊疗路径中的各个节点的节点价值;节点价值表征该节点对应的诊疗知识点对目标疾病诊断的影响力,具体地,例如某节点对应的诊疗知识点存在于先验库中,则该节点的节点价值就高。
88.本技术实施例在确定各个诊疗路径的节点价值后,还需进一步确定各个诊疗路径的深度信息,结合节点价值和深度值从至少一条诊疗路径中确当目标诊疗路径。
89.本技术实施例提供了一种可能的实现方式,根据节点价值和深度值从至少一条诊疗路径中确定目标诊疗路径,包括:
90.从至少一条诊疗路径中确定至少一条参考路径;参考路径的的节点对应的总的节点价值符合第一预设条件;
91.确定各个参考路径的深度值,根据深度值从参考路径中确定目标诊疗路径。
92.可以理解的是,根据基础诊疗知识点得到至少一条诊疗路径,这些诊疗路径中都包括基础诊疗知识点和目标诊疗知识点,这些诊疗路径不一定是最佳诊疗路径,需从至少一条诊疗路径中确定目标诊疗路径作为最佳诊疗路径。
93.本技术实施例在确定至少一条诊疗路径后,确定各条诊疗路径的节点的总的节点价值,确定总的节点价值符合第一预设条件的诊疗路径为候选路径,比如将总的节点价值
排名前3的诊疗路径确定为候选路径,在确定出候选路径后,从候选路径中确定深度值最小的候选路径为目标诊疗路径。
94.目标诊疗路径中的节点中包括基础诊疗知识点表征的节点和后续诊疗方法信息对应的目标诊疗知识点所表征的节点,本技术实施例可从目标诊疗知识点中确定目标用户的后续诊疗方法。
95.本技术实施例提供了一种可能的实现方式,根据深度值从参考路径中确定目标诊疗路径,包括:
96.将深度值最小的参考路径确定为目标诊疗路径。
97.本技术实施例提供了一种具体的应用场景,在疾病诊疗模型中标注基础诊疗知识点,将标注完基础诊疗知识点的疾病诊疗模型转换为第一目标矩阵,将该第一目标矩阵输入至预先建立的神经网络模型中,该神经网络模型的算法可以是蒙特卡洛算法,该神经网络模型对标注有基础诊疗知识点的第一目标矩阵进行蒙特卡洛树搜索,得到至少一条诊疗路径。
98.在蒙特卡洛树搜索的迭代遍历的过程中,确定当前迭代遍历到的当前节点;首次迭代遍历以根节点为当前节点;
99.确定当前节点对应的至少一个子节点,从至少一个子节点中确定最佳子节点,若确定最佳子节点对应的深度小于预设深度,则确定扩展最佳子节点,滚动模拟直至最佳子节点对应的深度大于预设深度,或最佳子节点为叶子节点,或至少一个子节点形成的路径不存在于目标用户的病例数据信息之中;
100.若确定最佳子节点大于预设深度或最佳子节点为叶子节点,则确定当前迭代完成,并由最佳子节点反向遍历至根节点,得到当前迭代遍历对应的候选路径。
101.蒙特卡洛树搜索是在不断遍历中进行的,首次遍历以根节点为当前节点,可根据基础诊疗知识点的属性选定一个基础诊疗知识点为根节点。
102.在当前迭代过程中,确定当前迭代遍历到的当前节点,确定当前节点对应的至少一个子节点,从至少一个子节点中确定最佳子节点,首次遍历以根节点为根节点为当前节点,确定根节点的子节点,确定各个子节点的遍历次数和节点价值,确定截至到当前时刻的根节点的总的遍历次数,根据各个子节点的遍历次数和节点价值以及根节点的总的遍历次数从句至少一个子节点中确定最佳子节点。
103.具体地,可通过树的上限置信区间uct算法来确定最佳子节点。在uct中,i∈i是从当前节点p可以到达的一组节点。利用下列方程,uct选择父节点p中具有最高期望值的子节点。对于任意一个子节点vi,确定该子节点的遍历次数n(vi)、其父节点被遍历过的次数n(v),以及该子节点的节点价值q(vi)来确定该子节点vi对应的uct(vi,v),通过以下公式确定:
[0104][0105]
其中,c为期望,n表示遍历次数,vi表示一组子节点,v表示当前节点,q(vi)表示该节点的节点价值。
[0106]
uct主要分为两个组件,第一个是:(q(vi))/(n(vi)),又叫做exploitation组件,是表示某一个节点成功的比率,是一个节点模拟成功的奖励值/总的该节点访问次数,在目
标诊疗路径的寻找中,(q(vi))/(n(vi))表征经过该节点且得到正确的最短诊疗路径的奖励值/该节点总的访问次数。在目标用户的病例数据信息中,n(vi)主要是疾病诊疗的宽度和深度,q(vi)主要是目标用户的病例数据信息和《皮肤科诊疗常规》路径的奖励值,通常来讲我们更希望遍历成功率更高的节点,但在蒙特卡罗算法中我们却不能仅依靠这样的节点,也就是不能仅依靠exploitation组件,因为这样会导致后面的模拟中很容易就抛弃前面被模拟为失败的节点,丧失随机性和公平性,也就无法给其他节点更多的模拟机会,导致过拟合。uct中的第二个组件为exploration,为了增加所有节点的搜索机会,从而得到最短的诊疗路径,还需要依靠后面的exploration组件,这个组件主要来遍历探索未知节点,也就是更多未被遍历过的诊疗症状节点,这些节点的分母值n(vi)较低,相应的组件值较大,从而导致节点更容易被选择。
[0107]
在确定各个子节点的uct(vi,v)之后,比较各个子节点的uct(vi,v)的数值大小,将uct(vi,v)的最大值对应的子节点确定为下一目标子节点。
[0108]
本技术实施例在确定出最佳子节点之后,若确定最佳子节点对应的深度小于预设深度,则扩展该最佳子节点,模拟走子,直至最佳子节点对应的深度大于预设深度,或节点形成的路径不存在于病历之中,无法继续向下遍历,预设深度为根据实际情况预先设置的,预设深度大于基础诊疗知识点的个数。
[0109]
本技术实施例若确定最佳子节点大于预设深度或最佳子节点为叶子节点,则确定当前迭代完成,并由最佳子节点反向遍历至根节点,得到当前迭代遍历对应的诊疗路径,需进一步从至少一条诊疗路径中确定出目标诊疗路径。
[0110]
从至少一个子节点中确定最佳子节点之后,还包括:
[0111]
将最佳子节点的遍历次数加1;
[0112]
由最佳子节点反向遍历至根节点,还包括:
[0113]
在反向遍历过程中,将遍历到的各个节点的遍历次数加1,将遍历到的各个节点对应的节点价值更新为当前节点的节点价值和子节点对应的节点价值的和。
[0114]
本技术实施例在确定出最佳子节点之后,将该最佳子节点的遍历次数加1,表征该最佳子节点被遍历过了。
[0115]
本技术实施例在确定由最佳子节点反向遍历至根节点的过程中,会将遍历到的各个节点的遍历次数加1,将遍历到的各个节点对应的节点价值更新为当前节点的节点价值和子节点对应的节点价值的和,以此来更新节点的价值。
[0116]
从至少一个子节点中确定最佳子节点,包括:
[0117]
确定至少一个子节点当前各自对应的遍历次数和节点价值;
[0118]
根据遍历次数和节点价值从至少一个子节点中确定最佳子节点;节点价值表征该节点对应的诊疗知识点对目标疾病诊断的影响力。
[0119]
值得注意的是,蒙特卡洛树中的各个节点包括节点价值和节点遍历次数,节点价值表征该节点对应的诊疗知识点在目标疾病诊断的影响力。
[0120]
节点价值的初始值是根据疾病诊疗手册对应的第二目标矩阵确定的,第二目标矩阵中疾病诊疗手册对应的诊疗知识点,对于任意一个候选诊疗知识点或基础诊疗知识点,通过确定该候选诊疗知识点或基础诊疗知识点和第二目标矩阵中的诊疗知识点之间的对应关系,确定该候选诊疗知识点或基础诊疗知识点对应的节点价值的初始值。该对应关系
包括制约关系、认同关系以及其他关系,若某节点对应的基础诊疗知识点或候选诊疗知识点与第二目标矩阵中的诊疗知识点存在制约关系,那么该节点对应的节点价值的初始值相对而言较低,若某节点对应的基础诊疗知识点或候选诊疗知识点与第二目标矩阵中的诊疗知识点存在认同关系,那么该节点对应的节点价值的初始值相对而言较高,当前,某节点对应的基础诊疗知识点或候选诊疗知识点与第二目标矩阵中的诊疗知识点之间的对应关系也可为其他关系,可根据实际情况进行设定。
[0121]
本技术实施例通过各个子节点的遍历次数和节点价值,从至少一个子节点确定最佳子节点,具体地,可通过树的上置信度界uct算法来确定最佳子节点,对于任意一个子节点vi,确定该子节点的遍历次数n(vi)、其父节点的遍历次数n(v),以及该子节点的节点价值q(vi)来确定该子节点vi对应的uct(vi,v),通过以下公式确定:
[0122][0123]
其中,c为常数,n表示遍历次数,vi表示当前节点可以到达的一组节点,v表示当前节点,q(vi)表示其子节点的节点价值。
[0124]
在确定各个子节点的uct(vi,v)之后,比较各个子节点的uct(vi,v)的数值大小,将uct(vi,v)的最大值对应的子节点确定为下一目标节点。
[0125]
本技术实施例在确定出至少一条诊疗路径后,需进一步对各个候选路径进行判断,结合每条路径的总的节点价值和深度值从至少一条诊疗路径中确定目标诊疗路径。
[0126]
本技术实施例在确定出参考路径后,需进一步结合实际医疗情况,从参考路径中确定目标诊疗路径,比如为节约医疗资源,将深度值最小的参考路径作为目标诊疗路径。
[0127]
本技术实施例提供了一种数据处理装置40,如图4所示,该数据处理装置40可以包括:
[0128]
基础诊疗知识点确定模块410,用于获取目标用户的病例数据信息,确定目标用户的病例数据信息中的基础诊疗知识点;
[0129]
疾病诊疗模型获取模块420,用于获取预先建立的疾病诊疗模型;疾病诊疗模型是基于病历诊断样本构建的、包含病历诊断样本中所有诊疗知识点的围棋棋盘式的数据模型;疾病诊疗模型中的元素为病历诊断样本的诊疗知识点;各个病历诊断样本中包括样本用户的病历数据信息和/或病历对应的已进行的诊疗方法信息;
[0130]
转换模块430,用于在疾病诊疗模型中标注基础诊疗知识点,将标注完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,目标格式包括图像格式、矩阵格式以及文本格式中的至少一种;
[0131]
诊疗路径确定模块440,用于将目标格式的数据输入至预设的人工智能算法中,得到至少一条诊疗路径,并从至少一条诊疗路径中确定目标诊疗路径;诊疗路径的节点表征基础诊疗知识点或后续诊疗方法信息对应的目标诊疗知识点。
[0132]
本技术实施例通过本技术实施例构建了疾病诊断样本对应的疾病诊疗模型,大量电子病历记录的诊疗过程充分表达到诊疗模型中,形成棋局数据,诊疗手册中涉及的重要诊疗步骤成为棋局节点,将诊疗信息参与的复杂逻辑计算做简单化处理,确定出目标诊疗路径,该目标诊疗路径中对应的诊疗方法为目标用户的病例数据信息对应的最大可能性的诊疗方法。简化了诊疗领域电子病历数据复杂度,为对抗学习等算法在诊疗领域中的应用
提供了数据兼容入口,有效处理海量病历信息中的变化和规律,并用此规律形成诊疗路径,提供临床诊疗服务,有效减少了医疗诊断中的试错过程,有效减少了医疗资源的浪费。
[0133]
本技术实施例提供了一种可能的实现方式,转换模块包括:
[0134]
第一转换子模块,用于若目标格式为图像格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为目标图像;目标图像的像素点为疾病诊疗模型的元素;
[0135]
第二转换子模块,用于若目标格式为矩阵格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为目标矩阵;目标矩阵的元素为疾病诊疗模型的元素;
[0136]
第三转换子模块,用于若目标格式为文本格式,则将标注完基础诊疗知识点的疾病诊疗模型转换为文本内容,文本内容中的各个词汇为疾病诊疗模型的元素。
[0137]
本技术实施例提供了一种可能的实现方式,疾病诊疗模型中横轴代表诊疗知识点的不同属性,诊疗模型包括至少一个属性,同一列的元素属于同一属性,诊疗模型大小为n*n;转换模块具体用于确定基础诊疗知识点对应的目标属性,在疾病诊疗模型中标注目标属性所对应的元素,连接标注的各个元素形成诊疗过程中的棋局数据,将棋局数据转换为目标格式的数据。
[0138]
本技术实施例提供了一种可能的实现方式,诊疗路径确定模块包括:
[0139]
先验库调用子模块,用于调用预设先验库,基于预设先验库确定各个诊疗路径中的各个节点的节点价值;节点价值表征该节点对应的诊疗知识点对目标疾病诊断的影响力;
[0140]
深度值确定子模块,用于确定各个诊疗路径的深度值;
[0141]
目标诊疗路径确定子模块,用于根据节点价值和深度值从至少一条诊疗路径中确定目标诊疗路径;先验库是基于疾病诊疗手册构建的库。
[0142]
本技术实施例提供了一种可能的实现方式,目标诊疗路径确定子模块包括:
[0143]
参考路径确定单元,用于从至少一条诊疗路径中确定至少一条参考路径;参考路径的的节点对应的总的节点价值符合第一预设条件;
[0144]
目标诊疗路径确定单元,用于确定各个参考路径的深度值,根据深度值从参考路径中确定目标诊疗路径。
[0145]
本技术实施例提供了一种可能的实现方式,目标诊疗路径确定单元用于将深度值最小的参考路径确定为目标诊疗路径。
[0146]
本技术实施例的装置可执行本技术实施例所提供的方法,其实现原理相类似,本技术各实施例的装置中的各模块所执行的动作是与本技术各实施例的方法中的步骤相对应的,对于装置的各模块的详细功能描述具体可以参见前文中所示的对应方法中的描述,此处不再赘述。
[0147]
本技术实施例中提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,该处理器执行上述计算机程序以实现数据处理方法的步骤,与相关技术相比可实现:本技术实施例通过获取目标用户的病历数据信息,确定目标用户的病例数据信息中的基础诊疗知识点;获取预先建立的疾病诊疗模型;疾病诊疗模型是基于病历诊断样本构建的、包含病历诊断样本中所有诊疗知识点的围棋棋盘式的数据模型;疾病诊疗模型中的元素为病历诊断样本的诊疗知识点;各个病历诊断样本中包括样本用户的病历数据信息和/或病历对应的已进行的诊疗方法信息;在疾病诊疗模型中标注基础诊疗知识点,将标注
完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,目标格式包括图像格式、矩阵格式以及文本格式中的至少一种;将目标格式的数据输入至预设的人工智能算法中,得到人工智能算法输出的至少一条诊疗路径,并从至少一条诊疗路径中确定目标诊疗路径;诊疗路径的节点表征基础诊疗知识点或后续诊疗方法信息对应的目标诊疗知识点。本技术实施例构建了疾病诊断样本对应的疾病诊疗模型,大量电子病历记录的诊疗过程充分表达到诊疗模型中,形成棋局数据,诊疗手册中涉及的重要诊疗步骤成为棋局节点,将诊疗信息参与的复杂逻辑计算做简单化处理,确定出目标诊疗路径,该目标诊疗路径中对应的诊疗方法为目标用户的病例数据信息对应的最大可能性的诊疗方法。简化了诊疗领域电子病历数据复杂度,为对抗学习等算法在诊疗领域中的应用提供了数据兼容入口,有效处理海量病历信息中的变化和规律,并用此规律形成诊疗路径,提供临床诊疗服务,有效减少了医疗诊断中的试错过程,有效减少了医疗资源的浪费。
[0148]
在一个可选实施例中提供了一种电子设备,如图5所示,图5所示的电子设备5000包括:处理器5001和存储器5003。其中,处理器5001和存储器5003相连,如通过总线5002相连。可选地,电子设备5000还可以包括收发器5004,收发器5004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器5004不限于一个,该电子设备5000的结构并不构成对本技术实施例的限定。
[0149]
处理器5001可以是cpu(central processing unit,中央处理器),通用处理器,dsp(digital signal processor,数据信号处理器),asic(application specific integrated circuit,专用集成电路),fpga(field programmable gate array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本技术公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器5001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。
[0150]
总线5002可包括一通路,在上述组件之间传送信息。总线5002可以是pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。总线5002可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0151]
存储器5003可以是rom(read only memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,ram(random access memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是eeprom(electrically erasable programmable read only memory,电可擦可编程只读存储器)、cd-rom(compact disc read only memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其他磁存储设备、或者能够用于携带或存储计算机程序并能够由计算机读取的任何其他介质,在此不做限定。
[0152]
存储器5003用于存储执行本技术实施例的计算机程序,并由处理器5001来控制执行。处理器5001用于执行存储器5003中存储的计算机程序,以实现前述方法实施例所示的步骤。
[0153]
其中,电子设备包可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收
器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。图5所示的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0154]
本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。与现有技术相比可实现:本技术实施例通过获取目标用户的病历数据信息,确定目标用户的病例数据信息中的基础诊疗知识点;获取预先建立的疾病诊疗模型;疾病诊疗模型是基于病历诊断样本构建的、包含病历诊断样本中所有诊疗知识点的围棋棋盘式的数据模型;疾病诊疗模型中的元素为病历诊断样本的诊疗知识点;各个病历诊断样本中包括样本用户的病历数据信息和/或病历对应的已进行的诊疗方法信息;在疾病诊疗模型中标注基础诊疗知识点,将标注完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,目标格式包括图像格式、矩阵格式以及文本格式中的至少一种;将目标格式的数据输入至预设的人工智能算法中,得到人工智能算法输出的至少一条诊疗路径,并从至少一条诊疗路径中确定目标诊疗路径;诊疗路径的节点表征基础诊疗知识点或后续诊疗方法信息对应的目标诊疗知识点。本技术实施例构建了疾病诊断样本对应的疾病诊疗模型,大量电子病历记录的诊疗过程充分表达到诊疗模型中,形成棋局数据,诊疗手册中涉及的重要诊疗步骤成为棋局节点,将诊疗信息参与的复杂逻辑计算做简单化处理,确定出目标诊疗路径,该目标诊疗路径中对应的诊疗方法为目标用户的病例数据信息对应的最大可能性的诊疗方法。简化了诊疗领域电子病历数据复杂度,为对抗学习等算法在诊疗领域中的应用提供了数据兼容入口,有效处理海量病历信息中的变化和规律,并用此规律形成诊疗路径,提供临床诊疗服务,有效减少了医疗诊断中的试错过程,有效减少了医疗资源的浪费。
[0155]
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
[0156]
本技术实施例还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。与现有技术相比可实现:本技术实施例通过获取目标用户的病历数据信息,确定目标用户的病例数据信息中的基础诊疗知识
点;获取预先建立的疾病诊疗模型;疾病诊疗模型是基于病历诊断样本构建的、包含病历诊断样本中所有诊疗知识点的围棋棋盘式的数据模型;疾病诊疗模型中的元素为病历诊断样本的诊疗知识点;各个病历诊断样本中包括样本用户的病历数据信息和/或病历对应的已进行的诊疗方法信息;在疾病诊疗模型中标注基础诊疗知识点,将标注完基础诊疗知识点的疾病诊疗模型转换为目标格式的数据,目标格式包括图像格式、矩阵格式以及文本格式中的至少一种;将目标格式的数据输入至预设的人工智能算法中,得到人工智能算法输出的至少一条诊疗路径,并从至少一条诊疗路径中确定目标诊疗路径;诊疗路径的节点表征基础诊疗知识点或后续诊疗方法信息对应的目标诊疗知识点。本技术实施例构建了疾病诊断样本对应的疾病诊疗模型,大量电子病历记录的诊疗过程充分表达到诊疗模型中,形成棋局数据,诊疗手册中涉及的重要诊疗步骤成为棋局节点,将诊疗信息参与的复杂逻辑计算做简单化处理,确定出目标诊疗路径,该目标诊疗路径中对应的诊疗方法为目标用户的病例数据信息对应的最大可能性的诊疗方法。简化了诊疗领域电子病历数据复杂度,为对抗学习等算法在诊疗领域中的应用提供了数据兼容入口,有效处理海量病历信息中的变化和规律,并用此规律形成诊疗路径,提供临床诊疗服务,有效减少了医疗诊断中的试错过程,有效减少了医疗资源的浪费。
[0157]
本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”、“1”、“2”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除图示或文字描述以外的顺序实施。
[0158]
应该理解的是,虽然本技术实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本技术实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本技术实施例对此不限制。
[0159]
以上仅是本技术部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术的方案技术构思的前提下,采用基于本技术技术思想的其他类似实施手段,同样属于本技术实施例的保护范畴。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1