基于知识图谱的归因分析方法、装置和系统与流程

文档序号:26541696发布日期:2021-09-07 22:05阅读:329来源:国知局
基于知识图谱的归因分析方法、装置和系统与流程

1.本发明涉及人工智能领域,尤其涉及一种基于知识图谱的归因分析方法、装置和系统。


背景技术:

2.随着现代社会节奏加快,生活压力增大,心理健康也日益成为职场人士重点关注的对象,抑郁症、神经衰落等精神或心理引发的疾病越来越困扰很多人,通过大数据方式对患者的检查结果进行人工智能算法建立模型可以辅助医生或者医务工作者提供更多科学的判断,如何有效利用这些数据,提供更好决策是急需解决的科学问题。随着影响疾病判断的因素不断增多,指标的变化成为常态,如何挖掘出促进指标增长的潜在因素正成为一个难题。


技术实现要素:

3.针对上述缺陷,本发明要解决的技术问题是如何利用好影响的心理或睡眠障碍的各种因素的大数据和不断增多的维度以进行更科学的判断。
4.针对上述缺陷,本发明的目的在于提供一种基于知识图谱的归因分析方法、系统及电子设备、计算机存储介质和程序产品。
5.根据本说明书的实施例的一方面,提供一种基于知识图谱的归因分析方法,用于服务器端,通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析。
6.优选的,算法模型包括自然语言处理、深度学习和知识图谱技术。
7.优选的,实体抽取包括关系抽取、事件抽取、实体消歧、知识融合和知识处理。
8.优选的,构造结构先验通过抽取子图结构,直接构造贝叶斯网络结构参数分布,再结合样本,共同学习贝叶斯网络结构。
9.优选的,构造结构先验统计出样本中变量的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,根据子图结构,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构。
10.优选的,构造结构先验在打分函数中加入惩罚因子,使得先验结构融合到后验结构中。
11.本发明提供一种基于知识图谱的归因分析方法,应用于互联网医疗平台,收集用户输入的医疗诊断检查数据,通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
12.优选的,医疗诊断检查数据包括文本数据和图片数据。
13.优选的,实体抽取包括睡眠障碍与医疗诊断检查数据关系抽取、与用户行为事件抽取、专家经验实体消歧、疾病和症状知识图谱知识融合和知识处理。
14.优选的,抽取子图利用图神经网络模型对图中节点之间的关系进行预测,挖掘更多因果关系。
15.优选的,方法结合专家经验,构建相关业务领域的知识图谱,基于图片抽取相关子图,在子图上利用图神经网络模型进行节点之间关系的预测,挖掘更多因果关系,构造贝叶斯网络机构先验分布,结合样本学习贝叶斯网络。
16.本发明提供一种基于知识图谱的归因分析系统,包括服务器端、客户端和互联网医疗平台,用户通过所述客户端提交医疗诊断检查数据,所述互联网医疗平台,收集用户输入的医疗诊断检查数据,所述服务器端通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
17.优选的,实体抽取包括睡眠障碍与医疗诊断检查数据关系抽取、与用户行为事件抽取、专家经验实体消歧、疾病和症状知识图谱知识融合和知识处理。
18.优选的,构造结构先验统计出样本中变量的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,根据子图结构,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构。
19.本发明提供一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现上述方法的步骤。
20.本发明提供一种计算机程序产品,包括计算机程序 /指令,其特征在于,该计算机程序/指令被处理器执行时实现上述方法的步骤。
21.本发明提供一种电子设备,包括:处理器;以及被设置成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析。
22.本发明提供一种电子设备,包括:处理器;以及被设置成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:收集用户输入的医疗诊断检查数据,通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
23.本发明可以有效利用专家经验,降低模型对样本量的要求,提升模型的性能, 加速模型训练速度,在缺乏心理疾病或睡眠障碍大数据的情况下能够将专家经验结合模型训练得到有效的分析结果。
附图说明
24.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
25.图1示出了本发明基于知识图谱的归因分析方法一实施例框架示意图;图2示出了本发明基于知识图谱的归因分析方法另一实施例框架示意图;图3示出了本发明基于知识图谱的归因分析方法一实施例流程示意图;图4示出了本发明基于知识图谱的归因分析方法另一实施例流程示意图;图5示出了本发明基于知识图谱的归因分析方法另一实施例流程示意图。
具体实施方式
26.下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
27.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
28.如图1所示,本说明书的一个实施例提供的一种基于知识图谱的归因分析方法,用于服务器端,通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;
根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析。
29.因果判断基于效应发生的条件得出关于因果关系的结论的过程。
30.知识图谱以结构化的形式描述客观世界中概念、实体及其之间的关系,将互联网医疗的信息表达成更接近人类认知世界的形式,更好地组织、管理和理解医疗互联网大数据中海量信息的能力。
31.图神经网络以gnn网络结构模型为典型,mi在概率和信息论中是两个随机变量的互信息(mutual information,mi)度量了两个变量之间相互依赖的程度。
32.cmi是条件互信息,给定三个变量,,,其中,在给定的条件下的直接或间接的非线性依赖关系程度。
33.pmi是部分互信息,原理基本与cmi相同,不同点在于,在给定的条件下具有部分独立性,而非完全的条件独立性。
34.在一些实施例中,算法模型包括自然语言处理、深度学习和知识图谱技术。
35.在一些实施例中,实体抽取包括关系抽取、事件抽取、实体消歧、知识融合和知识处理。
36.在一些实施例中,构造结构先验通过抽取子图结构,直接构造贝叶斯网络结构参数分布,再结合样本,共同学习贝叶斯网络结构。
37.如图2所示,本说明书的一个实施例提供的一种基于知识图谱的归因分析方法,通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析;在贝叶斯网络结构学习过程中,根据信息论相关理论,更好地度量变量间的线性和非线性因果关系。在本实施例中,加入部分互信息(pmi),以精确地度量变量间的线性与非线性因果关系。
38.设,,为三个随机变量,根据信息论相关知识,互信息、条件互信息定义如下:下:式中,部分互信息定义如下:
其中,其中,通过加入上述部分互信息(pmi),可以解决mi和cmi用于度量变量间线性因果关系以及非线性因果关系时的严重过估计和欠估计问题。
39.如图3所示,本说明书的一个实施例提供的一种基于知识图谱的归因分析方法,包括:s101、通过算法模型,对收集到的数据进行实体抽取;s102、利用图数据库对知识进行存储;s103、结合业务专家经验构建知识图谱;s104、根据知识图谱和输入信息,抽取相关子图,构造结构先验;s105、结合训练样本,学习建立贝叶斯网络模型;s106、利用学习建立的贝叶斯网络模型进行归因分析。
40.在一个具体例子中,构造结构先验统计出样本中变量的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,根据子图结构,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构。
41.在一些实施例中,构造结构先验在打分函数中加入惩罚因子,使得先验结构融合到后验结构中。
42.如图4所示,本发明提供一种基于知识图谱的归因分析方法的实施例,应用于互联网医疗平台,包括:s201、收集用户输入的医疗诊断检查数据;s202、通过算法模型,对数据进行实体抽取;s203、利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;s204、根据知识图谱和输入信息,抽取相关子图,构造结构先验;s205、结合训练样本,学习建立贝叶斯网络模型;s206、利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
43.在本发明的实施例中,互联网医疗平台可以为心理治疗或者睡眠障碍等。
44.在一些实施例中,互联网医疗平台依据历史已收集的数据进行初步建模,通过建立模型对不同疾病类型、不同人群以及不同检测方案的大数据进行建模。
45.在一些具体的例子中,医疗诊断检查数据包括文本数据和图片数据。
46.在一些具体的例子中,实体抽取包括睡眠障碍与医疗诊断检查数据关系抽取、与
用户行为事件抽取、专家经验实体消歧、疾病和症状知识图谱知识融合和知识处理。
47.在一些具体的例子中,抽取子图利用图神经网络模型对图中节点之间的关系进行预测,挖掘更多因果关系。
48.在一些具体的例子中,方法结合专家经验,构建相关业务领域的知识图谱,基于图片抽取相关子图,在子图上利用图神经网络模型进行节点之间关系的预测,挖掘更多因果关系,构造贝叶斯网络机构先验分布,结合样本学习贝叶斯网络。
49.本发明提供一种基于知识图谱的归因分析方法的实施例,应用于互联网医疗平台,包括:s301、收集用户输入的睡眠障碍体检数据;体检数据包括血液数据、血压数据、尿常规数据、心电图、b超、大脑ct等数据;s302、通过nlp、深度学习、知识图谱等技术,对数据进行实体抽取;实体抽取包括睡眠障碍与体检数据关系抽取、与用户行为事件如熬夜、咖啡因摄入、工作压力、运动量过大等事件抽取、医生经验实体消歧、疾病和症状知识图谱知识融合和知识处理;s303、利用图数据库,rdf资源描述框架等技术对知识进行存储,结合医生专家经验构建知识图谱;知识图谱包括不同的因素、不同的体检数据指标与对应的睡眠障碍和心理疾病的整体数据图谱;s304、根据知识图谱和输入信息,抽取相关子图,构造结构先验;s305、结合训练样本,学习建立贝叶斯网络模型;s306、利用学习建立的贝叶斯网络模型进行归因分析形成睡眠障碍分析结果。
50.在一些实施例中,构造结构先验统计出不同患者用户大数据样本中变量(比如心电图、b超、大脑ct数据或熬夜、咖啡因摄入、工作压力、运动量过大等事件变量)的频数以及变量间的频数,计算得到变量的平均频数以及变量间的平均频数,根据子图结构,将父节点作为尾节点,子节点作为头节点,利用所述频数和平均频数得到节点间的概率分布,根据子图结构,重复构造节点间的概率分布,将得到的子图概率分布作为结构先验参数,结合样本学习得到贝叶斯网络结构。
51.根据另一方面的实施例,还提供一种基于知识图谱的归因分析系统,包括服务器端、客户端和互联网医疗平台,用户通过所述客户端提交医疗诊断检查数据,所述互联网医疗平台,收集用户输入的医疗诊断检查数据,所述服务器端通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
52.在一些实施例中,实体抽取包括睡眠障碍与医疗诊断检查数据关系抽取、与用户行为事件抽取、专家经验实体消歧、疾病和症状知识图谱知识融合和知识处理。
53.根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现以下步骤:通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结
合业务专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析。
54.根据另一方面的实施例,还提供一种计算机程序产品,包括计算机程序 /指令,该计算机程序/指令被处理器执行时实现以下步骤:通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析。
55.根据本说明书的实施例的另一方面,还提供一种电子设备,包括:处理器;以及被设置成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:通过算法模型,对收集到的数据进行实体抽取,利用图数据库对知识进行存储,结合业务专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析。
56.根据本说明书的实施例的另一方面,还提供一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现以下步骤:收集用户输入的医疗诊断检查数据,通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
57.根据本说明书的实施例的另一方面,提供一种计算机程序产品,包括计算机程序 /指令,该计算机程序/指令被处理器执行时实现以下步骤:收集用户输入的医疗诊断检查数据,通过算法模型,对数据进行实体抽取,利用图数据库对知识进行存储,结合医生专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
58.根据本说明书的实施例的另一方面,提供一种电子设备,包括:处理器;以及被设置成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:收集用户输入的医疗诊断检查数据,通过算法模型,对数据进行实体抽取,利用图
数据库对知识进行存储,结合医生专家经验构建知识图谱;根据知识图谱和输入信息,抽取相关子图,构造结构先验,结合训练样本,学习建立贝叶斯网络模型;利用学习建立的贝叶斯网络模型进行归因分析形成分析结果。
59.本发明基于知识图谱的归因分析方法、系统及设备,通过构造领域知识图谱,利用图谱抽取子图,构造结构先验知识,最后利用训练学习的贝叶斯网络进行归因分析,可以有效利用专家经验,降低模型对样本量的要求,提升模型的性能, 加速模型训练速度,在缺乏心理疾病或睡眠障碍大数据的情况下能够将专家经验结合模型训练得到有效的分析结果。
60.为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本技术时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
61.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
62.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
63.本技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
64.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
65.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
66.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
67.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
68.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd

rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
69.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
70.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
71.以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1