患者信息知识图谱构建方法、可读存储介质和终端与流程

文档序号:16628841发布日期:2019-01-16 06:22阅读:239来源:国知局
患者信息知识图谱构建方法、可读存储介质和终端与流程

本发明涉及医疗技术领域,具体地涉及一种患者信息知识图谱构建方法、可读存储介质和终端。



背景技术:

智慧医疗是近几年兴起的一门融合了生命科学和信息技术的交叉学科,未来的医疗智能系统的关键组成部分将会是信息管理以及有效诊断。智慧医疗利用物联网技术打造区域医疗信息平台,通过建立人的电子健康档案,使得患者与医务人员、医疗机构、医疗设备之间的联系更加紧密,从而达到医疗全面信息化的目标。

知识图谱作为一种在大数据背景下产生的新型表示知识的方式,将为数据提供新的管理模式,近些年它已成为知识服务领域的新热点,受到国内外学者广泛关注。随着科技高速发展,医院的信息化程度日益提升,利用知识图谱强大的语义检索能力,从海量医学电子数据中提炼出医疗知识,构建医疗领域的知识图谱,有望带来更高效精准的医疗服务。

但是,现有的医学知识图谱存在着数据不够全面的问题,降低了医学知识图谱的参考价值。



技术实现要素:

本发明解决的技术问题是如何构建更加全面的医学知识图谱数据,从而提高医学知识图谱的参考价值。

为解决上述技术问题,本发明实施例提供了一种患者信息知识图谱构建方法,所述方法包括:

从所获取的患者电子病历和个人生活习惯信息中识别出对应的实体;

对识别出的实体进行关系识别,得到实体之间的实体关系;

构建本体中实体与不同数据源知识中的实体之间的映射关系;

通过将相同数据源中的相同的实体进行实体融合,实现实体歧义消除;

对歧义消除后得到的实体进行实体解析,消除冗余实体;

对消除冗余后所得到的实体之间的实体关系进行补齐和纠正;

将补齐和纠正后得到的实体关系及对应的实体所组成的三元组数据导入数据库中进行可视化,得到患者信息知识图谱。

可选地,所述从所获取的患者电子病历中识别出对应的实体,包括:

采用实体链接技术从所获取的患者电子病历中识别出对应的实体。

可选地,所述从所获取的患者电子病历中识别出对应的实体,包括:

所述从所获取的患者个人生活习惯信息中识别出对应的实体,包括:

通过命名识别技术从所获取的患者个人生活习惯信息中识别出对应的实体。

可选地,所述从所获取的患者电子病历中识别出对应的实体,包括:

所述构建本体中实体与不同数据源知识中的实体之间的映射关系,包括:

采用数据映射技术构建本体中实体与不同数据源知识中的实体之间的映射关系。

可选地,所述从所获取的患者电子病历中识别出对应的实体,包括:

所述通过将相同数据源中的相同的实体进行实体融合,进行实体歧义消除,包括:

通过将具有歧义的实体指称项链接到给定的知识库中,将相同数据源中的相同的实体进行实体融合,进行实体歧义消除。

可选地,所述从所获取的患者电子病历中识别出对应的实体,包括:

所述对消除冗余后所得到的实体之间的实体关系进行补齐和纠正,包括:

采用链接预测技术对消除冗余后所得到的实体之间的实体关系进行补齐和纠正。

本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一项所述的患者信息知识图谱构建方法的步骤。

与现有技术相比,本发明实施例的技术方案具有以下有益效果:

上述的方案,从所获取的患者电子病历和个人生活习惯信息中识别出对应的实体;对识别出的实体进行关系识别,得到实体之间的实体关系;构建本体中实体与不同数据源知识中的实体之间的映射关系;通过将相同数据源中的相同的实体进行实体融合,实现实体歧义消除;对歧义消除后得到的实体进行实体解析,消除冗余实体;对消除冗余后所得到的实体之间的实体关系进行补齐和纠正;将补齐和纠正后得到的实体关系及对应的实体所组成的三元组数据导入数据库中进行可视化,得到患者信息知识图谱;通过加入人们患者日常生活习惯方面的数据至医学知识图谱中,可以提升所建立的医学知识图谱的数据的全面性,进而可以提高医学知识图谱的参考价值。

附图说明

图1是本发明实施例中的一种患者信息知识图谱构建方法的流程示意图;

图2是本发明实施例中的一种基于知识图谱的患者信息处理装置的结构示意图。

具体实施方式

本发明实施例中的技术方案通过加入人们患者日常生活习惯方面的数据至医学知识图谱中,可以提升所建立的医学知识图谱的数据的全面性,进而可以提高医学知识图谱的参考价值。

为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。

图1是本发明实施例中的一种患者信息知识图谱构建方法的流程示意图。参见图1,本发明实施例中的一种患者信息知识图谱构建方法,具体可以包括如下的步骤:

步骤s101:从所获取的患者电子病历和个人生活习惯信息中识别出对应的实体。

在本发明一实施例中,在从所获取的患者电子病历中识别出对应的实体时,可以使用实体链接技术将病历数据中可能的候选实体链接到预设的医学知识库上,从而识别出电子病历文本中的实体,并将无用知识剔除。

在本发明一实施例中,所获取的患者个人生活习惯信息,包括姓名、年龄、身高、体重、性别、婚姻状况、血型、饮食、作息、职业、家族病史等,并使用命名识别技术识别出患者生活习惯信息文本中的实体,并剔除无用知识。

步骤s102:对识别出的实体进行关系识别,得到实体之间的实体关系。

在本发明一实施例中,利用双层训练分类模型-长短期记忆网络-循环神经网络(longshorttermmemorynetwork-recurrentneuralnetworks,lstm-rnn)模型,进行匹配链接,以对从电子病历和患者个人信息的电子文档中抽取实体进行实体关系识别。其中,长短期记忆网络-循环神经网络模型中,第一层由长短期记忆网络模型根据输入词向量、位置信息等来识别试题类型,训练得到的长短期记忆网络中隐藏层的分布式表达和实体的分类标签信息,作为第二层的循环神经网络模型的输入,由循环神经网络模型训练对实体关系的分类。

步骤s103:构建本体中实体与不同数据源知识中的实体之间的映射关系。

在具体实施中,可以采用数据映射技术建立本体中实体和不同数据源抽取知识中实体之间的映射关系,将不同数据源的实体数据融合在一起。例如,可以采用模式匹配技术进行数据融合,结合多种匹配算法,对基本术语做相似度计算,对计算结果进行合并,然后进行一致性检查后去除导致不一致的对应关系,不断循环此过程,直至不能再找到新的实体关系为止。

步骤s104:通过将相同数据源中的相同的实体进行实体融合,实现实体歧义消除。

在具体实施中,通过将具有歧义的实体指称项链接到给定的知识库中,识别出对应的实体,并对识别出来的实体进行两两组合,进行关系分类,最后把存在实体关系的实体和对应的实体关系作为三元组数据,与候选实体之间进行语义相似度计算,从而实现实体歧义消除。

步骤s105:对歧义消除后得到的实体进行实体解析,消除冗余实体。

在具体实施中,实体名称相同可能代表事物不同,也可能是不同的实体名称却代表着同一个事物。实体解析的过程就是根据知识推理链接技术,通过上下文的语义实体解析预测出不同实体是否代表同一个事物,以此删除冗余的实体。

具体地,可以将已经确定关系、分组完成的实体作为对象推入事件缓冲队列中,触发推理机制,启动知识推理,在检测到数据异常状态时,先根据目前异常状态正向推理出可能的原因,再通过反向推理进一步求证,排除部分原因,接着再进行正向推理,对推理结果进行自适应学习,不断地修正推理规则。

步骤s106:对消除冗余后所得到的实体之间的实体关系进行补齐和纠正。

在具体实施中,采用链接预测技术对消除冗余后所得到的实体之间的实体关系进行补齐和纠正,即对知识图谱中可能存在的关系进行链接预测,将实体与实体之间缺失的关系进行补齐,并纠正实体之间错误的关系。具体而言,可以把各种不良症状的实体划分成不重叠的两个范围,一部分作为训练症状,另一部分作为测试症状,然后从症状与患疾病的关系网络中提取要得到的训练数据集,选取在训练症状中与患某疾病关联的作息作为训练样本,根据症状在测试症状中是否会产生影响,将对应的训练样本的类标号属性设为真或假,由此将链接预测问题转化成了二元分类问题。该推理方法,同样也适用于某不良生活作息与患病的关系之间的推理。

步骤s107:将补齐和纠正后得到的实体关系及对应的实体所组成的三元组数据导入数据库中进行可视化,得到患者信息知识图谱。

在具体实施中,在确定最终的实体及实体关系是,可以将对应的实体和实体关系构成对应的三元组数据,并将所确定的三元组数据导入数据库中进行可视化操作,生成较为全面的病患个人信息知识图谱。

上述的方案,通过加入人们患者日常生活习惯方面的数据至医学知识图谱中,可以提升所建立的医学知识图谱的全面性,进而可以提高医学知识图谱的参考价值。

上述对本发明实施例中的方法进行描述,下面将对上述的方法对应的额装置进行介绍。

图2示出了本发明实施例中的一种基于知识图谱的患者信息处理装置的结构示意图。参见图2,本发明实施例中的一种基于知识图谱的患者信息处理装置20可以包括实体识别单元201、关系识别单元202、数据映射单元203、歧义消除单元204、冗余消除单元205、关系推理单元206和可视化单元207,其中:

所述实体识别单元201,适于从所获取的患者电子病历和个人生活习惯信息中识别出对应的实体;在本发明一实施例中,所述实体识别单元201,适于采用实体链接技术从所获取的患者电子病历中识别出对应的实体,并通过命名识别技术从所获取的患者个人生活习惯信息中识别出对应的实体。

所述关系识别单元202,适于对识别出的实体进行关系识别,得到实体之间的实体关系,

所述数据映射单元203,适于构建本体中实体与不同数据源知识中的实体之间的映射关系;在本发明一实施例中,所述数据映射单元203,适于采用数据映射技术构建本体中实体与不同数据源知识中的实体之间的映射关系。

所述歧义消除单元204,适于通过将相同数据源中的相同的实体进行实体融合,实现实体歧义消除;在本发明一实施例中,所述歧义消除单元204,适于通过将具有歧义的实体指称项链接到给定的知识库中,将相同数据源中的相同的实体进行实体融合,进行实体歧义消除。

所述冗余消除单元205,适于对歧义消除后得到的实体进行实体解析,消除冗余实体;

所述关系推理单元206,适于对消除冗余后所得到的实体之间的实体关系进行补齐和纠正;在本发明一实施例中,所述关系推理单元206,适于采用链接预测技术对消除冗余后所得到的实体之间的实体关系进行补齐和纠正。

所述可视化单元207,适于将补齐和纠正后得到的实体关系及对应的实体所组成的三元组数据导入数据库中进行可视化,得到患者信息知识图谱。

本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述的患者信息知识图谱构建方法的步骤。其中,所述患者信息知识图谱构建方法请参见前述部分的介绍,不再赘述。

本发明实施例还提供了一种终端,包括存储器和处理器,所述存储器上储存有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述的患者信息知识图谱构建方法的步骤。其中,所述患者信息知识图谱构建方法请参见前述部分的介绍,不再赘述。

采用本发明实施例中的上述方案,从所获取的患者电子病历和个人生活习惯信息中识别出对应的实体;对识别出的实体进行关系识别,得到实体之间的实体关系;构建本体中实体与不同数据源知识中的实体之间的映射关系;通过将相同数据源中的相同的实体进行实体融合,实现实体歧义消除;对歧义消除后得到的实体进行实体解析,消除冗余实体;对消除冗余后所得到的实体之间的实体关系进行补齐和纠正;将补齐和纠正后得到的实体关系及对应的实体所组成的三元组数据导入数据库中进行可视化,得到患者信息知识图谱。通过加入人们患者日常生活习惯方面的数据至医学知识图谱中,可以提升所建立的医学知识图谱的数据的全面性,进而可以提高医学知识图谱的参考价值。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:rom、ram、磁盘或光盘等。

虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1