医学知识图谱的构建方法、装置及辅助诊断方法与流程

文档序号:11230978阅读:400来源:国知局
医学知识图谱的构建方法、装置及辅助诊断方法与流程

本发明涉及数据处理技术领域,尤其涉及一种医学知识图谱的构建方法、装置及辅助诊断方法。



背景技术:

知识图谱作为一个结构化的信息网络,打破了原有的关系型数据库的限制,具有非常强大的表达能力,它在信息检索和信息整合等领域扮演着越来越重要的角色,可以为用户提供更广度、更深度的知识体系并不断扩充。

目前,知识图谱的应用非常广泛,在医学领域中,构建医学知识图谱,可以将病症、疾病与诊疗手段之间的错综复杂的关系,通过知识图谱构建成数据库,从而可以为医护人员提供很好的辅助诊断手段。但是,现有的医学知识图谱的结构比较简单,并且在利用知识图谱进行辅助诊断上,由于知识图谱的结构限制,不能很好地为医护人员提供帮助。



技术实现要素:

基于上述问题,本发明提供一种医学知识图谱的构建方法、装置及辅助诊断方法,能够为临床医学提供智能化的辅助诊断。

为解决上述问题,本发明提供了一种医学知识图谱的构建方法,包括:

收集医学数据库中的数据,构建用户词典;

根据所述用户词典和停止词词库,对电子病历数据进行处理;

将处理后的数据进行命名实体识别;

将识别的各个实体建立关联关系;

根据各个实体以及各个实体之间的关联关系,建立医学知识图谱。

其中,所述将处理后的数据进行命名实体识别,具体还包括:

通过处理后的诊断数据得到疾病实体,通过处理后的体检数据得到体征实体,根据处理后的患者主诉数据得到症状实体,根据处理意见数据得到处理实体,根据科室信息得到科室实体。

其中,所述将识别的各个实体建立关联关系,具体包括:

对疾病实体,分别与症状实体、体征实体、处理实体、科室实体建立关联关系;

其中,所述关联关系强度采用以下公式:

z=x/y

其中,y表示某项疾病的病历份数,x表示某项疾病的病历中目标实体出现的总次数,所述目标实体为症状实体、体征实体、处理实体、科室实体中的任一个。

其中,所述根据各个实体以及各个实体之间的关联关系,建立医学知识图谱,具体包括:

将处理后的实体依据关联关系形成的实体对及其相应的关联关系强度值导入neo4j图形数据库,并可视化,生成所述医学知识图谱。

其中,所述方法还包括:

根据当前获取的患者诊断结果和患者主诉及检查数据,对相应实体之间的关联强度进行实时更新。在本发明的另一个方面,提供一种基于医学知识图谱的计算机辅助诊断方法,包括:

获取患者的主诉数据和检查数据;

对所述主诉数据和检查进行预处理,得到患者的症状实体和体征实体构成的集合;

在医学知识图谱中查找与所述症状实体和体征实体相关联的疾病实体集合;

根据所述疾病实体集合和每个疾病实体所对应的症状实体与体征实体构成的集合,分别计算每个疾病实体在其对应的症状实体与体征实体构成的集合下的后验概率;

输出后验概率最大的疾病实体及其关联节点对应的数据。

其中,所述计算每个疾病实体在其对应子集下的后验概率,具体包括:

对于疾病di,在对应的症状实体与体征实体构成的子集{t1,t2,...tk}下的后验概率为:

其中,k为症状实体与体征实体的个数,k为症状实体与体征实体的个数。

通过所述症状实体与知识图谱中的疾病实体的关系强度值

在本发明的又一个方面,提供一种医学知识图谱的构建装置,所述装置包括:

用户词典构建单元,用于收集医学数据库中的数据,构建用户词典;

数据处理单元,用于根据所述用户词典和停止词词库,对电子病历数据进行处理;

实体识别单元,用于对数据处理单元处理后的数据进行命名实体识别;

关联关系建立单元,用于对实体识别单元形成的各个实体建立关联关系;

医学知识图谱构建单元,用于根据所述各个实体以及各个实体之间的关联关系,建立医学知识图谱。

其中,所述实体识别单元,具体包括:

疾病实体识别子单元,用于对处理后的诊断数据进行命名实体识别,得到疾病实体;

体征实体识别子单元,用于对处理后的体检数据进行命名实体识别,得到体征实体;

症状实体识别子单元,用于对处理后的患者主诉数据进行命名实体识别,得到症状实体;

处理实体识别子单元,用于对处理后的处理意见数据进行命名实体识别,得到处理实体;

科室实体识别子单元,用于对处理后的科室信息进行命名实体识别,得到科室实体。

其中,所述装置还包括:

更新单元,用于根据当前获取的患者诊断结果和患者主诉及检查数据,对相应实体之间的关联强度进行实时更新。本发明的医学知识图谱的构建方法、装置及辅助诊断方法,通过使用医学知识图谱进行辅助诊断,能够减轻医护人员工作负担,有效缓解医疗压力,从而降低医疗事故的发生。同时,对于医护工作者凭借经验不能确诊的病例,提供了精确的计算机辅助诊断,对医护人员工作的有力支撑。

此外,对于没有相应医学专业知识背景的普通人,通过自身症状,依靠系统而了解自身所患的疾病信息以及相应的治疗意见,了解基本的可行的疾病应对方法。

附图说明

图1示出了本发明的医学知识图谱的构建方法的流程图。

图2示出了本发明的基于医学知识图谱的辅助诊断方法的流程图。

图3示出了本发明的医学知识图谱的构建装置的结构框图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

图1示出了本发明的医学知识图谱的构建方法的流程图。

参照图1,本发明的医学知识图谱的构建方法,具体包括以下步骤:

s11、收集医学数据库中的数据,构建用户词典。

在本实施例中,在现有的医学数据库中,依据icd-10和icd-9-cm,收集相关的数据,构建成用户词典。

s12、根据所述用户词典和停止词词库,对电子病历数据进行处理。

本实施例中,构建知识图谱使用的数据可以是从现有的电子病历中获取的数据,如患者主诉、科室、病史、体检、诊断、处理意见等相关数据,然后根据用户词典以及停止词词库,可以使用相关的医学语言处理技术(mlp)对电子病历的数据进行处理,也可以对数据进行文本分词,去除停止词等处理,使得构建知识图谱的数据更精确。

s13、将处理后的数据进行命名实体识别。

在一个实施例中,可以通过条件随机场模型(crf)机器学习的方法,运用crf++工具进行命名实体识别,如一个实施例中,通过处理后的诊断数据得到疾病实体,通过处理后的体检数据得到体征实体,根据处理后的患者主诉数据得到症状实体,根据处理意见数据得到处理实体,根据科室信息得到科室实体。

s14、将识别的各个实体建立关联关系。

本实施例中,对疾病实体,分别与症状实体、体征实体、处理实体、科室实体建立关联关系,该关联关系强度采用以下公式:

z=x/y

其中,y表示某项疾病的病历份数,x表示某项疾病的病历中目标实体出现的总次数,所述目标实体为症状实体、体征实体、处理实体、科室实体中的任一个。

s15、根据各个实体以及各个实体之间的关联关系,建立医学知识图谱。

具体地,将处理后的实体依据关联关系形成的实体对及其相应的关联关系强度值导入neo4j图形数据库,并可视化,生成所述医学知识图谱。

在进一步的实施例中,当使用上述知识图谱进行辅助诊断后,根据诊断后的疾病结果,以及患者的主诉及检查数据,对相应实体之间的关联强度值进行更新,其关系强度为z=(x+1)/(y+1),其中y为已处理录入的该项疾病的病历份数,x为已处理录入的该项疾病的病历中目标实体出现次数。

本发明的医学知识图谱,将电子病历作为建立知识图谱的源数据,通过建立各个实体之间的关联关系,从而能够建立精确的知识图谱,为医护人员对疾病的针对起到很好的辅助作用,并能够为医护人员减轻工作负担,有效缓解了医疗压力,从而降低医疗事故的发生。

在本发明的另一个实施例中,提供一种基于医学知识图谱的辅助诊断方法,如图2所示,其具体步骤包括:

s21、获取患者的主诉数据和检查数据;

s22、对所述主诉数据和检查数据进行预处理,得到患者的症状实体和体征实体构成的集合;如对主诉数据和检查数据进行文本分词、去除停止词、以及命名实体识别处理等,以得到症状实体和体征实体构成的集合。

s23、在医学知识图谱中查找与所述症状实体和体征实体相关联的疾病实体集合;

根据步骤s22得到的症状实体和体征实体的集合中的实体与疾病实体的关联关系,在医学知识图谱中查找疾病实体集合d{d1,d2,...dn}。

在上述过程中,可以设定疾病di对症状实体或体征实体sj的条件概率p(sj|di)为两实体之间的关系强度值,即p(sj|di)=x/y。

s24、根据步骤s23得到的疾病实体和步骤s22得到的每个疾病实体所对应的症状实体与体征实体构成的集合,分别计算每个疾病实体在其对应的症状实体与体征实体构成的集合下的后验概率;

s25、输出后验概率最大的疾病实体及其关联节点对应的数据。

在上述过程中,对应疾病实体集合d中的n个疾病实体,通过关联关系找到症状实体与体征实体对应的n个集合。对于疾病di,在对应的症状实体与体征实体构成的集合{t1,t2,...tk}下的后验概率为:

其中,n为疾病实体的个数,k为症状实体与体征实体的个数,即上述后验概率为:

通过上述计算的后验概率,将后验概率最大的疾病及其关联节点对应的数据作为诊断结果。

本实施例的基于医学知识图谱的计算机辅助诊断方法,使用终端设备采集患者主诉,检查数据,并对数据进行医学语言处理mlp(分词、去停止词),命名实体识别处理,得到相应实体信息,依托已构建的医学知识图谱,通过关联关系,找到对应的候选疾病集,然后采用贝叶斯算法进行辅助诊断,确认患者所患何种疾病,为临床医学提供智能化的辅助诊断。

在本发明的又一个实施例中,提供一种医学知识图谱的构建装置,如图2所示,该装置包括:

用户词典构建单元10,用于收集医学数据库中的数据,构建用户词典;

数据处理单元20,用于根据所述用户词典和停止词词库,对电子病历数据进行处理;

实体识别单元30,用于对数据处理单元处理后的数据进行命名实体识别;

关联关系建立单元40,用于对实体识别单元30形成的各个实体建立关联关系;

医学知识图谱构建单元50,用于根据所述各个实体以及各个实体之间的关联关系,建立医学知识图谱。

具体地,上述实施例中,实体识别单元30包括:

疾病实体识别子单元,用于对处理后的诊断数据进行命名实体识别,得到疾病实体;

体征实体识别子单元,用于对处理后的体检数据进行命名实体识别,得到体征实体;

症状实体识别子单元,用于对处理后的患者主诉数据进行命名实体识别,得到症状实体;

处理实体识别子单元,用于对处理后的处理意见数据进行命名实体识别,得到处理实体;

科室实体识别子单元,用于对处理后的科室信息进行命名实体识别,得到科室实体。

在又一个实施例中,本发明的医学知识图谱的构建装置还包括:更新单元,用于根据当前获取的患者诊断结果和患者主诉及检查数据,对相应实体之间的关联强度进行实时更新。

本发明的医学知识图谱的构建方法、装置及辅助诊断方法,通过使用医学知识图谱进行辅助诊断,能够减轻医护人员工作负担,有效缓解医疗压力,从而降低医疗事故的发生。同时,对于医护工作者凭借经验不能确诊的病例,提供了精确的计算机辅助诊断,对医护人员工作的有力支撑。

此外,对于没有相应医学专业知识背景的普通人,通过自身症状,依靠系统而了解自身所患的疾病信息以及相应的治疗意见,了解基本的可行的疾病应对方法。

以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1