一种医学健康领域知识图谱的关系抽取方法及系统与流程

文档序号:18267633发布日期:2019-07-27 09:19阅读:305来源:国知局
一种医学健康领域知识图谱的关系抽取方法及系统与流程

本发明属于知识图谱技术领域,尤其涉及一种医学健康领域知识图谱的关系抽取方法及系统。



背景技术:

知识图谱(knowledgegraph)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。然而,现有医学健康领域知识图谱不能采用自然语言查询问句直接进行知识图谱检索,需要根据查询需要构造查询模式图,再进行信息检索,给知识图谱检索带来很大的不便;同时,知识图谱更新效果差,关联性差。

综上所述,现有技术存在的问题是:现有医学健康领域知识图谱不能采用自然语言查询问句直接进行知识图谱检索,需要根据查询需要构造查询模式图,再进行信息检索,给知识图谱检索带来很大的不便;同时,知识图谱更新效果差,关联性差。



技术实现要素:

针对现有技术存在的问题,本发明提供了一种医学健康领域知识图谱的关系抽取方法及系统。

本发明是这样实现的,一种医学健康领域知识图谱的关系抽取系统包括:

知识资源采集模块、检索模块、主控模块、挖掘模块、分析模块、关联模块、整合构建模块、绘制模块、更新模块、显示模块;

知识资源采集模块,与主控模块连接,用于通过数据采集设备采集医学健康领域知识资源数据;

检索模块,与主控模块连接,用于通过检索程序检索目标健康知识资源;

主控模块,与知识资源采集模块、检索模块、挖掘模块、分析模块、关联模块、整合构建模块、绘制模块、更新模块、显示模块连接,用于通过单片机控制各个模块正常工作;

挖掘模块,与主控模块连接,用于通过挖掘程序对检索的健康知识进行挖掘操作;

分析模块,与主控模块连接,用于通过分析程序分析健康知识含义、类别;

关联模块,与主控模块连接,用于通过关联程序根据分析结果进行关联操作;

整合构建模块,与主控模块连接,用于通过构建程序构建知识关联模型;

绘制模块,与主控模块连接,用于通过绘制程序根据关联模型绘制出可视化的关联图谱;

更新模块,与主控模块连接,用于通过更新程序对健康知识图谱进行更新操作;

显示模块,与主控模块连接,用于通过显示器显示医学健康领域知识图谱。

一种医学健康领域知识图谱的关系抽取方法包括以下步骤:

步骤一,通过知识资源采集模块利用数据采集设备采集医学健康领域知识资源数据;通过检索模块利用检索程序检索目标健康知识资源;

步骤二,主控模块通过挖掘模块利用挖掘程序对检索的健康知识进行挖掘操作;

步骤三,通过分析模块利用分析程序分析健康知识含义、类别;通过关联模块利用关联程序根据分析结果进行关联操作;

步骤四,通过整合构建模块利用构建程序构建知识关联模型;通过绘制模块利用绘制程序根据关联模型绘制出可视化的关联图谱;

步骤五,通过更新模块利用更新程序对健康知识图谱进行更新操作;

步骤六,通过显示模块利用显示器显示医学健康领域知识图谱。

进一步,所述检索模块检索方法如下:

(1)根据查询日志选取训练样本,对训练样本进行处理,建立查询问句与查询结构图之间的对应关系,根据所述对应关系训练得到语义识别模型,构建贝叶斯分类器;

(2)通过语义识别模型及贝叶斯分类器将用户输入的自然语言查询问句映射到最大概率的查询结构图上,并将所述查询结构图作为查询模式图进行知识图谱检索。

进一步,所述步骤(1)中,包括:

a、命名实体识别并实体标注所述训练样本中的查询问句,得到实体标签,根据所述实体标签挖掘对应的查询结构图,采用查询结构图对应的id标注所述查询问句,得到实体标签对应的查询结构图标签;

b、语义标注所述步骤a中完成实体标注的查询问句,将查询问句的实体标签转换成对应的语义标签,建立语义标签和查询结构图标签之间的对应关系;

c、将包含语义标签的查询问句作为训练数据,采用训练工具进行训练,得到语义识别模型;

d、将包含语义标签和查询结构图标签的查询问句作为训练数据进行训练,得到贝叶斯分类器模型参数,构建贝叶斯分类器。

进一步,所述更新模块更新方法如下:

1)获取目标关键词;

2)从预先建立的知识图谱包括的表征健康知识的实体中,确定至少一个对应的属性信息与所述目标关键词相匹配的实体作为匹配实体;

3)建立所确定的至少一个匹配实体的上级实体,以及基于匹配实体的属性信息,生成所述上级实体的属性信息;

4)将所述上级实体和所述上级实体的属性信息加入所述知识图谱中。

进一步,所述目标关键词的数量为至少一个,用于表征健康知识的实体的属性信息包括用于描述视频的至少一个关键词;

所述从预先建立的知识图谱包括的表征健康知识的实体中,确定至少一个对应的属性信息与所述目标关键词相匹配的实体作为匹配实体,包括:

计算所获取的至少一个目标关键词与用于表征健康知识的实体对应的至少一个关键词之间的相似度,将大于等于预设的相似度阈值的相似度对应的实体确定为匹配实体。

本发明的优点及积极效果为:本发明通过检索模块根据查询问句对应的查询结构图的id标注查询问句,建立查询问句与查询结构图的对应关系,此外,对查询问句进行语义标注,并据此训练出语义识别模型,同时,建立起查询结构图和语义标签的对应关系,再利用朴素贝叶斯方法训练贝叶斯分类模型参数,构建贝叶斯分类模型,当输入自然语言查询问句进行信息检索时,语义识别模型将查询问句转换成对应的语义标签序列,通过贝叶斯分类模型计算查询问句映射到对应的每类查询结构图的概率,选取最大概率值的查询结构图作为查询模式图,进行知识图谱检索;可以更加准确地理解用户的查询意图,提高检索的准确率,普通用户在知识图谱检索过程中也更加便捷;同时,通过更新模块建立知识图谱中的、表征相似视频或同类视频的实体的上级实体,实现对知识图谱中的实体的聚类,有助于提高知识图谱中的实体之间的关联性,以及有助于提高利用知识图谱搜索的全面性。

附图说明

图1是本发明实施例提供的医学健康领域知识图谱的关系抽取方法流程图。

图2是本发明实施例提供的医学健康领域知识图谱的关系抽取系统结构框图。

图3是本发明实施例提供的关联模块结构框图。

图2中:1、知识资源采集模块;2、检索模块;3、主控模块;4、挖掘模块;5、分析模块;6、关联模块;7、整合构建模块;8、绘制模块;9、更新模块;10、显示模块。

图3中:11、接收模块;12、关联程度计算模块;13、关联操作模块。

具体实施方式

为能进一步了解本发明的发明内容、特点及功效,兹例举以下实施例,并配合附图详细说明如下。

下面结合附图对本发明的结构作详细的描述。

如图1所示,本发明提供的医学健康领域知识图谱的关系抽取方法包括以下步骤:

步骤s101,通过知识资源采集模块利用数据采集设备采集医学健康领域知识资源数据;通过检索模块利用检索程序检索目标健康知识资源;

步骤s102,主控模块通过挖掘模块利用挖掘程序对检索的健康知识进行挖掘操作;

步骤s103,通过分析模块利用分析程序分析健康知识含义、类别;通过关联模块利用关联程序根据分析结果进行关联操作;

步骤s104,通过整合构建模块利用构建程序构建知识关联模型;通过绘制模块利用绘制程序根据关联模型绘制出可视化的关联图谱;

步骤s105,通过更新模块利用更新程序对健康知识图谱进行更新操作;

步骤s106,通过显示模块利用显示器显示医学健康领域知识图谱。

如图2所示,本发明实施例提供的医学健康领域知识图谱的关系抽取系统包括:知识资源采集模块1、检索模块2、主控模块3、挖掘模块4、分析模块5、关联模块6、整合构建模块7、绘制模块8、更新模块9、显示模块10。

知识资源采集模块1,与主控模块3连接,用于通过数据采集设备采集医学健康领域知识资源数据;

检索模块2,与主控模块3连接,用于通过检索程序检索目标健康知识资源;

主控模块3,与知识资源采集模块1、检索模块2、挖掘模块4、分析模块5、关联模块6、整合构建模块7、绘制模块8、更新模块9、显示模块10连接,用于通过单片机控制各个模块正常工作;

挖掘模块4,与主控模块3连接,用于通过挖掘程序对检索的健康知识进行挖掘操作;

分析模块5,与主控模块3连接,用于通过分析程序分析健康知识含义、类别;

关联模块6,与主控模块3连接,用于通过关联程序根据分析结果进行关联操作;

整合构建模块7,与主控模块3连接,用于通过构建程序构建知识关联模型;

绘制模块8,与主控模块3连接,用于通过绘制程序根据关联模型绘制出可视化的关联图谱;

更新模块9,与主控模块3连接,用于通过更新程序对健康知识图谱进行更新操作;

显示模块10,与主控模块3连接,用于通过显示器显示医学健康领域知识图谱。

如图3所示,本发明实施例提供的关联模块6包括:接收模块11、关联程度计算模块12、关联操作模块13。

接收模块11,用于接收分析模块5的健康知识含义、类别分析等分析结果;

关联程度计算模块,通过关联程序对知识资源数据根据健康知识的含义、类别进行关联程度计算;

关联操作模块,按关联程度计算结果对知识资源数据进行关联操作。

本发明提供的检索模块2检索方法如下:

(1)根据查询日志选取训练样本,对训练样本进行处理,建立查询问句与查询结构图之间的对应关系,根据所述对应关系训练得到语义识别模型,构建贝叶斯分类器;

(2)通过语义识别模型及贝叶斯分类器将用户输入的自然语言查询问句映射到最大概率的查询结构图上,并将所述查询结构图作为查询模式图进行知识图谱检索。

本发明提供的步骤(1)中,包括:

a、命名实体识别并实体标注所述训练样本中的查询问句,得到实体标签,根据所述实体标签挖掘对应的查询结构图,采用查询结构图对应的id标注所述查询问句,得到实体标签对应的查询结构图标签;

b、语义标注所述步骤a中完成实体标注的查询问句,将查询问句的实体标签转换成对应的语义标签,建立语义标签和查询结构图标签之间的对应关系;

c、将包含语义标签的查询问句作为训练数据,采用训练工具进行训练,得到语义识别模型;

d、将包含语义标签和查询结构图标签的查询问句作为训练数据进行训练,得到贝叶斯分类器模型参数,构建贝叶斯分类器。

本发明提供的更新模块9更新方法如下:

1)获取目标关键词;

2)从预先建立的知识图谱包括的表征健康知识的实体中,确定至少一个对应的属性信息与所述目标关键词相匹配的实体作为匹配实体;

3)建立所确定的至少一个匹配实体的上级实体,以及基于匹配实体的属性信息,生成所述上级实体的属性信息;

4)将所述上级实体和所述上级实体的属性信息加入所述知识图谱中。

本发明提供的目标关键词的数量为至少一个,用于表征健康知识的实体的属性信息包括用于描述视频的至少一个关键词;

所述从预先建立的知识图谱包括的表征健康知识的实体中,确定至少一个对应的属性信息与所述目标关键词相匹配的实体作为匹配实体,包括:

计算所获取的至少一个目标关键词与用于表征健康知识的实体对应的至少一个关键词之间的相似度,将大于等于预设的相似度阈值的相似度对应的实体确定为匹配实体。

以上所述仅是对本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所做的任何简单修改,等同变化与修饰,均属于本发明技术方案的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1