一种基于本体的医学数据整合方法及系统与流程

文档序号:18740184发布日期:2019-09-21 01:41阅读:228来源:国知局
一种基于本体的医学数据整合方法及系统与流程

本发明涉及医学数据处理技术领域,更具体地,涉及一种基于本体的医学数据整合方法及系统。



背景技术:

对于生物医学研究和药物发现特定领域,生物医学知识和相应的数据庞大,比如,基因组数据、蛋白代谢组数据、菌群数据等相同医学领域的数据,由于医学数据来源不同、医学数据的格式不同,导致这些医学数据之间无法打通实现基于意义的关联,这些医学数据之间很难互相利用,对生物医学领域的研究带来很大的困扰。



技术实现要素:

本发明提供一种基于本体的医学数据整合方法及系统,克服了不同来源、不同格式的医学数据之间无法融合的问题。

根据本发明的一个方面,提供了一种基于本体的医学数据整合方法,包括:

获取多种不同来源的医学研究数据信息;

确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库;

按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段;

将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中。

本发明的有益效果为:将不同来源、不同格式的医学数据进行标准结构化,有利于不同格式的医学数据之间的查询和利用,更好地实现了不同来源、不同格式的医学数据的融合。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步的,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库具体包括:

根据所述医学研究数据信息的来源,确定该医学研究数据信息所属的医学领域;

根据所述医学研究数据信息所属的医学领域,确定所述医学研究数据信息对应的医学本体,进而根据所述医学本体确定对应的结构化模型数据库。

进一步的,所述对象类型包含多个关键词字段,所述根据所述医学本体包含的对象类型,对所述医学研究数据信息进行切割具体包括:

根据所述对象类型中包含的每一个关键词字段,将所述医学研究数据信息切割为多个医学研究数据信息片段,所述关键词字段可表征医学研究数据信息片段的含义。

进一步的,根据所述对象类型中包含的每一个关键词字段,将所述医学研究数据信息切割为多个医学研究数据信息片段具体包括:

将所述医学研究数据信息与每一个关键词字段进行语义匹配,切割出每一个所述关键词字段对应的医学研究数据信息片段。

进一步的,所述将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于所述关系数据库中具体包括:

将每一个所述医学研究数据信息片段与所述对象类型包含的关键词字段一一对应输入结构化模型数据库中,从而将所述不同来源的医学研究数据信息转换为标准的结构化模型数据。

进一步的,所述将切割后的各段医学研究数据信息输入到所述对象类型的相应位置处,并存储于所述关系数据库中之后还包括:

根据关键词字段或者关键词字段组合在所述结构化模型数据库中查询对应的医学研究数据信息片段,并将所述医学研究数据信息片段相关数据以网页形式呈现。

根据本发明的另一个方面,提供了一种基于本体的医学数据整合系统,包括:

获取模块,用于获取多种不同来源的医学研究数据信息;

确定模块,基于确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库;

切割模块,用于按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段;

存储模块,将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中。

进一步的,还包括:

查询模块,用于根据关键词字段或者关键词字段组合在所述结构化模型数据库中查询对应的医学研究数据信息片段,并将所述医学研究数据信息片段相关数据以网页形式呈现。

根据本发明的又一个方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现一种基于本体的医学数据整合方法。

附图说明

图1为本发明一个实施例的一种基于本体的医学数据整合方法流程图;

图2为本发明另一个实施例的一种基于本体的医学数据整合方法流程图;

图3为本发明一个实施例的一种基于本体的医学数据整合系统框图;

图4为图3中确定模块的内部连接框图;

图5为本发明另一个实施例的一种基于本体的医学数据整合系统框图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

参见图1,提供了本发明一个实施例的一种基于本体的医学数据整合方法,该医学数据整合方法能够将不同来源、不同格式的医学数据进行标准化融合,实现不同医学数据之间的互相使用。该实施例提供的基于本体的医学数据整合方法包括:获取多种不同来源的医学研究数据信息;确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库;按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段;将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中。

具体的,医学研究数据信息可来自不同的数据来源,比如,可来自各个不同的医学研究单位,各个基础医学数据库以及不同的研究单位。不同来源的医学研究数据信息,由于所属医学领域不同,医学研究数据信息的格式也存在不同,因此,医学研究数据信息之间很难融合,互相利用。

在本实施例中,对于所有的医学研究数据信息,并非只对应一种结构化模型数据库,不同的结构化模型数据库对应有不同的标准,因此,需要先确定医学研究数据信息对应哪一种结构化模型数据库。不同的结构化模型数据库对应不同的医学本体,所谓医学本体,可以理解为制定的一套规则、概念描述,根据这一套规则、概念描述,将医学研究数据信息进行标准结构化。当确定了医学研究数据信息对应的医学本体后,即可确定该医学研究数据信息对应的结构化模型数据库。所谓医学本体,其中包含对象类型,对象类型中可能包含多个概念描述字段,对医学研究数据信息进行切割,将医学研究数据信息切割为多个医学研究数据信息片段,每一个医学研究数据信息片段与对象类型中的概念描述字段进行对应。对医学研究数据信息进行切割后,将切割后的医学研究数据信息片段与对应的对象类型相应存储在结构化模型数据库中,即形成了标准化的数据库。对于同一结构化模型数据库中的医学研究数据信息,是可以互相融合利用的。

在本发明的一个实施例中,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库具体包括:根据所述医学研究数据信息的来源,确定该医学研究数据信息所属的医学领域;根据所述医学研究数据信息所属的医学领域,确定所述医学研究数据信息对应的医学本体,进而根据所述医学本体确定对应的结构化模型数据库。

具体的,在本发明实施例中,不同的医学领域对应不同的医学本体,以及不同的医学本体对应不同的结构化模型数据库。因此,对于不同来源的医学研究数据信息,首先需要确定医学研究数据信息所属的医学领域。通常,原始的医学研究数据信息的来源地通常会表征该医学研究数据信息所属的医学领域,比如,存储原始医学研究数据信息的基础医学数据库的命名规则会表征该医学研究数据信息所属的医学领域,在这种情况下,可以根据基础医学数据库的命名来确定其中存储的医学研究数据信息的医学领域,而后根据医学领域确定对应的医学本体,进而根据确定的医学本体进一步确定该医学研究数据信息对应的结构化模型数据库,每一个结构化模型数据库对应有一套结构化数据模型。

在本发明的一个实施例中,对象类型包含多个关键词字段,所述根据医学本体包含的对象类型,对医学研究数据信息进行切割具体包括:根据每一个关键词字段,将所述医学研究数据信息切割为多个医学研究数据信息片段,其中,关键词字段可表征医学研究数据信息片段的含义。

具体的,在本发明的实施例中,医学本体包含对象类型,其中,对象类型更多的为关键词字段,通常,医学本体中包含的关键词字段为多个。根据多个关键词字段,将医学研究数据信息切割为若干段,形成多个医学研究数据信息片段,医学研究数据信息片段的段数与关键词字段的个数相等,即医学研究数据信息根据关键词字段切割后,每一个关键词字段对应一个医学研究数据信息片段,其中,关键词字段能够表征医学研究数据信息片段的含义。

在本发明的一个实施例中,所述根据每一个关键词字段,将所述医学研究数据信息切割为多个医学研究数据信息片段具体包括:将医学研究数据信息与每一个关键词字段进行语义匹配,切割出每一个关键词字段对应的医学研究数据信息片段。

具体的,在本发明实施例中,可以将整个医学研究数据信息与每一个关键词字段进行匹配,从医学研究数据信息中找到与关键词字段对应的语义片段,则该语义片段即为与关键词字段对应的医学研究数据信息片段。

在本发明的一个实施例中,所述将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于所述关系数据库中具体包括:将每一个所述医学研究数据信息片段与所述对象类型包含的关键词字段一一对应输入结构化模型数据库中,从而将所述不同来源的医学研究数据信息转换为标准的结构化模型数据。

具体的,在结构化模型数据库中定义了多个关键词字段,在上述实施例将整个医学研究数据信息按照关键词字段切割为对应的多个医学研究数据信息片段的基础上,将每一个医学研究数据信息片段和与之相应的关键词字段存储于结构化模型数据库中,即将医学研究数据信息片段和关键词字段一一对应存储于结构化模型数据库中,利用结构化模型数据库对相同领域的医学研究数据信息进行标准归一化。

参见图2,提供了本发明另一个实施例的一种医学数据整合方法,该方法包括:获取多种不同来源的医学研究数据信息;确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库;按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段;将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中;根据关键词字段或者关键词字段组合在所述结构化模型数据库中查询对应的医学研究数据信息片段,并将所述医学研究数据信息片段相关数据以网页形式呈现。

在本发明的实施例中,将医学研究数据信息按照关键词字段切割为对应的多个医学研究数据信息片段,并将医学研究数据信息片段与相应的关键词字段一一对应存储于结构化模型数据库中。当需要查询时,可以按照关键词字段或者关键词字段组合在结构化模型数据库中查询,查询到与关键词字段或者关键词字段组合对应的医学研究数据信息片段。在本发明实施例中,将查询所得到的医学研究数据信息片段以网页的形式进行呈现,当然,也可以以其它不同的形式进行展现,比如,以表格的形式进行展现。

参见图3,提供了一种基于本体的医学数据整合系统,包括获取模块31、确定模块32、切割模块33和存储模块34。

获取模块31,用于获取多种不同来源的医学研究数据信息。

确定模块32,用于确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库。

切割模块33,用于按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段。

存储模块34,用于将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中。

其中,参见图4,确定模块32包括第一确定单元321、第二确定单元322和第三确定单元323。

第一确定单元321,用于根据所述医学研究数据信息的来源,确定该医学研究数据信息所属的医学领域;

第二确定单元322,用于根据所述医学研究数据信息所属的医学领域,确定所述医学研究数据信息对应的医学本体,进而根据所述医学本体确定对应的结构化模型数据库。

其中,上述所说的对象类型包括多个关键词字段,切割模块33具体用于根据所述对象类型中包含的每一个关键词字段,将所述医学研究数据信息切割为多个医学研究数据信息片段,所述关键词字段可表征医学研究数据信息片段的含义。

存储模块34,具体用于将所述医学研究数据信息与每一个关键词字段进行语义匹配,切割出每一个所述关键词字段对应的医学研究数据信息片段。

参见图5,提供了本发明另一个实施例的一种医学数据整合系统,包括获取模块31、确定模块32、切割模块33、存储模块34和查询模块35。

获取模块31,用于获取多种不同来源的医学研究数据信息。

确定模块32,用于确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库。

切割模块33,用于按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段。

存储模块34,用于将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中。

查询模块35,用于根据关键词字段或者关键词字段组合在所述结构化模型数据库中查询对应的医学研究数据信息片段,并将所述医学研究数据信息片段相关数据以网页形式呈现。

本发明的另一个实施例还提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述各实施例的基于本体的医学数据整合方法。

本发明提供的一种基于本体的医学数据整合方法及系统,将不同来源、不同格式的医学研究数据信息按照医学本体进行标准结构化,有利于不同格式、不同来源的医学研究数据之间信息的查询和利用,更好地实现了不同来源、不同格式的医学数据的融合。

最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1