一种基于本体融合的工业大数据集成系统的制作方法

文档序号:17442572发布日期:2019-04-17 04:58阅读:210来源:国知局
一种基于本体融合的工业大数据集成系统的制作方法

本发明涉及工业领域的大数据集成技术,尤其是涉及一种基于本体融合的工业大数据集成系统。



背景技术:

工业行业经过多年建设和发展,数字化、信息化已经渗透进工业生产的每个角落,数据量的快速增长和深度应用已经处于量变到质变的关键节点,快速获取信息能力、及时准确分析及评估信息的能力成为流程工业企业核心竞争要素。

要发挥流程工业大数据的价值,需要解决知识建模复杂、知识模型异构、知识数据处理时效性强等问题。工业大数据应用的本质目标就是从高维、复杂、关联的海量数据中挖掘有价值的新信息,发现新模式与新知识。而海量数据关系密切、关联性强、语义稳定度高的特点,使本体成为解决多源、异构数据集成的有效工具。从企业管理的维度,将信息系统数据、设备数据归为企业内部数据,而外部互联网数据归为企业外部数据。目前制造领域本体主要根据企业内各业务领域专业知识独立构建,不仅各本体相互独立,而且对于来自互联网领域的大量信息缺乏集成与综合能力。



技术实现要素:

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于本体融合的工业大数据集成系统。

本发明的目的可以通过以下技术方案来实现:

一种基于本体融合的工业大数据集成系统,包括:

大数据本体构建模块,用于利用工业大数据构建大数据本体;

相似度计算模块,用于基于本体的语言学特征与结构特征,计算大数据本体中的概念进行相似度计算;

本体融合模块,用于根据相似度计算结果,进行本体融合,获得融合后的本体模型;

本体库构建模块,用于根据融合后的本体模型,将企业内部数据与企业外部数据映射成本体实例数据,生成工业大数据本体库,实现数据集成。

进一步地,所述大数据本体包括企业内部本体和企业外部本体。

进一步地,所述企业内部本的构建具体包括:

将企业内部的信息系统数据和设备数据转化为概念术语,获取各信息系统概念的层次关系和各设备概念的层次关系;

对所述信息系统概念和设备概念进行整合和抽取,形成企业内部实体和信息的关联描述,构建企业内部本体。

进一步地,所述企业外部本体的构建具体包括:

将分布在互联网上的相关工业大数据转化为概念术语,获取各概念术语的关联描述,构建企业外部本体。

进一步地,所述大数据本体通过protégé本体建模工具实现本体可视化。

进一步地,所述相似度计算模块包括:

语言学特征相似度计算单元,用于采用基于vsm的余弦相似度计算方法对本体的语言学特征进行相似度计算;

结构特征相似度计算单元,用于采用基于rdf有向二部图的gmo算法对本体的结构特征进行相似度计算;

整合单元,根据所述语言学特征相似度计算单元和结构特征相似度计算单元的计算结果,整合获得最终相似度。

进一步地,所述本体融合具体包括以下步骤:

1)根据相似度计算结果,判断待融合的两个本体之间是否存在类映射对,若是,则执行步骤2);若否,则结束融合;

2)判断待融合的两个本体之间的类映射对是否唯一,若是,则直接执行步骤3)和4);若否,则选择相似度最高的一个类映射对后执行步骤3)和4);

3)判断类映射对中是否存在关系映射对,若是,则进行该关系的子节点映射对的查找,若子节点映射对存在,则输出关系映射对与子节点映射对,否则输出关系映射对,并记录子节点,添加为领域本体中的一个类;若否,则记录关系与子节点,添加为领域本体的对象属性与类;

4)判断类映射对中是否存在数值属性映射对,若是,则保留映射对中的一个数值属性,若否,则记录数值属性,添加领域本体中的数值属性。

进一步地,所述本体库构建模块调用d2rq映射引擎将企业内部数据与企业外部数据映射成本体实例数据。

与现有技术相比,本发明具有以如下有益效果:

1)本发明在工业大数据环境下,通过本体融合,实现企业内外部不同数据源之间的互联互通互融,集成工业大数据,能够为工业大数据分析及创新应用提供统一的数据视图,为工业大数据分析以及创新性应用提供支撑。

2)本发明将工业大数据进行分类,引入本体分别建模,在相似度计算的基础上进行本体融合后,映射实例数据,生成工业大数据本体库,避免了在初期由于不同来源数据存储管理方式不同造成的数据之间概念模糊、关系不清,从而带来了本体完整性、一致性得不到保证的问题。

3)生成的本体库可以支撑对工业大数据的分析与创新性应用。

附图说明

图1为企业内部信息系统erp数据层次梳理图;

图2为企业内部设备数据层次梳理图;

图3为企业内部本体实体类层次梳理图;

图4为企业内部本体信息类层次梳理图;

图5为企业内部本体概念之间的关联图;

图6为企业外部互联网供应商数据层次梳理图;

图7为相似度计算流程图;

图8为本体融合流程图;

图9工业大数据本体库构建流程图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

本发明提供一种基于本体融合的工业大数据集成系统,可适用于制造领域,包括:

大数据本体构建模块,用于利用工业大数据构建大数据本体;

相似度计算模块,用于基于本体的语言学特征与结构特征,计算大数据本体中的概念进行相似度计算;

本体融合模块,用于根据相似度计算结果,进行本体融合,获得融合后的本体模型;

本体库构建模块,用于根据融合后的本体模型,将企业内部数据与企业外部数据映射成本体实例数据,生成工业大数据本体库,实现数据集成。

从企业管理的维度,本发明将不同来源的工业大数据分为企业内部数据与企业外部数据,其中,企业内部数据包括了信息系统数据、设备数据,企业外部数据包括了分布在互联网上的工业大数据。信息系统数据与设备数据通常由企业进行统一存储与管理,数据之间的业务逻辑及层次关系较明确,归为企业内部数据;而互联网上的市场环境数据、资源数据、评价数据以及供应商信息等外部数据,企业往往不做定期抓取与存储,仅在需求产生时通过互联网爬取,为企业外部数据。

对应地,大数据本体包括企业内部本体和企业外部本体。企业内部本体模型描述了企业内部信息系统、设备数据的概念术语,这些术语包括固定资产、物料、组织、人员、信息载体以及他们之间的关系。企业外部本体模型描述了互联网上采集到的工业大数据的概念术语,如供应商、财务报表、市场评价等。可根据不同的应用方向,择其中的若干概念进行描述与关联。

企业内部本的构建具体包括:

将企业内部的信息系统数据和设备数据转化为概念术语,获取各信息系统概念的层次关系和各设备概念的层次关系,如图1和图2所示;

对所述信息系统概念和设备概念进行整合和抽取,形成企业内部实体和信息的关联描述,构建企业内部本体,通过protégé本体建模工具实现本体模型开发与可视化。本体中包含了固定资产、人员、物料、信息载体、组织五个实体以及固定资产信息、人员信息、物料信息、信息载体信息、组织信息五个信息,实体与信息的层次关系图如图3和图4所示,概念之间的关联图如图5所示。

企业外部本体的构建具体包括:

将分布在互联网上的相关工业大数据转化为概念术语,获取各概念术语的关联描述,构建企业外部本体,通过protégé本体建模工具实现本体模型开发与可视化,如图6所示。

相似度计算模块包括语言学特征相似度计算单元、结构特征相似度计算单元和整合单元,语言学特征相似度计算单元用于采用基于vsm的余弦相似度计算方法对本体的语言学特征进行相似度计算;结构特征相似度计算单元用于采用基于rdf有向二部图的gmo算法对本体的结构特征进行相似度计算;整合单元根据所述语言学特征相似度计算单元和结构特征相似度计算单元的计算结果,整合获得最终相似度。相似度计算流程如图7所示。

本体融合的具体过程如图8所示,根据相似度计算结果,提出若干本体融合规则,进行本体中类、属性、关系的融合,形成涵盖了企业内部数据与企业外部数据的领域本体。本体融合包括以下步骤:

1)在映射对中找出类的映射对及相似度,存在两种情况:

i)对于待融合的两个本体,针对特定的类,存在唯一的映射对:此时保留该映射对并输出到步骤2);

ii)对于待融合本体之一中的类,在另一待融合本体中,存在多个映射对(如本体o1中概念a与本体o2中的概念b与概念c的相似度都在设置的阈值之上,都会作为映射对被输出):此时选择相似度较高的映射对输出,并进行人工干预,判断剩余概念是否保留作为融合后本体的一个类独立存在。

2)在输出的类映射对的基础上,在映射对中找出关系(对象属性)的映射对,存在两种情况:

i)存在关系映射对:则进行该关系连接的子节点映射对的查找,若子节点相似(即映射对存在),则输出关系的映射对与子节点的映射对,分别保留类、对象属性、子节点映射对的一个实体为融合后领域本体中的类、对象属性;若子节点不相似(即映射对不存在),则输出关系的映射对,并记录子节点,,分别保留类、对象属性映射对的一个实体,添加子节点为融合后领域本体中的类、对象属性;

ii)不存在关系映射对:记录关系与子节点,保留类映射对的一个实体,添加对象属性、子节点为融合后制造领域本体中的类、对象属性;

3)在类映射对的基础上,进行数值属性的相似度计算,也有两种情况:

i)存在数值属性的映射对:进行人工干预,进行属性的筛选,分别保留类、数值属性映射对的一个实体为融合后制造领域本体中的类、数值属性;

ii)不存在数值属性的映射对:记录数值属性,保留类映射对的一个实体,添加数值属性为融合后领域本体中的类、数值属性。

本体库构建模块在融合后的本体上进行实例数据绑定,将企业内部数据与互联网上抓取的工业大数据映射到本体上,形成工业大数据本体库,从而完成不同来源的工业大数据集成,为工业大数据分析以及创新性应用提供支撑。

如图9所示,工业大数据本体库生成具体为,

1)根据融合后的本体模型,以及数据的存储结构,利用d2rq映射语言制定映射规则。

2)根据1)中制定的映射规则,编写映射文件。

3)采用jena开发平台,调用d2rq映射引擎,输入本体模型文件和d2rq映射文件,将企业内部数据与企业外部数据映射成本体实例数据,生成工业大数据本体库。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1