一种基于物联网知识图谱的园区智能设施管理系统的制作方法

文档序号:23727798发布日期:2021-01-26 17:51阅读:67来源:国知局
一种基于物联网知识图谱的园区智能设施管理系统的制作方法

[0001]
本发明涉及园区智能管理技术领域,尤其涉及一种基于物联网知识图谱的园区智能设施管理系统。


背景技术:

[0002]
近年来,随着物联网技术的逐步成熟完善,工业、产业及科技园区也逐渐将以往分散的信息系统进行重组与整合。基于数字孪生的建设理念,结合业务、运营、基础设施数据构建完整的园区运营知识图谱,以期进一步实现园区的数字化转型,同时也面临着新的问题,主要表现在以下两个方面:
[0003]
一是业务复杂化,随着园区的逐步建设与管理的精细化,园区运营管理的业务也日益复杂。常见的园区管理业务至少包含:楼控、安防、消防、停车等不同系统,而大量异构信息阻碍了数据的互通与共享。
[0004]
二是监控分散化,故障响应能力较弱。不同的系统通常仅具有其自身的监控能力,导致监控产生的事件独立而分散,并非以日常管理工作中的事件出现,“头痛医头,脚痛医脚”的单一告警事件很难指导运维人员有效地快速高效排除故障,并对当前故障带来的隐患进行预判及处理。
[0005]
为解决园区日常运维管理的这些问题,实现物联网的智能化,提升运维人员处理故障的速度,降低处理门槛,首先需要解决的就是打通系统墙,实现集中化,标准化的监控;其次需要系统具备一定的深度检索能力,对当前故障的影响范围做出判断。为满足这一需求,不仅需要完善、标准、准确的设备数据,也需要系统在设备间建立链接关系,从而以最小的代价将数据湖中积累的信息组织起来,成为可以被有效进行关联分析的数据。
[0006]
知识图谱是结构化的语义知识库,用于以符号的形式描述物理世界中的概念及相互关系,其基本组成单位是“实体-关系-实体”三元组,以及实体及其“属性名-属性值”对,实体间通过关系相互联结,构成网状的知识结构。知识图谱由包含用于约束、规范实体及其关系的模式层,与存储着实体、属性及实体间关系的数据层组成。模式层本体库中对实体的规范化描述规则是实现异构信息规范化描述、语义标注及共享的基础,也是后续进行关联分析等智能化操作的有效支撑。
[0007]
因此,如何能够有效提取园区物联网智能设备数据构建园区物联网知识图谱,使得原本分散异构的信息集中标准,在日常运维检索或故障出现时提供更准确、高质量的故障影响分析,以帮助运维人员快速、高效且准确的进行日常工作或排除故障成为了现有技术急需解决的技术问题。


技术实现要素:

[0008]
本发明之目的是提供一种基于物联网知识图谱的园区智能设施管理系统,其能够提升用户对园区物联网设施日常运维管理产品的使用便利性,并且有利于提升物联网对故障的影响及范围的分析能力,从而提升整体智能性。
[0009]
本发明提供一种基于物联网知识图谱的园区智能设施管理系统,包括数据输入模块、数据接入模块、数据提取模块、数据存储模块与数据查询分析模块,其中,
[0010]
所述数据输入模块用于输入要查询的实体类型或信息,得到目标实体、实体属性、实体间关系的表达文本;
[0011]
所述数据接入模块用于接入告警平台、存量数据平台中的告警数据、存量数据及日志信息,获取告警设备实体信息、存量数据信息及用以作为语料的设备日志信息;
[0012]
所述数据提取模块用于对所述数据接入模块中接入的设备日志信息进行日志聚类、变量识别及远程标注操作,获取园区中设备、人员及事件的实体、实体属性及实体间关系信息;
[0013]
所述数据存储模块用于存储包含数据模型的模式层,及包含园区设备实体、实体属性及实体间关系信息的数据层,形成园区设施知识图谱;
[0014]
所述数据查询分析模块用于通过查询园区设施知识图谱中实体间的关系以及所述数据输入模块中的实体间的关系,获取受目标设备影响的设备实体信息,并将查询结果推送给用户,完成辅助决策园区智能设施的日常管理。
[0015]
优选地,所述数据提取模块还用于对园区数据模型及实体信息的优化模块在人工核验的前提下进行校正与更新。
[0016]
优选地,还包括数据处理经验库模块,所述数据处理经验库模块用于通过查询设备故障影响的处理经验,将查询结果推送给用户,完成辅助用户决策处理故障事件。
[0017]
优选地,所述数据输入模块为直接键入装置,所述直接键入装置用于用户通过键盘直接输入表达文本信息。
[0018]
优选地,所述数据输入模块为语音输入装置,所述语音输入装置通过语音识别文本算法获取表达文本输入。
[0019]
优选地,所述数据接入模块可通过配置任务的方式定时主动同步外部数据或被动接收同步数据请求,通过预定义的规则对半结构化或非结构化数据进行标准化,最终同步至知识图谱的实体库中。
[0020]
优选地,所述数据提取模块对设备日志信息采用线性判别分析算法lda进行聚类,获取日志模板分类信息。
[0021]
优选地,所述数据提取模块对设备日志信息通过得到的日志模板分类信息,采用smith-waterman算法进行局部序列比对以识别日志信息中的常量片段,获取剔除常量片段后日志信息中的变量。
[0022]
优选地,所述数据提取模块对设备日志信息中的变量,采用计算日志信息中变量与知识图谱中实体属性的levenshtein距离的方式,在引用伸缩控制机制的条件下,对获取到的日志信息中的变量进行远程标注。
[0023]
优选地,所述数据存储模块提供通过以可视化拓扑图的方式对园区设备的实体及实体间关系的数据模型的创建。
[0024]
本发明提供的一种基于物联网知识图谱的园区智能设施管理系统,相比于现有技术具有如下有益效果:
[0025]
1、本发明基于存量数据信息及日志信息通过自动化的方式进行物联网知识图谱实体库的构建,使得原本分散、异构且未能表达实体间关系的设备信息集中化、标准化并建
立了相互的关联关系,具备了进行影响、关联分析的基础。
[0026]
2、本发明在物联网设施管理系统中使用知识图谱作为园区设备日常管理的支撑,有利于系统在用户的日常运维检索及故障发生时对故障设备的影响范围的分析能力,帮助用户快速高效的解决及预防故障,提升了整体智能性。
附图说明
[0027]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅用于解释本发明的构思。
[0028]
图1为本发明的一种基于物联网知识图谱的园区智能设施管理系统的流程示意图;
[0029]
图2是本发明的数据提取模块提取数据以获取设备实体数据的流程示意图。
[0030]
附图标记汇总:
[0031]
10、数据输入模块
ꢀꢀꢀꢀꢀꢀꢀꢀ
20、数据接入模块
ꢀꢀꢀꢀꢀꢀ
30、数据提取模块
[0032]
40、数据存储模块
ꢀꢀꢀꢀꢀꢀꢀꢀ
50、数据查询分析模块
具体实施方式
[0033]
在下文中,将结合附图描述本发明的一种基于物联网知识图谱的园区智能设施管理系统的实施例。
[0034]
在此记载的实施例为本发明的特定的具体实施方式,用于说明本发明的构思,均是解释性和示例性的,不应解释为对本发明实施方式及本发明范围的限制。除在此记载的实施例外,本领域技术人员还能够基于本申请权利要求书和说明书所公开的内容采用显而易见的其它技术方案,这些技术方案包括对在此记载的实施例做出任何显而易见的替换和修改的技术方案。
[0035]
本发明中对于如下概念进行具体的描述。
[0036]
知识图谱脱胎于语义网(semantic network)与数据链接(linked data)的知识图谱最早由谷歌公司于2012年提出,并宣布以此为基础构建下一代智能化搜索引擎。此项目的核心技术包括从互联网网页中抽取实体及其属性信息,以及实体间的关系。这些适用于解决与实体间关系的技术创造出了一种全新的信息检索模式。
[0037]
知识图谱的定义:知识图谱,是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位“实体-关系-实体”三元组,以及实体及其相关属性-值对,实体间通过关系相互联结,构成网状知识结构。
[0038]
从图的角度看,知识图谱本质上是一种概念网络,其中的节点表示物理世界的实体或概念,而实体间的关系构成网络中的边。知识图谱的应用价值在于它能够改变现有的信息检索方式,通过图形化的方式向用户展示经过分类整理的结构化知识,从而使人们获得更加精准有效地搜索结果。
[0039]
如图1所示,本发明提供了一种基于物联网知识图谱的园区智能设施管理系统包括数据输入模块1、数据接入模块20、数据提取模块30、数据存储模块40与数据查询分析模块50。其中,
[0040]
数据输入模块1用于用户输入所希望要查询的实体类型或信息,得到目标实体、实体属性、实体间关系的表达文本;
[0041]
数据接入模块20用于接入告警平台、存量数据平台中的告警数据、存量数据及日志信息,获取告警设备实体信息、存量数据信息及用以作为语料的设备日志信息;
[0042]
数据提取模块30用于对数据接入模块20中接入的设备日志信息进行日志聚类、变量识别及远程标注操作,获取园区中设备、人员及事件的实体、实体属性及实体间关系信息;
[0043]
数据存储模块40用于存储包含数据模型的模式层,及包含园区设备实体、实体属性及实体间关系信息的数据层,形成园区设施知识图谱;
[0044]
数据查询分析模块50用于通过查询园区设施知识图谱中实体间的关系以及数据输入模块1中的实体间的关系,获取受目标设备影响的设备实体信息,并将查询结果推送给用户,完成辅助决策园区智能设施的日常管理。
[0045]
本发明的基于物联网知识图谱的园区智能设施管理系统是一种通过自动构建物联网园区知识图谱以帮助用户完成物联网园区的日常运维及排障工作的辅助系统。其通过建立标准、集中、准确的物联网设施数据及其关系,并通过知识图谱的检索能力,帮助用户在日常运维查询或故障发生时,快速定位并判断故障影响,并提供一定的相关故障解决经验或方法。
[0046]
随着园区知识图谱的逐渐完善准确,当用户进行日常运维查询或故障发生时,系统可根据知识图谱进行完备的影响范围分析。例如,当某变电设备发生故障时,系统会根据知识图谱中的关联关系查询该变电设备所影响到的配电柜,配电柜所关联的楼层,楼层所包含的房间,进而发现将会受到影响的会议或其他园区日常事件,再进一步发现到所受影响的具体园区人员并进行提示或通知。本发明的基于物联网知识图谱的园区智能设施管理系统通过完整的智能影响分析可以帮助园区运维人员节省大量的工作量,运维效率得到提升,运维门槛得以下降。而如果不使用知识图谱进行物联网设施的智能管理,仅仅根据各个不同监控系统进行园区的日常运维管理,如果发生运维故障情况,运维人员将不得不逐级查询不同系统以判断故障所带来的影响,但是系统对于故障的判断有限,对于可能涉及的相关设备或设施及其日常事件等信息不能及时关联,这样会缺乏智能性,并且应对故障能力较弱,缺乏使用的灵活性。
[0047]
在构建完善的知识图谱中,变电设备与其所在楼层包含房间中的各个关联设备均存在关联关系,在变电设备告警的同时,这些受到潜在影响的关联设备信息会一并反馈至运维人员。若系统同时也接入了园区日常活动系统数据(即将活动也作为实体纳管,该实体可能会拥有名称、时间、地点、参与人员等属性),则会同时将所受影响的活动及其参与者信息进行反馈。如果运维人员所了解到的不仅仅是单一设备的告警信息,而是包含受其影响的设备范围,影响活动甚至是影响人员的全局信息。若对于该类故障已有排障经验,甚至可同时获得大致排障时间及备选房间信息,以及自动通知至相关参与活动人员的自动化处理能力,这样会极大地提升了运维人员的判断范围与响应速度,也同时降低了运维门槛。
[0048]
本发明基于存量数据信息及日志信息通过自动化的方式进行物联网知识图谱实体库的构建,使得原本分散、异构且未能表达实体间关系的设备信息集中化、标准化并建立了相互的关联关系,具备了进行影响、关联分析的基础。
[0049]
并且,本发明在物联网设施管理系统中使用知识图谱作为园区设备日常管理的支撑,有利于系统在用户的日常运维检索及故障发生时对故障设备的影响范围的分析能力,帮助用户快速高效地解决及预防故障,提升了整体智能性。
[0050]
在本发明的进一步实施例中,数据提取模块30还用于对园区数据模型及实体信息的优化模块在人工核验的前提下进行校正与更新。其中,园区的数据模型即本体库,实体信息的优化模块即知识库,本发明中的数据提取模块30用于对数据接入模块20中接入的设备日志信息进行日志聚类、变量识别及远程标注操作,获取园区中设备、人员及事件的实体、实体属性及实体间关系信息,并且可以通过获取的园区中设备、人员及事件的实体、实体属性及实体间关系信息对本体库和知识库在人工核验的前提下进行校正与更新。
[0051]
cmdb(configuration management database)配置管理数据库,cmdb存储与管理企业it架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。cmdb的本质是it运维领域的知识图谱。而知识图谱相关技术,也能够帮助cmdb提升数据质量和使用体验。
[0052]
上述数据提取模块30是用于对数据接入模块20中接入的设备日志信息进行日志聚类、变量识别及远程标注操作,如图2所示,示出了数据提取模块30提取数据以获取设备实体数据的流程示意图,其中包括了日志聚类,变量识别及远程标注3个主要提取步骤。在进行提取步骤操作前先接入原始日志数据,本发明以接入9万条网络设备syslog数据为例说明提取步骤。
[0053]
关于提取步骤日志聚类:数据提取模块30对设备日志信息采用线性判别分析算法lda(linear discriminant analysis)进行聚类,获取日志模板分类信息。例如:日志通过lda算法获取实验结果,将9万条日志聚合成了23个分类(也可以理解为日志模板),正确率达到90%。比如下面四条日志都表达了control plane状态异常这个主题,因此可归为同一个日志模板。
[0054]
{
[0055]“id”:”000.50000000000”,
[0056]“template”:”*161 27757 nsd 55.18 32.3 bdc f3 dmz bl02 nsd show nve vni control plane inc up 5xx隔离网dmz区border leaf交换机bdc f3 dmz bl02 nve vni control plane状态异常,请通知网络值班登录该设备show nve vni control plane进行检查up个数46 1不等于阈值44”[0057]
},
[0058]
{
[0059]“id”:”000.50000000001”,
[0060]“template”:”161(.*)nsd 55.18 32.1 bdc f3 dmz bl01 nsd show nve vni control plane inc up 5xx隔离网dmz区border leaf交换机bdc f3 dmz bl01 nve vni control plane状态异常,请通知网络值班登录该设备show nve vni control plane进行检查up个数46 1不等于阈值44”[0061]
},
[0062]
{
[0063]“id”:”000.50000000002”,
[0064]“template”:”161(.*)nsd 55.2(.*)pdc(.*)dmz(.*)nsd show nve vni control plane inc up 5 xx隔离网dmz区border leaf交换机pdc(.*)dmz(.*)nve vni control plane状态异常,请通知网络值班登录该设备show nve vni control plane进行检查up个数48 1不等于阈值46”[0065]
},
[0066]
{
[0067]“id”:”000.50000000003”,
[0068]“template”:”161(.*)nsd 55.17(.*)bdc f3 b|z(.*)nsd show nve vni control plane inc up 5 xx业务网border leaf交换机bdc f3 b|z(.*)nve vni control plane状态异常,请通知网络值班登录该设备show nve vni control plane进行检查up个数44 1不等于阈值42”[0069]
}。
[0070]
本发明采用lda算法进行日志聚类效果比较好,其原因是lda算法是一种基于主题模型的算法,具有三大优势:一、不需要对齐匹配;二、是基于语义挖掘的主题模型;三、是一种无监督机器学习技术。第一项优势避免了在全局开展无意义的对齐匹配所造成的大量无效日志模板。第二项优势是针对传统的文档匹配算法而言的。传统方法(如tf-idf等)在匹配文档相似度时不考虑文字背后的语义关联,仅通过查看两个文档共同出现的单词的数量来判断相似度,共同单词越多就越相似。传统方法如tf-idf存在问题,比如,“他们的cmdb很成功”和“他们的配置管理超厉害”,这两句话虽然共同的单词很少,但它们的语义非常相似。如果按传统的方法判断这两个句子肯定相似度低,而lda算法就会考虑文字背后的语义,进而给出高相似度结论。第三项优势提到lda算法是一种无监督机器学习技术,其中无监督就是不需要做大量标注就能自学习。
[0071]
在完成日志聚类后,可以以日志模板为单元分析其中的日志是否包含ci数据,ci数据一般来自日志中的变量。
[0072]
关于提取步骤变量识别:数据提取模块30对设备日志信息通过得到的日志模板分类信息,采用smith-waterman算法进行局部序列比对以识别日志信息中的常量片段,获取剔除常量片段后日志信息中的变量。由于原生的smith-waterman算法是针对基因序列比对的(原始核函数是g-t与a-c匹配则得分),而运用到运维日志比对上就需要额外定制核函数,增加汉语字符的匹配权重。如下示出了经过调参的核函数及经过对齐算法后的日志信息识别示例,可以看出此时日志信息中还包含日期、序号等变量,再次剔除后剩余大部分均为具有业务含义的属性值变量。
[0073][0074][0075]
<185>dec$13 2017 02:09:$$$$$$$$1$$$9 huawei srm/1/powerfault:oid 1.3.6.1.4.12011.5.25.129.2.1.9 power is abnormal.(entityphysicallndex=67108873)
[0076]
<185>dec$21 2017 14:46:36 pdc-f1m3-oob-as10 srm/1/powerfault:oid 1.3.6.1.4.12011.5.25.129.2.1.9power is abnormal.(entityphysicallndex=67108873)
[0077]
<161>[2723]:(nsd)55.18.32.51 bdc-f3-extra-ar02show_ip_interface_brief_inc_serial0/2/0.1/1/1/3:0 5 xx外联路由器bdc-f3-extrar02到第三方平&&台$$$xxxxxx$9$.$$0.49.85端口状态异常up个数(0-0)不等于阈值2
[0078]
<161>[9774]:(nsd)55.18.32.51 bdc-f3-extra-ar02 show_ip_interface_brief_inc_serial0/2/0.1/1/4/3:0 5 xx外联路由器bdc-f3-extrar02到xxxxxxxxxxxxxxxxx备线_192.168.$6.61端口状态异常up个数(0-0)不等于阈值2。
[0079]
关于提取步骤远程标注,数据提取模块30对设备日志信息中的变量,采用计算日志信息中变量与知识图谱中实体属性的levenshtein距离的方式。为了提升匹配效果,在引
用伸缩控制机制的条件下,对获取到的日志信息中的变量进行远程标注。具体地,对于cmdb中的一个ci属性中正交的ci属性值x,按照其长度m将日志(长度为n)切分为n-m个子串yi;然后计算莱文斯坦比,即,levenshtein_ratio(x,yi),取最大x,设置阈值判定x是否与yi具有强相似性。实验中阈值设置为0.8(1表示完全相似,0表示完全不相似),也就是说只要大于0.8,就证明cmdb中的某个ci属性与该日志片段匹配上了。
[0080]
参见如下示出了对日志信息进行远程标注后的样例,可以通过不同颜色表示不同属性值,例如可以用红色下划线代表新发现的属性值,绿色下划线为远程标注属性值,到这里的结果经过人工核验、调整及过滤后会持续反馈给系统以优化算法,以期达到人工介入逐渐减少,算法逐渐成熟完善的目的。
[0081]
<185>dec$13 2017 09:59:20$$$$$$$$1$$$9 huawei srm/1/powerfault:oid 1.3.6.1.4.1.2011.5.25.129.2.1.9 power is abnormal.(entityphysicallndex=67108873)
[0082]
<185>dec$21 2017 14:46:36 pdc-f1m3-oob-as10 srm/1/powerfault:oid 1.3.6.1.4.1.2011.5.25.129.2.1.9 power is abnormal.(entityphysicallndex=67108873)
[0083]
<161>[$$$24086]:(nsd)11.28.0.1 172.17.17.$$6 nsd_nping 5 xxxxxxxxxxxxxxxx_$$海港路$支行电信ce地址xxxxxxxx$6无法ping通
[0084]
<161>[11774$$$]:(nsd)11.28.0.2 172.17.18.182 nsd_nping 5 xxxxxxxxxxxxxxxx_招远迎宾路分理处移动ce地址xxxxxxxx无法ping通
[0085]
<185>dec$13 2017 14:46:36$pdc-f1m3-$oob-as$$$$10srm/1/powerfault:oid 1.3.6.1.4.1.2011.5.25.129.2.1.9power is abnormal.(entityphysicallndex=67108873)
[0086]
<185>dec$21 2017 10:29:20 ythw-f2m3-ipmi-as03-e16 srm/1/powerfault:oid 1.3.6.1.4.1.2011.5.25.129.2.1.9power is abnormal.(entityphysicallndex=67108873)。
[0087]
本发明中数据提取模块30提取步骤采用远程标注的目的,是让机器能够模拟人的行为,以cmdb数据做样本,辅以机器学习算法,让机器理解日志的语义,进而从中提取出ci数据。
[0088]
在本发明的进一步实施例中,基于物联网知识图谱的园区智能设施管理系统还可以包括数据处理经验库模块,数据处理经验库模块用于通过查询设备故障影响的处理经验,将查询结果推送给用户,完成辅助用户决策处理故障事件。上述数据处理经验库模块是基于园区领域专家及日常处理经验得到的信息库,是可持续更新的数据处理经验库模块。
[0089]
在本发明的进一步实施例中,数据输入模块1可以为直接键入装置,该直接键入装置用于用户通过键盘直接输入表达文本信息。或者,数据输入模块1也可以为语音输入装置,该语音输入装置通过语音识别文本算法获取表达文本输入。
[0090]
在本发明的进一步实施例中,数据接入模块20可通过配置任务的方式定时主动同步外部数据或被动接收同步数据请求,通过预定义的规则对半结构化或非结构化数据进行标准化,最终同步至知识图谱的实体库中。
[0091]
优选地,数据存储模块40提供通过以可视化拓扑图的方式对园区设备的实体及实
体间关系的数据模型的创建。
[0092]
以上对本发明的一种基于物联网知识图谱的园区智能设施管理系统进行了说明。而且,上述披露的各技术特征并不限于已披露的与其它特征的组合,本领域技术人员还可根据本发明之目的进行各技术特征之间的其它组合,以实现本发明之目的为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1