调度自动化系统知识图谱的构建与应用方法与流程

文档序号:15557949发布日期:2018-09-29 01:34阅读:366来源:国知局
本发明属于调度自动化系统领域,尤其涉及一种调度自动化系统知识图谱的构建与应用方法。
背景技术
:随着电网各类业务的发展,调度自动化系统各类应用越来越多,业务知识越来越复杂。相关业务人员大多只了解局部的业务知识,而不清楚与之相关的业务逻辑,只有极少数专家级人员才能对整个业务流程有清晰的认识。因此当复杂的业务逻辑出现问题时,需要临时调动各个业务人员,理清所有的业务逻辑关系,才有可能找出引起问题的原因。而若建立起整个调度自动化系统相关业务的知识图谱,就可以根据知识图谱所表达的相关业务逻辑,十分清晰地查询所有的操作和数据流,从而找出所有可能产生错误的原因。知识图谱的概念在2012年由谷歌公司最先提出,谷歌公司想在知识图谱项目的基础上,构建新一代的智能化搜索引擎。该搜索引擎的思想是从网页上获得各类知识的实体、属性信息,以及各实体之间的关联关系,从而建立知识的语义网络。传统的搜索引擎都是基于字符串的搜索,而不是根据相应的语义信息进行搜索,因此传统的搜索引擎可能会搜索出与语义毫不相关的信息,而仅仅包含该字符串,而基于知识图谱的搜索是基于语义分析的,因而搜索更加精确。知识图谱的构建对于知识的展示与检索具有很高的研究价值,在国内百度和搜狗分别推出了“知心”和“知立方”来改善其搜索质量。清华大学建立了第一个大规模中英文跨语言知识图谱xlore,中科院在开放网络的基础上研发了“人立方、事立方、知立方”的原型系统。现有技术中介绍过基于多源数据的中文知识图谱构建方法和基于知识图谱的查询方法。在电力系统中,目前还没有知识图谱相关的应用。调度自动化系统中的很多知识都是以经验的形式存储在专家的脑袋中,或者零散地存在系统中,很少有人能够全面掌握所有的业务知识。若仅仅依靠互联网公司基于语义网络的方法,由于缺乏电力专业知识背景,导致建立的知识图谱出现业务不全、准确性不够和专业性不强的问题。因此在电力系统自动化领域,针对调度自动化系统的相关业务逻辑,提出构建知识图谱的方法,建立自动化系统的知识图谱,便于知识的总结、搜索与传播,具有很高的研究价值。技术实现要素:针对
背景技术
中的问题,本发明的目的在于提供一种调度自动化系统知识图谱的构建与应用方法。为了实现上述目的,本发明提出如下技术方案:一种调度自动化系统知识图谱的构建与应用方法,其特征在于:所述方法包括以下步骤:(1)知识图谱的构建:采用自底向上的方式构建智能电网调度控制系统的基础平台的知识图谱,采用自顶向下的方式构建智能电网调度控制系统的详细业务逻辑的知识图谱;(2)知识图谱的存储与维护:知识图谱的数据基于历史数据库进行存储,知识图谱的维护基于知识图谱的展示界面进行;(3)知识图谱的展示及应用:前台页面展示系统的基础平台和详细的业务知识图谱,基础平台的知识图谱展示智能电网调度控制系统的整体框架知识,业务逻辑的知识图谱展示智能电网调度控制系统的详细逻辑关系。进一步地,在步骤(1)中,所述基础平台中共包含六大类功能模块,分别是:平台管理、历史数据库、实时数据库、消息总线、服务总线以及公共服务;所述平台管理通过一套管理工具,实现对整个系统的管理,包括应用管理、进程管理、时钟管理、日志管理和定时任务管理;所述历史数据库主要用来保存电网设备、参数、历史统计信息;所述实时数据库用来提供高效的实时数据存取服务;所述消息总线和服务总线用于提供可靠通用的信息交互机制和广域服务机制,实现调度中心内部和调度中心之间安全高效的数据通信和应用集成;所述公共服务为应用的开发和集成提供一组通用服务,包括图形服务、文件服务、权限服务、消息邮件服务。进一步地,通过六大类功能模块和各个模块中的详细实体关系,抽象出的本体关系如下:1)系统包含功能模块;2)平台管理包含应用管理;平台管理包含进程管理;3)历史数据库包含数据库表;4)实时数据库包含实时库表;5)消息总线包含消息通道;消息总线包含消息事件;6)服务总线包含服务方式;7)公共服务包含权限服务;公共服务包含日志服务。进一步地,构建详细业务逻辑的知识图谱的步骤如下:(1.1)抽象本体和本体关系:根据智能电网调度控制系统的专家经验和程序的编程经验从系统的各个组成部分中抽象出本体和本体之间的关系;(1.2)抓取实体:通过系统的配置文件、实时数据库、历史数据库、相关程序源码以及专家的经验知识获得智能电网调度控制系统业务知识的实体信息;(1.3)依据本体关系,建立实体关系;(1.4)实体信息的清洗和融合:首先需要保证数据的一致性,消除本质上是同一个实体,但是由于不同的表达方式而出现多次的情况;当对实体的属性进行扩展时,需要判断该属性是否与已有的属性重合,只有是一个全新的属性时,才允许添加,从而减少数据的冗余性。进一步地,在步骤(1.2)中,解析应用定义配置文件,获得的实体包括:实时态、研究态、规划态、测试态、反演态和培训态,其属性包括:态号、态名;根据解析出的信息,提取本体为“态”;解析该文件中关于应用的定义,得到应用的实体包括:scada应用、pas应用、dts应用、fes应用、agc应用、public应用、wams应用,提取本体“应用”;在存放动态库的文件夹下,获得关于动态库的所有实体,并归纳出本体“动态库”。进一步地,实时数据库提供高速的本地访问接口、远方服务访问接口;历史数据库存储大量的历史数据;分别从实时数据库和历史数据库的表信息表中读取的所有表信息,获得实时库表和历史数据库表这两个本体的所有实体,对应的本体分为别“实时库表”和“历史数据库表”。进一步地,步骤(1.3)又包括如下步骤:(1.3.1)解析sca_analog进程相关业务的源码和配置文件,获得进程与其他实体之间的关系;实体关系采用三元组格式<sca_analog,关系a,实体2>表示sca_analog与实体2之间存在关系a,且sca_analog和实体2是主宾关系,位置不可颠倒;(1.3.2)依据已知的本体关系,确定关系a的具体实例范围;(1.3.3)根据确定的谓词和主宾关系,在工程源码或者makefile文件中,获相应的实体3,从而建立起完整的实体关系;(1.3.4)建立实体关系时,对于同种类型的实体关系,应前后表述一致,否则会被认为是多种不同的关系,而造成数据冗余错误;对于某些不便于解析或者无法解析的知识,提供手动录入的功能;人工添加本体、实体以及各实体的相互关系,方便对于知识的扩展。进一步地,在步骤(2)中,知识图谱的存储结构包括本体定义表、实体表、本体关系表和实体关系表;所述本体定义表定义了所有的本体信息以及存储各类实体信息的数据库表名;所述实体表是按照本体进行分类存储的,同一类的实体存储在同一张表中;所述本体关系表定义了不同本体之间所具有的关系;所述实体关系表定义两个实体之间的关系;知识图谱的内容采用三元组格式<实体1,关系,实体2>进行存储,实体1和实体2的信息存储在实体表中,关系的详细信息存储在本体关系表中,该存储方式避免了在每条实体关系中都存储详细信息而出现的数据冗余或者数据不一致错误。进一步地,在步骤(2)中,知识图谱的维护基于知识图谱的展示界面进行,共分为四类维护:本体配置、本体关系配置、实体配置,以及实体关系配置。与现有技术相比,本发明的有益效果为:本发明构建的知识图谱将抽象的调度自动化系统业务知识,以图形化的方式呈现出来,让使用者对整个系统的业务知识有直观地了解。同时使用者可以操作相应的实体,选择性查看自己关心的业务知识,具有很强的交互性和可用性。业务逻辑知识图谱提供如下几个功能:1)点击进程相关节点,例如点击sca_analog进程图标,系统自动搜索与展示该进程使用的消息事件、数据库表等信息;2)点击实时数据库相关节点,例如点击遥测表节点,系统将所有读取或者写入该表的进程展示出来。即业务逻辑的知识图谱可以从不同的维度,展示自动化系统的业务关系。3)使用者如果对某个实体的业务关系不关注,点击该实体,页面自动将与之直接相关的知识图谱在图形中删除。4)可对图形中的元素进行拖拽操作,并保存成模板,便于下一次的使用。基础平台的知识图谱展示有如下几个特点:1)能够展示基础平台的整体组成架构;2)知识图谱中的实体节点具有点击功能,点击进入后能够查看各个功能模块的业务逻辑。3)提供各个应用下详细业务逻辑知识图谱的入口,和业务逻辑知识图谱的展示形成整体。附图说明图1是基础平台知识图谱示意图。图2是知识图谱存储结构图。图3是基础平台知识图谱展示图。图4是业务逻辑知识图谱展示图。具体实施方式下面结合附图和具体实施方式,对本发明的具体实施方案作详细的阐述。这些具体实施方式仅供叙述而并非用来限定本发明的范围或实施原则,本发明的保护范围仍以权利要求为准,包括在此基础上所作出的显而易见的变化或变动等。1、知识图谱的构建知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,知识图谱的本体是人为抽象出来的概念,而真正存在的对象是实体。知识图谱的构建一般分为自顶向下和自底向上两种方法。自顶向下的构建方法是先从数据源中抽象出本体,得到术语、顶层的概念、同义和层次关系以及相关的规则,然后进行实体的学习过程,将实体归纳到前面的概念中,最后建立实体之间的相互关系,形成完整的知识图谱。自底向上的构建方法是先从数据源中抽取所有的实体及其相关属性,对抽取的数据进行清洗,然后建立规范化的实体间的相互关系,最后对实体进行分类,抽象成本体,并建立本体之间的关系,从而形成完整的知识图谱。智能电网调度控制系统是一个典型的调度自动化系统,本文以其为例,介绍知识图谱的构建。智能电网调度控制系统是由国家电网公司总部统一组织、集中研发的,将原来一个调度中心内部的10余套独立应用系统,横向集成为由基础平台和四大类应用构成的电网调度控制系统。本文采用自底向上和自顶向下相结合的方法,构建智能电网调度控制系统基础平台和详细业务逻辑的知识图谱。智能电网调度控制系统基础平台中的业务关系相对固定,各个实体之间的关系清晰明了,需要从各个实体之间的关系抽象出本体之间的关系,因而采用自底向上的方式构建知识图谱。智能电网调度控制系统各个应用下详细业务的逻辑关系复杂,实体较多,需要先抽象出本体之间的关系,然后通过实体的学习构建出最后的业务逻辑关系,故详细业务逻辑的知识图谱使用自顶向下的方式进行构建。1.1构建基础平台知识图谱基础平台是智能电网调度控制系统的基础,负责为各类应用的开发、运行和管理提供通用的技术支撑,为整个系统的集成和高效可靠运行提供保障,包括总线服务、数据存储服务、公共服务和平台管理等。构建基础平台的知识图谱,能够清晰展示出基础平台内各个模块的详细关联关系,从而为使用智能电网调度控制系统的人员提供一种详细描述基础平台内部结构的展示方法。基础平台中共包含六大类功能模块,分别是:平台管理、历史数据库、实时数据库、总线(消息总线、服务总线),以及公共服务。平台管理通过一套管理工具,实现对整个系统的管理,包括应用管理、进程管理、时钟管理、日志管理和定时任务管理等。历史数据库主要用来保存电网设备、参数、历史统计信息等一切需要永久保存的数据。实时数据库用来提供高效的实时数据存取服务。总线服务包括消息总线和服务总线两种,提供可靠通用的信息交互机制和广域服务机制,实现调度中心内部和调度中心之间安全高效的数据通信和应用集成。公共服务为应用的开发和集成提供一组通用服务,包括图形服务、文件服务、权限服务、消息邮件服务等。通过该六大类功能模块和各个模块中的详细实体关系,抽象出的本体关系如表1所示:表1基础平台本体关系表采用自顶向下的方法,结合基础平台的本体关系,构建的基础平台详细知识图谱的示意图如图1所示。1.2构建业务逻辑知识图谱应用下的业务逻辑关系是智能电网调度控制系统实现电网调度控制的功能实现,具有业务种类繁多、业务关系复杂,以及业务关系动态变化等特点。构建业务逻辑的知识图谱,对复杂业务的调用关系进行可视化展示,能够为智能电网调度控制系统的故障排查提供参考依据。构建业务逻辑的知识图谱,首先需要根据智能电网调度控制系统的专家经验和程序的编程经验从系统的各个组成部分中抽象出本体和本体之间的关系,再根据本体间的关联关系,进行业务实体的详细抓取,构建实体的关系,从而形成完整的知识图谱。1.2.1抽象本体和本体关系根据智能电网调度控制系统的专家经验,可以抽象出部分本体和本体关系,例如:系统包含态,态包含应用,应用包含进程。根据计算机专业的编程经验,可以抽象出剩余的本体和本体关系,例如:进程调用动态库,进程发送消息等。详细的本体和本体之间的关系,如下表所示:表2详细业务逻辑本体关系表本体1关系本体2进程使用配置文件进程使用动态库进程写入实时数据库表进程读取实时数据库表进程写入关系数据库表进程读取关系数据库表进程发送消息事件进程接收消息事件进程请求服务总线进程应答服务总线.........1.2.2抓取实体智能电网调度控制系统业务知识的实体信息,可以通过系统的配置文件、实时数据库、历史数据库、相关程序源码以及专家的经验知识等获得。(1)配置文件智能电网调度控制系统中,配置文件、动态库、可执行程序等都有指定的文件目录,在各自的文件目录中,获得所有实体信息。相关的配置文件大多是结构化或者半结构化的,因此可以按照配置文件的固定格式,解析其中的内容。解析应用定义配置文件,获得的实体包括:实时态、研究态、规划态、测试态、反演态和培训态,其属性包括:态号、态名等。根据解析出的信息,提取本体为“态”。解析该文件中关于应用的定义,得到应用的实体包括:scada应用、pas应用、dts应用、fes应用、agc应用、public应用、wams应用等,提取本体“应用”。在存放动态库的文件夹下,获得关于动态库的所有实体,并归纳出本体“动态库”。(2)实时库和历史数据库表实时数据库提供高速的本地访问接口、远方服务访问接口,历史数据库存储大量的历史数据,两种数据库都具有结构化、完整性和可靠性的特点。表信息表和域信息表是调度自动化系统中特别重要的两张表,表信息表定义了数据库中所有表的信息,包括表号、表英文名、表中文名、所属应用、最大记录数等,域信息表定义了每张数据表中所有的域信息,包括所属表、域名、类型、数据长度等。分别从实时库和历史数据库的表信息表中读取的所有表信息,获得实时库表和历史数据库表这两个本体的所有实体,对应的本体分为别“实时库表”和“历史数据库表”。(3)总线消息总线和服务总线为智能电网调度控制系统提供数据交互服务,实现同一系统内不同节点上数据的传递。消息总线通过事件集对消息进行分类,事件集是功能相近的事件的集合。解析事件集定义文件,获得事件集所有的实体,包括pdr记录通道、事件转发通道等。事件集内包括不同的事件,使用事件号区别具体的事件,通过消息事件的配置文件,获得所有事件的实体,同时提取出的本体“消息总线”、“消息事件集”和“消息事件”。服务总线提供的服务有实时库服务middata、历史数据库服务midhis、画面刷新服务midmmi、文件服务ftpserv、事件转发服务evt_sender和evt_recv、资源定位服务locator和远程访问代理服务proxy,建立服务总线的实体和本体。(4)进程智能电网调度控制系统的相关业务,本质上都是以进程的形式在计算机上运行的,可执行程序存放在bin目录下,遍历该文件夹,获得所有执行程序的信息,包括程序名、大小、更新时间等,形成具体的实体如:fes_104、model_modify、msg_bus、rtdb_server等,对应的本体为“进程”。1.2.3依据本体关系,建立实体关系构建智能电网调度控制系统业务知识图谱的关键是建立进程实体间的相互关系。sca_analog进程是scada应用的关键进程,对sca_analog进程的实体关系进行构建,能够体现构建业务逻辑知识图谱的全部特点,其详细构建步骤如下:1)解析sca_analog进程相关业务的源码和配置文件,获得进程与其他实体之间的关系。实体关系采用三元组格式<sca_analog,关系a,实体2>表示sca_analog与实体2之间存在关系a,且sca_analog和实体2是主宾关系,位置不可颠倒。2)依据已知的本体关系,确定关系a的具体实例范围,例如:实体1为sca_analog进程,则可以确定,关系a为:调用、发送、接收、读取,以及写入等;3)根据确定的谓词和主宾关系,在工程源码或者makefile文件中,获相应的实体3,从而建立起完整的实体关系,例如<sca_analog进程,调用,librte.so库>、<sca_analog进程,读取,全遥测表>、<sca_analog进程,接收,全遥测事件>。4)建立实体关系时,对于同种类型的实体关系,应前后表述一致,否则会被认为是多种不同的关系,而造成数据冗余错误。对于某些不便于解析或者无法解析的知识,提供手动录入的功能。可以人工添加本体、实体以及各实体的相互关系,方便对于知识的扩展。1.2.4实体信息的清洗和融合在不断对实体进行填充和实体间的关系进行扩展时,需要进行数据的清洗和融合。首先需要保证数据的一致性,消除本质上是同一个实体,但是由于不同的表达方式而出现多次的情况。当对实体的属性进行扩展时,需要判断该属性是否与已有的属性重合,只有是一个全新的属性时,才允许添加,从而减少数据的冗余性。2、知识的存储与维护知识图谱的存储结构如图2所示,根据本体定义表中的内容,能够实例化出多种实体表;然后再基于本体关系表,结合实例化出的多个实体表,就可以构建出实体关系表,从而可以存储完整的知识图谱。本体定义表:定义了所有的本体信息以及存储各类实体信息的数据库表名;实体表:实体表是按照本体进行分类存储的,同一类的实体存储在同一张表中;本体关系表:定义了不同本体之间所具有的关系,例如:“应用”与“进程”之间的“包含”关系,“进程”与“消息事件”之间的“发送数据”和“接收数据”关系,该表中还存储了本体关系的中英文描述等信息。实体关系表:定义两个实体之间的关系。知识图谱的内容采用三元组格式<实体1,关系,实体2>进行存储,实体1和实体2的信息存储在实体表中,关系的详细信息存储在本体关系表中,该存储方式避免了在每条实体关系中都存储详细信息而出现的数据冗余或者数据不一致错误。该存储结构清晰地展现出了所有的本体信息及其之间的关系,各类实体按类型分表存储,便于对各类实体的维护。本体关系表对实体之间的关系进行了约束,避免同样类型的关系出现不同的表述,而误当成多种关系的问题。同时,该存储结构便于知识图谱信息的扩展,若发现新的知识,只需要在本体表中加入相应的记录,建立相应的实体表,并建立实体关系即可,整个系统的模型架构不需要改变。3、知识图谱的展示及应用整个智能电网调度控制系统的知识图谱内容较多,并且关系复杂,因此前台页面展示了系统的基础平台和详细的业务知识图谱,基础平台的知识图谱各个实体节点相对固定,能够提供智能电网调度控制系统的整体框架知识,业务逻辑的知识图谱内容较多,关系复杂,能够提供智能电网调度控制系统的详细逻辑关系。3.1基础平台知识图谱展示如图3所示,基础平台的知识图谱展示有如下几个特点:1)能够展示基础平台的整体组成架构;2)知识图谱中的实体节点具有点击功能,点击进入后能够查看各个功能模块的业务逻辑。3)提供各个应用下详细业务逻辑知识图谱的入口,和业务逻辑知识图谱的展示形成整体。3.2业务逻辑知识图谱展示如图4所示,业务逻辑知识图谱关系较为复杂,各个实体之间存在错综复杂的谓词关系。结合上诉特点,业务逻辑知识图谱提供如下几个功能:1)点击进程相关节点,例如点击sca_analog进程图标,系统自动搜索与展示该进程使用的消息事件、数据库表等信息;2)点击实时数据库相关节点,例如点击遥测表节点,系统将所有读取或者写入该表的进程展示出来。即业务逻辑的知识图谱可以从不同的维度,展示自动化系统的业务关系。3)使用者如果对某个实体的业务关系不关注,点击该实体,页面自动将与之直接相关的知识图谱在图形中删除。4)可对图形中的元素进行拖拽操作,并保存成模板,便于下一次的使用。知识图谱将抽象的调度自动化系统业务知识,以图形化的方式呈现出来,让使用者对整个系统的业务知识有直观地了解。同时使用者可以操作相应的实体,选择性查看自己关心的业务知识,具有很强的交互性和可用性。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1