分布式系统的上下文特征数据驱动的顺序联合查询方法与流程

文档序号:16637204发布日期:2019-01-16 07:08阅读:249来源:国知局
分布式系统的上下文特征数据驱动的顺序联合查询方法与流程

本公开的实施例总体上涉及数据组织的方法,更具体地涉及用于查询与分布式住宅、商业和/或工业系统相关联的数据的系统和方法。

优先权声明

本申请要求以下临时专利申请的优先权和权益:2016年6月23日提交的名称为“contextual-characteristicdatadrivensequentialfederatedquerymethodsfordistributedsystems”的美国临时申请序列第us62/354,007号。前述专利申请的全部内容明确地通过引用并入本文。

背景

相关技术的描述

本申请要求以下临时专利申请的优先权和权益:2016年6月23日提交的名称为“contextual-characteristicdatadrivensequentialfederatedquerymethodsfordistributedsystems”的美国临时申请序列第us62/354,007号。前述专利申请的全部内容明确地通过引用并入本文。

物联网(iot)承诺大规模地将元件互连在一起。这些连接的元件可以包括设备、车辆、家庭、城市以及包含适用电子硬件、软件、传感器和使这些系统能够收集并交换数据的连接性的任何其他系统或系统集合。这种融合允许这种大量数据在全球范围内收集时能够转化为可操作信息。为了完成一项或更多项特定任务,系统之间会形成交互和协作。这些任务根据应用的上下文和环境而不同。例如,任务可以从感测和监测环境特征(例如单个房间的温度或湿度)到控制和优化整个建筑物或设施,以便实现更大的目标,例如能源管理战略。

根据应用,连接的元件包括促进感测、操作、致动、数据捕获、数据存储、数据处理和/或数据分析的异构和/或同构硬件。每种类型的元件都包括独特的数据结构,其详细说明硬件本身的能力和/或测量参数的数字表示。例如,温度传感器可以实现不同的硬件来促进温度测量。该硬件还可以依次提供不同的数据参数、值和/或操作单元,例如温度测量单元、时间格式、mac地址、ip地址和/或cpu类型数据。

数据结构单元、值和参数复杂性因存储和组织分布而加剧,这些分布可能存在于多个存储库内的任意数量的存储位置或混合数据结构中。此外,通过尝试统一对跨越大而不一致的时间段、存储周期性的、基于状态的或非结构化数据的数据集的可访问性,这种数据可访问性变得复杂。因此,随着真正大量异构数据通过各种可用的连接的元件及其各自的数据结构可用,高效、有效地分析该海量数据提出了严峻的挑战。

概述

本文讨论了有助于处理和执行联合查询(federatedquery)的方法和系统,该联合查询用于识别和使得可访问、可执行和可操作的数据与住宅、商业和/或工业系统相关联或由其生成。高效和有效的数据处理增益通过两部分的顺序联合查询过程实现。在各种实施例中,顺序联合查询访问、过滤、处理、转换、查询和/或对上下文特征数据源(ccds)和事务性非结构化数据源(tuds)执行操作。ccds数据组织可以包括诸如协议、使用、物理量或地形关系的数据,以及特定于应用的本体,诸如数据中心、建筑物或智能电网。tuds数据组织可以包括诸如时间序列id、时间和日期戳和/或参数值的数据。此外,非结构化或多结构化数据也可以包含在tuds内。

公开了用于在住宅、商业和/或分布式系统中的信息的顺序联合查询的方法和系统。一种处理用于分布式系统的顺序联合查询的方法可以包括:接收顺序联合查询;将顺序联合查询解构为查询元素;基于查询元素识别上下文特征数据源(ccds)、事务性非结构化数据源(tuds)和数据组织参数;基于数据组织参数从ccds生成ccds结果数据集;处理ccds结果数据集以基于数据组织参数开发tuds查询;基于所开发的tuds查询和数据组织参数,从tuds生成tuds结果数据集;基于tuds结果数据集和数据组织参数生成最终顺序联合查询数据集;基于对最终顺序联合查询数据集和数据组织参数的处理来处理格式化的顺序联合查询数据集;以及将格式化的顺序联合查询数据集提供给管理系统以用于采取行动。

本公开的原理考虑从用户和系统中的至少一个发起接收顺序联合查询。此外,从数据库、用户接口和应用接口中的至少一个接收顺序联合查询。

在本公开的一些实施例中,查询元素是基于上下文的,并且可以包括数据位置或数据操作。

在本公开的一些实施例中,使用基于查询元素的多个上下文特征数据源(ccds)、事务性非结构化数据源(tuds)或数据组织参数。

本公开的其他实施例考虑到,ccds结果数据集包括由连接的元件生成的操作异常数据。此外,tuds结果集采用时间序列数据、时间序列状态数据、时间戳数据或非结构化数据格式。此外,用于行动的管理系统可以是建筑物管理系统(bms)。

本公开的原理考虑了一种存储用于处理分布式系统的顺序联合查询的计算机可执行指令序列的非暂时性计算机可读介质,该计算机可执行指令序列包括指令,该指令指示至少一个处理器接收顺序联合查询;将顺序联合查询解构为查询元素;基于查询元素识别上下文特征数据源(ccds)、事务性非结构化数据源(tuds)和数据组织参数;基于数据组织参数从ccds生成ccds结果数据集;处理ccds结果数据集以基于数据组织参数开发tuds查询;基于所开发的tuds查询和数据组织参数,从tuds生成tuds结果数据集;基于tuds结果数据集和数据组织参数生成最终顺序联合查询数据集;基于对最终顺序联合查询数据集和数据组织参数的处理来处理格式化的顺序联合查询数据集;以及将格式化的顺序联合查询数据集提供给管理系统以用于采取行动。

在一些实施例中,至少一个处理器还被配置为接收顺序联合查询从用户或系统中的至少一个发起。此外,至少一个处理器还被配置为从数据库、用户接口和应用接口中的至少一个接收顺序联合查询。

在一些实施例中,至少一个处理器还被配置,以使得查询元素是基于上下文的,并且可以包括数据位置或数据操作。

在一些实施例中,至少一个处理器还被配置,以使得使用基于查询元素的多个上下文特征数据源(ccds)、事务性非结构化数据源(tuds)或数据组织参数。

本公开的原理考虑到,至少一个处理器还被配置以使得ccds结果数据集包括由连接的元件生成的操作异常数据。另外,至少一个处理器还被配置,以使得tuds结果集采用时间序列数据、时间序列状态数据、时间戳数据或非结构化数据格式。此外,至少一个处理器还被配置,以使得用于行动的管理系统是建筑物管理系统(bms)。

附图简述

这些附图并非意图按比例绘制。在附图中,在各个图中示出的每个相同或几乎相同的部件由划线数字表示。出于清楚的目的,并非每个部件都可以在每个图中被标记。在附图中:

图1示出了根据本公开的各种实施例的用于执行顺序联合查询的系统的各方面;

图2示出了根据本公开的各种实施例的异构硬件连接的元件的各方面,该异构硬件连接的元件可以连接到用于执行顺序联合查询的系统;

图3示出了根据本公开的各种实施例的提供用于执行顺序联合查询的数据的系统的异构硬件连接的元件的示例性部署;

图4a示出了根据本公开的各种实施例的提供用于执行顺序联合查询的数据的系统的示例性数据组织结构;

图4b示出了根据本公开的各个实施例的提供用于执行顺序联合查询方法的数据的系统的示例性上下文特征数据源(ccds)数据组织结构;

图4c示出了根据本公开的各种实施例的提供用于执行顺序联合查询的数据的系统的示例性事务性非结构化数据源(tuds)数据组织结构;

图5示出了根据本公开的各种实施例的用于执行顺序联合查询的系统部件的框图;

图6a和6b是示出根据本公开的各种实施例的执行顺序联合查询方法的方法的流程图;

图7示出了根据本公开的各种实施例的用于执行顺序联合查询的对于数据组织和处理流程图的示例系统;

图8示出了根据本公开的各种实施例的提供用于执行顺序联合查询方法的数据的示例性系统;

图9是根据本公开的实施例的处理系统的功能框图;

图10是根据图9的处理系统的处理存储系统的功能框图。

详细描述

本公开并不将其应用限于下面描述中阐述的或者在附图中示出的部件的结构以及布置的细节。本公开能够是其他实施例,并且能够以各种方式来实践或执行。另外,本文所使用的措辞和术语是出于描述的目的,而不应被视为限制。“包括(including)”、“包括(comprising)”、“具有”、“涉及”及变型在本文中的使用意在是开放式的,即“包括但不限于”。

在物联网(iot)或更广泛的网络物理系统(cps)的新兴世界中,多种技术的融合正在进行中,以允许感测、致动、数据捕获、存储或处理来自大阵列连接的元件的数据。可以使用现有网络基础设施远程访问这些连接的元件,以允许高效和有效的机器对机器(m2m)和人对机器(h2m)通信。在此通信过程中,由于连接的元件的网络随着时间的推移而改变并收集数据,来自这些连接的元件以及外部源的大量数据将被生成、存储,并允许以前不可能的相关性。底层硬件和相应关联数据结构的完全不同的异构性加剧了组织、访问、分析、操作和作用于连接的元件的动态集的问题。

数据量、种类和速度都在以远远超出对于大多数计算系统的、使用可用方法有效和高效地组织和分析过去、现在和未来数据以采取行动的能力的速度增长。存在对于处理、请求和分析来自定义系统的连接的元件的和在线可用数据的真正大量数据二者的异构源的数据,以便实现高效、有效、可操作和可执行的数据关联的能力的当前需求。应当认识到,所公开的方法和系统不仅仅是可用数据的呈现,而是一种方法和系统,其有助于针对搜索大量数据并使其相关联的技术问题来组织数据集,以向系统或用户提供可执行的信息,通过自动化可以对该信息采取行动。

每个单独的连接的元件可以具有生成不同值、单位或参数的不同硬件实现。连接的元件还可能具有诸如协议、使用、物理量或地形关系等特性,以及特定于应用的上下文数据,如数据中心、建筑物或智能电网。虽然连接的元件可以包含形成类似于其他单独的连接的元件或连接的元件的组的数据结构的特征,但是系统总是包含异构连接的元件和相关联的数据结构。然而,即使具有相似的数据特征,跨越大型物理网络的高效和有效的查询和不同连接的元件上的与这些查询相关的事务性非结构化数据也是重大挑战。解决数据异构问题的一种方法包括实现和执行对于顺序联合查询的方法。

顺序联合查询允许通过顺序查询多于一个数据源来处理查询,并提供可执行的可操作的结果。当数据源被排序(ordered)和定序(sequenced)时,使用顺序联合查询解决了两个不同的问题。第一个解决方案解决了数据异构的问题。第二个解决方案解决了处理可用于确定可执行的或接近实时的可执行的结果或解决方案集的大量事务性非结构化数据的问题。

首先,当包含不同硬件、数据结构和/或特性的连接系统被聚合用于用户、云平台和/或另一个存储库时,数据异构性就会出现。数据结构和底层数据可能不匹配。有必要对这种异构数据进行标准化,并允许对源自其他结构或格式的其他数据进行一致比较。

其次,是大量的事务性非结构化数据的集成,这些数据可能作为定义的系统的一部分存在,或者作为结构化或非结构化数据存在,而与定义的系统无关。该数据可以来自被监测系统的连接的元件,或者可以来自外部源,以分析潜在的数据相关性。以高效和有效的方式搜索如此大量的数据(有时称为“数据仓库”或“数据湖(datalakes)”)来实时或接近实时的可执行的结果来确定可执行的、可操作的结果是非常理想的。该系统还可以被部署以促进效率,并在时间不太敏感的应用中生成可执行的操作结果。

该方法的示例应用可以包括但不限于:(1)管理建筑物hvac系统以确保居住者的舒适性,(2)维护办公室环境空气质量(其可能包括温度、湿度和二氧化碳含量),并根据当前的天气条件动态调整办公室环境,(3)通过监测和控制日常操作、维护和监督设施操作来管理工厂楼层。这种应用的商业实施例可以实现为家庭、建筑物或工业自动化系统的一部分。

应当理解,本文描述的系统有助于在配置、特征、功能和/或最终用户应用方面的显著灵活性,并且,尽管描述了几个示例,但许多可选的实施例配置和实现是可能的。

图1示出了有助于生成和/或执行顺序联合查询100的系统的各方面。用于联合查询方法的系统可以包括一个或更多个处理系统110和云计算环境120。连接到云计算环境120的是各种建筑物类型,例如住宅、商业和/或工业建筑物(分别为140、150和160)。每个建筑物可以具有相关联的数据存储阵列(分别为130a、130b和130n)。一个或更多个连接的元件(如图2所示)与这些建筑物相关联,网络连接180也是如此,以允许系统各部分之间的数据交换。

对于包括用于顺序联合查询方法100的系统的建筑物的类型或数量没有隐含的限制。例如,实施例可以包括住宅140和相关联的数据存储阵列130a、办公楼150和相关联的数据存储阵列130b,或者工业生产设备160和相关联的数据存储阵列130n。每个建筑物可以维持到云计算环境120的网络连接180,并且经由网络连接180从每个建筑物中的连接的元件到每个存储阵列。应当认识到,用于顺序联合查询方法100的系统的各个部分有助于协同定位或远程存储或处理解决方案。例如,用于住宅140的数据存储阵列130a可以位于住宅140本身内、在云计算环境120中的外部但附近,和/或分布在一个或更多个存储节点上。

在图1所示的系统的一个实施例中,建筑物150包含一个或更多个连接的元件,这些元件执行用于监测或管理建筑物150的感测、致动、数据捕获、存储或处理。任何种类的连接的元件可用于捕获、存储、处理数据,致动和/或操作通过网络连接180与云计算环境120、与系统的其他部分相关联的设备。这些连接的元件可以包括硬件、模块和/或传感器。

例如,连接的元件、传感器或硬件可以被配置用于检测温度、湿度、环境光、声音、烟雾、一氧化碳、二氧化碳、运动、非导电流体、导电流体、振动、能量、功率、电压、电流或任何其他期望的特性,以及它们的组合。连接的元件还可以操作、控制或铰接其他连接的元件、部件和/或其他系统,例如打开灯、打开门或窗户、移动窗帘或触发门锁。连接的元件可以具有处理来自其他连接的元件的数据或将数据从一个或更多个连接的元件传播到一个或更多个其他连接的元件的能力。这种硬件处理能力可以是通过传感器测量环境参数的补充或替代。可以以任何组合部署任何数量的连接的元件来监测或管理物理空间,包括例如壁橱、房间、住宅、商业建筑物、校园、办公室、长廊、工业环境或任何其他期望的位置。

包含连接的元件的每个建筑物可以最终通过网络连接180连接到云计算环境120。该网络连接180允许通过能够以有线或无线连接方式连接到云计算环境120的各种设备访问该云计算环境120。根据图1,这样的设备可以包括能够从用户接收输入或者提供自主操作的一个或更多个处理系统110。一个或更多个相关联的数据存储阵列130a、130b、130n可用于提供上下文特征数据、事务性非结构化数据或两者的附加数据存储能力。应该认识到,虽然提供到附加的连接的元件或系统的附加通信路径,但是云计算环境120不需要作为顺序联合查询方法的一部分。实施例考虑整装的、独立或分布式系统。

图2示出了根据本公开的各种实施例的连接到用于执行顺序联合查询200的系统的异构硬件连接的元件的各方面。在一个实施例中,建筑物150包含用于监测或管理结构的一种或更多种类型的连接的元件210、220、230、240。这些连接的元件210、220、230、240经由有线网络连接250或无线网络连接260网络通信,并且使得来自每个连接的元件的数据结构经由网络连接180对云环境120可用。网络连接180可以包括有线和/或无线连接类型。

例如,这种连接可包括但不限于任何物理布线方法,诸如5类电缆、同轴电缆、光纤、铜、双绞线或传播电信号的任何其它物理介质。无线连接可包括但不限于个人区域网(pan)、局域网(lan)、wi-fi、蓝牙、蜂窝、全球或基于空间的通信网络。在云环境120和任何其它云环境之间的访问在其它实现中是可能的,这些其它云环境被配置成与类似于云环境(诸如现有的云环境120)的设备连接。将理解,图中所示的和本文所讨论的计算设备旨在是例证性的,并且计算节点和云计算环境可通过具有可寻址或直接连接的任何类型的网络与任何类型的计算机化设备通信。

任何种类的连接的元件可用于通过网络连接180对云计算环境120、系统的其他部分执行组织、进行访问、分析、以及操作或感测、致动、数据捕获、存储或处理。因此,这些设备可以分别具有不同的数据参数、字段、单位或与每个设备相关联的总体数据结构。

例如,如图2所示,连接的元件210可以是用于测量二氧化碳以用于监测建筑物150的空气质量并经由有线网络连接250进行通信的连接传感器。连接的元件可以被配置为获取数据并控制各种模块,例如用于检测环境光的连接传感器和被实现以改变居住者照明设备的状态并经由有线网络连接250通信的致动器连接的元件220。连接的元件可以是用于温度和湿度连接的元件230的连接传感器,以监测建筑物150的环境并经由无线网络连接260通信。最后,连接的元件240用作连接的网关,以经由它们各自的网络连接250、260与相关联的连接的元件210、220、230通信,处理每个元件的数据结构,并且将其发送到网络连接180以传输到云环境120。应该认识到,虽然提供到附加的设备或系统的附加通信路径,但计算环境120不需要作为顺序联合查询方法的一部分。其他实施例考虑整装的独立系统和/或分布式系统。

这些连接的元件不需要在地理上被定位或以任何方式在逻辑上分组以利用本公开的实施例。在地理上或在逻辑上分组连接的元件可允许更经济的使用。诸如在公寓、家庭或办公室建筑物中的地理分组以及在逻辑上按功能来定位连接的元件可被实现。许多逻辑分组示例中的一个可以是定位被设计成感测靠近被占用的位置的温度以检测环境的变化的连接端点。应当认识到,连接端点的分组也可以位于非常大的地理范围内,甚至全球范围内。这种全球操作可以通过位于全球范围的任何数量的设施中的网络来监控。

图3示出了根据本公开的各种实施例的提供用于执行顺序联合查询的数据的系统300的异构硬件连接的元件的示例性部署。示出了具有(3)个楼层的建筑物310。楼层(1)312、楼层(2)314、楼层(3)316包含在建筑物310内。在图3中,每个楼层具有(3)个不同类型的连接的元件。例如,连接的元件可以是连接传感器,以测量二氧化碳330、332、334,用于监测建筑物310的空气质量,并经由有线网络连接进行通信。连接的元件可以是用于检测环境光的连接传感器和用于改变居住者照明设备的状态并经由有线网络连接进行通信的致动器340、342、344。连接的元件可以是用于温度和湿度的连接350、352、354,以监测建筑物310的环境并经由无线网络连接进行通信。

给定图3中所示的配置,每个连接的元件拥有上下文表征数据结构,该数据结构包括但不限于传感器特定信息(温度/湿度、二氧化碳和环境光)、地理信息(区域、楼层、建筑物)和网络信息(mac地址、ip地址、有线、无线)。其他连接的元件信息以及与连接的元件本身的操作相关的信息也是可用的。作为一个示例,在线或离线状态可用于进一步添加到对于每个连接的元件的数据结构。

此外,每个连接的元件可以拥有事务性非结构化数据结构,该数据结构包括但不限于传感器特定信息(在本示例中为温度/湿度值、二氧化碳和环境光),这些信息在时间、状态或非结构化的基础上被存储。这样,每个连接的元件都有与其相关联的历史记录。该历史记录或“数据日志”可用于确定对于特定的连接的元件在时间上的趋势和/或操作特性。此外,来自各种连接的元件的历史记录的组合的数据可以分析对于特定地理空间、系统和/或系统组(例如建筑物)的趋势和/或操作特征。事务性非结构化数据的使用预计会随着时间的推移而增长,因此,需要高效的查询处理,以允许高效且有效地查询这个不断扩展的“数据湖”。

有助于处理和执行联合查询的方法和系统,该联合查询用于识别与住宅、商业和/或工业系统相关联或由其生成的数据并使得该数据可访问、可执行和可操作。高效和有效的数据处理增益通过执行两部分的顺序联合查询实现。作为以这种方式在各种各样的连接的元件上收集数据的结果,上下文特征数据和事务性非结构化数据都将可供用户或系统用于分析、构建、控制和/或连接的元件操作。这就产生了一个基本问题,即如何使用户或其他管理系统在不使用本文描述的系统的情况下可以访问且高效和有效地查询对于行动来说可能非常大的不同类型的数据源。

图4a示出了根据本公开的各种实施例的提供用于执行顺序联合查询的数据的系统400的示例性数据组织结构。如图4a所示,一个或更多个处理系统110通过网络连接180发起顺序联合查询。查询分两部分执行。首先,是对上下文特征数据源(ccds)410的查询。ccds的示例在图4b中描述。第二,来自ccds410查询的结果被处理并用于查询事务性非结构化数据源(tuds)420。tuds的示例在图4c中描述。一旦完成对数据源的处理,在适当的物理位置(例如建筑物310)中执行任何可执行的操作数据结果和相应的活动。举一个例子,在没有有效占用传感器读数的情况下,关闭已经在5am后打开了多于三个小时的北楼的灯。这两个步骤简化了对大量数据的搜索,以确定可执行或可操作的数据和/或解决方案。

示例性ccds410和tuds420都被用于所公开的顺序联合查询的方法中,以产生可执行的结果。本公开的实施例预期该数据可以存储在单个数据阵列、多个数据阵列、本地、远程、基于云或其中的任何组合上。

图4b示出了与系统相关联的连接的元件的示例性ccds410组织结构。应当认识到,任何组合中的任何连接的元件类型可以存在于任何地理位置中,并且包括相应数据结构中的附加信息。这些示例性数据组织示出了上下文特征数据和参数的示例,例如协议、使用、物理量或地形关系,以及特定于和/或上下文于应用、连接的元件或位置的本体,例如数据中心、建筑物或智能电网。

图4c示出了跨越有利于顺序联合查询的系统的连接的元件和相关联数据的示例性tuds420组织结构。存在用于顺序联合查询的系统的实施例,其中多个连接的元件向系统提供上下文特征数据和事务性非结构化数据。应该认识到,该数据可以是特定系统内部的(例如一系列湿度测量结果),系统外部的(例如公用事业公司提供的功耗率),或者两者都有。系统的特征有助于解决当分析的每个连接的元件都有关联的事务性非结构化数据以及上下文特征数据时产生的问题。

这个tuds420也包括几种类型的数据。时间序列数据430可以包含具有时间序列id或某个唯一标识符的几个数据字段。此外,每个时间序列数据元素可以具有时间和日期戳,以将数据包识别到特定时刻。最后,参数值可以与时间序列数据元素相关联以存储一个或更多个数据值。时间序列数据430的示例可以包括来自温度传感器的测量结果,该测量结果可以随时间被绘图和绘制以显示视觉曲线。

时间序列状态数据440类似于时间序列数据430,但是代替从传感器存储的数值参数,可以从光传感器捕获状态,例如“开”或“关”。每个传感器或连接的元件可以捕获无限数量的状态,例如“高”、“中”或“低”或层次状态机(hsm)中的多种状态中的任何一种。一种时间序列数据与另一种类型没有隐含限制。

时间戳数据450也可以存在于事务性非结构化数据中,其中另外的非结构化数据可能具有相关联的时间戳。这种数据类型的示例可以是在收到时打上时间戳的电子邮件消息。这种事务性非结构化数据可用于顺序联合查询中,以帮助对于系统的数据相关性。

非结构化数据460可以存在,其可能不具有相关联时间,但是在顺序联合查询中可能非常有用,以帮助对于系统的数据相关性、分析、操作和/或控制。这种数据类型的示例可以是与社交媒体应用、图像、文本文件或其他没有时间戳的文档相关联的数据。这种事务性非结构化数据可以与上下文特征数据结合使用,以形成对于系统的可执行相关性。应当认识到,“非结构化数据”还包括“多结构化数据”。换句话说,尽管数据结构不一致,几个异构的数据结构仍然分组在一起。这种数据以各种各样的格式存在,并且可以驻留在事务型和非事务型系统中。通常,这些类型的数据指的是在创建数据时可能没有定义的数据模型或以定义的方式组织的信息。

应当认识到,虽然每个连接的元件可以具有关联的上下文特征数据和事务性非结构化数据结构,但是连接的元件的数据结构的数量可以根据所涉及的硬件、特定配置或应用而变化。一旦以这种方式组织了连接的元件的数据结构,就可以在没有物理系统和相关联的连接的元件的离散或深入知识的情况下执行多维顺序联合分析。此外,前述仅仅是数据的示例,而不应被认为是以任何方式进行限制。

图5示出了根据本公开的各种实施例的系统部件的框图,该系统部件组织、使得可访问、分析、操作和作用于数据以用于执行顺序联合查询500。用户和/或机器中的自动化进程可以生成并提交顺序联合查询。用户或系统发起的查询可以在处理系统110处开始。在其他实现中,机器发起的过程可以从系统中的任何其他过程中导出。应该认识到,顺序联合查询的发起方法不是相互排斥的。在这两种情况下,顺序联合查询由联合查询处理器510处理并且是具有特定语法的结构化联合查询。在一个示例中,sparql或任何其他表达性查询语言可用于提供结构化查询语法。这种语法结构可以包括使用各种数据源、操作(例如匹配或绘图)、赋值、聚合或子查询。

顺序联合查询被接收到联合查询处理器510中,在图5中被示为一系列模块,包括:查询解构(qd)功能模块520、数据源识别和处理(dsip)功能模块530以及结果转换和过滤(rtf)功能模块540。另外,存在上下文特征数据源(ccds)410以及事务性非结构化数据源(tuds)420,其中上下文特征数据源(ccds)410具有与诸如建筑物310的结构中的连接的元件相关联的上下文特征数据。应当认识到,两个数据源可以驻留在同一物理设备上,或者跨一个或更多个系统。

查询解码器(qd)520分析顺序联合查询并将其解构为查询元素。这些查询元素可以包括上下文数据或操作符,例如要使用的任何数据源的位置、用于数据的操作参数、要对结果执行的过滤以及任何输出格式。

数据源识别和处理(dsip)功能模块530处理和利用查询元素,以分析查询元素并基于解构的查询元素对转换的数据源或从结果数据构建的查询执行操作。这些数据源可以包括ccds410、tuds420和/或数据源的组合。应该认识到,首先查询ccds410,结果被处理、转换和利用以在tuds420上执行查询。由于ccds和tuds的不同的数据存储范式,有必要根据目标数据源范式处理查询。dsip能够根据目标存储数据格式生成查询。数据格式包括sparql、sql、mongodb查询等。

ccds查询将由数据源识别和处理(dsip)功能模块530执行,并发送550到ccds410。一旦查询完成,ccds结果数据将被返回555到数据源识别和处理(dsip)功能模块530。类似地,tuds查询将由数据源识别和处理(dsip)功能模块530执行,并被发送560到tuds420。一旦查询完成,tuds结果数据将被返回565到数据源识别和处理(dsip)功能模块530。

一旦数据在ccds410和tuds420中被查询,由查询元素定义的结果就由结果转换和过滤模块540处理和/或过滤并转换成初始顺序联合查询中指定的格式。为转换准备的数据格式示例可包括csv、xml、json或rdf。转换的结果被传送回处理系统110,用于在相应环境中的操作或行动,例如在建筑物310内执行的建筑物管理系统。

图6a和图6b是示出根据本公开的各种实施例的执行顺序联合查询600的方法的流程图。如所讨论的,从用户或处理系统接收610顺序联合查询。这可以是来自用户的手动行动、来自另一个处理系统的自动行动,或者两者的某种组合。应该认识到,不止一个数据源或连接的元件可能是顺序联合查询的目标。这包括内部系统和外部数据,例如来自“数据仓库”或“数据湖”的数据。应当认识到,所公开的方法并不仅仅导致可用数据的呈现,而是一种方法,其有助于针对搜索大量数据并使其相关联的技术问题来组织数据集,以向系统或用户提供可执行的信息,通过自动化可以对该信息采取行动。

一旦接收到,顺序联合查询被解构为其复合查询元素620。这些查询元素可以包括要使用的任何数据源的位置、用于数据的操作参数以及要对结果执行的任何过滤和/或处理。一旦解构,就执行625错误检查以确定正在请求什么顺序联合查询类型,以及基于所确定的查询元素是否能够满足这样的请求。如果所确定的查询元素不允许当前方法继续,则该过程返回到接收顺序联合数据查询610输入元素,以用于顺序联合查询的重新提交和/或重新构造。

如果确定查询元素支持所请求的查询类型,则该方法通过识别上下文特征数据源(ccds)、事务性非结构化数据源(tuds)和/或任何数据组织参数630来继续。在一个示例中,验证635还被执行以验证数据源当前是否以顺序联合查询中指定的形式或位置存在。此外,可以做出关于可用数据的类型和/或源是否适合这种查询的确定。例如,如果存在特定类型的上下文特征,或者存在多个事务性非结构化源,则可能需要进一步的逻辑。

一旦每个数据源被验证635,基于从顺序联合查询确定的数据组织参数640来查询上下文特征数据集。对上下文特征数据的这种查询创建了集中的数据集,该数据集可以应用于大量数据,例如包含在tuds中的数据,以产生对系统用户(如建筑管理员)和/或特定系统最有用的精化数据集。该流程从图6a继续到图6b645。

一旦上下文特征查询创建了集中的数据集,该数据集就被转换成事务性非结构化查询650。应当认识到,查询数据源的顺序是实现本文描述的效率的重要方面。(1)上下文特征源查询,然后是(2)事务性非结构化源查询的这种有序的方法,通过在步骤(1)中充分关注需要在步骤(2)中查询的事务性非结构化数据量,而有助于高效搜索大型事务性非结构化数据集。

从来自事务性非结构化数据集的查询结果中,基于来自数据源和数据组织参数的结果提取原始数据集660。从该原始数据集,将以事务性非结构化格式创建670精化数据集,诸如时间序列数据430、时间序列状态数据440、时间戳数据450或非结构化数据460。然后,该结果数据集基于查询参数被处理和/或过滤,并转换以形成最终数据集680。为转换准备的数据格式示例可包括csv、xml、json或rdf。

该最终数据集然后被验证685,以基于结果数据确定可以采取什么行动、操作或分析。如果这些行动被确定为有效,则它们可以被发送给用户或管理系统,例如建筑物管理系统,以基于来自顺序联合查询690的结果采取自主行动。如果确定这些行动无效,则处理返回到接收顺序联合查询695以重新提交。

图7示出了根据本公开的各种实施例的用于执行顺序联合查询的数据组织和处理流程图700的典型系统。该系统的实施例示出了在从用户或处理系统的输入时接收的顺序联合查询。顺序联合查询的创建可以是来自用户的手动行动、来自另一个处理系统的自动行动,或者两者的某种组合701。顺序联合查询可以利用诸如sparql、sql或mongodb的语言来查询任何上下文特征数据源751,如图7所示为“系统1”。

一旦接收到,顺序联合查询被解构为其复合查询元素702。这些查询元素可以包括要使用的任何数据源的位置,例如“系统1”751内的上下文特征数据源(ccds)数据源或如图7所示的“系统2”752的事务性非结构化数据源(tuds)数据源。查询元素中还可以包括用于数据的操作参数以及对结果执行的任何过滤。

基于从初始顺序联合查询702解构的查询元素,在“系统1”751的ccds上执行703查询。来自在“系统1”上执行的ccds查询的这些基于上下文特征的结果被系统接收704、处理705,并被转换成事务性非结构化数据格式706,例如sql或xquery、mongodb或其他。

现在以事务性非结构化数据格式706进行转换,这些结果作为查询707被注入到“系统2”752的tuds中。此查询可以格式化为sql、mongodb、xquery或任何其他查询语言。该查询结果由“系统2”752处理708,并且结果709产生事务性非结构化数据格式的数据,但仅参考先前指定的上下文特征数据。这是通过这个两部分顺序联合查询过程实现的高效和有效的数据处理增益。以这种顺序次序执行,该系统有助于处理和执行顺序联合查询,以便以高效和有效的方式识别与住宅、商业和/或工业系统相关联或由其生成的可访问、可执行的和可操作的数据。

来自对“系统2”752的tuds的查询的结果被返回到系统,并且根据初始顺序联合查询参数被处理和/或过滤710。最后,结果被转换成请求的格式711,它可以包括csv、xml、json、rdf。这种格式可以被人类和/或机器用于生成从结果数据导出的行动的方法。

图8示出了实施工业建筑物设施和能量管理系统的图7的处理步骤的工作示例800。示出的具有三个不同建筑部分的工业建筑物810包括:机器车间820、hvac房间830和办公空间840。每个不同的建筑部分具有三个不同类型的连接的元件,包括二氧化碳传感器连接的元件850、852、854和用于检测照明的占用/致动的连接传感器860、862、864。连接的元件可以是用于功率测量的连接传感器870、872、874,以监测建筑物810的各部分的能量消耗。这种系统还具有ccds880,以提供具体关于建筑物810和包含在其中的连接的元件的上下文特征数据。ccds880可以包含在建筑物810内、位于远程位置中和/或基于云。此外,可能位于远程位置中或基于云的tuds890也通过网络连接被连接到系统,以向系统提供事务性非结构化数据。

作为许多示例之一,建筑物管理系统(bms)可以由用户编程来测量和保持一定水平的空气质量。应当认识到,这也可以由系统通过使用预定义的规则来实现,以通过传感器、建筑物空气处理和/或hvac系统来测量和保持一定水平的空气质量。该空气质量水平可被编程为基于所监测的建筑物的部分而变化。每当建筑物的特定部分820、830、840被占用时,可以将百万分之1000(ppm)的二氧化碳水平设置为对于建筑物810内所有空间的上限。然而,如果整个建筑未被占用,则可允许二氧化碳水平上升到最高5000ppm,从而只有当人们在建筑物内时,通过高效运行空气处理器系统来节约能源。如果检测到占用者,必须在可接受的占用水平内对二氧化碳水平进行立即补救。这种补救通过激活对于建筑物810的空气处理系统来实现。

单个bms可以负责管理类似于示例建筑物810的几个建筑。为了高效和有效地管理和控制所有连接的建筑物中所有连接传感器及其相关联的空气处理和/或hvac系统,以及利用事务性非结构化数据;可以利用顺序联合查询。因此,负责维持建筑物810中空气质量的bms利用由系统提供的顺序联合查询来(1)通过处理来自检测占用率的连接传感器860、862、864来确定建筑物810的占用率,(2)通过处理来自二氧化碳传感器连接的元件850、852、854的数据来确定当前二氧化碳水平,(3)将测量的二氧化碳读数与事务性非结构化数据集相关联,以及(4)转换生成的数据集以执行补救行动,例如激活空气处理系统,来降低其中空气处理激活合适的那些区域中的二氧化碳水平。

当bms连续处理这种顺序联合查询时,查询ccds880用于具体关于建筑物810的数据。一旦该数据从ccds中提取出来,它就被处理并转换成事务性非结构化数据格式,并作为查询注入到tuds890中。作为按顺序查询和处理ccds880和tuds890的直接结果,如果建筑物或建筑物的部分被占用给定的持续时间,并且二氧化碳水平高于规定的最大值,则bms将发起自主行动来补救空气质量。

在另一个示例中,在周期性的基础上监测建筑物810的每个部分的用于功率测量的所有连接传感器870、872、874。关于这些传感器,存在ccds880数据,这些数据提供例如传感器位置的上下文特征数据,并且周期性数据与对给定时间的能量测量一起存储在tuds890中。如果建筑物操作员被要求了解对于一段时间内的功耗数据,并确定预测未来使用的最大用例,那么可以使用顺序联合查询来高效地检索这些数据。

在这种情况下,建筑物操作员将创建顺序联合查询,该查询指定用于功率测量870、872、874的连接传感器。此外,用户还可以指定要使用的ccds880和tuds890以及其他参数,例如要查询的特定时间帧,并提供总功耗数以及对最大功耗结果进行过滤。

这种顺序联合查询将查询ccds880用于对功率测量的传感器870、872、874的上下文特征数据,并且依次处理和转换该数据以查询tuds890对于所需的特定时间帧。一旦对tuds890的查询在初始顺序联合查询中如所描述的那样被完成和处理和/或过滤,则结果将被返回给用户用于行动,在这个示例中,可以包括对于建筑物810的规划活动。

在另一个示例中,可以执行顺序联合查询,以确定哪些(如果有的话)连接的元件已经变得不可操作或者以其他方式发生了故障。在这种顺序联合查询中,用户或系统可以关联建筑物810的办公空间840中的所有或一些连接的元件(例如连接的元件854、864、874)子集的比较。虽然如果连接的元件的配置没有改变,ccds880数据将保持不变,但是对于每个连接的元件854、864、874的tuds890数据的比较可能无法产生tuds890数据,例如在线状态或先前定义的基于周期性的离散温度/湿度测量结果。这种类型的顺序联合查询允许维护操作员及时针对非常大且异构分布的连接传感器确定问题和后续行动。

以这种方式,给定由上下文特征数据类型数据确定的一个或更多个环境考虑,可以执行手动、自主或接近实时的自主行动和/或控制。这种环境考虑通过异构连接的元件进行监测,并与大量事务性非结构化数据相关联。这些描述的系统和方法有助于处理和执行顺序联合查询,用于识别与住宅、商业和/或工业系统相关联或由其生成的数据并使该数据可访问、可执行和可操作。高效和有效的数据处理增益通过这两部分的顺序联合查询过程实现。

应当认识到,所公开的方法和系统不仅仅是可用数据的呈现,而是一种方法和系统,其有助于针对搜索大量数据并使其相关联的技术问题来组织数据集,以向系统或用户提供可执行的信息,通过自动化可以对该信息采取行动。

在本公开的各种实施例中使用的任何处理系统可以是例如处理系统,诸如基于intelpentium型处理器、motorolapowerpc、sunultrasparc、hewlett-packardpa-risc处理器或任何其它类型的处理器的那些计算机。

例如,本公开的各种实施例可被实现为在处理系统900(诸如图9所示的处理系统)中执行的专用软件。处理系统900可包括处理器920,其连接到一个或更多个存储器设备930,诸如磁盘、存储器或用于存储数据的其它设备。存储器930一般用于在处理系统900的操作期间存储程序和数据。处理系统900也可包括提供额外的存储容量的储存系统950。处理系统900的部件可由互连机构940耦合,互连机构640可包括一个或更多个总线(例如,在集成在同一机器内的部件之间)和/或网络(例如,在存在于单独的分立机器上的部件之间)。互连机构940使通信(例如,数据、指令)能够在系统900的系统部件之间交换。

处理系统900还包括一个或更多个输入设备910(例如,键盘、鼠标、轨迹球、麦克风、触摸屏)和一个或更多个输出设备960(例如,打印设备、显示屏、扬声器)。另外,处理系统900可以包括将处理系统900连接至通信网络(互联机构940的补充或替代)的一个或更多个接口(未示出)。

在图10中更详细示出的储存系统950一般包括计算机可读和可写的非易失性介质1010,其中存储了定义由处理器执行的程序或存储在介质1010上或中以由程序处理的信息以执行与本文所述的实施例相关联的一个或更多个功能的信号。介质可以是例如磁盘或闪存。通常,在操作中,处理器使数据从非易失性记录介质1010中读取到另一存储器1020内,存储器1020允许与介质1010相比由处理器更快地访问信息。这个存储器1020一般是易失性随机存取存储器,诸如动态随机存取存储器(dram)或静态存储器(sram)。它可位于如所示的储存系统1000中或存储器系统930中。处理器920通常操纵在集成电路存储器930、1020内的数据并接着在处理完成之后将数据复制到介质1010。各种机构已知用于管理在介质1010和集成电路存储器元件930、1020之间的数据移动,且本公开不限于此。本公开内容不限于特定的存储器系统930或储存系统950。

处理系统可包括特别编程的专用硬件,例如专用集成电路(asic)。本公开的各方面可在软件、硬件或固件或其任何组合中实现。此外,这样的方法、行动、系统、系统元件及其部件可被实现为上面所述的处理系统的部分或实现为独立部件。

虽然处理系统900作为示例被示为本公开的各方面可以在其上实施的一种类型的处理系统,但应认识到,本公开的各方面不限于在如图10所示的处理系统上实现。可在具有图10所示的不同的架构或部件的一个或更多个计算机上实施本公开的各种方面。此外,在本公开的实施例的功能或过程在本文(或在权利要求中)被描述为在处理器或控制器上执行的情况下,这样的描述旨在包括使用多于一个处理器或控制器来执行功能的系统。

处理系统900可以是使用高级计算机编程语言可编程的处理系统。处理系统900也可以使用专门编程的专用硬件来实现。在处理系统900中,处理器920一般是市场上可买到的处理器,诸如从英特尔公司可买到的公知的pentium类处理器。许多其他处理器是可用的。这样的处理器通常执行操作系统,其可以是例如从微软公司可得到的windows95、windows98、windowsnt、windows2000、windowsme、windowsxp、vista、windows7、windows10或子代操作系统、从苹果计算机可得到的macossystemx或子代操作系统、从sunmicrosystems可得到的solaris操作系统或从各种源可得到的unix、linux(任何发行版)或子代操作系统。可使用许多其他操作系统。

处理器与操作系统一起定义了对其以高级编程语言编写应用程序的计算机平台。应理解,本公开的实施例不限于特定的处理系统平台、处理器、操作系统或网络。此外,对本领域的技术人员应当明显的是,本公开不限于特定的编程语言或处理系统。此外应该认识到,还可使用其他适合的编程语言和其他适合的处理系统。

处理系统的一个或更多个部分可被分布在耦合到通信网络的一个或更多个处理系统当中。例如,如上面讨论的,确定可用的功率容量的处理系统可位于远离系统管理器处。这些处理系统也可以是处理系统系统。例如,本公开的各个方面可被分配于一个或更多个处理系统之间,该处理系统被构造成为一个或更多个客户计算机提供服务(比如服务器),或者作为分配系统的一部分执行总的任务。例如,可在包括分布在执行根据本公开的各种实施例的各种功能的一个或更多个服务器系统当中的部件的客户端-服务器或多层系统上执行本公开的各种方面。这些部件可以是使用通信协议(例如,tcp/ip)通过通信网络(例如,互联网)通信的可执行中间(例如,il)或解释(例如,java)代码。例如,一个或更多个数据库服务器可用于存储在设计与本公开的实施例相关联的布局时使用的设备数据,诸如预期功率抽取。

应认识到,本公开不限于在任何特定的系统或系统组上执行。此外应认识到,本公开不限于任何特定的分布式架构、网络或通信协议。

本公开的不同实施例可使用面向对象的编程语言编程,比如smalltalk、java、c++、ada或c#(c-sharp)。也可以使用其它的面向对象的编程语言。或者,可以使用函数、脚本和/或逻辑编程语言,例如basic、fortran、cobol、tcl或lua。本公开的各个方面可在非编程的环境下(比如以html、xml或其他格式创建的文档,当在浏览器程序的窗口中查看时,其提供图形用户界面(gui)的外观或执行其他的功能)实行。本公开的各个方面可被实现为编程的或非编程的元素,或其任意组合。

上面所述的系统和方法的实施例通常被描述为用于在具有很多设备机架的相对大的数据中心中使用;然而,也可与较小的数据中心一起以及与除了数据中心以外的设施一起使用本公开的实施例。一些实施例也可以是在地理上分布以免类似于特定的架构的非常少量的计算机。

在上面讨论的本公开的实施例中,分析的结果被描述为实时地被提供。如本领域中的技术人理解的,术语实时的使用并不意欲暗示结果是立即可用的,而更确切地,其是快速可用的,给设计者在短时间段期间(诸如在几分钟内)尝试多个不同的设计的能力。

在这样描述了本公开的至少一个实施例的几个方面后,应认识到,本领域技术人员将容易想到各种改变、修改和改进。这种改变、修改和改进旨在成为本公开的一部分,并且旨在本公开的精神和范围内。因此,前文的描述和附图仅仅是示例性的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1