针对分布式体系架构的可扩展商业过程智能和预测性分析的制作方法

文档序号:11851367阅读:168来源:国知局
本申请要求2015年3月31日递交的美国申请No.14/675,397的优先权的权益,该美国申请要求2014年3月31日递交的并且题为“针对分布式体系架构的可扩展商业过程智能和预测性分析(ScalableBusinessProcessIntelligenceandPredictiveAnalyticsforDistributedArchitectures)”的美国临时专利申请No.61/973,006的优先权。
技术领域
:本发明涉及数据管理,具体地,涉及跨分布式系统体系架构的数据管理。甚至更具体地,本发明性的构思涉及配置为跨分布式系统体系架构来管理数据的系统、技术和/或产品。针对如下特定的目的,数据被管理:确定并提供与一个或多个商业过程相关的商业智能和/或预测性分析,所述商业过程与数据被收集、生成、产生、获取等相连/相关。
背景技术
::在已知的商业智能和分析中,利用任意数量的惯常的隔离机制(例如,针对特定的目的或部门,指定特定的资源,诸如包括针对生产、质量控制、运送、接收、会计、人力资源、客户关系等的独立资源的体系架构),数据被跨体系架构分配。该体系架构的每个独立的组份可包括处理资源和/或存储资源。示例性的处理资源可包括硬件和/或软件。在某些实例中,处理资源包括诸如分析软件之类的特定于上下文的工具,其被配置为分析并提供与商业数据(其可选地可以被本地存储或远程存储到处理资源)相关的商业智能。惯常的商业智能利用存储在“仓库”惯例中的数据,其中根据上述惯常的方式,数据被分配,如果可能的话,全部数据被分配。仓库数据通过利用一种处理被发现和定位,其中用户制定标准的查询(例如,SQL查询或其他适用于与惯常的关系数据库结构一起使用的查询)并且将查询提交至控制实体(例如,数据贮存控制器)以用于处理。控制实体穷尽式地将查询分配给实体正与其进行通信的所有资源,并且接收回复,该回复指示针对每个资源的结果。为了获得可接受的性能,惯常的商业智能方法要求载入内存中的整个数据集,以便利用其中所包含的数据来执行任何操纵或计算。虽然惯常的对数据分布的强制力方法有效地降低了施加于任何特定资源上的贮存负载,并且类似地,通过跨多个处理器分路工作负载而减少了工作处理时间,但是,贮存以及处理范式的非智能本质给整个系统和相关联的处理引入了显著的低效性。例如,为了利用所存储的数据来进行典型的处理操作,惯常的方法要求将整个数据集存储在内存中并且在全载入数据集上执行对应的处理操作。自然地,这要求对能够利用任何给定资源而处理的数据集的最大大小上引入极限。由于商业数据整合和分析依赖于越来越大和更加复杂的数据集,因此,惯常的方法在可获得的性能上呈现出硬极限。另外,惯常的数据贮存遵循范式,其中数据集的每个接入点(例如,访问数据或所有数据的每个用户)维护接入点和数据集之间的关系集(通常以数据指针或参考的形式存在)。相应地,系统开销要求作为要求访问数据集的用户数量的函数而增加。通常的经验法则是,针对每个与数据集相关联的用户,系统要求大约10%的额外资源容量(或内存)。因此,如果系统要求100GB的内存来处理与单个用户相关联的数据集,则如果与十个用户相关联的话,相同的系统将要求200GB的内存来类似地处理相同的数据集。因此,惯常的压缩技术,即便能够获得很大程度的占用空间的减少(例如,特别成功的占用空间减少可获得多达10:1的压缩比),这很快被用户访问要求的适度增加而抵消。根据强制性方法,惯常的BI利用惯常的查询结构和处理来定位并取回跨多个资源存储的数据。结果,关于存储在不同位置处的特定数据,可能存在冗余和非一致性(例如,版本历史)。但是,查询将报告所有满足其中所定义的条件的数据,而不管这种冗余、非一致性或其他惯常方法内在的成问题的问题。更糟糕的是,出于处理目的而将整个数据集保持在内存中的要求给系统施加了硬的性能极限,其并不随着越来越多的数据要求或系统自身而扩展。换言之,如果具有大约1TB的占用空间的数据集仅访问0.75TB的内存,则该处理以现实世界限制所不可接受的冰川步调中断或进行。因此,许多这些分析平台已经达到了传统数据管理技术的能力,并且求助于内存中解决方案来解决性能问题。利用与商业智能平台相关联的内存中解决方案帮助降低了分析查询被发起时以及结果可被用于移动组织向前进之间的延迟。第一代内存中BI产品限于利用建立在单个服务器上的存储器。该问题被如下事实恶化:针对每个用户,其还要求多达额外10%的数据开销,这使得更加适中的数据量在大多数服务器上快速达到最大。随着处理功率和存储器可用性上的增长,许多平台(服务器/台式机/膝上型计算机)未充分利用一个或多个处理器和存储器的可用计算机资源。通过将数据从传统(例如,“旋流片”)数据管理移动至主存空间数据管理,内存中的方法降低了从数据管理位置到处理执行的“往返行程”的时间量。例如,存储在磁盘上或在磁盘上存储信息的数据库管理系统(DBMS)上的文件。这些内存中实现是基于惯常的方法的若干通用特征的。例如,内存中实现限于在单个平台(诸如,针对单个用户环境的服务器或台式机或膝上型计算机)上可用的存储器空间的极限内进行处理。另外,内存中设备通常根据特定实现(例如,供应商实现)而被分配,而非作为通用数据管理资源而被利用。结果,许多这些惯常的方法和环境利用平台(服务器/台式机/膝上型计算机)存储器空间上的大约一半可用内存。在该有限的存储器分配中,针对单个用户环境,可获得大约3-5x的压缩因子(其很大程度上依赖于被存储的数据的类型),这有效地减少了整体系统上的数据占用空间。例如,在带有24GB内存用于服务的标准商品服务器上,针对商业智能平台的大多数内存中设备支持对具有大约36GB和60GB之间的数据的数据集的处理。利用专有的内存中数据管理解决方案而非通用的DBMS,许多商业智能平台将特定数据结构中的信息进行隔离,并且限制对该信息的访问。由于各种经隔离的组件并未被配置或未能够对通用数据库的容量起作用,因此,信息仅可被特定供应商的方法访问或经由复杂的数据访问系统而被访问。因此,存在与商业智能平台中实现内存中相关联的开销。许多这些早期的内存中设备是基于特定于特定供应商的实现的专用结构的。这允许对存储器管理和数据压缩进行特定的工作负载考虑。这些组件允许供应商最佳地利用与平台以及对由解决方案所管理的信息的知识相关联的可用内存。但是,至于调谐和资源分配,其可能是个“黑匣子”。这种对内部工作的可视性的缺乏可阻碍建筑师和管理员适当地针对其特定环境来分配资源。接下来,内存中设备所利用的存储器空间仅在现有平台(服务器/台式机/膝上型计算机)的内部“扩展”。随着用户数量的增加,针对环境的容量要求也增高。每个额外的用户要求大约额外10%,以用于重叠分析要求。这以数据交集和个人用户信息的开销的形式存在。这减少了针对要分析的核心数据的可用空间量。由于这些限制,类似于以上详述的支持10个用户而非仅1个用户的服务器环境将能够支持减少的数据集。由于增加的用户要求,仅15-25GB的信息将在相同的存储器空间中服务,而非36-60GB的数据。最后,由于许多这些内存中设备并不是通用数据库,因此,很难与其他应用共享信息。除了NoSQL数据管理平台以外,标准的数据访问方法是跨越数据贮存以整合信息的道路。但是,这些专用结构并不与存在已久的结构化查询语言(SQL)交流,以提供分析平台之外的整合。前述用以实现早期内存中技术的标准方法引入了受限制的因素。首先,规模或可扩展性是主要的担心。这些平台与增长的并分布广的分析要求相匹配的能力显著地限制了在何处以及如何应用内存中,而无需手动驱动的分割技术。第二,移动到全内存中的方法创建了兼容性的问题,因为该技术偏离了当前世界常见的工业标准,其中“旋流片”被用作数据管理的一种高效选项。对于解决针对分析的增长的要求而言,内存中是卓越的答案。但是,传统的数据管理针对操作性和经济原因二者提供了很好的补充。第三,早期的内存中设备主要聚焦于经由内存分配和数据压缩来利用技术性元数据来驱动性能提升。该狭窄的聚焦没有意识到通过利用通用元数据模型和性能管理范式所提供的整个益处。牢记这些限制,对于提供内存中设备用于商业智能平台经由分布式计算的改进、数据管理方法之间的协作,以及利用元数据的额外层来最优化分析环境的性能和经济二者是有用处的。技术实现要素:当前所公开的发明性构思一般涉及可扩展的商业智能和分析,并且提供无缝、高效的技术、系统以及计算机程序产品。在一个实施例中,一种方法包括接收与商业或商业过程相关的数据;根据元数据模型来处理接收到的数据,其中所述处理包括生成与多个数据部分中的每个相对应的元数据;至少部分基于与所述数据部分相对应的所述元数据,将所述接收到的数据分割成多个所述数据部分,以及跨布置在分布式体系架构中的多个资源,分配多个所述数据部分中的每个以及与每个各自数据部分相对应的所述元数据。所述元数据模型包括描述所述数据的特征,所述特征包括语义特征;提取、转变、载入(ETL)特征;以及使用特征。在另一实施例中,一种方法,包括:接收代表商业的当前状态的一个或多个种子值;接收代表预确定时段中的多个所述商业的历史状态的历史商业状态数据;利用至少一个处理器,使用所述一个或多个种子值和基于所述历史商业状态数据的模型连续仿真一个或多个商业进程;以及检测与所述仿真中所预期的进展的偏离。在又一实施例中,一种计算机程序产品,包括具有体现于其上的计算机可读程序指令的计算机可读存储介质,所述计算机可读程序指令被配置为一旦执行则使得至少一个处理器进行以下操作:接收与商业或商业过程相关的数据;根据元数据模型来处理接收到的数据,其中所述处理包括生成与多个数据部分中的每个相对应的元数据;至少部分基于与所述数据部分相对应的所述元数据,将所述接收到的数据分割成多个所述数据部分,以及跨布置在分布式体系架构中的多个资源,分配多个所述数据部分中的每个以及与每个各自数据部分相对应的所述元数据;其中所述元数据模型包括描述所述数据的特征,所述特征包括:语义特征;提取、转变、载入(ETL)特征;以及使用特征。当然,前述仅是阐释性实施例,并且多个发明性特征将随着详细给出的描述和附图中更全面地理解。附图说明图1描绘了根据一个实施例的体系架构。图2示出了根据一个实施例的与用户设备和/或服务器相关联的代表性的硬件环境。图3描绘了一般地根据本发明的一个实施例的原理操作的分布式体系架构。图4是根据一个实施例的方法的流程图。图5是根据一个实施例的方法的流程图。具体实施方式出于阐释本发明的一般原理的目的,进行以下描述,并且这并不意味着限制此处所要求保护的发明性概念。另外,此处所描述的特定特征可与其他所描述的特征以各种可能的组合和排列被组合使用。除非此处另外具体限定,所有的术语都被给予其最宽的可能的解释,其包括说明书中所暗示的含义以及本领域技术人员所理解的含义和/或字典、论文等中所定义的含义。还必须注意,如在说明书和所附权利要求书中所使用的那样,除非另外指定,单数形式的“一”,“一个”和“那个”包括复数的指示对象。本申请涉及数据管理。更具体地,当前公开的发明性构思应用于数据管理并公开了高级的技术、系统体系架构、程序产品等,其使得能够跨多个系统进行数据共享。如此处所指的,系统、技术、产品等被看作是“高度可扩展的”,其中用户、管理员、机器(物理的和/或虚拟的)、接入点等可被添加至现有的体系架构中和/或从其移除,而不会对管理和/或其操作引入额外的开销。在一个一般的实施例中,方法包括:接收与商业或商业过程相关的数据;根据元数据模型来处理接收到的数据,其中所述处理包括生成与多个数据部分中的每个相对应的元数据;至少部分基于与所述数据部分相对应的所述元数据,将所述接收到的数据分割成多个所述数据部分,以及跨布置在分布式体系架构中的多个资源,分配多个所述数据部分的每个以及与每个各自的数据部分相对应的元数据。该元数据模型包括描述数据的特征,该特征包括语义特征;提取、转变、载入(ETL)特征;以及使用特征。在另一一般的实施例中,方法包括接收代表商业的当前状态的一个或多个种子值;接收代表预定时段中的多个商业的历史状态的历史商业状态数据;利用至少一个处理器,利用所述一个或多个种子值以及基于所述历史商业状态数据的模型,连续仿真一个或多个商业过程;以及检测仿真中对预期进展的偏离。在又一一般的实施例中,计算机程序产品包括体现于其上的计算机可读程序指令的计算机可读存储介质,该计算机可读程序指令被配置为一旦执行则使得至少一个处理器:接收与商业或商业过程相关的数据;根据元数据模型来处理接收到的数据,其中所述处理包括生成与多个数据部分中的每个相对应的元数据;至少部分基于与所述数据部分相对应的所述元数据,将所述接收到的数据分割成多个所述数据部分,以及跨布置在分布式体系架构中的多个资源,分配多个所述数据部分的每个以及与每个各自的数据部分相对应的元数据。该元数据模型包括描述数据的特征,该特征包括语义特征;提取、转变、载入(ETL)特征;以及使用特征。通用联网和计算概念如此处所理解的,移动设备是任何能够接收数据而无需经由物理连接(例如,线缆、绳、电缆等)提供功率,并且能够接收数据而无需物理的数据连接(例如,线缆,绳,电缆等)的设备。在本公开的范围内的移动设备包括诸如移动电话、智能电话、平板电脑、个人数字助理、设备等之类的示例性设备。当然,此处阐述的各个实施例可利用硬件、软件或其任何所希望的组合来实现。就此而言,可以使用能够实现此处阐述的各种功能的任何类型的逻辑。呈现此处的描述是用以使得任何本领域技术人员能够做出并利用本发明,并且该描述在本发明的特定应用和其要求的上下文中被提供。对于本领域技术人员而言,对所公开的实施例的各种修改将是极其显然的,并且此处所定义的一般原理可被应用于其他实施例和应用,而不偏离本发明的精神和范围。因此,本发明并不意欲受限于所示出的实施例,而是符合与此处所公开的原理和特征一致的最宽的范围。具体地,此处所讨论的本发明的各个实施例利用因特网作为多个计算机系统之间通信的手段来实现。本领域技术人员将意识到,本发明并不限于将因特网用作通信介质,并且本发明的可替换方法可接纳使用私人内部网、局域网(LAN)、广域网(WAN)或其他通信手段。另外,可利用有线、无线(例如,射频)和光通信链路的各种组合。本发明的一个实施例可在其中示例性执行的程序环境融合了一个或多个通用计算机或专用设备,诸如手持计算机。这些设备(例如,处理器、存储器、数据贮存器、输入和输出设备)的细节是已知的,并且出于简洁的目的而被省略。还应理解,可利用多种技术来实现本发明的技术。例如,可以以在计算机系统上运行的软件来实现此处所描述的方法,或以利用一个或多个处理器和逻辑(硬件和/或软件)来执行该方法的操作的硬件来实现此处所描述的方法,或专用集成电路,诸如场可编程门阵列(FPGA)之类的可编程逻辑设备,和/或各种其组合来实现此处所描述的方法。另外,根据各个实施例的系统可包括处理器以及与处理器集成和/或由处理器执行的逻辑,该逻辑被配置为执行此处所记述的一个或多个处理步骤。通过与其集成,这意味着处理器具有嵌入其中作为硬件逻辑的逻辑,诸如专用集成电路(ASIC),场可编程门阵列(FPGA)等。可由处理器执行意味着该逻辑是硬件逻辑;诸如固件、操作系统的一部分、应用程序的一部分等之类的软件逻辑,或硬件和软件逻辑的某些组合,其可由处理器访问并被配置为一旦由处理器执行则使得处理器执行某些功能。软件逻辑可被存储在任何存储器类型的本地和/或远程存储器上,如本领域中所已知的。可利用任何本领域中已知的处理器,诸如软件处理器模块和/或诸如ASIC、FPGA之类的硬件处理器、中央处理单元(CPU)、集成电路(IC)、图形处理单元(GPU)等。在一个示例性方法中,此处所描述的方法可由驻于诸如物理的(例如,非暂态)计算机可读介质之类的贮存介质上的一系列计算机可执行指令实现。另外,虽然本发明的特定实施例可利用面向对象的软件编程概念,但是本发明并不如此限定,并且容易地适合于利用指引计算机的操作的其他形式。还可以计算机程序产品的形式来提供本发明,其包括其上具有计算机代码的计算机可读存储或信号介质,所述计算机代码可由计算设备(例如,处理器)和/或系统来执行。计算机可读存储介质可包括任何能够在其上存储计算机代码的介质,以用于计算设备或系统的使用,其包括诸如只读和可写CD和DVD之类的光介质、磁存储器或介质(例如,硬盘驱动、磁带)、半导体存储器(例如,闪存或其他便携式存储卡等)、编码于芯片中的固件等。计算机可读信号介质是不符合上述存储介质类别的介质。例如,示例性的计算机可读信号介质例如经由物理网络或虚拟网络等在一个系统内、多个系统之间进行通信或否则传输暂态信号。图1示出了根据一个实施例的体系架构100。如图1中所示,提供了多个远程网络102,其包括第一远程网络104和第二远程网络106。网关101可被耦合在远程网络102和最近的网络108之间。在本网络体系架构100的上下文中,网络104、106中的每个可采用任何形式,其包括但不限于LAN、WAN,诸如因特网、公共交换电话网(PSTN)、内部电话网等。在使用中,网关101用作从远程网络102到最近的网络108的进入点。如此,网关101可用作路由器,其能够指引到达网关101的给定的数据包,并且交换机为给定数据包提供了进入和离开网关101的实际路径。还包括与最近的网络108相耦合的至少一个数据服务器114,并且经由网关101其可从远程网络102访问。应当注意,一个或多个数据服务器114可包括任何类型的计算设备/组件。耦合至每个数据服务器114的是多个用户设备116。这种用户设备116可包括台式计算机、膝上型计算机、手持计算机、打印机或任意其他类型的逻辑。应当注意,在一个实施例中,用户设备111还可直接耦合至任何网络。一个外围设备120或一系列外围设备120,例如,传真机、打印机、联网的贮存单元等,可被耦合至一个或多个网络104、106、108。应当注意,数据库、服务器和/或额外的组件可与任意类型的耦合至网络104、106、108的网络元件一起使用或集成到该网络元件中。在本描述的上下文中,网络元件可指网络的任意组件。根据某些方法,此处所描述的方法和系统可用虚拟系统和/或仿真一个或多个其他系统的系统来实现和/或在其上实现,诸如,仿真MACOS环境的UNIX系统、虚拟地宿主MICROSOFTWINDOWS环境的UNIX系统、仿真MACOS环境的MICROSOFTWINDOWS系统等。在某些实施例中,这种虚拟化和/或仿真可通过使用VMWARE软件来加强。在某些方法中,一个或多个网络104、106、108可代表通常被称为“云”的系统集群。在云计算中,诸如处理功率、外围设备、软件、数据处理和/或贮存器、服务器等之类的共享资源,优选地以按需关系被提供给云中的任意系统,从而允许跨许多计算系统来访问和分配服务。云计算通常包含因特网或在云中操作的系统之间的其他高速连接(例如,4GLTE光纤等),但是还可使用其他连接系统的技术。图1示出了根据一个实施例的体系架构100。如图1中所示,提供了多个远程网络102,其包括第一远程网络104和第二远程网络106。网关101可被耦合在远程网络102和最近的网络108之间。在本体系架构100的上下文中,网络104、106中的每个可采用任何形式,其包括但不限于LAN、WAN,诸如因特网、公共交换电话网(PSTN)、内部电话网等。在使用中,网关101用作从远程网络102到最近的网络108的进入点。如此,网关101可用作路由器,其能够指引到达网关101的给定的数据包,并且交换机为给定数据包提供了进入和离开网关101的实际路径。还包括与最近的网络108相耦合的至少一个数据服务器114,并且经由网关101其可从远程网络102访问。应当注意,一个或多个数据服务器114可包括任何类型的计算设备/组件。耦合至每个数据服务器114的是多个用户设备116。这种用户设备116可包括台式计算机膝上型计算机手持计算机打印机或任意其他类型的逻辑。应当注意,在一个实施例中,用户设备111还可直接耦合至任何网络。一个外围设备120或一系列外围设备120,例如,传真机、打印机、联网的贮存单元等,可被耦合至一个或多个网络104、106、108。应当注意,数据库、服务器和/或额外的组件可与任意类型的耦合至网络104、106、108的网络元件一起使用或集成到该网络元件中。在本描述的上下文中,网络元件可指网络的任意组件。根据某些方法,此处所描述的方法和系统可用虚拟系统和/或仿真一个或多个其他系统的系统来实现和/或在其上实现,诸如,仿真MACOS环境的UNIX系统虚拟地宿主MICROSOFTWINDOWS环境的UNIX系统、仿真MACOS环境的MICROSOFTWINDOWS系统等。在某些实施例中,这种虚拟化和/或仿真可通过使用VMWARE软件来加强。在某些方法中,一个或多个网络104、106、108可代表通常被称为“云”的系统集群。在云计算中,诸如处理功率、外围设备、软件、数据处理和/或贮存器、服务器等之类的共享资源,优选地以按需关系被提供给云中的任意系统,从而允许跨许多计算系统来访问和分配服务。云计算通常包含因特网或在云中操作的系统之间的其他高速连接(例如,4GLTE、光纤等),但是还可使用其他连接系统的技术。图2示出了根据一个实施例的、与图1的用户设备116和/或服务器114相关联的代表性硬件环境。这种图示出了工作站的典型硬件配置,其包括中央处理单元210,诸如微处理器,以及经由系统总线212互连的多个其他单元。图2中所示的工作站包括随机存取存储器(RAM)214,只读存储器(ROM)216,用于将外围设备(诸如磁盘贮存单元220)连接至总线212的I/O适配器218,用于将键盘224、鼠标226、扬声器228、麦克风232和/或其他用户接口设备(诸如触摸屏和数字相机(未示出))连接至总线212的用户接口适配器222,通信适配器234,其用于将工作站连接至通信网络235(例如,数据处理网络),以及用于将总线212连接至显示器设备238的显示器适配器236。工作站可具有驻于其上的操作系统,诸如MICROSOFT操作系统(OS)、MACOS、UNIXOS等。将理解,优选的实施例还可在除了这些提到的之外的平台和操作系统上实现。可利用JAVA、XML、C和/或C++语言,或其他编程语言,以及面向对象的编程方法来写优选的实施例。可使用面向对象编程(OOP),其越来越多地被用于开发复杂的应用。应用可被安装在移动设备上,例如,存储在设备的非易失性存储器中。在一个方法中,应用包括指令,以在移动设备上执行图像的处理。在另一方法中,应用包括指令,以将图像发送至远程服务器,诸如网络服务器。在又一方法中,应用可包括指令,以决定是否在移动设备上执行某些或全部处理和/或是否将图像发送至远程站点。在多个实施例中,当前公开的方法、系统和/或计算机程序产品可利用和/或包括在2005年11月2日递交的、题为“SYSTEMANDMETHODFORDISCOVERYOFBUSINESSPROCESSES”的相关美国专利申请No.11/163,867;2005年11月30日递交的、题为“STATEENGINEFORBUSINESSPROCESSEXECUTION”的美国专利申请No.11/164,619;以及2006年7月21日递交的、题为“METHODANDSYSTEMFORIMPROVINGTHEACCURACYOFABUSINESSFORECAST”的美国专利申请No.11/309,286中公开的任意功能。如以下所描述的,“多个数据”或“数据”应当被理解为包括任意数字(例如,二进制)格式的信息表示。类似地,“数据集”可被理解为包括以任何已知或合适的格式布置的数据集合,诸如,现代计算中惯常已知的任何数据结构,其包括阵列、哈希、表、图、网络、关系数据库等,如本领域技术人员所理解的。类似地,在商业过程或商业智能上下文中,“数据”应被理解为指任何可测量的或可量化的信息的表达,通常以数字单元(诸如,日期、数量等)或字母数字串的形式存在,该字母数字串指示特定类别中的成员关系(例如,“标签”,诸如测量的单位,其包括美元($)、欧元(€)、英尺(in.)、厘米(cm)、小时(hr)、千克(kg)、兆字节(MB),诸如颜色、性别、法律状态等之类的量化分类,如本领域普通技术人员在阅读本描述时将理解的)。商业智能“数据”的通用示例包括接收到的和/或消耗的资源的任何表示(例如,所发生的花销、接收到的收入、库存的存货清单等),进程的度量(例如,经过的时间、预定义目标的接近度、绝对量的累积等),或在分析商业过程的上下文中的任何其他有用的信息,如本领域技术人员审阅本公开将理解的。类似地,如此处所指的“度量(metric)”应当被理解为包括任何值、结论、结果、产品等,其通过组合或评估两个或更多片数据而获得。例如,继续以上阐述的示例性数据集,可从包括花销和收入的数据计算出的示例性度量将为利润率,其在简单的情景中可通过将花销从收入中减去以确定对应的利润率而计算出来。当然,其他任何类型的数据可以以任何合适的方式组合,本领域普通技术人员在阅读这些描述时将理解为对商业过程是有益的或信息量大的。对用于商业智能平台的早期内存中设备的通用元件的变更是利用分布式处理中的发展。许多现有的商业智能平台将利用带有平台(服务器/台式机/膝上型计算机)CPU的分布式处理。多核处理器的升级已推进了该实践。但是,在能够跨多个存储器空间来分配数据方面,许多商业智能平台聚焦于单个平台的方法,其限制了可寻址的内存空间的量,或者被限制于平台所能支持的内存量。系统的这种属性被称为“可扩展性”或“向上扩展”至单个内存空间中的能力。跨多个平台进行扩展以不仅利用跨多个CPU核的并行处理而且利用跨多个内存空间的并行处理,其提供了与扩展的数据要求相匹配的极大的机会。该概念被称为跨多个内存空间“向外扩展”。通过添加额外的硬件,能够向外扩展的平台可有效地扩展,以仅满足任何数据要求。将多个商品硬件组件合并在一起以用于协作和并行的使用是比单个大型服务器环境更加有效的解决方案。技术获取开销也被有益地减低了。体系架构和实现方式的灵活性增强了。另外,并且更重要地,可寻址的内存空间量增长了。以上,示例被用于显示额外的用户如何降低单个环境中的可用内存量。“向外扩展”允许使用相同量的数据,但是允许更多的用户。这种类型的环境还支持所声明的增长数据要求。补充容量以跨越多个平台(服务器/台式机/膝上型计算机)是与“旋流盘”DBMS设备协作以使用针对工作的正确的数据管理工具的能力。利用内存中和传统选项二者允许配置和体系架构中的更大的灵活性。这允许数据被定位在内存中设备中,该数据要求接近实时的操作访问。具有较低响应要求的数据可被定位在“旋流盘”环境中。该情形还允许与数据增长相关联的危险减轻。在单个平台“向上扩展”情形或多个服务器“向外扩展”环境中,内存空间是不可避免的限制。在这种情形中,存在商业智能平台将运行至两个情形之一的风险。由于缺乏可用的空间,平台将发生故障。另一选项是操作系统将经由“虚拟存储器”接管内存管理或开始在主存和“旋流盘”之间交换信息。由于出于通用目的,操作系统执行该任务,因此,分析应用性能将遭受影响。在该情形中,管理员具有有限的选项以减轻故障的风险或降低性能的风险。通过将传统的数据库用作补充的组件,“旋流盘”DBMS的功率可被用于维持特定水平的性能。最后,商业智能平台仅刚刚开始利用与其管理的信息相关联的元数据的功率。技术性元数据早已是与分析相关联的信息管理的一部分。随着可用于商业智能平台的语义元数据级别的增长,利用更宽范围的元数据的价值增加了。可在数据管理环境中并置(collocate)类似的数据集和通用域度量,不管其为内存中还是“旋流盘”。并置并协调数据带来了与分析处理相关联的额外价值。客户信息可被一起并置。另外,可通过与细粒信息相关联的合计或累积(roll-up)的度量来定位有关收入的详细数据。MAPAGGREGATE(R)解决方案通过改进的分析响应的驱动,商业智能平台正迅速地转向实现内存中技术。许多这些实现共享受限的因素,诸如要求预定义的数据结构以及组织机制,缺乏“向外扩展”至多个内存空间的能力,以及缺乏协作的元数据设备。跨接这些边界是克服惯常方法限制的关键,其使得分布式系统体系架构和技术能够从特定于上下文的“一次性(oneoff)”解决方案的拼凑(patchwork)转换成针对基于性能的数据管理的无处不在的、高效的和持久耐用的通用解决方案。一种方法是所谓的“MAPAGGREGATE(R)”数据管理功能,其允许上述惯常内存中技术的若干解决方案。为了便于理解,此处所公开的“MAPAGGREGATE(R)”方法可被比较式地通过参照惯常的本领域中已知的“映射-化简(Map-Reduce)”方法来查看(参见,例如:“Map-Reduce”,维基百科,http://en.wikipedia.org/wiki/MapReduce(最后访问于2014年2月21日))。MAPAGGREGATE(R)优选地利用基于分布式服务器的方法。这不同于其他台式机或单个服务器实现方式。通过利用“向外扩展”功能,与依赖于单个内存空间相反,MAPAGGREGATE(R)使得组织能够跨多个内存空间而扩展。如以上所提及的,单个内存空间具有用完可用内存的限制和/或依赖于操作系统以用于管理虚拟内存。这些问题二者均可妨碍组织满足商业利益相关者所要求的性能水平。包括MAPAGGREGATE(R)在内的当前所公开的技术使得用户、设计师和管理员能够用基于多个商品硬件的解决方案来针对商业利益相关者的要求进行计划并满足该要求。通过能够实现额外的商品硬件(如所必须的),管理员能经济地并动态地扩展以满足增长的数据要求。伴随着针对内存中性能的“向外扩展”能力的是一种发明性方法,其授予跨多个数据管理选项来管理数据要求的能力。简单而言,不是所有的数据都要求内存中处理和贮存设备的速度和性能。将内存中性能与传统的“旋流盘”能力的平衡属性相匹配意味着正确的工具可用于正确的工作。当前讨论的范式提供了内存中设备,其跨越至传统的数据管理环境。这能满足一个平台中的若干挑战。MAPAGGREGATE(R)允许用户利用“旋流盘”DBMS的额外的处理功率和数据贮存,而没有处理和查询故障。该技术还辅助管理员有关操作环境和评估他们独特的商业情形的要求二者的设计能力。可做出关于如何跨内存中和“旋流盘”选项二者来分配数据的决定。管理员可以平衡与其现有的环境和长期的数据中心和预算资源相关联的那些要求。如当前所公开的,MAPAGGREGATE(R)提供了设计和配置平台的能力,以不仅满足随着“向外扩展”而增加的服务器而改变大小的数据,还满足预算和操作考虑。但是,允许商业智能平台最佳地利用内存中和“旋流盘”数据管理二者的另一个属性是广泛的元数据管理设备。这超越了确定分析的技术性元数据的能力。其扩展至元数据的语义属性和度量以及查询的使用信息。再次,识别并管理所有这些属性的能力将设计和体系架构的力量置于平台管理员的手中,而非操作系统或黑匣子配置中。这一水平的元数据洞悉是经由此处被称为“度量集市(metricsmart)”的工具而提供的。度量集市提供有关哪些信息应当驻于内存中以及哪些数据元素最好由“旋流盘”数据管理来服务的可视性。决定并非只基于技术方面。设计师可设计以将商业信息定位于通用内存空间中,以辅助特定分析工作负载的合计。本质上,度量集市是单个企业库,其维护了数据、元数据和度量的经验证的状态。这使能跨分布式体系架构的多个资源的无代码分析和改进的数据访问,并且与MAPAGGREGATE(R)组合起来特别强大,因为MAPAGGREGATE(R)使能跨分布式体系架构的对内存和处理资源的利用。允许商业智能平台最佳地利用内存中设备的所有元件与避免“一次性满足”所有的方法相关联,许多商业智能供应商通过其对内存中的实现正采用该“一次性满足”所有的方法。向外扩展、数据管理设备之间的混合使用以及对可用元数据的高级使用,提供避免障碍的条件。针对商业智能和分析的内存中MAPAGGREGATE(R)方法满足这些特定的要求,并且将组织定位为避免与早期内存中实现相关联的陷阱。一般而言,MAPAGGREGATE(R)结合了内存中数据管理方法和分布式系统体系架构以及关系数据库概念,以经由内聚引擎来提供广泛的数据贮存和处理解决方案。该引擎运行于三个使能规则:(1)单个元数据模型共享于分布式体系架构的所有点并针对所有数据由引擎管理或跨体系架构管理;(2)(优选地,相关的)数据库管理系统(DBMS),其被配置为组织预处理的数据(例如,根据落入上述单个元数据模型并可替换地称为“度量集市”的元数据);以及(3)分布式体系架构,跨该分布式体系架构来利用单个元数据模型和管理系统。更具体地,可从三个主要方面来理解单个元数据模型。在一个方面,该模型是语义模型-对度量和记录(事实)在定义、时间分解、可用维度、这些维度的本质(字典、独特值)、用户访问限制、互依赖性等方面的描述,如本领域普通技术人员在阅读本描述时将理解的。在第二方面,模型是提取、转变、载入(ETL)模型。换言之,元数据可用作度量和记录、刷新频率和量、重写逻辑等的资源,如本领域普通技术人员在阅读本描述时会理解的。在第三方面,模型是使用模型-元数据用其描述了在何处以及如何在仪表盘和报告中使用这些度量和记录。如以下所指的,预处理数据可包括根据上述方面中的一个或多个来预处理数据,从而根据单个元数据模型来结合经预处理的数据生成、操纵、关联元数据等。例如,参照图3中所描绘的示例性体系架构300,将根据一个示例性实施例来示意性地呈现当前所公开的发明性概念。一般而言,MAPAGGREGATE(R)根据三个步骤的过程来工作。首先,数据跨分布式体系架构300而被分割。第二,数据请求被数据服务接收。第三,对该请求的响应被生成和处理。以下提供了关于每个步骤的进一步细节。关于数据分割和分配,一般而言,数据经由数据管理系统(优选地,DBMS,例如,上述的“度量集市”)被预处理,并且结果跨所有可用的服务器资源而被分割。根据模型来执行该分割,该模型从因素的某些组合而导出,这些因素包括基于元数据的启发式以及预定义的贮存惯例、实践等,其可选地由管理员定义。在单个服务器的内存中,基于元数据来布置数据,根据上述的预处理来定义元数据。例如,数据可被布置在元数据语义特征、ETL特征、使用特征等之上。关于数据被分割之后的对数据请求的接收,一般而言,MAPAGGREGATE(R)通过基于相同的总体单个元数据模型来辅助数据消费者(例如,仪表盘,报告引擎,警告引擎等)之间的通信而操作,该总体单个元数据模型被跨分布式体系架构的很宽的区域利用。例如,并且通过参照以上的图3,在一个实施例中,客户请求或请求1被数据服务接收。请求1可可选地由客户端生成,或由分布式体系架构中的另一组件生成,或可由与分布式体系架构通信的另一组件生成。有优势地,一个或多个请求1以对应于(即,可被其理解或在其范围内的)单个元数据模型的格式被接收。在一个阐释性情景中,遵循单个元数据模型的请求可以本质上表示为“计算数据点:针对之前的12个月的持续时间的收入、开销以及利润率,并且根据标准:部门和国家,来对那些结果进行分类”的格式表达。由于请求以单个元数据模型术语表达,因此,其能够有效地被MAPAGGREGATE(R)引擎处理(例如,在数据服务中),并且经处理的请求被映射2到各自的服务器中,例如,在一个实施例中,宿主适当的收入、开销和利润率数据的服务器。在一个一般地遵循前述示例的实施例中,度量“利润率”被特别引入,因为其不在任何地方被宿主,而是从被实际宿主的收入和开销中飞速计算出的。在预处理之后,利用单个元数据模型,经映射的请求2基于接收到的客户请求1被分配到各自的服务器。接下来,每个服务器处理所接收的经映射的请求2。一旦接收到,服务器处理经映射的请求2,以确定对应的经请求的数据是否已经被载入到(或否则驻于)内存中。如果是,则数据可在内存中被合计。可替换地,如果数据仅部分驻于内存中,并且部分地驻于其他地方(例如,在DBMS中),或整个驻于其他地方,则服务器生成并执行合适的查询3(例如,至DBMS)以定位经请求的数据。一旦定位到经请求的数据,可选地,对单独存储于单个服务器上的数据的任何必要的处理(例如,合计、过滤、格式化等)可由服务器执行,并且作为结果的(合计的或原始的)经定位的数据4的单个“数据块(chunk)”可在响应5中被返回至数据服务。数据服务接收一个或多个响应5,并且将与初始请求1相关的部分数据进行合计,并且对数据执行任意必要的处理、计算、评估、操纵、格式化等,以执行批准初始(客户端)请求1所必须的操作。例如,根据以上所阐述的示例性情景,开销和收入是存储在多个服务器上的数据,并且,利润率是可利用那些数据进行计算的度量。一旦从各自的服务器接收到以一个或多个响应5形式存在的经合计的开销和收入数据,数据服务可利用那些合计数据来计算针对对应的持续时间的对应的利润率。一旦从数据计算和/或合计出必要的一个或多个度量,最终结果被集合起来并在适当的响应6上下文中被返回给提出初始请求1的客户端。根据任意数量的标准,可重复和/或修改该处理任意次,该标准仅受用户的想象力以及跨分布式体系架构所分割的数据中所表示的属性的深度和广度的限制。现参照图4,示出了用于跨分布式体系架构来管理数据的方法400的示例性实施例。方法400可被看作是用于数据管理的MAPAGGREGATE(R)解决方案的一个示例性方法。可在任意合适的环境中执行方法400,其包括图1至图3中所描绘的那些,或本领域普通技术人员在阅读本描述时将理解的任意其他合适的环境。如所示,方法400包括操作402,其中与商业或商业过程相关的数据被接收。在操作404中,根据元数据模型来处理接收到的数据。该元数据模型包括描述数据的特征,诸如语义特征、ETL特征以及使用特征。该处理包括生成对应于多个数据部分中的每个(数据部分)的元数据。在操作406中,至少部分基于分析对应于每个各自数据部分的元数据,接收到的数据被分割成多个数据部分。在操作408中,与对应的元数据一起,每个数据部分被跨布置在分布式体系架构中的多个资源而分配。当然,在各种方法中,本领域技术人员在阅读本公开时将理解,包括其任何组合、排列、合成和/或修改形式的一个或多个额外的和/或可替换的特征可以是有优势的。例如,在若干示例性实施例中,当前所公开的方法400可包括以下特征或操作中的任意一个或多个。在特别优选的方法中,方法还包括接收与某些或全部数据相关的请求;基于请求中的元数据,将请求映射到分布式体系架构中的多个资源中的一个或多个;响应于映射该请求,从多个资源中的每个接收一个或多个响应;处理该一个或多个响应以生成报告;以及将报告返回至资源,从该资源接收请求。该请求可包括对应于数据的元数据。例如,针对利润率的请求包括收入和开销元数据。为了辅助对数据的无缝且高效的分配和分析,映射优选地将请求引导到至少一个资源,与请求相关的数据服务驻于该资源中。该方法还可包括在合计一个或多个响应之前,确定所请求的数据的位置。所确定的位置是“内存中”或“已存档”,其中“内存中”指示当前载入的用于由分布式体系架构主动使用的资源,诸如执行处理任务的处理器,针对I/O所安装的贮存设备,针对数据的贮存或管理所载入的DBMS等。在另一方面,数据位置“已存档”对应于当前不处于“内存中”的分布式体系架构的资源(诸如,贮存设备)或当前不处于“内存中”的数据库管理系统(DBMS)的贮存位置。若所请求的数据的位置被确定为“内存中”,则优选地,响应于该确定,处理被直接执行,以便遍及分布式体系架构而高效并无缝地使能数据的分配和处理。该方法还可包括:响应于确定至少某些所请求的数据的位置是“已存档”,生成一个或多个请求;以及执行查询,以从“已存档”的位置取回所请求的数据。该方法还可包括:将从“已存档”位置取回的数据载入到内存中;以及响应于载入,确定所请求的数据的位置是“内存中”。优选地,响应于确定所请求的数据的位置是“内存中”,直接执行合计。该方法可包括基于数据来计算一个或多个度量。优选地,报告至少部分基于数据、度量以及请求中的一个或多个。例如,鉴于所提供的度量和/或请求本身,报告可包括对数据的上下文分析。该方法还可包括基于数据来计算一个或多个度量,在该情形中,报告至少部分基于数据、度量以及请求中的一个或多个。优选地,每个数据部分由至少一个特征来表征,该至少一个特征对接收到的数据中的所有其他数据部分是唯一的,并且每个数据部分与至少一个元数据标签相关联。连续仿真在另一方面,当前所公开的技术可利用强大的预测性分析能力,其进一步扩展了过程智能。被称为连续仿真的新能力基于由当前所描述的系统和技术所监控的商业过程提供了针对改进的操作性预测的机制。基于正被收集的实际操作性数据,这些预测被持续更新和提炼,这导致了更高的准确度。连续仿真克服了传统的基于统计和静态过程模型的预测方法的限制。传统的统计技术虽然针对预测稳态趋势是足够的,但是,无法检测并预测历史模式的突然变更的影响。静态过程模型通常还导致不好的结果,这是由于模型质量问题以及与正被仿真的条件相关的不正确的假定问题。通过利用动态过程模型,连续仿真消除了这些问题,该动态过程模型由操作性系统所确认并基于最新的条件而被持续调整。在一个方法中,连续仿真包括以下一般的特征。首先,商业的当前状态被确定、接收、定义等。本质上,商业的状态可采用本领域中已知的任何形式,并且可利用任何合适的数据、模型等来表示。在优选的方法中,经由商业智能来获得商业的当前状态,例如,作为适于用作过程仿真的初始状态的一个或多个种子值。可经由用户,经由预确定的或预定义的“默认”状态来获得商业状态,以作为来自商业过程或商业过程群组的输出,或根据本领域技术人员在阅读本描述时将理解的任意其他合适的方式或技术的组合。优选地,商业状态可根据方式、技术等来确定,其包括相当的历史商业状态数据,例如,在扩展的持续时间对被观测到的、定义的、测量的、计算的等的商业状态的记录,诸如若干工作日、星期、月、“季度”(例如,大约三个月的持续时间)、年、财政期间、投资周期等,如阅读这些描述的本领域技术人员将理解的。在扩展的持续时间中,商业状态被相应地收集、观测或否则获得,并且可选地被编译到“历史”商业状态数据的知识库中。历史数据可根据任何已知的或有用的惯例被组织、细分等,例如,历史商业状态数据可被按照月份或财政周期而被按时间组织,并且根据地理位置(例如,商业领地、法定管辖、国家等)而被进一步组织。当然,历史数据可根据任意数量的标准、结构等被组织,如阅读该公开的本领域技术人员将理解的。利用商业状态数据,在某些方法中,当前公开的技术可执行连续仿真,例如,利用模型(诸如,预定义的商业和/或统计模型、基于历史商业状态数据的模型、标准模型等,如本领域普通技术人员在阅读本公开时将理解的)。在甚至更加优选的方法中,连续仿真利用历史商业状态数据和当前的商业状态数据来执行对一个或多个商业过程的连续仿真,并且利用商业过程仿真过程中的历史商业状态数据,检测与预期的或所希望的仿真进展的一个或多个偏离(例如,根据一个或多个数据点、度量、分析等来检测与商业模型的偏离,诸如,如以上讨论的一个示例性情景中的预期的利润率的偏离)。基于仿真,可仿真一个或多个可能的现实世界商业情景,并且可实验性地测试、观察和评估各种潜在的响应(包括不采取任何行动,例如,没有响应)的影响,以帮助决策实体理解并指引由连续仿真所建模的各种假定情景中的商业过程。与预期的或所希望的仿真进展的偏离可根据任何合适的技术被检测和/或测量。例如,在一个方法中,偏离可体现为阈值,并且在满足或超过阈值时被检测到,诸如在确定商业状态(例如,收入)的过程中所测量的特定值,基于历史商业状态信息,偏离了预确定的或动态确定的量。在涉及收入作为商业状态信息的一种类型的示例性方法中,在一个方法中,每当对应的经仿真的商业收入背离历史数据达大约10%或更大的幅度时,与历史商业状态数据的偏离可在仿真的过程中被检测到。例如,收入可降低到历史收入的90%或更少(即,收入比历史观测到的收入低10%或更低)或增加到历史收入的110%(即,收入比历史观测到的收入高10%),并且响应于检测到该偏离,仿真可采取一个或多个动作。在一个实施例中,仿真可以以足以允许本领域技术人员查看商业状态信息并从中确定一个或多个贡献因素或导致多达所观测到的偏离的原因过程的方式来生成日志,该日志包括商业状态信息和关于积极地影响所述商业状态信息的任何商业过程的信息(例如,销售活动、购买或获取活动、投资活动、管制活动,诸如税收、罚款等)。当然,在某些实施例中,仿真可不涉及人工干预,并且可包括多个预定义的标准或阈值,通过该标准或阈值可测量仿真进展。自动系统可被配置为响应于检测到存在一个或多个预定义的标准或阈值被满足、通过等来采取预确定的动作。通过这种方式,各种商业过程发展策略可基于历史商业信息被经验性地测试,并且可基于特定上下文(例如,在由历史商业状态信息所反映的特定事实下)中的给定策略的成功或失败来制定智能选择。相应地,在一个实施例中,连续仿真可根据方法500来执行,如图5中所示。该方法可在任何合适的环境中执行,其包括图1至图3中所描绘的环境,如本领域技术人员在阅读本描述时所适于理解的任何其他环境等。方法500包括操作502-508。在操作502中,接收代表商业的当前状态的一个或多个种子值,例如,如此处所描述的分布式体系架构的一个或多个资源处。在操作504中,接收代表预确定时段中商业的多个历史状态的历史商业状态数据,再次优选地,在一个或多个分布式体系架构资源处。在操作506中,利用至少一个处理器(例如,分布式体系架构中的),利用一个或多个种子值和基于历史商业状态日期的模型来连续仿真一个或多个商业过程。在操作508中,检测与仿真中的所预期进程的偏离。一般而言,偏离对应于与如在模型和/或历史商业状态数据中所表示的历史行为的显著差异。偏移可被体现为阈值,并且代表非标准的事件(例如,一个或多个状态)或由仿真系统所经历的过程。这种非标准的事件可引起暴露于风险、债务、损失或相反地可代表显著的商业机会,并且因此利用诸如当前所公开的连续仿真和偏离检测技术之类的客观标准来识别是非常有用的。当然,在各个实施例中,当前所公开的连续仿真的实施例该方法可额外地或/或可替换地包括响应于检测到与仿真中的所预期进展的偏离而接收用户输入;以及基于一个或多个种子值、模型和用户输入来仿真商业状态中的变化。优选地,响应于确定代表经仿真的商业状态的特定值以大于阈值偏离的量偏离代表商业的一个或多个历史商业状态的相应值,偏离被检测到。特别是,其中一个或多个种子值和偏离代表利润率,但是在任意合适的实施例中,阈值偏离大约是10%。在若干方法中,至少一个种子值和偏离中的每个代表对应于商业状态的利润率。该方法可额外地和/或可替换地包括响应于检测到与仿真中的所预期进展的偏离而自动接收输入;以及基于一个或多个种子值、模型和输入来仿真商业状态中的变更。在这种情景中,输入包括预确定的响应,其被历史性地确定为对偏离的有效响应。在各种方法中,当前所公开的发明性概念可以服务或服务平台的形式提供。例如,在一个实施例中,技术可采用以下称为“INSIGHT(R)”或“AltosoftINSIGHT(R)”的商业智能平台的形式。虽然以下的描述讨论“INSIGHT(R)”的实施例,其一定包括一个或多个特征或功能,例如,通过使用术语“是(is)”,“是(are)”,“做(does)”,“将(will)”,“一定会(shall)”等,但是,应当理解,每个特征的示例性描述通过例示方式呈现,并且可以任何合适的组合、排列、子集等方式来组合,如本领域普通技术人员阅读本描述时将理解的。INSIGHT(R)是企业级商业智能(BI)平台,其允许组织在其他BI工具的部分时间中部署基于浏览器的分析。从跨多个资源的数据整合到对特征丰富的仪表盘的拖放创建的高级转变和分析,INSIGHT(R)使得平台上的所有人都能访问BI,其提供了之前所不可能的可扩展性和性能。使用轻松和快速的部署并不意味着妥协。INSIGHT(R)将BI推至带有过程智能的新水平-在与其相关的商业过程的上下文中理解数据的能力。结果是,容易测量操作有效性并监视过程遵从性的能力,交付了过程性能的清晰的、端到端的可视性。不同于要求来自不同供应商的多个工具的BI方法,INSIGHT(R)使得用户能够快速访问、分析并最优化来自单个平台的商业操作。建造于INSIGHT(R)上的专用MAPAGGREGATE(R)分布式内存中体系架构,其可以接近实时地从资源系统提取信息,并且以没有限制的可扩展性来执行高速计算,从而确保用户具有最新的且完整的信息,而不管其数据的大小或用户数量。INSIGHT(R)消除了惯常的BI解决方案的开销和复杂度,同时提交了高级功能以用于操作性能提升和数据可视化。INSIGHT(R)是针对所有BI需求的广泛的平台。过程智能组织的成功直接联系于其如何好地管理其商业过程。有效地管理过程要求理解质量以及它们如何被执行的时间轴。商业过程上下文中的过程智能、数据分析是提升BI能量的下一个演进式步骤。通过将数据和度量链接至商业过程中的步骤,过程智能提供了理解其所代表的过程和操作是如何工作的所必要的洞察。其可发现瓶颈和过程异常,其可将组织的管制服从置于危险之中。其可监视对服务水平协议(SLA)或其他性能职责的遵守。很简单,过程智能传递了回答问题所必需的关键上下文,这用其他BI工具是不可能的。过程智能还可帮助预测未来的条件,其可呈现挑战或机会。INSIGHT(R)的连续仿真预测性分析引擎基于被监视的过程而提供了操作性预测。基于正被收集的实际的操作性数据,预测被持续地更新并且提炼,这导致更高的准确度。INSIGHT(R)的方法通过检测并预测历史模式的突然变更的影响并且通过基于最新的条件来动态地提炼过程模型和操作假定,克服了传统的基于统计和静态过程的预测的限制。不再有代码INSIGHT(R)的单平台方法的一个重要的益处是,其消除所有编码而不妥协企业力量的能力。不再要求SQL、编程或任何类型的脚本。这确保访问和分析数据的力量被置于最佳地被准备以理解组织需求的那些人手中。通过INSIGHT(R),构建和部署BI解决方案被简化为利用直觉式的点击界面的配置练习。强大的和个性化的UIINSIGHT(R)提供给用户创建强大的UI的能力。不再有针对严格报告或仪表盘的设置。容易地变更图的类型,在表和图之间切换,利用直觉式的数据透视表(pivottable)功能来操纵数据,以及深度探讨细节-所有都无需从IT请求变更。INSIGHT(R)通过基于浏览器的、拖放的界面在数分钟内使能丰富的仪表盘开发,该界面包括定制导航和其他丰富的交互,以最优化数据发现过程。MAPAGGREGATE(R)多服务器,内存中设计INSIGHT(R)的MAPAGGREGATE(R)技术被设计为通过结合内存中处理的速度和分布式内存中模型的可扩展性和灵活性来解决快速扩展数据量和针对高速数据发现的需求问题。虽然第一代内存中BI产品限制为单个服务器上的内存并且其要求针对每个用户最高至10%的额外开销,但是,MAPAGGREGATE(R)允许INSIGHT(R)克服这些限制。利用MAPAGGREGATE(R),组织可通过智能利用任何物理的或虚拟的服务器上可用的内存和CPU,来扩展超出当个服务器的资源限制。MAPAGGREGATE(R)还消除了每个用户的开销,从而允许所有可用的内存被使用,以处理独立于用户数量的更大的数据量。经支配的数据发现INSIGHT(R)被设计为满足IT组织的支配需求,同时支持数据发现所承诺的对终端用户的授权。其被设计为允许IT资源中心化地配置、管理和监视所共享的服务器资源,同时允许非IT用户设计和部署仪表盘和报告,而无需IT干涉。为了辅助对作为经支配的数据发现解决方案的INSIGHT(R)的部署,INSIGHT(R)平台支持多种部署选项。这包括配置单个经部署的INSIGHT(R)实例的能力,其由IT支配,其可支持大量的个人项目,该个人项目可由终端用户独立地创建和操作。部署灵活性单个平台还意味着更快的实现。INSIGHT(R)客户通常在二至四周内是可操作的,这比许多BI主动者(initiative)要快得多。并且由于商业并不仅发生于桌面,因此,INSIGHT(R)通过浏览器提供了对任何设备上的仪表盘的访问;当被需要时并且在被需要处,数据是可用的。当用户经由电子邮件或消息传递而离线时,平台甚至可警告用户有关关键的情况。在一个实施例中,方法包括接收与商业或商业过程相关的数据;根据元数据模型来处理接收到的数据,其中该处理包括生成与多个数据部分中的每个相对应的元数据;至少部分基于与数据部分相对应的元数据,将接收到的数据分割成多个数据部分,以及跨布置在分布式体系架构中的多个资源来分配多个数据部分中的每个以及与每个各自数据部分相对应的元数据。元数据可包括描述数据的特征,即,语音特征;提取、转变、载入(ETL)特征;以及使用特征。该方法还可包括:接收与某些或全部数据相关的请求;基于请求中的元数据,将请求映射到分布式体系架构中的多个资源中的一个或多个;响应于映射该请求,从多个资源中的每个接收一个或多个响应;处理一个或多个响应以生成报告;以及将报告返回至资源,从该资源处接收请求。优选地,报告至少部分基于数据、度量和请求中的一个或多个。另外,每个数据部分可被至少一个特征表征,该特征唯一于接收到的数据中的所有其他数据部分,并且每个数据部分优选地与至少一个元数据标签相关联。该请求优选地包括与数据相对应的元数据,请求与该数据相关联。有优势地,映射将请求指引到至少一个资源,与请求相关的数据服务驻于该资源中。该方法还包括在合计一个或多个响应之前,确定数据的位置,其中,数据位置是“内存中”或“已存档”。数据位置“已存档”是当前不处于“内存中”的分布式体系架构的贮存设备,或者是当前不处于“内存中”的数据管理系统(DBMS)的贮存位置。优选地,若数据位置被确定为“内存中”,响应于确定数据位置是“内存中”,则处理被直接执行。在另一方面,若数据位置被确定为“已存档”,则处理包括响应于确定数据位置是“已存档”,生成一个或多个查询;以及执行查询,其中查询被配置为从“已存档”的数据位置取回数据;将从数据位置“已存档”取回的数据载入内存中;响应于载入,确定数据位置是“内存中”;以及响应于确定数据位置是“内存中”,直接合计“内存中”数据。该方法还包括基于数据来计算一个或多个度量。在另一实施例中,其可被有优势地与前述示例性方法一起使用,包括接收代表商业的当前状态的一个或多个种子值;接收历史商业状态数据,其代表预确定的时段中的商业的多个历史状态;利用至少一个处理器,利用一个或多个种子值和基于历史商业状态数据的模型,连续仿真一个或多个商业进程;以及检测与仿真的所预期的进展的偏离。该方法还可包括响应于检测到与仿真中所预期的进展的偏离,接收用户输入;以及基于一个或多个种子值、模型和用户输入来仿真商业状态中的变化。额外地和/或可替换地,该方法可包括响应于检测到与仿真中所预期的进展的偏离,自动接收输入,其中该输入包括预确定的响应,其被历史地确定为对偏离的有效响应;以及基于一个或多个种子值、模型和输入来仿真商业状态中的变化。优选地,响应于代表商业的经仿真的状态的特定值以大于阈值偏离的量偏离代表商业的一个或多个历史商业状态的对应值,检测到偏离。特别优选地包括实施例,其中阈值偏离是大约10%,并且至少一个种子值和偏离中的每个代表对应于商业状态的利润率。虽然以上已经描述了多个实施例,但是,应当理解,它们仅是通过示例来呈现的,而非限制。每个单个的发明性构思,以及此处所公开或本领域技术人员阅读本描述时将理解的对其任意的变化以作为此处所描述的构思的等同物,可以任意合适的方式组合。因此,阅读这些发明性公开的本领域技术人员将理解的任何排列、组合、替换、合成、修改或其他改变应当被理解为在本发明的范围之内。因此,本发明的实施例的广度和范围不应当被限制为上述示例性实施例中的任何一个,而是应当仅根据以下权利要求及其等同物而被限定。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1