用于基于上下文在数据分析中处理推荐的方法和系统的制作方法_2

文档序号：8395918阅读：来源：国知局

112和应用114的相应实例。用户接口 112利用客户端设备110和115接收来自人员的输入。在示例实施方式中，客户端设备110和115上的应用114可以分析存储在服务器130上的数据。例如，应用114访问服务器130上的对应于各种类型的产品的销售的数据，并且创建相关于销售时间段(例如，年度、季度等)的不同类型的产品的销售的可视化(例如，表、图形表示等)。在示例实施方式中，应用114接收来自用户接口 112的输入，其可以由人员利用客户端设备110或者115来提供。
[0021]在一个实施方式中，客户端设备110和115以及服务器130通过网络120通信。网络120例如可以是局域网(LAN)、电信网络、广域网(WAN)诸如互联网或者上述三者的组合，并且包括有线、无线或者光纤连接。通常，根据本发明的实施方式，网络120可以是连接和协议的任意组合，其可以支持在客户端设备110和115以及服务器130之间通信。
[0022]在示例实施方式中，服务器130可以是桌面计算机、计算机服务器或者现有技术已知的任何其他计算机系统。在特定实施方式中，服务器130表示计算机系统，其利用集群化的计算机和组件(例如，数据库服务器计算机、应用服务器计算机等)，当由数据处理环境100(例如，客户端设备110和115)的元素访问时，用作无缝资源的单一池。通常而言，根据本发明的实施方式，服务器130是能够执行机器可读程序指令的任何电子设备或者电子设备的组合的代表，如参见图3更详细地描述。
[0023]服务器130包括存储设备135以及推荐程序200。在示例实施方式中，存储设备135存储客户端设备110和115利用应用114可以访问和分析的数据。存储设备135可以以任意类型的存储设备来实现，例如，持久存储308，其能够存储由客户端设备110和115以及服务器130访问和利用的数据，诸如数据库服务器、硬盘驱动或者闪存。在其他实施方式中，存储设备135可以表示服务器130内的多个存储设备。在示例实施方式中，根据本发明的实施方式，推荐程序200在数据分析中提供对应于当前数据分析步骤的上下文的推荐。
[0024]在一个实施方式中，存储设备135包括数据136以及先前分析137。数据136可以是应用114可以访问和分析的各种类型的数据(例如，销售数据、金融数据、资源利用和其他形式的数据)。例如，数据136包括不同类型产品的销售数据，其中销售数据包括每个产品的销售量、每个销售的价格、订单被下单的方法(例如，在线、电话、店内)销售时间、和对应于产品销售的其他数据。先前分析137包括来自数据136的先前分析的数据。例如，数据136可以由应用114分析了多次；利用不同的分析尝试来分析数据的不同集合。在一个实施方式中，先前分析137包括从业务数据136确定的先前可视化、以及与可视化相关联的数据。先前分析137包括有需要重新创建先前已经达到的分析状态(即，数据分析中的步骤)，以及先前分析137的实例存在对应于已经执行的每个先前数据分析步骤。
[0025]在数据分析步骤被执行时，被采纳以分析数据136的每个分析步骤(例如，通过利用客户端设备110或者115来由人员实现)在存储设备135中被存储为先前分析137的实例。在另一实施方式中，当先前的分析步骤已经作为先前分析137的实例而存储在存储设备135中时，分析上下文的指示与先前分析137的相应实例相关联地存储。分析上下文是用于表征分析的一组属性并且是数据分析的前提。分析上下文的确定中包括的属性包括但不限于:名称、注释、数据源、概念、测量、层级、过滤器、成员和数据分析中的其他参数。在一个实施方式中，与数据分析并发操作的注释者(例如，非结构化信息管理架构(ΠΜΑ)注释者)可以捕获关于与数据分析相关联的属性的信息(例如，上下文属性、分析的程度、数据趋势等)。例如，客户端设备115是利用应用114来分析城市的人口细节。确定的上下文可以包括包含城市、周、国家、日期、月、年等的属性和概念。
[0026]在另一实施方式中，当先前的分析步骤作为先前分析137的实例而存储在存储设备135中时，相关联的相似性矩阵和相似性指标评级被确定和存储。在一个实施方式中，相似性指标评级是基于多矢量空间(例如，相似性矩阵)中的从给定分析分支到相同分析树中的其他分析分支的相对距离来计算的。分析树是一组分析分支的集合，其共享公共的分析步骤(即，分析树的根)。分析分支是分析步骤的集合，其对应于分析上下文的属性。在示例实施方式中，分析分支包括由应用针对数据136中的数据的集合执行的一系列数据分析步骤，并且被存储在先前分析137中。在此示例中，分析树包括与数据分析步骤的序列的第一分析步骤相关联的全部分析分支。
[0027]多个矢量空间(即，相似性矩阵)可以是被利用以定义分析分支的上下文的上下文属性的集合(例如，上下文参数、概念、值等)相似性指标评级可以通过使用距离计算算法(例如，欧氏距离公式)来计算，以确定在相似性矩阵内的分析分支之间的相对距离。每个分析树具有相应的相似性矩阵，其可以被用以确定分析分支相对于给定分析分支的相似性指标评级。例如，相似性指标评级的计算可以包括距离矢量与属性，诸如针对每个上下文属性的加权的贡献、匹配上下文属性或者参数、匹配范围的数量，以及可以在分析分支之间共享的数据分析的其他参数。在示例实施方式中，相似性指标评级包括提供其中分析分支相关于相同分析树中的其他分析分支的程度指示的数值(例如，具有较高相似性指标评级的分析分支比具有低相似性指标评级的分析分支更相似)。
[0028]图2是绘出根据本发明一个实施方式的推荐程序200的操作步骤的流程图。在一个实施方式中，推荐程序200响应于应用114发起数据分析而启动，或者响应于在数据分析中应用执行一动作(例如，数据分析步骤)而启动。例如，推荐程序200响应于应用114请求数据分析136、以及响应于114在分析数据136中指定新的分析参数而启动。
[0029]在步骤202中，推荐程序200标识当前数据分析步骤。在一个实施方式中，推荐程序200标识数据分析步骤(即，分析状态)其中应用114当前正在执行。例如，当前数据分析步骤是响应于经由用户接口 112向应用114输入所定义的参数的图形化描述。在一个示例中，人员在客户端设备110上使用应用114来在服务器130上执行数据136的数据分析。在此实施方式中，应用114执行对应于2012年3月到2012年6月的数据范围的北美的产品X的示出为显著的下降的销售数据的分析。推荐程序200标识应用114的当前数据分析步骤为“2012年3月到2012年6月日期范围的北美的产品X的销售数据示出显著下降”。
[0030]在步骤204中，推荐程序200确定所标识当前数据分析步骤的内容。数据分析步骤的内容是表征分析步骤的属性集，并且是数据分析步骤的前提。在一个实施方式中，推荐程序200确定应用114当前正在执行的数据分析步骤的上下文(在步骤202中标识)。在一个示例实施方式中，推荐程序200利用注释器(例如UIMA注释器)来捕获关于与标识的当前数据分析步骤相关联的属性的信息(例如，上下文属性、分析的目的、数据趋势，等)。在先前讨论的示例中，推荐程序200标识应用114的当前数据分析步骤为“2012年3月到2012年6月日期范围的北美的产品X的销售数据示出显著下降”(在步骤202)中。在此示例中，推荐程序200确定并定义上下文为“产品X，销售，北美，2012年3月到2012年6月，显著下降”。
[0031]在步骤206中，推荐程序200标识相似于所标识的当前数据分析步骤的确定的上下文的分析分支的列表。在一个实施方式中，推荐程序200使用确定的上下文(从步骤204)来标识在先前分析137中的分析分支的列表，其相似于所标识的当前数据分析步骤的上下

完整全部详细技术资料下载

当前第2页1 2 3 4