用于基于上下文在数据分析中处理推荐的方法和系统的制作方法

文档序号:8395918阅读:400来源:国知局
用于基于上下文在数据分析中处理推荐的方法和系统的制作方法
【技术领域】
[0001]本发明概括地涉及数据分析领域,以及更具体地涉及基于上下文在数据分析中确定推荐。
【背景技术】
[0002]随着可获得的数据量的增长,数据分析对于用于确定来自大量数据的相关信息而言越来越重要。业务分析使用数据分析来试图从大量数据中确定重要信息(例如,趋势)。根据业务的目标,数据可以用于统计和量化分析、可视化、影响和原因分析、预测建模和其他形式的数据分析的业务分析。
[0003]业务分析使用来自各种不同域的数据,以实现涵盖多个业务方面的可视化。例如,业务分析中的数据分析可以用于将相关于其中订单被下单的方法(例如,在线、电话、店内)的不同类型的产品的销售的图形表示可视化。在数据分析中确定相关趋势是多步骤并且是多变化的过程,其可以通过各种不同方法来实现。在业务分析领域中工作的人员更熟悉如下方法,其中该方法可以产生对应于业务兴趣的洞察。

【发明内容】

[0004]本发明的实施方式公开了一种用于基于上下文在数据分析中提供推荐的计算机实现的方法、计算机程序产品和系统。在根据本发明的实施方式中,计算机实现的方法包括如下步骤:确定在数据分析中当前正在被执行的分析步骤的分析上下文;标识相似于确定的所述分析上下文的先前执行的分析分支的列表,其中所述分析分支是对应于分析上下文的属性的分析步骤的集合;基于与关联于标识的所述列表中的每个先前执行的分析分支的分析树中的每个先前执行的分析分支相关联的相似性指标评级,标识最相似的先前执行的分析分支的集合,其中分析树是共享共同分析步骤的分析分支的集合;以及基于标识的所述集合中的所述先前执行的分析分支的分析上下文,提供针对当前正在被执行的所述分析步骤的分析推荐。
【附图说明】
[0005]图1是根据本发明的一个实施方式的数据处理环境的功能性框图;
[0006]图2是绘出根据本发明一个实施方式的用于处理对执行数据分析的人员的数据分析推荐的程序的操作步骤的流程图;以及
[0007]图3绘出了根据本发明一个实施方式的图1的计算系统的组件的框图。
【具体实施方式】
[0008]本发明的各个实施方式允许基于当数据分析步骤的上下文来向执行数据分析的人员提供数据分析推荐。在一个实施方式中,将当前数据分析步骤与先前分析相比较,以标识相似于当前数据分析步骤的分析上下文的先前分析。对于被确定相似于当前数据分析步骤的上下文的先前分析,向执行数据分析的人员推荐相关分析(基于每个相似分析分支)。
[0009]本发明的实施方式认识到,随着数据量的增长而使得数据分析变得更加困难。对于经验较少的人员而言,分析大量数据并简单地呈现获取的数据的可视化,这可能不能提供用以从数据确定趋势和其他信息的有效的信息。向分析数据的人员提供分析推荐步骤可以提高确定相关性洞察数据的可能性。分析数据的人员通常通过在高等级分析数据开始,并且通过过滤系统地缩小分析的范围实现实现分析的期望等级。
[0010]所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施方式中,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
[0011]可以使用计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一一但不限于一一电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPR0M或闪存)、便携式压缩盘只读存储器(CD-ROM)、光存储设备、磁存储设备、以及上述的任意合适的组合。在本文档的上下文中,计算机可读存储介质可以是任何有形的介质,其可以包括或者存储程序以用于由执行执行系统、装置或者设备使用,或者与连接。
[0012]计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0013]计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括一但不限于一无线、有线、光缆、RF等等,或者上述的任意合适的组合。
[0014]可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言一诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言一诸如“C”语言或相似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络一包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0015]下面将参照根据本发明实施方式的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其他可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
[0016]也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其他可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)。
[0017]计算机指令还可以被加载到计算机、其他可编程数据处理装置或者其他设备,以使得在计算机、其他可编程装置或者其他设备上执行一系列步骤,以便产生计算机实现的过程,从而在计算机或者其他可编程装置上执行的指令提供处理来实现在流程图和/或框图的一个或者多个框中指定的功能/动作。
[0018]现在将参考附图详细描述本发明。图1是示出根据本发明的一个实施方式的分布式数据处理环境的功能框图。
[0019]数据处理环境100的实施方式包括客户端设备110和115、服务器130,其全部通过网络120互联。在本发明的各种实施方式中,客户端设备110和115可以是工作站、个人计算机、个人数字助理、移动电话或者能够执行根据本发明的实施方式的程序指令的任何其他设备。通常,根据本发明的各个实施方式,客户端设备110和115是能够执行及其可读程序指令的任何电子设备或者电子设备的组合的代表,如参见图3更详细地描述。客户端设备110和115可以通过网络120访问访问器130上的数据。
[0020]客户端设备110和115包括用户接口
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1