用于预测与应用相关联的用户活动级的方法和系统的制作方法

文档序号:6563616阅读:85来源:国知局

专利名称::用于预测与应用相关联的用户活动级的方法和系统的制作方法
技术领域
:本发明涉及在多用户计算环境中预测与应用相关联的用户活动级,更具体地涉及通过使用相关性和回归分析来在万维网应用环境中预测用户活动级。
背景技术
:在主管的万维网应用中,资源(例如中央处理单元、随机存取存储器、盘和网络)的使用可以在任何给定的时间点响应于终端用户的活动而显著地改变。而且,我们知道,万维网应用在用户活动级超过应用特定的门限值的情况下进入不可恢复的应用服务器错误状态。传统的基础架构和应用提供处理可以使得可以获得附加的资源(例如服务器),但是,这些提供处理要求相当大的超前时间(例如几个小时)。在传统提供手段上的这种不足使得在提高的用户活动级的情况下对资源提供的反应式手段(reactiveapproach)不可行。而且,用于资源利用的已知预测技术受到不充分的可靠性的限制。因此,在本领域中存在着对克服如上所述的不足和限制的需要。
发明内容在第一实施例中,本发明提供了一种用于预测与在多用户计算环境中的计算系统上执行的应用相关联的用户活动级的方法,所述方法包括将用户活动量度(UAM)定义为与多个活动级相关联的变量,其中,所述多个活动级的每个活动级是在多个时段的一个时段期间由使用所述应用的多个用户执行的事务的数目,或是在所述时段期间使用所述应用的用户的数目;定义与所述UAM相关联的多个要素;向所述UAM分配多个测量,其中,所述多个测量的每个测量是所述多个活动级的一个活动级;向所述多个要素的要素分配多个值,所述多个值一一对应地与所述多个测量相关联,并且一一对应地与所述多个时段相关联;计算在所述多个值的至少两个值和所述多个测量的至少两个测量之间的的至少一个相关系数;确定小于预设门限值的所述至少一个相关系数的最大相关系数;响应于所述确定而从所述多个要素中排除所述要素,以便利形成所述多个要素的子集,所述子集包括一个或多个要素,其中,所述一个或多个要素的任何要素与所述UAM之间的相关系数的绝对值大于或等于所述预设的门限值;以及产生回归模型(regressionmodel)以预测活动级,所述回归模型基于所述多个测量和所述子集。在第二实施例中,本发明提供了一种用于预测与在多用户计算环境中的计算系统上执行的应用相关联的用户活动级的系统,所述系统包括用于将用户活动量度(UAM)定义为与多个活动级相关联的变量的部件,其中,所述多个活动级的每个活动级是在多个时段的一个时段期间由使用所述应用的多个用户执行的事务的数目,或是在所述时段期间使用所述应用的用户的数目;用于定义与所述UAM相关联的多个要素的部件;用于向所述UAM分配多个测量的部件,其中,所述多个测量的每个测量是所述多个活动级的一个活动级;用于向所述多个要素的要素分配多个值的部件,所述多个值一一对应地与所述多个测量相关联,并且一一对应地与所述多个时段相关联;用于计算在所述多个值的至少两个值和所述多个测量的至少两个测量之间的至少一个相关系数的部件;用于确定小于预设门限值的所述至少一个相关系数的最大相关系数的部件;用于响应于所述确定而从所述多个要素中排除所述要素、以便利形成所述多个要素的子集的部件,所述子集包括一个或多个要素,其中,所述一个或多个要素的任何要素与所述UAM之间的相关系数的绝对值大于或等于所述预设的门限值;以及用于产生回归模型以预测活动级的部件,所述回归模型基于所述多个测量和所述子集。在第三实施例中,本发明提供了一种计算机程序产品,包括计算机可用介质,所述计算机可用介质包括计算机可用程序代码,所述计算机可用程序代码用于预测与在多用户计算环境中的计算系统上执行的应用相关联的用户活动级,所述计算机程序产品包括用于将用户活动量度(UAM)定义为与多个活动级相关联的变量的计算机可用代码,其中,所述多个活动级的每个活动级是在多个时段的一个时段期间由使用所述应用的多个用户执行的事务的数目,或是在所述时段期间使用所述应用的用户的数目;用于定义与所述UAM相关联的多个要素的计算机可用代码;用于向所述UAM分配多个测量的计算机可用代码,其中,所述多个测量的每个测量是所述多个活动级的一个活动级;用于向所述多个要素的要素分配多个值的计算机可用代码,所述多个值一一对应地与所述多个测量相关联,并且一一对应地与所述多个时段相关联;用于计算在所述多个值的至少两个值和所述多个测量的至少两个测量之间的至少一个相关系数的计算机可用代码;用于确定小于预设门限值的所述至少一个相关系数的最大相关系数的计算机可用代码;用于响应于所述确定而从所述多个要素中排除所述要素、以便利形成所述多个要素的子集的计算机可用代码,所述子集包括一个或多个要素,其中,所述一个或多个要素的任何要素与所述UAM之间的相关系数的绝对值大于或等于所述预设的门限值;以及用于产生回归模型以预测活动级的计算机可用代码,所述回归模型基于所述多个测量和所述子集。在第四实施例中,本发明提供了一种用于部署计算基础结构的方法,包括将计算机可读代码集成到计算系统中,其中,与所述计算机系统组合的所述代码能够执行预测与在多用户计算环境中的计算系统上执行的应用相关联的用户活动级的处理,所述处理包括将用户活动量度(UAM)定义为与多个活动级相关联的变量,其中,所述多个活动级的每个活动级是在多个时段的一个时段期间由使用所述应用的多个用户执行的事务的数目,或是在所述时段期间使用所述应用的用户的数目;定义与所述UAM相关联的多个要素;向所述UAM分配多个测量,其中,所述多个测量的每个测量是所述多个活动级的一个活动级;向所述多个要素的要素分配多个值,所述多个值一一对应地与所述多个测量相关联,并且一一对应地与所述多个时段相关联;计算在所述多个值的至少两个值和所述多个测量的至少两个测量之间的至少一个相关系数;确定小于预设门限值的所述至少一个相关系数的最大相关系数;响应于所述确定而从所述多个要素中排除所述要素,以便利形成所述多个要素的子集,所述子集包括一个或多个要素,其中,在所述一个或多个要素的任何要素和所述UAM之间的相关系数的绝对值大于或等于所述预设的门限值;并且产生回归模型以预测活动级,所述回归模型基于所述多个测量和所述子集。有益的是,本发明提供了一种用于将用户活动级与确定要素相关以产生如下统计模型的技术,该统计模型可靠地预测用户活动级以便利硬件资源的主动提供。图1是按照本发明的实施例的包括与要预测的用户活动级相关联的应用的系统的方框图。图2是按照本发明的实施例的用于产生用以预测与在图1的系统上执行的应用相关联的用户活动级的模型的方法的流程图。图3是按照本发明的实施例的用于使用图2的模型来预测与应用相关联的用户活动级的方法的流程图。图4是按照本发明的实施例的用于实现图2和3的方法的计算单元的方框图。具体实施例方式本发明提供了一种用于预测在未来的特定时间的活动级(也称为用户活动级或用户负荷)的技术。所述用户活动级与在多用户计算环境中执行的应用的终端用户相关联。所述用户活动级预测技术由基于多个可测量的确定(deterministic)要素的历史数据值的统计模型支持。与所述要素相关联的实时数据被输入到所述统计模型中以预测未来的用户活动级,该未来的用户活动级用于重新分配与该应用相关的硬件资源。图1是按照本发明的实施例的、包括与要预测的用户活动级相关联的应用的系统的方框图。系统100是多层系统,它包括多个应用服务器102、104(即业务层)和多个数据库服务器106、108(即数据层)。应用服务器102、104经由通信链路112而连接,数据库服务器106、108经由通信链路110而连接。通信链路110、112是例如局域网(LAN)分段。系统100也包括经由因特网114或其他网络与该业务层和数据层通信的多个客户机或终端用户计算单元113-1...113-n(例如个人计算机)。通过前端防火墙116将应用服务器102、104与因特网114隔离。应用服务器102、104和数据库服务器106、108通过数据层防火墙118而隔离。应用服务器102、104可以是专用的小型或大型计算机。数据库服务器106、108可以是能够执行数据库管理系统的计算机,所述数据库管理系统管理磁或光存储媒体。应用服务器102、104的一个或多个服务器包括由多个用户使用的应用,该多个用户与所述应用相关联的活动级通过本文描述的技术来预测。该应用的用户向应用服务器102或104发送请求。接收请求的应用服务器可以查询数据库服务器106或108,以便准备对于该请求的响应。该多个用户经由终端用户计算单元113-1...113-n来使用该应用。所述用户活动级预测技术用于根据在所预测的用户活动级和预先限定(pre-defined)的资源提供门限值之间的比较来重新分配诸如应用服务器102、104的硬件资源。可以根据在本文描述的用户活动级预测技术重新分配的硬件资源的其他示例包括数据库服务器106、108和万维网服务器(未示出)。在一个实施例中,由多个用户使用的应用是在每个应用服务器102、104上包括的万维网应用,所述服务器的每个还包括能够经由因特网114而与在终端用户计算单元113上驻留的万维网浏览器通信的万维网服务器。如这里所使用的,万维网应用是从服务器(例如服务器102)通过诸如因特网114或内联网之类的网络提供到用户的软件应用。使用终端用户计算单元113的终端用户经由由万维网浏览器提供的接口来与由服务器102提供的万维网应用交互。下文,驻留在应用服务器102、104上的上述应用被简称为“应用”。图2是按照本发明的实施例的产生下述模型的方法的流程图,该模型用于预测与在图1的系统上执行的应用相关联的用户活动级。下文中,为简单起见,上述的模型被称为预测模型。所述预测模型产生处理在步骤200开始。在步骤202,定义用户活动量度(useractivitymetric,UAM)。UAM是被分配多个测量的变量。被分配到UAM的每个测量是关系到(haveabearingupon)在所述应用下的计算基础架构(例如万维网服务器、应用服务器和数据库服务器)上的负载的活动级。如这里所使用的,活动级(也被称为用户活动级)被定义为(1)由经由终端用户计算单元113-1...113-n而使用所述应用的多个用户执行的事务(transaction)的数量,其中,在一个或多个时段的预设集合中的一个时段期间执行所述事务,或(2)在该一个或多个时段的预设集合中的一个时段期间,该多个用户中活动地使用所述应用的用户的数量。对于类型(1)的活动级,所述事务消耗类似类型和数量的计算资源,而每个用户能够执行任意数量的事务。对于类型(2)的活动级,使用所述应用的每个用户执行就所需要的计算资源的数量和类型而言类似的活动。在本发明的上下文中,用户等同于终端用户,并且被定义为经由接口而使用充分开发的计算机应用(例如由图1的应用服务器102提供的万维网应用)的人。如这里所使用的,事务被定义为由一个或多个用户进行的行为以及由代表业务活动的单元的应用进行的一个或多个相关联的响应。通常整体上实时地执行事务。在步骤204中,定义与应用的用户活动级相关联的多个要素,并且向在所述集合中的要素分配一系列索引。要素是按照专家知识对UAM具有影响的变量。下文中,除非另外声明,对于要素的引用包括影响UAM的变量和被赋予给所述变量的任何值。所定义的要素的每个被置于下面相对于步骤208所讨论的下面三个离散分组之一中日历类型要素、外部要素和内部要素。所述多个要素可以被包括在上述三组之一中或在所述三组的任何组合之间被划分。在步骤206,收集历史数据。所述历史数据用于提供在步骤204中定义的一个或多个要素在多个时段期间的值,以及在步骤202中定义的UAM在多个时段期间的测量。所述测量是与应用相关联的用户活动级。基于历史数据或者由历史数据提供的多个值被分配到每个非日历类型要素,并且一一对应地与多个时段相关联。步骤206也向每个日历类型要素分配基于循环的时标(timescale)的多个值。对于每个日历类型要素,由历史数据提供的多个测量在步骤206被分配到UAM,其中,所述多个测量与被分配到日历类型要素的多个值相关联。对于每个非日历类型要素,向UAM分配多个测量,并且在具有至少两个测量的多个集合中包括所述多个测量,其中,每个集合对应于在所述集合中的测量与非日历类型要素的相关联值之间的特定时滞(timelag)或时间步长。在下面给出的非日历类型要素——相关分析部分——中更详细地描述了时间步长。在一个实施例中,多个集合中的第一集合包括与被分配到所述要素的多个值一一对应地相关联的多个测量,其中,其他集合是第一集合的子集。而且,所述多个集合的每个集合中的至少两个测量依赖于在步骤204中定义的要素。日历类型要素——相关性分析查询步骤208确定在步骤204中所定义的要素是否包括一个或多个日历类型要素。如果所述要素包括一个或多个日历类型要素,则对于每个日历类型要素,步骤210计算UAM的相关联的多个测量的样本均值、标准偏差和标准误差。还计算样本均值+N*标准误差的值,其中,N是预设的乘数(例如3)。日历类型要素是被赋予循环时标的多个值的变量,其中,每个值表示从指定事件过去的时间量,并且所述多个值具有相对于时标的线性关系,例如,可以向表示星期日期星期一到星期五的日历类型要素赋予数值0、1、2、3、4,其中,0指示星期一,1指示星期二,等等。在这个示例中,所述指定事件是星期一的开始,每个值表示从星期一开始过去的日子的数量。如这里所使用,循环时标被定义为通过值的重复模式而循环的时标。所述时标在关于星期日期的上述示例中是循环的,因为在多个星期中的星期日期被赋予通过值0、1、2、3和4的模式而循环的值。例如,以一个星期中的星期一开始并且以随后的星期的星期五结束的星期日期被赋予值0、1、2、3、4、0、1、2、3、4。日历类型要素的值的其他示例包括与应用的活动级相关联的一日的时刻或与应用的活动级相关联的多个日子中的一个日子的表示,其中,所述多个日子是例如一个星期、一个月、与日历年不同的金融年或在相对于组织或组织单元的生产周期中的一系列日子。如果所述值是一日的时刻,则可以通过其中该应用的用户所位于的时区来调整所述值。在步骤206中收集的历史数据提供了多个测量,所述多个测量被分配到UAM,并且与由步骤208确定的日历类型要素的多个值表示的多个时间单位(例如一日的时刻或星期的日子)一一对应地相关联。在步骤212,调整每个日历类型要素的值。与UAM样本均值相差超过标准误差的预定倍数(诸如标准误差的三倍)的日历类型要素值在调整的要素标度(scale)上被调整为基值(诸如0值)。在线性标度上调整日历类型要素的其他值以反映到基值的距离,同时保留未调整的值的线性和标度。在下面参见表格1-4描述其他值的调整。包括基值的被调整的值被分配到日历类型要素以取代在步骤206中分配的未调整的基于时标的值。在步骤212中的调整被设计为更接近地反映在日历类型要素和UAM之间的线性相关,由此使得,在经调整的日历类型要素的值与UAM的测量之间的相关的系数(也称为相关系数)的绝对值大于在未经调整的日历类型要素的值与UAM的测量之间的相关系数的绝对值。在没有调整的情况下,在日历类型要素的值和被分配到UAM的测量之间的相关系数可能小于预设的门限值,并且可能被从被利用来经由回归模型而预测活动级的要素中排除(参见下述的步骤214和224)。在表1中示出了对于表示星期日期的日历类型要素的值的调整的示例。表1的列(1)包括表示列(2)的星期日期的日历类型要素的值。列(3)包括被分配到UAM的测量,它是通过星期日期来划分(breakdown)的事务的数量。由业务应用的用户在一年的时段上执行所述事务。列(4)包括对应于在列(1)中的值的调整值。所述表格值之下是列(3)测量的、由步骤210计算的样本均值、标准偏差和标准误差。标准误差之下的是表达式(样本均值+3*标准误差)的值。表1平均值57402.8标准偏差6997.528118标准误差3129.389709平均值+3*标准误差66790.97与下述UAM测量对应的列(1)中的要素值被指定为具有在调整值标度上的0值,该UAM测量比平均UAM测量超过大于三倍的标准误差。如这里所使用的,UAM测量是被分配到UAM的测量。在表1的示例中,因为星期一的事务的数量70258超过平均值+3*标准误差值即66790.97,因此将0值置于对应于星期一的列(4)中。而且,所述70258测量是峰值。如这里所使用的,峰值被定义为超过平均值+3*标准误差值的活动级。而且,所述要素的其他数值被调整以反映到指定的0值的距离。以未调整的要素值为单位来表达到指定的0值的距离。如果对于一个要素仅仅确定一个峰值,则通过使用等式(1)来计算到所述0值的距离A=min(|a-Z|);|a-S-Z|;|a+S-Z|)(1)其中,min(x,y,z)返回三个操作数的最小值,|X|返回X的绝对值,A是日历类型要素的调整值(例如在表1的列(4)中的值),a是未调整值(例如在表1的列(1)中的值),S是由日历类型要素使用的循环日历类型的标度的大小(例如,由在由表1示出的示例中的5个业务日子指示的5),并且Z是与峰值相关联的非调整值(例如,表1的列(1)中的0是与70258的峰值相关联的未调整值)。表2包括具有附加列(4)、(5)和(6)的表1的示例,所述附加列(4)、(5)和(6)示出用于确定在列(7)中的调整值的中间值。使用上述的方程(1),a是在列(1)中的数值,S是5,因为在由日历类型要素所使用的日子的循环中有5个星期日期,Z是0,因为0是对应于峰值70258的列(1)的值,A是在列(7)中的调整值。列(4)、(5)和(6)包括在等式(1)的最小函数中用作操作数的中间值。例如,在第二行中,在列(7)中的A是1,因为在列(4)中的1、在列(5)中的4和在列(6)中的6的最小值是1。表2在另一个示例中(例如参见表3),多个峰值与日历类型要素相关联。因此,多个0被指定为调整值,并且其他的未调整数值要素值被调整以在调整标度上反映到最近的0的距离。因为表3包括两个峰值70258和72222,因此在对应于峰值的列(3)中指定两个0值。表3再一次,在步骤212中的调整被设计来提高在被调整的日历类型要素和UAM之间的相关系数的绝对值。这个提高被示出在表3的示例中,因为在列(1)和(2)(即要素的未调整值和UAM测量)之间的相关系数是-0.30415,而在列(3)和(2)(要素的调整值和UAM测量)之间的相关系数是-0.95027,并且|-0.95027|>|-0.30415|。对于其未调整的值包括在调整值标度上被指定为0值的多个值的日历类型要素,使用等式(2)来计算其他要素值的调整值A=mini=1,...,m(min(|a-Zi|;|a-S-Zi|;|a+S-Zi|))---(2)]]>其中,Zi是与调整标度上的0值对应的第i个要素值,其中,i=1,...,m(例如,在表3中所示的示例中Z1=0,并且Z2=3),m是与在调整标度上的0值对应的要素值的数目(例如,在表3中所示的示例中m=2),并且返回对于i=1,...,m的其操作数的最小值表4包括表3的示例,其中附加列(3)和(4)示出了用于确定在列(5)中的调整值的中间值。使用如上所述的等式(2),a是在列(1)中的数值,S是5,因为在由日历类型要素使用的日子的循环中有5个星期日期,Z1是0,因为0是与峰值70258对应的列(1)值,Z2是3,因为3是与峰值72222对应的列(1)值,A是在列(5)中的调整值。列(3)和(4)包括在等式(2)的外部最小函数中用作操作数的中间值,例如,在表4的数据的第二行中,在列(5)中的A是1,因为在列(3)中的1和在列(4)中的2的最小值是1。表4<tablesid="table4"num="004"><tablewidth="895">(1)要素的数值(a)(2)每天的事务的数量(3)min(|a-Z1|;|a-S-Z1|;|a+S-Z1|)(4)min(|a-Z2|;|a-S-Z2|;|a+S-Z2|)(5)调整值(A)0=Z1123=Z247025859045509877222254598012212210101101</table></tables>对于下述的回归模型,只要存在未调整要素值到调整值的映射(即函数关系),则任何步骤212调整规程是可接受的。在表1-4的示例中,所述的调整规程提供了所需要的映射。在步骤213中,计算在每个日历类型要素和UAM之间的相关系数。相关系数计算基于被分配到一个要素的多个调整值(即调整要素值)和与该多个调整要素值相关联的被分配到UAM的多个测量。因为在步骤213中计算的相关系数是使用特定日历类型要素的多个值计算的系数,因此其绝对值也是与那个日历类型要素相关联的最大相关系数。再一唯一相关次,在相关系数计算中所使用的在步骤212中的它们的调整之前的多个值和多个测量是从历史数据获得的。方程(3)用于计算相关系数r=&Sigma;i=1,...,n(xi-X)(yi-Y)&Sigma;i=1,...,n(xi-X)2&Sigma;i=1,...,n(yi-Y)2---(3)]]>其中,r是相关系数,xi是要素的第i个值,n是被分配到要素的值的数目和被分配到UAM的测量的数目,yi是被分配到UAM并且对应于xi的第i个测量,并且在日历类型要素的情况下,第i个测量是由步骤212计算的调整测量,X是xi样本均值X=(&Sigma;i=1,...,nxi)/n,]]>以及Y是yi样本均值Y=(&Sigma;i=1,...,nyi)/n]]>步骤213后的步骤214中,从在步骤204中定义的要素集合中排除其在步骤213中计算的相关系数的绝对值小于预设的相关系数门限值(例如0.3)的每个要素。虽然单个预设的门限值(例如0.3)通常被应用到所有的要素,但是可以预设多个门限值,其中,不同的门限值与不同的要素相关联。在步骤214从在步骤204中定义的要素集合中排除一个或多个要素后,定义原始的要素集合的子集,它包括由步骤204定义的并且未被步骤214排除的一个或多个要素。在步骤214中的要素的排除将要素和其所相关联的多个值排除于在图2的后继步骤中的进一步分析之外。在步骤216中,将由步骤214确定的要素子集的索引(参见步骤204)重新编号为顺序的并且除去在由步骤214的排除一个或多个要素所引起的在索引之中的任何间隙。索引的重新编号便利了在用于描述如下关于步骤224所讨论的回归模型的方程中的向量(例如要素的阵列)的使用。非日历类型要素——相关分析如果查询步骤218确定尚有一个或多个要素剩余在步骤204中定义的要素的集合中而未由步骤210、212和213处理,则所述方法重复查询208。查询208确定剩余的一个或多个要素是非日历类型要素,它们关系到UAM。非日历类型要素是外部要素或内部要素。外部要素是关系到UAM的可测量变量,其值通过在控制或使用应用的组织之外的实体确定,所述应用的活动级被本发明预测。外部要素的示例包括(1)国家经济指标,诸如道琼斯工业平均(DowJonesIndustrialAverage,DJIA)、国家汇率、消费者信任指数和新失业申请的数量;以及(2)商品的价格。内部要素是关系到UAM的可测量变量,其值通过在上述组织内存在的活动或方面来确定。例如,内部要素包括(1)网络活动(例如,每个小时对于内联网和因特网站点的全部或预设的子集的HTTP或域名系统(DNS)请求的数量),(2)电话活动(例如每个小时的进入/外出电话呼叫的数量),(3)每个小时由指定的业务应用的用户执行的事务的数量,(4)用户的工作角色,(5)用户的场所。为了建立下述的回归模型,非日历类型要素值是变量的实际测量值、估计的测量或从实际值导出的值。导出值可以例如是改变率(即相对于时间的导数的离散模拟)。虽然在图2中未示出,但是替代实施例可以包括调整规程,其提供从非日历类型要素值到调整值的映射以改进在非日历类型要素和UAM之间的相关。不是步骤212中的使用单个的调整规程来用于各种日历类型要素,而是在不同的非日历要素之间的变化要求将调整规程定制用于特定的非日历要素。在查询208确定剩余的一个或多个要素是非日历类型要素后,收集历史数据的阵列以建立由xij元素构成的矩阵,其中,xij是由步骤204定义的非日历类型要素的第i个要素的多个值中的一个值,其中该值是在与所述第i个要素相关联的多个时段中的一个离散时段j的结尾测量的。所述时段例如是一个小时、8小时生产轮班、24小时时段等。步骤220建立yijk元素的三维矩阵,它包括xij元素的所述矩阵,yijk元素是在第(j+k)个离散时段的结尾测量的UAM的测量,其中i是与UAM测量相关联的要素的索引号,j是离散时段的索引号,在所述离散时段的结尾,测量要素的值,并且k是在要素测量时间和UAM测量时间之间的离散时段的数目。所述三维矩阵也包括元素rik,其中,rik元素是在第i个要素的值和在第i个要素的测量后的k个离散时段所测量的UAM的值之间的相关系数。在步骤222中,对于所述一个或多个非日历类型要素的每个要素,确定相关联的最大系数。第i个要素的最大相关系数是步骤220的三维矩阵的rik值的绝对值的最大值。步骤222也使用方程(4)确定与第i个非日历类型要素的相关系数的绝对值的最大值相关联的时间步长值KiKi=argmax|rik|(4)其中,i是要素的索引号,k是在第i个要素的值的测量和被分配到UAM的相关联的测量之间的时段的数目。表5图解了用于建立步骤220的三维矩阵的数据的示例。在表5中,在两个连续业务日子的正常工作时间期间每个小时测量DJIA的值。在时间列中指示的小时测量每个DJIA(例如,时间10指示时间上午10:00)。时间列值是按照时间顺序的。也对于与DJIA值相关联的小时集合的至少一个子集测量与业务应用相关联的事务的数目。表5在这个示例中,应用的用户活动依赖于在DJIA中的改变,而不是DJIA值本身。在DJIA中的改变被包括在标注为DeltaDJIA的列中,DeltaDJIA是在与一个时间值(例如当前小时)相关联的DJIA值和在先前的时间值(例如前一个小时)所测量的DJIA值之间的差。例如,通过10173-10160(即与时间上午10:00和上午9:00相关联的DJIA值的差)来计算在第二行数据中的DeltaDJIA13。在DeltaDJIA列下的数据表示对于第i个要素(即DeltaDJIA)和在时间列下的一组j个时段的如上所述的xij元素集合。在编辑了表5后,确定在DJIA改变和业务应用的用户的反应之间的时间步长或时滞。为了确定所述时滞,通过将在测量DeltaDJIA后k个小时测量的事务的数目与DeltaDJIA值相关联而建立二维矩阵。表6示出了三维矩阵的一个层面(也称为截面(crosssection)),其中,在测量DeltaDJIA后k=0、1、2、3、4小时测量事务的数量。在表6中的事务的数目的每个测量是如上所述的yijk元素。也对于每个k值计算和在表6中示出了相关系数。因为对应于DeltaDJIA值的用户活动级测量的数目依赖于在表6中的k列而改变,因此利用在方程(3)中的不同的n值来计算在表6中的每个相关系数。例如,在k=0的列中,对于在方程(3)中的相关系数计算,n=14,这是因为所有的14个用户活动级测量对应于14个DeltaDJIA值之一,其中,n是用户活动级测量的数目;在k=1列中,n=13,因为仅仅用户活动级测量中的13个对应于DeltaDJIA值;在k=2列中,n=12,等等。三维矩阵的一个层面对应于单个第i个要素,其中,在表6中示出了i=0的情况,虽然未示出,完整的三维矩阵包括多个层面,每个层面包括来自与表6类似的表的数据,其中,每个表对应于第i个要素。所述三维矩阵的每个层面可以包括对应于时段的不同数目的数据行。表6在对于i=0要素建立表6后,方程(4)在步骤222中确定K0=2,因为k=2与0.904019,即在表6的相关系数行上的相关系数的绝对值的最大值相关联。K0=2指示业务应用的用户以2小时的时滞对于在DJIA中的改变响应。因此,在这种情况下,建立下述的回归模型使用在测量UAM的时间之前两个小时测量的DeltaDJIA。在步骤222后,再一次执行如上所述的步骤214,只是将对于每个非日历类型要素的在步骤222中确定的最大相关系数与所述预设的门限值(例如0.3)相比较。如果在步骤220中对于第i个非日历类型要素确定的任何最大的相关系数小于预设的相关系数门限值(例如0.3),则从由跟随步骤213后的步骤214的执行所定义的要素子集中排除该第i个非日历类型要素。换句话说,如果所有的其相关联的rik值小于预设的门限值(例如0.3),则排除第i个非日历类型要素。非日历类型要素的这种排除形成第二子集,所述第二子集包括未被在跟随步骤213后的步骤214排除的日历类型要素和未被在跟随步骤222后的步骤214排除的非日历类型要素。第二子集包括一个要素或多个要素。在跟随步骤222和214后的步骤216的第二次发生中,由步骤214确定的要素的第二子集的索引(参见步骤204)被重新编号为顺序的。虽然在图2中未示出,一个实施例包括如果在步骤214中的要素的排除在结果产生的要素子集中剩下小于预设数目的要素(例如2个要素),则在步骤214后循环回到步骤204。在步骤214和216中处理所述一个或多个非日历类型要素后,查询218确定没有剩余还未被步骤210、212和213或被步骤220和222处理的另外的要素。在步骤214的排除后,剩余的要素的子集可以包括仅仅一个或多个日历类型要素、仅仅一个或多个非日历类型要素或者一个或多个日历类型要素和一个或多个非日历类型要素的组合。本发明考虑如上所述的图2步骤的其他次序。例如,可以在日历类型要素之前分析非日历类型要素。作为另一个示例,可以在步骤214之前完成日历类型要素和非日历类型要素两者的相关分析,并且在这种情况下,在步骤214中的排除可以在包括日历类型要素和非日历类型要素的任何次序工作。回归分析在步骤224中,产生回归模型。回归模型能够在指定的时段期间预测活动级。所述回归模型基于在步骤206(参见图2)被分配到UAM的一个或多个测量和在步骤206和212(参见图2)被分配到在由步骤214(参见图2)的最后发生所确定的要素子集中的每个要素的一个或多个值或调整值。在表6的DJIA示例的情况下,因为k=2最大化相关系数,因此回归模型使用在测量相关联的用户活动级的时间之前的两个小时测量的DeltaDJIA,回归模型的一个示例是使用被输入到方程(5)中的历史数据的多线性回归模型U=b0+&Sigma;i=1,...,nbixi---(5)]]>其中U是被预测的用户活动级,xi是第i个要素,b0是第0个回归系数,并且bi是第i个回归系数。在步骤226,通过本领域内公知的方法来确定在方程(5)中的回归系数值。本发明不限于使用多线性回归模型来实现步骤224。可以使用诸如多项式回归模型之类的其他模型来克服所述多回归模型的不足。应当注意,如果向每个要素分配三个或更多的值并且向UAM分配三个或更多的测量,则可以以更大的精度来进行如上所述预测模型建立技术的相关分析,其中,所述三个或更多的值和三个或更多的测量与三个或更多的时段相关联。预测用户活动级图3是按照本发明的实施例的、用于使用图2的模型来预测与应用相关联的用户活动级并且根据所述预测而重新分配资源的方法的流程图。以下,图3的处理被称为预测和重新分配处理。使用由图2的处理产生的模型而预测用户活动级的系统的实时操作在步骤300开始。在步骤302,动态地和定期地收集在步骤224中(参见图2)产生的回归模型中包括的非日历类型要素的实时值。所述实时值被提供到预测活动级的计算系统(参见图4)。所述实时值包括一个或多个实时值的一个或多个集合,并且该一个或多个集合一一对应地与在通过步骤214的最后发生而建立的子集中的一个或多个非日历类型要素相关联(参见图2)。在步骤224(参见图2)的回归模型中使用每个实时值(例如,用作方程(5)中的xi值)。在一个实施例中,在步骤302收集的值被分配到回归模型的非日历类型要素,并且在与被预测的活动级相关联的时间之前的Ki个单位的时间被测量,其中,Ki是通过方程(4)来计算的。返回到其中等式(4)计算出Ki=2小时的表6的示例,在步骤302向DeltaDJIA要素分配的值是在与通过回归模型预测的事务的数量相关联的时间之前2个小时测量的值。在DeltaDJIA示例中,在业务时间期间每个小时收集新的DJIA测量,并且每个小时使用新的DJIA测量来重复图3的处理,只要也按小时测量其他的要素值。在步骤304中,通过计算由在步骤224(参见图2)产生的回归模型提供的活动级而预测指定时段的活动级,该回归模型利用了在步骤226(参见图2)确定的回归系数。例如,在步骤302获得实时值的计算系统(参见图4)在步骤304执行计算。在步骤304预测的活动级是在未来的时段期间将由使用应用的多个用户执行的事务的数目或在未来的时段期间将使用应用的用户的数目。在步骤306中,将步骤304的预测活动级与多个预设的资源提供门限值相比较。在步骤308,按照步骤306的比较来重新分配一个或多个硬件资源,诸如服务器(例如万维网服务器、应用服务器和/或数据库服务器)、路由器、负载平衡器等。在一个实施例中,一对资源提供门限值包括两个UAM相关联的值和对应的时段,它们是针对不同的硬件元素(例如硬件服务器)指定的。在表7中示出了这个实施例的一个示例。表7的UAM1列指示“低水位”提供门限值(“lowwater”provisioningthreshold,LWPT)。如果对于超过Time1的值(例如多个小时)的时段在步骤304中预测的活动级小于LWPT,则对应于所述LWPT的、在表7的第一列中指定的硬件资源被重新分配(例如重新部署),以便硬件资源不再服务于与所预测的活动级相关联的应用。例如,如果在步骤304中预测的活动级是在时段2小时中每个小时4000个事务,则万维网服务器被重新部署为离开服务于所述应用,这是因为4000小于万维网服务器的LWPT(即每个小时5000个事务),并且所述两个小时时段大于对应于万维网服务器的Time1值(即1个小时)。在这个示例中,不重新部署应用服务器或数据库服务器,因为每个小时4000个事务大于应用服务器和数据库服务器的LWPT(即每个小时500个事务)。表7的UAM2列指示“高水位”提供门限值(HWPT)。如果对于超过Time2的值(例如多个小时)的时段在步骤304中预测的活动级大于HWPT,则分配或重新分配另外的硬件资源,以服务于与所预测的活动级相关联的应用。附加硬件资源具有与在对应于HWPT的、在表7的第一列中指定的硬件资源相同的类型。例如,如果在步骤304中预测的活动级是对于5小时的时段每个小时60,000个事务,则万维网服务器被重新分配以服务于所述应用,这是因为60,000大于万维网服务器的HWPT(即每个小时50,000),并且所述4个小时的时段大于对应于万维网服务器的Time2值(即3个小时)。在这个示例中,也存在对附加的应用服务器和附加的数据库服务器的重新分配以服务于所述应用,因为每个小时60,000个事务和所述5小时的时段分别大于应用服务器和数据库服务器的HWPT(即每个小时5000个事务)和Time2值(即4个小时)。表7如果查询步骤310确定应用系统100(参见图1)或包括用于预测用户活动级的逻辑的计算单元(参见图4)的状态要求结束所述预测和重新分配处理,则图3的处理在步骤312结束;否则,所述预测和重新分配处理在步骤302重复开始。图4是按照本发明的实施例的用于实现图2和3的方法的计算单元400的方框图。计算单元400一般包括中央处理单元(CPU)402、存储器404、输入/输出(I/O)接口406、总线408、I/O器件410和存储单元412。CPU402执行计算单元400的计算和控制功能。CPU402可以包括单个处理单元或被分布在一个或多个位置中的一个或多个处理单元上(例如在客户机和服务器上)。存储器404可以包括任何公知类型的数据存储和/或传输媒体,包括磁媒体、光媒体、随机存取存储器(RAM)、只读存储器(ROM)、数据高速缓冲存储器、数据对象等。存储单元412是例如磁盘驱动器或光盘驱动器。而且,类似于CPU402,存储器404可以驻留在单个物理位置上,包括一个或多个类型的数据存储器,或者被分布在各种形式的多个物理系统上。而且,存储器404可以包括被分布在例如局域网、广域网或存储区域网(SAN)(未示出)上的数据。I/O接口406包括用于向或从外部源交换信息的任何系统。I/O器件410包括任何公知类型的外部器件,包括显示监控器、键盘、鼠标、打印机、扬声器、手持器件、打印机、传真机等。总线408在计算单元400中的每个部件之间提供通信链路,并且可以包括任何类型的传输链路,包括电的、光的、无线的等。I/O接口406还允许计算单元400从辅助存储器件——诸如非易失性存储器件(例如CD-ROM驱动器,它接收CD-ROM盘)(未示出)——存储和检索信息(例如程序指令或数据)。计算单元400可以从其他辅助存储器件(未示出)存储和检索信息,所述其他辅助存储器件可以包括直接存取存储器(DASD)(例如硬盘或软盘)、磁光盘驱动器、磁带驱动器或无线通信器件。存储器404包括计算机程序代码,其中包括用户活动级预测系统414,用于预测与在应用服务器102、104(参见图1)上执行的应用相关联的用户活动级。用户活动级预测系统414实现图2和3的处理的逻辑。而且,存储器404可以包括在图4中未示出的其他系统,诸如运行在CPU402上的操作系统(例如Linux),并且提供对在计算单元400内和/或与计算单元400连接的各种部件的控制。计算单元400链接到切换器(未示出),所述切换器也链接到图1的多个服务器102、104、106和108。本发明可以采取整个硬件实施例、整个软件实施例或包含硬件和软件元素的实施例的形式。在优选实施例中,本发明以软件实现,所述软件包括但是不限于固件、驻留软件、微码等。而且,本发明可以采取可以从计算机可用或计算机可读介质存取的计算机程序产品的形式,所述计算机程序产品提供由计算单元400或任何指令执行系统使用或与计算单元400或任何指令执行系统结合使用的程序代码414,以提供和便利本发明的能力。为本说明的目的,计算机可用或计算机可读介质可以是可以包含、存储、通信、传播或传送由指令执行系统、装置或器件使用或与其相结合使用的程序的任何装置。所述介质可以是电的、磁的、光的、电磁的、红外线的或半导体的系统(或装置或器件)或传播介质。计算机可读介质的示例包括半导体或固态存储器、磁带、可装卸计算机盘、RAM404、ROM、硬磁盘和光盘。光盘的当前示例包括致密盘——只读存储器(CD-ROM)、致密盘——读取/写入(CD-R/W)和DVD。适合于存储和/或执行程序代码414的计算系统400包括直接耦接到或通过系统总线408而间接地耦接到存储元件404的至少一个处理器402。所述存储元件可以包括在程序代码的实际执行期间使用的本地存储器、大容量存储器和高速缓冲存储器,它们提供至少一些程序代码的暂时存储,以便降低在执行期间必须从大容量存储器检索代码的次数。而且,本发明公开了一种用于部署或集成计算基础架构的方法,包括将计算机可读代码集成到计算机系统400中,其中,与计算机系统400组合的代码能够预测与应用相关联的用户活动级。用于部署或集成具有在此所述的能力的计算基础架构的所公开的方法可以被提供作为在订购服务上的服务。在此所述的流程图是作为示例提供的。在不脱离本发明的精神的情况下,可以存在对于在此所述的这些图或步骤(或操作)的多种变化形式。例如,在某些情况下,可以以不同的顺序来执行所述步骤,或可以增加、删除或修改步骤。所有这些变化形式被视为在所附的权利要求中所述的本发明的一部分。虽然已经为了说明的目的而在此描述了本发明的实施例,但是对于本领域内的技术人员而言,许多修改和改变将变得清楚。因此,所附的权利要求意欲涵盖落入本发明的真实精神和范围内的所有这样的修改和改变。权利要求1.一种用于预测与在多用户计算环境中的计算系统上执行的应用相关联的用户活动级的方法,所述方法包括将用户活动量度(UAM)定义为与多个活动级相关联的变量,其中,所述多个活动级的每个活动级是在多个时段的一个时段期间由使用所述应用的多个用户执行的事务的数目,或是在所述时段期间使用所述应用的所述用户的数目;定义与所述UAM相关联的多个要素;向所述UAM分配多个测量,其中,所述多个测量的每个测量是所述多个活动级的一个活动级;向所述多个要素的要素分配多个值,所述多个值一一对应地与所述多个测量相关联,并且一一对应地与所述多个时段相关联;计算在所述多个值的至少两个值和所述多个测量的至少两个测量之间的至少一个相关系数;确定小于预设门限值的所述至少一个相关系数的最大相关系数;响应于所述确定而从所述多个要素中排除所述要素,以便利形成所述多个要素的子集,所述子集包括一个或多个要素,其中,所述一个或多个要素的任何要素与所述UAM之间的相关系数的绝对值大于或等于所述预设的门限值;以及产生回归模型以预测活动级,所述回归模型基于所述多个测量和所述子集。2.按照权利要求1的方法,还包括实时地收集包括一个或多个值的一个或多个集合的多个值,所述一个或多个集合一一对应地与在所述子集中包括的所述一个或多个要素相关联;以及使用所述多个值经由所述回归模型来计算所述活动级,其中,所述活动级是在未来的时段期间将由使用所述应用的所述多个用户执行的事务的数目或是在所述未来时段期间将使用所述应用的所述用户的数目。3.按照权利要求2的方法,还包括将所述活动级与多个资源提供门限值相比较;以及响应于所述比较而提供所述计算系统的一个或多个资源,所述提供包括下述之一向所述应用重新分配所述一个或多个资源的第一资源,其中,所述活动级超过所述多个资源提供门限值的第一门限值,并且从所述应用向所述计算系统的另一个部分重新分配所述一个或多个资源的第二资源,其中,所述活动级小于所述多个资源提供门限值的第二门限值,所述第二门限值与所述第一门限值不同。4.按照权利要求1的方法,其中,所述定义所述多个要素包括将所述要素定义为日历类型要素,对于日历类型要素所述多个值的每个值表示从指定事件过去的时间量,其中,所述至少一个相关系数包括单个相关系数,以及其中,所述最大的相关系数是所述单个相关系数的绝对值。5.按照权利要求4的方法,还包括确定与所述多个测量相关联的样本均值、标准偏差和标准误差,所述多个测量是历史数据;将所述多个值的值修改为预设的基值,其中,所述值与超过所述样本均值多于所述标准误差乘以预设数的所述多个测量的测量相关联;以及将所述多个值的其他值调整为两个或多个调整值的集合,其中,所述两个或多个调整值的调整值表示到所述基值的距离,其中,所述计算使用所述基值和两个或多个调整值的所述集合来计算所述单个相关系数,其中,所述单个相关系数的第一绝对值大于在所述多个值和所述多个测量之间的另一个相关系数的第二绝对值。6.按照权利要求4的方法,其中,被分配到所述日历类型要素的所述多个值的值包括下述之一与所述活动级相关联并且被其中所述多个用户的用户所位于的时区调整的时刻,与所述活动级相关联的多个日子的一个日子,所述多个日子被包括在下述之一中一个星期、一个月、与日历年不同的金融年度和生产周期。7.按照权利要求1的方法,其中,所述定义所述多个要素包括定义所述多个要素的第一子集,所述第一子集包括至少一个要素,其中,所述要素被包括在所述第一子集中,其中,所述第一子集的每个要素是所述UAM所依赖于的可测量的变量,其中,所述可测量变量不是日历类型要素,对于所述日历类型要素,所述多个值的每个值表示从指定事件过去的时间量,以及其中,所述方法还包括向所述UAM分配多个测量,所述多个测量被包括在具有至少两个测量的多个集合中,其中,具有所述至少两个测量的每个集合依赖于所述多个要素的一个要素,并且被包括在所述多个测量中,以及其中,所述多个测量被包括在所述多个集合的一个集合中。8.按照权利要求7的方法,还包括产生xij元素的第一矩阵,其中,xij是在所述多个时段的第j个时段的结尾测量的所述第一子集的第i个要素的值;以及产生包括所述第一矩阵的第二矩阵,其中,所述第二矩阵是包括yijk元素的三维矩阵,其中,yijk是被分配到所述UAM的第(i,j,k)个测量,并且被包括在具有至少两个测量的所述多个集合的第k个集合中,所述第(i,j,k)个测量与所述xij相关联,并且在所述多个时段的第(j+k)个时段的结尾被测量,以及其中,所述第二矩阵包括元素rik,其中,rik是所述第一子集的所述第i个要素和所述第k个集合之间的第(i,k)个相关系数,其中,所述最大相关系数是在所述元素rik的集合中包括的元素(r)的绝对值,其中,所述r的所述绝对值大于或等于所述元素rik的所述集合的任何其他元素的绝对值,所述r与所述要素相关联,并且与具有至少两个测量的所述多个集合的一个集合相关联,以及其中,所述最大的相关系数与时间步长K相关联,其中,所述多个集合的所述集合的每个测量是在所述多个时段的一个时段结尾后的K个单位时间被测量的。9.按照权利要求8的方法,还包括一一对应地向所述子集的所述一个或多个要素分配一个或多个要素值,其中,所述一个或多个要素值的每个要素值是在其中所述活动级要发生的时间段的开始之前的所述K个单位时间被测量的;以及经由所述回归模型来计算所述活动级,其中,所述回归模型是使用所述一个或多个要素值来作为输入以预测在所述时段期间的所述活动级的多线性回归模型。10.一种用于预测与在多用户计算环境中的计算系统上执行的应用相关联的用户活动级的系统,所述系统包括用于将用户活动量度(UAM)定义为与多个活动级相关联的变量的部件,其中,所述多个活动级的每个活动级是在多个时段的一个时段期间由使用所述应用的多个用户执行的事务的数目,或是在所述时段期间使用所述应用的所述用户的数目;用于定义与所述UAM相关联的多个要素的部件;用于向所述UAM分配多个测量的部件,其中,所述多个测量的每个测量是所述多个活动级的一个活动级;用于向所述多个要素的要素分配多个值的部件,所述多个值一一对应地与所述多个测量相关联,并且一一对应地与所述多个时段相关联;用于计算在所述多个值的至少两个值和所述多个测量的至少两个测量之间的至少一个相关系数的部件;用于确定小于预设门限值的所述至少一个相关系数的最大相关系数的部件;用于响应于所述确定而从所述多个要素中排除所述要素、以便利形成所述多个要素的子集的部件,所述子集包括一个或多个要素,其中,所述一个或多个要素的任何要素与所述UAM之间的相关系数的绝对值大于或等于所述预设的门限值;以及用于产生回归模型以预测活动级的部件,所述回归模型基于所述多个测量和所述子集。11.按照权利要求10的系统,还包括用于实时地收集包括一个或多个值的一个或多个集合的多个值的部件,所述一个或多个集合一一对应地与在所述子集中包括的所述一个或多个要素相关联;以及用于使用所述多个值经由所述回归模型来计算所述活动级的部件,其中,所述活动级是在未来的时段期间将由使用所述应用的所述多个用户执行的事务的数目或是在所述未来时段期间将使用所述应用的所述用户的数目。12.按照权利要求11的系统,还包括用于将所述活动级与多个资源提供门限值相比较的部件;用于响应于所述比较而提供所述计算系统的一个或多个资源的部件,所述用于提供的部件包括下述之一用于向所述应用重新分配所述一个或多个资源的第一资源的部件,其中,所述活动级超过所述多个资源提供门限值的第一门限值,以及用于从所述应用向所述计算系统的另一个部分重新分配所述一个或多个资源的第二资源的部件,其中,所述活动级小于所述多个资源提供门限值的第二门限值,所述第二门限值与所述第一门限值不同。13.按照权利要求10的系统,其中,所述用于定义所述多个要素的部件包括用于将所述要素定义为日历类型要素的部件,对于日历类型要素所述多个值的每个值表示从指定事件过去的时间量,其中,所述至少一个相关系数包括单个相关系数,以及其中,所述最大的相关系数是所述单个相关系数的绝对值。14.按照权利要求13的系统,还包括用于确定与所述多个测量相关联的样本均值、标准偏差和标准误差的部件,所述多个测量是历史数据;用于将所述多个值的值修改为预设的基值的部件,其中,所述值与超过所述样本均值多于所述标准误差乘以预设数的所述多个测量的测量相关联;以及用于将所述多个值的其他值调整为两个或多个调整值的集合的部件,其中,所述两个或多个调整值的调整值表示到所述基值的距离,其中,所述计算使用所述基值和两个或多个调整值的所述集合来计算所述单个相关系数,其中,所述单个相关系数的第一绝对值大于在所述多个值和所述多个测量之间的另一个相关系数的第二绝对值,15.按照权利要求13的系统,其中,被分配到所述日历类型要素的所述多个值的值包括下述之一与所述活动级相关联并且被其中所述多个用户的用户所位于的时区调整的时刻,与所述活动级相关联的多个日子的一个日子,所述多个日子被包括在下述之一中一个星期、一个月、与日历年不同的金融年度和生产周期。16.按照权利要求10的系统,其中,所述用于定义所述多个要素的部件包括用于定义所述多个要素的第一子集的部件,所述第一子集包括至少一个要素,其中,所述要素被包括在所述第一子集中,其中,所述第一子集的每个要素是所述UAM所依赖于的可测量的变量,其中,所述可测量变量不是日历类型要素,对于日历类型要素,所述多个值的每个值表示从指定事件过去的时间量,以及其中,所述系统还包括用于向所述UAM分配多个测量的部件,所述多个测量被包括在具有至少两个测量的多个集合中,其中,所述具有至少两个测量的每个集合依赖于所述多个要素的要素,并且被包括在所述多个测量中,以及其中,所述多个测量被包括在所述多个集合的一个集合中。17.按照权利要求16的系统,还包括用于产生xij元素的第一矩阵的部件,其中,xij是在所述多个时段的第j个时段的结尾测量的所述第一子集的第i个要素的值;以及用于产生包括所述第一矩阵的第二矩阵的部件,其中,所述第二矩阵是包括yijk元素的三维矩阵,其中,yijk是被分配到所述UAM的第(i,j,k)个测量,并且被包括在具有至少两个测量的所述多个集合的第k个集合中,所述第(i,j,k)个测量与所述xij相关联,并且在所述多个时段的第(j+k)个时段的结尾被测量,以及其中,所述第二矩阵包括元素rik,其中,rik是所述第一子集的所述第i个要素和所述第k个集合之间的第(i,k)个相关系数,其中,所述最大相关系数是在所述元素rik的集合中包括的元素(r)的绝对值,其中,所述r的所述绝对值大于或等于所述元素rik的所述集合的任何其他元素的绝对值,所述r与所述要素相关联,并且与具有至少两个测量的所述多个集合的集合相关联,以及其中,所述最大的相关系数与时间步长K相关联,其中,所述多个集合的所述集合的每个测量是在所述多个时段的一时段结尾后的K个单位的时间被测量的。18.按照权利要求17的系统,还包括用于一一对应地向所述子集的所述一个或多个要素分配一个或多个要素值的部件,其中,所述一个或多个要素值的每个要素值是在其中所述活动级要发生的时间段的开始之前的所述K个单位时间被测量的;以及用于经由所述回归模型来计算所述活动级的部件,其中,所述回归模型是使用所述一个或多个要素值来作为输入以预测在所述时段期间的所述活动级的多线性回归模型。19.一种用于部署计算基础架构的方法,包括将计算机可读代码集成到计算系统中,其中,与所述计算机系统组合的所述代码能够执行预测与在多用户计算环境中的计算系统上执行的应用相关联的用户活动级的处理,所述处理包括将用户活动量度(UAM)定义为与多个活动级相关联的变量,其中,所述多个活动级的每个活动级是在多个时段的一时段期间由使用所述应用的多个用户执行的事务的数目,或是在所述时段期间使用所述应用的所述用户的数目;定义与所述UAM相关联的多个要素;向所述UAM分配多个测量,其中,所述多个测量的每个测量是所述多个活动级的一个活动级;向所述多个要素的要素分配多个值,所述多个值一一对应地与所述多个测量相关联,并且一一对应地与所述多个时段相关联;计算在所述多个值的至少两个值和所述多个测量的至少两个测量之间的至少一个相关系数;确定小于预设门限值的所述至少一个相关系数的最大相关系数;响应于所述确定而从所述多个要素中排除所述要素,以便利形成所述多个要素的子集,所述子集包括一个或多个要素,其中,在所述一个或多个要素的任何要素和所述UAM之间的相关系数的绝对值大于或等于所述预设的门限值;以及产生回归模型以预测活动级,所述回归模型基于所述多个测量和所述子集。20.按照权利要求19的方法,所述处理还包括实时地收集包括一个或多个值的一个或多个集合的多个值,所述一个或多个集合一一对应地与在所述子集中包括的所述一个或多个要素相关联;并且使用所述多个值经由所述回归模型来计算所述活动级,其中,所述活动级是在未来的时段期间将由使用所述应用的所述多个用户执行的事务的数目或是在所述未来时段期间将使用所述应用的所述用户的数目。21.按照权利要求20的方法,所述处理还包括将所述活动级与多个资源提供门限值相比较;以及响应于所述比较而提供所述计算系统的一个或多个资源,所述提供包括下述之一向所述应用重新分配所述一个或多个资源的第一资源,其中,所述活动级超过所述多个资源提供门限值的第一门限值,以及从所述应用向所述计算系统的另一个部分重新分配所述一个或多个资源的第二资源,其中,所述活动级小于所述多个资源提供门限值的第二门限值,所述第二门限值与所述第一门限值不同。22.按照权利要求19的方法,其中,所述定义所述多个要素包括将所述要素定义为日历类型要素的部件,对于日历类型要素所述多个值的每个值表示从指定事件过去的时间量,其中,所述至少一个相关系数包括单个相关系数,以及其中,所述最大的相关系数是所述单个相关系数的绝对值。23.按照权利要求22的方法,所述处理还包括确定与所述多个测量相关联的样本均值、标准偏差和标准误差,所述多个测量是历史数据;将所述多个值的值修改为预设的基值,其中,所述值与超过所述样本均值多于所述标准误差乘以预设数的所述多个测量的测量相关联;以及将所述多个值的其他值调整为两个或多个调整值的集合,其中,所述两个或多个调整值的调整值表示到所述基值的距离,其中,所述计算使用所述基值和两个或多个调整值的所述集合来计算所述单个相关系数,其中,所述单个相关系数的第一绝对值大于在所述多个值和所述多个测量之间的另一个相关系数的第二绝对值。24.按照权利要求22的方法,其中,被分配到所述日历类型要素的所述多个值的值包括下述之一与所述活动级相关联并且被其中所述多个用户的用户所位于的时间区域调整的时刻,与所述活动级相关联的多个日子的一个日子,所述多个日子被包括在下述之一中一个星期、一个月、与日历年不同的金融年度和生产周期。25.按照权利要求19的方法,其中,所述定义所述多个要素包括定义所述多个要素的第一子集,所述第一子集包括至少一个要素,其中,所述要素被包括在所述第一子集中,其中,所述第一子集的每个要素是所述UAM所依赖于的可测量的变量,其中,所述可测量变量不是日历类型要素,对于日历类型要素,所述多个值的每个值表示从指定事件过去的时间量,并且其中,所述处理还包括向所述UAM分配多个测量,所述多个测量被包括在具有至少两个测量的多个集合中,其中,所述至少两个测量的每个集合依赖于所述多个要素的一个要素,并且被包括在所述多个测量中,以及其中,所述多个测量被包括在所述多个集合的一个集合中。26.按照权利要求25的方法,所述处理还包括产生xij元素的第一矩阵,其中,xij是在所述多个时段的第j个时段的结尾测量的所述第一子集的第i个要素的值;并且产生包括所述第一矩阵的第二矩阵,其中,所述第二矩阵是包括yijk元素的三维矩阵,其中,yijk是被分配到所述UAM的第(i,j,k)个测量,并且被包括在具有至少两个测量的所述多个集合的第k个集合中,所述第(i,j,k)个测量与所述xij相关联,并且在所述多个时段的第(j+k)个时段的结尾被测量,以及其中,所述第二矩阵包括元素rik,其中,rik是所述第一子集的所述第i个要素和所述第k个集合之间的第(i,k)个相关系数,其中,所述最大相关系数是在所述元素rik的集合中包括的一元素(r)的绝对值,其中,所述r的所述绝对值大于或等于所述元素rik的所述集合的任何其他元素的绝对值,所述r与所述要素相关联,并且与具有至少两个测量的所述多个集合的一个集合相关联,并且其中,所述最大的相关系数与时间步长K相关联,其中,所述多个集合的所述集合的每个测量是在所述多个时段的一时段结尾后的K个单位时间被测量的。27.按照权利要求26的方法,所述处理还包括一一对应地向所述子集的所述一个或多个要素分配一个或多个要素值,其中,所述一个或多个要素值的每个要素值是在其中所述活动级要发生的时间段的开始之前的所述K个单位时间被测量的;并且经由所述回归模型来计算所述活动级,其中,所述回归模型是使用所述一个或多个要素值来作为输入以预测在所述时段期间的所述活动级的多线性回归模型。全文摘要用于预测与应用相关联的用户活动级的方法和系统。活动级是每个时段由使用所述应用的用户执行的事务的数目或每个时段使用所述应用的用户的数目。活动级的测量被分配到用户活动量度(UAM)变量,并且相关联的值被分配到要素集合。计算在每个要素和UAM之间的至少一个相关系数。响应于小于预设门限值的与要素相关联的最大相关系数,从所述要素集合排除所述要素以便利形成与其绝对值大于或等于所述预设门限值的相关系数相关联的要素的子集。使用所述子集的回归模型被产生以预测活动级。文档编号G06F9/44GK1976345SQ20061016037公开日2007年6月6日申请日期2006年11月15日优先权日2005年12月1日发明者德米特里·安德烈夫,加里纳·格鲁宁,保罗·G·格林斯坦,格雷戈里·维尔尚斯基申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1