异常环境下的指标数据生成方法、装置及电子设备与流程

文档序号:16506497发布日期:2019-01-05 09:04阅读:208来源:国知局
异常环境下的指标数据生成方法、装置及电子设备与流程
本申请涉及计算机
技术领域
,尤其涉及一种异常环境下的指标数据生成方法、装置及电子设备。
背景技术
:银行压力测试是一种评估银行风险的方法。银行压力测试包括银行的信用压力测试、市场压力测试、流动性压力测试和操作压力测试等。在银行的压力测试中,需要合理可信的异常环境下的多个指标数据作为输入参数。例如,在银行的流动性压力测试中,由于上海银行间同业拆放利率(shanghaiinterbankofferedrate,shibor)能够很好地刻画市场流动性,因此可将异常环境(例如shibor突然飙升的极端市场环境)下的多种期限结构的shibor作为银行流动性压力测试的输入参数。其中,shibor的期限结构包括隔夜(o/n)、一周(1w)、两周(2w)、1个月(1m)、3个月(3m)、6个月(6m)、9个月(9m)和一年(1y)8种。但是,由于历史上只出现过为数不多的shibor突然飙升的极端市场环境,因此需要使用的一定的方法预测生成更多的异常环境下的shibor,作为银行流动性压力测试的输入参数。传统的方法是对历史极端场景下的多个指标的数据做一些幅度调整,生成更多的异常环境下的多个指标的数据。这种方式过于简单,没有考虑不同指标之间的联系。技术实现要素:本申请实施例提供了一种异常环境下的指标数据生成方法、装置及电子设备,以兼顾不同指标数据之间的联系,提高预测出的多个指标数据的可靠性和合理性。为解决上述技术问题,本申请实施例是这样实现的:第一方面,提出了一种异常环境下的指标数据生成方法,所述方法包括:对多个指标的历史数据分别进行预处理,获得所述多个指标的目标数据,所述目标数据为不同时刻的历史数据之间的变化值的标准化数据;对所述多个指标的目标数据进行主成分分析,获得多个主成分的数据;基于至少一个主成分的数据的分布以及预设置信度,确定异常环境下所述至少一个主成分的数据,所述预设置信度是所述多个主成分的数据属于正常环境下数据的可信水平;对所述异常环境下的所述至少一个主成分的数据,依次进行所述主成分分析的逆操作和所述预处理的逆操作,生成所述多个指标在所述异常环境下的预测数据。第二方面,提出了一种异常环境下的指标数据生成装置,所述装置包括:预处理模块,用于对多个指标的历史数据分别进行预处理,获得所述多个指标的目标数据,所述目标数据为不同时刻的历史数据之间的变化值的标准化数据;主成分分析模块,用于对所述多个指标的目标数据进行主成分分析,获得多个主成分的数据;第一确定模块,用于基于至少一个主成分的数据的分布以及预设置信度,确定异常环境下所述至少一个主成分的数据,所述预设置信度是所述多个主成分的数据属于正常环境下的数据的可信水平;生成模块,用于对所述异常环境下的所述至少一个主成分的数据,依次进行所述主成分分析的逆操作和所述预处理的逆操作,生成所述多个指标在所述异常环境下的预测数据。第三方面,提出了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:对多个指标的历史数据分别进行预处理,获得所述多个指标的目标数据,所述目标数据为不同时刻的历史数据之间的变化值的标准化数据;对所述多个指标的目标数据进行主成分分析,获得多个主成分的数据;基于至少一个主成分的数据的分布以及预设置信度,确定异常环境下所述至少一个主成分的数据,所述预设置信度是所述多个主成分的数据属于正常环境下数据的可信水平;对所述异常环境下的所述至少一个主成分的数据,依次进行所述主成分分析的逆操作和所述预处理的逆操作,生成所述多个指标在所述异常环境下的预测数据。第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:对多个指标的历史数据分别进行预处理,获得所述多个指标的目标数据,所述目标数据为不同时刻的历史数据之间的变化值的标准化数据;对所述多个指标的目标数据进行主成分分析,获得多个主成分的数据;基于至少一个主成分的数据的分布以及预设置信度,确定异常环境下所述至少一个主成分的数据,所述预设置信度是所述多个主成分的数据属于正常环境下数据的可信水平;对所述异常环境下的所述至少一个主成分的数据,依次进行所述主成分分析的逆操作和所述预处理的逆操作,生成所述多个指标在所述异常环境下的预测数据。由以上本申请实施例提供的技术方案可见,本申请实施例提供的方案至少具备如下一种技术效果:由于对多个指标的目标数据进行主成分分析得到的多个主成分的数据,能够反映多个指标的历史数据之间的联系,因此,利用主成分分析预测异常环境下的指标数据时,可以兼顾到不同指标之间的联系,提高预测出的多个指标数据的可靠性和合理性,应用该指标数据进行压力测试时,得到的压力测试结果也更为准确。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是本说明书实施例提供的异常环境下的指标数据生成方法的流程示意图之一。图2是本说明书实施例提供的异常环境下的指标数据生成方法的原理示意图。图3是图2第一象限中处于极端场景下的多个指标数据变化趋势示意图。图4是图2第一象限中处于极端场景下的多个指标数据变化趋势示意图。图5是图2第一象限中处于极端场景下的多个指标数据变化趋势示意图。图6是图2第一象限中处于极端场景下的多个指标数据变化趋势示意图。图7是本说明书实施例提供的异常环境下的指标数据生成方法的流程示意图之二。图8是本说明书实施例提供的正态分布示意图。图9是本说明书实施例提供的一种电子设备的结构示意图。图10是本说明书实施例提供的异常环境下的指标数据生成装置的结构示意图之一。图11是本说明书实施例提供的异常环境下的指标数据生成装置的结构示意图之二。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。为了兼顾不同指标数据之间的联系,提高预测出的多个指标数据的可靠性和合理性,本说明书提供一种异常环境下的指标数据生成方法及装置。本说明书提供的异常环境下的指标数据生成方法的执行主体,可以是服务器或终端。需要说明的是,虽然在本说明书中以银行压力测试作为应用场景,介绍本说明书提供的异常环境下的指标数据生成方案,但应理解,本说明书提供的异常环境下的指标数据的生成方案还可以应用于其他场景。还需要说明的是,在本说明书实施例中正常环境和异常环境是相对而言的,可以以指标的数值变化趋势来界定,例如,假设隔夜shibor利率在很长一段时间内都是在1%~2%之间波动而没有出现大的变动,说明这一段时间的隔夜shibor利率处在正常环境下,在此基础上,如果某一天隔夜shibor利率飙升到了5%,说明书这一天的隔夜shibor利率处在异常环境(或称极端环境)下。下面结合附图1至8对本说明书实施例提供的一种异常环境下的指标数据生成方法进行详细的说明。如图1所示,在一个实施例中,本说明书提供的一种异常环境下的指标数据生成方法,可以包括如下步骤:步骤102、对多个指标的历史数据分别进行预处理,获得所述多个指标的目标数据,所述目标数据为不同时刻的历史数据之间的变化值的标准化数据。在本说明书中,指标可以理解为是能够衡量事物特征水平的标准。例如,上海银行间同业拆放利率(shanghaiinterbankofferedrate,shibor)是一个能够很好地衡量货币市场流动性的标准。还应理解,描述不同事物特征的指标可以是不同的,且描述同一事物的同一特征指标可以有多个。例如,能够衡量银行信用风险的指标可以包括正常贷款迁徙率和不良贷款迁徙率两个指标,这与衡量货币市场流动性的指标不同。再如本说明书
背景技术
中所述,能够衡量货币市场流动性的指标shibor可以不止一个,而是包括隔夜(o/n)、一周(1w)、两周(2w)、1个月(1m)、3个月(3m)、6个月(6m)、9个月(9m)和一年(1y)8种期限结构的shibor。在本说明书中,为了方便描述,主要将8种不同期限结构的shibor作为步骤102中的多个指标的一个例子,进行本说明书提供的各个技术方案的介绍。在一个例子中,步骤102具体可以包括:对所述多个指标的历史数据,分别以预设时间间隔为步长计算产生时间在后的数据相对于产生时间在前的数据的变化值(也可以称为差分值),得到所述多个指标的变化值数据;对所述多个指标的变化值数据分别进行标准化处理,得到所述多个指标的目标数据。其中,预设时间间隔可以根据实际需要进行设定,例如,假设要用历史数据预测未来第一天的shibor利率,以用于银行压力测试时,预设时间间隔可以设为一天;假设要用历史数据预测未来第二天的shibor利率,以用于银行压力测试时,预设时间间隔可以设为两天,等等。例如,假设多个指标中的一个指标的历史数据为{a1,a2,a3,a4,…,ai,…,an},其中,a1至an是按照以天为单位采集的历史数据,且a1至an按时间的先后顺序排列,n为采集的历史数据的数量,i=1,2,…,n。那么,在预设时间间隔为1天时,得到的该指标的变化值数据为{a2-a1,a3-a2,a4-a3,…,ai-ai-1,…,an-an-1}。其中,标准化处理可以包括归一化处理等,具体的可以采用z分数(zscore)进行标准化处理。应理解标准化处理的方式可以有很多种,此处不一一列举。利用上述预处理方式对多个指标的历史数据进行预处理后,得到的某一指标的目标数据可以理解为是,该指标在不同时刻的历史数据之间的变化值的标准化数据。步骤104、对所述多个指标的目标数据进行主成分分析,获得多个主成分的数据。主成分分析(principalcomponentanalysis,pca)是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照特征值依次递减的顺序排列,变换得到几个变量就有几个主成分。在步骤104中,除得到多个主成分的数据外,还可以保存记录各主成分的特征值和变换矩阵等,方便在后续的步骤中确定第一主成分和第二主成分等,以及方便后续进行主成分分析的逆操作。在本说明书实施例中,是利用主成分分析将多个指标作为一组相关变量,通过线性变换转换成另一组不相关的变量,具体的变换方法可以采用现有技术,此处不进行详细描述。举例来说,假如多个指标为8种期限结构的shibor,他们的目标数据可以如表1所示,通过数学变换得到的多个主成分的数据可以如表2所示。应理解,在实际应用中,表1中的目标数据是一些具体的数值,表2中的主成分的数据也是一些具体的数值。表1序号隔夜一周两周1个月三个月6个月9个月1年1a1b1c1d1e1f1e1g12a2b2c2d2e2f2e2g2···························nanbncndnenfnengn表2序号第一主成分第二主成分···第m主成分1h1j1···k12h2j2···k2···············nhnjn···kn步骤106、基于至少一个主成分的数据的分布以及预设置信度,确定异常环境下所述至少一个主成分的数据,所述预设置信度是所述多个主成分的数据属于正常环境下数据的可信水平。在一个例子中,基于至少一个主成分的数据的分布以及预设置信度,确定异常环境下所述至少一个主成分的数据可以包括:基于所述至少一个主成分的特征值、所述至少一个主成分的数据的自由度和所述预设置信度,确定所述预设置信度下的置信区间;基于落在所述置信区间外的所述至少一个主成分的数据,确定异常环境下所述至少一个主成分的数据。在此基础上,也可以将预设置信度理解为是多个主成分的数据落在上述置信区间的可信水平。可信水平常用百分比来表示,也即置信度可以用百分比来表示。在上述例子的第一种实施方式中,假设所述至少一个主成分包括第一主成分和第二主成分,所述第一主成分是所述多个主成分中特征值最大的主成分,所述第二主成分是所述多个主成分中特征值的大小排名第二的主成分,则基于所述至少一个主成分的特征值、所述至少一个主成分的数据的自由度和所述预设置信度,确定所述预设置信度下的置信区间,具体可以包括如下子步骤:子步骤1062、绘制所述第一主成分的数据和所述第二主成分的数据的二维散点分布图,所述二维散点分布图以所述第一主成分和第二主成分为笛卡尔坐标系的坐标轴。如图2所示,可以以第一主成分为笛卡尔坐标系的横坐标,第二主成分为笛卡尔坐标系的纵坐标,绘制第一主成分的数据和第二主成分的数据的二维散点分布图。在图2中,一个点的坐标值可以用(第一主成分的值,第二主成分的值)表示。子步骤1064、基于所述第一主成分的特征值、所述第一主成分的数据的自由度和所述预设置信度,确定置信椭圆的长轴,并基于所述第二主成分的特征值、所述第二主成分的数据的自由度和所述预设置信度,确定所述置信椭圆的短轴,其中,所述置信椭圆用于表征所述置信区间。举例来说,置信椭圆的长轴和短轴分别可以通过如下两个公式计算:长轴=sqrt(s*a)短轴=sqrt(s*b)其中,“sqrt”表示开根号运算,a为第一主成分的特征值,b为第二主成分的特征值;s=t1*t2*finv(p,t1,t3)/(t2),其中,“finv”表示f分布的反函数;p表示预设置信度;t1为finv的分子自由度,此处由于是针对两个主成分确定置信区间,因此,t1=2;t2为第一主成分的数据的数量,或t2为第二主成分的数据的数量,参见上表2可知,t2=n;t3为finv的分母自由度,在该例子中t3=t2-1。更为具体的,假设n=2223,p=95%,t2=2223,则t3=2222,则相应的:s=2*2223*finv(0.95,2,2222)/(2222)子步骤1066、基于所述长轴和所述短轴,在所述二维散点分布图中,以原点为中心绘制所述置信椭圆。具体如图2所示,在不同预设置信度下,可以画出以原点为中心的不同大小的椭圆。在图2中,椭圆10至椭圆50,分别是预设置信度等于95%、99%、99.9%、99.99%和99.999%时的置信椭圆。且在图2所示的例子中,置信椭圆的长轴与第一主成分对应的坐标轴平行,置信椭圆的短轴与第二主成分对应的坐标轴平行。在此基础上,基于落在所述置信区间外的所述至少一个主成分的数据,确定异常环境下所述至少一个主成分的数据的步骤,可以包括:基于所述二维散点分布图中位于所述置信椭圆外的点,确定异常环境下的所述第一主成分的数据和所述第二主成分的数据。在一种更为具体的实施方式中,可以从所述二维散点分布图的任一象限中位于所述置信椭圆外的点中选择一点,作为所述异常环境下的数据点;基于所述数据点在所述笛卡尔坐标系中的坐标值,确定所述异常环境下所述第一主成分的数据和所述第二主成分的数据。当然,在实际应用中,可以根据实际需求,依据该具体实施方式选择出更多的处在异常环境下的数据点,从而确定出更多的第一主成分的数据和第二主成分的数据。在另一种更为具体的实施方式中,可以将所述二维散点分布图的任一象限中位于所述置信椭圆外的点的质心,作为所述异常环境下的数据点;基于所述数据点在所述笛卡尔坐标系中的坐标值,确定所述异常环境下所述第一主成分的数据和所述第二主成分的数据。这样,可以在四个象限中分别确定出一个异常环境下的数据点。例如,在图2中,当置信椭圆为椭圆10时,可将第一象限中椭圆10外的点的质心11、第二象限中椭圆10外的点的质心12、第三象限中椭圆10外的点的质心13和第三象限中椭圆10外的点的质心14中的一个或多个,作为异常环境下的数据点。当置信椭圆为椭圆20时,可将第一象限中椭圆20外的点的质心21、第二象限中椭圆20外的点的质心22、第三象限中椭圆20外的点的质心23和第三象限中椭圆20外的点的质心24中的一个或多个,作为异常环境下的数据点。以此类推,当置信椭圆为椭圆30时,可以将椭圆30外的质心31、质心32、质心33和质心34中的一个或多个,作为异常环境下的数据点;当置信椭圆为椭圆40时,可以将椭圆40外的质心41、质心42、质心43和质心44中的一个或多个,作为异常环境下的数据点;或者,当置信椭圆为椭圆50时,可以将椭圆50外的质心51、质心52、质心53和质心54中的一个或多个,作为异常环境下的数据点。不难理解,由于质心能够反映多个数据的总体趋势和平均水平,因此将任一象限中位于椭圆外的点的质心,作为异常环境下的数据点求得的异常环境下的第一主成分和第二主成分的数据更可靠、更合理。由于在图2中,一个点的坐标值可以用(第一主成分的值,第二主成分的值)表示,因此在上述确定异常环境下的数据点的两种具体实施方式中,可以将数据点的横坐标值确定为异常环境下第一主成分的数据,将数据点的纵坐标值确定为异常环境下第二主成分的数据。当然,除了利用两个主成分(第一主成分和第二主成分)的散点分布图,绘制置信椭圆确定异常环境下的这两个主成分的数据外,在第二种具体实施方式中,上述基于至少一个主成分的数据的分布以及预设置信度,确定异常环境下所述至少一个主成分的数据,可以包括:基于第一主成分的数据的分布以及预设置信度,确定异常环境下所述第一主成分的数据;其中,所述第一主成分是所述多个主成分中特征值最大的主成分。也即基于一个主成分确定置信区间。具体的,可以基于第一主成分的特征值、所述预设置信度、所述第一主成分的数据的自由度,确定所述预设置信度下的置信区间;基于所述第一主成分的数据与所述置信区间,确定异常环境下的所述第一主成分的数据。此时,由于只选取了第一主成分确定置信区间,因此确定出的置信区间可以是一维轴线上的一段线段,且这一线段以该一维轴线的原点为中心。这样可以基于落在上述线段外点确定异常环境下的第一主成分的数据。或者,在第三种具体实施方式中,上述基于至少一个主成分的数据的分布以及预设置信度,确定异常环境下所述至少一个主成分的数据,可以包括:基于第一主成分的数据、第二主成分的数据和第三主成分的分布以及预设置信度,确定异常环境下所述第一主成分的数据、第二主成分的数据和第三主成分的数据;其中,所述第一主成分是所述多个主成分中特征值最大的主成分,所述第二主成分是所述多个主成分中特征值的大小排名第二的主成分,所述第二主成分是所述多个主成分中特征值的大小排名第三的主成分。也即也即基于三个主成分确定置信区间。具体的,可以以第一主成分、第二主成分和第三主成分为为笛卡尔坐标系的坐标轴,绘制第一主成分的数据、第二主成分的数据和第三主成分的三维散点分布图;在所述三维散点分布图中,以原点为中心绘制所述预设置信度下的置信椭球,其中,所述置信椭圆的三个半轴长度的确定方法与上文确定置信椭圆的长轴和短轴的方法类似,此处不做重复描述;然后基于所述三维散点分布图中位于所述置信椭球外的点,确定异常环境下的第一主成分的数据、第二主成分的数据和第三主成分的数据。不难想象,在步骤106中,所述“至少一个主成分”中包含的主成分的数量越多,步骤108中确定出的置信区间合理,使得预测出的异常环境下的指标数据越可靠。当然,所述“至少一个主成分”的数量越多,确定出置信区间的过程也更复杂。在实际应用中可以对这两方面做出平衡,确定出合适的所述“至少一个主成分”中包含的主成分的数量。步骤108、对所述异常环境下的所述至少一个主成分的数据,依次进行所述主成分分析的逆操作和所述预处理的逆操作,生成所述多个指标在所述异常环境下的预测数据。可以理解,主成分的数据并非指标的数据,需要对主成分数据进行反向还原得到指标的数据。例如,先利用主成分分析时采用的矩阵变换的逆变换得到指标的目标数据,然后对指标的目标数据进行去标准化和变化值还原,得到指标的预测数据。本说明书实施例提供的异常环境下的指标数据生成方法,由于对多个指标的目标数据进行主成分分析得到的多个主成分的数据,能够反映多个指标的历史数据之间的联系,因此,利用主成分分析预测异常环境下的指标数据时,可以兼顾到不同指标之间的联系,提高预测出的多个指标数据的可靠性和合理性,应用该指标数据进行压力测试时,得到的压力测试结果也更为准确。此外,相比于传统方法,本说明书实施例提供的异常环境下的指标数据生成方法,具有理论依据,可解释性强,因此预测出的数据更可靠、更合理。研究表明,在上述实施例中,如果多个指标为8种不同期限结构的shibor利率,上文中特征值最大的第一主成分能够反映期限结构水平,特征值第二大的第二主成分能够反映期限结构斜率变化,因此,在一个例子中,可以将步骤106中,对异常环境下多个主成分的数据的模拟预测,简化成对异常环境下的第一主成分和第二主成分的数据的模拟预测。更为具体的,其中,第一主成分可以反映8种期限结构的shibor利率的上浮和下行情况,如果第一主成分是正值,则预示着8种期限结构的shibor利率上浮,反之预示着8种期限结构的shibor利率下行;第二主成分可以反映不同期限结构的shibor利率之间的斜率,如果第二主成分是正值,表明不同期限结构的shibor利率之间的差距增大,反之表明不同期限结构的shibor利率之间的差距减小。当将两种主成分的影响叠加在一起之后,就有可能预测出诸如利率倒挂的异常情况,所谓利率倒挂是指短期限的shibor利率大于长期限的shibor利率的现象。图3至图6示出了8种期限结构的shibor利率与第一主成分和第二主成分的值的变化关系,在图3至图6中,附图标记31至38分别对应表示的是隔夜、一周、两周、1个月、3个月、6个月、9个月和1年8种期限结构的shibor利率,且图3至图6分别表示的是图2中第一象限至第四象限对应的shibor利率变化情况。具体的,如图3和图6所示,当第一主成分的值大于0时,8种期限结构的shibor利率均呈上升趋势;如图4和图5所示,当第一主成分的值小于0时,8种期限结构的shibor利率均呈下降趋势;图3和图4所示,第二主成分的值大于0时,不同期限结构的shibor利率之间的差距增大;图5和图6所示,第二主成分的值小于0时,不同期限结构的shibor利率之间的差距减小。且从图6中可以看出,当第一主成分的值大于0时,8种期限结构的shibor利率整体上升,当第二主成分的值小于0时,不同期限结构的shibor利率之间的差距减小,并且出现了利率倒挂的极端情况。从图3中可以看出,当第一主成分的值小于0时,8种期限结构的shibor利率整体下降,当第二主成分的值大于0时,不同期限结构的shibor利率之间的差距增大,也出现了利率倒挂的极端情况。这符合历史上出现的货币市场流动性突变的极端情况,因此,本说明书提供的方法预测出的指标数据更为合理,更为可靠。可选地,在另一实施例中,在图2所示的例子的基础上,如图7所示,在上述步骤108之前,本说明书实施例提供的异常环境下的指标数据生成方法,还可以包括:步骤110、确定所述数据点所在的象限中的点对应的其余主成分的数据,所述其余主成分是所述多个主成分中除所述第一主成分和所述第二主成分外的主成分。例如,假设步骤104中确定出的多个主成分除了包括第一主成分和第二主成分,还包括第三主成分和第四主成分,则在步骤110中需要确定出图2所示的四个象限中的点对应的第三主成分和第四主成分的数据。步骤112、基于所述其余主成分的数据的标准差,确定所述其余主成分的数据的正态分布图。在此步骤中,将步骤110中确定出的四个象限中的点对应的第三主成分和第四主成分的数据,分别按对应的象限的不同:先计算第三主成分的数据的标准差,以及计算第四主成分的数据的标准差;然后,基于第三主成分的数据的标准差,绘制第三主成分的数据的正态分布图,基于第四主成分的数据的标准差,绘制第四主成分的数据的正态分布图。最终得到不同象限中,第三主成分的数据的正态分布图,和第四主成分的数据的正态分布图。步骤114、基于所述正态分布图,确定异常环境下所述其余主成分的数据。正态分布图可以反映随机样本的分布规律,如图8所示,正态分布曲线是一条中间高,两端逐渐下降且完全对称的钟形曲线,一般而言,越是远离钟形曲线的中心的样本出现的概率越小,且通常是一些异常环境下的样本。因此,可以将其余主成分的正态分布图中远离钟形曲线中心的数据确定为异常环境下的数据,例如,将图8中附图标记81或82所指的位置的数据,确定为异常环境下的数据。如图7所示,此时步骤108可以包括:对所述异常环境下,所述第一主成分的数据、所述第二主成分的数据以及所述其余主成分的数据,依次进行所述主成分分析的逆操作和所述预处理的逆操作,生成所述多个指标在所述异常环境下的预测数据。具体可以在对所述异常环境下,所述第一主成分的数据、所述第二主成分的数据以及所述其余主成分的数据进行合并之后,再依次进行所述主成分分析的逆操作和所述预处理的逆操作,生成所述多个指标在所述异常环境下的预测数据。例如,假设在步骤106中确定出的异常环境下的数据点为,图2所示的二维散点图中的第一象限中的质心11,且假设质心11的坐标为(1,2);在步骤114中确定出异常环境下的其余主成分的值为(0.1,0.2,0.3,0.4,0.5,0.6);可以合并得到这样一组(1,2,0.1,0.2,0.3,0.4,0.5,0.6)数据,然后对(1,2,0.1,0.2,0.3,0.4,0.5,0.6)执行主成分分析的逆操作和预处理的逆操作,生成多个指标在异常环境下的预测数据。对于图2中所示的其他象限中的质心,可以采用类似的方法进行处理,此处不再重复描述。不难理解,图7所示的实施例提供的异常环境下的指标数据确定方法,除了异常环境下的第一主成分的数据和第二主成分的数据外,还将其余主成分的数据合并在一起,逆向预测出多个指标的数据,因此,可以进一步提预测出的多个指标数据的可靠性和合理性。以上是对本说明书提供一种异常环境下的指标数据生成方法的说明,下面对本说明书提供的电子设备进行介绍。图9是本说明书的一个实施例提供的电子设备的结构示意图。请参考图9,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(random-accessmemory,ram),也可能还包括非易失性存储器(non-volatilememory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是isa(industrystandardarchitecture,工业标准体系结构)总线、pci(peripheralcomponentinterconnect,外设部件互连标准)总线或eisa(extendedindustrystandardarchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成异常环境下的指标数据生成装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:对多个指标的历史数据分别进行预处理,获得所述多个指标的目标数据,所述目标数据为不同时刻的历史数据之间的变化值的标准化数据;对所述多个指标的目标数据进行主成分分析,获得多个主成分的数据;基于至少一个主成分的数据的分布以及预设置信度,确定异常环境下所述至少一个主成分的数据,所述预设置信度是所述多个主成分的数据属于正常环境下数据的可信水平;对所述异常环境下的所述至少一个主成分的数据,依次进行所述主成分分析的逆操作和所述预处理的逆操作,生成所述多个指标在所述异常环境下的预测数据。上述如本说明书图1所示实施例揭示的异常环境下的指标数据生成方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。该电子设备还可执行图1的异常环境下的指标数据生成方法,本说明书在此不再赘述。当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:对多个指标的历史数据分别进行预处理,获得所述多个指标的目标数据,所述目标数据为不同时刻的历史数据之间的变化值的标准化数据;对所述多个指标的目标数据进行主成分分析,获得多个主成分的数据;基于至少一个主成分的数据的分布以及预设置信度,确定异常环境下所述至少一个主成分的数据,所述预设置信度是所述多个主成分的数据属于正常环境下数据的可信水平;对所述异常环境下的所述至少一个主成分的数据,依次进行所述主成分分析的逆操作和所述预处理的逆操作,生成所述多个指标在所述异常环境下的预测数据。下面对本说明书提供的一种异常环境下的指标数据生成装置进行说明。图10是本说明书提供的异常环境下的指标数据生成装置1000的结构示意图。请参考图10,在一种软件实施方式中,异常环境下的指标数据生成装置1000可包括:预处理模块1001、主成分分析模块1002、第一确定模块1003和生成模块1004。预处理模块1001,用于对多个指标的历史数据分别进行预处理,获得所述多个指标的目标数据,所述目标数据为不同时刻的历史数据之间的变化值的标准化数据。可选地,预处理模块1001,具体可以用于对所述多个指标的历史数据,分别以预设时间间隔为步长计算产生时间在后的数据相对于产生时间在前的数据的变化值,得到所述多个指标的变化值数据。对所述多个指标的变化值数据分别进行标准化处理,得到所述多个指标的目标数据主成分分析模块1002,用于对所述多个指标的目标数据进行主成分分析,获得多个主成分的数据。第一确定模块1003,用于基于至少一个主成分的数据的分布以及预设置信度,确定异常环境下所述至少一个主成分的数据,所述预设置信度是所述多个主成分的数据属于正常环境下的数据的可信水平。可选地,第一确定模块1003,具体可以用于基于所述至少一个主成分的特征值、所述至少一个主成分的数据的自由度和所述预设置信度,确定所述预设置信度下的置信区间;基于落在所述置信区间外的所述至少一个主成分的数据,确定异常环境下所述至少一个主成分的数据。可选地,在一种实施例方式中,上述至少一个主成分包括第一主成分和第二主成分,所述第一主成分是所述多个主成分中特征值最大的主成分,所述第二主成分是所述多个主成分中特征值的大小排名第二的主成分。且第一确定模块1003可以用于:绘制所述第一主成分的数据和所述第二主成分的数据的二维散点分布图,所述二维散点分布图以所述第一主成分和第二主成分为笛卡尔坐标系的坐标轴;基于所述第一主成分的特征值、所述第一主成分的数据的自由度和所述预设置信度,确定置信椭圆的长轴,并基于所述第二主成分的特征值、所述第二主成分的数据的自由度和所述预设置信度,确定所述置信椭圆的短轴,其中,所述置信椭圆用于表征所述置信区间;基于所述长轴和所述短轴,在所述二维散点分布图中,以原点为中心绘制所述置信椭圆。以及第一确定模块1003可以用于:基于所述二维散点分布图中位于所述置信椭圆外的点,确定异常环境下的所述第一主成分的数据和所述第二主成分的数据。更为具体的,第一确定模块1003可以用于:从所述二维散点分布图的任一象限中位于所述置信椭圆外的点中选择一点,作为所述异常环境下的数据点;基于所述数据点在所述笛卡尔坐标系中的坐标值,确定所述异常环境下所述第一主成分的数据和所述第二主成分的数据。或者,第一确定模块1003可以用于:将所述二维散点分布图的任一象限中位于所述置信椭圆外的点的质心,作为所述异常环境下的数据点;基于所述数据点在所述笛卡尔坐标系中的坐标值,确定所述异常环境下所述第一主成分的数据和所述第二主成分的数据。生成模块1004,用于对所述异常环境下的所述至少一个主成分的数据,依次进行所述主成分分析的逆操作和所述预处理的逆操作,生成所述多个指标在所述异常环境下的预测数据。本实施例提供的一种异常环境下的指标数据生成装置1000,由于对多个指标的目标数据进行主成分分析得到的多个主成分的数据,能够反映多个指标的历史数据之间的联系,因此,利用主成分分析预测异常环境下的指标数据时,可以兼顾到不同指标之间的联系,提高预测出的多个指标数据的可靠性和合理性,应用该指标数据进行压力测试时,得到的压力测试结果也更为准确。图11实施本说明书的另一个实施例提供的异常环境下的指标数据生成装置1000的结构示意图,如图11所示,异常环境下的指标数据生成装置1000除了包括:预处理模块1001、主成分分析模块1002、第一确定模块1003和生成模块1004,还可以包括:第二确定模块1005、第三确定模块1006和第四确定模块1007。第二确定模块1005,用于在触发生成模块1004之前,确定所述数据点所在的象限中的点对应的其余主成分的数据,所述其余主成分是所述多个主成分中除所述第一主成分和所述第二主成分外的主成分。第三确定模块1006,用于基于所述其余主成分的数据的标准差,确定所述其余主成分的数据的正态分布图。第四确定模块1007,用于基于所述正态分布图,确定异常环境下所述其余主成分的数据,并触发生成模块1004。且,此时生成模块1004具体用于:对所述异常环境下,所述第一主成分的数据、所述第二主成分的数据以及所述其余主成分的数据,依次进行所述主成分分析的逆操作和所述预处理的逆操作,生成所述多个指标在所述异常环境下的预测数据。图11所示的实施例提供的异常环境下的指标数据确定装置1000,除了异常环境下的第一主成分的数据和第二主成分的数据外,还将其余主成分的数据合并在一起,逆向预测出多个指标的数据,因此,可以进一步提预测出的多个指标数据的可靠性和合理性。需要说明的是,异常环境下的指标数据生成装置1000能够实现图1的方法实施例的方法,具体可参考图1所示实施例的异常环境下的指标数据生成方法,不再赘述。总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制时,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1