购物系统的在线可靠性预测和提高方法_2

文档序号：9217632阅读：来源：国知局

以选择吞吐量等；其次，根据选择的变量来配置系统的日志文件。本发明针对具有响应时间要求的系统选择变量响应时间，配置l〇g4j来获得系统的运行日志。因为使用的是基于端口的可靠性预测模型，所以从日志中收集系统所有端口的失效数据。比如order端口，有三个输入变量（userid,isPayed，totalPrice)和两个输出变量（detailorder,response time)。通过监控javaServlet中响应时间的值和发送到日志的运行时间值，收集到变量响应时间数据如下表所示：
[0048] (2)失效数据预测：根据得到的数据序列，建立ARIMA模型ARIMA(p,d,q)，其中p 为自回归项，q为移动平均项数，d为时间序列成为平稳时所做的差分次数。首先根据得到的数据序列，判断其平稳性，对于不稳定的序列需先进行有限次差分得到一个平稳序列 {Xt}。继续以端口order为例，从表1数据可知，数据序列呈增长趋势，故为不稳定序列。对其进行平稳化处理，首先对此数列对数化，令Yt=lnXt。Yt的结果如下表所示。
[0050] 接着，使用统计软件Eviews来分析Yt的稳定性。使用Eviews得到序列Yt的单位根与ADF值。对ADF进行第一次差分处理后可知，ADF与第一次差分后结果均大于10%，故 Yt仍然是不稳定的。然后，再对Yt进行第二次差分处理并检验其单位根，二次差分后所得的ADF值为-4. 866626,小于1%临界值。因此Yt二次差分后为稳定的序列，即d= 2。令 Zt=D(Yt，2)代表Yt二次差分后的值，其依旧为稳定的序列。
[0051] 其次进行参数确定，对于模型ARIMA(p，q)，其一般的数学公式为：Xt=巾A#… + <1%11)+￡1+01^_1+~+0 (1￡1_(1，其中{￡1}为白噪声序列，因此需要根据平稳序列{&}确定p，q, 0^0^。对于p，q的确定需要根据平稳序列的自相关系数、偏自相关系数以及经验确定几组（P，q)的值，然后对每组进行极大似然估计确定系数4^-4%，0 0 q，最终从中选取最佳的一组（P，q)以及相应的系数0i_0q(可根据AkaikeInformation Criterion(AIC)值来进行判定，AIC值越小，对应的（p，q)最优）。模型确定之后，就可以依次预测未来个时刻的变量值，并根据预期值判断是否是失效数据。如order端口，此时模型ARIMA(p，2，q)由上一步所得的序列Zt来分析。由Zt所得的自相关和偏相关结果，利用 AIC进行模型优化，计算不同的AIC值得到不同的p，q值，最后当取（p，q) = (6,8)时，AIC 取得最小值-5. 354639。因此，得到模型ARIMA(6, 8)。为了验证所得模型ARIMA(6, 8)是否为所需最终结果，对模型ARIMA(6, 8)剩余序列进行分析，看是否满足白噪声序列。因为使用Eviews进行分析，故只需检验自相关和偏相关系数是否在置信区间内。置信区间为可靠性估计的一个度量，由前面所得的自相关和偏相关系数值可知，其均在置信区间内。因此，最终确定模型为ARIMA(6, 2, 8)。
[0052] (3)系统可靠性预测：本发明所使用的可靠性计算模型是基于端口的服务组合可靠性计算模型。假设端口P有操作Pl-P2，则在时间T端口p的可靠性定义为：
，其中叫表不端口p在一段时间间隔[0,T]内被访问的次数，预测过程中一个失效数据表示一次错误，4表示预测过程中错误的次数；系统的可靠性定义为
，其中f(tr)表示轨迹的发生频率， r(tri)表示轨迹tri的可靠性，定义为轨迹上的端口可靠性的乘积：两个顺序关系的端口Ppp2的可靠性定义r(p1;p2) =Hpjrh)，两个选择关系的端口的可靠性定义为 /;:) = /如+1，b是一个布尔条件，如果b真，贝1」选择端口Pi执行，x(b) =1，否则选择P2执行，x (b) = 0 ;对于循环的端口p，可靠性定义为
（b 是一个布尔条件，pji)表示在第i次退出循环的概率，
1或者r(n*p) =r(p)n(n 是一个正整数，表示端口p循环n次）。仍以端口order为例，首先预测序列Zt，然后将结果返回到序列Yt，最后令不预测出Xt。用此模型来预测接下来3分钟的响应时间，预测结果分别为：7072. 03、7816. 5U8518. 68。显然端口order只有在第23分钟响应时间大于 8s;其次，假设order端口共经过了 468次。因此，可以得到端口order的可靠性为1-1/468 =0.9978。
[0053] 同理可以预测其余各端口在第23分钟的可靠性，见下表。
[0054]
[0055] 同时，可得到概率pb4(l) = 0.965,pb4(2) = 0.024(被盗的信用卡，信用不足等），pb4(3) = 0? 011 (错别字等），标记频率：f(trl) = 56，f(tr2) = 53，f(tr3) = 78，f(tr4) =58,f(tr5) =85,f(tr6) =62,f(tr7) =49,f(tr8) =65,f(tr9) =57,f(trl0) =94,f(trll) = 56,f(trl2) = 76,f(trl3) = 51。因此，预测的整个系统的可靠性为：
[0057] 因此系统的可靠性低于预期值，为此，需要找出导致此问题的故障组件。
[0058] (4)故障组件定位：当预测的可靠性低于系统的预期值时，则需要寻找最可能导致系统可靠性降低的一个（组）组件。首先，根据一组测试结果，构建频谱矩阵（A，e)，其中 A= (aj，ay表示第i次测试通过组件j的概率，e=(eJ取值为0或1 (0表示第i 次试验失败，1表示第i次试验成功）；第二，根据频谱矩阵生成诊断候选集集合D，利用最小命中集算法STACCATO得出候选集D。算法分为三步：（1)初始化阶段使用相关系数对组件进行排行，（2)将所有失败的集合中包含的组件加入候选集D中，（3)当|D|〈L时，对排行中首先超过A的组件做以下处理：移除组件j，保留（A，e)中所有ei= 1Aaij>0的Ai#，对新的（A，e)运行STACCATO算法，将返回的组件加入D并验证它是否为最小命中集。
[0059] 组件j的相似系数计算公式为：
[0060]
，nn(j) = |{ila。〉0~e!= 1} |， n01(j) = |U|aij= 0 八ei= 1}|，n10(j) = |{ila。》0 八ei= 0} | 〇第三，计算每个候选集的后验概率Pr(dk|obs)，其中obs= (A，e)。
[0061]
，由于每次测试独立，故
，而
，这里eik定义为
，其中4表示组件 j出错的概率。通过极大似然估计法得到h的估计值。将候选集按后验概率从高到低进行排序，最前面的候选集为最有可能出错的组件集合，即为需要进行重新配置的组件集。具体计算如下：
[0062] 从数据库的文件信息中得到系统运行时所经过的组件信息以及运行情况，以60 秒为窗口大小，更新频谱矩阵，如下所示：
[0064] 各组件相关系数计算如下所示：

[0066] 因此，由相关系数大小排序得<Cn，C12,C21，C22,Ces，C3,Cds>。由最小命中集算法 STACCATO返回的候选集为{{Cn}，{C12，C21}，{C12，C22}}。
[0067] 计算每个候选集的概率值，从而确定出问题组件。对于候选集{Cn}可知：
[0069] 故Pr(〇bs| {Cn}) =h/Q-hi)3,对h求其最大似然估计值得h:= 0? 7,此时Pr(e| {Cn}) = 2. 224*1〇-3。同理，对于候选集{C12,C21}知：
[0071] Pr(obs| {C12,C21}) =WQ-hD(l_h2) (l-h^)，对hph2求最大似然估计值为h! =0? 6417,h2= 0? 8528,故Pr(obs| {C12,C21}) = 2. 07*10'
[0072] 对于候选集{C12,C22}:
[0073]
[0075] Pr(obs| {C12, C22}) = h^hfa-hi) (l_h24) (l-hA4)，对!^，h2求最大似然估计值为 4= 0? 6417, h2= 0? 9610,故 Pr(obs| {C12, C22}) = 2. 07*1(T3。
[0076] 利用公式可知 Pr (屯 | obs) = 1. 86*10 9，Pr (d21 obs) = 1. 92*10 1Q，Pr (d31 obs)= 1.92*10_1(1。所以候选集排行为{{Cn}，{C

完整全部详细技术资料下载

当前第2页1 2 3