一种基于改进多目标粒子群优化算法的待增组件选择方法_2

文档序号:9217039阅读:来源:国知局
征的应用用户并发量预测方法:通过分析历史 应用用户并发量,根据其数据分布趋势,利用自相关系数分析方法将并发量分为平稳型和 非平稳型;针对不同的特征利用不同的时间序列预测方法,预测应用用户并发量;该方法 不但提高了预测的效率,而且提升了预测方法的灵活度,可以达到较高的预测准确度。
[0053] (2)本发明利用组件调用关系和组件调用频率分解应用用户并发量,计算各组件 并发量,综合考虑组件并发量和组件响应时间两种可以直观反映组件工作性能的因素,并 以此作为选择待增组件的依据,提高了组件选择方法的准确性;
[0054] (3)针对传统粒子群优化算法约束条件精度低的问题,本发明根据半可行域,提出 了基于选择算子的约束条件处理算法,可以有效的提高约束条件的精度。
【附图说明】
[0055]图1为本发明一种实施例的基于改进多目标粒子群优化算法的待增组件选择方 法流程图;
[0056] 图2为本发明一种实施例的组件调用关系示意图;
[0057] 图3为本发明一种实施例的平稳型应用用户并发量示意图;
[0058]图4为本发明一种实施例的当云服务系统处于平稳型时,应用并发量自相关系数 分布示意图;
[0059] 图5为本发明一种实施例的当云服务系统处于非平稳型时,应用并发量自相关系 数分布示意图;
[0060] 图6为本发明一种实施例的当云服务系统处于季节型时,应用并发量自相关系数 分布示意图;
[0061] 图7为本发明一种实施例的组件副本服务调用关系示意图。
【具体实施方式】
[0062] 下面结合附图对本发明一种实施例做进一步说明。
[0063] 本发明实施例中,基于改进多目标粒子群优化算法的待增组件选择方法,方法流 程图如图1所示,包括以下步骤:
[0064] 步骤1、采集目标云服务平台中所有组件的历史数据,包括:组件调用关系、组件 调用频率和采样时间段的用户并发量;
[0065] 本发明实施例中,以景点语音导航云服务系统为例,以表1为例,服务系统包含8 个组件,分别是Si-Sy
[0066] 表1组件调用关系表
[0067]
[0068] 通过分析表1可知,本发明实施例中共有8个组件,将组件调用关系抽象为调用关 系图,如图2所不;
[0069] 组件调用频率是指在一定时间内,一个组件及其副本被其他组件及其副本调用的 次数,比如Is内,组件服务Si被其他所有组件调用的次数,为组件Si的调用频率;当组件Si 有叫个副本,S」有n」个副本时,组件S」被S3周用的频率则可以通过计算所有副本之间调 用的频率之和得到;
[0071] 其中,/#为组件服务Si的第ki个组件服务副本调用组件服务S」的第k2个组件 服务副本的调用频率,而为组件服务Si调用\的总调用频率;
[0072] 在本实施例中,采样时间段的用户并发量在不同的场景下有不同的数值,例如在 具有平稳型特征的应用用户并发量场景下,用户并发量在290~330间波动,相对比较平 稳;如图3所不:
[0073] 步骤2、根据所采集的组件调用关系和组件调用频率,获得每个组件相对于其它组 件的权值,进而获得组件关系;所述的组件关系为组件调用关系矩阵,矩阵的行数和列数为 组件的个数,矩阵中的元素为组件两两之间的调用权重;
[0074] 本发明实施例中,利用组件调用关系和组件调用频率,计算每个组件相对其他所 有组件的权值eu,表示组件Si调用\的比重,计算公式如下:
[0076] 其中,匕」为组件S」被组件Si调用的频率,n表示组件的个数,n=8 ;
[0077] 建立组件调用关系模型,即组件调用关系矩阵E:
[0079] -个组件到所有其他组件的边的调用频率之和为1 ;
[0080] 获得其组件调用关系矩阵e_vot:
[0082] 步骤3、根据采集的采样时间段的用户并发量,获得不同采样时间段用户并发量的 自相关系数;
[0083] 本发明实施例中,设conpcon2, . . .,cont,. . .,conn是过去n个时期应用户并发 量;这n个并发量观测值为一个时间序列,组成(n-1)对数据:
[0084] (corij,con2), (con2,con3), . . . ,(cont,cont+1), . . . ,(con^j,conn);
[0085] 计算并发量数据对的相关系数,用^表示,具体公式如下:
[0089] 其中,^是并发量时间序列的"自相关系数",用来度量并发量时间序列上一时间 段并发量观测值与下一时间段并发量观测值之间的关系,从定量的角度来确定上一时间段 对下一时间段并发量观测值的影响程度有多大;
[0090] 因为并发量自相关系数巧表示cont与cont+1的相关程度,称为并发量时间延迟为 1的自相关系数;并发量自相关系数r2表示cont与cont+2的相关程度,称为并发量时间延 迟为2的自相关系数;那么t时期并发量观测值cont与(t+k)时期并发量观测值cont+k之 间的相关程度,称为时间延迟为k的并发量自相关系数rk,公式如下:
[0092] 所有的并发量自相关系数的绝对值小于或等于1 ;本发明实施例中,计算^个并 发量自相关系数即可,即
[0093] 步骤4、根据所获的自相关系数,判断用户并发量所属类型,即判断自相关系数是 否接近于0,若是,则用户并发量属于平稳型,并执行步骤6;否则,执行步骤5;
[0094] 本发明实施例中,采用自相关系数判定应用用户并发量时间序列的特征;云服务 系统应用用户并发量分为三种特征:平稳型,非平稳型和季节型;
[0095] (1)平稳型
[0096] 若应用用户并发量是平稳的时间序列,则第一个自相关系数^比较大,与0有显 著性的差异,而r2要比ri小,r3要比r2小,其余的自相关系数逐渐与0没有显著性差异0; 如图4所示,是当云服务系统处于平稳型时,应用并发量自相关系数分布示意图。
[0097] 步骤5、判断所获自相关系数是否以固定频率出现高峰,若是,则用户并发量属于 季节型,并执行步骤8;否则,用户并发量属于非平稳型,并执行步骤7;
[0098] ⑵非平稳型
[0099] 若应用用户并发量是非平稳的时间序列,也就是存在着趋势的影响,则自相关系 数^最大,r2,r3,……逐渐递减,但是有相当数量的自相关系数与〇有显著性的差异;图5 是当云服务系统处于非平稳型时,应用并发量自相关系数分布示意图;
[0100] (3)季节型
[0101] 若应用用户并发量是一个季节型的时间序列,则自相关系数将会以固定的频率出 现高峰;本实施例中,季节型的时间序列,周期长度是4,则自相关系数每隔4个出现一个高 峰,即r4,r8,r12等相当的大,与0有显著性差异,但是r8要比r4小,r12要比1*8小,而其他的 自相关系数都接近于零;图6是当云服务系统处于季节型时,应用并发量自相关系数分布 示意图。
[0102] 步骤6、采用TopK算法将平稳型用户并发量中幅度大的数据去除;
[0103] 本发明实施例中,基于时间序列的应用用户并发量预测是基于数据处理进行,所 以数据的可用性以及正确性与处理方法的有效性息息相关;由于景点语音导航云服务系统 历史应用用户并发量保存在数据库中,但是从数据库读到的数据存在由于数据录入、数据 转换及数据库链接等操作过程中的失误,可能会出现错误数据的问题,所以在进行正式的 数据操作之前,必须要进行数据预处理,以便对数据质量进行诊断、评估及提升;
[0104] 本发明实施例中,在云服务系统中所存放有关应用用户并发量数据是应用历史用 户并发量和监测的时刻,使用<t,con>表示,t表示监测时刻,con表示t时刻应用历史用 户并发量;数据预处理的过程就是对数据进行"数据清洗",即将"脏"数据清理掉,其中"脏" 数据表示错误的数据,错误数据是指数据项中存在着不合理数据;以应用并发用户数历史 信息的数据为例,错误数据即在一系列数据中该数据的波动较大,不符合整体的数据水平 趋势或周期趋势的数据;TopK算法就是在海量数据中找出出现频率最高的前K个数,或者 从海量数据中找出最大或最小的的前K个数,本发明实施例中采用TopK算法,基于不同的 特征模型找出并发量自相关系数中异常的自相关系数预处理历史应用用户并发量数据;
[0105] 本发明实施例中,当应用用户并发量属于平稳型时,并发量的数值一定会在一定 范围内有微小的浮动;假设收集了过去n个时刻的应用用户并发量:
[0106] 〈tpcor^〉,<t2,con2>,? ? ?,<tn,conn> ;
[0107] 需要将corvcon2, . . .,conn这一系列数据中的"脏"数据纠错,此时"脏"数据为 这一系列数据中波动较大的数据,即超出大部分数据浮动范围的数据;首先,利用TopK算 法,找出n个数据中最大的m/2个数据conal,cona2, . . .,conjP最小的m/2个数据conbl, conb2,. . .,c〇nbm;然后,去除这些波动较大的数据后求剩余的n-m个数据的平均数^丨;最后 纠正收集的应用用户并发量,将conal,cona2, . . .,(3〇11"和conbl,conb2, . . .,conbirl^纠正为 其中,m的取值为全部数据数量的10%。
[0108] 步骤7、采用差分方法将非平稳型用户并发量转换为平稳型用户并发量,再采用 TopK算法将用户并发量中幅度大的数据去除;
[0109] 本发明实施例中,当应用用户并发量属于非平稳型时,则需要进一步分析,判断该 应用用户并发量属于线性型或二次曲线型;
[0110] 如果一个非平稳型
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1