一种面向数据标注云服务器的负载预测方法与流程

文档序号:25042811发布日期:2021-05-14 11:15阅读:113来源:国知局
一种面向数据标注云服务器的负载预测方法与流程

1.本发明涉及云计算领域,尤其是涉及一种面向数据标注云服务器的负载预测方法。


背景技术:

2.人工智能技术正在飞速地发展。随着人工智能技术的不断进步,它已经深入到了人们生活的方方面面,例如:智能导航,指纹识别,刷脸支付,个性化视频推荐等。标注的数据是人工智能技术的基础。只有拥有海量的经过了标注的数据才能提升人工智能技术的实用性。目前,技术人员可以利用爬虫技术较容易地采集到海量的数据,然而对海量的数据进行标注却是一项耗时费力的任务。为了有效地对海量数据进行标注,技术人员往往需要建立云计算系统来实现海量数据的存储、标注任务的分配等。在面向数据标注的云计算系统中,技术人员需要快速准确地把握众多的数据标注云服务器的负载,根据数据标注云服务器的负载来实现标注任务的分配,实现每台数据标注云服务器的负载相对均衡,提高数据标注云服务器的资源利用率,从而避免有的数据标注云服务器处于较空闲状态,而有的数据标注云服务器处于较高负载状态。
3.为了高效地把握众多的数据标注云服务器的负载,技术人员常常利用机器学习方法来预测数据标注云服务器在将来某个时间点的负载。支持向量机是一种预测数据标注云服务器负载的常用方法。然而,技术人员在利用支持向量机预测数据标注云服务器的负载时,往往较难设置支持向量机的三个训练参数:惩罚参数c、核函数参数g和不敏感损失参数ε,并且这三个训练参数的设置会在很大程度上影响数据标注云服务器的负载预测精度。为此,技术人员采用模拟自然界演化规律的演化算法来优化设计支持向量机的这三个训练参数。蝙蝠仿生算法是一种模拟蝙蝠回声定位的演化算法,它在优化设计支持向量机的训练参数中取得了一定的效果。然而,传统蝙蝠仿生算法应用于数据标注云服务器的负载预测时容易出现陷入局部最优的缺点。


技术实现要素:

4.本发明的目的在于提出一种面向数据标注云服务器的负载预测方法,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
5.本发明提供一种面向数据标注云服务器的负载预测方法。它在一定程度上克服了传统蝙蝠仿生算法应用于数据标注云服务器的负载预测时容易出现陷入局部最优的缺点,本发明能够提高数据标注云服务器的负载预测精度。
6.为了实现上述目的,根据本发明的一方面,提供一种面向数据标注云服务器的负载预测方法,所述方法包括以下步骤:
7.步骤1,采集数据标注云服务器的历史负载数据;
8.步骤2,对采集到的历史负载数据进行预处理得到样本数据集;
9.步骤3,将样本数据集划分为训练数据集和测试数据集;
10.步骤4,用户输入种群大小bsize,最大频率maf,最小频率mif,最大搜索代数bmt,支持向量机的待优化训练参数的数量pn;
11.步骤5,设置当前搜索代数t=0;
12.步骤6,按公式(1)随机生成bsize个个体组成种群:
[0013][0014]
其中下标bi=1,2,...,bsize;下标bu=1,2,...,pn;rand表示随机实数产生函数;al
bu
表示支持向量机的第bu个待优化训练参数的下界;au
bu
表示支持向量机的第bu个待优化训练参数的上界;表示种群中第bi个个体的当前速度;表示种群中第bi个个体的当前速度的第bu维度;表示种群中第bi个个体的当前位置,它存储了支持向量机的pn个训练参数值;表示种群中第bi个个体的当前位置所存储的支持向量机的第bu个训练参数值;
[0015]
步骤7,计算种群中每个个体的适应值,对于种群中第bi个个体,其适应值的计算过程为:首先从种群中第bi个个体的当前位置中提取出支持向量机的pn个训练参数值,利用得到的支持向量机的pn个训练参数值在训练数据集上训练得到基于支持向量机的数据标注云服务器的负载预测模型lmp
bi
,然后计算数据标注云服务器的负载预测模型lmp
bi
在测试数据集的均方误差lpe
bi
,再将种群中第bi个个体的适应值设置为lpe
bi
;其中下标bi=1,2,...,bsize;
[0016]
步骤8,从种群中找出适应值最小的个体,并将适应值最小个体的当前位置保存到最优位置bestma;
[0017]
步骤9,设置种群中每个个体的优良位置然后设置种群中每个个体的引导位置ldma
bi
=hisma
bi

[0018]
步骤10,设置种群中每个个体的引导权重ldw
bi


1;
[0019]
步骤11,如果引导权重ldw
bi
大于0,则转到步骤12,否则转到步骤14;
[0020]
步骤12,设置探测权重crw
bi
=ldw
bi

[0021]
步骤13,转到步骤15;
[0022]
步骤14,按公式(2)计算探测权重crw
bi

[0023]
crw
bi
=adw
bi
×
0.8+rand(0,1)
×
0.2
[0024]
adw
bi
=1.0

exp(

daf
bi
)
ꢀꢀꢀ
(2)
[0025]
daf
bi
=abs(lpe
bi

lpbest)
[0026]
其中,exp表示以自然常数e为底的指数函数;abs为取绝对值函数;lpbest为最优位置bestma的适应值;adw
bi
为适应性探测系数;daf
bi
为适应值距离;
[0027]
步骤15,按公式(3)计算探测位置dcma
bi

[0028]
dcma
bi
=crw
bi
×
hisma
bi
+(1.0

crw
bi
)
×
bestma
ꢀꢀꢀ
(3)
[0029]
步骤16,如果探测位置dcma
bi
的适应值小于引导位置ldma
bi
的适应值,则转到步骤
17;否则设置引导权重ldw
bi


1,然后转到步骤18;
[0030]
步骤17,设置引导位置ldma
bi
=dcma
bi
,然后设置引导权重ldw
bi
=crw
bi

[0031]
步骤18,根据公式(4)计算种群中每个个体的新一代速度和新一代位置:
[0032][0033]
其中,rnw为[0,1]之间的随机实数;cwf为当前频率;为种群中第bi个个体的新一代速度;为种群中第bi个个体的新一代位置;
[0034]
步骤19,计算种群中每个个体的新一代位置的适应值;其中,计算适应值的方法与步骤7相同;
[0035]
步骤20,如果新一代位置的适应值小于优良位置hisma
bi
的适应值,则设置否则保持hisma
bi
不变;
[0036]
步骤21,如果优良位置hisma
bi
的适应值小于引导位置ldma
bi
的适应值,则设置ldma
bi
=hisma
bi
,否则保持ldma
bi
不变;
[0037]
步骤22,如果新一代位置的适应值小于最优位置bestma的适应值,则设置否则保持bestma不变;
[0038]
步骤23,设置当前搜索代数t=t+1;
[0039]
步骤24,如果当前搜索代数t小于最大搜索代数bmt,则转到步骤11,否则转到步骤25;
[0040]
步骤25,从最优位置bestma中提取出支持向量机的pn个训练参数值,利用得到的支持向量机的pn个训练参数值在训练数据集上训练得到基于支持向量机的数据标注云服务器的负载预测模型,即实现数据标注云服务器的负载预测。
[0041]
本发明的有益效果为:本发明提供一种面向数据标注云服务器的负载预测方法,针对传统蝙蝠仿生算法存在的缺点,本发明应用改进的蝙蝠仿生算法来优化支持向量机的训练参数,并利用优化得到的支持向量机来构建数据标注云服务器的负载预测模型。在改进的蝙蝠仿生算法中,根据适应值距离来获得个体优良位置的权重,并利用获得的权重将个体优良位置与最优位置进行融合生成引导个体,然后利用引导个体来指导种群中个体的搜索方向。在提出方法中,个体当前位置的适应值与最优位置的适应值的距离越大,则个体优良位置在生成引导个体时的权重就越大,这样避免了种群中的所有个体都是直接朝着最优位置的方向来执行搜索操作,增强了种群的多样性,能够提高数据标注云服务器的负载预测精度。
附图说明
[0042]
图1为本发明的一个实施例的一次探测权重图。
具体实施方式
[0043]
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0044]
如图1所示为本发明的一个实施例的一次探测权重图,下面结合图1来阐述根据本发明的实施方式的一种面向数据标注云服务器的负载预测方法。
[0045]
本发明提出一种面向数据标注云服务器的负载预测方法,具体包括以下步骤:
[0046]
步骤1,采集数据标注云服务器的历史负载数据;所述数据标注为对给定的数据根据其特性打上相应的标签;所述数据标注云服务器为用于执行数据标注任务的云计算机系统;所述历史负载数据包括但不限于每隔1分钟采集一次数据标注云服务器的网络流量数据,连续采集1000次;
[0047]
步骤2,对采集到的历史负载数据进行预处理得到样本数据集;其中,所述预处理包括但不限于缺失值补全、删除异常数据、数据标准化;
[0048]
步骤3,将样本数据集中前80%的数据设置为训练数据集,并样本数据集中剩余20%的数据设置为测试数据集;
[0049]
步骤4,用户输入种群大小bsize=30,最大频率maf=2.5,最小频率mif=0.5,最大搜索代数bmt=200,支持向量机的待优化训练参数的数量pn=3;
[0050]
步骤5,设置当前搜索代数t=0;
[0051]
步骤6,按公式(1)随机生成bsize个个体组成种群:
[0052][0053]
其中下标bi=1,2,...,bsize;下标bu=1,2,...,pn;rand(0,1)表示在0到1之间的随机实数产生函数;al
bu
表示支持向量机的第bu个待优化训练参数的下界;au
bu
表示支持向量机的第bu个待优化训练参数的上界;表示种群中第bi个个体的当前速度;表示种群中第bi个个体的当前速度的第bu维度;表示种群中第bi个个体的当前位置,它存储了支持向量机的3个训练参数值:惩罚参数c、核函数参数g和不敏感损失参数ε;表示种群中第bi个个体的当前位置所存储的支持向量机的第bu个训练参数值;
[0054]
步骤7,计算种群中每个个体的适应值,对于种群中第bi个个体,其适应值的计算过程为:首先从种群中第bi个个体的当前位置中提取出支持向量机的pn个训练参数值,利用得到的支持向量机的pn个训练参数值在训练数据集上训练得到基于支持向量机的数据标注云服务器的负载预测模型lmp
bi
,然后计算数据标注云服务器的负载预测模型lmp
bi
在测试数据集的均方误差lpe
bi
,再将种群中第bi个个体的适应值设置为lpe
bi
;其中下标bi=1,2,...,bsize;所述基于支持向量机的数据标注云服务器的负载预测模型lmp
bi
的输入变量为当前时刻在前10分钟每隔1分采集的网络流量,所述基于支持向量机的数据标注云服务器的负载预测模型lmp
bi
的输出变量为当前时刻在2分钟后的网络流量;
[0055]
步骤8,从种群中找出适应值最小的个体,并将适应值最小个体的当前位置保存到
最优位置bestma;
[0056]
步骤9,设置种群中每个个体的优良位置然后设置种群中每个个体的引导位置ldma
bi
=hisma
bi

[0057]
步骤10,设置种群中每个个体的引导权重ldw
bi


1;
[0058]
步骤11,如果引导权重ldw
bi
大于0,则转到步骤12,否则转到步骤14;
[0059]
步骤12,设置探测权重crw
bi
=ldw
bi

[0060]
步骤13,转到步骤15;
[0061]
步骤14,按公式(2)计算探测权重crw
bi

[0062]
crw
bi
=adw
bi
×
0.8+rand(0,1)
×
0.2
[0063]
adw
bi
=1.0

exp(

daf
bi
)
ꢀꢀꢀ
(2)
[0064]
daf
bi
=abs(lpe
bi

lpbest)
[0065]
其中,exp表示以自然常数e为底的指数函数;abs为取绝对值函数;lpbest为最优位置bestma的适应值;adw
bi
为适应性探测系数;daf
bi
为适应值距离;所述探测权重crw
bi
的一次计算值如图1所示;
[0066]
步骤15,按公式(3)计算探测位置dcma
bi

[0067]
dcma
bi
=crw
bi
×
hisma
bi
+(1.0

crw
bi
)
×
bestma
ꢀꢀꢀ
(3)
[0068]
步骤16,如果探测位置dcma
bi
的适应值小于引导位置ldma
bi
的适应值,则转到步骤17;否则设置引导权重ldw
bi


1,然后转到步骤18;
[0069]
步骤17,设置引导位置ldma
bi
=dcma
bi
,然后设置引导权重ldw
bi
=crw
bi

[0070]
步骤18,根据公式(4)计算种群中每个个体的新一代速度和新一代位置:
[0071][0072]
其中,rnw为[0,1]之间的随机实数;cwf为当前频率;
[0073]
步骤19,计算种群中每个个体的新一代位置的适应值;其中,计算适应值的方法与步骤7相同;
[0074]
步骤20,如果新一代位置的适应值小于优良位置hisma
bi
的适应值,则设置否则保持hisma
bi
不变;
[0075]
步骤21,如果优良位置hisma
bi
的适应值小于引导位置ldma
bi
的适应值,则设置ldma
bi
=hisma
bi
,否则保持ldma
bi
不变;
[0076]
步骤22,如果新一代位置的适应值小于最优位置bestma的适应值,则设置否则保持bestma不变;
[0077]
步骤23,设置当前搜索代数t=t+1;
[0078]
步骤24,如果当前搜索代数t小于最大搜索代数bmt,则转到步骤11,否则转到步骤25;
[0079]
步骤25,从最优位置bestma中提取出支持向量机的pn个训练参数值,利用得到的
支持向量机的pn个训练参数值在训练数据集上训练得到基于支持向量机的数据标注云服务器的负载预测模型,通过基于支持向量机的数据标注云服务器的负载预测模型对数据标注云服务器的负载进行预测,即实现数据标注云服务器的负载预测。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1