本发明属于网络流量分类,具体涉及一种基于apso-cnn的网络流量分类方法。
背景技术:
1、卷积神经网络作为一种强大的模型,已经在图像识别、图像分类、目标检测等任务中取得了显著的成果。为了提高cnn模型的性能和训练效率,许多优化算法被提出和应用。然而,它们在处理复杂的非凸优化问题时存在易陷入局部最优解、收敛速度较慢等问题。
2、粒子群优化算法(pso)模拟了鸟群或鱼群等群体在搜索空间中寻找最优解的行为。其主要特点是简单、易于实现,且不依赖问题的梯度信息,具有全局搜索能力,能够在复杂的搜索空间中找到较好的解,尤其在连续优化问题中表现出色。然而,由于pso算法对问题的解空间没有显式的建模,所以它在处理高维、非凸优化问题时也可能陷入局部最优解。
3、尽管传统的网络流量分类方法取得了一些成果,但随着网络流量数据集规模的增大和数据复杂性的增加,传统的网络流量分类方法在处理高维复杂数据或大规模数据时面临着模型参数的选择以及对大规模数据的扩展性问题,导致网络流量分类准确性不够高。
技术实现思路
1、发明目的:本发明的意图是解决高维复杂时序数据的分类和手动调整模型超参数的高人工成本的技术问题,由此,本发明提出一种基于apso-cnn的网络流量分类方法。
2、技术方案:本发明提出一种基于apso-cnn的网络流量分类方法,该方法步骤包括以下步骤:
3、(1)采集网络流量数据,利用主成分分析法将网络流量数据进行降维,以张量的形式表示,并将网络流量数据集平均分为两部分,前一部分数据集包含网络流量数据及其相应的分类标签,后一部分数据集只包含网络流量数据,无需包含对应分类标签,将前一部分数据集输入到未经过训练的cnn模型中用于训练,以得到适用于网络流量分类的最优cnn模型;
4、(2)将cnn模型的超参数进行编码和初始化,利用二进制编码作为粒子的位置,认知参数的加速度系数和社会参数的加速度系数都被初始化;将cnn模型的交叉熵函数值设置为粒子的适应度函数值,并计算出所有粒子的适应度函数值,选择适应度函数值最小的粒子为全局最优粒子;
5、(3)计算全局最优粒子与其最近邻粒子之间的距离,比较所有粒子中的最大和最小距离和,通过欧几里得度量方法计算第个粒子到所有其它粒子之间的平均距离,以此计算进化因子,根据进化因子的值采用模糊分类,划分出四个状态:探索状态、开发状态、收敛状态和跳出状态;
6、(4)设置认知参数的加速度系数和社会参数的加速度系数的边界,并根据步骤(3)中的四个状态自适应调整和的值;
7、(5)利用以下公式更新惯性权重;
8、
9、其中,表示当前粒子的适应度函数值,表示当前种群的平均适应度函数值,表示全局最优粒子的适应度函数值,分别表示最大惯性权重和最小惯性权重;
10、(6)根据apso算法规则更新粒子位置与速度,速度更新公式为:
11、
12、位置更新公式为:
13、
14、其中,
15、表示速度参数;
16、表示位置参数;
17、表示第次迭代中第个粒子速度的第个分量,表示第次迭代中第个粒子位置的第个分量,表示粒子群的维数,和表示在区间[0,1]内服从均匀分布的两个随机数,表示当前粒子遇到的最佳位置,表示整个粒子群遇到的最佳位置;
18、(7)重复步骤(2)-(6),直到达到收敛条件,判断收敛条件为当达到最大迭代次数时,判定为收敛并结束训练过程;
19、(8)跟踪全局最优适应度函数值以及其对应的模型超参数,选择使适应度函数值最小的粒子对应的超参数,将其视为全局最优解,并将其作为apso-cnn模型的最优超参数,对应的模型代表最优cnn模型;
20、(9)将后一部分数据集输入到最优cnn模型中,并将输出的矩阵送入softmax函数,以获取网络流量数据所属类别的概率分布,概率最高的类别即被确定为该网络流量数据所归为的类别,以实现网络流量分类。
21、进一步的,步骤(2)的具体方法为:
22、随机选取一组粒子作为粒子群的初始位置和速度,并将其所处位置作为历史最优位置,其中,初始速度采用随机数,将和初始化,即,最大惯性权重和最小惯性权重分别设置为,将cnn在第一个训练周期的交叉熵函数值设置为粒子的适应度函数值。
23、进一步的,步骤(3)中,计算第个粒子到所有其它粒子之间的平均距离为:
24、
25、其中,表示粒子群大小,进化因子,根据进化因子的值划分探索、开发、收敛和跳出这四个状态,采用模糊分类将四种状态赋予模糊隶属函数,其分类数值公式如下:
26、(1)探索状态:
27、(2)开发状态:
28、(3)收敛状态:
29、(4)跳出状态:。
30、进一步的,步骤(4)的具体方法为:
31、为和设置边界:,其中,表示当前迭代次数,表示第次迭代时的值,表示加速度,,若和之和大于4.0,则将其归一化,归一化公式为:,根据步骤(3)状态分类的结果分别对加速度系数和进行自适应调整,根据分类状态的不同,共有四种不同的策略,当处于探索状态时,增大0.05,减小0.05;当处于开发状态时,增大0.005,减小0.005;当处于收敛状态时,和增大0.005;当处于跳出状态时,减小0.05,增大0.05。
32、进一步的,。
33、有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果:
34、本发明提出了一种基于apso-cnn的网络流量分类方法,避免了手动调整超参数寻找适合任务模型的高人工成本,提高了模型输出的准确率以及泛化能力。通过利用apso算法对超参数进行优化,可以找到更优的权重和偏差配置,从而提高cnn模型的训练速度,以节省时间和计算资源,使得模型的迭代和优化更加高效。
1.一种基于apso-cnn的网络流量分类方法,其特征在于,该方法步骤包括以下步骤:
2.根据权利要求1所述的一种基于apso-cnn的网络流量分类方法,其特征在于,步骤(2)的具体方法为:随机选取一组粒子作为粒子群的初始位置和速度,并将其所处位置作为历史最优位置,其中,初始速度采用随机数,将和初始化,即,最大惯性权重和最小惯性权重分别设置为,将cnn在第一个训练周期的交叉熵函数值设置为粒子的适应度函数值。
3.根据权利要求2所述的一种基于apso-cnn的网络流量分类方法,其特征在于,步骤(3)中,计算第个粒子到所有其它粒子之间的平均距离为:
4.根据权利要求3所述的一种基于apso-cnn的网络流量分类方法,其特征在于,步骤(4)的具体方法为:为和设置边界:,其中,表示当前迭代次数,表示第次迭代时的值,表示加速度,,若和之和大于4.0,则将其归一化,归一化公式为:,根据步骤(3)状态分类的结果分别对加速度系数和进行自适应调整,根据分类状态的不同,共有四种不同的策略,当处于探索状态时,增大0.05,减小0.05;当处于开发状态时,增大0.005,减小0.005;当处于收敛状态时,和增大0.005;当处于跳出状态时,减小0.05,增大0.05。
5.根据权利要求4所述的一种基于apso-cnn的网络流量分类方法,其特征在于,。