本申请涉及通信,尤其涉及一种数据处理方法、设备和计算机可读存储介质。
背景技术:
1、随着计算机网络技术的飞速发展,如何有效保证网络安全成为亟待解决的问题之一。目前,一般是将待检测数据输入到支持向量机(support vector machine,svm)模型,得到待检测数据为正常或异常的数据类型;若待检测数据的数据类型为正常直接输出,若待检测数据的数据类型为异常,将待检测数据输入到反向传播神经网络(back propagationneural network,bpnn)模型,从而得到待检测数据的异常类别。但是,相关技术中的这种确定数据是否异常的方式存在检测的准确率较低的问题。
技术实现思路
1、为解决上述技术问题,本申请实施例期望提供一种数据处理方法、设备和计算机可读存储介质,解决了相关技术中存在检测准确率较低的问题,提高了对数据的检测准确率。
2、本申请的技术方案是这样实现的:
3、一种数据处理方法,所述方法包括:
4、获取第一训练数据;
5、采用第一度量函数和第二度量函数,基于所述第一训练数据进行模型训练得到目标聚类模型和多个目标分类模型;其中,所述第一度量函数和所述第二度量函数均用于度量所述目标训练数据之间的距离;
6、基于所述目标聚类模型对待处理数据进行聚类处理,得到所述待处理数据所属的类簇;
7、基于所述待处理数据所属的类簇对应的目标分类模型对所述待处理数据进行分类处理,得到所述待处理数据的分类结果。
8、上述方案中,所述采用第一度量函数和第二度量函数,基于所述第一训练数据进行模型训练得到目标聚类模型和多个目标分类模型,包括:
9、确定邻域参数、初始聚类模型和多个初始分类模型;
10、采用所述第一度量函数、所述第二度量函数和所述邻域参数,基于所述第一训练数据对所述初始聚类模型和所述多个初始分类模型进行模型训练,得到所述目标聚类模型和所述多个目标分类模型。
11、上述方案中,所述采用所述第一度量函数、所述第二度量函数和所述邻域参数,基于所述第一训练数据对所述初始聚类模型和所述多个初始分类模型进行模型训练,得到所述目标聚类模型和所述多个目标分类模型,包括:
12、采用所述第一度量函数和所述邻域参数,基于所述第一训练数据对所述初始聚类模型进行模型训练得到第一聚类模型和多个第一类簇数据;
13、基于所述多个第一类簇数据分别对所述多个初始分类模型进行模型训练得到多个第一分类模型;
14、基于所述多个第一分类模型的模型参数,更新所述第二度量函数得到第一目标度量函数;
15、采用所述第一目标度量函数和所述邻域参数,基于所述第一训练数据对所述第一聚类模型进行模型训练得到第二聚类模型和多个第二类簇数据,并基于所述多个第二类簇数据分别对所述多个第一分类模型进行模型训练,直到得到所述目标聚类模型和所述多个目标分类模型;其中,除所述初始聚类模型外的第n聚类模型对应的度量函数为所述第二度量函数,所述第n聚类模型对应的所述第二度量函数是基于所述多个第n-1分类模型的模型参数确定的,所述n为正整数。
16、上述方案中,所述采用所述第一度量函数和所述邻域参数,基于所述第一训练数据对初始聚类模型进行模型训练得到第一聚类模型和多个第一类簇数据,包括:
17、将所述第一训练数据进行划分,得到第二训练数据;
18、采用所述第一度量函数和所述邻域参数,基于所述第二训练数据对初始聚类模型进行模型训练得到第一聚类模型和多个目标类簇数据;
19、基于所述多个目标类簇数据中的边缘训练数据进行聚类,得到所述多个第一类簇数据。
20、上述方案中,所述基于所述多个目标类簇数据中的边缘训练数据进行聚类,得到所述多个第一类簇数据,包括:
21、确定所述多个目标类簇数据中的边缘训练数据;
22、采用所述第一度量函数,获取所述边缘训练数据之间的距离;
23、基于所述边缘数据之间的距离和所述邻域半径对所述多个目标类簇数据进行聚类,得到所述多个第一类簇数据。
24、上述方案中,所述基于所述多个第一分类模型的模型参数,更新所述第二度量函数得到第一目标度量函数,包括:
25、基于所述多个第一分类模型的准确率,从所述多个第一分类模型中确定待处理分类模型;
26、基于所述待处理分类模型的模型参数,更新所述第二度量函数得到所述第一目标度量函数。
27、上述方案中,所述基于所述多个第二类簇数据分别对所述多个第一分类模型进行模型训练,直到得到所述目标聚类模型和所述多个目标分类模型,包括:
28、基于所述多个第二类簇数据分别对所述多个第一分类模型进行模型训练,得到多个第二分类模型;
29、基于所述多个第二分类模型的模型参数,更新所述第一目标度量函数得到第二目标度量函数;
30、采用所述第二目标度量函数和所述邻域参数,基于所述第一训练数据对所述第二聚类模型进行模型训练直到满足目标条件,以得到所述目标聚类模型和所述多个目标分类模型。
31、上述方案中,所述目标聚类模型包括具有噪声应用的基于密度的空间聚类dbscan模型,所述多个目标分类模型包括多个支持向量机svm模型。
32、一种数据处理设备,所述设备包括:处理器、存储器和通信总线;
33、所述通信总线用于实现处理器和存储器之间的通信连接;
34、所述处理器用于执行存储器中的数据处理程序,以实现上述所述的数据处理方法的步骤。
35、一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述所述的数据处理方法的步骤。
36、本申请的实施例所提供的数据处理方法、设备和计算机可读存储介质,可以采用第一度量函数和第二度量函数,基于获取的第一训练数据进行模型训练得到目标聚类模型和多个目标分类模型,并基于目标聚类模型对待处理数据进行聚类处理得到待处理数据所属的类簇,之后基于待处理数据所属的类簇对应的目标分类模型对待处理数据进行分类得到待处理数据的分类结果,如此通过第一度量函数和第二度量函数训练得到的目标聚类模型和多个目标分类模型中对数据分类和聚类时不会受噪声的影响,使得采用目标聚类模型和多个目标分类模型确定出来的数据的分类结果的准确率更高,解决了相关技术中存在检测准确率较低的问题,提高了对数据的检测准确率。
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述采用第一度量函数和第二度量函数,基于所述第一训练数据进行模型训练得到目标聚类模型和多个目标分类模型,包括:
3.根据权利要求2所述的方法,其特征在于,所述采用所述第一度量函数、所述第二度量函数和所述邻域参数,基于所述第一训练数据对所述初始聚类模型和所述多个初始分类模型进行模型训练,得到所述目标聚类模型和所述多个目标分类模型,包括:
4.根据权利要求3所述的方法,其特征在于,所述采用所述第一度量函数和所述邻域参数,基于所述第一训练数据对初始聚类模型进行模型训练得到第一聚类模型和多个第一类簇数据,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述多个目标类簇数据中的边缘训练数据进行聚类,得到所述多个第一类簇数据,包括:
6.根据权利要求3所述的方法,其特征在于,所述基于所述多个第一分类模型的模型参数,更新所述第二度量函数得到第一目标度量函数,包括:
7.根据权利要求3所示的方法,其特征在于,所述基于所述多个第二类簇数据分别对所述多个第一分类模型进行模型训练,直到得到所述目标聚类模型和所述多个目标分类模型,包括:
8.根据权利要求1所述的方法,其特征在于,所述目标聚类模型包括具有噪声应用的基于密度的空间聚类dbscan模型,所述多个目标分类模型包括多个支持向量机svm模型。
9.一种数据处理设备,其特征在于,所述设备包括:处理器、存储器和通信总线;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1~8中任一项所述的数据处理方法的步骤。