本发明涉及数据传输,具体涉及一种用于计算机的数据传输方法。
背景技术:
1、计算机通过数据传输使得不同计算机或设备之间实现数据共享,促进信息的交流和协作;数据传输为大规模数据分析提供了必要的基础,帮助企业和研究机构做出更有意义的决策,为信息社会的发展提供了重要的基础和便利。
2、通常在进行数据传输时需要先对数据进行压缩处理,但通常在进行数据压缩时对数据中的冗余数据过于依赖,即对于重复相似性高的数据产生的压缩效果较好,而对于重复相似低的数据产生的压缩效果较差,导致对所传输的数据进行压缩的效果不稳定,压缩效率得不到保证。
技术实现思路
1、本发明提供一种用于计算机的数据传输方法,以解决现有的问题:现有编码压缩算法在对数据压缩时对数据中的冗余数据过于依赖,即对于重复相似性高的数据产生的压缩效果较好,而对于重复相似低的数据产生的压缩效果较差,导致对所传输的数据进行压缩的效果不稳定,压缩效率得不到保证。
2、本发明的一种用于计算机的数据传输方法采用如下技术方案:
3、本发明一个实施例提供了一种用于计算机的数据传输方法,该方法包括以下步骤:
4、获取计算机运行过程中需要进行传输的时序数据集,时序数据集中包含若干个数据序列;
5、将时序数据集中数据序列的所有数据点的平均数值记为数据序列的横轴维度指标,根据数据点在所属数据序列中出现的频率以及数据序列内数据点的最大值和最小值,获得数据序列的纵轴维度指标,利用横轴维度指标和纵轴维度指标构建二维的特征空间,获取所有数据序列的横轴维度指标和纵轴维度指标构建,并将所有数据序列映射到特征空间中;
6、利用特征空间中任意两个数据序列所形成向量与纵轴方向之间的夹角,对所述两个数据序列之间的距离进行调节,获得数据序列之间的相似性;结合相似性对特征空间中的数据序列进行聚类,获得若干个聚类簇;
7、对所有聚类簇分别进行编码压缩并进行传输。
8、进一步的,所述根据数据点在所属数据序列中出现的频率以及数据序列内的最大值和最小值,获得数据序列的纵轴维度指标,包括的具体方法为:
9、根据数据点在所属数据序列中出现的频率获得数据序列的熵,记为数据序列的第一纵轴因子;
10、根据数据序列内数据点的最大值和最小值的比值获得数据序列的第二纵轴因子;
11、预设第一参数和第二参数,第一参数大于第二参数,利用第一参数和第二参数对第一纵轴因子和第二纵轴因子进行调节,分别获得第一数值和第二数值;
12、将第一数值和第二数值的和值记为数据序列的纵轴维度指标。
13、进一步的,所述第二纵轴因子的具体获取方法为:
14、将数据序列中数据点的最大值与最小值的比值记为第一比值;
15、将第一比值与1的差值绝对值作为双曲线正切函数的输入,将双曲线正切函数的输出记为第二纵轴因子。
16、进一步的,所述第一数值和第二数值的具体获取方法为:
17、将第一参数和第一纵轴因子的乘积记为第一数值;
18、将第二参数和第二纵轴因子的乘积记为第二数值。
19、进一步的,所述利用横轴维度指标和纵轴维度指标构建二维的特征空间,包括的具体方法为:
20、构建二维直角坐标系,将以横轴维度指标作为二维直角坐标系的横轴,且以纵轴维度指标作为二维直角坐标系的纵轴,所形成的二维空间称为特征空间。
21、进一步的,所述利用特征空间中任意两个数据序列所形成向量与纵轴方向之间的夹角,对所述两个数据序列之间的距离进行调节,获得数据序列之间的相似性,包括的具体方法为:
22、首先,获取在特征空间中任意两个数据序列之间的欧氏距离;数据序列在特征空间中所形成的向量与纵轴方向上的夹角包括正向夹角和负向夹角;
23、根据正向夹角和负向夹角获得规则系数,利用规则系数对数据序列之间的欧氏距离进行调节,获得数据序列之间的相似性,具体计算方法为:
24、
25、其中,表示数据序列和数据序列的相似性;和表示特征空间中任意两个数据序列;表示数据序列和数据序列在特征空间中的欧氏距离;表示规则系数;表示正向夹角;表示负向夹角;表示获取最小值。
26、进一步的,所述正向夹角和负向夹角的具体获取方法为:
27、将任意两个数据序列在特征空间中形成的向量记为相似向量;
28、获取相似向量分别与纵轴正方向和纵轴负方向之间的夹角,分别记为正向夹角和负向夹角。
29、进一步的,所述根据正向夹角和负向夹角获得规则系数,包括的具体方法为:
30、将正向夹角和负向夹角中的最小值记为规则因子;
31、将规则因子输入到以自然常数为底数的指数衰减函数,将所述的指数衰减函数的输出记为规则系数。
32、进一步的,所述结合相似性对特征空间中的数据序列进行聚类,获得若干个聚类簇,包括的具体方法为:
33、结合相似性计算方法获取特征空间中任意数据序列之间的相似性,通过层次聚类算法对特征空间中所有数据序列进行层次聚类,获得若干个聚类簇。
34、进一步的,所述对所有聚类簇分别进行编码压缩并进行传输,包括的具体方法为:
35、首先,对各个聚类簇内的数据序列进行游程编码压缩处理,获得每个聚类簇中数据序列对应的压缩数据;
36、然后,利用5g网络或局域网对压缩数据进行远程传输。
37、本发明的技术方案的有益效果是:通过利用时序数据集中的各个数据序列内数据点的分布特征,将数据序列映射到特征空间中,根据数据序列在特征空间中形成的向量对数据序列在特征空间中的距离进行调节优化,获得可以自适应的相似性度量方法,并利用相似性对数据序列进行聚类划分,获得由多个相似性高的数据序列所形成的聚类簇,通过对数据冗余程度高的聚类簇内的数据序列进行编码压缩和数据远程传输,提高了编码压缩的压缩效率,进一步提高了数据的传输速度。
1.一种用于计算机的数据传输方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述一种用于计算机的数据传输方法,其特征在于,所述根据数据点在所属数据序列中出现的频率以及数据序列内的最大值和最小值,获得数据序列的纵轴维度指标,包括的具体方法为:
3.根据权利要求2所述一种用于计算机的数据传输方法,其特征在于,所述第二纵轴因子的具体获取方法为:
4.根据权利要求2所述一种用于计算机的数据传输方法,其特征在于,所述第一数值和第二数值的具体获取方法为:
5.根据权利要求1所述一种用于计算机的数据传输方法,其特征在于,所述利用横轴维度指标和纵轴维度指标构建二维的特征空间,包括的具体方法为:
6.根据权利要求1所述一种用于计算机的数据传输方法,其特征在于,所述利用特征空间中任意两个数据序列所形成向量与纵轴方向之间的夹角,对所述两个数据序列之间的距离进行调节,获得数据序列之间的相似性,包括的具体方法为:
7.根据权利要求6所述一种用于计算机的数据传输方法,其特征在于,所述正向夹角和负向夹角的具体获取方法为:
8.根据权利要求6所述一种用于计算机的数据传输方法,其特征在于,所述根据正向夹角和负向夹角获得规则系数,包括的具体方法为:
9.根据权利要求1所述一种用于计算机的数据传输方法,其特征在于,所述结合相似性对特征空间中的数据序列进行聚类,获得若干个聚类簇,包括的具体方法为:
10.根据权利要求1所述一种用于计算机的数据传输方法,其特征在于,所述对所有聚类簇分别进行编码压缩并进行传输,包括的具体方法为: