基于物联网的企业数据智能管理方法与流程

文档序号:38035696发布日期:2024-05-17 13:20阅读:14来源:国知局
基于物联网的企业数据智能管理方法与流程

本发明涉及数据压缩,具体涉及基于物联网的企业数据智能管理方法。


背景技术:

1、随着物联网技术的快速发展,越来越多的设备和传感器被广泛应用于各个领域,而企业数据智能管理旨在有效地收集、处理、分析和应用企业数据,从而提高企业的运营效率、决策能力和竞争优势,而通过传感器采集的企业数据的数据量较大,带来巨大的存储压力,因此需要对采集的企业数据进行压缩后存储。

2、传统的费诺编码算法是对企业数据中的各类字符按照其频率从大到小的顺序进行排序,得到字符种类序列,然后计算字符种类序列中各类字符的累加频率,当累加频率最接近0.5的情况对字符种类序列进行迭代分组,因此传统的费诺编码只考虑了组之间的字符频率之和是否接近,而未考虑到组内各个字符的频率是否接近,从而导致传统的费诺编码算法的压缩效率较低。


技术实现思路

1、为了解决上述问题,本发明提供基于物联网的企业数据智能管理方法。

2、本发明的基于物联网的企业数据智能管理方法采用如下技术方案:

3、本发明一个实施例提供了基于物联网的企业数据智能管理方法,该方法包括以下步骤:

4、采集企业数据;

5、获取企业数据中各类字符的频率;根据企业数据中各类字符的频率,获取字符种类序列;

6、对字符种类序列进行分段,获取多个分段区间:对字符种类序列中的前n个字符进行标记,记为第一初始区间;根据字符种类序列中第n+1个字符加入第一初始区间后字符频率波动与第一初始区间中的字符频率波动的差异,获取字符种类序列中第n+1个字符加入第一初始区间的可能性;根据字符种类序列中第n+1个字符加入第一初始区间的可能性,获取第一分段区间;获取第二分段区间,依次类推,获取多个分段区间;

7、对多个分段区间进行分组获取多种第一组合;根据每种第一组合中每个组的字符频率的接近程度以及组之间的字符频率的接近程度,获取每种第一组合的优选程度;根据每种第一组合的优选程度获取第一最优组合;

8、根据第一最优组合完成字符种类序列的多次分组,根据字符种类序列的每次分组构建费诺编码树;

9、根据费诺编码树对企业数据进行压缩,获取压缩数据并存储。

10、优选的,所述根据企业数据中各类字符的频率,获取字符种类序列,包括的具体步骤如下:

11、获取企业数据中的字符种类,根据企业数据中每类字符的频率从大到小的顺序对企业数据中的字符种类进行排列,得到字符种类序列。

12、优选的,所述获取字符种类序列中第n+1个字符加入第一初始区间的可能性,包括的具体步骤如下:

13、

14、式中,en+1代表字符种类序列中第n+1个字符加入第一初始区间的可能性;n代表第一初始区间的字符总数;pi代表第一初始区间中第i个字符的频率;代表第一初始区间中所有字符的频率均值;表示将字符种类序列中第n+1个字符加入第一初始区间后所有字符的频率均值。

15、优选的,所述根据字符种类序列中第n+1个字符加入第一初始区间的可能性,获取第一分段区间,包括的具体步骤如下:

16、预设可能性阈值t1,当en+1≤t1时,将字符种类序列中第n+1个字符加入第一初始区间并标记,接着依次获取字符种类序列中第n+2个字符加入第一初始区间的可能性,直至字符种类序列中的第n+x个字符加入第一初始区间的可能性大于可能性阈值时停止,将更新的第一初始区间作为第一分段区间;当en+1>t1时,字符种类序列中第n+1个字符不加入第一初始区间,将第一初始区间作为第一分段区间。

17、优选的,所述获取第二分段区间,依次类推,获取多个分段区间,包括的具体步骤如下:

18、依次获取字符种类序列中的未标记前n个字符进行标记,记为第二初始区间,接着依次获取字符种类序列中未标记的第一个字符加入第二初始区间的可能性,记为m;

19、当m≤t1时,将字符种类序列中未标记的第一个字符加入第二初始区间并标记,接着依次获取字符种类序列中未标记的第一个字符加入第二初始区间的可能性,直至字符种类序列中未标记的第一个字符加入第二初始区间的可能性大于可能性阈值时停止,将更新的第二初始区间作为第二分段区间;当m>t1时,字符种类序列中未标记的第一个字符不加入第二初始区间,将第二初始区间作为第二分段区间;

20、依次类推,获取多个分段区间。

21、优选的,所述对多个分段区间进行分组获取多种第一组合,包括的具体步骤如下:

22、对所有分段区间进行分组,共分成两组,得到若干种分组情况,将每种分组情况作为一个第一组合。

23、优选的,所述获取每种第一组合的优选程度,包括的具体步骤如下:

24、

25、式中,ya代表第a种第一组合的优选程度;na,1代表第a种第一组合的第一组中的字符总数;pa,1,j代表第a种第一组合的第一组中第j个字符的频率;na,2代表第a种第一组合的第二组中的字符总数;pa,2,z代表第a种第一组合的第二组中第z个字符的频率;norm()代表归一化函数;||代表绝对值符号。

26、优选的,所述根据每种第一组合的优选程度获取第一最优组合,包括的具体步骤如下:

27、将优选程度最高的第一组合作为第一最优组合。

28、优选的,所述根据第一最优组合完成字符种类序列的多次分组,包括的具体步骤如下:

29、根据第一最优组合完成字符种类序列的第二次分组:

30、对于第一最优组合中只存在一个分段区间的组,使用费诺编码算法对该组的分段区间中的字符进行迭代分组,直至该组的分段区间中的每个字符为一个组时停止;对于第一最优组合中存在多个分段区间的组,对组中的多个分段区间按照第一组合的获取方法重新进行分组,得到组中的若干种第二组合,对每种第二组合按照上述方法获取优选程度,将优选程度最大的第二组合作为组中的第二最优组合,完成对字符种类序列的第二次分组;以此类推,根据组中的第二最优组合完成字符种类序列的第三次分组,以此类推直至字符种类序列中的每个字符为一个组时停止。

31、优选的,所述根据费诺编码树对企业数据进行压缩,获取压缩数据并存储,包括的具体步骤如下:

32、根据费诺编码树,获取企业数据中每类字符的编码,根据企业数据中每类字符的编码对企业数据进行编码,得到压缩数据,将压缩数据存储至数据库。

33、本发明的技术方案的有益效果是:本发明首先采集企业数据;获取企业数据中各类字符的频率,进而得到获取字符种类序列;对字符种类序列进行分段,获取多个分段区间,使得每个分段区间中各个字符的频率较为接近;接着对多个分段区间进行分组获取多种第一组合,根据多种第一组合中每个组中的字符频率的接近程度以及组之间的字符频率的接近程度,进而得到第一最优组合,使得第一最优组合中组之间的字符频率接近并且组的字符频率的接近;最后根据第一最优组合完成字符种类序列的多次分组,根据字符种类序列每次分组构建费诺编码树;根据费诺编码树对企业数据进行压缩,获取压缩数据并存储,本发明在对字符种类序列进行迭代分组时,考虑组之间的频率之和是否接近结合以及组中字符的频率是否接近,以此提高了费诺编码的压缩效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1