一种气候投融资项目数据采集处理方法

文档序号:36492934发布日期:2023-12-27 02:26阅读:33来源:国知局
一种气候投融资项目数据采集处理方法

本发明涉及数据处理,具体涉及一种气候投融资项目数据采集处理方法。


背景技术:

1、投融资项目是指通过资金的投入和融资来支持各种商业活动的项目。它是促进经济增长和实现商业目标的重要机制之一。气候投融资项目主要是为解决气候变化和环境问题而设立的资金项目。气候投融资项目的数据涉及多个方面的信息,包括融资规模、投资领域、资金来源、投资趋势、碳减排效益和能源节约效益等。气候投融资项目在近年来经历了数量大量增加的激增,项目的规模不断增长,项目产生的数据也在日益剧增。巨大的数据量对系统内存的占用负担越来越大,因此需要一种有效的数据压缩方法对气候投融资项目数据进行压缩,减少企业系统内存压力,提高存储效率。

2、传统的压缩处理方法常常使用游程编码对数据进行压缩,该方法对于连续多个重复数据压缩效果较好,但对于不存在连续数据的数据集压缩效果很差,甚至会出现数据膨胀的现象。对于转化为二进制后的投融资项目数据,数据会存在连续重复的部分,虽然游程编码能有一定的压缩效果,但是整体压缩效果不佳,而且因为数据随机性强,压缩大小结果并不稳定。针对上述问题,本发明提出了一种气候投融资项目数据采集处理方法,通过分析气候投融资项目的数据变化特点,增大数据的重复冗余程度、减小数据随机性,得到一个优化的数据序列来获取较好的游程编码效果。


技术实现思路

1、本发明提供一种气候投融资项目数据采集处理方法,以解决数据随机性强,压缩大小结果并不稳定的问题,所采用的技术方案具体如下:

2、本发明一个实施例提供了一种气候投融资项目数据采集处理方法,该方法包括以下步骤:

3、采集气候投融资项目数据表获取投资序列;

4、对投资序列使用差分运算获取第一差分序列,对第一差分序列使用差分运算获取第二差分序列,对于第一差分序列和第二差分序列都获取其对应的符号序列;

5、将第二差分序列转换为二维矩阵,在二维矩阵中根据每个游程编码路径获取重复元素,并根据重复元素获取元素链,根据每个游程编码路径获取的重复元素和元素链得到路径评估值,根据路径评估值获取最优压缩路径;

6、根据最优压缩路径对采集数据完成压缩,在使用数据时使用符号序列解压。

7、优选的,所述对投资序列使用差分运算获取第一差分序列,对第一差分序列使用差分运算获取第二差分序列的方法为:

8、将投资序列从第一个数据点开始,相邻数据点的数据值作差,将所得到的差值构成第一差分序列,第一差分序列的最后一个值为投资序列的最后一个值;

9、将第一差分序列从第一个数据点开始,相邻数据点的数据值作差,将所得到的差值构成第二差分序列,第二差分序列的最后两个值为第一差分序列的最后两个值。

10、优选的,所述对于第一差分序列和第二差分序列都获取其对应的符号序列的方法为:

11、令每个差分序列中的数据值与其绝对值的比值作为符号序列的数值,符号序列只存在1和-1,将第一差分序列和第二差分序列每个数据点的数值与其绝对值之比分别得到第一符号序列和第二符号序列。

12、优选的,所述将第二差分序列转换为二维矩阵的方法为:

13、令第二差分序列转换成的二维矩阵每一行的元素数量都是相同的,二维矩阵的每一行的最后一个元素与下一行的第一个元素在第二差分序列中是前后关系,二维矩阵的长和宽需要再满足每一行元素相等的基础上差值最小,若第二差分序列的长度为质数,则将第二差分序列的长度加一后再转换。

14、优选的,所述在二维矩阵中根据每个游程编码路径获取重复元素,并根据重复元素获取元素链的方法为:

15、在游程编码路径上遍历,将遍历的元素与下一个遍历的元素对应的元素值作差,若差值为0,则说明两个元素为重复元素,继续遍历,直到所有元素遍历完成;

16、在游程编码路径方向上连续的重复元素作为一个元素链。

17、优选的,所述根据游程编码路径包括水平方向编码、垂直方向编码、对角线方向编码。

18、优选的,所述根据每个游程编码路径获取的重复元素和元素链得到路径评估值的方法为:

19、

20、式中,li表示二维矩阵中第i个元素链的长度,k表示二维矩阵中元素链的数量,m表示二维矩阵中重复元素的数量,m表示二维矩阵中所有元素的数量,η1和η2表示权重因子,w表示路径评估值。

21、本发明的有益效果是:本发明通过分析气候投融资项目数据与普通数据的不同特征,得到项目数据的特有特征,并通过该特征尽可能的增加数据的重复冗余程度,使游程编码得到更适合气候投融资项目数据的编码方法。进一步提升了游程编码的压缩效率,得到的压缩结果更加理想。



技术特征:

1.一种气候投融资项目数据采集处理方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种气候投融资项目数据采集处理方法,其特征在于,所述对投资序列使用差分运算获取第一差分序列,对第一差分序列使用差分运算获取第二差分序列的方法为:

3.根据权利要求1所述的一种气候投融资项目数据采集处理方法,其特征在于,所述对于第一差分序列和第二差分序列都获取其对应的符号序列的方法为:

4.根据权利要求1所述的一种气候投融资项目数据采集处理方法,其特征在于,所述将第二差分序列转换为二维矩阵的方法为:

5.根据权利要求1所述的一种气候投融资项目数据采集处理方法,其特征在于,所述在二维矩阵中根据每个游程编码路径获取重复元素,并根据重复元素获取元素链的方法为:

6.根据权利要求1所述的一种气候投融资项目数据采集处理方法,其特征在于,所述根据游程编码路径包括水平方向编码、垂直方向编码、对角线方向编码。

7.根据权利要求1所述的一种气候投融资项目数据采集处理方法,其特征在于,所述根据每个游程编码路径获取的重复元素和元素链得到路径评估值的方法为:


技术总结
本发明涉及数据处理技术领域,提出了一种气候投融资项目数据采集处理方法,包括:采集气候投融资项目数据表获取投资序列;对投资序列使用差分运算获取第二差分序列,并获取其相应的符号序列;将第二差分序列转换为二维矩阵,在二维矩阵中根据每个游程编码路径获取重复元素,并根据重复元素获取元素链,根据每个游程编码路径获取的重复元素和元素链得到路径评估值,根据路径评估值获取最优压缩路径;根据最优压缩路径对采集数据完成压缩,在使用数据时使用符号序列解压。本发明提升了游程编码的压缩效率,得到的压缩结果更加理想。

技术研发人员:罗兰兰,杨梅,乐胜杰
受保护的技术使用者:湖南工商大学
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1