本发明涉及产业互联网平台交易数据处理,特别是一种基于产业互联网平台的行业景气指数的编制方法。
背景技术:
1、随着我国经济发展,产业互联网逐步发展壮大。传统产业中的交易数据也突破了原有的采集瓶颈,随着所积累的数据在不断的增长,数据的量级不断升级以及应用的不断深入,大数据的价值变得越来越不可忽视。因此,如何有效应用各产业各场景的数据成为产业互联网平台需要重视的问题。
2、由于陶瓷原料交易产业属于传统和封闭的行业,产品定价由买卖双方间协商确定,历年来都是靠口口相传的,这就导致行业交易信息和运输信息未能通过电子化、信息化以及线上化方式采集和保存,并且陶瓷行业体量偏少,缺乏有效的行业统一指导机制,所以在陶瓷行业不存在行业景气指数等技术。
技术实现思路
1、针对上述缺陷,本发明提出了一种基于产业互联网平台的行业景气指数的编制方法,其目的在于解决了传统陶瓷原料交易产业体量偏少,缺乏有效的行业统一指导机制,且不存在行业景气指数的问题。
2、为达此目的,本发明采用以下技术方案:
3、一种基于产业互联网平台的行业景气指数的编制方法,包括以下步骤:
4、步骤s1:从产业互联网平台数据库中,提取全平台会员的近年历史交易数据;
5、步骤s2:从国家统计局和中经数据网中导出指标数据;
6、步骤s3:对全平台会员的近年历史交易数据进行筛选,并将筛选出的交易数据进行计算,得到第一数据集;
7、步骤s4:以自然月为关联字段将指标数据和第一数据集进行合并,得到第二数据集;
8、步骤s5:对第二数据集中的缺失数据进行数据填充,得到第三数据集;
9、步骤s6:对第三数据集进行季度调整,得到第四数据集;
10、步骤s7:对第四数据集进行滚动平均,得到第五数据集;
11、步骤s8:将第五数据集拆分成一致性指标组和领先指标组,分别对一致性指标组和领先指标组进行合成指数运算,得到一致性指数和领先指数;
12、步骤s9:将一致性指数和领先指数储存于行业指数mysql数据库。
13、优选地,在步骤s3中,具体包括以下子步骤:
14、步骤s31:从全平台会员的近年历史交易数据中筛选出应用于陶瓷行业的陶瓷原材料的交易数据;
15、步骤s32:对应用于陶瓷行业的陶瓷原材料的交易数据中的交易金额,以交易所在月份为单位进行求和统计,得到陶瓷原材料交易月度交易额,即为第一数据集。
16、优选地,在步骤s5中,对第二数据集中的缺失数据进行数据填充具体包括以下步骤:取当前缺失数据值上一个月的数据值和下一个月的数据值进行求均值,并将均值取代当前缺失数据值,均值的具体计算公式如下:
17、
18、其中,xn为当前缺失数据值,xn-1为当前缺失数据值上一个月的数据值;xn+1为当前缺失数据值下一个月的数据值。
19、优选地,在步骤s6中,具体包括以下子步骤:
20、步骤s61:使用python中的pandas库获取第三数据集;
21、步骤s62:以日期的字段作为第三数据集的索引,获取第三数据集中每个指标的数据;
22、步骤s63:去除每个指标的数据中缺失的数据,得到每个指标的更新数据;
23、步骤s64:建立x-12-arima季节调整模型,将每个指标的更新数据输入所述x-12-arima季节调整模型进行计算,输出每个指标经过x-12-arima计算后的数据,构成第四数据集。
24、优选地,在步骤s7,具体包括以下子步骤:
25、步骤s71:对第四数据集中每个指标每月的数据分别求移动平均值;
26、步骤s72:通过pandas库中rolling.mean函数,计算出每个指标的第n数值和第n-1个数值的滚动2个月的移动平均值,其中n为正整数。
27、优选地,在步骤s8中,分别对一致性指标组和领先指标组进行合成指数运算,具体是运算步骤如下:
28、步骤s81:计算单个指标的对称变化率cij(t),具体的计算公式如下:
29、
30、其中,cij(t)代表单个指标的对称变化率;yij(t)代表当前指标;yij(t-1)代表上一个月指标;i=1和2分别代表一致性指标组和领先指标组;j=1,2......n分别代表各组内各个指标;t代表日期;n代表正整数;
31、当当前指标yij(t)为零或负值时,或者当前指标yij(t)为比率序列时,则取一阶差分,具体公式如下:
32、cij(t)=yij(t)-yij(t-1),t=2,3,......n
33、步骤s82:计算标准化因子aij,具体的计算公式如下:
34、
35、其中,aij代表标准化因子;cij(t)代表单个指标的对称变化率;
36、步骤s83:用标准化因子aij将cij(t)标准化,得到标准化变化率sij(t),具体公式如下:
37、
38、其中,sij(t)代表标准化变化率;aij代表标准化因子;cij(t)代表单个指标的对称变化率;
39、步骤s84:计算一致性指标组或领先指标组的平均变化率rj(t),具体计算公式如下:
40、
41、其中,rj(t)代表一致性指标组或领先指标组的平均变化率;sij(t)代表标准化变化率;wij代表各个指标的权重;kj代表j组指标的计数,k1代表一致性指标组的计数,数值为7,k2代表领先指标组的计数,数值为4;
42、步骤s85:计算一致性指标组或领先指标组的合成指数ij(t),具体的计算公式如下:
43、
44、其中,ij(t)代表当前一致性指标组或领先指标组的合成指数;ij(t-1)代表上一个月一致性指标组或领先指标组的合成指数,rj(t)代表一致性指标组或领先指标组的平均变化率。
45、本申请实施例提供的技术方案可以包括以下有益效果:
46、本方案中通过对产业互联网平台数据库中的交易数据和国家统计局和中经数据网中的指标数据进行编制,得到的一致性指数和领先指数能够反馈陶瓷行业的景气度变化,以及陶瓷行业相关的宏观经济指标的变动,有利于行业参与者对行业景气度进行预判分析。
1.一种基于产业互联网平台的行业景气指数的编制方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于产业互联网平台的行业景气指数的编制方法,其特征在于:在步骤s3中,具体包括以下子步骤:
3.根据权利要求1所述的一种基于产业互联网平台的行业景气指数的编制方法,其特征在于:在步骤s5中,对第二数据集中的缺失数据进行数据填充具体包括以下步骤:取当前缺失数据值上一个月的数据值和下一个月的数据值进行求均值,并将均值取代当前缺失数据值,均值的具体计算公式如下:
4.根据权利要求1所述的一种基于产业互联网平台的行业景气指数的编制方法,其特征在于:在步骤s6中,具体包括以下子步骤:
5.根据权利要求1所述的一种基于产业互联网平台的行业景气指数的编制方法,其特征在于:在步骤s7,具体包括以下子步骤:
6.根据权利要求1所述的一种基于产业互联网平台的行业景气指数的编制方法,其特征在于:在步骤s8中,分别对一致性指标组和领先指标组进行合成指数运算,具体是运算步骤如下: