一种基于大数据的数字经济指数测算方法与流程

文档序号:26625456发布日期:2021-09-14 21:20阅读:1509来源:国知局
一种基于大数据的数字经济指数测算方法与流程

1.本发明涉及数字经济技术领域,特别涉及了一种基于大数据的数字经济指数测算方法。


背景技术:

2.数字经济,作为经济学概念的数字经济是人类通过大数据的识别—选择—过滤—存储—使用,引导、实现资源的快速优化配置与再生、实现经济高质量发展的经济形态,数字经济,作为一个内涵比较宽泛的概念,凡是直接或间接利用数据来引导资源发挥作用,推动生产力发展的经济形态都可以纳入其范畴,在技术层面,包括大数据、云计算、物联网、区块链、人工智能、5g通信等新兴技术,在应用层面,“新零售”、“新制造”等都是其典型代表。
3.目前用数字经济发展指数来评价区域内数字经济总体发展水平,主要采用层次分析法来计算数字经济发展指数。如中国专利局2019年10月8日公开了一种名称为一种基于层次分析的数字经济指数测算方法的发明,其公开号为cn110310024a。该发明包括下列步骤:步骤一、构建宏观经济与数字经济的有向关系模型;步骤二、根据步骤一构建的模型,构建数字经济发展评价指标体系;步骤三、采用层次分析法将步骤二构建的指标体系进行指标赋权。本发明首次将层次分析法应用在数字经济发展评价指标体系的指标赋权中,将复杂的指标体系层次化,通过逐层比较各种关联因素的重要性来为指数测算提供定量依据,为科学衡量数字经济发展水平提供有力支撑。通过选取一系列反映各类数字经济发展指标构建指标体系,利用统计方法进行合成计算而得,但在指标过多时数据统计量大,且权重难以确定;另一方面,随着指标增多,在判断矩阵的特征值和向量值时,所用的精确求法也比较复杂。


技术实现要素:

4.本发明的目的是克服现有技术中层次分析法在指标过多时数据统计量大,且权重难以确定的问题,提供了一种基于大数据的数字经济指数测算方法,通过数据库获取多区域多指标的数据,通过筛选确定具体的指标值再计算权重,从而得到数字经济指数。
5.为了实现上述目的,本发明采用以下技术方案:一种基于大数据的数字经济指数测算方法,其特征在于,它包括下列步骤:
6.s1:建立数据库,设计数字经济发展指数评价指标体系,评价指标体系包括基础指数评价、产业指数评价、融合指数评价以及环境指数评价,每一个指数下都有若干个指标;
7.s2:获取典型区域内各指标数值,采用减法一致化法对指标体系中经过初选后的指标进行指标一致化处理;
8.s3:采用极差标准化法对经过一致化处理的指标进行无量纲化处理,得到各指标得分;
9.s4:对经过无量纲化处理后的指标进行分析,根据分析结果对指标进行选取;
10.s5:采用因子分析和主成分法以及熵值法确定选取的指标的权重;
11.s6:根据选取的指标计算待测区域数字经济指数,并根据得到的指数对待测区域数字经济发展水平进行分析。
12.第一步是将一个复杂的多目标决策问题作为一个系统,确定数字经济指数的评价结构。
13.第二步是将第一步分析出的每个指标进行典型区域数据获取,所属典型区域为数字经济发展水平较高的城市、数字经济发展水平较高的城市以及数字经济发展水平较低的城市。为了统一比较的标准,保证结果的可靠性,我们在分析数据之前,需要对原始变量进行一定的处理,我们采用减法一致化法对指标体系中经过初选后的指标进行指标一致化处理。所述的减法一致化指利用该指标允许范围内的一个上界值(m),依次减去每一个原始数据。
14.第三步是对数据进行无量纲化处理,数据无量纲化处理,主要解决数据之间可比性的问题。由于不同变量自身的量纲不同,数量级存在较大差异,不同变量所占的作用比重也会有所不同。因此,为了消除量纲、变量自身变异和数值大小的影响,比较不同变量之间的相对作用,就需要对数据进行无量纲化处理,将其转化为无量纲的纯数值来进行评价和比较。本发明采用极差标准化法进行无量纲化处理,极差标准化法,是消除变量量纲和变异范围影响最简单的方法。极差标准化法就是找出该指标的最大值和最小值,并计算极差,然后用该变量的每一个观察值减去最小值,再除以极差。
15.第四步是根据处理后的指标得分,从若干个三级指标中选取与二级指标关联最大的指标,以选取的指标作为计算数字经济指数的指标。
16.第五步是计算指标的权重。熵值是不确定性的一种度量。信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大。因而利用熵值携带的信息进行权重计算,结合各项指标的变异程度,利用信息熵这个工具,计算出各项指标的权重,为多指标综合评价提供依据。
17.第六步是计算数字经济指数,根据数字经济指数分析待测区域内数字经济发展水平。可以按照月、季度、年分别计算数字经济指数。
18.作为优选,所述的步骤s1中所述基础指数评价包括目标层、准则层和指标层;所述产业指数评价包括目标层、准则层和指标层;所述融合指数评价包括目标层、准则层和指标层;所述环境指数评价包括目标层、准则层和指标层。将决策的目标、考虑的因素和决策对象按它们之间的相互关系分为最高层、中间层和最低层。其中最高层是指决策的目的、要解决的问题;最低层是指决策时的备选方案;中间层是指考虑的因素、决策的准则。对于相邻的两层,称高层为目标层,低层为指标层。清晰明了,便于统计。
19.作为优选,所述的步骤s1进一步表示为:
20.s1.1:将基础指数评价目标层中的一级指标设立为基础指数a1、将产业指数评价目标层中的一级指标设立为产业指数a2、将融合指数评价目标层中的一级指标设立为融合指数a3、将环境指数评价目标层中的一级指标设立为环境指数a4;
21.s1.2:设立目标层下的准则层中的二级指标:包括基础指数a1下的传统数字基础设施b1、新型数字基础设施b2,产业指数a2下的产业规模b3、产业主体b4,融合指数a3下的工业数字化b5、农业数字化b6以及服务业数字化b7,环境指数a4下的政务新媒体b8、政务网上服务b9以及政务网上资源b10;
22.s1.3:确定准则层下的指标层中的三级指标。
23.根据问题的性质和要达到的总目标,将问题分解为不同的组成因素,并按照因素间的相互关联影响以及隶属关系将因素按不同层次聚集组合,形成一个多层次的分析结构模型,从而最终使问题归结为最低层(供决策的方案、措施等)相对于最高层(总目标)的相对重要权值的确定或相对优劣次序的排定,直观清晰。
24.作为优选,所述的步骤s1.3中,各准则层对应的指标层各分指标项为:准则层下的指标层中的三级指标为:移动宽带普及率c1、城(省)域网出口宽带c2、固定宽带用户数c3、网站数量c4、固定宽带用户平均下载速度c5、移动宽带用户数c6、互联网普及率c7、域名数量c8、数据中心数量c9、5g试点城市数量c10、ipv6比例c11、电子信息制造业规模c12、信息传输业规模c13、软件和信息技术服务业规模c14、互联网百强企业数量c15、独角兽企业数量c16,重点行业典型企业的epr普及率c17、mes普及率c18、plm普及率c19、scm普及率c20、采购环节电子商务应用c21、销售环节电子商务应用c22、装备数控化率c23,中小企业信息化服务平台数指数c24、农业农村信息化示范基地数量c25、第三方支付金融牌照和互联网保险金融牌照数量c26、电子商务交易额c27、有电子商务交易活动占比c28、政务网站数量缩减比例c29、政务网站服务在线办理成熟度c30、政务网站服务在线办理成效度c31、政务数据可共享目录数c32、政务数据可开放目录数c33以及钟无数据开放平台建设情况c34。这些是与数字经济相关的指标,但不限于这些指标。
25.作为优选,所述的步骤s2进一步表示为:
26.s2.1:通过数据库迁移工具从数据资源库中获取典型区域内各指标数值;
27.s2.2:采用减法一致化法对指标进行一致化处理,计算公式为:
28.x

ij
=m

x
ij
29.其中,m为指标允许范围内的一个上界值,x
ij
为第i个区域第j个指标的原始数据值,x

ij
为第i个区域第j个指标经过减法一致化处理后的值。减法一致化不改变数据的分散程度,因此结果较倒数一致化而言会更加稳定。
30.作为优选,所述的所述的步骤s3中极差标准化法的计算公式为:
[0031][0032]
其中,x

ij max
表示第i个区域第j个指标的最大值,x

ij min
表示第i个区域第j个指标最小值,x

ij
表示第i个区域第j个指标经过无量纲化处理后的得分。经过极差标准化方法处理后,无论原始数据是正值还是负值,该变量各个观察值的数值变化范围都满足0≤x

ij
≤1,并且正指标、逆指标均可转化为正向指标,作用方向一致。但是如果有新数据加入,就可能会导致最大值x

ij max
和最小值x

ij min
发生变化,就需要进行重新定义,并重新计算极差x

ij max

x

ij min

[0033]
作为优选,所述的步骤s4中,根据分析结果对指标进行选取的方式为:选取得分较高的指标,去除得分较低的指标,每一个二级指标下面至少有一个三级指标。与数字经济指数相关的三级指标由若干个,但不是每一个都能对数字经济指数造成一定影响,而且指数的增多,对于后续计算权重是一个负担,因此我们需要选取权重。本发明才用的选取指标的方法是去除所有区域中得分均较低的指标,保留所有区域中得分均较高的指标。选取指数
的时候要确保每个二级指标下面至少有一个三级指标,才能保证最后得到的数字经济指数由每一个二级指标组成。
[0034]
作为优选,所述的步骤s5进一步表示为:
[0035]
s5.1:采用因子分析和主成分法得到各区域准则层中的二级指标的权重并取均值;
[0036]
s5.2:采用熵值法得到各区域指标层中三级指标的权重并取均值;
[0037]
s5.3:将得到的权重保存在数据库中。
[0038]
本步骤中得到的权重则为后续步骤中计算基础指数、产业指数、融合指数以及环境指数的权重。
[0039]
作为优选,所述的步骤s6进一步表示为:
[0040]
s6.1:获取待测区域的选取的指标的数据,将指标数据进行一致化和无量纲化处理,得到指标得分;
[0041]
s6.2:根据步骤s5中得到的权重计算出基础指数、产业指数、融合指数以及环境指数;
[0042]
s6.3:根据各个指数计算得到数字经济指数,计算公式为:
[0043]
数字经济指数=基础指数*25%+产业指数*25%+融合指数*25%+环境指数*25%;
[0044]
s6.3:根据得到的基础指数、产业指数、融合指数、环境指数以及最终得到的数字经济指数,对待测区域数字经济发展水平进行分析。
[0045]
数字经济指数越低说明该区域数字经济发展水平越低,需要寻找突破口,可以根据基础指数、产业指数、融合指数、环境指数研究决定具体深入发展哪一个部分;数字经济指数越高,说明该区域数字经济发展水平越高,可以借鉴该区域发展经验。
[0046]
因此,本发明具有如下有益效果:1、综合考虑基础设施、产业发展、数字化发展、环境等因素,从多个指标中选取指标,再计算权重,最后得到数字经济发展指数;2、提供了一套反映区域数字经济发展水平的科学、合理的评价指标体系,可为区域内今后的数字经济发展研究工作提供更为科学、规范的研究方法和更为广阔的研究视角。
附图说明
[0047]
图1为本发明的具体操作流程图。
具体实施方式
[0048]
下面结合附图与具体实施方式对本发明作进一步详细描述:
[0049]
如图1所示的实施例中,可以看到一种基于大数据的数字经济指数测算方法,其操作流程为:
[0050]
第一步:建立数据库,设计数字经济发展指数评价指标体系,评价指标体系包括基础指数评价、产业指数评价、融合指数评价以及环境指数评价,每一个指数下都有若干个指标
[0051]
基础指数评价包括目标层、准则层和指标层;所述产业指数评价包括目标层、准则层和指标层;所述融合指数评价包括目标层、准则层和指标层;所述环境指数评价包括目标
层、准则层和指标层。
[0052]
首先将基础指数评价目标层中的一级指标设立为基础指数a1、将产业指数评价目标层中的一级指标设立为产业指数a2、将融合指数评价目标层中的一级指标设立为融合指数a3、将环境指数评价目标层中的一级指标设立为环境指数a4。
[0053]
然后设立基础指数a1下的传统数字基础设施b1、新型数字基础设施b2,产业指数a2下的产业规模b3、产业主体b4,融合指数a3下的工业数字化b5、农业数字化b6以及服务业数字化b7,环境指数a4下的政务新媒体b8、政务网上服务b9以及政务网上资源b10。
[0054]
最后确定准则层下的指标层中的三级指标包括:移动宽带普及率c1、城(省)域网出口宽带c2、固定宽带用户数c3、网站数量c4、固定宽带用户平均下载速度c5、移动宽带用户数c6、互联网普及率c7、域名数量c8、数据中心数量c9、5g试点城市数量c10、ipv6比例c11、电子信息制造业规模c12、信息传输业规模c13、软件和信息技术服务业规模c14、互联网百强企业数量c15、独角兽企业数量c16,重点行业典型企业的epr普及率c17、mes普及率c18、plm普及率c19、scm普及率c20、采购环节电子商务应用c21、销售环节电子商务应用c22、装备数控化率c23,中小企业信息化服务平台数指数c24、农业农村信息化示范基地数量c25、第三方支付金融牌照和互联网保险金融牌照数量c26、电子商务交易额c27、有电子商务交易活动占比c28、政务网站数量缩减比例c29、政务网站服务在线办理成熟度c30、政务网站服务在线办理成效度c31、政务数据可共享目录数c32、政务数据可开放目录数c33以及政务数据开放平台建设情况c34。
[0055]
其对应关系为:
[0056]
基础指数评价:
[0057]
[0058][0059]
产业指数评价:
[0060][0061]
融合指数评价:
[0062]
[0063][0064]
环境指数评价:
[0065]
[0066][0067]
第二步:获取典型区域内各指标数值,采用减法一致化法对指标体系中经过初选后的指标进行指标一致化处理
[0068]
通过数据库迁移工具从数据资源库中获取典型区域内各指标数值,数据库迁移工具优选为sqoop。为了统一比较的标准,保证结果的可靠性,我们在分析数据之前,需要对原始变量进行一定的处理,我们采用减法一致化法对指标体系中的指标进行指标一致化处理。所述的减法一致化指利用该指标允许范围内的一个上界值(m),依次减去每一个原始数据采用减法一致化法对指标进行一致化处理,计算公式为:
[0069]
x

ij
=m

x
ij
[0070]
其中,m为指标允许范围内的一个上界值,x
ij
为第i个区域第j个指标的原始数据值,x

ij
为第i个区域第j个指标经过减法一致化处理后的值。减法一致化则不改变数据的分散程度,因此结果较倒数一致化而言会更加稳定。
[0071]
第三步:采用极差标准化法对经过一致化处理的指标进行无量纲化处理,得到各指标得分
[0072]
由于不同变量自身的量纲不同,数量级存在较大差异,不同变量所占的作用比重也会有所不同。因此,为了消除量纲、变量自身变异和数值大小的影响,比较不同变量之间的相对作用,就需要对数据进行无量纲化处理,将其转化为无量纲的纯数值来进行评价和比较。本发明采用极差标准化法进行无量纲化处理,极差标准化法,是消除变量量纲和变异范围影响最简单的方法。极差标准化法就是找出该指标的最大值和最小值,并计算极差,然后用该变量的每一个观察值减去最小值,再除以极差。极差标准化法的计算公式为:
[0073][0074]
其中,x

ij max
表示第i个区域第j个指标的最大值,x

ij min
表示第i个区域第j个指标最小值,x

ij
表示第i个区域第j个指标经过无量纲化处理后的得分。经过极差标准化方法处理后,无论原始数据是正值还是负值,该变量各个观察值的数值变化范围都满足0≤x

ij
≤1,并且正指标、逆指标均可转化为正向指标,作用方向一致。但是如果有新数据加入,就可能会导致最大值x

ij max
和最小值x

ij min
发生变化,就需要进行重新定义,并重新计算极差x

ij max

x

ij min

[0075]
第四步:对经过无量纲化处理后的指标进行分析,根据分析结果对指标进行选取
[0076]
选取得分较高的指标,去除得分较低的指标,每一个二级指标下面至少有一个三
级指标。与数字经济指数相关的三级指标由若干个,但不是每一个都能对数字经济指数造成一定影响,而且指数的增多,对于后续计算权重是一个负担,因此我们需要选取权重。本发明才用的选取指标的方法是去除所有区域中得分均较低的指标,保留所有区域中得分均较高的指标。选取指数的时候要确保每个二级指标下面至少有一个三级指标,才能保证最后得到的数字经济指数由每一个二级指标组成。
[0077]
第五步:采用因子分析和主成分法以及熵值法确定选取的指标的权重
[0078]
采用因子分析和主成分法得到各区域准则层中的二级指标的权重并取均值;采用熵值法得到各区域指标层中三级指标的权重并取均值;将得到的权重保存在数据库中。
[0079]
第六步:根据选取的指标计算待测区域数字经济指数,并根据得到的指数对待测区域数字经济发展水平进行分析
[0080]
获取待测区域的选取的指标的数据,将指标数据进行一致化和无量纲化处理,得到指标得分,然后根据第五步中得到的权重计算出基础指数、产业指数、融合指数以及环境指数;根据各个指数计算得到数字经济指数,计算公式为:
[0081]
数字经济指数=基础指数*25%+产业指数*25%+融合指数*25%+环境指数*25%;
[0082]
根据得到的基础指数、产业指数、融合指数、环境指数以及最终得到的数字经济指数,对待测区域数字经济发展水平进行分析。
[0083]
数字经济指数越低说明该区域数字经济发展水平越低,需要寻找突破口,可以根据基础指数、产业指数、融合指数、环境指数研究决定具体深入发展哪一个部分;数字经济指数越高,说明该区域数字经济发展水平越高,可以借鉴该区域发展经验。
[0084]
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1