一种行业科技发展力量化评估方法与评估系统与流程

文档序号:12672507阅读:188来源:国知局
一种行业科技发展力量化评估方法与评估系统与流程

本发明涉及计算机领域,具体涉及一种利用计算系统实现行业科技发展力量化评估的方法和系统。



背景技术:

行业科技发展水平评估是正确认识促进科学技术发展的重要手段。国外的科技评价主要关注国家整体竞争力的评估,其中所包含的科技评估部分各具特色,有的注重绩效、有的重视体制与政策影响、有的考量科技发展整体过程、有的专注科技创新活动。IMD和WEF从衡量国家的综合国力方面考虑非常周全,指标多达数百,但也存在指标间意义重叠且根据统一的权重计算、评价结果的简单相加等问题。OECD相比之下提供更为准确和全面的衡量科技发展的指标,但其指标设计更多围绕的是OECD成员国的经济发展特点而制定,对于我国当前的经济和科技发展状况,其大部分经济和科技衡量指标和统计口径尚不匹配。

国内产业竞争力研究最具影响力的是赵彦云教授,在《中国科技国际竞争力评析及展望》一文中,他完全采纳了IMD(1999年)的指标体系中涉及于科技的部分。金碚研究员为首的中国社会科学院竞争力研究课题组,在《中国工业国际竞争力——理论、方法与实证研究》中建立了一个比较清晰的产业竞争力分析的理论模型。

国内外的研究大都注重所有产业的国际综合竞争力,关于行业科技发展力的评估指标过于笼统,无法进行量化的评估,很难将不同行业科技发展力进行比较。现有技术对于行业科技发展力的评估指标不够全面,指标之间存在物理意义重叠,无法客观、全面地评价行业的科技发展力水平;此外,由于影响科技发展力的因素众多,指标体系复杂,现有技术无法实现对多个国民经济行业的科技发展特征的多维度定量评估。



技术实现要素:

针对现有技术的不足,本发明所要解决的技术问题是提供一种利用计算机来实现量化评估我国国民经济主要行业的科技发展水平的方法和系统,通过构建一个完整的评估指标体系,以计算机系统进行建模和参数优化,实现对行业科技发展力的全面量化评价。

本发明采用的技术方案如下:

一种行业科技发展力量化评估方法,其特征在于包括如下步骤:

(1)构建评估指标体系:所述指标体系包括行业科技环境、行业科技投入、行业科技产出、行业核心竞争与行业社会经济影响五大模块,以及附加模块,每个模块包括一级指标与二级指标,具体指标如图1所示:

(2)数据采集:对每项指标采集相应数据;

(3)评估建模:采用多元线性加权或多元线性回归的方式进行建模;

(4)计算得出行业科技发展力评估值。

作为优选,步骤(2)数据采集步骤之后,还进一步包括数据补全步骤和/或参数优化步骤。

数据补全步骤是通过数据拟合或插值的方式,数据拟合曲线既能反映数据的总体分布,又不至于出现局部较大的波动,更能反映被逼近函数的特性,使求得的逼近函数与已知函数从总体上来说其偏差达到最小,数据拟合要求得到的近似函数更能反映数据的基本关系,在某种意义上更具有实用价值,作为优选,可采用基于线性拟合方式来完成数据补全。

参数优化步骤是为了将反映相同物理意义的指标删除,防止指标被重复计算,影响评价结果。本发明通过计算指标两两之间的皮尔森相关系数,发现相关指标,来对体系中的指标进行精简。皮尔森相关系数也叫皮尔逊积矩相关系数,是统计学中常用的一种线性相关系数,它是一种可以反映两个变量线性相关程度的统计量,其值介于-1与1之间。在经济学与社会学统计中,如果两个变量相关系数的绝对值大于0.9,则可以认为它们之间存在非常强的线性相关性。根据每个指标在模块中的分布情况,以及指标的重要程度,本发明在建模过程中移除反映相同物理意义的指标。

作为优选,所述步骤(3)中多元线性加权的建模方式包含如下步骤:

(a)对采集的指标数据进行归一化处理,对于每个行业i的指标j,即xi,j,其归一化函数为其中Ni是行业的个数,是指标j的均值,对于变量xi首先减去该类型变量的均值这个过程叫做居中化,让后再除以该类型变量的居中化后的标准差,由于标准差的量纲与居中化以后变量的量纲相同,因此经过归一化处理后的变量是无量纲的;

(b)确定评估指标的权重值,指标j的指标系数由指标权重γj与模块权重δj共同决定:βj=δj×γj

模块权重δj,根据专家评估确定指标体系中五大模块的权重;

指标权重γj,采用指标归一化后的均标准差作为衡量每个指标重要性的参数,

(c)采取多元线性加权的方式进行行业科技发展水平的评估:

针对行业i,其科技发展水平ISTDi=β1f(xi,1)+β2f(xi,2)+…+βJf(xi,J),其中J为指标总个数,ISTDi为行业i的行业科技发展力评估值。

作为优选,所述步骤(3)中多元线性回归的建模方式包含如下步骤:

(a)建立多元回归方程:ISTDi=b0+b1F1i+b2F2i+…+bnFni+ei,其中ISTDi为行业i的行业科技发展力评估值;

F1i、F2i……Fni是行业i某一年的指标值;

b0,b1,……bn为自变量的回归系数,其中b0为截距;

ei是残差,所有ei独立同分布,且ei~N(o,s2)。

(b)对三类指标分别进行自变量预处理,对第一类指标采用取以10为底对数方式进行处理,对第二类指标采用取以2为底对数方式进行处理,对第三类指标采用平方的方式进行处理;所述第一类指标包括从业人员学历结构、国内授权发明专利产出率、中文核心期刊论文产出率、综合能耗产出率、烟尘排放率、粉尘排放率,所述第二类指标包括国内发明专利申请、国内专利申请、科研仪器设备配置、科研仪器设备人均配置、人均创新产出、新产品研发人均投入、人均研发经费,所述第三类指标为累计国内有效发明专利全国占比;

(c)在训练阶段,根据历史的ISTDi与F1,F2,…,Fn来计算b0,b1,…,bn,s2

(d)在评估阶段,通过新的F1,F2,…,Fn与训练阶段获得的b0,b1,…,bn,s2,来计算ISTDi

所述的历史ISTDi采用专家打分的方式或利用附加模块中的获奖数量产生历史的ISTDi

基于所述多元线性回归的的建模方式,建立模型1,该模型采用指标体系中的所有指标,或采用参数优化步骤后的指标,作为模型自变量,利用所采集的数据计算得出b0,b1,…,bn,s2,进而得出相关行业科技发展力评估值。

作为优选,在所述模型1的基础上进一步采用AIC(Akaike's An Information Criterion)信息量作为逐步回归的指标,通过不断去掉使得AIC下降最快的自变量,来建立新的回归模型,直到去掉任意一个自变量都无法使得新模型的AIC下降为止,得到模型2,利用所采集的数据,计算得出b0,b1,…,bn,s2,进而得出相关行业科技发展力评估值。

作为优选,在所述模型2的基础上进一步采用回归诊断的方式删除异常点,得到更加稳定的模型3,利用所采集的数据,计算得出b0,b1,…,bn,s2,进而得出相关行业科技发展力评估值。

本发明的第二个目的是提供一种行业科技发展力量化评估系统,包括指标体系模块、数据采集模块、评估建模模块和结果输出模块,其中:

所述指标体系模块用于指标体系的构建,所述数据采集模块基于指标体系模块中的每项指标进行相应的数据采集,采集后的数据导入所述的评估建模模块,进而由所述的结果输出模块输出行业科技发展力评估值;

所述指标体系模块包括行业科技环境、行业科技投入、行业科技产出、行业核心竞争与行业社会经济影响五大模块,以及附加模块,每个模块包括一级指标与二级指标,具体指标如图1所示。

所述评估建模模块采用多元线性加权或多元线性回归的方式进行建模;

所述结果输出模块计算输出行业科技发展力评估值;

作为优选,数据采集模块之后,还还进一步包括数据补全模块和/或参数优化模块。

数据补全步骤是通过数据拟合或插值的方式,数据拟合曲线既能反映数据的总体分布,又不至于出现局部较大的波动,更能反映被逼近函数的特性,使求得的逼近函数与已知函数从总体上来说其偏差达到最小,数据拟合要求得到的近似函数更能反映数据的基本关系,在某种意义上更具有实用价值,作为优选,可采用基于线性拟合方式来完成数据补全。

参数优化步骤是为了将反映相同物理意义的指标删除,防止指标被重复计算,影响评价结果。本发明通过计算指标两两之间的皮尔森相关系数,发现相关指标,来对体系中的指标进行精简。皮尔森相关系数也叫皮尔逊积矩相关系数,是统计学中常用的一种线性相关系数,它是一种可以反映两个变量线性相关程度的统计量,其值介于-1与1之间。在经济学与社会学统计中,如果两个变量相关系数的绝对值大于0.9,则可以认为它们之间存在非常强的线性相关性。根据每个指标在模块中的分布情况,以及指标的重要程度,本发明在建模过程中移除反映相同物理意义的指标。

作为优选,所述模块(3)中多元线性加权的建模方式包含如下步骤:

(a)对采集的指标数据进行归一化处理,对于每个行业i的指标j,即xi,j,其归一化函数为其中Ni是行业的个数,是指标j的均值,对于变量xi首先减去该类型变量的均值这个过程叫做居中化,让后再除以该类型变量的居中化后的标准差,由于标准差的量纲与居中化以后变量的量纲相同,因此经过归一化处理后的变量是无量纲的;

(b)确定评估指标的权重值,指标j的指标系数由指标权重γj与模块权重δj共同决定:βj=δj×γj

模块权重δj,根据专家评估确定指标体系中五大模块的权重;

指标权重γj,采用指标归一化后的均标准差作为衡量每个指标重要性的参数,

(c)采取多元线性加权的方式进行行业科技发展水平的评估:

针对行业i,其科技发展水平ISTDi=β1f(xi,1)+β2f(xi,2)+…+βJf(xi,J),其中J为指标总个数,ISTDi为行业i的行业科技发展力评估值。

作为优选,所述模块(3)中的多元线性回归方程的建模方式包含如下步骤:

(a)建立多元回归方程:ISTDi=b0+b1F1i+b2F2i+…+bnFni+ei,其中ISTDi为行业i的行业科技发展力评估值;

F1i、F2i……Fni是行业i某一年的指标值;

b0,b1,……bn为自变量的回归系数,其中b0为截距;

ei是残差,所有ei独立同分布,且ei~N(o,s2);

(b)对三类指标分别进行自变量预处理,对第一类指标采用取以10为底对数方式进行处理,对第二类指标采用取以2为底对数方式进行处理,对第三类指标采用平方的方式进行处理;所述第一类指标包括从业人员学历结构、国内授权发明专利产出率、中文核心期刊论文产出率、综合能耗产出率、烟尘排放率、粉尘排放率,所述第二类指标包括国内发明专利申请、国内专利申请、科研仪器设备配置、科研仪器设备人均配置、人均创新产出、新产品研发人均投入、人均研发经费,所述第三类指标为累计国内有效发明专利全国占比;

(c)在训练阶段,根据历史的ISTDi与F1,F2,…,Fn来计算b0,b1,…,bn,s2

(d)在评估阶段,通过新的F1,F2,…,Fn与训练阶段获得的b0,b1,…,bn,s2,来计算ISTDi

所述的历史ISTDi采用专家打分的方式或利用附加模块中的获奖数量产生历史的ISTDi

基于所述的多元线性回归方程,建立模型1,该模型采用指标体系中的所有指标,或采用精简后指标体系中的指标,作为模型自变量,利用所采集的数据计算得出b0,b1,…,bn,s2,进而得出相关行业科技发展力评估值。

作为优选,在所述模型1的基础上进一步采用AIC(Akaike's An Information Criterion)信息量作为逐步回归的指标,通过不断去掉使得AIC下降最快的自变量,来建立新的回归模型,直到去掉任意一个自变量都无法使得新模型的AIC下降为止,得到模型2,利用所采集的数据,计算得出b0,b1,…,bn,s2,进而得出相关行业科技发展力评估值。

作为优选,在所述模型2的基础上进一步采用回归诊断的方式删除异常点,得到更加稳定的模型3,利用所采集的数据,计算得出b0,b1,…,bn,s2,进而得出相关行业科技发展力评估值。

本发明的有益效果是:

(1)本发明通过构建完整的评估指标体系,用量化方法评价我国国民经济行业的科技发展水平,并针对各产业领域科技进步的个性和共性特征,提出客观、有效、全面的评估指标体系,从而实现多维度量化评估。

(2)采用多元线性加权与多元线性回归的方式进行建模,在建模和运算的过程中,对抽取的数据进行了归类和分析以及补缺等,在多元线性回归的基础上,比较了三种模型的特点和结果,不断优化模型,优选地采用回归诊断+多元线性回归+逐步回归的方式进行建模,实现了行业科技发展力的量化评估。

附图说明

图1为本发明中指标体系包括的具体指标图。

图2为本发明中煤炭开采和洗选业经数据补全后的数据图。

图3为本发明采用多元线性加权建模方式中指标权重值分布图。

图4为本发明32个行业大类科技发展力综合评分示意图。

具体实施方式

以下实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

实施例1

根据《国民经济行业分类GB/4754-2011》划出的国民经济20个门类,96个大类,本实施例选取96个大类中的其中一类——“煤炭开采和洗选业”进行评估,但本发明中的行业科技发展力量化评估方法和系统适用于国民经济所有大类。

在“煤炭开采和洗选业”的量化评估中,首先构建评估指标体系,指标体系包括行业科技环境、行业科技投入、行业科技产出、行业核心竞争以及行业社会经济影响五大模块,以及附加模块,每个模块包括一级指标与二级指标,具体指标如图1所示,并采集2004年、2008年、2011年以及2012年相应指标数据。

数据补全,针对现有数据缺失部分,采用基于线性拟合的方式,完成数据补全,补全后的数据如图2所示,其中方格底部灰色部分的数据为补全数据。

参数优化,为了将反映相同物理意义的指标删除,防止指标被重复计算,影响评价结果。通过计算指标两两之间的皮尔森相关系数,发现相关指标,来对体系中的指标进行精简。根据每个指标在模块中的分布情况,以及指标的重要程度,移除以下指标:政府财政支持力度、自有科研机构密度、R&D人员密度、从业人员学历结构、国内发明专利申请、国内专利申请、产学研合作网络、研发劳务支出占比、科研仪器设备配置、科研仪器设备人均配置、累计国内有效专利量、新产品开发项目、创新研发密度。

采用多元线性加权的建模方式进行建模,包含如下步骤:

(a)对采集的指标数据进行归一化处理,对于每个行业i的指标j,即xi,j,其归一化函数为其中Ni是行业的个数,是指标j的均值。

(b)确定评估指标的权重值,指标j的指标系数由指标权重γj与模块权重δj共同决定:βj=δj×γj

模块权重δj,经专家打分后,五大模块的权重比例为:行业核心竞争30%,行业科技投入20%,行业科技产出20%,行业科技环境15%,行业社会经济影响15%;

指标权重γj,采用指标归一化后的均标准差作为衡量每个指标重要性的参数,

经计算后得出指标系数,具体数值如图3所示;

(c)采取多元线性加权的方式进行行业科技发展水平的评估:

针对行业i,其科技发展水平ISTDi=β1f(xi,1)+β2f(xi,2)+…+βJf(xi,J),其中J为指标总个数,ISTDi为行业i的行业科技发展力评估值。

经计算得出煤炭开采和洗选业的行业科技发展力评估值为:2004年,37.50;2008年,44.31;2009年,46.94,;2011年,51.59;2012年,52.69。根据这五年行业科技发展力评估值的数据,平均后获得该行业科技发展力综合评分为46.61。

基于上述的方法,根据《国民经济行业分类GB/4754-2011》,在制造业、采矿业和电力、热力、燃气及水生产和供应业三个大的行业门类所属的43个大类中进一步筛选了32个行业大类作为本发明的实施例,采集2004年、2008年、2011年以及2012年相应指标数据,进行行业科技发展力量化评估,所得出的行业科技发展力综合评分见图4。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1