一种军民融合数据信息定量分析系统的制作方法

文档序号:12672794阅读:360来源:国知局
一种军民融合数据信息定量分析系统的制作方法与工艺
本发明涉及一种军民融合数据信息定量分析系统,尤其涉及一种基于逻辑回归函数指标数据映射的军民融合数据信息定量分析系统。
背景技术
:军民融合指数研究大数据平台,是指建成以分析和决策系统为支撑的军民融合监测分析平台,完成通过研究军民融合达到为政府和投资者提供决策支持为目的的军民融合指数构建,深入开展军民融合相关政策、政务数据开放机制、军民融合指数算法研究的理论研究。指数的编制是指基于海量数据、采用科学计算方法统计得出的反映不同事件领域发展状况。广义的指数泛指所有研究社会经济现象数量变动的相对数,是用来表明现象在不同时间、不同空间、不同总体等相对变动情况的统计指标。例如,动态相对数,比较相对数、计划完成程度相对数。狭义指数仅指反映不能直接相加的复杂社会经济现象在数量上综合变动情况的相对数。例如,零售物价指数,消费价格指数、股价指数等。然而,目前并没有通过所公开的数据来分析军民融合指数的系统。技术实现要素:针对上述技术问题,本发明提供一种能够确定军民融合指数的军民融合数据信息定量分析系统。本发明的实施例提供的一种军民融合数据信息定量分析系统,用于确定选定地区在一定时间段内的军民融合指数,包括:指标构建模块,构建适合确定选定地区的军民融合指数的测算指标库;指标数据获取模块,基于所述指标构建模块构建的测算指标库从数据库中获取或者从外部获取与测算指标相关的指标数据;指标数据处理模块,对获取的所述指标数据进行无量纲化处理以得到无量纲化的测算指标值,其中,在无量纲化处理过程中包括异构数据进行转换处理,以使得经转换处理后的异构数据落入区间[0,1]的范围内;指数确定模块,基于各测算指标值来确定各测算指标的权重,并基于得到的各测算指标的权重来确定所述军民融合指数。可选地,所述测算指标库包括4个一级指标和44个二级指标,其中所述4个一级指标包括军民融合的环境指标、创新指标、效益指标和服务能力指标,所述环境指标包括12个二级指标,所述创新指标包括12个二级指标,所述效益指标包括11个二级指标,所述服务能力指标包括9个二级指标。可选地,所述环境指标包括如下12项二级指标:军民融合法律法规或中央政策数量、法律法规或中央政策关注领域覆盖率、军方政策发布数量、军方政策关注领域覆盖率、参与民融合部委机关比例、部门规章发布数量、部门规章关注领域覆盖率、军民标准通用化程度、地方军民融合管理机构覆盖率、地方文件发布数量、地方文件关注领域覆盖率、地方文件提及军民融合工作频率;所述创新指标包括如下12项二级指标:军工单位中参与民品研发科技人员的比重、民企军品科研资金投入比例、高校培养军队创新人才比例、技术交易额比率、军工企业研发经费支出占工业增加值比重、创新人才投入比例、军民结合创新企业比例、军民结合科技机构比例、创新产品率、军民融合专利占比、军民融合论文占比、创新成果转化率;所述效益指标包括如下11项二级指标:民参军企业军品生产资金投入的比率、军工企业民品研发资金投入的比率、参与军民融合工作的军工企业比例、军工企业股份制改造融资规模、行业内民参军企业比例、军工企业民品销售收入占比、军工企业民品销售利润占比、民参军企业军品销售收入占比、民参军企业军品销售利润占比、军工企业民品产值比重、民用企业军品产值比重、军民融合领域高新技术企业占比;所述服务能力指标包括如下9项二级指标:军队医疗保障社会化比率、武器装备维修社会化比率、武器装备采购社会化比率、战略交通运输力量社会化比率、地方高校培养军队干部数量、军队特招地方专业技术人员入伍数量、军民通用基础设施建设比率、军民通用物资储备社会化比率。可选地,获取的指标数据包括测算指标的当前值、总体值和基期值,所述基期值为所述一定时间段内的第一期的指标值,其中,所述异构数据通过当前值和基期值的比值表示。可选地,基于以下逻辑回归函数来对所述异构数据进行转换处理:其中:rij是第i个时期、第j个测算指标的原始指标值,取值范围为[0%,+∞];r′ij是经处理后的第i个时期、第j个测算指标的指标值,取值范围为[0,100%]。可选地,基于主成分分析法来确定每个一级指标的各个二级指标的权重,并基于各个二级指标的权重来确定每个一级指标的得分,所述每个一级指标的得分通过下述公式确定:其中,Pi为第i个一级指标的得分,Pik为第i个指标的第k个二级指标的指标值,wik第i个指标的第k个二级指标的权重。可选地,基于每个一级指标的得分,利用主成分分析法来确定每个一级指标的权重,并基于每个一级指标的权重来确定所述军民融合指数,所述军民融合指数通过下述公式确定:其中,C为军民融合指数,Pi为第i个一级指标的得分,wi为第i个一级指标的权重。可选地,所述指标数据获取模块通过爬取互联网或政府网站的数据来获取所需的指标数据。本发明提供的军民融合数据信息定量分析系统,该系统通过构建与军民融合相关的4个一级指标和44个二级指标,通过全面采集数据来利用多个指标对一个选定地区的军民融合指数进行测算,且在测算过程中,采用基于逻辑回归函数指标无量纲化,使得计算过程中能够容纳更多的指标,从而使得军民融合指数能更加准确的反应出区域军民融合真实水平。附图说明图1为本发明实施例提供的军民融合数据信息定量分析系统的结构示意图。图2为本发明实施例提供的军民融合数据信息定量分析系统确定军民融合指数的流程图。图3为本发明使用的逻辑回归函数的映射曲线图。具体实施方式以下结合附图对本发明的具体实施方式进行介绍。图1为本发明实施例提供的军民融合数据信息定量分析系统的结构示意图。本发明的实施例提供的一种军民融合数据信息定量分析系统,用于确定选定地区在一定时间段内的军民融合指数,如图1所示,该系统包括:指标构建模块1、指标数据获取模块2、指标处理模块3和指数确定模块4。其中,指标构建模块1用于构建适合确定选定地区的军民融合指数的测算指标库;指标数据获取模块2用于基于所述指标构建模块构建的测算指标库从数据库中获取或者从外部获取与测算指标相关的指标数据;指标数据处理模块3用于对获取的所述指标数据进行无量纲化处理以得到无量纲化的测算指标值,其中,在无量纲化处理过程中包括异构数据进行转换处理,以使得经转换处理后的异构数据落入区间[0,1]的范围内;指数确定模块4用于基于各测算指标值来确定各测算指标的权重,并基于得到的各测算指标的权重来确定所述军民融合指数。本发明的军民融合数据信息定量分析系统的工作流程如下(参考图2):首先,指标构建模块1根据控制指令构建适合计算军民融合指数的测算指标库(S100);接着,指标数据获取模块2从系统数据库或者外部数据中获取相应的指标数据(S200),并发送给指标数据处理模块3;再接着,指标数据处理模块3对获取的指标数据进行处理。在处理过程中,对异构数据进行转换处理后作为计算军民融合指数的测算指标值(S300),并将测算指标值发送给指数确定模块4;最后,指数确定模块4基于测算指标值来计算军民融合指数(S400)。具体地,本发明基于大量的文献资料与历史研究,制定了用于确定军民融合指数的4个一级指标和44个二级指标,这些一级指标和二级指标通过在指标构建模块1中构建并构成测算指标库,并存储在系统的数据库中的。这4个一级指标具体包括环境指标、创新指标、效益指标和服务能力指标,44个二级指标具体为:所述环境指标包括12个二级指标,所述创新指标包括12个二级指标,所述效益指标包括11个二级指标,所述服务能力指标包括9个二级指标。具体地,所述环境指标包括如下12项二级指标:军民融合法律法规或中央政策数量、法律法规或中央政策关注领域覆盖率、军方政策发布数量、军方政策关注领域覆盖率、参与民融合部委机关比例、部门规章发布数量、部门规章关注领域覆盖率、军民标准通用化程度、地方军民融合管理机构覆盖率、地方文件发布数量、地方文件关注领域覆盖率、地方文件提及军民融合工作频率。所述创新指标包括如下12项二级指标:军工单位中参与民品研发科技人员的比重、民企军品科研资金投入比例、高校培养军队创新人才比例、技术交易额比率、军工企业研发(R&D)经费支出占工业增加值比重、创新人才投入比例、军民结合创新企业比例、军民结合科技机构比例、创新产品率、军民融合专利占比、军民融合论文占比、创新成果转化率(专利转化成产品或产品为专利)。所述效益指标包括如下11项二级指标:民参军企业军品生产资金投入的比率、军工企业民品研发资金投入的比率、参与军民融合工作的军工企业比例、军工企业股份制改造融资规模、行业内民参军企业比例、军工企业民品销售收入占比、军工企业民品销售利润占比、民参军企业军品销售收入占比、民参军企业军品销售利润占比、军工企业民品产值比重、民用企业军品产值比重、军民融合领域高新技术企业占比。所述服务能力指标包括如下9项二级指标:军队医疗保障社会化比率、武器装备维修社会化比率、武器装备采购社会化比率、战略交通运输力量社会化比率、地方高校培养军队干部数量、军队特招地方专业技术人员入伍数量、军民通用基础设施建设比率、军民通用物资储备社会化比率。在本发明的一示例中,以绵阳的军民融合水平为评价目标,考察时间范围为2006-2015共10年时间,但是并不局限于此,可以构建其他城市、其他省份甚至全国或者某个国家的军民融合指标体系。构建的指标具体如下表1所示。表1接着,基于指标构建模块1构建的测算指标库,指标数据获取模块2获取与测算指标库中的各指标相对应的指标数据,具体可包括各测算指标的当前值、测算指标的总体值。对于无法获取总体值或者没有总体值的测算指标,还需获取该测算指标的基期值。当前值、总体值和基期值是以军事融合指数的测算时间点为基准的,可以年或月为单位,基期值为测算时间范围内的第一期的指标值。对于能够直接从系统的数据库获得数据则直接从数据库中获取,如果不能直接从数据库中获取的指标数据,主要从以下两个2个渠道中获取:(1)互联网数据,可通过专门构建的大规模数据爬取平台采集及第三方数据合作供应商提供,包括企业数据、地方高校数据和金融机构数据等。(2)政府数据,涉及政府多个部门数据,包含政府网站数据,全军武器装备采购网,各部委网站,工业和信息化部、国防科工委和武装部等多部门数据。具体地,可用Python语言编程爬取互联网上的互联网数据和政府网站上的政府数据,并且将爬取的数据存放在MySQL数据库,其具体过程是:用户输入网址之后,经过DNS服务器,找到服务器主机,向服务器发出一个请求,服务器经过解析之后,发送给用户的浏览器HTML、JS、CSS等文件,浏览器解析出来。因此,用户看到的网页实质是由HTML代码构成的,爬虫爬来的便是这些内容,通过分析和过滤这些HTML代码,实现对图片、文字、以及上传附件等资源的爬取,这样就可以对各互联网数据,政府网站等相关的内容进行爬取。指标数据获取模块2在获取相关数据后,对这些数据进行脱敏处理与验证后录入数据库,为后续的指数的分析做足准确。接着,指标数据处理模块3对指标数据获取模块2获取的指标数据进行无量纲化处理,以得到无量纲化的测算指标数据。在获取各测算指标的指标数据时,绝大部分测算指标能够同时获取当前值和总体值,这样可以利用当前值和总体值的比值来得到该测算指标的指标值,对于具有正常数据的指标可称为正常测算指标,这种正常测算指标的指标值可称为正常数据,其结构为百分比,生成形式如下式(1)所示:xx%表示正常测算指标的指标值。由于当前值比总体值小,所以计算结果范围一定落在区间[0%,100%]内。由于总指数是由全部指标数据加权而成,如果指标全部为正常数据,其范围是[0%,100%],那么总指数的得分也在[0%,100%]。通过上述式(1),可以对具有当前值和总体值的正常测算指标进行无量纲化处理,从而得到无量纲化的测算指标数据。而对于一些测算指标,无法获得或者没有总体值,对于这类测算指标,只能使用当前值和基期值来计算该测算指标的指标值,这种测算指标可称为异常测算指标,这种异常测算指标的指标值可称为异构数据,其生成方式如下式(2)所示:xxx%表示异常测算指标的指标值。基期值为考察时间范围内第一期的指标值,根据前述示意性实施例,基期值指的是该指标在2006年的取值。由于当前值有很可能大于基期值,所以异常测算指标的指标值通常会落在[0%,+∞]。由于异常测算指标的指标值的范围有可能超过100%,如果总指数计算过程中包括异常测算指标的指标值,那么总指数的结果有可能大于100%,造成总指数意义错误。因此,有必要将异构数据进行映射。为使指数计算能够融合这类异构指标到指标体系中进行计算,需要使用函数映射,将[0,+∞]的数据映射到[0%,100%]之间,使其能参与计算。本发明使用逻辑回归函数来达到此目的,逻辑回归函数的公式如下式(3)所示:其中:rij是第i个时期、第j个指标的原始数据。r′ij是第i个时期、第j个指标的原始数据处理以后的数据。应用到本发明中,rij为第i个时期、第j个异常测算指标的原始指标值,r′ij为经处理以后的第i个时期、第j个异常测算指标的改进指标值。该函数的特点是当自变量取值范围为[0,∞]时,因变量的取值[0%,100%]。上述逻辑回归函数的图形可如图3所示,借助该函数,可以使得指标数据最终得分值在[0%,100%]之间。举例说明:假设某指标体系中,绝大部分指标均为百分比,但有两个指标不是百分比,它们只有当前值,没有总体值,无法用部分除以整体的方式得到百分比指标。对于这样的指标,可以选择第一期值为基期值,用当前值除以基期值得到异构数据。假设今年军方发布政策数量为4个,而2006年发布的政策为3个,那么这个指标处理后的数据为4/3=133%。再比如今年地方高校培养军队干部数量为1200人,而2006年为500人,那么这个指标处理后的数据1200/500=240%。将这两个指标进行映射的结果分别为:映射后的结果均在[0%,100%]之内,可以参与到总指数的计算当中。根据本发明的一示例所获取的数据,用上述方法将服务能力中的两个异构指标进行转化后得到下表2所示的结果:表2接着,指数确定模块4基于指标数据处理模块3处理的各无量纲化的测算指标值来确定各测算指标的权重。即,在将各指标转换成百分比以后,需要将这些指标的数据加权求和才能得到总指数(军民融合指数)。加权求和的步骤与指标的级数相同,本发明的军民融合指数指标分两个层级,则需加权求和两次。如果指标分三个层级,则需加权求和三次。本发明采用主成分分析法来对各测算指标的权重进行计算,具体如下所示:<二级指标权重计算>首先计算各一级指标的二级指标的权重。利用主成分分析法计算二级指标的权重的步骤如下所示:首先,利用各二级测算指标的指标值构建样本相关矩阵R,然后求解相关矩阵R的特征方程,得到相关矩阵R的特征值和特征向量,并将特征值按大小顺序进行排列;接着,选取特征值的累积方差贡献率达到85%以上时的测算指标,与各测算指标线性组合后得到标准化主成分模型,主成分模型Yj的格式为ai是第i个变量Xi与第j个主成分的相关度,1≦j≦i≦n。然后,取各测算指标在线性组合中的系数的平均值作为该测算指标的权重。以军民融合中的服务能力部分为例,这部分的二级指标有9个,采用主成分分析法确定各二级指标的权重的描述如下。(1)计算特征值和贡献率:根据指标数据处理模块4确定的服务能力的二级指标Xi(i=1,2,…,9)的指标值构建相关矩阵R,解相关矩阵R的特征方程,得到相关矩阵R的9个特征值λi(i=1,2,…,9)和特征向量ei(i=1,2,…,9),将特征值按大小顺序进行排列,如表3所示:表3(2)提取主成分:由表3可知,前3个测算指标的累积方差贡献率已达到85%以上,则可以确定主成分个数为3。(3)计算权重:然后提取这两个特征的特征值和计算出相应的特征向量,与测算指标X1~X13线性组合后得到主成分模型,各测算指标在线性组合中的系数如下表4所示:表4将上表2中的线性组合的系数取平均值作为各个测算指标的权重。最后得到的各测算指标的权重如下表5所示:表5<一级指标权重计算>根据前述内容计算的二级指标的权重,利用下述加权公式(4)来计算一级指标的得分:其中,Pi为第i个一级指标的得分,Pik为第i个指标的第k个二级指标的指标值,wik第i个指标的第k个二级指标的权重。根据二级指标的指标值和权重,通过上述公式(4)可得到一级指标的得分。接着,与二级指标权重的计算方法类似,可利用主成分分析法得到一级指标的权重,然后基于下述加权公式(5)来计算军民融合指数:其中,C为军民融合指数,Pi为第i个一级指标的得分,wi为第i个一级指标的权重。根据本发明的一示例,得到的2006年至2015年这十年间绵阳地区的军民融合指数如下表6所示:表6年份军民融合总指数200638.82%200741.52%200843.68%200947.58%201050.94%201152.59%201251.94%201354.04%201457.43%201557.90%综上,本发明的军民融合数据信息定量分析系统在计算军民融合指数时,采用了逻辑回归函数来对异构数据进行转换处理,从而可以容纳更多的指标,所以总指数的得分会更加接近真实值,能更加贴近的反映出军民融合指数的总得分,可以促进军民融合企业的发展,为政府和投资者提供决策依据。显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1