基于数据包络分析的评估指标选取方法及装置的制造方法

文档序号:9547690阅读:938来源:国知局
基于数据包络分析的评估指标选取方法及装置的制造方法
【技术领域】
[0001] 本发明涉及一种数据评估方法,尤其涉及一种基于数据包络分析的评估指标选取 方法。
【背景技术】
[0002] 数据包络分析(Data Envelopment Analysis,DEA)是一种常用的效率评估方法, 用于评价一组具有多个投入、多个产出的评估决策单元(Decision Making Units,DMUs)之 间的相对效率。1978年,Chames,Cooper和Rhodes提出了第一个DEA模型,这个模型被命 名为数据包络分析模型。该模型在评价多投入多产出DMU的规模有效性和技术有效性方面 十分有效。
[0003] 运用数据包络分析方法时需要根据不同的评价目的,选取不同的评价指标。目前, 选择评价指标的方法主要包括主成分分析法、因子分析法。其中,Aider和Golany釆用主 成分分析法对现有数据进行集成,解决了 DEA计算中投入、产出变量过多的问题。匡海波等 人应用主成分分析法对港口的投入产出指标进行筛选,用选取的评价指标计算其效率并排 序。Azadeh等人使用PCA方法测量每一个指标的重要性,并与DEA方法、数值分类法相结 合,用于产品质量评价。但是主成分分析法利用主成分代替原始变量,只能改进原始变量的 线性组合,与DEA方法的改进投入与产出指标的目的不相符,不利于管理者及时发现问题。 因子分析法可以将多个原始变量缩减成几个解释性较强的因子变量,从而实现计算过程降 维的目的。
[0004] 在计算过程之前,以上方法需要决策者主观确定每个因子变量的属性,人为规定 因子变量为投入变量还是产出变量;或只是借鉴别人已有的评价指标,导致评估效率低。由 于指标选取未引起决策者的足够重视,导致在指标选取、变量间的相关分析、指标属性确定 等方面存在一些问题,需要进一步完善。

【发明内容】

[0005] 本发明的其中一个目的在于提供一种基于数据包络分析的评估指标选取方法及 装置,以解决现有技术中指标选取需要决策者主观选取以及导致的评估效率低的技术问 题。
[0006] 为实现上述发明目的,本发明实施例提供了一种基于数据包络分析的评估指标选 取方法,包括:
[0007] S1、收集全部投入指标与产出指标,依据指标选取原则确定η个主要投入指标和m 个主要产出指标,n、m为正整数;
[0008] S2、对η个主要投入指标做相关性分析,确定相关性最强的至少两个主要投入指 标;
[0009] S3、利用上述至少两个主要投入指标与m个主要产出指标建立数据包络分析基础 模型,并利用所述数据包络分析基础模型计算每个评估决策单元的第一效率值;
[0010] S4、将剩余的主要投入指标依次引入所述数据包络分析基础模型以获取多个新的 数据包络分析模型,并分别计算每个新的数据包络分析模型对应的效率值;
[0011] S5、根据每个新的数据包络分析模型的效率值与第一效率值获取效率值变化比 例;并根据效率值变化比例超过第一预设值的个数与剩余的主要投入指标的总数获取效率 值变化超过率;
[0012] S6、若所述效率值变化超过率超过第二预设值,则将对应的主要投入指标引入到 上述数据包络分析基础模型中形成新的数据包络分析模型;将该新的数据包络分析模型作 为数据包络分析基础模型,返回步骤S4 ;
[0013] S7、当所得的效率值变化超过率全部小于所述第二预设值时,将此时数据包络分 析基础模型的主要投入指标作为最终选定的投入指标,m个主要产出指标作为最终选定的 产出指标。
[0014] 可选地,当主要产出指标的数量m超过一定值时,步骤S2中还包括对m个主要产 出指标做相关性分析,确定相关性最强的两个主要广生指标的步骤。
[0015] 可选地,步骤Sl中采用以下指标选取原则确定η个主要投入指标和m个主要产出 指标:
[0016] (1)选取的投入指标与产出指标之间需相互关联;
[0017] (2)选取的投入指标与产出指标的数值存在且为正值;
[0018] (3)评估决策单元的个数要大于等于投入指标与产出指标的数量之和的2倍。
[0019] 可选地,所述步骤S2中采用皮尔森方法对η个主要投入指标和/或m个主要产出 指标作相关性分析,所述皮尔森方法的公式如下:
[0021] 式中:η为样本量,X1为第i行主要投入指标的值,f为η行主要投入指标的平均 值,&为η行主要投入指标的方差,Y i为第i列主要投入指标的值,歹为η列主要投入指标 的平均值,&为η列主要投入指标的方差。
[0022] 可选地,步骤S3中数据包络分析基础模型为:

[0025] 式中为投入指标,y i为产出指标,λ i为第i个指标的权重,Θ为效率值,S为 投入松弛变量,S+为产出松弛变量,e和$为分别为分量为1的s维列向量、m维列向量,ε 为非阿基米德无穷小量。
[0026] 可选地,步骤S5中采用以下公式计算效率值变化比例:
[0027] 效率值变化比例=(每个剩余的主要投入指标的效率值-第一效率值)/第一效 率值X 100%。
[0028] 可选地,步骤S5中采用以下公式计算效率值变化超过率:
[0029] 效率值变化超过率=(效率值变化比例超过第一预设值的个数/剩余的主要投入 指标的总数)X 100%。
[0030] 第二方面,本发明实施例还提供了一种基于数据包络分析的评估指标选取装置, 基于上文所述的评估指标选取方法实现,包括:
[0031] 主要指标选取模块,用于收集全部投入指标与产出指标,依据指标选取原则确定η 个主要投入指标和m个主要产出指标,n、m为正整数;
[0032] 相关性分析模块,用于对η个主要投入指标做相关性分析,确定相关性最强的至 少两个主要投入指标;和,
[0033] 最终指标选取模块,用于执行以下步骤:
[0034] S4、将剩余的主要投入指标依次引入所述数据包络分析基础模型,形成多个新的 数据包络分析模型,并分别计算每个新的数据包络分析模型对应的效率值;
[0035] S5、根据每个新的数据包络分析模型的效率值与第一效率值获取效率值变化比 例;并根据效率值变化比例超过第一预设值的个数与剩余的主要投入指标的总数获取效率 值变化超过率;
[0036] S6、若所述效率值变化超过率超过第二预设值,则将对应的主要投入指标引入到 上述数据包络分析基础模型中形成新的数据包络分析模型;将该新的数据包络分析模型作 为数据包络分析基础模型,返回步骤S4 ;
[0037] S7、当所得的效率值变化超过率全部小于所述第二预设值时,将此时数据包络分 析基础模型的主要投入指标作为最终选定的投入指标,m个主要产出指标作为最终选定的 产出指标。
[0038] 可选地,当主要产出指标的数量m超过一定值时,所述相关性分析模块还包括产 出指标分析单元,用于对m个主要产出指标做相关性分析,确定相关性最强的两个主要产 生指标。
[0039] 可选地,所述最终指标选取模块包括效率值变化比例计算单元和效率值变化超过 率计算单元,其中:
[0040] 所述效率值变化比例计算单元采用以下公式计算效率值变化比例:
[0041] 效率值变化比例=(每个剩余的主要投入指标的效率值-第一效率值)/第一效 率值XlOO % ;
[0042] 所述效率值变化超过率计算单元采用以下公式计算效率值变化超过率:
[0043] 效率值变化超过率=(效率值变化比例超过第一预设值的个数/剩余的主要投入 指标的总
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1