基于pca?dea二维综合评价模型的电力施工主体效益分析方法

文档序号:10687736阅读:249来源:国知局
基于pca?dea二维综合评价模型的电力施工主体效益分析方法
【专利摘要】本发明公开一种基于PCA?DEA二维综合评价模型的电力施工主体效益分析方法,包括:样本数据预处理,剔除包含异常数据和缺失数据的样本;使用主成分分析法从原始样本数据中筛选出主成分指标,并对电力施工企业的内部资源转化能力进行分析;以上述主成分指标作为运营变量,选定输入指标和输出指标,使用数据包络分析法进行电力施工企业之间的效益对比分析;将两种方法的评价结果加以对比,分别以DEA和PCA的评价值作为横、纵坐标轴建立二维坐标,进行电力施工主体的综合评价与分析。该电力施工主体效益分析方法简捷实用,可作为主要依据来评判企业的竞争力和整个市场中企业的效益分布,对电力工程市场的整体分析提供实用的侧面参考。
【专利说明】
基于PCA-DEA二维综合评价模型的电力施工主体效益分析 方法
技术领域
[0001] 本发明涉及电力工程市场分析评估技术领域,特别是涉及一种基于PCA-DEA二维 综合评价模型的电力施工主体效益分析方法。
【背景技术】
[0002] 随着我国经济的持续发展,电力需求不断提高,相关的电力工程投资规模也越来 越大。为了规范电力工程市场的秩序,国家建立了承装(修、试)电力设施许可证制度。该制 度规定,进入电力工程市场的企业必须获得承装(修、试)电力设施许可证,并接受国家能源 局(原为国家电力监管委员会)的持续性监管。广东省本地的承装(修、试)电力设施持证企 业数量截止至2013年已达1049家。目前的监管手段对规范市场起到了良好的作用,但是还 存在一些问题和空缺,特别是在数据不完全情况下对电力工程供给市场的分析方法的研 究。在电力工程供给市场方面,由于没有有效的渠道,项目中主要依赖自查表、调研等方式 获得基础数据,很难保证数据的完整性和准确性。如何在这种情况下得到关于市场的尽量 准确的分析结果,如何对电力施工企业自身能力以及企业之间的相对效益进行科学有效的 评价,是有待研究的问题。对于电力工程市场的主体部分,即各电力施工企业,主要是进行 其综合效益的评价,以此作为主要依据来评判企业的竞争力和整个市场中企业的效益分 布。而主成分分析(Principal Component Analysis,PCA)法和数据包络分析(Data Envelopment Analysis,DEA)方法各自具有其中的部分功能,故将这两种方法结合起来显 然是适用于对电力施工企业进行评价的综合方法。

【发明内容】

[0003] 本发明的目的在于克服现有技术的缺点与不足,提供一种基于PCA-DEA二维综合 评价模型的电力施工主体效益分析方法。
[0004] 本发明的目的通过下述技术方案实现:
[0005] -种基于PCA-DEA二维综合评价模型的电力施工主体效益分析方法,包括如下步 骤:
[0006] S1、对收集到的电力施工企业的各项样本数据预处理,进行异常数据的识别,剔除 包含异常数据和缺失数据的样本;
[0007] S2、使用主成分分析法从原始样本数据中筛选出主成分指标,并对电力施工企业 的内部资源转化能力进行分析;
[0008] S3、以所述主成分指标作为运营变量,选定输入指标和输出指标,使用数据包络分 析法进行电力施工企业之间的效益对比分析;
[0009] S4、将上述主成分分析法和数据包络分析法的评价结果加以对比,分别以数据包 络分析法和主成分分析法的评价值作为横、纵坐标轴建立二维坐标系,进行电力施工主体 的综合评价与分析。
[0010]作为优选的,所述步骤Si中样本数据预处理包括以下分步骤:
[0011] sii、根据承装、承修或者承试电力设施许可证的等级规定将电力施工企业分为五 个等级,确定每个等级中各项指标的区间范围;
[0012] S12、遍历所有电力施工企业,检查其各项指标是否在其许可证等级所对应的区间 范围内,若指标值超过区间边界比例阀值,则直接判断为异常数据,剔除该企业样本;
[0013] S13、对剩余的企业样本,采用RobustZ值法对各项指标进行异常数据的识别,并对 包含异常数据的企业样本进行剔除。
[0014] 作为优选的,所述步骤S2包括以下分步骤:
[0015] S21、读取样本观测数据矩阵:
[0016]
[0017]其中,Xlj表示第i个企业样本第j个指标的值;[0018] S22、对原始数据进行标准化处理:
[0021] S23、计算样本相关系数矩阵:
[0019]
[0020]
[0022]
[0023] 假定原始数据标准化后仍用Xlj表示,则经标准化处理后的数据的相关系数为:
[0024]
[0025] S24、用雅克比方法求相关系数矩阵R的特征值(λ^λ^λρ)和相应的特征向量ai = (an,ai2,·?Ρ),i = 1,2···ρ;
[0026] S25、根据各个主成分累计贡献率的大小选取前k个主成分;
[0027] S26、计算主成分得分,根据标准化的原始数据,按照各个企业样本顺序,分别代入 主成分表达式,得到各主成分下的各个企业样本的主成分得分,具体形式为:
[0028] Fi = aixii+a2Xi2+...+akXik,i = l,2···η。
[0029] 作为优选的,所述步骤S3包括以下分步骤:
[0030] S31、从所述步骤S2中的主成分指标中选择DEA模型的输入指标和输出指标;
[0031 ] S32、设有η个决策单元,确定每个DMUj (j = 1,2,…η)的输入、输出向量
[0032] Xj=(xij,x2j,---,Xmj)T>0, j = l,---,n;
[0033] Yj=(yij,y2j,---,ysj)T>〇, j = l,---,n;
[0034] 333、定义权变量丫=(>1,¥2,.",¥111)1'和11=(111,112,.",11;〇 1',构造011]」(]_ = 1,2,"11) 的效益评价指数
[0035] S34、对于每一个DMUj(j = l,2,…n),求使Ej达到最大值的权向量,得至_A的C2R模 型:对于每一个DMUj (j = 1,2,…η ),构造以下极大化问题:
[0036]
[0037] S35、对上述分式规划问题,令? = ^:'μ = ?ιι,ω =tv,则将模型化为以下等价线性 xI. 1 规划问题:
[0038]
[0039] S 3 fi、为傾干給3合D E A的有效性,考虑模型的对偶模型的等式形式:
,:其中,S-= (Sl-,S2-,…,Sm-)是111项输入的松弛变量,S+= (S1+, S2+,…,Ss+)是8项输出的松弛变量,λ= (A1,λ2,…,λη)是η个DMU的组合系数,eiT= (I,1,…, l)m、e2T=(l,1,···,l)s,e是个很小的正数;
[0040] S37、解DEA模型,得到每一个DMUj (j = 1,2,…η)的效益评价值Ej。
[0041 ]作为优选的,所述步骤S4包括以下分步骤:
[0042] S41、根据所述步骤S2和S3的计算结果,选取适当的主成分分析分界值以及数据包 络分析分界值;
[0043] S42、以数据包络分析得分为横坐标、以主成分分析得分为纵坐标,建立二维坐标 系,将所有样本按其得分在二维坐标系上分布,进行综合分析。
[0044] 作为优选的,所述贡献率指某个主成分的方差占全部方差的比重
[0045] 作为优选的,所述主成分个数k的选取,根据主成分的累积贡献率来决定,要求累 计贡献率达到85%以上,以此保证综合变量能包括原始变量的绝大多数信息。
[0046] 作为优选的,所述主成分包括净资产(单位:万元)、设备总量(单位:台)、技术力量 (单位:人)、进网电工(单位:人)、工程业绩(单位:万元)。
[0047] 作为优选的,所述区间边界比例阀值为15%。
[0048] 本发明相对于现有技术具有如下的优点及效果:
[0049] 1、本发明提供的基于原对偶内点法的地区电网载荷裕度分析方法简捷实用,不需 要迭代计算,求解速度快,能够在数据不完全情况下筛选出关键指标和数据,对电力工程供 给市场进行分析。
[0050] 2、本发明能够对电力施工企业自身能力以及企业之间的相对效益进行科学有效 的评价。以二维尺度展现评价的结果,直观明了,以此作为主要依据来评判企业的竞争力和 整个市场中企业的效益分布。
【附图说明】
[0051] 图1为本发明中公开的一种基于PCA-DEA二维综合评价模型的电力施工主体效益 分析方法的流程步骤图;
[0052] 图2为实施例中企业样本效益随工程业绩的变化图;
[0053] 图3为实施例中企业样本在不同效益值下的数目分布图;
[0054]图4为实施例中企业样本的DEA/PCA二维综合分析图。
【具体实施方式】
[0055]为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对 本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用 于限定本发明。
[0056] 实施例
[0057]如图1所示,本实施例公开了一种基于PCA-DEA二维综合评价模型的电力施工主体 效益分析方法,包括如下步骤:
[0058] S1、对收集到的电力施工企业的各项样本数据预处理,进行异常数据的识别,剔除 包含异常数据和缺失数据的样本;
[0059] S2、使用主成分分析(PCA)法从原始样本数据中筛选出主成分指标,并对电力施工 企业的内部资源转化能力进行分析;
[0060] S3、以上述主成分指标作为运营变量,选定输入指标和输出指标,使用数据包络分 析(DEA)法进行电力施工企业之间的效益对比分析;
[0061] S4、将两种方法分别评价的结果(分值与排序)加以对比,分别以DEA和PCA的评价 值作为横、纵坐标轴建立二维坐标屏幕,进行电力施工主体的综合评价与分析。
[0062]电力工程市场的主体部分,即各电力施工企业,主要是进行其综合效益的评价,以 此作为主要依据来评判企业的竞争力和整个市场中企业的效益分布。本实施例的电力施工 主体效益分析方法,基于成熟的数学理论和稳定的数学规划算法发展而来,计算速度快,稳 定性好,是一种简捷实用的分析方法。
[0063] 具体的:
[0064] 步骤Sl、样本数据预处理,具体步骤包括:
[0065] Sll、根据承装(修、试)电力设施许可证的等级规定将电力施工企业分为一级、二 级、三级、四级、五级这五个等级,其中,一级资质为最高等级,五级资质为最低等级。确定每 个等级中各项指标的区间范围;
[0066] S12、遍历所有电力施工企业,检查其各项指标是否在其许可证等级所对应的区间 范围内。若指标值超过区间边界15%以上,则直接判断为异常数据,剔除该企业样本;
[0067] S13、对于剩余的企业样本,采用RobustZ值法(稳健统计法)对各项指标进行异常 数据的识别,并对包含异常数据的企业样本进行剔除。本实施实例选择五级资质的企业作 为分析样本,对样本数据预处理的结果如表1所示。表1为本实施实例中企业样本数据预处 理结果。
[0068] 表 1
[0070] 步骤S2、使用主成分分析(PCA)法从原始样本数据中筛选出主成分指标,并对电力 施工企业的内部资源转化能力进行分析,具体步骤包括:
[0071] S21、读取样本观测数据矩阵:
[0072]
[0073] 其中,Xlj表示第i个企业样本第j个指标的值;[0074] S22、对原始数据进行标准化处理:
[0079]为方便,假定原始数据标准化后仍用Xlj表示,则经标准化处理后的数据的相关系 数为:
[0075]
[0076]
[0077]
[0078]
[0080]
[0081] S24、用雅克比方法求相关系数矩阵R的特征值(λ^λ^λρ)和相应的特征向量ai = (an,ai2,·?Ρ),i = 1,2···ρ;
[0082] S25、根据各个主成分累计贡献率的大小选取前k个主成分,这里贡献率指某个主 成分的方差占全部方差的比重
[0083] 主成分个数k的选取,主要根据主成分的累积贡献率来决定,要求累计贡献率达到 85%以上,以此保证综合变量能包括原始变量的绝大多数信息。对本实施实例进行分析,选 取净资产(万元)、设备总量(台)、技术力量(人)、进网电工(人)、工程业绩(万元)五个指标 作为主成分;
[0084] S26、计算主成分得分。根据标准化的原始数据,按照各个企业样本顺序,分别代入 主成分表达式,就可以得到各主成分下的各个企业样本的主成分得分。具体形式为:
[0085] Fi = a1xil+a2Xi2+."+akXik,i = 1,2···η。在本实施实例中选取部分企业,列出其主成 分指标及PCA得分如表2所示。表2为本实施实例中部分企业样本的主成分指标及PCA得分。
[0086] 表 2
[0088] 步骤S3、以上述主成分指标作为运营变量,选定输入指标和输出指标,使用数据包 络分析(DEA)法进行电力施工企业之间的效益对比分析,具体步骤包括:
[0089] S31、选取净资产、设备总量、技术力量和进网电工人数作为输入指标,选取工程业 绩作为输出指标。
[0090] S32、共有318个决策单元,确定每个DMUj(j = 1,…,318)的输入、输出向量
[0091] Xj=(xij,x2j,---,Xmj)T>〇,j = 1,---,318
[0092] Yj=(yij,y2j,---,ysj)T>〇,j = 1,···,318;
[0093] 533、定义权变量丫=(>1,¥2,.",¥111)1'和11=(111,112,.",11 3)1',构造011^(]_ = 1,2,"11) 的效益评价指f
;
[0094] S34、对于每一个DMUj(j = 1,2,···!〇,求使Ej达到最大值的权向量。因此得到DEA的 C2R模型:对于每一个DMUj (j = 1,2,…η ),构造以下极大化问题:
[0095]
[0096] S35、对上述分式规划问题Z
则将模型化为以下等价线 性规划问题:
[0097]
[0098] S36、为便于检验DEA的有效性,考虑模型的对偶模型的等式形式(带有松弛变量且 具有非阿基米德无穷小E
项输入的松弛变量;S+= (si+,S2+,…,Ss+)是s项输出的松弛变量;λ = (A1,λ2,…,λη)是η个 DMU的组合系数;eiT=(l,l,···,l)m、e2T=(l,l,···,l) s,e是个很小的正数;
[0099] S37、解DEA模型,得到每一个DMUj( j = 1,2,…η)的效益评价值Ej。对于本实施实例, 选取部分企业,列出其DEA得分如表3所不。表3为本实施实例中部分企业样本的DEA得分值。
[0100] 表3
[0102] 企业效益随工程业绩的变化情况如图2所示,列出所有企业样本的效益分布如图3 所示。
[0103] S4、将两种方法分别评价的结果(分值与排序)加以对比,分别以DEA和PCA的评价 值作为横、纵坐标轴建立二维坐标屏幕,进行电力施工主体的综合评价与分析,具体步骤包 括:
[0104] S41、列出前11个企业样本的PCA和DEA得分如表4所示。表4为本实施实例中前11个 企业样本的PCA得分值及DEA得分值。
[0105]耒4
[0108] 根据步骤S2和S3的计算结果,此处选取0.0 TEA值和0.5PCA值作为界限。
[0109] S42、以DEA得分为横坐标、以PCA得分为纵坐标,建立二维坐标系,将所有样本按其 得分在二维屏幕上分布,得到企业DEA/PCA二维综合分析图如图4所示。由图可知,处于右上 区域(高综合效益区)的企业共有26家,其DEA和PCA评价结果均属于"高水平",说明其相对 于其他企业的有效性显著,又是在差异最大的投入产出比综合指标上得高分,相对效益优 异,该区域的企业市场竞争力以及企业资源转化能力较高。但是这类企业相对较少。
[0110] 处于左上方区域和右下方区域定义为"中综合效益区"。处于左上方区域的企业共 有11家,其DEA评价得分较低,但PCA得分较高,说明处于此区域的企业相对效益较差,但在 差异最大的投入产出比综合指标上表现较好,与其他企业竞争过程中竞争力较差,企业内 部资源转化能力较高。处于右下方区域的企业则相反,其反映相对有效性的DEA得分较高, 但是在差异最大的投入产出比综合指标上表现较差,与其他企业竞争过程中竞争力较强, 企业内部资源转化能力不高,这类企业共有27家。对于这两个区域的企业应该根据具体情 况做进一步的分析,如决策者希望以DEA评价为主,以PCA评价为辅,则应该选择落在右边区 域的企业进行分析。
[0111] 剩余企业全部处于左下区域(低综合效益区),处于该区域的企业数量最多,而该 区域是DEA和PCA的值都较小的区域,也即是企业整体效益比较差的区域,该区域的企业市 场竞争力以及企业资源转化能力较低。
[0112] 剩余超过半数的企业全部处于左下区域,处于该区域的企业数量最多,而该区域 是DEA和PCA的值都较小的区域,也即是企业整体效益比较差的区域。这说明该实施实例的 电力工程市场中施工企业的整体效益比较低,原因可能是现阶段施工企业的数量过多,而 待建工程量过少,造成"僧多粥少"的现象,从而导致了施工企业普遍的效益低下。
[0113] 上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的 限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化, 均应为等效的置换方式,都包含在本发明的保护范围之内。
【主权项】
1. 一种基于PCA-DEA二维综合评价模型的电力施工主体效益分析方法,其特征在于,包 括如下步骤: 51、 对收集到的电力施工企业的各项样本数据预处理,进行异常数据的识别,剔除包含 异常数据和缺失数据的样本; 52、 使用主成分分析法从原始样本数据中筛选出主成分指标,并对电力施工企业的内 部资源转化能力进行分析; 53、 以所述主成分指标作为运营变量,选定输入指标和输出指标,使用数据包络分析法 进行电力施工企业之间的效益对比分析; 54、 将上述主成分分析法和数据包络分析法的评价结果加以对比,分别以数据包络分 析法和主成分分析法的评价值作为横、纵坐标轴建立二维坐标系,进行电力施工主体的综 合评价与分析。2. 根据权利要求1所述的基于PCA-DEA二维综合评价模型的电力施工主体效益分析方 法,其特征在于,所述步骤S1中样本数据预处理包括以下分步骤: 511、 根据承装、承修或者承试电力设施许可证的等级规定将电力施工企业分为五个等 级,确定每个等级中各项指标的区间范围; 512、 遍历所有电力施工企业,检查其各项指标是否在其许可证等级所对应的区间范围 内,若指标值超过区间边界比例阀值,则直接判断为异常数据,剔除该企业样本; 513、 对剩余的企业样本,采用RobustZ值法对各项指标进行异常数据的识别,并对包含 异常数据的企业样本进行剔除。3. 根据权利要求1所述基于PCA-DEA二维综合评价模型的电力施工主体效益分析方法, 其特征在于,所述步骤S2包括以下分步骤: 521、 读取样本观测数据矩阵:其中,Xlj表示第i个企业样本第j个指标的值; 522、 对原始数据进行标准化处理:523、 计算样本相关系数矩阵:假定原始数据标准化后仍用Xlj表示,则经标准化处理后的数据的相关系数为:524、 用雅克比方法求相关系数矩阵R的特征值(λ^λ^λρ)和相应的特征向量ai=(ail, ai2,·?Ρ),i = 1,2···ρ; 525、 根据各个主成分累计贡献率的大小选取前k个主成分; 526、 计算主成分得分,根据标准化的原始数据,按照各个企业样本顺序,分别代入主成 分表达式,得到各主成分下的各个企业样本的主成分得分,具体形式为: Fi = a1xil+a2xi2+."+akXik,i = l,2···η〇4.根据权利要求1所述的基于PCA-DEA二维综合评价模型的电力施工主体效益分析方 法,其特征在于,所述步骤S3包括以下分步骤: 531、 从所述步骤S2中的主成分指标中选择DEA模型的输入指标和输出指标; 532、 设有η个决策单元,确定每个DMUj (j = 1,2,…η)的输入、输出向量 X = (.V,., X, (...... λ·Μ( ); > 0, / = !,···,? γ' = (.'?,'.?'::,'··-r.;)( > j = n 533、 定义权变量丫=(>1,¥2,'",¥111)1'和11=(111,112,...,113) 1',构造011]」(」=1,2,"11)的效 益评价指数534、 对于每一个DMUj(j = 1,2,."η),求使Ej达到最大值的权向量,得到DEA的C2R模型: 对于每一个DMUj(j = l,2,···]!),构造以下极大化问题:535、 对上述分式规划问题'y = tu,ω =tv,则将模型化为以下等价线性规划 问题:S 3 6、为便于检验D E A的有效性,考虑模型的对偶模型的等式形式:其中,s^= (Sr,S2、…,8')是111项输入的松弛变量,S+= (S1+, S2+,…,Ss+)是8项输出的松弛变量,λ= (λχ,λ2,…,λη)是η个DMU的组合系数,eiT= (1,1,…, l)m、e2T=(l,1,···,l)s,e是个很小的正数; S37、解DEA模型,得到每一个DMUj (j = 1,2,…η)的效益评价值Ej。5. 根据权利要求1所述的基于PCA-DEA二维综合评价模型的电力施工主体效益分析方 法,其特征在于,所述步骤S4包括以下分步骤: 541、 根据所述步骤S2和S3的计算结果,选取适当的主成分分析分界值以及数据包络分 析分界值; 542、 以数据包络分析得分为横坐标、以主成分分析得分为纵坐标,建立二维坐标系,将 所有样本按其得分在二维坐标系上分布,进行综合分析。6. 根据权利要求3所述的基于PCA-DEA二维综合评价模型的电力施工主体效益分析方 法,其特征在于, 所述贡献率指某个主成分的方差占全部方差的比重7. 根据权利要求6所述的基于PCA-DEA二维综合评价模型的电力施工主体效益分析方 法,其特征在于, 所述主成分个数k的选取,根据主成分的累积贡献率来决定,要求累计贡献率达到85 % 以上,以此保证综合变量能包括原始变量的绝大多数信息。8. 根据权利要求3所述的基于PCA-DEA二维综合评价模型的电力施工主体效益分析方 法,其特征在于, 所述主成分包括净资产、设备总量、技术力量、进网电工、工程业绩。9. 根据权利要求2所述的基于PCA-DEA二维综合评价模型的电力施工主体效益分析方 法,其特征在于, 所述区间边界比例阀值为15%。
【文档编号】G06Q50/06GK106056274SQ201610339278
【公开日】2016年10月26日
【申请日】2016年5月19日
【发明人】荆朝霞, 王宏益, 华栋, 张高言
【申请人】华南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1