基于多核支持向量回归机的电网基建工程造价预测方法

文档序号:6380099阅读:251来源:国知局
专利名称:基于多核支持向量回归机的电网基建工程造价预测方法
技术领域
本发明涉及数据挖掘技术,特别是涉及基于多核支持向量回归机的电网基建工程造价预测方法。
背景技术
近年来,电网行业的建设步伐较快,2010年完成电网建设投资454亿元,2011年完成电网建设投资297亿元。受内外部环境影响,电网的合理控制工程造价,提升电网基建工程造价管理精益化水平的需求非常迫切。外部环境,近几年CPI (Consumer Price Index,消费者物价指数)指数持续走高,主要设备材料价格上涨较快,同时,电监会等外部监管单位对基建造价工作要求较高,每年均要求公司报送典型项目的相关造价分析材料;内部环境,近年来电网基建工程项目结余 率较高,概算编制不合理的问题长期存在。如何加强电网基建工程造价管理,向管理要效益,节约公司建设成本,成为企业基建管理领域的工作重点和工作难点。传统支持向量回归机能够在给定参数,单一稳定的数据来源的数据集上有效预测数据,但在面临更复杂的异构数据情况下,传统的支持向量回归机由于只使用单一核函数,难以在该核函数空间下对输入输出建立合理的映射关系,因此不能有效地获得较为精确的回归函数,或者会得到一个具有过泛化的回归函数,从而导致预测不够准确。

发明内容
基于此,有必要针对上述问题,提供一种基于多核支持向量回归机的电网基建工程造价预测方法,能够提供一种准确、简捷、实用的工程造价预测方法。一种基于多核支持向量回归机的电网基建工程造价预测方法,包括对输变电项目描述数据进行属性预处理,并采用基本核函数计算多核矩阵,其中,所述属性预处理包括将连续型变量标准化及枚举型变量类型的转换;构建多核支持向量回归机的预测模型,对该预测模型的回归参数及所述多核矩阵的权重进行优化;将所述属性预处理获得的数据作为待测样本,利用所述预测模型进行造价预测。在其中一个实施例,所述属性预处理的步骤当中,输变电项目描述属性包括枚举型变量属性与连续型变量属性;其中,所述枚举型变量属性包括电压等级、投产年份、建设性质、变电站型式;所述连续型变量属性包括征地面积、全站建筑面积、主控楼建筑面积、主变压器单价、高压侧断路器单价。在其中一个实施例,所述属性预处理的步骤当中,所述枚举型变量类型的转换是指将枚举型属性转换成取值为0,I的二值型属性。在其中一个实施例,所述属性预处理的步骤当中,所述将连续型变量标准化是指将输变电项目的每个连续型的属性变量值放大或缩小到预设的
区间。
在其中一个实施例,采用基本核函数计算多核矩阵的步骤当中,所使用的基本核函数包括高斯核函数、多项式核函数、Sigmoid核函数。在其中一个实施例,所述利用所述预测模型进行造价预测的步骤,包括41)在连续型变量标准化和枚举型变量类型转换的基础上与回归函数中的训练样本做多核函数的计算;42)计算待测样本的预测值。实施本发明,具有如下有益效果本发明利用了多核函数,充分考虑了训练样本在多核函数空间的表达性,并在统一的框架下对参数进行优化,提供了多核函数支持向量回归机预测方法。利用本发明所提供的基于多核支持向量回归机的电网基建工程造价预测方法,能提高对训练样本的拟合性能,并能削弱训练数据不充分带来的不利影响,具有较强泛化能力,能够对电网基建工程 造价做出合理的预测,以便可以帮助基建管理人员提高概算编制精度,有效控制基建投资。工程造价预测的精确度直接关系到企业的基建投资规模预测的准确度,对节约公司建设成本,提升企业经济效益和管理效益有着至关重要的作用。


图I为本发明基于多核支持向量回归机的电网基建工程造价预测方法的流程图;图2为本发明的一个实施方式的回归函数参数及多核函数权重的演算流程图。
具体实施例方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。随着机器学习方法尤其是支持向量回归机(Support Vector Regression, SVR)的不断发展,目前支持向量回归机在费用预测领域取得了显著的进展。支持向量回归机建立在统计学习理论的基础上,克服了神经网络和传统参数方法的诸多缺点,不需要特定问题的先验知识,在有限的训练样本情况下,可以很好地控制学习机器的推广能力。另外,支持向量回归机的性能主要取决于核函数的选择。利用Kernel trick,我们可以设计使用不同的核函数度量样本在不同特征空间的相似性;同时,利用核函数将样本从显式的特征空间映射到隐式的核函数空间,可以避免构建显式的特征表达以及高维特征空间的维数灾难问题;而且借助核函数组合的方式,多核支持向量回归机(MultipleKernel Support Vector Regression)可以更好的处理不同类型数据的输入,在统一的框架下同时优化多核函数的权重及对应的回归函数参数,具有较强的预测能力。图I为本发明基于多核支持向量回归机的电网基建工程造价预测方法的流程图,包括SlOl :对输变电项目描述数据进行属性预处理,并采用基本核函数计算多核矩阵,其中,所述属性预处理包括将连续型变量标准化及枚举型变量类型的转换;S102:构建多核支持向量回归机的预测模型,对该预测模型的回归参数及所述多核矩阵的权重进行优化;S103:将所述属性预处理获得的数据作为待测样本,利用所述预测模型进行造价预测。图I是按照本发明的一个实施方式的工作流程图。利用本发明解决电网基建工程造价预测问题,以Data, cost数据集为例,Data, cost数据集包含47个变量输入,我们随机筛选出60%数据作为训练数据集,40%数据作为测试数据使用。第一部分、预处理阶段首先,对输变电项目数据进行预处理。进行属性提取,构造出输变电项目描述属性,用以刻画工程造价。提取的输变电项目属性包括枚举型变量属性与连续型变量属性。枚举型属性包括电压等级、投产年份、建设性质、变电站型式等。其中,电压等级可选类型为500kV、220kV、110KV、35kV ;投产年份可选类型为2008、2009、2010、2011 ;建设性质可选类型为扩建、新建;变电站型式可选类型为户内、户外、半户内、地下、半地下。而输变电项目描述属性中的连续型变量属性包括征地面积、全站建筑面积、主控楼建筑面积、主变压器单价、高压侧断路器单价等。
将输变电项目描述属性中的枚举型变量类型转换处理。将枚举型变量转化为算法可以识别并运算的0、1 二值型的变量。转换方法如下如果某个属性可以取K个不同的值,则将其转换为K个取值为0,I的二值型属性。如属性“建设性质”可以取“扩建”与“新建”,贝IJ可以将属性“建设性质”转换为两个属性,分别是“扩建”与“新建”,如果某个输变电项目的“建设性质”为“扩建”,则其转换后的输变电项目描述属性中,“扩建”属性值为“ I ”,“新建”的属性值为“O”。将输变电项目描述属性中的连续型变量进行标准化处理。由于描述属性中的不同的连续型变量之间的大小区别很大,如“征地面积”的数量级是105而“主变压器单价”的数量级是107的,所以,如果直接将这样量级相差巨大的不同描述属性输入模型进行训练的话,会不可避免地对量级大的属性产生偏倚,影响预测结果,故对连续型变量进行标准化
处理。处理方法如下属性X转换为即除以该属性值的最大值。这样,每个连续型
属性值就转化至
之间的值,避免了不同属性值之间由于量级不同产生的偏倚,可以有效提高预测准确率。在核函数方面,采用了 M种核函数,例如多项式核,高斯核,sigmoid核等,分别利用各种核函数计算训练集中所有样本对所对应的核函数值,构建多核矩阵。图2为本发明的一个实施方式的回归函数参数及多核函数权重的演算流程图。以下结合图2对本发明第二、三部分做进一步的说明。S201 :初始化多核函数的权重;S202 :最小化目标函数,优化回归函数参数;S203 :最大化目标函数,优化多核函数的权重;S204 :参数更新;当满足终止条件时,转入步骤S205 ;S205 目标函数更新。当不满足终止条件时,转入步骤S206 ;S206 :计算给定的目标值的回归函数;S207 :回归函数参数学习算法结束。
第二部分,建模阶段构造多核支持向量回归机模型,考虑多个基本核函数的凸组合,其形如
权利要求
1.一种基于多核支持向量回归机的电网基建工程造价预测方法,其特征在于,包括 对输变电项目描述数据进行属性预处理,并采用基本核函数计算多核矩阵,其中,所述属性预处理包括将连续型变量标准化及枚举型变量类型的转换; 构建多核支持向量回归机的预测模型,对该预测模型的回归参数及所述多核矩阵的权重进行优化; 将所述属性预处理获得的数据作为待测样本,利用所述预测模型进行造价预测。
2.根据权利要求I所述的基于多核支持向量回归机的电网基建工程造价预测方法,其特征在于所述属性预处理的步骤当中,输变电项目描述属性包括枚举型变量属性与连续型变量属性; 其中,所述枚举型变量属性包括电压等级、投产年份、建设性质、变电站型式;所述连续型变量属性包括征地面积、全站建筑面积、主控楼建筑面积、主变压器单价、高压侧断路器单价。
3.根据权利要求I或2所述的基于多核支持向量回归机的电网基建工程造价预测方法,其特征在于所述属性预处理的步骤当中,所述枚举型变量类型的转换是指将枚举型属性转换成取值为O,I的二值型属性。
4.根据权利要求I或2所述的基于多核支持向量回归机的电网基建工程造价预测方法,其特征在于所述属性预处理的步骤当中,所述将连续型变量标准化是指将输变电项目的每个连续型的属性变量值放大或缩小到预设的[O,I]区间。
5.根据权利要求I或2所述的基于多核支持向量回归机的电网基建工程造价预测方法,其特征在于采用基本核函数计算多核矩阵的步骤当中,所使用的基本核函数包括高斯核函数、多项式核函数、Sigmoid核函数。
6.根据权利要求I所述的基于多核支持向量回归机的电网基建工程造价预测方法,其特征在于,采用线性约束组合构建多核支持向量回归机,所述线性约束组合包括
7.根据权利要求6所述的基于多核支持向量回归机的电网基建工程造价预测方法,其特征在于对该预测模型的回归参数及所述多核矩阵的权重进行优化的步骤包括,求解回归参数{ ,+,() 、多核函数权重的最大最小鞍点,获取所述预测模型的回归函数。
8.根据权利要求7所述的基于多核支持向量回归机的电网基建工程造价预测方法,其特征在于求解最大最小鞍点的步骤,包括 31)给定多核函数权重参数,用所述多核支持向量回归机演算回归参数; 32)给定回归参数,用半无限线性规划演算多核函数权重; 33)迭代执行31)步骤和32)步骤,直至满足预设的迭代终止条件。
9.根据权利要求8所述的基于多核支持向量回归机的电网基建工程造价预测方法,其特征在于所述迭代终止条件包括连续两次迭代参数的变化阈值、迭代次数达到预设上限。
10.根据权利要求I所述的基于多核支持向量回归机的电网基建工程造价预测方法,其特征在于所述利用所述预测模型进行造价预测的步骤,包括 41)在连续型变量标准化和枚举型变量类型转换的基础上与回归函数中的训练样本做多核函数的计算;42)计算待测·样本的预测值。
全文摘要
本发明公开了基于多核支持向量回归机的电网基建工程造价预测方法,包括对输变电项目描述数据进行属性预处理,并采用基本核函数计算多核矩阵,其中,所述属性预处理包括将连续型变量标准化及枚举型变量类型的转换;构建多核支持向量回归机的预测模型,对该预测模型的回归参数及所述多核矩阵的权重进行优化;将所述属性预处理获得的数据作为待测样本,利用所述预测模型进行造价预测。采用本发明,可以能够对电网基建工程造价做出合理的预测,以便可以帮助基建管理人员提高概算编制精度,有效控制基建投资。
文档编号G06Q10/04GK102930352SQ20121042479
公开日2013年2月13日 申请日期2012年10月30日 优先权日2012年10月30日
发明者杨晶晶, 李隽 , 齐志刚, 萧展辉, 金波, 赖启结, 谢榕昌, 杨眉, 张雨, 刘冬根, 谢文景 申请人:广东电网公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1