基于电力大数据主变高峰负荷预测方法及数据仓库系统与流程

文档序号:14187079阅读:192来源:国知局

本发明涉及电力系统技术领域,更具体地,涉及一种基于电力大数据主变高峰负荷预测的方法。



背景技术:

随着电力系统的商品化和市场化,电力负荷预测的准确性对电力系统安全经济运行和国民经济发展具有重要意义。电力负荷预测工作的水平已成为一个电力企业的管理是否走向现代化的显著标志之一。电力系统负荷预测值作为电能交易中的重要依据,为电力公司定制电能报价、运行方案以及电网规划提供了必要的导向,其预测精度将密切影响到电力企业的经济效益,尤其在我国电力事业空前发展的今天,用电管理走向市场,电力负荷预测问题己经成为电力系统面临的一项重要而又艰巨的任务。

电力负荷预测的结果对整个规划工作的优劣起到直接性的影响,众多电力工作者努力探求的目标是做到准确的预测。可是要达到这一点有很大的难度性,因为电量变化的影响因素是非常复杂的,这种类型的电力负荷预测,单纯依赖电力系统自身的资料和信息是完成不了的,另外环境因素与电量之间的关系是不可以用函数来简单地描述,换种说法它们就是一种模糊的关系,伴随着电力工业的前进和发展,电力系统规模越来越大,规模的变大使得众多政治、经济、社会甚至气象等因素也跟着一起加入到预测的大背景中来,使得预测环境的难度性大大增加。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种基于电力大数据主变高峰负荷预测的方法,通过建立数据仓库系统,建立数据挖掘处理方法,采用支持向量机方法预测主变负荷变化情况,实现准确、可靠的主变高峰负荷预测,合理调度系统使其安全经济的运行。

为解决上述问题,本发明提供的技术方案是:一种基于电力大数据主变高峰负荷预测的方法,其中,包括以下步骤:

s1.对电网系统历史数据进行统计和分析,建立数据仓库系统;

s2.采用序列模式分析和聚类分析数据挖掘方法,根据最终用户的决策目的对提取的知识进行分析,把最有价值的信息区分出来,提交给用户;

s3.通过整理的历史数据,对主变高峰负荷数据进行预处理,建立基于支持向量机的负荷预测模型,预测未来主变负荷情况。

进一步地,所述的s1步骤还包括数据处理,其中,数据处理包括数据的提取、数据的转载装载、源数据的建立、数据仓库建模。

进一步地,所述的s2步骤中的数据挖掘过程包括数据准备、数据挖掘和解释评估,其中,所述的数据准备包括以下步骤:

s201.数据集成,将多文件或多数据库运行环境中的数据进行合并处理,解决语意模糊性,处理数据中的遗漏和清洗无用数据;

s202.数据选择,根据用户要求,利用一些数据库操作对数据进行处理,从数据中提取出需要挖掘的数据集合;

s203.数据预处理,对s202步骤中的数据进行再加工,检查数据的完整性和一致性,对其中的噪声数据进行处理,对丢失的数据利用统计方法进行填补,为进一步的分析做准备,并确定将要进行的挖掘操作的类型;

s204.数据转换,根据数据挖掘的需要,进行离散值数据与连续值数据之间的相互转换、数据值的分组分类、数据项之间的计算组合的操作。

在本发明中,数据挖掘采用序列模式分析和聚类分析方法,从数据中提取用户需要的知识;其中,解释评估根据最终用户的决策目的对提取的知识进行分析,把最有价值的信息区分出来,提交给用户。在这个过程中,不仅要把知识以能被人理解的方式表达出来,还要对其进行有效性评价,如果不能满足用户要求,则应重复上述数据挖掘过程。

进一步地,所述的s3步骤中负荷预测包括:

s301.样本及其输入输出量的选择,支持向量机的负荷回归预测模型中输入向量x∈rm为历史负荷、气象因素及日类型负荷影响因素,输出y为待预测负荷;根据己知数据建立训练样本集和预测样本集,建立支持向量机svm回归目标函数,解得最优解带回到回归决策函数方程,得到回归决策函数,最后计算预测结果;

s302.核函数的选取,选取高斯径向基核函数作为回归模型中的核函数,高斯径向基核函数公式如下:

s303.对历史数据进行预处理和归一化处理;对历史数据进行平滑和归一化处理,即将原始数据通过线性变换至[-1,1]区间中,构成训练样本集;归一化公式为:

其中,x′i为归一化的数据值,xi为实测值,ximin=min(xi),ximax=max(xi),n为输入向量维数,即影响负荷因素的个数;

s304.建立svm电力负荷模型,根据得到的训练样本集及选择的核函数建立svm回归目标函数;

s305.利用预测样本及上一步得到的决策回归方程对未来某一天的平均负荷进行预测;

s306.预测完成后,将次月/日负荷真实数据视为己知数据,加入训练样本集中,依此类推完成全月/日的负荷预测。

本发明还提供一种用于基于电力大数据主变高峰负荷预测方法的数据仓库系统,其中,所述的数据仓库系统包括数据源模块、数据处理模块、数据仓库模块、数据分析与挖掘模块、应用与展示模块,所述的数据源模块、数据处理模块、数据仓库模块、数据分析与挖掘模块、应用与展示模块顺序连接。其中,数据仓库模块存储数据以供分析使用,根据不同的分析要求,数据按不同的综合程度存储,它类似于一个中央数据库,但又不同于传统的数据库。由于数据庞大,采用c/s结构;建立数据仓库不仅是为了存储量的信息,更重要的是要对这些大量的数据进行分析处理,从而为决策提供有效的寿命。使用数据仓库的前端查询工具,提供随机查询的功能,可以进行任意条件、任意模式组合的查询,而不需要编写任何程序;建设数据仓库的最终目的,让工作人员能够方便地使用数据仓库这一集成的决策支持环境以获取有价值的信息,从而能对不断变化的网络运行状况作出迅捷准确的判断和制定相应的对策。采用b/s方式,将客户服务端集成到总体架构中,通过web服务器为各工作站提供查询、分析等服务。

进一步地,所述的数据源包括:历年主变负荷数据、电网实时数据、电力设备台账以及地理信息。

在本发明中,任何负荷预测都是基于原始数据的,历史资料的收集和整理的不好,会直接影响负荷预测的质量。在历史负荷序列中,一方面,由于随机因素的影响,负荷会在某一时刻产生不同于以往运行方式的负荷点,在出现非正常负荷点的情况下,负荷序列的规律性被破坏,负荷曲线的相似性降低,则负荷的可预测性被破坏了,影响预测精度;另一方面,原始数据采集系统如果出现故障或外界信号干扰,就会出现传输错误,导致资料不准确或数据缺失。这些都是坏数据产生的原因。本发明在历史资料进行数据分析预处理时,剔除这些坏数据,保证资料的完整无缺,数字准确无误,反映的都是正常状态下的水平,即平稳化异常值及补遗缺失数据。本发明采用的处理方法:用相邻一个周期的同类型日的数据进行平均得到一个完整日负荷序列值,然后将各日负荷与此平均负荷进行对比误差的判别分析,误差超过10%则进行修正,可用平均负荷值代替。

负荷预测模型是统计资料轨迹的概括,预测模型是多种多样的,在解决有限样本、非线性及高维识别中支持向量机突出体现了其优势,而影响电力系统负荷因素具有非线性特点,利用支持向量机优越的非线性学习及预测性能,本发明提出了基于支持向量机的负荷预测方法模型。通过支持向量机建立的一套完整的有限样本下机器学习的理论框架和通用方法,能较好地解决小样本、非线性、高维数和局部极小点等实际问题,用于主变高峰负荷预测,能得到较高的精确度。

进一步地,所述的数据处理模块包括:数据提取单元、数据转载装载单元、源数据建立单元、数据仓库建模单元。通过专门的数据接口对数据源进行数据的提取、转换、清洁,进入数据仓库中。数据处理模块要实现的功能包括数据的提取和转换装载、原数据的建立和数据仓库的建模。数据处理需要针对不同的数据源按一定的时间规则对数据仓库中的数据进行刷新与重新综合。

与现有技术相比,有益效果是:本发明提供的一种基于电力大数据主变高峰负荷预测的方法,通过对电力系统运行和管理产生的大量历史数据进行分析,对这些大量的数据进行有效的统计、分析、预测和评估,从中快速准确地提取用于电力企业科学决策的信息,为快速、准确预测未来主变高峰负荷变化提供依据,通过建立数据仓库系统,建立数据挖掘处理方法,采用支持向量机方法预测主变负荷变化情况,实现准确、可靠的主变高峰负荷预测,合理调度系统使其安全经济的运行。

附图说明

图1为本发明整体流程图。

图2为本发明负荷预测流程图。

图3为本发明数据仓库系统示意图。

具体实施方式

附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本专利的限制。

如图1所示,一种基于电力大数据主变高峰负荷预测的方法,其中,包括以下步骤:

s1.对电网系统历史数据进行统计和分析,建立数据仓库系统;

s2.采用序列模式分析和聚类分析数据挖掘方法,根据最终用户的决策目的对提取的知识进行分析,把最有价值的信息区分出来,提交给用户;

s3.通过整理的历史数据,对主变高峰负荷数据进行预处理,建立基于支持向量机的负荷预测模型,预测未来主变负荷情况。

在一些实施例中,s1步骤还包括数据处理,其中,数据处理包括数据的提取、数据的转载装载、源数据的建立、数据仓库建模。

在一些实施例中,s2步骤中的数据挖掘过程包括数据准备、数据挖掘和解释评估,其中,所述的数据准备包括以下步骤:

s201.数据集成,将多文件或多数据库运行环境中的数据进行合并处理,解决语意模糊性,处理数据中的遗漏和清洗无用数据;

s202.数据选择,根据用户要求,利用一些数据库操作对数据进行处理,从数据中提取出需要挖掘的数据集合;

s203.数据预处理,对s202步骤中的数据进行再加工,检查数据的完整性和一致性,对其中的噪声数据进行处理,对丢失的数据利用统计方法进行填补,为进一步的分析做准备,并确定将要进行的挖掘操作的类型;

s204.数据转换,根据数据挖掘的需要,进行离散值数据与连续值数据之间的相互转换、数据值的分组分类、数据项之间的计算组合的操作。

在本发明中,数据挖掘采用序列模式分析和聚类分析方法,从数据中提取用户需要的知识;其中,解释评估根据最终用户的决策目的对提取的知识进行分析,把最有价值的信息区分出来,提交给用户。在这个过程中,不仅要把知识以能被人理解的方式表达出来,还要对其进行有效性评价,如果不能满足用户要求,则应重复上述数据挖掘过程。

在一些实施例中,s3步骤中负荷预测包括:

s301.样本及其输入输出量的选择,支持向量机的负荷回归预测模型中输入向量x∈rm为历史负荷、气象因素及日类型负荷影响因素,输出y为待预测负荷;根据己知数据建立训练样本集和预测样本集,建立支持向量机svm回归目标函数,解得最优解带回到回归决策函数方程,得到回归决策函数,最后计算预测结果;选取样本输入量特征项依次为:

第1-24项:预测日前24月/天平均负荷数据a={a1,a2,...,a24};

第25-48项:预测日前24月/天最大负荷数据max={m1,m2,...,m24};

第49-72项:预测日前24月/天最小负荷数据min={n1,n2,...,n24};

第73-96项:预测日前24月/天平均负荷的标准差std={s1,s2,...,s24};

第97-120项:预测日前24月/天平均天气温度t={t1,t2,...,t24};

此120个特征项为实现电力负荷预测的特征向量来参与支持向量机的训练。

s302.核函数的选取,svm由训练样本集和核函数来表述,选取不同形式的核函数就可以生成不同的svm回归模型。核函数主要有:线性核函数、多项式核函数和高斯径向基核函数svm的性能与所选用的核函数的类型关系不大,核参数(核函数中的参数σ)和平衡系数c才是影响svm性能的主要因素。但是,选取合适的核函数有利于减小计算量,本发明选取高斯径向基核函数作为回归模型中的核函数,高斯径向基核函数公式如下:

s303.对历史数据进行预处理和归一化处理;对历史数据进行平滑和归一化处理,即将原始数据通过线性变换至[-1,1]区间中,构成训练样本集;归一化公式为:

其中,x′i为归一化的数据值,xi为实测值,ximin=min(xi),ximax=max(xi),n为输入向量维数,即影响负荷因素的个数;

s304.建立svm电力负荷模型,根据得到的训练样本集及选择的核函数建立svm回归目标函数;

s305.利用预测样本及上一步得到的决策回归方程对未来某一天的平均负荷进行预测;

s306.预测完成后,将次月/日负荷真实数据视为己知数据,加入训练样本集中,依此类推完成全月/日的负荷预测。

本发明还提供一种用于基于电力大数据主变高峰负荷预测方法的数据仓库系统,其中,所述的数据仓库系统包括数据源模块、数据处理模块、数据仓库模块、数据分析与挖掘模块、应用与展示模块,所述的数据源模块、数据处理模块、数据仓库模块、数据分析与挖掘模块、应用与展示模块顺序连接。其中,数据仓库模块存储数据以供分析使用,根据不同的分析要求,数据按不同的综合程度存储,它类似于一个中央数据库,但又不同于传统的数据库。由于数据庞大,采用c/s结构;建立数据仓库不仅是为了存储量的信息,更重要的是要对这些大量的数据进行分析处理,从而为决策提供有效的寿命。使用数据仓库的前端查询工具,提供随机查询的功能,可以进行任意条件、任意模式组合的查询,而不需要编写任何程序;建设数据仓库的最终目的,让工作人员能够方便地使用数据仓库这一集成的决策支持环境以获取有价值的信息,从而能对不断变化的网络运行状况作出迅捷准确的判断和制定相应的对策。采用b/s方式,将客户服务端集成到总体架构中,通过web服务器为各工作站提供查询、分析等服务。

在一些实施例中,数据源包括:历年主变负荷数据、电网实时数据、电力设备台账以及地理信息。

在本发明中,任何负荷预测都是基于原始数据的,历史资料的收集和整理的不好,会直接影响负荷预测的质量。在历史负荷序列中,一方面,由于随机因素的影响,负荷会在某一时刻产生不同于以往运行方式的负荷点,在出现非正常负荷点的情况下,负荷序列的规律性被破坏,负荷曲线的相似性降低,则负荷的可预测性被破坏了,影响预测精度;另一方面,原始数据采集系统如果出现故障或外界信号干扰,就会出现传输错误,导致资料不准确或数据缺失。这些都是坏数据产生的原因。本发明在历史资料进行数据分析预处理时,剔除这些坏数据,保证资料的完整无缺,数字准确无误,反映的都是正常状态下的水平,即平稳化异常值及补遗缺失数据。本发明采用的处理方法:用相邻一个周期的同类型日的数据进行平均得到一个完整日负荷序列值,然后将各日负荷与此平均负荷进行对比误差的判别分析,误差超过10%则进行修正,可用平均负荷值代替。

负荷预测模型是统计资料轨迹的概括,预测模型是多种多样的,在解决有限样本、非线性及高维识别中支持向量机突出体现了其优势,而影响电力系统负荷因素具有非线性特点,利用支持向量机优越的非线性学习及预测性能,本发明提出了基于支持向量机的负荷预测方法模型。通过支持向量机建立的一套完整的有限样本下机器学习的理论框架和通用方法,能较好地解决小样本、非线性、高维数和局部极小点等实际问题,用于主变高峰负荷预测,能得到较高的精确度。

具体地,数据处理模块包括:数据提取单元、数据转载装载单元、源数据建立单元、数据仓库建模单元。通过专门的数据接口对数据源进行数据的提取、转换、清洁,进入数据仓库中。数据处理模块要实现的功能包括数据的提取和转换装载、原数据的建立和数据仓库的建模。数据处理需要针对不同的数据源按一定的时间规则对数据仓库中的数据进行刷新与重新综合。

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1