风电场理论功率曲线确定方法及装置的制造方法

文档序号：10570480阅读：312来源：国知局

风电场理论功率曲线确定方法及装置的制造方法
【专利摘要】本发明公开了一种风电场理论功率曲线确定方法及装置，该方法包括：获取风电场各风机在预设时间内的历史数据，历史数据包括风速和功率；基于历史数据构建单机风速功率散点图；剔除单机风速功率散点图中的异常数据；针对剔除异常数据后的单机风速功率散点数据，分别计算以预设风速间隔划分的各个区间对应的数据集合的聚类中心，并按聚类中心构建单机等值功率曲线；基于单机等值功率曲线，对所剔除的异常数据点中的风速进行线性插值计算对应的理论功率数据，并按该理论功率数据重构单机理论功率数据；根据各风机理论功率数据得到风电场理论功率曲线。本发明仅使用风速和功率两项数据能最大限度排除干扰数据，还原真实风电场理论功率曲线。
【专利说明】
风电场理论功率曲线确定方法及装置
技术领域
[0001] 本发明涉及风电场技术领域，尤其涉及一种风电场理论功率曲线确定方法及装置。
【背景技术】
[0002] 近年来，随着风电高速发展，我国弃风限电问题也越趋严重。风电场的理论功率数据是准确研究风电功率预测、客观评价弃风限电情况和合理规划风电容量配置的重要基础，因此有必要对风电历史运行数据中的限电以及故障等异常数据进行还原重构，以最大限度地反映风电场真实理论出力水平。
[0003] 对于风电场理论功率的研究主要基于历史数据回归重构的角度进行开展，包括标杆风机法、机舱风速法等。然而，风电场实际运行过程中影响数据质量的因素有很多，由于条件约束、外部干扰和设备故障等原因，实际运行数据中充斥着大量异常数据，严重破坏了各因素之间的对应关系，造成回归重构结果存在偏差，精度不足。
[0004] 实际运行中，风电场除了因限电带来大量数据外，众多因素会造成各数据之间的对应关系发生畸变，如较小的风速(切入风速以下）对应着较大的风电功率输出（甚至达到额定功率），因此不能仅依据风机是否处于限电状态来判断风机运行数据是否正常，而且状态信息也同时存在一些异常数据。
[0005] 针对上述问题，目前尚未提出有效的解决方案。

【发明内容】

[0006] 本发明提供了一种风电场理论功率曲线确定方法及装置，以至少解决现有技术中大量异常数据的存在导致通过历史数据回归重构得到的风电场理论功率存在偏差的问题。
[0007] 根据本发明的一个方面，提供了一种风电场理论功率曲线确定方法，包括:获取风电场中各风机在预设时间内的历史数据，其中所述历史数据包括:风速和功率;基于所述历史数据构建单机风速功率散点图；剔除所述单机风速功率散点图中的异常数据;针对剔除异常数据后的单机风速功率散点数据，按照以预设风速间隔划分的区间，分别计算各个区间对应的数据集合的聚类中心，并按照所述聚类中心构建单机等值功率曲线;基于所述单机等值功率曲线，对所剔除的异常数据点中的风速进行线性插值计算得到对应的理论功率数据，并根据所述理论功率数据重构单机在所述预设时间内的理论功率数据;根据各风机在所述预设时间内的理论功率数据得到风电场在所述预设时间内的理论功率曲线。
[0008] 在一个实施例中，剔除所述单机风速功率散点图中的异常数据，包括:利用罗曼诺夫斯基准则剔除所述单机风速功率散点图中的异常数据；以及利用聚类分析法剔除所述单机风速功率散点图中剩余的异常数据。
[0009] 在一个实施例中，利用罗曼诺夫斯基准则剔除所述单机风速功率散点图中沿第一方向分布的异常数据，包括:在所述单机风速功率散点图中，按照预设功率间隔将风机功率范围划分为P个功率区间，并按功率区间将风速功率散点数据划分为P个数据集合Xi，X2，… Xp;将数据集合Xi内的受怀疑数据Xh去掉，计算该数据集合Xi内不包括受怀疑数据Xh的风速数据的算数平均值I，其中，1 ;计算该数据集合Xi内不包括受怀疑数据Xh的风速数据的标准偏差si;根据第一预设显著水平^和该数据集合Xi内包含的风速数据量m，在t分布表中查出检验系数K(ai，m);若则确定受怀疑数据Xh为异常数据并进行剔除，在该数据集合^内除受怀疑数据Xh之外的风速数据中选定新的受怀疑数据，重复执行计算算术平均值、标准偏差和检验系数的步骤，直到剔除该数据集合Xi内所有的异常数据;若 | %-贝議定该数据集合X#除受怀疑数据xh之外的风速数据均不是异常数据。
[0010] 在一个实施例中，采用以下公式计算该数据集合Xi内不包括受怀疑数据Xh的风速数据的算数平均值i
其中，Xl表示数据集合&内的第i个风速数据;采用以下公式计算该数据集合Xi内不包括受怀疑数据Xh的风速数据的标准偏差si :
[0011] 在一个实施例中，利用罗曼诺夫斯基准则剔除所述单机风速功率散点图中沿第二方向分布的异常数据，包括:在所述单机风速功率散点图中，按照预设风速间隔将风机风速范围划分为q个风速区间，并按风速区间将风速功率散点数据划分为q个数据集合Yi，Y2，… Yq;将数据集合h内的受怀疑数据yh去掉，计算该数据集合h内不包括受怀疑数据yh的功率数据的算数平均值其中，计算该数据集合1内不包括受怀疑数据y h的功率数据的标准偏差s2;根据第二预设显著水平〇2和该数据集合Yi内包含的功率数据量n，在t分布表中查出检验系数K(a 2，n);若|乃-则确定受怀疑数据yh为异常数据并进行剔除，在该数据集合^内除受怀疑数据y h之外的功率数据中选定新的受怀疑数据，重复执行计算算术平均值、标准偏差和检验系数的步骤，直到剔除该数据集合^内所有的异常数据;若 |为-罗| ，》；)&，则确定该数据集合 Yl内除受怀疑数据yh之外的功率数据均不是异常数据。
[0012] 在一个实施例中，采用以下公式计算该数据集合Yi内不包括受怀疑数据yh的功率数据的算数平均值f
，其中，yi表示数据集合h内的第i个功率数据;采用以下公式计算该数据集合￥1内不包括受怀疑数据yh的功率数据的标准偏差s2:
L〇〇13」在一个实施例中，利用聚类分析法剔除所述单机风速功率散点图中剩余的异常数据，包括:在所述单机风速功率散点图中，按照预设风速间隔将风机风速范围划分为q个风速区间，并按风速区间将风速功率散点数据划分为q个数据集合Yi，Y 2，…Yq;基于k均值聚类算法将数据集合1内的风速功率散点数据划分为k类数据…&，并计算各个聚类的聚类中心W1，W2，???Wk;确定聚类中心W1，W2，…Wk中的最大聚类中心Wmax以及对应的聚类Cmax;确定与最大聚类中心lax的距离大于预设值的所有聚类，并将确定的聚类作为异常数据进行剔除。
[0014]在一个实施例中，采用以下公式对所剔除的异常数据点中的风速进行线性插值计算得到对应的理论功率数据P
其中，（Xi，yi)，（ Xj，yj)表示所述单机等值功率曲线中相邻的两点，v表示所剔除的异常数据点中的风速，且vG[Xl，Xj]。
[0015]根据本发明的另一个方面，提供了一种风电场理论功率曲线确定装置，包括:获取单元，用于获取风电场中各风机在预设时间内的历史数据，其中所述历史数据包括:风速和功率;第一构建单元，用于基于所述历史数据构建单机风速功率散点图；剔除单元，用于剔除所述单机风速功率散点图中的异常数据;第二构建单元，用于针对剔除异常数据后的单机风速功率散点数据，按照以预设风速间隔划分的区间，分别计算各个区间对应的数据集合的聚类中心，并按照所述聚类中心构建单机等值功率曲线;重构单元，用于基于所述单机等值功率曲线，对所剔除的异常数据点中的风速进行线性插值计算得到对应的理论功率数据，并根据所述理论功率数据重构单机在所述预设时间内的理论功率数据;计算单元，用于根据各风机在所述预设时间内的理论功率数据得到风电场在所述预设时间内的理论功率曲线。
[0016] 在一个实施例中，所述剔除单元包括:第一剔除子单元，用于利用罗曼诺夫斯基准则剔除所述单机风速功率散点图中的异常数据；以及第二剔除子单元，用于利用聚类分析法剔除所述单机风速功率散点图中剩余的异常数据。
[0017] 在一个实施例中，所述剔除单元包括:第一划分模块，用于在所述单机风速功率散点图中，按照预设功率间隔将风机功率范围划分为P个功率区间，并按功率区间将风速功率散点数据划分为P个数据集合Xi，X 2，;第一计算模块，用于将数据集合Xi内的受怀疑数据xh去掉，计算该数据集合Xi内不包括受怀疑数据Xh的风速数据的算数平均值J，其中， i ;第二计算模块，用于计算该数据集合Xi内不包括受怀疑数据Xh的风速数据的标准偏差 s1;查找模块，用于根据第一预设显著水平^和该数据集合Xi内包含的风速数据量m，在t分布表中查出检验系数以~，m);第一确定模块，用于在1%. >尽(^，/^^的情况下，则确定受怀疑数据xh为异常数据并进行剔除，在该数据集合Xift除受怀疑数据Xh之外的风速数据中选定新的受怀疑数据，重复执行计算算术平均值、标准偏差和检验系数的步骤，直到剔除该数据集合&内所有的异常数据;第二确定模块，用于在|心的情况下，则确定该数据集合&内除受怀疑数据Xh之外的风速数据均不是异常数据。
[0018] 在一个实施例中，所述第一计算模块具体用于采用以下公式计算该数据集合&内不包括受怀疑数据xh的风速数据的算数平均值Z
，其中，Xl表示数据集合Xi 内的第i个风速数据;所述第二计算模块具体用于采用以下公式计算该数据集合Xi内不包括受怀疑数据Xh的风速数据的标准偏差81
[0019] 在一个实施例中，所述第二剔除子单元包括:第二划分模块，用于在所述单机风速功率散点图中，按照预设风速间隔将风机风速范围划分为q个风速区间，并按风速区间将风速功率散点数据划分为q个数据集合 Yl，Y2，…Yq;第三计算模块，用于基于k均值聚类算法将数据集合1内的风速功率散点数据划分为k类数据…&，并计算各个聚类的聚类中心￥1，'\￥2，.11<;第三确定模块，用于确定聚类中心￥1，'\￥2，.11<中的最大聚类中心￥ 111￡?以及对应的聚类Cmax;第四确定模块，用于确定与最大聚类中心 Wmax的距离大于预设值的所有聚类，并将确定的聚类作为异常数据进行剔除。
[0020] 通过本发明的风电场理论功率曲线确定方法及装置，利用异常数据剔除和重构，最大限度地排除干扰数据，尽可能还原真实的风电场理论功率曲线；同时，该方法仅使用了风速和功率两项数据，实施简单，适应于各类复杂环境。
【附图说明】
[0021] 此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的限定。在附图中：
[0022] 图1是本发明实施例的风电场理论功率曲线确定方法的流程图；
[0023] 图2是本发明实施例的风电场理论功率曲线确定装置的结构框图；
[0024] 图3是本发明实施例的基于异常数据剔除和重构的风电场理论功率曲线确定方法的不意图；
[0025]图4是本发明实施例的风电场实际功率不意图；
[0026] 图5是本发明实施例的001#风机实际功率示意图；
[0027] 图6是本发明实施例的001#风机实际风速示意图；
[0028] 图7是本发明实施例的001#风机的风速功率散点图；
[0029] 图8是本发明实施例的001#风机的等值功率曲线示意图；
[0030] 图9是本发明实施例的风电场实际功率和理论功率曲线示意图。
【具体实施方式】
[0031] 下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明的保护范围。
[0032] 本发明实施例提供了一种风电场理论功率曲线确定方法，图1是本发明实施例的风电场理论功率曲线确定方法的流程图，如图1所示，该方法包括：
[0033] 步骤S101，获取风电场中各风机在预设时间内的历史数据，其中历史数据包括:风速和功率。该预设时间可以是几个月、一年或者几年。历史数据中还可以包括切入风速和切出风速，其中，切入风速为风机并网发电的启动风速，切出风速为风机并网发电的最大风速。
[0034]步骤S102,基于上述历史数据构建单机风速功率散点图。
[0035]本发明对于单机风速功率散点图的横纵坐标不做限制，即以风速为横坐标，功率为纵坐标，或者，以功率为横坐标，风速为纵坐标。较优的，单机风速功率散点图以风速为横坐标，以功率为纵坐标。
[0036] 步骤S103,剔除单机风速功率散点图中的异常数据。
[0037] 步骤S104,针对剔除异常数据后的单机风速功率散点数据，按照以预设风速间隔划分的区间，分别计算各个区间对应的数据集合的聚类中心，并按照聚类中心构建单机等值功率曲线。对于散点图，数据集合中的数据可以用坐标表示，聚类中心实际是数据集合中的某一个数据，也可用坐标表示，将各个聚类中心连接成曲线，则得到等值功率曲线。
[0038] 步骤S105,基于单机等值功率曲线，对所剔除的异常数据点中的风速进行线性插值计算得到对应的理论功率数据，并根据该理论功率数据重构单机在预设时间内的理论功率数据。具体的，对异常数据点中的风速进行插值计算得到对应的准确的功率数据，从而可以得到较为准确的单机理论功率数据。
[0039]步骤S106，根据各风机在预设时间内的理论功率数据得到风电场在预设时间内的理论功率曲线。其中，可以先对各风机的理论功率数据进行求和，得到风电场的理论功率数据，然后以时间为横坐标，功率为纵坐标建立风电场理论功率曲线。
[0040] 通过上述方法，利用异常数据剔除和重构，最大限度地排除干扰数据，尽可能还原真实的风电场理论功率曲线；同时，该方法仅使用了风速和功率两项数据，实施简单，适应于各类复杂环境。
[0041] 在一个实施例中，步骤S103中剔除单机风速功率散点图中的异常数据可以包括：利用罗曼诺夫斯基准则剔除单机风速功率散点图中的异常数据；以及利用聚类分析法剔除单机风速功率散点图中剩余的异常数据。
[0042] 利用罗曼诺夫斯基准则进行异常数据剔除，可以包括:剔除横向分布差异的数据和/或剔除纵向分布差异的数据，二者方法类似，横向是指在单机风速功率散点图中以纵坐标为基准划分区间或数据集合，纵向是指在单机风速功率散点图中以横坐标为基准划分区间或数据集合。但是利用罗曼诺夫斯基准则并不能剔除全部异常数据，例如不能剔除限电数据，因此，本发明还利用聚类分析法进行剩余异常数据的剔除，从而尽可能剔除全部异常数据。针对单机风速功率散点图中数据点的分布特点，利用聚类分析法主要是纵向上的异常数据剔除。
[0043] 当然，也可以先利用聚类分析法剔除单机风速功率散点图中的异常数据，再利用罗曼诺夫斯基准则剔除剩余的异常数据。
[0044] 在一个实施例中，利用罗曼诺夫斯基准则剔除单机风速功率散点图中沿第一方向分布的异常数据，可以包括以下步骤：
[0045] (1)在单机风速功率散点图中，按照预设功率间隔将风机功率范围划分为p个功率区间，并按功率区间将风速功率散点数据划分为P个数据集合&，&，^%。优选的，预设功率间隔可以是某一固定值，例如5kW。预设功率间隔也可以是不等的间隔，例如在合理的情况下按2kW、3kW、4kW逐个递增，或者以2kW、3kW和5kW这三个间隔进行循环。
[0046] (2)将数据集合&内的受怀疑数据Xh去掉，计算该数据集合Xi内不包括受怀疑数据 xh的风速数据的算数平均值i，其中，l<i<p。具体的，可以采用以下公式计算该算数平均值I
其中，m表示数据集合Xi内包含的风速数据量，xi表示数据集合Xi内的第i个风速数据。
[0047] (3)计算该数据集合Xi内不包括受怀疑数据Xh的风速数据的标准偏差81。具体的，可以采用以下公式计算该标准偏差s1:
其中，m表示数据集合Xi内包含的风速数据量，Xl表示数据集合&内的第i个风速数据。
[0048] (4)根据第一预设显著水平^和该数据集合&内包含的风速数据量m，在t分布表中查出检验系数K(ai，m)。其中，显著水平是估计总体参数落在某一区间内，可能犯错误的概率，显著水平可以预先设定，一般取值为〇.〇5;t分布表中adPm数列交叉的数即为相应的检验系数。
[0049] (5)若|xA -到> ，则确定受怀疑数据&为异常数据并进行剔除，在该数据集合Xift除受怀疑数据xh之外的风速数据中选定新的受怀疑数据，重复执行计算算术平均值、标准偏差和检验系数的步骤，直到剔除该数据集合Xi内所有的异常数据；若则确定该数据集合&内除受怀疑数据xh之外的风速数据均不是异常数据。
[0050] 本实施例中，按照预设功率间隔划分区间和数据集合，根据之前对横向和纵向的含义说明，可知，如果单机风速功率散点图以功率作为纵坐标，则本实施例属于横向异常数据剔除;如果单机风速功率散点图以功率作为横坐标，则本实施例属于纵向异常数据剔除。本实施例中使用罗曼诺夫斯基准则剔除异常数据，能够较为精确地剔除大部分异常数据，保证最终得到的风电场理论功率曲线的准确性较高。
[0051] 在另一个实施例中，利用罗曼诺夫斯基准则剔除单机风速功率散点图中沿第二方向分布的异常数据，可以包括以下步骤：
[0052] (1)在单机风速功率散点图中，按照预设风速间隔将风机风速范围划分为q个风速区间，并按风速区间将风速功率散点数据划分为q个数据集合心八 2，一Yq。优选的，预设风速间隔可以是某一固定值，例如lm/s。预设风速间隔也可以是不等的间隔，例如在合理的情况下按lm/s、2m/s、3m/s逐个递增，或者以lm/s、2m/s和3m/s这三个间隔进行循环。
[0053 ] (2)将数据集合h内的受怀疑数据yh去掉，计算该数据集合Yi内不包括受怀疑数据 yh的功率数据的算数平均值其中，l<i<q。具体的，可以采用以下公式计算该算数平均值$
，其中，n表示数据集合Yi内包含的功率数据量，yi表示数据集合Yi内的第i个功率数据。
[0054] (3)计算该数据集合￥1内不包括受怀疑数据yh的功率数据的标准偏差 82。具体的，可以采用以下公式计算该标准偏差s2:
其中，n表示数据集合Yi内包含的功率数据量，yi表示数据集合Yi内的第i个功率数据。
[0055] (4)根据第二预设显著水平^和该数据集合h内包含的功率数据量n，在t分布表中查出检验系数K(a2，n)。其中，显著水平是估计总体参数落在某一区间内，可能犯错误的概率，显著水平可以预先设定，一般取值为〇.〇5;t分布表中<!2和11数列交叉的数即为相应的检验系数。
[0056] (5)若|乃,-到>疋(《2,?；)52，则确定受怀疑数据升为异常数据并进行剔除，在该数据集合Yift除受怀疑数据yh之外的功率数据中选定新的受怀疑数据，重复执行计算算术平均值、标准偏差和检验系数的步骤，直到剔除该数据集合？：内所有的异常数据；若 |乃，-歹| ?；)士，则确定该数据集合^内除受怀疑数据y h之外的功率数据均不是异常数据。
[0057] 本实施例中，按照预设风速间隔划分区间和数据集合，根据之前对横向和纵向的含义说明，可知，如果单机风速功率散点图以风速作为纵坐标，则本实施例属于横向异常数据剔除;如果单机风速功率散点图以风速作为横坐标，则本实施例属于纵向异常数据剔除。本实施例中使用罗曼诺夫斯基准则剔除异常数据，能够较为精确地剔除大部分异常数据，保证最终得到的风电场理论功率曲线的准确性较高。
[0058]需要说明的是，为了尽可能的剔除所有异常数据，提高最终得到的理论功率曲线的正确性，可以同时使用上述两个实施例中描述的利用罗曼诺夫斯基准则剔除异常数据的方法，即同时使用横向异常数据剔除和纵向异常数据剔除，执行顺序不区分先后。
[0059] 利用聚类分析法剔除单机风速功率散点图中剩余的异常数据，可以包括以下步骤：
[0060] (1)在单机风速功率散点图中，按照预设风速间隔将风机风速范围划分为q个风速区间，并按风速区间将风速功率散点数据划分为q个数据集合心八 2，一Yq。优选的，预设风速间隔可以是某一固定值，例如lm/s。预设风速间隔也可以是不等的间隔，例如在合理的情况下按lm/s、2m/s、3m/s逐个递增，或者以lm/s、2m/s和3m/s这三个间隔进行循环。
[0061] (2)基于k均值聚类算法将数据集合Yift的风速功率散点数据划分为k类数据Q， C2，???〇!<，并计算各个聚类的聚类中心Wl，W2，~Wk。
[0062]具体的，k均值聚类算法的步骤如下：
[0063]①为每个聚类确定一个初始聚类中心，这样就有k个初始聚类中心；
[0064]②将各个聚类中的数据按照最小距离原则分配到与其距离最小的初始聚类中心所在的聚类；
[0065]③将每个聚类中的数据的均值作为新的聚类中心；
[0066]④重复步骤②、③，直到聚类中心不再变化；
[0067] ⑤流程结束，得到k个聚类及其对应的k个聚类中心。
[0068] (3)确定聚类中心Wl，W2，^_Wk中的最大聚类中心Wmax以及对应的聚类Cmax。
[0069] (4)确定与最大聚类中心wmax的距离大于预设值的所有聚类，并将确定的聚类作为异常数据进行剔除。其中，该预设值的取值可以为〇.2Pr，Pr为风机的额定功率。
[0070] 本实施例中使用聚类分析法剔除异常数据，能够较为精确地剔除大部分异常数据，保证最终得到的风电场理论功率曲线的准确性较高。
[0071] 步骤S105中，可以采用以下公式对所剔除的异常数据点中的风速进行线性插值计算得到对应的理论功率数据P:
[0073] 其中，（^^?，（^，^丨表示单机等值功率曲线中相邻的两点^表示所剔除的异常数据点中的风速，且vG [Xi，Xj]。
[0074] 基于同一发明构思，本发明实施例还提供了一种风电场理论功率曲线确定装置，可以用于实现上述实施例所描述的方法。由于该装置解决问题的原理与上述方法相似，因此该装置的实施可以参见上述方法的实施，重复之处不再赘述。以下所使用的，术语"单元" 或者"模块"可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。
[0075] 图2是本发明实施例的风电场理论功率曲线确定装置的结构框图，如图2所示，该装置包括:获取单元21、第一构建单元22、剔除单元23、第二构建单元24、重构单元25和计算单元26，下面对该结构进行具体说明。
[0076] 获取单元21，用于获取风电场中各风机在预设时间内的历史数据，其中历史数据包括:风速和功率；
[0077] 第一构建单元22,用于基于上述历史数据构建单机风速功率散点图；
[0078] 剔除单元23，用于剔除单机风速功率散点图中的异常数据；
[0079] 第二构建单元24,用于针对剔除异常数据后的单机风速功率散点数据，按照以预设风速间隔划分的区间，分别计算各个区间对应的数据集合的聚类中心，并按照聚类中心构建单机等值功率曲线；
[0080] 重构单元25,用于基于单机等值功率曲线，对所剔除的异常数据点中的风速进行线性插值计算得到对应的理论功率数据，并根据该理论功率数据重构单机在预设时间内的理论功率数据；
[0081] 计算单元26，用于根据各风机在预设时间内的理论功率数据得到风电场在预设时间内的理论功率曲线。
[0082] 通过上述装置，利用异常数据剔除和重构，最大限度地排除干扰数据，尽可能还原真实的风电场理论功率曲线；同时，该装置仅使用了风速和功率两项数据，实施简单，适应于各类复杂环境。
[0083]在一个实施例中，剔除单元23可以包括:第一剔除子单元，用于利用罗曼诺夫斯基准则剔除单机风速功率散点图中的异常数据；以及第二剔除子单元，用于利用聚类分析法剔除单机风速功率散点图中剩余的异常数据。
[0084] 在一个实施例中，第一剔除子单元可以包括：
[0085] 第一划分模块，用于在单机风速功率散点图中，按照预设功率间隔将风机功率范围划分为P个功率区间，并按功率区间将风速功率散点数据划分为P个数据集合Xi，X 2，…XP;
[0086] 第一计算模块，用于将数据集合Xift的受怀疑数据Xh去掉，计算该数据集合&内不包括受怀疑数据xh的风速数据的算数平均值3F，其中，
[0087] 第二计算模块，用于计算该数据集合Xi内不包括受怀疑数据Xh的风速数据的标准偏差si;
[0088]第一查找模块，用于根据第一预设显著水平^和该数据集合X:内包含的风速数据量m，在t分布表中查出检验系数K(ai，m);
[0089]第一确定模块，用于在h _ > A： (?丨，丨的情况下，则确定受怀疑数据Xh为异常数据并进行剔除，在该数据集合^内除受怀疑数据Xh之外的风速数据中选定新的受怀疑数据，重复执行计算算术平均值、标准偏差和检验系数的步骤，直到剔除该数据集合&内所有的异常数据；
[0090] 第二确定模块，用于在|xA -i| S 的情况下，则确定该数据集合X:内除受怀疑数据Xh之外的风速数据均不是异常数据。
[0091] 具体的，第一计算模块可以采用以下公式计算该数据集合Xi内不包括受怀疑数据 Xh的风速数据的算数平均值.f
[0092] 第二计算模块可以采用以下公式计算该数据集合Xi内不包括受怀疑数据Xh的风速数据的标准偏差s1:
[0093]在一个实施例中，第一剔除子单元还可以包括：
[0094] 第二划分模块，用于在单机风速功率散点图中，按照预设风速间隔将风机风速范围划分为q个风速区间，并按风速区间将风速功率散点数据划分为q个数据集合Yi，Y 2，…Yq;
[0095] 第三计算模块，用于将数据集合Yift的受怀疑数据yh去掉，计算该数据集合h内不包括受怀疑数据yh的功率数据的算数平均值P，其中，
[0096] 第四计算模块，用于计算该数据集合￥1内不包括受怀疑数据yh的功率数据的标准偏差S2;
[0097]第二查找模块，用于根据第二预设显著水平^和该数据集合Yi内包含的功率数据量n，在t分布表中查出检验系数K(a2，n);
[0098] 第三确定模块，用于在|乃,-歹|>尺(《2，《^2的情况下，则确定受怀疑数据凡为异常数据并进行剔除，在该数据集合^内除受怀疑数据yh之外的功率数据中选定新的受怀疑数据，重复执行计算算术平均值、标准偏差和检验系数的步骤，直到剔除该数据集合^内所有的异常数据；
[0099] 第四确定模块，用于在|凡-〒| <以《2, /小:的情况下，则确定该数据集合Yi内除受怀疑数据yh之外的功率数据均不是异常数据。
[0100] 具体的，第三计算模块可以采用以下公式计算该数据集合1内不包括受怀疑数据 yh的功率数据的算数平均值；
[0101] 第四计算模块可以采用以下公式计算该数据集合h内不包括受怀疑数据yh的功率数据的标准偏差s2:
[0102] 第二剔除子单元可以包括：
[0103] 第三划分模块，用于在单机风速功率散点图中，按照预设风速间隔将风机风速范围划分为q个风速区间，并按风速区间将风速功率散点数据划分为q个数据集合Yi，Y 2，…Yq; [0104]第五计算模块，用于基于k均值聚类算法将数据集合Yi内的风速功率散点数据划分为k类数据Ci，C2，…Ck，并计算各个聚类的聚类中心wi，W2，…wk;
[0105] 第五确定模块，用于确定聚类中心W1，W2,…Wk中的最大聚类中心Wmax以及对应的聚类 Cmax;
[0106] 第六确定模块，用于确定与最大聚类中心Wmax的距离大于预设值的所有聚类，并将确定的聚类作为异常数据进行剔除。
[0107] 重构单元25可以采用以下公式对所剔除的异常数据点中的风速进行线性插值计算得到对应的理论功率数据P:
[0109] 其中，（^，71)，（&，^)表示单机等值功率曲线中相邻的两点，￥表示所剔除的异常数据点中的风速，且vG [Xi，Xj]。
[0110] 当然，上述单元或模块划分只是一种示意划分，本发明并不局限于此。只要能实现本发明的目的的模块划分，均应属于本发明的保护范围。
[0111] 为了对上述风电场理论功率曲线确定方法及装置进行更为清楚的解释，下面结合具体的实施例来进行说明，然而值得注意的是该实施例仅是为了更好地说明本发明，并不构成对本发明不当的限定。
[0112] 图3是本发明实施例的基于异常数据剔除和重构的风电场理论功率曲线确定方法的示意图。在本实施例中，散点图以风速为横坐标，功率为纵坐标。
[0113] (1)获得风电场中各风机的风速全年历史数据V1，V2，…v n和功率全年历史数据Pi， p2，…Pn(其中n为风机数量），其中包括切入风速Vr和切出风速V。。
[0114] (2)基于各风机历史数据构建以风速Vl为横坐标和以功率Pi为纵坐标的单机风速功率散点图。
[0115] (3)利用横向罗曼诺夫斯基准则剔除单机风速功率散点图中横向分布差异的数据。具体如下：
[0116] ①在单机风速功率散点图中，以P△为间隔单位将风机功率范围[OJd划分为p个区间，并按功率区间将风速功率数据划分为P个数据集合Xi，X 2，一Xp，之后针对各个数据集合，利用罗曼诺夫斯基准则进行异常数据剔除。
[0117] ②将数据集合Xift的受怀疑数据Xh(Xh可选取与均值偏差最大的数据)去掉，计算数据集合&内不包括Xh的风速数据的算数平均值f，l<i<p。算数平均值J的具体计算公式参见上述描述，此处不再赘述。
[0118] ③计算数据集合Xift不包括Xh的风速数据的标准偏差s。标准偏差s的具体计算公式参见上述描述，此处不再赘述。
[0119]④根据预设显著水平a(-般取0.05)和数据集合X:内包含的风速数据量m，在t分布表中查出检验系数K(a，m)。
[0120] ⑤若|% -詞> ，则可确定xh为异常数据并进行剔除，重复执行步骤②、③、 ④，直到剔除该数据集合&内所有的异常数据;若|x"-则可确定剩余风速数据(该数据集合&内除受怀疑数据Xh之外的风速数据)均不是异常数据。
[0121] (4)利用纵向罗曼诺夫斯基准则剔除单机风速功率散点图中纵向分布差异的数据，其具体实现方法与步骤(3)类似，此处不再赘述。
[0122] (5)利用纵向聚类分析法剔除异常数据。
[0123] ①在单机风速功率散点图中，以v△为间隔单位将风机风速范围[0，v。]划分为q个区间，并按功率区间将风速功率数据划分为q个数据集合Yi，Y 2，??々<!，之后针对各个数据集合，利用聚类分析法进行异常数据剔除。
[0124] ②基于k均值聚类算法将数据集合Yift的风速功率散点数据划分为k类数据Q， C2，???〇!<，并计算各个聚类的聚类中心W1，W2, ??％，聚类中心即与数据集合内各点的距离和最小的那个数据。
[0125] ③找出Wl，W2，^_Wk中的最大聚类中心Wmax以及对应的聚类Cmax。
[0126] ④找出所有与最大聚类中心wmax的距离大于预设值T( 一般取0.2Pr，Pr为风机的额定功率)的聚类，并将这些聚类视为异常数据进行剔除。
[0127] (6)针对剔除异常数据后的单机风速功率散点数据，按照划分的q个区间，分别计算各个区间对应的数据集合的聚类中心( X1，yi)，（X2，y2)，…，U，yq)，并按照聚类中心构建单机等值功率曲线。
[0128] (7)基于构建的单机等值功率曲线，对所剔除的异常数据点中的风速v进行线性插值计算得到对应的理论功率数据P，并根据计算的理论功率数据P重构单机全年理论功率数据P' i。功率数据P的具体计算公式参见上述描述，此处不再赘述。
[0129] (8)将各风机全年理论功率数据求和得到风电场全年理论功率曲线。
[0130] 以某地区电网内一座风电场为例进行计算分析，对上述风电场理论功率曲线确定方法进行解释说明。
[0131] 该风电场并网装机容量99.5丽，共39台风机，其中2MW风机11台，2.5丽风机13台， 3MW风机15台。
[0132] (1)获取该风电场各风机2015年1-8月的实际功率和实际风速数据，风电场实际功率如图4所示，1号(001#)风机实际功率如图5所示，001#风机实际风速如图6所示。
[0133] (2)以风速Vi为横坐标，以功率Pi为纵坐标构建各单机的风速功率散点图，001#风机的风速功率散点图如图7所示。
[0134] (3)选取P△为20kW，v△为0.5m/s，分别利用罗曼诺夫斯基准则和k均值聚类剔除异常数据，并构建单机等值功率曲线。001#风机的等值功率曲线如图8所示，与图6相比，去除了大量的异常数据，其中灰色的曲线为001#风机的等值功率曲线。
[0135] (4)重构风机2015年1-8月的理论功率曲线，进而得到风电场2015年1-8月的理论功率曲线，如图9所示，为风电场1月1日至1月11日的实际功率和理论功率曲线示意图，其中，实线表示理论功率，虚线表示实际功率。
[0136] (5)弃风电量评估
[0137] 根据该风电场2015年1-8月的实际功率和理论功率曲线，可知该风电场1-8月实际发电量为1.26亿千瓦时，理论发电量为1.88亿千瓦时，弃风电量为0.62亿千瓦时。
[0138] 综上所述，本发明提出了一种基于异常数据剔除和重构的风电场理论功率曲线确定方法及装置，该方案将异常数据剔除和重构应用到风电场理论功率估算中，通过剔除异常数据来还原风速理论功率曲线，并以此回归重构异常数据点对应的理论功率数值来构建风电场理论功率曲线，最大限度地排除干扰数据，尽可能地还原真实的风电场理论功率曲线。
[0139] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。
[0140] 在本说明书的描述中，参考术语"一个实施例"、"一些实施例"、"示例"、"具体示例"、或"一些示例"等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0141] 以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【主权项】
1. 一种风电场理论功率曲线确定方法，其特征在于，包括：获取风电场中各风机在预设时间内的历史数据，其中所述历史数据包括:风速和功率；基于所述历史数据构建单机风速功率散点图；剔除所述单机风速功率散点图中的异常数据；针对剔除异常数据后的单机风速功率散点数据，按照以预设风速间隔划分的区间，分别计算各个区间对应的数据集合的聚类中心，并按照所述聚类中心构建单机等值功率曲线；基于所述单机等值功率曲线，对所剔除的异常数据点中的风速进行线性插值计算得到对应的理论功率数据，并根据所述理论功率数据重构单机在所述预设时间内的理论功率数据；根据各风机在所述预设时间内的理论功率数据得到风电场在所述预设时间内的理论功率曲线。2. 根据权利要求1所述的方法，其特征在于，剔除所述单机风速功率散点图中的异常数据，包括：利用罗曼诺夫斯基准则剔除所述单机风速功率散点图中的异常数据；以及利用聚类分析法剔除所述单机风速功率散点图中剩余的异常数据。3. 根据权利要求2所述的方法，其特征在于，利用罗曼诺夫斯基准则剔除所述单机风速功率散点图中沿第一方向分布的异常数据，包括：在所述单机风速功率散点图中，按照预设功率间隔将风机功率范围划分为P个功率区间，并按功率区间将风速功率散点数据划分为P个数据集合Xi，X2，…Xp; 将数据集合X1内的受怀疑数据a去掉，计算该数据集合X1内不包括受怀疑数据a的风速数据的算数平均值X，其中，KiSp; 计算该数据集合X1内不包括受怀疑数据Xh的风速数据的标准偏差S1; 根据第一预设显著水平^和该数据集合X1内包含的风速数据量m，在t分布表中查出检验系数IUa1,m); 若|χΛ -司> ，则确定受怀疑数据Xh为异常数据并进行剔除，在该数据集合&内除受怀疑数据Xh之外的风速数据中选定新的受怀疑数据，重复执行计算算术平均值、标准偏差和检验系数的步骤，直到剔除该数据集合X1内所有的异常数据；若|%-?7；)￥贝議定该数据集合除受怀疑数据Xh之外的风速数据均不是异常数据。4. 根据权利要求3所述的方法，其特征在于，采用以下公式计算该数据集合X1内不包括受怀疑数据Xh的风速数据的算数平均值I:其中，X1表示数据集合X1内的第i个风速数据；采用以下公式计算该数据集合X1内不包括受怀疑数据Xh的风速数据的标准偏差S1:5. 根据权利要求2或3所述的方法，其特征在于，利用罗曼诺夫斯基准则剔除所述单机风速功率散点图中沿第二方向分布的异常数据，包括：在所述单机风速功率散点图中，按照预设风速间隔将风机风速范围划分为q个风速区间，并按风速区间将风速功率散点数据划分为q个数据集合Yi，Y2，…Yq ; 将数据集合Y1内的受怀疑数据yh去掉，计算该数据集合Y1内不包括受怀疑数据yh的功率数据的算数平均值F，其中，KiSq; 计算该数据集合1内不包括受怀疑数据yh的功率数据的标准偏差S2; 根据第二预设显著水平^和该数据集合Y1内包含的功率数据量n，在t分布表中查出检验系数Κ(α2，η); 若I乃到则确定受怀疑数据yh为异常数据并进行剔除，在该数据集合γ1 内除受怀疑数据yh之外的功率数据中选定新的受怀疑数据，重复执行计算算术平均值、标准偏差和检验系数的步骤，直到剔除该数据集合^内所有的异常数据；若|凡-到，则确定该数据集合Y1R除受怀疑数据yh之外的功率数据均不是异常数据。6. 根据权利要求5所述的方法，其特征在于，采用以下公式计算该数据集合￥1内不包括受怀疑数据yh的功率数据的算数平均值.F:，其中，yi表示数据集合Yi内的第i个功率数据；采用以下公式计算该数据集合￥1内不包括受怀疑数据yh的功率数据的标准偏差S2:7. 根据权利要求2所述的方法，其特征在于，利用聚类分析法剔除所述单机风速功率散点图中剩余的异常数据，包括：在所述单机风速功率散点图中，按照预设风速间隔将风机风速范围划分为q个风速区间，并按风速区间将风速功率散点数据划分为q个数据集合Yl，Y2，…Yq ; 基于k均值聚类算法将数据集合Y1内的风速功率散点数据划分为k类数据C1，C2，…C k，并计算各个聚类的聚类中心Wl，W2，+Wk; 确定聚类中心Wl, W2,中的最大聚类中心Wmax以及对应的聚类Cmax; 确定与最大聚类中心wmax的距离大于预设值的所有聚类，并将确定的聚类作为异常数据进行剔除。8. 根据权利要求1所述的方法，其特征在于，采用以下公式对所剔除的异常数据点中的风速V进行线性插值计算得到对应的理论功率数据P :其中，（Xl，yi)，（XhD)表示所述单机等值功率曲线中相邻的两点，V表示所剔除的异常数据点中的风速，且V e [Xi，Xj]。9. 一种风电场理论功率曲线确定装置，其特征在于，包括：获取单元，用于获取风电场中各风机在预设时间内的历史数据，其中所述历史数据包括:风速和功率；第一构建单元，用于基于所述历史数据构建单机风速功率散点图；剔除单元，用于剔除所述单机风速功率散点图中的异常数据；第二构建单元，用于针对剔除异常数据后的单机风速功率散点数据，按照以预设风速间隔划分的区间，分别计算各个区间对应的数据集合的聚类中心，并按照所述聚类中心构建单机等值功率曲线；重构单元，用于基于所述单机等值功率曲线，对所剔除的异常数据点中的风速进行线性插值计算得到对应的理论功率数据，并根据所述理论功率数据重构单机在所述预设时间内的理论功率数据；计算单元，用于根据各风机在所述预设时间内的理论功率数据得到风电场在所述预设时间内的理论功率曲线。10. 根据权利要求9所述的装置，其特征在于，所述剔除单元包括：第一剔除子单元，用于利用罗曼诺夫斯基准则剔除所述单机风速功率散点图中的异常数据；以及第二剔除子单元，用于利用聚类分析法剔除所述单机风速功率散点图中剩余的异常数据。11. 根据权利要求10所述的装置，其特征在于，所述第一剔除子单元包括：第一划分模块，用于在所述单机风速功率散点图中，按照预设功率间隔将风机功率范围划分为P个功率区间，并按功率区间将风速功率散点数据划分为P个数据集合Xi，X2，…Xp; 第一计算模块，用于将数据集合X1内的受怀疑数据Xh去掉，计算该数据集合X1内不包括受怀疑数据Xh的风速数据的算数平均值f，其中，KiSp; 第二计算模块，用于计算该数据集合X1内不包括受怀疑数据Xh的风速数据的标准偏差 Si; 查找模块，用于根据第一预设显著水平<^和该数据集合X1内包含的风速数据量m，在t分布表中查出检验系数K(C^m); 第一确定模块，用于在，册;K的情况下，则确定受怀疑数据Xh为异常数据并进行剔除，在该数据集合&内除受怀疑数据Xh之外的风速数据中选定新的受怀疑数据，重复执行计算算术平均值、标准偏差和检验系数的步骤，直到剔除该数据集合X 1内所有的异常数据；第二确定模块，用于在|七,& (αρ的情况下，则确定该数据集合X1内除受怀疑数据Xh之外的风速数据均不是异常数据。12. 根据权利要求11所述的装置，其特征在于，所述第一计算模块具体用于采用以下公式计算该数据集合X1内不包括受怀疑数据Xh的风速数据的算数平均值，其中，Xl表示数据集合X1内的第i个风速数据；所述第二计算模块具体用于采用以下公式计算该数据集合X1内不包括受怀疑数据Xh的风速数据的标准13.根据权利要求10所述的装置，其特征在于，所述第二剔除子单元包括：第二划分模块，用于在所述单机风速功率散点图中，按照预设风速间隔将风机风速范围划分为q个风速区间，并按风速区间将风速功率散点数据划分为q个数据集合Yi，Y2，…Yq; 第三计算模块，用于基于k均值聚类算法将数据集合Y1内的风速功率散点数据划分为k 类数据Cl，C2，…Ck，并计算各个聚类的聚类中心Wl，W2，…Wk ; 第三确定模块，用于确定聚类中心Wl，W2，…Wk中的最大聚类中心Wmax以及对应的聚类 Cmax ；第四确定模块，用于确定与最大聚类中心Wmax的距离大于预设值的所有聚类，并将确定的聚类作为异常数据进行剔除。
【文档编号】G06Q50/06GK105930933SQ201610266284
【公开日】2016年9月7日
【申请日】2016年4月26日
【发明人】徐海翔, 崔正湃, 吴林林, 王靖然, 孙荣富, 刘辉, 王若阳, 李蕴红
【申请人】华北电力科学研究院有限责任公司, 国网冀北电力有限公司电力科学研究院, 国家电网公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐海翔;崔正湃;吴林林;王靖然;孙荣富;刘辉;王若阳;李蕴红;
技术所有人：华北电力科学研究院有限责任公司;国网冀北电力有限公司电力科学研究院;国家电网公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。