测风数据异常的识别方法和设备与流程

文档序号:20955976发布日期:2020-06-02 20:24阅读:465来源:国知局
测风数据异常的识别方法和设备与流程

本发明涉及风力发电技术领域,更具体地讲,涉及一种测风数据异常的识别方法和设备。



背景技术:

风电场发电量的评估是否准确,第一要点就是测风塔测量计算的风速是否准确。然而,测风塔在测风过程中,往往由于仪器损坏,数据传输故障,结冰覆冰等原因,部分测风数据出现缺失或异常,导致计算出的风速偏差较大,因此,风资源工程师需要识别出异常数据,将其排除统计。而现有技术大都是借助电子表格、风力资源分析软件(windographer)等软件工具,人工对异常数据识别并手动拖拉进行异常标识,此过程耗时费力,特别是测风塔测风时间较长以及测风文件较大时,需要耗费大量的人力成本和时间成本。并且由于,传统处理方式均是由风资源工程师手动筛选,不同工程师筛选的异常情况有所不同,不能统一化。



技术实现要素:

本发明的目的在于提供一种测风数据异常的识别方法和设备,以解决现有的识别方法耗时费力且不能统一化的问题。

本发明的一方面提供一种测风数据异常的识别方法,所述识别方法包括:获取测风数据,其中,测风数据包括测风数据测量期间内的各个时刻以及高度的测风数据;将各个时刻以及高度的测风数据与其对应的阈值范围进行比较,将在阈值范围之外的测风数据识别为第一异常数据;针对被识别为第一异常数据之外的测风数据,通过以下步骤来判断所述第一异常数据之外的测风数据是否为第二异常数据:针对任一时刻的任一高度的除气压之外的任一种测风数据,确定所述任一时刻前后两个第一预定时段内的所述任一高度的所述测风数据的众数的个数,占所述任一时刻前后两个第一预定时段内的所述任一高度的所述测风数据的总数量的第一比例;当所述第一比例大于或等于第一预定比例时,识别所述第一异常数据之外的测风数据为第二异常数据。

可选地,判断所述第一异常数据之外的测风数据是否为第二异常数据的步骤还包括:当所述第一比例小于第一预定比例且大于第二预定比例时,确定所述任一时刻前一个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的众数的个数,占所述任一时刻前一个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的总数量的第二比例,以及确定所述任一时刻后一个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的众数的个数,占所述任一时刻后一个第一预定时段内的所述除气压之外的任一高度的所述任一种种测风数据的总数据的第三比例;当所述第二比例和所述第三比例都大于或等于第一预定比例时,识别所述任一时刻的任一高度的除气压之外的任一种测风数据为第二异常数据。

可选地,还包括:在第二异常数据中,将其所在时刻以及所在高度的温度数据小于预定温度的第二异常数据确定为第三异常数据,其中所述测风数据包括温度数据;或者,在第二异常数据中,将其所在时刻为预定月份的第二异常数据确定为第三异常数据。

可选地,还包括:针对被识别第一异常数据和第二异常数据之外的测风数据,通过以下步骤来判断各个时刻的测风数据是否为第四异常数据:测风数据分为预定数量扇区的测风数据;根据每个扇区内的测风数据中的风速数据确定每个扇区内测风数据的全场平均切变指数以及各个时刻的实时切变指数;根据每个扇区内测风数据的全场平均切变指数以及各个时刻的实时切变指数推算每个扇区内的各个时刻的各个高度的风速;针对任一扇区内的任一时刻的所有高度的风速数据,当任一扇区内的任一时刻的所有高度的最大风速数据大于或等于预定风速时,在所有高度中,确定推算的风速数据与实际的风速数据相差的绝对值大于或等于最大高度的实际风速的第一预定倍数的第一高度,以及确定推算的风速数据与实际的风速数据相差的绝对值小于最大高度的实际风速的第一预定倍数,且大于或等于最大高度的实际风速的第二预定倍数的第二高度,将确定的第一高度的风速数据识别为第四异常数据,将确定的第二高度的风速数据识别为可疑异常的数据,将所述任一时刻的其他高度的风速数据确定为正常数据,其中,第一预定倍数大于第二预定倍数;针对任一扇区内的任一时刻的所有高度的风速数据,当任一扇区内的任一时刻的所有高度的最大风速数据小于预定风速时,在所有高度中,确定推算的风速数据与实际的风速数据相差的绝对值大于或等于第一预定常数的第三高度,以及确定推算的风速数据与实际的风速数据相差的绝对值小于第一预定常数,且大于或等于第二预定常数的第四高度,将确定的第三高度的风速数据识别为第四异常数据,将确定的第四高度的风速数据识别为可疑异常的数据,将其他高度的风速数据确定为正常数据,其中,第一预定常数大于第二预定常数。

可选地,还包括:针对被识别为正常或者可疑异常的风速数据,通过以下步骤来识别各个扇区的各个时刻的各个高度的测风数据是否为可疑异常的数据:针对任一扇区内的任一时刻的任一高度的风速数据,确定所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据的总数量的第四比例,当所述第四比例大于或等于第四预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据;当所述第四比例小于第四预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据。

可选地,还包括:针对被识别为正常或者可疑异常的风速数据,通过以下步骤来识别各个扇区的各个时刻的各个高度的测风数据是否为可疑异常的数据:针对任一扇区内的任一时刻的任一高度的风速数据,确定所述任一扇区内的所述任一时刻前后两个第三预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第三预定时段内的所述任一高度的测风数据的总数量的第五比例;当所述第五比例大于或等于第五预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据;当所述第五比例小于第五预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据,其中,所述第三预定时段小于所述第二时段。

可选地,还包括:在识别异常数据之前,识别获取的测风数据的格式,并确定获取的测风数据的格式与预定的格式是否一致;当获取的测风数据的格式与预定的格式不一致时,将获取的测风数据的格式转换为预定的格式。

可选地,还包括:在识别异常数据之前,查找所述测风数据测量期间内缺失测风数据的时刻,用空值补齐查找的时刻的测风数据。

可选地,还包括:在识别异常数据之前,创建各个时刻的各个高度的各种测风数据的标签,并且将各个时刻的各个高度的各种测风数据的标签值的初始值设定为第一预定值;在识别各种类型的异常数据后,将不同类型的异常数据的标签值更改为不同的预定值。

本发明的另一方面提供一种测风数据异常的识别设备,包括:获取单元,获取测风数据,其中,测风数据包括测风数据测量期间内的各个时刻以及高度的测风数据;第一识别单元,将各个时刻以及高度的各种测风数据与其对应的阈值范围进行比较,将在阈值范围之外的测风数据识别为第一异常数据;第二识别单元,针对被识别为第一异常数据之外的测风数据,通过以下处理来判断第一异常数据之外的测风数据是否为第二异常数据:针对任一时刻的任一高度的除气压之外的任一种测风数据,确定所述任一时刻前后两个第一预定时段内的所述任一高度的所述任一种测风数据的众数的个数,占所述任一时刻前后两个第一预定时段内的所述任一高度的所述任一种测风数据的总数量的第一比例;当所述第一比例大于或等于第一预定比例时,识别所述任一时刻的任一高度的任一种测风数据为第二异常数据。

可选地,判断所述第一异常数据之外的测风数据是否为第二异常数据的处理还包括:当所述第一比例小于第一预定比例且大于第二预定比例时,确定所述任一时刻前一个第一预定时段内的所述任一高度的所述任一种除气压之外的测风数据的众数的个数,占所述任一时刻前一个第一预定时段内的所述任一高度的所述任一种除气压之外的测风数据的总数量的第二比例,以及确定所述任一时刻后一个第一预定时段内的所述任一高度的所述任一种除气压之外的测风数据的众数的个数,占所述任一时刻后一个第一预定时段内的所述任一高度的所述任一种除气压之外的测风数据的总数据的第三比例;当所述第二比例和所述第三比例都大于或等于第一预定比例时,识别所述任一时刻的任一高度的任一种测风数据为第二异常数据。

可选地,还包括:第三识别单元,在第二异常数据中,将其所在时刻以及所在高度的温度数据小于预定温度的第二异常数据确定为第三异常数据其中所述测风数据包括温度数据;或者,在第二异常数据中,将其所在时刻为预定月份的第二异常数据确定为第三异常数据。

可选地,还包括:异地异常单元,针对被识别第一异常数据和第二异常数据之外的测风数据,通过以下处理来判断各个时刻的测风数据是否为第四异常数据:将测风数据分为预定数量扇区的测风数据;根据每个扇区内的测风数据中的风速数据确定每个扇区内测风数据的全场平均切变指数以及各个时刻的实时切变指数;根据每个扇区内测风数据的全场平均切变指数以及各个时刻的实时切变指数推算每个扇区内的各个时刻的各个高度的风速;针对任一扇区内的任一时刻的所有高度的风速数据,当任一扇区内的任一时刻的所有高度的最大风速数据大于或等于预定风速时,在所有高度中,确定推算的风速数据与实际的风速数据相差的绝对值大于或等于最大高度的实际风速的第一预定倍数的第一高度,以及确定推算的风速数据与实际的风速数据相差的绝对值小于最大高度的实际风速的第一预定倍数,且大于或等于最大高度的实际风速的第二预定倍数的第二高度,将确定的第一高度的风速数据识别为第四异常数据,将确定的第二高度的风速数据识别为可疑异常的数据,将所述任一时刻的其他高度的风速数据确定为正常数据,其中,第一预定倍数大于第二预定倍数;针对任一扇区内的任一时刻的所有高度的风速数据,当任一扇区内的任一时刻的所有高度的最大风速数据小于预定风速时,在所有高度中,确定推算的风速数据与实际的风速数据相差的绝对值大于或等于第一预定常数的第三高度,以及确定推算的风速数据与实际的风速数据相差的绝对值小于第一预定常数,且大于或等于第二预定常数的第四高度,将确定的第三高度的风速数据识别为第四异常数据,将确定的第四高度的风速数据识别为可疑异常的数据,将其他高度的风速数据确定为正常数据,其中,第一预定常数大于第二预定常数。

可选地,还包括:第五识别单元,针对被识别为正常或者可疑异常的风速数据,通过以下处理来识别各个扇区的各个时刻的各个高度的测风数据是否为可疑异常的数据:针对任一扇区内的任一时刻的任一高度的风速数据,确定所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据的总数量的第四比例,当所述第四比例大于或等于第四预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据;当所述第四比例小于第四预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据。

可选地,还包括:第六识别单元,针对被识别为正常或者可疑异常的风速数据,通过以下处理来识别各个扇区的各个时刻的各个高度的测风数据是否为可疑异常的数据:针对任一扇区内的任一时刻的任一高度的风速数据,确定所述任一扇区内的所述任一时刻前后两个第三预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第三预定时段内的所述任一高度的测风数据的总数量的第五比例;当所述第五比例大于或等于第五预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据;当所述第五比例小于第五预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据,其中,所述第三预定时段小于所述第二时段。

可选地,还包括:预处理单元,在识别异常数据之前,识别获取的测风数据的格式,并确定获取的测风数据的格式与预定的格式是否一致;当获取的测风数据的格式与预定的格式不一致时,将获取的测风数据的格式转换为预定的格式。

可选地,还包括:预处理单元,在识别异常数据之前,查找所述测风数据测量期间内缺失测风数据的时刻,用空值补齐查找的时刻的测风数据。

可选地,还包括:标签单元,在识别异常数据之前,创建各个时刻的各个高度的各种测风数据的标签,并且将各个时刻的各个高度的各种测风数据的标签值的初始值设定为第一预定值;在识别各种类型的异常数据后,将不同类型的异常数据的标签值更改为不同的预定值。

本发明的另一方面提供一种测风数据异常的识别系统,所述系统包括:处理器;存储器,存储有计算机程序,当所述计算机程序被处理器执行时,执行如上所述的方法。

本发明的另一方面提供一种其中存储有计算机程序的计算机可读存储介质,当所述计算机程序被执行时实现如上所述的方法。

根据本发明的实施例的测风数据异常的识别方法和设备,可对获取的测风数据中的异常数据进行自动的识别,效率较高,省时节力,并且对异常数据的识别过程进行统一化、标准化,避免手动筛选时由于不同的工程师处理造成的误差。

将在接下来的描述中部分阐述本发明另外的方面和/或优点,还有一部分通过描述将是清楚的,或者可以经过本发明的实施而得知。

附图说明

通过下面结合附图进行的详细描述,本发明的上述和其它目的、特点和优点将会变得更加清楚,其中:

图1是示出根据本发明的实施例的测风数据异常的识别方法的流程图;

图2是示出根据本发明的实施例的测风数据异常的识别设备的框图。

具体实施方式

下面参照附图详细描述本发明的实施例。

图1是示出根据本发明的实施例的测风数据异常的识别方法的流程图。

作为示例,测风数据又称测风塔数据,包括是由在测风塔上不同高度安装的各种传感器在不同的时刻采集的各种测风数据(例如:风速数据、风向数据、温度数据、气压数据等),可被存储于数据记录器中。

作为示例,测风塔是用于测量各种测风数据的高耸结构,其用于安装各种传感器以及数据记录器。

在步骤s10,获取测风数据。获取的测风数据包括测风数据测量期间内的各个时刻的各个高度的各种测风数据,也就是说,在各个时刻以及各个高度测量的各种测风数据。

在一个优选的实施例中,由于从不同来源获取的测风数据的格式可能不同,为了方便后续的数据处理,在识别异常数据之前,可先识别获取的测风数据的格式,并确定获取的测风数据的格式与预定的格式是否一致。当测风数据的格式与预定的格式不一致时,将将测风数据转换为预定的格式,以将不同的测风数据的格式进行统一。

统一格式后的测风数据的同一列数据可以由不同时刻的同一高度的同一种测风数据组成。作为示例,统一格式后的测风数据的列的名称可以是指示该列包括的测风数据所对应的高度以及类型,例如列名称为ws_90中的测风数据为高度为90米的风速数据。作为示例,可将统一格式后的测风数据中没有数据的列进行删除。

此外,为了保证测风数据的完整性,可在识别异常数据之前,对测风数据进行重塑,即查找测风数据测量期间内缺失测风数据的时刻,用空值补齐查找的时刻的测风数据。

此外,为了方便测风数据的管理以及便于区分异常数据和正常数据,可在识别异常数据之前,创建各个时刻的各个高度的各种测风数据的标签,并且将各个时刻的各个高度的各种测风数据的标签值的初始值设定为第一预定值;在识别各种类型的异常数据后,将不同类型的异常数据的标签值更改为不同的预定值。

例如,将各个时刻的各个高度的各种测风数据的标签值的初始值设定为1;在识别各种类型的异常数据后,将超出正常阈值的异常数据(下文称为第一异常数据)的标签值更改为-1,将冰冻数据(下文称为第三异常数据)的标签值更改为-2,将一定时间内恒定的异常数据(下文称为第二异常数据)的标签值更改为-3,将趋势不一致的异常风速数据(下文称为第四异常数据)的标签值更改为-5,将可疑异常的数据(即可能异常的数据)的标签值更改为-4。

在步骤s20,将各个时刻以及高度的测风数据(即各个时刻的各个高度的测风数据)与其对应的阈值范围进行比较,将在阈值范围之外的测风数据识别为第一异常数据。

作为示例,可预先设置不同类型的测风数据对应的阈值范围,表1示出了不同类型的测风数据对应的阈值范围的示例。在步骤s20,针对任一时刻的任一高度的任一种测风数据,确定其是否在与该任一种测风数据对应的阈值范围之内,当其在阈值范围之外时,将其识别为第一异常数据,当其在阈值范围之内时,将其识别为正常数据。

表1各种测风数据对应的阈值范围的示例

作为示例,对于识别为第一异常数据的测风数据,可将其标签值更改为-1。

在步骤s30,针对第一异常数据之外的测风数据,通过以下步骤来判断第一异常数据之外的测风数据(即第一异常数据之外的各个时刻的各个高度的各种测风数据)是否为第二异常数据:针对任一时刻的任一高度的除气压之外的任一种测风数据,确定所述任一时刻前后两个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的众数的个数,占所述任一时刻前后两个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的总数量的第一比例;当所述第一比例大于或等于第一预定比例时,识别所述第一异常数据之外的测风数据为第二异常数据,即识别所述任一时刻的任一高度的除气压之外的任一种测风数据为第二异常数据。

作为示例,当第一比例小于第一预定比例且大于第二预定比例时,确定所述任一时刻前一个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的众数的个数,占所述任一时刻前一个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的总数量的第二比例,以及确定所述任一时刻后一个第一预定时段内的所述任一高度的所述除气压之外的任一种种测风数据的众数的个数,占所述任一时刻后一个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的总数据的第三比例;当所述第二比例和所述第三比例都大于或等于第一预定比例时,识别所述任一时刻的任一高度的除气压之外的任一种测风数据为第二异常数据。

作为示例,在步骤s30,可将测风数据中识别出的第一异常数据设置为空值,不再予以考虑;根据测风数据中的列名称,筛选出各种测风数据(例如风速数据、风向数据、温度数据等);针对筛选出的所有测风数据,通过以下方式依次遍历测风数据中每个时刻的每个高度的每种测风数据:针对任一时刻的任一高度的除气压之外的任一种测风数据,以该任一时刻为目标时刻点,将其分别左右平移第一预定时段(例如,3个小时),此时得到以目标时刻点为中心的6个小时的所述任一高度的所述除气压之外的任一种测风数据;计算这6个小时内所述任一高度的所述除气压之外的任一种测风数据的众数的个数,以及计算这6个小时内所述除气压之外的任一高度的所述任一种测风数据的总数量,若在这个时间段内众数的个数占总数量的比例大于或等于第一预定比例(例如85%),则识别该任一时刻的任一高度的除气压之外的任一种测风数据为一定时间恒定的异常数据(即第三异常数据),可将其标签值更改为-3。

若在这个时间段内众数的个数占总数量的比例小于第一预定比例,但是大于第二预定比例(例如50%),则分别判断在目标时刻点前面和后面的两个时间段内(例如各3小时),各自的众数占各自总数量的比例(第二比例和第三比例)是否都大于或等于第一预定比例,若第二比例和第三比例都大于或等于,则识别该任一时刻的任一高度的除气压之外的任一种测风数据为一定时间恒定的异常数据(即第三异常数据),可将其标签值更改为-3。;若第二比例或第三比例小于第一预定比例,则识别该任一时刻的任一高度的除气压之外的任一种测风数据为正常数据,标签值仍为1。

在另外一个实施例中,测风数据异常的识别方法还可识别一定时间内恒定的异常数据是否为冰冻数据(即第三异常数据)。

具体说来,当测风数据中包括温度数据时,在第二异常数据中,将其所在时刻以及所在高度的温度数据小于预定温度(例如2摄氏度)的第二异常数据确定为第三异常数据。

此外,还可根据第二异常数据所处季节进行判断。具体说来,在第二异常数据中,将其所在时刻为预定月份的第二异常数据确定为第三异常数据。例如,将所在时刻为9月、10月、11月、12月、1月或2月其中任何一个月份的第二异常数据判定为冰冻数据,其标签值可更改为记为-2。

在另外一个实施例中,测风数据异常的识别方法还可识别趋势不一致的异常风速数据(即第四异常数据)。

具体说来,可针对第一异常数据、第二异常数据和第三异常数据之外的测风数据,通过以下步骤来判断各个时刻的测风数据是否为第四异常数据:将测风数据分为预定数量扇区的测风数据;根据每个扇区内的测风数据中的风速数据确定每个扇区内测风数据的全场平均切变指数以及各个时刻的实时切变指数;根据每个扇区内测风数据的全场平均切变指数以及各个时刻的实时切变指数推算每个扇区内的各个时刻的各个高度的风速;针对任一扇区内的任一时刻的所有高度的风速数据,当任一扇区内的任一时刻的所有高度的最大风速数据大于或等于预定风速时,在所有高度中,确定推算的风速数据与实际的风速数据相差的绝对值大于或等于最大高度的实际风速的第一预定倍数的第一高度,以及确定推算的风速数据与实际的风速数据相差的绝对值小于最大高度的实际风速的第一预定倍数,且大于或等于最大高度的实际风速的第二预定倍数的第二高度,将确定的第一高度的风速数据识别为第四异常数据,将确定的第二高度的风速数据识别为可疑异常的数据,将其他高度的风速数据确定为正常数据,其中,第一预定倍数大于第二预定倍数;当任一扇区内的任一时刻的所有高度的最大风速数据小于预定风速时,在所有高度中,确定推算的风速数据与实际的风速数据相差的绝对值大于或等于第一预定常数的第三高度,以及确定推算的风速数据与实际的风速数据相差的绝对值小于第一预定常数,且大于或等于第二预定常数的第四高度,将确定的第三高度的风速数据识别为第四异常数据,将确定的第四高度的风速数据识别为可疑异常的数据,将其他高度的风速数据确定为正常数据,其中,第一预定常数大于第二预定常数。

作为示例,可将测风数据中识别出的第一异常数据、第二异常数据和第三异常数据设置为空值,不再予以考虑;根据测风数据中的风向数据将测风数据分为预定数量(例如12)扇区的测风数据,即得到预定数量不同扇区的测风数据;在每一个扇区内,将所有包括风速数据的列中,风速数据的个数小于最大数据的50%的列删除,避免求切变时出现较大偏差,其中,最大数据是指所有列中的包括的风速数据的个数最多的列包括的风速数据的个数;计算每个扇区内测风数据的全场平均切变指数以及每个时刻的实时切变指数;根据每个扇区内测风数据的全场平均切变指数以及各个时刻的实时切变指数推算每个扇区内的各个时刻的各个高度的风速,其中,若某个时刻的实时切变指数大于0,则推算时采用全场平均切变指数;反之,则推算时采用该时刻的实时切变指数。

作为示例,上述的预定风速、第一预定倍数、第二预定倍数、第一预定常数和第二预定数据可进行预先设定。例如,预定风速可设定为5米每秒,第一预定倍数可设定为0.4,第二预定倍数可设定为0.3,第一预定常数可以为3,第二预定常数为2。

作为示例,针对任一扇区内的任一时刻的所有高度的风速数据,当任一扇区内的任一时刻的所有高度的最大风速数据≥5米每秒时,通过以下方式来确定所述任一扇区内的任一时刻的各个高度的风速数据是否为第四异常数据。

若某一高度的推算的风速数据与实际的风速数据相差的绝对值≥0.4×最大高度的实际风速,则确定该高度的风速数据为第四异常数据。

若0.3×最大高度的实际风速≤某一高度的推算的风速数据与实际的风速数据相差的绝对值<0.4×最大高度的实际风速,则确定该高度的风速数据为可疑异常的数据。

作为示例,针对任一扇区内的任一时刻的所有高度的风速数据,当任一扇区内的任一时刻的所有高度的最大风速数据<5米每秒时,通过以下方式来确定所述任一扇区内的任一时刻的各个高度的风速数据是否为第四异常数据。

若某一高度的推算的风速数据与实际的风速数据相差的绝对值≥1.5×2,则确定该高度的风速数据为第四异常数据。

若2≤某一高度的推算的风速数据与实际的风速数据相差的绝对值<1.5×2,则确定该高度的风速数据为可疑异常的数据。

作为示例,可将确定为第四异常数据的测风数据的标签值更改为-5,将确定为可疑异常的数据的测风数据的标签值更改为-4。

此外,为了进一步识别在上述步骤中被识别为正常或者可疑异常的风速数据,针对在上述步骤中被识别为正常或者可疑异常的风速数据,通过以下步骤来识别各个扇区的各个时刻的各个高度的测风数据是否为可疑异常的数据:针对任一扇区内的任一时刻的任一高度的风速数据,确定所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据的总数量的第四比例,当所述第四比例大于或等于第四预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据,当所述第四比例小于第四预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据。

作为示例,针对任一扇区内的任一时刻的任一高度的风速数据,以该任一时刻为目标时刻点,将其分别左右平移第二预定时段(例如,3个小时),此时得到以目标时刻点为中心的6个小时的所述任一高度的风速数据;确定所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据的总数量的第四比例,当第四比例大于或等于第四预定比例(例如85%)时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据,并将其标签值由-4修改为1,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据,并将其标签由1修改为-4。

此外,为了再进一步识别在上述步骤中被识别为正常或者可疑异常的风速数据,可缩小考虑的时段。

具体说来,针对在上述步骤中被识别为正常或者可疑异常的风速数据,通过以下步骤来识别各个扇区的各个时刻的各个高度的测风数据是否为可疑异常的数据:针对任一扇区内的任一时刻的任一高度的风速数据,确定所述任一扇区内的所述任一时刻前后两个第三预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第三预定时段内的所述任一高度的测风数据的总数量的第五比例,当所述第五比例大于或等于第五预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据,当所述第五比例小于第五预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据。

作为示例,针对任一扇区内的任一时刻的任一高度的风速数据,以该任一时刻为目标时刻点,将其分别左右平移第二预定时段(例如,2个小时),此时得到以目标时刻点为中心的4个小时的所述任一高度的风速数据;确定所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据的总数量的第五比例,当第五比例大于或等于第五预定比例(例如85%)时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据,并将其标签值由-4修改为1,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据,并将其标签由1修改为-4。

在完成异常数据的识别后,可将各个扇区的测风数据的标签值数据按时间顺序合并为一个标签文件。

图2是示出根据本发明的实施例的测风数据异常的识别设备的框图。根据本发明的的实施例的测风数据异常的识别设备可包括获取单元10、第一识别单元20和第二识别单元30。

作为示例,测风数据又称测风塔数据,包括是由在测风塔上不同高度安装的各种传感器在不同的时刻采集的各种测风数据(例如:风速数据、风向数据、温度数据、气压数据等),可被存储于数据记录器中。

作为示例,测风塔是用于测量各种测风数据的高耸结构,其用于安装各种传感器以及数据记录器。

获取单元10用于获取测风数据。获取的测风数据包括测风数据测量期间内的各个时刻的各个高度的各种测风数据,也就是说,在各个时刻以及各个高度测量的各种测风数据。

在一个优选的实施例中,由于从不同来源获取的测风数据的格式可能不同,为了方便后续的数据处理,识别设备还可包括预处理单元(图中未示出),在识别异常数据之前,预处理单元可先识别获取的测风数据的格式,并确定获取的测风数据的格式与预定的格式是否一致。当测风数据的格式与预定的格式不一致时,预处理单元将测风数据转换为预定的格式,以将不同的测风数据的格式进行统一。

统一格式后的测风数据的同一列数据可以由不同时刻的同一高度的同一种测风数据组成。作为示例,统一格式后的测风数据的列的名称可以是指示该列包括的测风数据所对应的高度以及类型,例如列名称为ws_90中的测风数据为高度为90米的风速数据。作为示例,可将统一格式后的测风数据中没有数据的列进行删除。

此外,为了保证测风数据的完整性,可在识别异常数据之前,预处理单元还可对测风数据进行重塑,即查找测风数据测量期间内缺失测风数据的时刻,用空值补齐查找的时刻的测风数据。

此外,为了方便测风数据的管理以及便于区分异常数据和正常数据,识别设备还可包括标签单元(图中未示出),可在识别异常数据之前,标签单元创建各个时刻的各个高度的各种测风数据的标签,并且将各个时刻的各个高度的各种测风数据的标签值的初始值设定为第一预定值;在识别各种类型的异常数据后,将不同类型的异常数据的标签值更改为不同的预定值。

例如,标签单元将各个时刻的各个高度的各种测风数据的标签值的初始值设定为1;在识别各种类型的异常数据后,将超出正常阈值的异常数据(下文称为第一异常数据)的标签值更改为-1,将冰冻数据(下文称为第三异常数据)的标签值更改为-2,将一定时间内恒定的异常数据(下文称为第二异常数据)的标签值更改为-3,将趋势不一致的异常风速数据(下文称为第四异常数据)的标签值更改为-5,将可疑异常的数据(即可能异常的数据)的标签值更改为-4。

第一识别单元20用于将各个时刻以及高度的测风数据(即各个时刻的各个高度的测风数据)与其对应的阈值范围进行比较,将在阈值范围之外的测风数据识别为第一异常数据。

作为示例,可预先设置不同类型的测风数据对应的阈值范围,上述的表1示出了不同类型的测风数据对应的阈值范围的示例。第一识别单元20针对任一时刻的任一高度的任一种测风数据,确定其是否在与该任一种测风数据对应的阈值范围之内,当其在阈值范围之外时,将其识别为第一异常数据,当其在阈值范围之内时,将其识别为正常数据。

作为示例,对于识别为第一异常数据的测风数据,可将其标签值更改为-1。

第二识别单元30针对第一异常数据之外的测风数据,通过以下处理来判断第一异常数据之外的测风数据(即第一异常数据之外的各个时刻的各个高度的各种测风数据)是否为第二异常数据:针对任一时刻的任一高度的除气压之外的任一种测风数据,确定所述任一时刻前后两个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的众数的个数,占所述任一时刻前后两个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的总数量的第一比例;当所述第一比例大于或等于第一预定比例时,识别所述第一异常数据之外的测风数据为第二异常数据,即识别所述任一时刻的任一高度的除气压之外的任一种测风数据为第二异常数据。

作为示例,当第一比例小于第一预定比例且大于第二预定比例时,确定所述任一时刻前一个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的众数的个数,占所述任一时刻前一个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的总数量的第二比例,以及确定所述任一时刻后一个第一预定时段内的所述任一高度的所述除气压之外的任一种种测风数据的众数的个数,占所述任一时刻后一个第一预定时段内的所述任一高度的所述除气压之外的任一种测风数据的总数据的第三比例;当所述第二比例和所述第三比例都大于或等于第一预定比例时,识别所述任一时刻的任一高度的除气压之外的任一种测风数据为第二异常数据。

作为示例,第二识别单元30可将测风数据中识别出的第一异常数据设置为空值,不再予以考虑;根据测风数据中的列名称,筛选出各种测风数据(例如风速数据、风向数据、温度数据等);针对筛选出的所有测风数据,通过以下方式依次遍历测风数据中每个时刻的每个高度的每种测风数据:针对任一时刻的任一高度的除气压之外的任一种测风数据,以该任一时刻为目标时刻点,将其分别左右平移第一预定时段(例如,3个小时),此时得到以目标时刻点为中心的6个小时的所述任一高度的所述除气压之外的任一种测风数据;计算这6个小时内所述任一高度的所述除气压之外的任一种测风数据的众数的个数,以及计算这6个小时内所述除气压之外的任一高度的所述任一种测风数据的总数量,若在这个时间段内众数的个数占总数量的比例大于或等于第一预定比例(例如85%),则识别该任一时刻的任一高度的除气压之外的任一种测风数据为一定时间恒定的异常数据(即第三异常数据),标签单元将其标签值更改为-3。

若在这个时间段内众数的个数占总数量的比例小于第一预定比例,但是大于第二预定比例(例如50%),则分别判断在目标时刻点前面和后面的两个时间段内(例如各3小时),各自的众数占各自总数量的比例(第二比例和第三比例)是否都大于或等于第一预定比例,若第二比例和第三比例都大于或等于,则识别该任一时刻的任一高度的除气压之外的任一种测风数据为一定时间恒定的异常数据(即第三异常数据),标签单元可将其标签值更改为-3。;若第二比例或第三比例小于第一预定比例,则识别该任一时刻的任一高度的除气压之外的任一种测风数据为正常数据,标签值仍为1。

在另外一个实施例中,测风数据异常的识别设备还可包括第三识别单元(图中未示出),第三识别单元用于识别一定时间内恒定的异常数据是否为冰冻数据(即第三异常数据)。

具体说来,当测风数据中包括温度数据时,在第二异常数据中,第三识别单元将其所在时刻以及所在高度的温度数据小于预定温度(例如2摄氏度)的第二异常数据确定为第三异常数据。

此外,还可根据第二异常数据所处季节进行判断。具体说来,在第二异常数据中,第三识别单元将其所在时刻为预定月份的第二异常数据确定为第三异常数据。例如,将所在时刻为9月、10月、11月、12月、1月或2月其中任何一个月份的第二异常数据判定为冰冻数据,其标签值可被更改为记为-2。

在另外一个实施例中,测风数据异常的识别设备还可包括第四识别单元(图中未示出),用于识别趋势不一致的异常风速数据(即第四异常数据)。

具体说来,可针对第一异常数据、第二异常数据和第三异常数据之外的测风数据,第四识别单元通过以下处理来判断各个时刻的测风数据是否为第四异常数据:将测风数据分为预定数量扇区的测风数据;根据每个扇区内的测风数据中的风速数据确定每个扇区内测风数据的全场平均切变指数以及各个时刻的实时切变指数;根据每个扇区内测风数据的全场平均切变指数以及各个时刻的实时切变指数推算每个扇区内的各个时刻的各个高度的风速;针对任一扇区内的任一时刻的所有高度的风速数据,当任一扇区内的任一时刻的所有高度的最大风速数据大于或等于预定风速时,在所有高度中,确定推算的风速数据与实际的风速数据相差的绝对值大于或等于最大高度的实际风速的第一预定倍数的第一高度,以及确定推算的风速数据与实际的风速数据相差的绝对值小于最大高度的实际风速的第一预定倍数,且大于或等于最大高度的实际风速的第二预定倍数的第二高度,将确定的第一高度的风速数据识别为第四异常数据,将确定的第二高度的风速数据识别为可疑异常的数据,将其他高度的风速数据确定为正常数据,其中,第一预定倍数大于第二预定倍数;当任一扇区内的任一时刻的所有高度的最大风速数据小于预定风速时,在所有高度中,确定推算的风速数据与实际的风速数据相差的绝对值大于或等于第一预定常数的第三高度,以及确定推算的风速数据与实际的风速数据相差的绝对值小于第一预定常数,且大于或等于第二预定常数的第四高度,将确定的第三高度的风速数据识别为第四异常数据,将确定的第四高度的风速数据识别为可疑异常的数据,将其他高度的风速数据确定为正常数据,其中,第一预定常数大于第二预定常数。

作为示例,第四识别单元可将测风数据中识别出的第一异常数据、第二异常数据和第三异常数据设置为空值,不再予以考虑;根据测风数据中的风向数据将测风数据分为预定数量(例如12)扇区的测风数据,即得到预定数量不同扇区的测风数据;在每一个扇区内,将所有包括风速数据的列中,风速数据的个数小于最大数据的50%的列删除,避免求切变时出现较大偏差,其中,最大数据是指所有列中的包括的风速数据的个数最多的列包括的风速数据的个数;计算每个扇区内测风数据的全场平均切变指数以及每个时刻的实时切变指数;根据每个扇区内测风数据的全场平均切变指数以及各个时刻的实时切变指数推算每个扇区内的各个时刻的各个高度的风速,其中,若某个时刻的实时切变指数大于0,则推算时采用全场平均切变指数;反之,则推算时采用该时刻的实时切变指数。

作为示例,上述的预定风速、第一预定倍数、第二预定倍数、第一预定常数和第二预定数据可进行预先设定。例如,预定风速可设定为5米每秒,第一预定倍数可设定为0.4,第二预定倍数可设定为0.3,第一预定常数可以为3,第二预定常数为2。

作为示例,针对任一扇区内的任一时刻的所有高度的风速数据,当任一扇区内的任一时刻的所有高度的最大风速数据≥5米每秒时,通过以下方式来确定所述任一扇区内的任一时刻的各个高度的风速数据是否为第四异常数据。

若某一高度的推算的风速数据与实际的风速数据相差的绝对值≥0.4×最大高度的实际风速,则确定该高度的风速数据为第四异常数据。

若0.3×最大高度的实际风速≤某一高度的推算的风速数据与实际的风速数据相差的绝对值<0.4×最大高度的实际风速,则确定该高度的风速数据为可疑异常的数据。

作为示例,针对任一扇区内的任一时刻的所有高度的风速数据,当任一扇区内的任一时刻的所有高度的最大风速数据<5米每秒时,通过以下方式来确定所述任一扇区内的任一时刻的各个高度的风速数据是否为第四异常数据。

若某一高度的推算的风速数据与实际的风速数据相差的绝对值≥1.5×2,则确定该高度的风速数据为第四异常数据。

若2≤某一高度的推算的风速数据与实际的风速数据相差的绝对值<1.5×2,则确定该高度的风速数据为可疑异常的数据。

作为示例,标签单元可将确定为第四异常数据的测风数据的标签值更改为-5,将确定为可疑异常的数据的测风数据的标签值更改为-4。

此外,为了进一步识别在上述处理中被识别为正常或者可疑异常的风速数据,识别设备还可包括第五识别单元,用于针对在上述处理中被识别为正常或者可疑异常的风速数据,通过以下处理来识别各个扇区的各个时刻的各个高度的测风数据是否为可疑异常的数据:针对任一扇区内的任一时刻的任一高度的风速数据,确定所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据的总数量的第四比例,当所述第四比例大于或等于第四预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据,当所述第四比例小于第四预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据。

作为示例,第五识别单元针对任一扇区内的任一时刻的任一高度的风速数据,以该任一时刻为目标时刻点,将其分别左右平移第二预定时段(例如,3个小时),此时得到以目标时刻点为中心的6个小时的所述任一高度的风速数据;确定所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据的总数量的第四比例,当第四比例大于或等于第四预定比例(例如85%)时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据,标签单元将其标签值由-4修改为1,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据,标签单元将其标签由1修改为-4。

此外,为了再进一步识别在上述步骤中被识别为正常或者可疑异常的风速数据,可缩小考虑的时段。

具体说来,识别设备还可包括第六识别单元,用于针对在上述步骤中被识别为正常或者可疑异常的风速数据,通过以下处理来识别各个扇区的各个时刻的各个高度的测风数据是否为可疑异常的数据:针对任一扇区内的任一时刻的任一高度的风速数据,确定所述任一扇区内的所述任一时刻前后两个第三预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第三预定时段内的所述任一高度的测风数据的总数量的第五比例,当所述第五比例大于或等于第五预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据,当所述第五比例小于第五预定比例时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据。

作为示例,第六识别单元针对任一扇区内的任一时刻的任一高度的风速数据,以该任一时刻为目标时刻点,将其分别左右平移第二预定时段(例如,2个小时),此时得到以目标时刻点为中心的4个小时的所述任一高度的风速数据;确定所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据为正常的测风数据的个数,占所述任一扇区内的所述任一时刻前后两个第二预定时段内的所述任一高度的测风数据的总数量的第五比例,当第五比例大于或等于第五预定比例(例如85%)时,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为可疑异常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为正常数据,标签单元将其标签值由-4修改为1,如果所述任一扇区内的所述任一时刻的所述任一高度的风速数据目前为正常的数据时,将所述任一扇区内的所述任一时刻的所述任一高度的风速数据识别为可疑异常的数据,标签将其标签由1修改为-4。

在完成异常数据的识别后,标签单元可将各个扇区的测风数据的标签值数据按时间顺序合并为一个标签文件。

根据本发明的实施例的测风数据异常的识别方法和设备,可对获取的测风数据中的异常数据进行自动的识别,效率较高,省时节力,并且对异常数据的识别过程进行统一化、标准化,避免手动筛选时由于不同的工程师处理造成的误差。

此外,根据本发明的实施例的测风数据异常的识别方法和设备支持不同的测风数据的格式,不用手动进行转换,并且能够有效区别测风数据的异常类型。

根据本发明的一个实施例,本发明还提供一种其中存储有计算机程序的计算机可读存储介质,当所述计算机程序被执行时实现如上所述的方法。

根据本发明的一个实施例,本发明还提供一种测风数据异常的识别系统。所述系统包括:处理器和存储器。存储器存储有计算机程序,当所述计算机程序被处理器执行时,执行如上所述的方法。

此外,应该理解,根据本发明示例性实施例的设备中的各个单元可被实现硬件组件和/或软件组件。本领域技术人员根据限定的各个单元所执行的处理,可以例如使用现场可编程逻辑控制器(plc)、现场可编程门阵列(fpga)或专用集成电路(asic)来实现各个单元。

此外,根据本发明示例性实施例的方法可以被实现为计算机可读记录介质中的计算机程序。本领域技术人员可以根据对上述方法的描述来实现所述计算机程序。当所述计算机程序在计算机中被执行时实现本发明的上述方法。

尽管已经参照其示例性实施例具体显示和描述了本发明,但是本领域的技术人员应该理解,在不脱离权利要求所限定的本发明的精神和范围的情况下,可以对其进行形式和细节上的各种改变。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1