一种典型场景的电能质量数据清洗方法及系统与流程

文档序号:23709794发布日期:2021-01-23 16:42阅读:86来源:国知局
一种典型场景的电能质量数据清洗方法及系统与流程

[0001]
本发明涉及数据挖掘技术领域,特别是涉及一种典型场景的电能质量数据清洗方法及系统。


背景技术:

[0002]
在提高新能源消纳能力,克服其出力波动性和随机性的发展中,以分布式微网、超高压输电等电网新技术发展迅猛,这些新技术也改变了电网形态,较为明显特征为是电网电力电子化,但是也带来了诸多新的问题,例如:大量的电力电子器件引发如高超谐振等问题,因此现在电网电能质量分析尤为重要。
[0003]
而经过数十年的发展,国内电网公司都已构建专业的电能质量系统,主要由分布于变电站站、重要用户等电能质量终端及部署于电网公司的电能质量分析软件构成,终端用于采集监测对象数据,而分析软件完成数据采集、数据存储、数据分析及数据展示等功能。
[0004]
目前,大数据技术的快速发展为电能质量数据挖掘和应用提供了新的方向,但因终端性能、通讯质量等因素导致现有电能质量系统中存在大量异常数据,因此需要对数据进行清洗,提高数据质量,保证后续挖掘及分析的可靠性,因此对数据清洗显得尤为重要,而现有的数据清洗技术无法根据具体场景进行数据清洗,其数据清洗的效率低。


技术实现要素:

[0005]
本发明的目的在于,提出一种典型场景的电能质量数据清洗方法及系统,解决现有方法无法根据具体场景进行数据清洗,其数据清洗的效率低的技术问题。
[0006]
本发明的一方面,提供一种典型场景的电能质量数据清洗方法,包括以下步骤:
[0007]
步骤s1,获取用电线路的历史电流数据,根据所述历史电流数据判断所述用电线路所处的典型场景类型;
[0008]
步骤s2,根据典型场景类型获取相应的电压波动率平均值,根据所述电压波动率平均值计算边界调整参数;
[0009]
步骤s3,获取所述用电线路的电能质量数据,根据预设规则将所述电能质量数据转换为箱形图展示数据集;并根据所述箱形图展示数据集和所述边界调整参数计算所述电能质量数据的正常值上界限和正常值下界限;
[0010]
步骤s4,根据所述电能质量数据的正常值上界限和正常值下界限对电能数据进行数据清洗。
[0011]
优选的,所述步骤s1包括:获取用电线路的历史电流数据,并将所述历史电流数据按照月份进行划分,生成自然月电流数据;
[0012]
获取预的设典型场景类型数据,根据所述典型场景类型数据和所述自然月电流数据进行典型场景聚类计算,确定所述用电线路对应的设典型场景类型。
[0013]
优选的,根据以下公式计算判断各数据所属的典型聚类场c
k

[0014][0015]
其中,x=(x1,..xi..,xn)为任意的自然月电流数据;u=(u1,..ui,..,un)为典型场景距离中心数据;
[0016]
选择任意的自然月电流数据x到多个典型场景中距离中心最小的典型场景类型,作为用电线路对应的典型场景类型。
[0017]
优选的,所述步骤s2包括:获取与典型场景类型相对应的电压波动率平均值;
[0018]
根据以下公式计算边界调整参数:
[0019]
α=(1+β)
[0020]
其中,α为边界调整参数;β为电压波动率平均值。
[0021]
优选的,所述步骤s3包括:获取所述箱形图展示数据集的最大值、最小值、中位数值、上四分位数值及下四分位数值;
[0022]
根据以下公式计算所述电能质量数据的正常值上界限f
1
和正常值下界限f
2

[0023]
f
1
=q
l-aq
r
[0024]
f
2
=q
l
+αq
r
[0025]
其中,q
l
为下四分位数,表示数据集中四分之一的数值小于它;q
u
为上四分位数,表示数据集中四分之一的数值大于它;q
r
为四分位间距,是上四分位数qu与下四分位数q
l
之差;α为边界调整参数。
[0026]
优选的,所述步骤s4包括:根据电能质量数据的正常值上界限f
1
和正常值下界限f
2
对电能质量数据进行筛选,将超过正常值上界限f
1
和正常值下界限f
2
的数据判定为异常数据,并对所述异常数据进行数据清洗。
[0027]
本发明还提供一种典型场景的电能质量数据清洗系统,用以实现所述的典型场景的电能质量数据清洗方法,包括:
[0028]
典型场景类型模块,用以获取用电线路的历史电流数据,根据所述历史电流数据判断所述用电线路所处的典型场景类型;
[0029]
数据计算模块,用以根据典型场景类型获取相应的电压波动率平均值,根据所述电压波动率平均值计算边界调整参数;以及获取所述用电线路的电能质量数据,根据预设规则将所述电能质量数据转换为箱形图展示数据集;并根据所述箱形图展示数据集和所述边界调整参数计算所述电能质量数据的正常值上界限和正常值下界限;
[0030]
数据清洗模块,用以根据所述电能质量数据的正常值上界限和正常值下界限对电能数据进行数据清洗。
[0031]
优选的,所述典型场景类型模块获取用电线路的历史电流数据,并将所述历史电流数据按照月份进行划分,生成自然月电流数据;获取预的设典型场景类型数据,根据所述典型场景类型数据和所述自然月电流数据根据以下公式计算判断各数据所属的典型聚类场c
k

[0032][0033]
其中,x=(x1,..xi..,xn)为任意的自然月电流数据;u=(u1,..ui,..,un)为典型场景距离中心数据;
[0034]
选择任意的自然月电流数据x到多个典型场景中距离中心最小的典型场景类型,
作为用电线路对应的典型场景类型。
[0035]
优选的,所述数据计算模块获取与典型场景类型相对应的电压波动率平均值;根据以下公式计算边界调整参数:
[0036]
α=(1+β)
[0037]
其中,α为边界调整参数;β为电压波动率平均值;
[0038]
获取所述箱形图展示数据集的最大值、最小值、中位数值、上四分位数值及下四分位数值;
[0039]
根据以下公式计算所述电能质量数据的正常值上界限f
1
和正常值下界限f
2

[0040]
f
1
=q
l-aq
r
[0041]
f
2
=q
l
+αq
r
[0042]
其中,q
l
为下四分位数,表示数据集中四分之一的数值小于它;q
u
为上四分位数,表示数据集中四分之一的数值大于它;q
r
为四分位间距,是上四分位数qu与下四分位数q
l
之差;α为边界调整参数。
[0043]
优选的,所述数据清洗模块根据电能质量数据的正常值上界限f
1
和正常值下界限f
2
对电能质量数据进行筛选,将超过正常值上界限f
1
和正常值下界限f
2
的数据判定为异常数据,并对所述异常数据进行数据清洗。
[0044]
综上,实施本发明的实施例,具有如下的有益效果:
[0045]
本发明提供的典型场景的电能质量数据清洗方法及系统,先根据电流数据在预设的各个典型聚类场景中确定目标聚类场景,再根据目标聚类场景的电压波动率完成数据清洗,从而实现了根据不同场景进行针对性清洗,提高了数据清洗的清洗效率。
附图说明
[0046]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
[0047]
图1为本发明实施例中一种典型场景的电能质量数据清洗方法的主流程示意图。
[0048]
图2为本发明实施例中一种典型场景的电能质量数据清洗系统的结构示意图。
具体实施方式
[0049]
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
[0050]
如图1所示,为本发明提供的一种典型场景的电能质量数据清洗方法的一个实施例的示意图。在该实施例中,所述方法包括以下步骤:
[0051]
步骤s1,获取用电线路的历史电流数据,根据所述历史电流数据判断所述用电线路所处的典型场景类型;可以理解的,线路电流变化与季节、节假日、天气等相关,可以根据电流变化选择典型聚类场景。
[0052]
具体的实施例中,获取用电线路的历史电流数据,并将所述历史电流数据按照月份进行划分,生成自然月电流数据;获取预的设典型场景类型数据,根据所述典型场景类型
数据和所述自然月电流数据进行典型场景聚类计算,确定所述用电线路对应的设典型场景类型。可以理解的,本实施例中选择6个典型场景作为聚类标准,每个典型场景的选择可以采用一个自然月的基波电流数据判断。
[0053]
具体的,根据以下公式计算判断各数据所属的典型聚类场ck:
[0054][0055]
其中,x=(x1,..xi..,xn)为任意的自然月电流数据;u=(u1,..ui,..,un)为典型场景距离中心数据;可以理解的,对于任意的自然月电流数据为x=(x1,..xi..,xn),而典型距离中心数据u=(u1,..ui,..,un),利用公式判断各数据所属的典型聚类场景ck=(c1,c2..cl..c6);
[0056]
选择任意的自然月电流数据x到6个典型场景中距离中心最小的典型场景类型,作为用电线路对应的典型场景类型。
[0057]
步骤s2,根据典型场景类型获取相应的电压波动率平均值,根据所述电压波动率平均值计算边界调整参数;可以理解的,通常的α=1.15,但需考虑运行场景即根据聚类场景调整α;而电压波动越大,需要设置的上下界越大,反之越小。
[0058]
具体实施例中,获取与典型场景类型相对应的电压波动率平均值;根据以下公式计算边界调整参数:
[0059]
α=(1+β)
[0060]
其中,α为边界调整参数;β为电压波动率平均值,该值可从现有电能质量系统的获得。
[0061]
步骤s3,获取所述用电线路的电能质量数据,根据预设规则将所述电能质量数据转换为箱形图展示数据集;并根据所述箱形图展示数据集和所述边界调整参数计算所述电能质量数据的正常值上界限和正常值下界限。
[0062]
具体实施例中,获取所述箱形图展示数据集的最大值、最小值、中位数值、上四分位数值及下四分位数值;根据以下公式计算所述电能质量数据的正常值上界限f
1
和正常值下界限f
2

[0063]
f
1
=q
l-aq
r
[0064]
f
2
=q
l
+αq
r
[0065]
其中,q
l
为下四分位数,表示数据集中四分之一的数值小于它;q
u
为上四分位数,表示数据集中四分之一的数值大于它;q
r
为四分位间距,是上四分位数qu与下四分位数q
l
之差,其间包含了数据集的一半;α为边界调整参数。
[0066]
步骤s4,根据所述电能质量数据的正常值上界限和正常值下界限对电能数据进行数据清洗。具体的,根据电能质量数据的正常值上界限f
1
和正常值下界限f
2
对电能质量数据进行筛选,将超过正常值上界限f
1
和正常值下界限f
2
的数据判定为异常数据,并对所述异常数据进行数据清洗。
[0067]
如图2所示,本发明的实施例还提供一种典型场景的电能质量数据清洗系统,用以实现所述的典型场景的电能质量数据清洗方法,包括:
[0068]
典型场景类型模块,用以获取用电线路的历史电流数据,根据所述历史电流数据判断所述用电线路所处的典型场景类型;具体的实施例中,所述典型场景类型模块获取用
电线路的历史电流数据,并将所述历史电流数据按照月份进行划分,生成自然月电流数据;获取预的设典型场景类型数据,根据所述典型场景类型数据和所述自然月电流数据根据以下公式计算判断各数据所属的典型聚类场c
k

[0069][0070]
其中,x=(x1,..xi..,xn)为任意的自然月电流数据;u=(u1,..ui,..,un)为典型场景距离中心数据;
[0071]
选择任意的自然月电流数据x到多个典型场景中距离中心最小的典型场景类型,作为用电线路对应的典型场景类型。
[0072]
数据计算模块,用以根据典型场景类型获取相应的电压波动率平均值,根据所述电压波动率平均值计算边界调整参数;以及获取所述用电线路的电能质量数据,根据预设规则将所述电能质量数据转换为箱形图展示数据集;并根据所述箱形图展示数据集和所述边界调整参数计算所述电能质量数据的正常值上界限和正常值下界限;
[0073]
具体实施例中,所述数据计算模块获取与典型场景类型相对应的电压波动率平均值;
[0074]
根据以下公式计算边界调整参数:
[0075]
α=(1+β)
[0076]
其中,α为边界调整参数;β为电压波动率平均值;
[0077]
获取所述箱形图展示数据集的最大值、最小值、中位数值、上四分位数值及下四分位数值;
[0078]
根据以下公式计算所述电能质量数据的正常值上界限f
1
和正常值下界限f
2

[0079]
f
1
=q
l-aq
r
[0080]
f
2
=q
l
+αq
r
[0081]
其中,q
l
为下四分位数,表示数据集中四分之一的数值小于它;q
u
为上四分位数,表示数据集中四分之一的数值大于它;q
r
为四分位间距,是上四分位数qu与下四分位数q
l
之差;α为边界调整参数。
[0082]
数据清洗模块,用以根据所述电能质量数据的正常值上界限和正常值下界限对电能数据进行数据清洗。
[0083]
具体实施例中,所述数据清洗模块根据电能质量数据的正常值上界限f
1
和正常值下界限f
2
对电能质量数据进行筛选,将超过正常值上界限f
1
和正常值下界限f
2
的数据判定为异常数据,并对所述异常数据进行数据清洗。
[0084]
综上,实施本发明的实施例,具有如下的有益效果:
[0085]
本发明提供的典型场景的电能质量数据清洗方法及系统,先根据电流数据在预设的各个典型聚类场景中确定目标聚类场景,再根据目标聚类场景的电压波动率完成数据清洗,从而实现了根据不同场景进行针对性清洗,提高了数据清洗的清洗效率。
[0086]
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1