本发明涉及电力数据用于环保指令管控领域的分析方法技术领域,尤其涉及基于90%用电分布特征指标的环保管控监测及评价方法。
背景技术:
近年来,随着国家电网泛在电力物联网的建设,电网呈现信息化、数字化、智能化特征,大量电网数据为国网公司开拓电网数字经济的蓝海提供了有利的平台和坚实的基础。目前,大部分研究主要集中在泛在电力物联网与智能电网之间的融合交互,旨在利用信息化手段为传统电网赋能,提升电网的运行效率和客户服务质量,然而,对于电网数据在其他行业的应用尚处于初步探索阶段,相关的问题分析方法仍有待进一步研究。
将用户用电数据用于环保管控监测,为有关政府部门提供管控效果反馈信息和决策支持是对“枢纽型”、“平台型”、“共享型”电网的积极探索。一方面,有效的促进电网数据的经济效益挖掘,有利于国家电网公司战略转型策略的实施;另一方面,可有效提升环保监测的效率和准确性,实现跨专业、跨行业的数据共享、技术支撑和互利共赢。然而,由于不同的企业生产情况和用能情况各不相同,同一企业在不同季节、不同时间段在产量、工艺等方面也有较大差异,以往通过日电量数据反映用户生产水平和环保管控措施响应情况的方法难以适应“蓝天保卫战”的实际需求。
技术实现要素:
本发明所要解决的技术问题是现有的环保管控监测方法不能精准地实现生产企业对环保部门管控指令响应情况的研判和异常生产企业的把控,难以满足实际需求。本发明提供了解决上述问题的基于90%用电分布特征指标的环保管控监测及评价方法,本发明从用户的多维度历史用电数据入手,基于90%用电分布特征指标挖掘用户的用电特征和环保指令响应特征,为环保部门实现管控措施响应信息远程监控和异常生产企业精准控制提供技术手段。
本发明通过下述技术方案实现:
基于90%用电分布特征指标的环保管控监测及评价方法,该方法包括以下步骤:
步骤1:获取待监测企业历史用电曲线,并对历史用电曲线进行数据清洗和对历史用电数据的管控情况进行标记;
步骤2:根据步骤1标记结果对待监测企业的非环保管控时段用户用电曲线进行聚类,挖掘90%典型生产带和企业典型模式生产能力曲线,并计算生产模式指标,结合各个生产模式指标提取不同的生产模式;
步骤3:根据步骤2提取的不同生产模式,建立不同的管控指令,结合管控指令计算管控曲线;
步骤4:结合管控曲线,读取实时用电曲线,进行企业环保响应监控及评价。
基于现有的环保管控监测方法不能精准地实现生产企业对环保部门管控指令响应情况的研判和异常生产企业的把控,难以满足实际需求。因此本发明充分利用企业历史用电曲线,考虑研究扩展时间维度电量信息用于生产企业环保管控执行情况的监测及精准辨识方法,充分挖掘用户用电信息与环保管控之间的关联关系,实现异常生产企业的精确查找;本发明基于90%用电分布特征指标的环保管控监测及评价方法,提出基于90%用电分布带的典型生产能力曲线获取方法,构造了生产模式指标用以表征企业生产状态和模式,并通过建立基于不同生产模式的环保管控曲线以及环保管控响应评价指标,通过电网企业为用电企业建立基于90%典型生产带和企业典型模式生产能力曲线来计算生产模式指标,结合各个生产模式指标提取不同的生产模式,从而结合管控指令计算用电企业对应的管控曲线;这样便建立了用电企业、电网企业和环保局之间的对应关系,为环保局对各个用电企业提供相对应环保管控措施的监控,在此基础上,实现企业环保管控响应实时研判,为环保监查提供了技术手段。
进一步地,所述步骤1包括以下子步骤:
步骤11:从电网公司用电采集系统获取待监测企业用户历史用电曲线,用户历史用电曲线为用户一天多个时间点的电量数据或功率数据,采集周期根据实际需求确定,一般可取15min,1h,2h等。
步骤12:对步骤11中采集到的数据进行数据清洗,其中数据清洗包括异常数据剔除和缺失数据补齐;其中,异常数据剔除主要是对明显不符合实际情况的数据,例如用电量激增、功率数据为负等情况。针对采样数据中存在数据缺失的情况,可以利用相邻多日相同时刻点数据的均值、插值等算法对缺失数据进行补齐;当一个样本中缺失数据超过三分之一时,应将该样本予以去除。
步骤13:对步骤12中清洗后的数据进行历史数据标记初步标记和管控标记:初步标记包括工作日与非工作日,工作日标记为0,非工作日标记为1;管控标记按照环保部门的要求包括无管控、红色管控、橙色管控和黄色管控四类,分别对应标记为0、1、2和3;
步骤14:进行工作日标记和非工作日标记的有效性判定:对工作日数据和非工作日数据的相关性进行分析,判断该企业工作日和非工作日的用电情况是否呈现较大差异,若差异较大,对非工作日和工作日分别进行处理;若差异较小,则不区分工作日和非工作日。
进一步地,步骤s12中的所述缺失数据补齐方法采用相邻多日相同时刻点数据的均值算法或者插值算法对缺失数据进行补齐;
其中,采用均值算法对缺失数据进行补齐时,若第n个样本i时刻数据缺失,则缺失时刻的数据由缺失样本前后一段时长的数据补齐,计算结果为:
式中,
进一步地,所述步骤2包括以下子步骤:
步骤21:基于最大层间距离的聚类方法对待监测企业的非环保管控时段用户用电曲线进行聚类;
若采用基于划分的聚类方法(如k-means、fuzzyk-means等),根据企业性质和用电情况确定分类数目需要人为选定,然而,企业数量众多人为选定工作量大,且人工选定的分类数目可能存在主观性,难以实现最优聚类。因此,本发明首先根据历史样本建立聚类树,根据聚类树的最大纵向距离(最大层间距离)选定分类数目,并以该分类数目为基础采用聚类算法对数据进行划分。
步骤22:根据步骤21的聚类结果,针对不同类生产模式,通过离群点检测方法,去除离群点的数量不高于10%,从而获得包含90%的样本数据的最小范围;从而挖掘出不同时间点的范围值构成90%典型生产带;
步骤23:挖掘企业典型模式生产能力曲线:根据步骤21的聚类结果,按照不同类来生成典型曲线带;典型生产模式的生产能力曲线公式:
式中:i的取值范围为1~k;c的取值范围为1~分类数;
步骤24:基于典型生产能力曲线计算生产模式指标,结合各个生产模式指标提取不同的生产模式;其中,生产模式指标包括曲线均衡度、曲线平稳度和日生产量。
曲线均衡度
式中,
曲线平稳度
式中,
实际中,可以通过循环改变窗长时间t来计算平稳度指标,并根据指标的变化情况判定生产模式的最佳匹配模型。
日生产量,用totc来表征第c类生产模式日生产能力,公式如下:
式中,
提取生产模式包括但不限于高产模式、中产模式和低产模式,应结合曲线平稳度、曲线均衡度和日常量共同确定。具体而言包括:
高产模式和低产模式应分别通过日生产能力查找不同聚类结果的典型生产能力曲线获取。首先从所有生产能力曲线中选取日生产量最高的一类生产能力曲线和日生产量最低的一类生产能力曲线。然后判定所选择的生产能力曲线的平稳程度;对于曲线均衡度小于2、
进一步地,所述步骤22的具体步骤包括:
步骤221:针对每一个时刻的不同用户用电曲线样本计算待挖掘样本不同时刻的标准差;
步骤222:对不同时刻用户用电曲线样本标准差进行排序;
步骤223:对于标准差最大的时刻,采用离群点检测方法淘汰1%的用户用电曲线样本,重新计算样本标准差;
步骤224:用户用电曲线样本数量低于90%且新的用户用电曲线样本均值或者原用户用电曲线样本均值的距离小于最大值的2%,则结束计算;否则返回步骤222。
进一步地,所述步骤3包括如下子步骤:
步骤31:针对步骤2提出的不同生产模式,建立不同的管控指令;
管控规则的制定原则:
管控时段的生产用电曲线不得超过管控前企业所属典型模式的生产能力曲线。数值高于典型模式生产能力曲线的时刻判定为未响应时刻。
应根据管控前企业所属典型模式的生产能力曲线,确定不同的生产能力响应模型,实时监测曲线数值高于管控曲线的时刻判定为未响应时刻。不同的生产能力曲线不同生产模式所对应的管控深度应该有所差异。
具体而言,针对第c类曲线模式建立如下管控曲线的函数表达式为:
式中,
管控系数
其中,
步骤32:进行管控指令响应情况评估指标确定。
开展企业排污管控措施响研判,重点在于判定在当前条件下,企业生产情况是否满足管控指令要求,提供企业是否执行环保管控指令的判断依据。从环保部门的角度看,在执行管控期间,希望各生产企业积极响应,一方面,企业是否响应管控指令的判定需要考察生产状况与管控曲线之间的关系;另一方面,除了与生产无关的基础负荷外,管控期间的用电水平不应该超过管控前的用电水平。
综合上述两个方面,实际管控曲线应该由公式(6)确定的管控曲线和管控前的生产曲线共同确定。具体评估指标包括累积电量响应指标和实时电量响应指标。
(1)累积电量响应指标:若管控前为非基础负荷模式,管控期间非基础负荷的日电量应不高于管控前的日电量,且低于管控曲线日电量,计算公式与公式(7)相同。基于此,提出累积电量响应指标:
所述累积电量响应指标
式中:
(2)实时电量响应指标
根据上述分析可知,若某时刻管控期间生产电量低于管控曲线电量,则企业响应指令的概率为1;若某时刻管控期间生产电量高于低一级管控指令的曲线电量,则该企业响应管控的概率为0。低一级管控指令是指根据环保部门提供的环保指令中,按照污染严重程度由低到高排序,红色管控曲线的低一级管控指令为橙色管控曲线,橙色管控曲线的低一级管控指令为黄色管控曲线,黄色管控曲线的低一级管控指令为管控前所述生产能力曲线。当实际用电曲线介于管控曲线和低一级管控曲线之间时,企业响应管控的概率呈现一定的分布,可以是用线性分布或指数分布等,记为
假设当前管控程度β的标号为n,提出实时电量响应指标,所述实时电量响应指标的计算公式为:
式中:t为时间,
进一步地,所述步骤4包括以下子步骤:
步骤41:确定待监测企业管控前一段时长的生产模式;比如,提取管控前五天的数据,生成与管控日样本所对应的典型模式生产能力曲线(当生产模式与工作日相关时,应考虑生产模式与工作日之间的关系);
步骤42:结合典型模式生产能力曲线和环保部门给定的管控指令,进一步计算管控曲线(包括低一级指令的管控曲线);
步骤43:读取实时用电曲线,结合管控曲线进行,计算指令响应情况评估指标,并结合评估指标判断企业环保响应情况,并给出判定结果。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明基于90%用电分布特征指标的环保管控监测及评价方法,提出基于90%用电分布带的典型生产能力曲线获取方法,构造了生产模式指标用以表征企业生产状态和模式,并通过建立基于不同生产模式的环保管控曲线以及环保管控响应评价指标,在此基础上,实现企业环保管控响应实时研判,为环保监查提供了技术手段。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明方法流程图。
图2为本发明实施例步骤211中建立的聚类树。
图3为本发明实施例步骤21中样本聚类结果。
图4为本发明实施例中的90%数据用户曲线分布提取结果及生产能力曲线结果。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例
如图1至图4所示,本发明基于90%用电分布特征指标的环保管控监测及评价方法,该方法包括以下步骤:
步骤1:获取待监测企业历史用电曲线,并对历史用电曲线进行数据清洗和对历史用电数据的管控情况进行标记;
步骤2:根据步骤1标记结果对待监测企业的非环保管控时段用户用电曲线进行聚类,挖掘90%典型生产带和企业典型模式生产能力曲线,并计算生产模式指标,结合各个生产模式指标提取不同的生产模式;
步骤3:根据步骤2提取的不同生产模式,建立不同的管控指令,结合管控指令计算管控曲线,进行基于环保管控曲线的指令响应情况的评估;
步骤4:结合管控曲线,读取实时用电曲线,进行企业环保响应监控及评价。
具体实施时,详细实施步骤如下:
所述步骤1包括以下子步骤:
步骤11:从电网公司用电采集系统获取待监测企业用户历史用电曲线,用户历史用电曲线为用户一天多个时间点的电量数据或功率数据;本实施例中采用采样周期为1h用户历史用电曲线,采用用户一天24个点的功率数据进行分析。
步骤12:对步骤11中采集到的数据进行数据清洗,其中数据清洗包括异常数据剔除和缺失数据补齐;其中,异常数据剔除主要是对明显不符合实际情况的数据,本实施例中,对于用电量超过抄表容量的数据按照抄表容量予以替换。
针对采样数据中存在数据缺失的情况,可以利用相邻多日相同时刻点数据的均值、插值等算法对缺失数据进行补齐;当一个样本中缺失数据超过三分之一时,应将该样本予以去除。在本实施李忠,采用均值算法对缺失数据进行补齐。
步骤13:对步骤12中清洗后的数据进行历史数据标记初步标记和管控标记:初步标记包括工作日与非工作日,工作日标记为0,非工作日标记为1;管控标记按照环保部门的要求包括无管控、红色管控、橙色管控和黄色管控四类,分别对应标记为0、1、2和3;
步骤14:进行工作日标记和非工作日标记的有效性判定:对工作日数据和非工作日数据的相关性进行分析,判断该企业工作日和非工作日的用电情况是否呈现较大差异,若差异较大,对非工作日和工作日分别进行处理;若差异较小,则不区分工作日和非工作日。
所述步骤2包括以下子步骤:
步骤21:基于最大层间距离的聚类方法对待监测企业的非环保管控时段用户用电曲线进行聚类;
步骤211:本实施例中首先根据历史样本建立聚类树,如附图2所示。
步骤212:计算聚类树的最大纵向距离(最大层间距离),本实施例中为43048。
步骤213:根据聚类树的最大纵向距离(最大层间距离)选择聚类数目,本实施例中为2。
步骤214:以聚类数目2进行聚类分析,本实施例中聚类分析结果如图3所示。
步骤22:根据步骤21的聚类结果,针对不同类生产模式,通过离群点检测方法,去除离群点的数量不高于10%,从而获得包含90%的样本数据的最小范围;从而挖掘出不同时间点的范围值构成90%典型生产带;
所述步骤22的具体步骤包括:
步骤221:针对每一个时刻的不同用户用电曲线样本计算待挖掘样本不同时刻的标准差;
步骤222:对不同时刻用户用电曲线样本标准差进行排序;
步骤223:对于标准差最大的时刻,采用离群点检测方法淘汰1%的用户用电曲线样本,重新计算样本标准差;
步骤224:用户用电曲线样本数量低于90%且新的用户用电曲线样本均值或者原用户用电曲线样本均值的距离小于最大值的2%,则结束计算;否则返回步骤222。
步骤23:挖掘企业典型模式生产能力曲线:根据步骤21的聚类结果,按照不同类来生成典型曲线带;本实施例中生产能力曲线结果如图4所示,图4为90%数据用户曲线分布提取结果及生产能力曲线结果。典型生产模式的生产能力曲线公式如下:
式中:i的取值范围为1~k;c的取值范围为1~分类数;
步骤24:基于典型生产能力曲线计算生产模式指标,结合各个生产模式指标提取不同的生产模式;其中,生产模式指标包括曲线均衡度
提取生产模式包括但不限于高产模式、中产模式和低产模式,应结合曲线平稳度、曲线均衡度和日生产量共同确定。
本实施例中根据计算结果,
所述步骤3包括以下子步骤:
步骤31:根据管控规则的制定原则,针对步骤2提出的不同生产模式,建立不同的管控指令。
具体而言,针对第c类曲线模式建立如下管控曲线的函数表达式为:
式中,
管控系数
其中,
步骤32:进行管控指令响应情况评估指标确定。
所述步骤4包括以下子步骤:
步骤41:确定待监测企业管控前五天的生产模式;提取管控前五天的数据,生成与管控日样本所对应的典型模式生产能力曲线,所属的曲线为由于本实施例中生产模式与工作日与否不相关,因此无需考虑生产模式与工作日之间的关系。本实施例中管控前五天的数据所属类型为类型1高产模式。
步骤42:结合典型模式生产能力曲线和环保部门给定的管控指令,进一步计算管控曲线(包括低一级指令的管控曲线);
步骤43:读取实时用电曲线,结合管控曲线进行,计算指令响应情况评估指标,并结合评估指标判断企业环保响应情况,并给出判定结果。计算指令响应情况评估指标如下:
开展企业排污管控措施响研判,重点在于判定在当前条件下,企业生产情况是否满足管控指令要求,提供企业是否执行环保管控指令的判断依据。从环保部门的角度看,在执行管控期间,希望各生产企业积极响应,一方面,企业是否响应管控指令的判定需要考察生产状况与管控曲线之间的关系;另一方面,除了与生产无关的基础负荷外,管控期间的用电水平不应该超过管控前的用电水平。
综合上述两个方面,实际管控曲线应该由公式(6)确定的管控曲线和管控前的生产曲线共同确定。具体评估指标包括累积电量响应指标和实时电量响应指标。
(1)累积电量响应指标:若管控前为非基础负荷模式,管控期间非基础负荷的日电量应不高于管控前的日电量,且低于管控曲线日电量,计算公式与公式(7)相同。基于此,提出累积电量响应指标:
所述累积电量响应指标
式中:
(2)实时电量响应指标
根据上述分析可知,若某时刻管控期间生产电量低于管控曲线电量,则企业响应指令的概率为1;若某时刻管控期间生产电量高于低一级管控指令的曲线电量,则该企业响应管控的概率为0。低一级管控指令是指根据环保部门提供的环保指令中,按照污染严重程度由低到高排序,红色管控曲线的低一级管控指令为橙色管控曲线,橙色管控曲线的低一级管控指令为黄色管控曲线,黄色管控曲线的低一级管控指令为管控前所述生产能力曲线。当实际用电曲线介于管控曲线和低一级管控曲线之间时,企业响应管控的概率呈现一定的分布,可以是用线性分布或指数分布等,记为
假设当前管控程度β的标号为n,提出实时电量响应指标,所述实时电量响应指标的计算公式为:
式中:t为时间,
结合评估指标判断企业环保响应情况,t时刻该企业响应管控的概率为
由此,根据本发明方法最终计算出的
工作原理是:基于现有的环保管控监测方法不能精准地实现生产企业对环保部门管控指令响应情况的研判和异常生产企业的把控,难以满足实际需求。因此本发明考虑研究扩展时间维度电量信息用于生产企业环保管控执行情况的监测及精准辨识方法,充分挖掘用户用电信息与环保管控之间的关联关系,实现异常生产企业的精确查找;本发明基于90%用电分布特征指标的环保管控监测及评价方法,提出基于90%用电分布带的典型生产能力曲线获取方法,构造了生产模式指标用以表征企业生产状态和模式,以用户90%用电曲线分布为基础挖掘企业的生产能力曲线,并通过均衡度、平稳度、日常量三个指标对生产模式进行分析;通过电网企业为用电企业建立基于90%典型生产带和企业典型模式生产能力曲线来计算生产模式指标,结合各个生产模式指标提取不同的生产模式,从而结合管控指令计算用电企业对应的管控曲线;这样便建立了用电企业、电网企业和环保局之间的对应关系,为环保局对各个用电企业提供相对应环保管控措施的监控;在此基础上,提出了管控曲线的计算方法和管控指令响应情况的评估指标,从累积电量和实时电量两个方面对企业环保响应情况进行分析,为环保监查提供依据。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。