一种涉污企业用电信息匹配及数据处理方法与流程

文档序号:20919105发布日期:2020-05-29 13:54阅读:247来源:国知局
一种涉污企业用电信息匹配及数据处理方法与流程

本发明涉及信息匹配及数据处理技术领域,具体涉及一种涉污企业用电信息匹配及数据处理方法。



背景技术:

目前,各地生态环境系统主要采取高排放企业在重污染天气下停产、限产或轮产等管控措施,降低排污企业的污染物排放量,保障空气质量。各地生态环境系统为确保相关企业落实减低排放措施,传统上一般抽选部分企业,并指派执法人员进行现场监督检查。这种方式管控效率低下,覆盖面窄,难以及时发现违规生产企业,影响空气质量及时改善。部分地区推进污染源工况在线监测,在企业的主要排污点装设终端监测设备,采集企业污染数据,实现企业污染物排放的监测和管理。也有部分地区采用在主要排污生产设备和治污设备的供电点加装电能计量装置,采集排污生产设备和治污设备的用电数据,实现企业生产情况的监测。但是,上述两种方式均需单独建立数据采集、数据传输和存储系统,同时需常态开展设备和系统的运行维护,监测成本较高,不宜大规模推广应用至一般工业企业,以致当前绝大多数一般企业未安装在线监测设备,无法满足生态环境系统开展企业生产活动和排污情况实时监控的需求。



技术实现要素:

本发明提供一种涉污企业用电信息匹配及数据处理方法,解决了现有技术无法通过企业用电数据实现污染防治管控过程中的生产情况和减排措施响应情况在线监测的问题。

本发明通过下述技术方案实现:

一种涉污企业用电信息匹配及数据处理方法,包括以下步骤:

s1:采用企业信息与电网企业用电客户信息进行匹配并提取企业用户编号;

s2:根据企业用户编号,从电网企业用电信息采集系统中抽取企业用电数据;

s3:对抽取得到的企业用电数据进行预处理和脱敏处理;

s4:将经过步骤s3处理后的企业用电数据通过隔离装置,完成从电网企业内部网络到外部网络的安全传输;

本技术方案中,随着电网企业加快推进智能电表换装工作,电网企业的用电信息采集系统实现了用户用电信息的全采集覆盖;因此,通过企业用电量可以直接反应企业的生产情况以反映该企业的排污状况;由于生态环境系统中的企业信息与电网企业用电客户信息没有进行标准化格式录入,因此,要从电网企业用电信息采集系统中抽取企业用电数据,就需要采用生态环境系统中的企业信息与电网企业用电客户信息首先进行匹配,再信息匹配成功后,才能提取出企业用户编号,并根据企业用户编号从电网企业用电信息采集系统中抽取企业用电数据;当提取了企业用电数据后,需要对企业电数据进行预处理和脱敏处理,并将处理后的数据进行从电网企业内部网络到外部网络的安全传输,以帮助有关部门根据处理后的数据对涉污企业用电数据进行分析以达到环保在线监测的目的;通过本技术方案,能够利用电网企业广泛覆盖的涉污企业智能电表采集数据,通过信息匹配、数据处理和安全隔离传输,实现企业生产用电数据的在线监测。

作为本发明的进一步改进,步骤s1中,采用企业信息与电网企业用电客户信息进行匹配并提取企业用户编号包括基于jieba分词的涉污企业信息匹配并提取企业用户编号和基于税务信息的信息匹配并提取企业用户编号;其中,只有在基于jieba分词的涉污企业信息匹配并提取企业用户编号失败后,才使用基于税务信息的信息匹配并提取企业用户编号;

本技术方案中,jieba分词用于中文自然语言处理分词,对句子中的词汇根据语义进行划分;首先通过jieba分词,对涉污企业信息进行匹配并提取企业用户编号;当基于jieba分词的涉污企业信息匹配并提取企业用户编号失败后,才使用基于税务信息的信息匹配并提取企业用户编号;这样,就可以有多重方式来保证提取出企业用户编号,会后续提取企业用电数据提供依据。

进一步,所述基于jieba分词的涉污企业信息匹配并提取企业用户编号具体包括以下步骤:

s101:整理生态环境系统提供的涉及污染排放企业信息,包括企业名称、增值税税号、法人名称和联系电话;同时,抽取电力客户档案信息,包括电力用户名称、用户编号、联系人、联系电话、用电容量、电表倍率、电表电压等级和增值税税号,其中,电表倍率包括综合倍率和ct倍率;

s102:构建行政区划、行业属性、组织形式和后缀信息四个自定义字典,并为每个自定义字典中的词条定义词性;

s103:利用jieba分词,对企业名称和电力用户名称分别进行分词处理,并借助步骤s102构建的自定义字典,提取企业名称中的字号信息;

s104:采用匹配方法,对提取到的字号信息进行匹配,获取企业用电信息中的用户名称;

s105:利用用户名称,提取企业用户编号;

本技术方案中,由于生态环境系统中的企业信息与电网企业用电客户信息没有进行标准化格式录入,因此,需要整理出生态环境系统提供的涉及污染排放企业信息和电网企业用电客户信息中的电力客户档案信息,方便后续进行相关信息的匹配;由于企业名称和电力用户名称包括行政区划、字号信息、行业属性、组织形式和后缀信息五个部分,因此,需要构建行政区划、行业属性、组织形式和后缀信息四个自定义字典,并为每个自定义字典中的词条定义词性;这样,就可以利用jieba分词,对企业名称和电力用户名称分别进行分词处理,区分出行政区划、字号、行业属性、组织形式和后缀信息五个部分,并借助自定义字典,再次区分出行政区划、行业属性、组织形式和后缀信息四个分部,从而提取出企业名称和电力用户名称中仅剩下的字号信息;如果企业名称和电力用户名称中的字号信息相互匹配,就可以根据字号信息获取企业的用户名称,进而利用用户名称,提取企业用户编号。

进一步,所述基于税务信息的信息匹配并提取企业用户编号具体包括以下步骤:

s201:利用企业的增值税税号与电网中的增值税税号进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库;否则,进入步骤s202;

s202:利用涉污企业法人名称与电力客户的联系人进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库;否则,进入步骤s203;

s203:利用涉污企业联系电话与电力客户的联系电话进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库;

本技术方案中,当基于jieba分词的涉污企业信息匹配并提取企业用户编号失败后,可以根据步骤s101中,生态环境系统提供的涉及污染排放企业信息和电力客户档案信息进行匹配,其中,企业的增值税税号与电网中的增值税税号进行匹配,涉污企业法人名称与电力客户的联系人进行匹配,涉污企业联系电话与电力客户的联系电话进行匹配;这样,就可以通过这三种匹配方式,更有效的获取用户名称和用户编号。

进一步,步骤s2具体包括以下步骤:

s301:根据用户编号,查找企业的供电单位编号;

s302:利用用户编号和企业的供电单位编号,从用电信息采集系统统一接口平台抽取企业用电数据;其中,对具备高频采集的企业,抽取时段冻结电能示值、功率和电流数据;对不具备高频采集能力的企业,抽取日冻结电能示值数据。

进一步,步骤s3中,所述对抽取得到的企业用电数据进行预处理和脱敏处理具体包括以下步骤:

s401:对抽取的用电数据进行清洗;

s402:对电表的采集数据进行电量还原;

s403:如果用户有多个电表,则将各电表数据相加求和,计算用户总用电数据;否则,进入步骤s404;

s404:对企业用电数据进行标幺化处理;

进一步,步骤s401具体是指对冻结的异常电能示值数据进行预处理,将比上表底小、且未发生换表的下表底及其对应上表底数据置为空;对采集到的整点功率数据进行预处理,将超过用户额定容量或报装用电容量一定范围的整点功率进行置空处理,同时,将负的整点功率置为空值;其中,一定范围为用户额定容量或报装用电容量的1.5倍或2倍;

进一步,步骤s402,所述对电表的采集数据进行电量还原包括以下步骤:

s501:如果抽取企业用电数据中包括时段冻结电能示值,则利用相邻两个时刻点的电能示值数据做差,再乘以电表倍率,得到该电表在该时段的真实用电量数据:

(1)

其中,表示时段的真实用电量,表示电表的综合倍率,表示时段下表底,表示时段上表底;否则,进入步骤s502;

s502:如果抽取企业用电数据中包括功率或/和电流数据,则电表倍率乘以功率值或/和电流值,得到该电表在该时刻点的真实功率数据或/和电流数据:

(2)

其中,表示t时刻的真实功率或电流值,表示电表的综合倍率,对于功率计算,采用综合倍率,对于电流计算,采用ct倍率,表示时刻t电表测量的功率或电流值;否则,进入步骤s503;

s503:如果抽取企业用电数据中包括日冻结电能示值数据,则利用当天的上下表底做差,再乘以电表倍率,得到该电表在当日的真实用电量数据:

(3)

其中,表示第di天的真实用电量,表示电表的综合倍率,表示第di天的下表底,表示第di天的上表底。

本技术方案中,步骤s502中,由于功率数据和电流数据可以替换,因此,采用公式(2)就可以得到时刻t电表测量的功率或电流值;通过本技术方案中,可以保证无论涉污企业属于具备高频采集的企业或者不具备高频采集能力的企业,都能够计算出该企业的电表的采集数据,为后续步骤s403中计算用户总用电数据和步骤s404中对企业用电数据进行标幺化处理做好准备。

进一步,步骤s403具体包括以下步骤:

s601:如果各电表数据包括时段真实用电量数据,则将多个电表对应时段的真实用电量数据累加求和,得到用户该时段的总用电量;否则,进入步骤s602;

s602:如果各电表数据包括时刻真实功率数据,则将多个电表对应的时刻点的功率数据累加求和,得到用户该时刻点的总功率;如果用户电表数量大于1,而且各电表电压等级不同,各电表数据包括时刻电流数据,则舍弃该用户各电表的电流数据;否则,将多个电表对应的时刻点的电流数据累加求和,得到用户该时刻点的总电流;否则,进入步骤s603;

s603:如果各电表数据包括日真实用电量数据,则将多个电表对应的日真实电量数据累加求和,得到用户当日的总用电量。

进一步,步骤s404中,对企业用电数据进行标幺化处理包括以下步骤:

s701:对每个企业,获取标幺化处理基值;该基值包括历史最大用电量、额定容量和某个时点的功率、某个时点的电流中的任意一项;选定该基值后,各企业的基值数据保持不变;

s702:根据步骤s701中确定的基值,对采集的用户用电数据进行标幺化处理:

(4)

其中,e表示时段总用电量、整点总功率、整点总电流量或日总用电量;表示基底值;e表示对应电量或功率或电流的标幺值。

综上,本发明的有益效果为,通过采用企业信息与电网企业用电客户信息进行匹配,能够有效提取企业用户编号,并根据企业用户编号从电网企业用电信息采集系统中抽取企业用电数据,对企业电数据进行预处理和脱敏处理后,能够得到涉污企业用电数据的标幺值,并进行从电网企业内部网络到外部网络的安全传输,以帮助有关部门根据涉污企业用电数据的标幺值进行分析,达到环保在线监测的目的;该方法弥补了现有技术无法通过企业用电数据实现污染防治管控过程中的生产情况和减排措施响应情况在线监测的问题。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:

图1为本发明的方法流程图;

图2为本发明的企业信息匹配方法流程图;

图3为本发明的企业名称构成示意图;

图4为本发明的企业用电数据预处理和脱敏处理方法流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。

实施例1:

如图1所示,一种涉污企业用电信息匹配及数据处理方法,包括以下步骤:

s1:采用企业信息与电网企业用电客户信息进行匹配并提取企业用户编号;

s2:根据企业用户编号,从电网企业用电信息采集系统中抽取企业用电数据;

s3:对抽取得到的企业用电数据进行预处理和脱敏处理;

s4:将经过步骤s3处理后的企业用电数据通过隔离装置,完成从电网企业内部网络到外部网络的安全传输。

随着电网企业加快推进智能电表换装工作,电网企业的用电信息采集系统实现了用户用电信息的全采集覆盖;因此,通过企业用电量可以直接反应企业的生产情况以反映该企业的排污状况;由于生态环境系统中的企业信息与电网企业用电客户信息没有进行标准化格式录入,因此,要从电网企业用电信息采集系统中抽取企业用电数据,就需要采用生态环境系统中的企业信息与电网企业用电客户信息首先进行匹配,再信息匹配成功后,才能提取出企业用户编号,并根据企业用户编号从电网企业用电信息采集系统中抽取企业用电数据;当提取了企业用电数据后,需要对企业电数据进行预处理和脱敏处理,并将处理后的数据进行从电网企业内部网络到外部网络的安全传输,以帮助有关部门根据处理后的数据对涉污企业用电数据进行分析以达到环保在线监测的目的;通过本技术方案,能够利用电网企业广泛覆盖的涉污企业智能电表采集数据,通过信息匹配、数据处理和安全隔离传输,实现企业生产用电数据的在线监测。

如图2所示,步骤s1中,采用企业信息与电网企业用电客户信息进行匹配并提取企业用户编号包括基于jieba分词的涉污企业信息匹配并提取企业用户编号和基于税务信息的信息匹配并提取企业用户编号;其中,只有在基于jieba分词的涉污企业信息匹配并提取企业用户编号失败后,才使用基于税务信息的信息匹配并提取企业用户编号。

所述基于jieba分词的涉污企业信息匹配并提取企业用户编号具体包括以下步骤:

s101:整理生态环境系统提供的涉及污染排放企业信息,包括企业名称、增值税税号、法人名称和联系电话;同时,抽取电力客户档案信息,包括电力用户名称、用户编号、联系人、联系电话、用电容量、电表倍率、电表电压等级和增值税税号,其中,电表倍率包括综合倍率和ct倍率;

s102:构建行政区划、行业属性、组织形式和后缀信息四个自定义字典,并为每个自定义字典中的词条定义词性;

s103:利用jieba分词,对企业名称和电力用户名称分别进行分词处理,并借助步骤s102构建的自定义字典,提取企业名称中的字号信息;

s104:采用匹配方法,对提取到的字号信息进行匹配,获取企业用电信息中的用户名称;s105:利用用户名称,提取企业用户编号。

所述基于税务信息的信息匹配并提取企业用户编号具体包括以下步骤:

s201:利用企业的增值税税号与电网中的增值税税号进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库;否则,进入步骤s202;

s202:利用涉污企业法人名称与电力客户的联系人进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库;否则,进入步骤s203;

s203:利用涉污企业联系电话与电力客户的联系电话进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库。

jieba分词用于中文自然语言处理分词,对句子中的词汇根据语义进行划分;首先通过jieba分词,对涉污企业信息进行匹配并提取企业用户编号;当基于jieba分词的涉污企业信息匹配并提取企业用户编号失败后,才使用基于税务信息的信息匹配并提取企业用户编号;这样,就可以有多重方式来保证提取出企业用户编号,会后续提取企业用电数据提供依据。

由于生态环境系统中的企业信息与电网企业用电客户信息没有进行标准化格式录入,因此,需要整理出生态环境系统提供的涉及污染排放企业信息和电网企业用电客户信息中的电力客户档案信息,方便后续进行相关信息的匹配;由于企业名称和电力用户名称包括行政区划、字号信息、行业属性、组织形式和后缀信息五个部分,因此,需要构建行政区划、行业属性、组织形式和后缀信息四个自定义字典,并为每个自定义字典中的词条定义词性;这样,就可以利用jieba分词,对企业名称和电力用户名称分别进行分词处理,区分出行政区划、字号、行业属性、组织形式和后缀信息五个部分,并借助自定义字典,再次区分出行政区划、行业属性、组织形式和后缀信息四个分部,从而提取出企业名称和电力用户名称中仅剩下的字号信息;如果企业名称和电力用户名称中的字号信息相互匹配,就可以根据字号信息获取企业的用户名称,进而利用用户名称,提取企业用户编号。其中,如图3所示,当企业名称为“四川银律科技有限责任公司郫都分公司”的时候,“四川”为行政区划,“银律”为字号信息,“科技”为行业属性,“有限责任公司”为组织形式,“郫都分公司”为后缀信息;当使用jieba分词对“四川银律科技有限责任公司郫都分公司”进行处理时,首先区分出行政区划、字号、行业属性、组织形式和后缀信息五个部分,然后借助自定义字典,再次区分出行政区划、行业属性、组织形式和后缀信息四个分部,即“四川”、“科技”、“有限责任公司”和“郫都分公司”,最后,分词后剩下的“银律”,即为字号信息。

当基于jieba分词的涉污企业信息匹配并提取企业用户编号失败后,可以根据步骤s101中,生态环境系统提供的涉及污染排放企业信息和电力客户档案信息进行匹配,其中,企业的增值税税号与电网中的增值税税号进行匹配,涉污企业法人名称与电力客户的联系人进行匹配,涉污企业联系电话与电力客户的联系电话进行匹配;这样,就可以通过这三种匹配方式,更有效的获取用户名称和用户编号。

步骤s2具体包括以下步骤:

s301:根据用户编号,查找企业的供电单位编号;

s302:利用用户编号和企业的供电单位编号,从用电信息采集系统统一接口平台抽取企业用电数据;其中,对具备高频采集的企业,抽取时段冻结电能示值、功率和电流数据;对不具备高频采集能力的企业,抽取日冻结电能示值数据。

如图4所示,步骤s3中,所述对抽取得到的企业用电数据进行预处理和脱敏处理具体包括以下步骤:

s401:对抽取的用电数据进行清洗;

s402:对电表的采集数据进行电量还原;

s403:如果用户有多个电表,则将各电表数据相加求和,计算用户总用电数据;否则,进入步骤s404;

s404:对企业用电数据进行标幺化处理。

步骤s401具体是指对冻结的异常电能示值数据进行预处理,将比上表底小、且未发生换表的下表底及其对应上表底数据置为空;对采集到的整点功率数据进行预处理,将超过用户额定容量或报装用电容量一定范围的整点功率进行置空处理,同时,将负的整点功率置为空值;其中,一定范围为用户额定容量或报装用电容量的1.5倍或2倍。

步骤s402,所述对电表的采集数据进行电量还原包括以下步骤:

s501:如果抽取企业用电数据中包括时段冻结电能示值,则利用相邻两个时刻点的电能示值数据做差,再乘以电表倍率,得到该电表在该时段的真实用电量数据:

(1)

其中,表示时段的真实用电量,表示电表的综合倍率,表示时段下表底,表示时段上表底;否则,进入步骤s502;

s502:如果抽取企业用电数据中包括功率或/和电流数据,则电表倍率乘以功率值或/和电流值,得到该电表在该时刻点的真实功率数据或/和电流数据:

(2)

其中,表示t时刻的真实功率或电流值,表示电表的综合倍率,对于功率计算,采用综合倍率,对于电流计算,采用ct倍率,表示时刻t电表测量的功率或电流值;否则,进入步骤s503;

s503:如果抽取企业用电数据中包括日冻结电能示值数据,则利用当天的上下表底做差,再乘以电表倍率,得到该电表在当日的真实用电量数据:

(3)

其中,表示第di天的真实用电量,表示电表的综合倍率,表示第di天的下表底,表示第di天的上表底。

步骤s403具体包括以下步骤:

s601:如果各电表数据包括时段真实用电量数据,则将多个电表对应时段的真实用电量数据累加求和,得到用户该时段的总用电量;否则,进入步骤s602;

s602:如果各电表数据包括时刻真实功率数据,则将多个电表对应的时刻点的功率数据累加求和,得到用户该时刻点的总功率;如果用户电表数量大于1,而且各电表电压等级不同,各电表数据包括时刻电流数据,则舍弃该用户各电表的电流数据;否则,将多个电表对应的时刻点的电流数据累加求和,得到用户该时刻点的总电流;否则,进入步骤s603;

s603:如果各电表数据包括日真实用电量数据,则将多个电表对应的日真实电量数据累加求和,得到用户当日的总用电量。

步骤s404中,对企业用电数据进行标幺化处理包括以下步骤:

s701:对每个企业,获取标幺化处理基值;该基值包括历史最大用电量、额定容量和某个时点的功率、某个时点的电流中的任意一项;选定该基值后,各企业的基值数据保持不变;

s702:根据步骤s701中确定的基值,对采集的用户用电数据进行标幺化处理:

(4)

其中,e表示时段总用电量、整点总功率、整点总电流量或日总用电量;表示基底值;e表示对应电量或功率或电流的标幺值。

步骤s502中,由于功率数据和电流数据可以替换,因此,采用公式(2)就可以得到时刻t电表测量的功率或电流值;通过本技术方案中,可以保证无论涉污企业属于具备高频采集的企业或者不具备高频采集能力的企业,都能够计算出该企业的电表的采集数据,为后续步骤s403中计算用户总用电数据和步骤s404中对企业用电数据进行标幺化处理做好准备。本实施例中,e表示时段总用电量、整点总功率、整点总电流量或日总用电量中的任意一项;基底值将根据e的选取来决定,即当e为时段总用电量或者日总用电量,将为企业历史单位时段电量的最大值,当e为整点总功率时,将为额定容量或最大功率;每个企业的基底值确定后,将不再变。最后,当得到标幺值e后,将通过隔离装置,将企业的标幺值e进行从电网企业内部网络到外部网络的安全传输。

在现有技术中,主要通过在企业的主要排污点装设终端监测设备,采集企业污染数据,实现企业污染物排放的监测和管理或者采用在主要排污生产设备和治污设备的供电点加装电能计量装置,采集排污生产设备和治污设备的用电数据,实现企业生产情况的监测,监测成本,不宜大规模推广应用至一般工业企业,无法满足生态环境系统开展企业生产活动和排污情况实时监控的需求。而本发明通过利用已有的电网企业的用电信息采集系统,采用企业信息与电网企业用电客户信息进行匹配,能够有效提取企业用户编号,并根据企业用户编号从电网企业用电信息采集系统中抽取企业用电数据,对企业电数据进行预处理和脱敏处理后,能够得到涉污企业用电数据的标幺值,并进行从电网企业内部网络到外部网络的安全传输,以帮助有关部门根据涉污企业用电数据的标幺值进行分析,达到环保在线监测的目的;弥补了现有技术无法通过企业用电数据实现污染防治管控过程中的生产情况和减排措施响应情况在线监测的问题。

以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1