本公开涉及环境监测,具体地,涉及一种企业排污实时监管方法、装置、存储介质及电子设备。
背景技术:
1、随着工业化发展进程的深入,环境污染问题日益凸显。工业排放是环境污染最大来源,对工业企业的污染排放进行实时全面监管,遏止偷排、漏排、超标排放等行为是有效减少环境污染的重要途经。然而目前对工业企业的污染排放的监管,通常存在监管企业数量多、分布广,监管效率低、覆盖面有限等问题。
技术实现思路
1、本公开的目的是提供一种企业排污实时监管方法、装置、存储介质及电子设备。
2、为了实现上述目的,本公开第一方面提供一种企业排污实时监管方法,所述方法包括:
3、获取监管区域内多个监管企业中每个监管企业的企业监管数据,所述企业监管数据,用于描述指定历史时间段内企业的生产、排污、治污以及排污检查的状况信息;
4、根据所述监管区域内每个监管企业的所述企业监管数据确定所述监管区域的基准企业特征数据,所述基准企业特征数据用于补全监管企业的企业特征数据;
5、根据所述基准企业特征数据确定每个所述监管企业的目标企业特征数据;
6、根据每个所述监管企业的所述目标企业特征数据确定所述监管区域内多个监管企业中的监管问题企业。
7、可选地,所述根据所述监管区域内每个监管企业的所述企业监管数据确定所述监管区域的基准企业特征数据,包括:
8、对每个所述监管企业的所述企业监管数据进行校验处理,以得到校验之后的待用监管数据;
9、从每个所述监管企业的所述待用监管数据中提取多个预设字段的企业数据,以得到每个监管企业的企业特征数据;
10、根据所述监管区域内多个监管企业中每个监管企业的所述企业特征数据确定所述基准企业特征数据。
11、可选地,所述根据所述监管区域内多个监管企业中每个监管企业的所述企业特征数据确定所述基准企业特征数据,包括:
12、确定每个所述企业特征数据对应的字段类型数量;
13、确定所述监管区域内多个监管企业中所述字段类型数量最多的目标监管企业;
14、将所述目标监管企业的所述企业特征数据作为所述基准企业特征数据。
15、可选地,所述对每个所述监管企业的所述企业监管数据进行校验处理,以得到校验之后的待用监管数据,包括:
16、对所述企业监管数据进行格式统一化处理,以得到所述企业监管数据对应的待校验数据;
17、确定所述待校验数据中的数值型数据和非数值型数据;
18、根据所述数值型数据和所述非数值型数据确定校验之后的待用监管数据。
19、可选地,所述根据所述数值型数据和所述非数值型数据确定校验之后的待用监管数据,包括:
20、对所述数值型数据进行上下限值校验,以得到中间校验数据;在确定所述中间校验数据中存在一个字段有多个来源的不同数值的情况下,确定所述不同数值的均值,将所述均值作为校验后的目标数值型数据;
21、针对所述非数值型数据,在确定一个事项包括多个来源的多种描述数据的情况下,展示所述多种描述数据,并接收用户指定的目标描述信息,将所述目标描述信息作为校验后的目标非数值型数据,以得到包括所述目标数值型数据和所述目标非数值型数据的待用监管数据。
22、可选地,所述根据所述基准企业特征数据确定每个所述监管企业的目标企业特征数据,包括:
23、在确定所述监管企业的所述企业特征数据中每个所述预设字段对应的企业数据均不为空的情况下,确定所述企业特征数据为无需补全的企业特征数据;
24、在确定所述多个预设字段对应的企业数据中存在空值的情况下,确定所述企业特征数据为待补全的企业特征数据;
25、根据所述基准企业特征数据补全所述待补全的企业特征数据,以得到所述目标企业特征数据。
26、可选地,所述根据所述基准企业特征数据补全所述待补全的企业特征数据,以得到所述目标企业特征数据,包括:
27、根据所述待补全的企业特征数据中的已有企业数据和所述基准企业特征数据确定待补全企业与所述基准企业特征数据对应企业的相似度;
28、根据所述相似度确定所述待补全的企业特征数据中的目标补全数据;
29、将所述已有企业数据和所述目标补全数据作为所述目标企业特征数据。
30、可选地,所述根据所述相似度确定所述待补全的企业特征数据中的目标补全数据,包括:
31、从预设关系数据中确定所述相似度对应的目标补全数据,所述预设关系数据包括多个预设相似度与不同补全数据的对应关系。
32、可选地,所述根据所述基准企业特征数据补全所述待补全的企业特征数据,以得到所述目标企业特征数据,包括:
33、将所述待补全的企业特征数据与所述基准企业特征数据输入第一预设机器学习模型,以获取所述第一预设机器学习模型输出的所述目标企业特征数据。
34、可选地,所述第一预设机器学习模型的训练方法包括:
35、获取第一训练数据,所述第一训练数据中包括多组样本数据,每组样本数据中包括基准样本数据和待补全样本数据,以及补全样本数据,
36、以所述补全样本数据为样本标注数据,对第一预设初始模型进行模型训练,以得到所述第一预设机器学习模型。
37、可选地,所述根据每个所述监管企业的所述目标企业特征数据确定所述监管区域内多个监管企业中的监管问题企业,包括:
38、将每个监管企业的所述目标企业特征数据输入第二预设机器学习模型,以获取所述第二预设机器学习模型输出的企业类型,所述企业类型包括重点排污问题企业,重点治污问题企业,中性企业和正面企业;
39、将所述监管区域内所述多个监管企业中企业类型为重点排污问题企业和/或重点治污问题企业的监管企业作为所述监管问题企业。
40、可选地,所述第二预设机器学习模型的训练方法包括:
41、获取第二训练数据,所述第二训练数据中包括多个企业的企业特征样本数据以及企业类型标注数据,
42、通过所述第二训练数据,对第二预设初始模型进行模型训练,以得到所述第二预设机器学习模型。
43、本公开的第二方面提供一种企业排污实时监管装置,所述装置包括:
44、获取模块,被配置为获取监管区域内多个监管企业中每个监管企业的企业监管数据,所述企业监管数据,用于描述指定历史时间段内企业的生产、排污、治污以及排污检查的状况信息;
45、第一确定模块,被配置为根据所述监管区域内每个监管企业的所述企业监管数据确定所述监管区域的基准企业特征数据,所述基准企业特征数据用于补全监管企业的企业特征数据;
46、第二确定模块,被配置为根据所述基准企业特征数据确定每个所述监管企业的目标企业特征数据;
47、第三确定模块,被配置为根据每个所述监管企业的所述目标企业特征数据确定所述监管区域内多个监管企业中的监管问题企业。
48、可选地,所述第一确定模块,被配置为:
49、对每个所述监管企业的所述企业监管数据进行校验处理,以得到校验之后的待用监管数据;
50、从每个所述监管企业的所述待用监管数据中提取多个预设字段的企业数据,以得到每个监管企业的企业特征数据;
51、根据所述监管区域内多个监管企业中每个监管企业的所述企业特征数据确定所述基准企业特征数据。
52、可选地,所述第一确定模块,被配置为:
53、确定每个所述企业特征数据对应的字段类型数量;
54、确定所述监管区域内多个监管企业中所述字段类型数量最多的目标监管企业;
55、将所述目标监管企业的所述企业特征数据作为所述基准企业特征数据。
56、可选地,所述第一确定模块,被配置为:
57、对所述企业监管数据进行格式统一化处理,以得到所述企业监管数据对应的待校验数据;
58、确定所述待校验数据中的数值型数据和非数值型数据;
59、根据所述数值型数据和所述非数值型数据确定校验之后的待用监管数据。
60、可选地,所述第一确定模块,被配置为:
61、对所述数值型数据进行上下限值校验,以得到中间校验数据;在确定所述中间校验数据中存在一个字段有多个来源的不同数值的情况下,确定所述不同数值的均值,将所述均值作为校验后的目标数值型数据;
62、针对所述非数值型数据,在确定一个事项包括多个来源的多种描述数据的情况下,展示所述多种描述数据,并接收用户指定的目标描述信息,将所述目标描述信息作为校验后的目标非数值型数据,以得到包括所述目标数值型数据和所述目标非数值型数据的待用监管数据。
63、可选地,所述第二确定模块,被配置为:
64、在确定所述监管企业的所述企业特征数据中每个所述预设字段对应的企业数据均不为空的情况下,确定所述企业特征数据为无需补全的企业特征数据;
65、在确定所述多个预设字段对应的企业数据中存在空值的情况下,确定所述企业特征数据为待补全的企业特征数据;
66、根据所述基准企业特征数据补全所述待补全的企业特征数据,以得到所述目标企业特征数据。
67、可选地,所述第二确定模块,被配置为:
68、根据所述待补全的企业特征数据中的已有企业数据和所述基准企业特征数据确定待补全企业与所述基准企业特征数据对应企业的相似度;
69、根据所述相似度确定所述待补全的企业特征数据中的目标补全数据;
70、将所述已有企业数据和所述目标补全数据作为所述目标企业特征数据。
71、可选地,所述第二确定模块,被配置为:
72、从预设关系数据中确定所述相似度对应的目标补全数据,所述预设关系数据包括多个预设相似度与不同补全数据的对应关系。
73、可选地,所述第二确定模块,被配置为:
74、将所述待补全的企业特征数据与所述基准企业特征数据输入第一预设机器学习模型,以获取所述第一预设机器学习模型输出的所述目标企业特征数据。
75、可选地,所述装置还包括第一训练模块,所述第一训练模块被配置为:
76、获取第一训练数据,所述第一训练数据中包括多组样本数据,每组样本数据中包括基准样本数据和待补全样本数据,以及补全样本数据,
77、以所述补全样本数据为样本标注数据,对第一预设初始模型进行模型训练,以得到所述第一预设机器学习模型。
78、可选地,所述第三确定模块,被配置为:
79、将每个监管企业的所述目标企业特征数据输入第二预设机器学习模型,以获取所述第二预设机器学习模型输出的企业类型,所述企业类型包括重点排污问题企业,重点治污问题企业,中性企业和正面企业;
80、将所述监管区域内所述多个监管企业中企业类型为重点排污问题企业和/或重点治污问题企业的监管企业作为所述监管问题企业。
81、可选地,所述装置还包括第二训练模块,被配置为:
82、获取第二训练数据,所述第二训练数据中包括多个企业的企业特征样本数据以及企业类型标注数据;
83、通过所述第二训练数据,对第二预设初始模型进行模型训练,以得到所述第二预设机器学习模型。
84、本公开的第三方面提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以上第一方面所述方法的步骤。
85、本公开的第四方面提供一种电子设备,包括:
86、存储器,其上存储有计算机程序;
87、处理器,用于执行所述存储器中的所述计算机程序,以实现以上第一方面所述方法的步骤。
88、上述技术方案,能够根据所述监管区域内每个监管企业的所述企业监管数据确定所述监管区域的基准企业特征数据,所述基准企业特征数据用于补全监管企业的企业特征数据;根据所述基准企业特征数据确定每个所述监管企业的目标企业特征数据;根据每个所述监管企业的所述目标企业特征数据确定所述监管区域内多个监管企业中的监管问题企业,由于能够根据所述基准企业特征数据确定每个所述监管企业的目标企业特征数据,因此能够有效扩大污染排放远程监管企业的覆盖范围,并且由于能够根据每个所述监管企业的所述目标企业特征数据确定所述监管区域内多个监管企业中的监管问题企业,因此能够有效提升企业污染排放监管的自动化程度,降低企业污染排放监管所需的人力物力,提升监管效率。
89、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。