一种固定源数据治理方法及系统与流程

文档序号:33051097发布日期:2023-01-24 23:20阅读:40来源:国知局
一种固定源数据治理方法及系统与流程

1.本发明涉及污染源治理技术领域,具体涉及一种固定源数据治理方法及系统。


背景技术:

2.固定源也叫固定污染源,是指向环境排放或释放有害物质或对环境产生有害影响的各类行业企业、场所、生产设施、固定设备等,简称固定源。
3.随着数字化改革的飞速发展,环保行业对数据的要求也越来越高,单一的业务数据已经无法满足环保业务的发展,需要把各个环境业务的数据都整合起来,进行环境业务的应用创新。因此在环保业务中,固定源作为其中最重要的主数据,需要被很好的管理起来。但是目前,各个业务部门都是自建的业务系统,且固定源也是采用独立的系统,无法将固定源和业务进行统一管理,使得业务和固定源之间的信息很难共享,导致固定源的数据没有可靠的、具有可信度的数据来源,进而使得对于固定源的治理难度增大,治理效率低下。


技术实现要素:

4.本发明实施例提供的一种固定源数据治理方法及系统,解决了现有技术中对固定源的治理难度大、效率低的问题。
5.根据第一方面,一种实施例中提供一种固定源数据治理方法,包括;
6.获取多个污染源数据,所述污染源数据至少包括企业名称或统一社会信用代码;
7.分别从所述多个污染源数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到多个污染源基本信息;所述污染源基本信息至少包括企业名称或统一社会信用代码,还包括:法人、法人联系电话、企业地址以及一个或多个业务项目中的至少一种;
8.对所述多个污染源基本信息进行分类,并将同类污染源基本信息进行合并,得到主污染源基本信息;
9.获取业务项目数据,所述业务项目数据至少包括业务项目,所述业务项目用于表征对污染源进行监管的项目类型;
10.从所述业务项目数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到业务项目基本信息,所述业务项目基本信息至少包括业务项目,还包括:企业名称、统一社会信用代码、法人、法人联系电话和企业地址中的至少一种;
11.将所述主污染源基本信息与所述业务项目基本信息进行关联度计算,并将关联度超过预设值的所述主污染源基本信息与所述业务项目基本信息进行关联。
12.作为一种可能实现的方式,所述分别从所述多个污染源数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到多个污染源基本信息,包括:
13.分别从所述多个污染源数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目对应的多种字段信息;
14.分别将从污染源数据中提取的多种字段信息映射至预设的污染源基本信息标识中,得到多个污染源基本信息;其中,污染源基本信息标识至少包括企业名称标识或统一社会信用代码标识,还包括:法人标识、法人联系电话标识、企业地址标识以及一个或多个业务项目标识中的至少一种。
15.作为一种可能实现的方式,所述对所述多个污染源基本信息进行分类,包括:
16.根据多维度对比算法对所述多个污染源基本信息进行分类。
17.作为一种可能实现的方式,所述污染源基本信息的企业名称包括企业名称对应的字段信息,所述污染源基本信息的统一社会信用代码包括统一社会信用代码对应的字段信息,所述污染源基本信息的法人包括法人对应的字段信息,所述污染源基本信息的法人联系电话包括法人联系电话对应的字段信息,所述污染源基本信息的企业地址包括企业地址对应的字段信息,所述污染源基本信息的业务项目包括业务项目对应的字段信息;所述将同类污染源基本信息进行合并,得到主污染源基本信息,包括:
18.选取同类的所述多个污染源基本信息中包含的字段信息种类最多的污染源基本信息作为主污染源基本信息;
19.确定所述主污染源基本信息中缺失的字段信息,从其余的同类污染源基本信息中获取所述缺失的字段信息并补充至所述主污染源基本信息中。
20.作为一种可能实现的方式,所述将同类污染源基本信息进行合并,得到主污染源基本信息之后,还包括:
21.基于用户的编辑操作,对所述主污染源基本信息中的字段信息进行编辑,所述编辑包括补充新的字段信息、修改原字段信息和删除原字段信息中的至少一种;和/或,
22.若其余的同类污染源基本信息的字段信息完整程度更高,则用所述完整程度更高的字段信息替换所述主污染源基本信息中对应的字段信息。
23.作为一种可能实现的方式,所述若其余的同类污染源基本信息的字段信息完整程度更高,则用所述完整程度更高的字段信息替换所述主污染源基本信息中对应的字段信息,包括:
24.显示同类的所述多个污染源基本信息的合并界面,所述合并界面显示有所述主污染源基本信息的标识和对应的字段信息、其余污染源基本信息的标识和对应的字段信息;
25.接收用于选择标识的指令,响应于所述指令,用选择的所述其余污染源基本信息的标识所对应字段信息替换所述主污染源基本信息中对应标识的字段信息。
26.作为一种可能实现的方式,所述从所述业务项目数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到业务项目基本信息,包括:
27.从所述业务项目数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目对应的多种字段信息;
28.将从所述业务项目数据中提取的多种字段信息映射至预设的业务项目基本信息标识中,得到业务项目基本信息;其中,业务项目基本信息标识至少包括业务项目,还包括:企业名称、统一社会信用代码、法人、法人联系电话和企业地址中的至少一种。
29.作为一种可能实现的方式,所述将所述主污染源基本信息与所述业务项目基本信息进行关联度计算,并将关联度超过预设值的所述主污染源基本信息与所述业务项目基本信息进行关联之后,还包括:
30.显示未关联的业务项目基本信息;
31.接收新增污染源基本信息的指令,响应于所述指令,增加与所述未关联的业务项目基本信息相对应的污染源基本信息。
32.作为一种可能实现的方式,所述将关联度超过预设值的所述主污染源基本信息与所述业务项目基本信息进行关联后,还包括:
33.将与所述业务项目基本信息进行关联后的主污染源基本信息进行存储,并用于对所述关联后的主污染源基本信息进行监管。
34.根据第二方面,一种实施例中提供一种固定源数据治理系统,包括:
35.第一获取模块,用于获取多个污染源数据,所述污染源数据至少包括企业名称或统一社会信用代码;
36.第一信息提取模块,用于分别从所述多个污染源数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到多个污染源基本信息;所述污染源基本信息至少包括企业名称或统一社会信用代码,还包括:法人、法人联系电话、企业地址以及一个或多个业务项目中的至少一种;
37.合并模块,用于对所述多个污染源基本信息进行分类,并将同类污染源基本信息进行合并,得到主污染源基本信息;
38.第二获取模块,用于获取业务项目数据,所述业务项目数据至少包括业务项目,所述业务项目用于表征对污染源进行监管的项目类型;
39.第二信息提取模块,用于从所述业务项目数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到业务项目基本信息,所述业务项目基本信息至少包括业务项目,还包括:企业名称、统一社会信用代码、法人、法人联系电话和企业地址中的至少一种;
40.关联模块,用于将所述污染源基本信息与所述业务项目基本信息进行关联度计算,并将关联度超过预设值的所述主污染源基本信息与所述业务项目基本信息进行关联。
41.本技术实施例提供的一种固定源数据治理方法及系统,首先对污染源数据进行获取,并提取污染源数据的基本信息,然后对污染源基本信息进行分类,并将同类污染源基本信息合并,得到主污染源基本信息;同时,对业务项目数据进行获取,并提取业务项目数据的基本信息,得到业务项目基本信息,最后将主污染源基本信息与业务项目基本信息进行关联,以便于对污染源进行查询时,能够直接找到其数据来源,并能够针对其相关联的业务项目对污染源进行具有针对性的治理,从而减小其治理难度,降低治理成本,并提高治理效率。
附图说明
42.图1为本实施例提供的固定源数据治理方法流程图;
43.图2为本实施例提供的得到污染源基本信息的流程图;
44.图3为本实施例提供的污染源基本信息界面效果图;
45.图4为本实施例提供的污染源基本信息详情界面效果图;
46.图5为本实施例提供的得到主污染源基本信息的流程图;
47.图6为本实施例提供的主污染源基本信息界面效果图;
48.图7为本实施例提供的对主污染源基本信息补全的流程图一;
49.图8为本实施例提供的对主污染源基本信息补全的流程图二;
50.图9为本实施例提供的对主污染源基本信息补全的界面效果图;
51.图10为本实施例提供的得到业务项目基本信息的流程图;
52.图11为本实施例提供的业务项目基本信息的界面效果图;
53.图12为本实施例提供的增加与未关联的业务项目基本信息相对应的污染源基本信息的流程图;
54.图13为本实施例提供的一种主污染源信息进行配置的界面效果图;
55.图14为本实施例提供的另一种主污染源基本信息进行配置的界面效果图;
56.图15为本实施例提供的污染源基本信息列表的操作日志界面效果图;
57.图16为本实施例提供的污染源基本信息的操作日志界面效果图;
58.图17为本实施例提供的固定源数据治理系统的结构框图。
59.附图标记:100、第一获取模块;200、第一信息提取模块;300、合并模块;400、第二获取模块;500、第二信息提取模块;600、关联模块。
具体实施方式
60.下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本技术能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本技术相关的一些操作并没有在说明书中显示或者描述,这是为了避免本技术的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
61.另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
62.本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本技术所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
63.目前,对于固定源的治理方案主要有:数据转换映射、通过应用系统承担主数据管理功能、或者引入独立的主数据管理平台。上述三种方案的实施成本都比较高,且无法根据固定源的特点提供个性化的、具有针对性的治理功能。因此,根据固定源的特点,本方案设计了一种固定源数据治理方法以及治理系统,使固定源与业务数据进行关联,以便于能够有针对性的对固定源进行治理。
64.具体结合附图对固定源与业务数据关联以实现对固定源治理的方法进行详细介
绍。
65.根据第一方面,请参考图1,一种实施例中提供一种固定源数据治理方法,包括;
66.步骤1:获取多个污染源数据,污染源数据至少包括企业名称或统一社会信用代码。
67.污染源数据治理系统也即固定源数据治理系统可以从第二次全国污染源普查数据中获取多个污染源数据,具体获取的污染源数据包括企业名称、统一社会信用代码、法人、法人联系电话、企业地址、业务项目、污染源地址、污染源名称、污染源编号、排污许可证编号、营业执照注册号等,其中,获取的污染源数据中至少要包括企业名称或统一社会信用代码,以便于后续对污染源进行分类。
68.步骤2:分别从多个污染源数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到多个污染源基本信息;污染源基本信息至少包括企业名称或统一社会信用代码,还包括:法人、法人联系电话、企业地址以及一个或多个业务项目中的至少一种。
69.在获取的多个污染源数据中,污染源数据治理系统分别提取每个污染源数据中的企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目等信息中的多种信息,得到多个污染源基本信息。其中,通过对每个污染源数据提取后得到的污染源基本信息主要包括企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目等多种信息。
70.步骤3:对多个污染源基本信息进行分类,并将同类污染源基本信息进行合并,得到主污染源基本信息。
71.污染源数据治理系统通过采用多维度对比算法,将多个污染源基本信息进行对比分类,并将对比分类后的结果以如图3所示的信息卡片的形式进行展示,每个信息卡片上显示有该污染源数据对应的污染源基本信息,清洗人员能够很直观的看到每个污染源数据所对应的污染源基本信息,并判断出哪些属于同一类污染源基本信息,然后通过系统的合并功能将同类污染源基本信息合并至一个污染源基本信息上,得到主污染源基本信息。
72.另外,当无法通过上述提取的信息对污染源基本信息进行分类时,则清洗人员点开信息卡片上的详情按钮,污染源数据治理系统收到触发详情按钮的命令后,显示详情页面,其中,如图4所示,详情页面用于显示污染源地址、污染源名称、污染源编号、排污许可证编号、营业执照注册号等信息。此外,当出现重复的污染源基本信息时,可以通过企查查或其他企业查询的现有网站对污染源的名称、统一社会信用代码进行查询,进而判断出其是否重合或者判断出哪一个是最新的污染源对应的污染源基本信息。
73.步骤4:获取业务项目数据,业务项目数据至少包括业务项目,业务项目用于表征对污染源进行监管的项目类型。
74.同时,污染源数据治理系统会从政府或者企业的业务系统中获取业务项目数据。污染源数据一般是从第二次全国污染源普查数据中获取,由此可知,获取污染源数据与业务项目数据的系统是属于两个完全不相同且不相关联的两个系统,因此目前在针对污染源进行治理的过程中,需要分别将两种数据进行查找,然后一一进行匹配,不仅费时费力,准确度还低。而本实施例是分别获取污染源数据和业务项目数据后,将两者进行关联,以方便对污染源进行更好的管理。
75.在本实施例中,通过污染源数据治理系统从业务系统中获取业务项目数据,其中,业务项目数据至少包括有业务项目,业务项目用于表征对各类污染源进行监管的项目类型,例如,建设项目信息、环境信访信息、固定废物、行政处罚信息、排污许可证信息、污染源在线数据、voc污染源等都属于业务项目。
76.步骤5:从业务项目数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到业务项目基本信息,业务项目基本信息至少包括业务项目,还包括:企业名称、统一社会信用代码、法人、法人联系电话和企业地址中的至少一种。
77.本实施例中业务项目基本信息的提取方式同上述污染源基本信息的提取方式相似,具体的,污染源数据治理系统提取每个业务项目数据中的企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目等信息中的多种信息,得到业务项目基本信息。其中,通过对每个业务项目数据提取后得到的业务项目基本信息中主要包括业务项目、企业名称、统一社会信用代码、法人、法人联系电话和企业地址等多种信息。
78.步骤6:将主污染源基本信息与业务项目基本信息进行关联度计算,并将关联度超过预设值的主污染源基本信息与业务项目基本信息进行关联。
79.系统会通过多维度对比算法,将合并后的主污染源基本信息与业务项目基本信息进行关联度计算,然后将关联度结果进行展示,如将关联度结果显示在显示界面的主污染源基本信息卡片上。具体的,清洗人员可以通过选择业务项目数据,然后查看主污染源基本信息卡片上的关联度,也即图6中信息卡片上显示的综合相似度,当综合相似度超过预设值时,可以通过清洗人员输入关联的指令将主污染源基本信息与业务项目基本信息进行关联,也可以通过系统直接判断当综合相似度超过预设值时,直接将主污染源基本信息与业务项目基本信息进行关联。
80.如图6所示,与业务项目基本信息关联后的主污染源基本信息在业务数据关联界面进行显示,且业务数据关联界面上还设置有输入框,该输入框用于供清洗人员对关键信息进行搜索,搜索出的与业务项目基本信息关联后的主污染源基本信息以卡片信息的形式在显示界面上进行显示。通过在上述界面上的操作,以便于清洗人员可以将与目标业务项目数据可能关联的污染源基本信息查询出来,并能够针对其相关联的业务项目对污染源进行具有针对性的治理,从而减小其治理难度,降低治理成本,并提高治理效率。
81.作为一种可以实现的方式,请参考图2,第一信息提取模块分别从多个污染源数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到多个污染源基本信息,包括:
82.步骤21:分别从多个污染源数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目对应的多种字段信息。
83.步骤22:分别将从污染源数据中提取的多种字段信息映射至预设的污染源基本信息标识中,得到多个污染源基本信息;其中,污染源基本信息标识至少包括企业名称标识或统一社会信用代码标识,还包括:法人标识、法人联系电话标识、企业地址标识以及一个或多个业务项目标识中的至少一种。在实际应用当中,本实施例的污染源基本信息标识中,企业名称标识、统一社会信用代码标识、法人标识、法人联系电话标识、企业地址标识以及多个业务项目标识等都会显示在污染源配置页面中。
84.本实施例中,对于污染源基本信息的提取,具体的,如图13、图14所示,进入污染源配置页面,第一信息提取模块分别从多个污染源数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目等信息中所需的对应字段信息,并将每个污染源数据对应字段信息以中间表或源表的模式映射至系统中预设的污染源基本信息标识中,使每个标识对应相应的字段信息,最终分别得到多个污染源基本信息。相应地,系统中预设的污染源基本信息标识至少需要包括企业名称标识或统一社会信用代码标识,为保证信息的完整度,还包括有法人标识、法人联系电话标识、企业地址标识以及一个或多个业务项目标识等;也可以是包括法人标识、法人联系电话标识、企业地址标识以及一个或多个业务项目标识等中的至少一种。
85.其中,中间表或源表根据业务系统的业务项目数据结构进行选择,中间表的模式会把关联关系写入到对应的中间表中,再通过中间表映射至系统中预设的污染源基本信息标识中;源表模式则是把关联关系直接写入到源表中,即将字段信息直接映射至系统中预设的污染源基本信息标识中。需要注意的是,在中间表或源表中,需要配置污染源基本信息的项目,并且该项目的名字固定为“污染源基本信息”,以保证中间表或源表中污染源数据信息所对应字段在匹配时能够准确地映射至的系统中预设的污染源基本信息标识中。对于中间表,参考图14,采用数据标签sql对污染源数据或业务项目数据进行编辑,具体的,编写一个sql语句,用于把当前污染源的业务项目数据进行查询,通过union all来连接多个业务项目数据,使用#{wrybh}来作为污染源的查询条件占位符。
86.其中,本实施例中需说明,污染源基本信息和业务项目基本信息中,企业名称、统一社会信用代码、法人、法人联系电话和企业地址、业务项目等的标识相同,在将污染源基本信息和业务项目基本信息进行关联时,具体是将标识所对应的字段信息进行匹配或者关联度的计算。
87.作为一种可以实现的方式,对多个污染源基本信息进行分类,包括:根据多维度对比算法对多个污染源基本信息进行分类。本实施例中所采用的多维度对比算法为现有技术,本实施例对此不做过多要求,只要能够实现对多个污染源基本信息进行分类即可。
88.作为一种可以实现的方式,请参考图5,污染源基本信息的企业名称包括企业名称对应的字段信息,污染源基本信息的统一社会信用代码包括统一社会信用代码对应的字段信息,污染源基本信息的法人包括法人对应的字段信息,污染源基本信息的法人联系电话包括法人联系电话对应的字段信息,污染源基本信息的企业地址包括企业地址对应的字段信息,污染源基本信息的业务项目包括业务项目对应的字段信息;通过合并模块将同类污染源基本信息进行合并,得到主污染源基本信息,包括:
89.步骤31:选取同类的多个污染源基本信息中包含的字段信息种类最多的污染源基本信息作为主污染源基本信息。
90.步骤32:确定主污染源基本信息中缺失的字段信息,从其余的同类污染源基本信息中获取缺失的字段信息并补充至主污染源基本信息中。
91.本实施例中,更具体的,合并模块在对同类污染源基本信息进行合并时,同类污染源中,每个污染源基本信息会分别对应其相应的字段信息,具体结合图3,以其中一个污染源基本信息为例,例如,企业名称(也即图中的公司名称)标识用于标识企业名称,可以是中文字段、英文字段或缩写、图片等,图3中的企业名称标识是“企业名称”字段,该标识跟随的“xxx公司”就是该企业名称对应的字段信息。以此类推,统一社会信用代码标识用于标识统一社会信用代码,法人标识用于标识法人的名称,法人联系电话标识用于标识法人的联系电话,企业地址标识用于标识污染源对应企业的地址,业务项目标识用于标识业务项目。系统通过选取同类的多个污染源基本信息中以上多个标识分别所对应的字段信息种类最多的污染源基本信息作为主污染源基本信息,例如图3所示的污染源合并界面所显示的同类污染源基本信息卡片中,选取企业名称、统一社会信用代码、法人、法人联系电话、企业地址、业务项目中对应填写的字段信息中填写种类最多的一个污染源基本信息卡片作为主污染源基本信息,然后确定出主污染源基本信息中缺失的字段信息种类,将其他污染源基本信息卡片中对应该字段信息种类的字段信息补充至主污染源基本信息中,使得主污染源基本信息更加完善。
92.作为一种可能实现的方式,请参考图7,将同类污染源基本信息进行合并,得到主污染源基本信息之后,还包括:
93.步骤7:基于用户的编辑操作,对主污染源基本信息中的字段信息进行编辑,编辑包括补充新的字段信息、修改原字段信息和删除原字段信息中的至少一种。和/或,
94.步骤8:若其余的同类污染源基本信息的字段信息完整程度更高,则用完整程度更高的字段信息替换主污染源基本信息中对应的字段信息。
95.本实施例中,在将同类污染源基本信息进行合并,得到主污染源基本信息之后,主污染源基本信息中的各项字段信息中还会存在字段信息不全面或者字段信息不完整的情况,此时,还需要对每项信息中对应的字段信息进行补全。具体的,对主污染源基本信息中每项信息对应的字段信息进行补全可以通过两种方式实现,一种是通过清洗人员对主污染源基本信息进行观察,当发现其他污染源基本信息中某一项字段信息更加完善,点击主污染源基本信息的补全按钮,参考其他污染源基本信息对主污染源基本信息中的字段信息进行编辑,具体编辑的信息包括补充新的字段信息、修改原字段信息、删除原字段信息。另一种是通过清洗人员对主污染源基本信息进行观察,结合图8所示,当发现其他污染源基本信息中某一项字段信息的完整程度更高,则清洗人员点击该其他污染源基本信息的补全按钮(如图8中c所示的即为补全按钮),系统在接收到点击操作后,将该完整程度更高的字段信息直接替换至主污染源基本信息中对应的字段信息中,实现信息自动补全。例如,图8所示的数据补全对话框中包括主污染源基本信息列和其他污染源基本信息列,且主污染源基本信息列和其他污染源基本信息列对应设置,主污染源基本信息侧的“企业名称a”标识下方填写有对应的字段信息,其他污染源基本信息侧的“企业名称”标识下方也填写有对应的字段信息b,但是其他污染源基本信息侧的“企业名称”标识下方的字段信息更完整,此时点击补全按钮c,其他污染源基本信息侧的字段信息会自动将主污染源基本信息侧的字段信息b进行替换,以将主污染源基本信息的各标识所对应的字段信息补充地更完整。
96.作为一种可能实现的方式,请参考图9,若其余的同类污染源基本信息的字段信息完整程度更高,则用完整程度更高的字段信息替换主污染源基本信息中对应的字段信息,包括:
97.步骤81:显示同类的多个污染源基本信息的合并界面,合并界面显示有主污染源基本信息的标识和对应的字段信息、其余污染源基本信息的标识和对应的字段信息。
98.步骤82:接收用于选择标识的指令,响应于指令,用选择的其余污染源基本信息的
标识所对应字段信息替换主污染源基本信息中对应标识的字段信息。
99.本实施例中,通过采用完整程度更高的字段信息替换主污染源基本信息中对应的字段信息时,具体的,通过将主污染源基本信息和同类的其他多个污染源基本信息显示在一个界面上,其中,界面上显示有主污染源基本信息的标识和对应的字段信息、其余污染源基本信息的标识和对应的字段信息,然后,清洗人员通过点击操作完整程度更高的污染源基本信息的某一标识,系统接收到点击操作指令后,该标识对应的完整的字段信息直接替换了主污染源基本信息的该标识对应的字段信息,完成对主污染源基本信息的补全,以便于后续将主污染源基本信息与业务项目基本信息更准确的匹配。
100.作为一种可能实现的方式,请参考图10,第二获取模块从业务项目数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到业务项目基本信息,包括:
101.步骤51:从业务项目数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目对应的多种字段信息。
102.步骤52:将从业务项目数据中提取的多种字段信息映射至预设的业务项目基本信息标识中,得到业务项目基本信息;其中,业务项目基本信息标识至少包括业务项目,还包括:企业名称、统一社会信用代码、法人、法人联系电话和企业地址中的至少一种。
103.本实施例中,对于业务项目基本信息的提取,污染源业务数据治理系统的第二获取模块从外部的业务系统中获取业务项目数据,并提取业务项目数据的企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目等分别对应的字段信息,并将每个业务项目数据对应字段信息以中间表或源表的模式映射至系统中预设的业务项目基本信息标识中,使每个标识对应相应的字段信息,最终得到业务项目基本信息。
104.具体的,请参考图11,进入业务数据配置页面,该页面中会显示系统获取的相应的业务项目名称(包括有固废数据、二污普数据、建设项目信息、环境信访信息、固定废物、行政处罚信息、排污许可证信息等)、业务项目所属数据源、业务项目对应的表名、以及对业务项目操作的列表,然后第二获取模块将提取的每个业务项目的企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目等的字段信息在对业务项目操作列表中的编辑窗口对应进行编辑,形成业务项目数据对应的业务项目基本信息,编辑完成后的业务项目基本信息可以通过对业务项目操作列表中的预览窗口进行预览,以便于清洗人员能够查看提取的信息是否准确。
105.作为一种可能实现的方式,请参考图12,通过关联模块将主污染源基本信息与业务项目基本信息进行关联度计算,并将关联度超过预设值的主污染源基本信息与业务项目基本信息进行关联之后,还包括:
106.步骤9:显示未关联的业务项目基本信息。
107.步骤10:接收新增污染源基本信息的指令,响应于指令,增加与未关联的业务项目基本信息相对应的污染源基本信息。
108.本实施例中,关联模块在对主污染源基本信息与业务项目基本信息进行关联之后,对于未与污染源基本信息关联的业务项目基本信息,也即业务数据没有合适的污染源关联,此时,可以在显示污染源基本信息的页面中增加一个污染源基本信息,具体的,该污染源基本信息中所对应的各项信息与该未关联的业务项目基本信息中的各项信息相对应,
以便于将所有的业务项目数据都能够关联到对应的污染源数据,使每个污染源所对应的业务项目都能够直观的查找出来,方便了后续对于每个污染源提供具有针对性的治理措施。
109.作为一种可能实现的方式,将关联度超过预设值的主污染源基本信息与业务项目基本信息进行关联后,还包括:将与业务项目基本信息进行关联后的主污染源基本信息进行存储,并用于对关联后的主污染源基本信息进行监管。
110.本实施例中,将污染源基本信息与业务项目基本信息进行关联后,在实际应用当中,可以将与业务项目基本信息进行关联后的主污染源基本信息进行存储,当需要对关联后的主污染源基本信息进行查询时,清洁人员进入系统中如图15所示的操作日志界面,系统中会显示每个主污染源基本信息的各项信息、与每个主污染源基本信息相关联的业务项目以及各种操作过程数据,操作日志界面上显示有查询对话框,清洁人员只需在该对话框中输入查询对象(例如污染源名称、污染源编码等),可以将针对该污染源的操作记录(包括操作的过程数据)直接查找出来,不同的操作类型会有不同的过程数据,点击任意一个主污染源基本信息的详情按钮,进入到如图16所示的详情界面,能够显示该主污染源基本信息中各项信息的具体详情,并能够追溯到该主污染源基本信息操作前的状态,以便于对每一类的主污染源基本信息进行监管。
111.根据第二方面,请参考图17,一种实施例中提供一种固定源数据治理系统,包括:
112.第一获取模块100,用于获取多个污染源数据,污染源数据至少包括企业名称或统一社会信用代码;
113.第一信息提取模块200,用于分别从多个污染源数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到多个污染源基本信息;污染源基本信息至少包括企业名称或统一社会信用代码,还包括:法人、法人联系电话、企业地址以及一个或多个业务项目中的至少一种;
114.合并模块300,用于对多个污染源基本信息进行分类,并将同类污染源基本信息进行合并,得到主污染源基本信息;
115.第二获取模块400,用于获取业务项目数据,业务项目数据至少包括业务项目,业务项目用于表征对污染源进行监管的项目类型;
116.第二信息提取模块500,用于从业务项目数据中提取企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目中的多种,得到业务项目基本信息,业务项目基本信息至少包括业务项目,还包括:企业名称、统一社会信用代码、法人、法人联系电话和企业地址中的至少一种;
117.关联模块600,用于将污染源基本信息与业务项目基本信息进行关联度计算,并将关联度超过预设值的主污染源基本信息与业务项目基本信息进行关联。
118.本实施例中的固定源数据治理系统中,包括有第一获取模块100、第一信息提取模块200、合并模块300、第二获取模块400、第二信息提取模块500以及关联模块600,其中,对于第一获取模块100,污染源数据治理系统通过第一获取模块100从第二次全国污染源普查数据中获取多个污染源数据,具体获取的污染源数据包括企业名称、统一社会信用代码、法人、法人联系电话、企业地址、业务项目、污染源地址、污染源名称、污染源编号、排污许可证编号、营业执照注册号等,其中,获取的污染源数据中至少要包括企业名称或统一社会信用代码,以便于后续对污染源进行分类。
119.然后通过第一信息提取模块200分别提取每个污染源数据中的企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目等信息中的多种信息,得到多个污染源基本信息。其中,通过对每个污染源数据提取后得到的污染源基本信息主要包括企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目等多种信息。
120.污染源数据治理系统再通过合并模块300采用多维度对比算法,将多个污染源基本信息进行对比分类,并将对比分类后的结果以如图3所示的信息卡片的形式进行展示,每个信息卡片上显示有该污染源数据对应的污染源基本信息,清洗人员能够很直观的看到每个污染源数据所对应的污染源基本信息,并判断出哪些属于同一类污染源基本信息,然后通过系统的合并功能将同类污染源基本信息合并至一个污染源基本信息上,得到主污染源基本信息。另外,当无法通过上述提取的信息对污染源基本信息进行分类时,则清洗人员点开信息卡片上的详情按钮,污染源数据治理系统收到触发详情按钮的命令后,显示详情页面,其中,如图4所示,详情页面用于显示污染源地址、污染源名称、污染源编号、排污许可证编号、营业执照注册号等信息。此外,当出现重复的污染源基本信息时,可以通过企查查或其他企业查询的现有网站对污染源的名称、统一社会信用代码进行查询,进而判断出其是否重合或者判断出哪一个是最新的污染源对应的污染源基本信息。
121.污染源数据治理系统再通过第二获取模块400从政府或者企业的业务系统中获取业务项目数据。其中,业务项目数据至少包括有业务项目,业务项目用于表征对各类污染源进行监管的项目类型,例如,建设项目信息、环境信访信息、固定废物、行政处罚信息、排污许可证信息、污染源在线数据、voc污染源等都属于业务项目。
122.污染源数据一般是从第二次全国污染源普查数据中获取,由此可知,获取污染源数据与业务项目数据的系统是属于两个完全不相同且不相关联的两个系统,因此目前在针对污染源进行治理的过程中,需要分别将两种数据进行查找,然后一一进行匹配,不仅费时费力,准确度还低。而本实施例中是通过第二获取模块400从政府或者企业的业务系统中获取业务项目数据后,将业务项目数据与污染源数据进行关联,以方便对污染源进行更好的管理。
123.然后,再通过第二信息提取模块500提取每个业务项目数据中的企业名称、统一社会信用代码、法人、法人联系电话、企业地址和业务项目等信息中的多种信息,得到业务项目基本信息。其中,通过对每个业务项目数据提取后得到的业务项目基本信息中主要包括业务项目、企业名称、统一社会信用代码、法人、法人联系电话和企业地址等多种信息。
124.最后,关联模块600通过采用多维度对比算法,将合并后的主污染源基本信息与业务项目基本信息进行关联度计算,然后将关联度结果进行展示,如将关联度结果显示在显示界面的主污染源基本信息卡片上。具体的,清洗人员可以通过选择业务项目数据,然后查看主污染源基本信息卡片上的关联度,也即图6中信息卡片上显示的综合相似度,当综合相似度超过预设值时,可以通过清洗人员输入关联的指令将主污染源基本信息与业务项目基本信息进行关联,也可以通过系统直接判断当综合相似度超过预设值时,直接将主污染源基本信息与业务项目基本信息进行关联。
125.此外,关于系统中的各模块功能的具体限定可以参见上文对于固定源数据治理方法中各步骤所对应的模块的限定,本实施例在此不再赘述。
126.以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限
制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1