调查对象数据处理方法、装置、存储介质及电子设备与流程

文档序号:24873115发布日期:2021-04-30 12:46阅读:81来源:国知局
调查对象数据处理方法、装置、存储介质及电子设备与流程

本申请涉及数据统计领域,尤其涉及调查对象数据处理方法、装置、存储介质及电子设备。



背景技术:

统计调查对象数据的界定即确定调查对象数据的范围,是依据调查目的,通过调查对象数据特点进行调查对象数据的筛选、分类、划定范围和定义,继而根据调查对象数据来制定调查方案。具体到每一个统计调查项目,进行统计的调查对象数据都可能不同。

目前,在国家统计调查项目及经济普查中,调查对象数据是以国家名录库数据为基础,进行固定分类划分,如按照法人单位、产业活动单位和个体工商户等进行分组调查。

此种方式存在两个弊端:其一,此项分类方式与各部委办等部门界定装置有出入,数据可能会因统计标准、规则不一致而导致统计的调查对象数据出现误差。其二,固定的调查对象数据分类已无法满足国家对各级统计机构提出的更精准的进行调查方案制定、统计数据分析工作、统计内部管理的需求。

故,在国家统计调查项目及经济普查中,如何进行统计调查对象数据的界定,以消除对统计调查对象数据真实性精准性的误差,是目前亟需解决的问题。



技术实现要素:

为克服相关技术中存在的问题,本申请提供一种调查对象数据处理方法、装置、存储介质及电子设备。

根据本申请实施例的第一方面,提供一种调查对象数据处理方法,包括:

根据统计业务调查目的,获取与所述统计业务调查目的对应的一个或多个主题调查对象数仓,其中,所述主题调查对象数仓为根据调查对象数据预先确定得到;

针对每一个主题调查对象数仓,按照统一的属性维度和属性维度规范,对所述每一个调查对象数仓中调查对象数据的属性进行标准化处理,得到标准主题调查对象数仓;

按照预设的条件规则,从所述标准主题调查对象数仓中筛选调查对象数据,得到符合所述条件规则的一个或多个第一调查对象数据集合;

基于所述第一调查对象数据集合,生成对象数据库。

可选地,根据调查对象数据预先确定主题调查对象数仓,包括:

获取多个调查对象数据,以及多个调查对象数据的属性数据;

根据所述属性数据,确定所述多个调查对象数据中每一个调查对象数据属性的有效性,得到包括有效属性的调查对象数据;

基于统计业务调查目的,对包括有效属性的调查对象数据进行分类,得到主题调查对象数仓。

可选地,所述预设的条件规则包括:根据调查对象数据的一个属性或者多个属性确定的一个条件规则,或者确定的多个条件规则的组合,其中,预设条件规则包括逻辑运算、集合运算、数据运算、组合运算中的一个或多个组合,以及包括针对运算结果,将调查对象数据移入或者移出所述第一调查对象数据集合。

可选地,所述基于所述第一调查对象数据集合,生成对象数据库,包括:

根据得到的一个或多个第一调查对象数据集合,将所述第一调查对象数据集合确定为与统计业务调查目的对应的对象数据库。

可选地,所述基于所述第一调查对象数据集合,生成对象数据库,包括:

若得到多个第一调查对象数据集合,则获取从多个第一调查对象数据集合中选择的对象集合,得到多个第二调查对象数据集合;

对所述多个第二调查对象数据集合进行集合运算,得到第三调查对象数据集合,将所述第三调查对象数据集合确定与统计业务调查目的对应的对象数据库。

可选地,所述对象数据库包括是否自动更新的参数、是否公开的参数和发布范围的参数;

所述方法还包括:

设置所述对象数据库上述参数中的一种或者多种的组合:

设置所述对象数据库是否为自动更新数据;

设置所述对象数据库是否为公开展示;

设置所述对象数据库的发布范围。

根据本申请实施例的第二方面,提供一种调查对象数据处理装置,包括:

获取模块,被配置为根据统计业务调查目的,获取与所述统计业务调查目的对应的一个或多个主题调查对象数仓,其中,所述主题调查对象数仓为根据调查对象数据预先确定得到;

处理模块,被配置为针对每一个主题调查对象数仓,按照统一的属性维度和属性维度规范,对所述每一个调查对象数仓中调查对象数据的属性进行标准化处理,得到标准主题调查对象数仓;

筛选模块,被配置为按照预设的条件规则,从所述标准主题调查对象数仓中筛选调查对象数据,得到符合所述条件规则的一个或多个第一调查对象数据集合;

确定模块,被配置为基于所述第一调查对象数据集合,生成对象数据库。

可选地,所述获取模块采用如下方式根据调查对象数据预先确定主题调查对象数仓:

获取多个调查对象数据,以及多个调查对象数据的属性数据;

根据所述属性数据,确定所述多个调查对象数据中每一个调查对象数据属性的有效性,得到包括有效属性的调查对象数据;

基于统计业务调查目的,对包括有效属性的调查对象数据进行分类,得到主题调查对象数仓。

可选地,所述预设的条件规则包括:根据调查对象数据的一个属性或者多个属性确定的一个条件规则,或者确定的多个条件规则的组合,其中,预设条件规则包括逻辑运算、集合运算、数据运算、组合运算中的一个或多个组合,以及包括针对运算结果,将调查对象数据移入或者移出所述第一调查对象数据集合。

可选地,所述确定模块采用如下方式基于所述第一调查对象数据集合,生成对象数据库:

根据得到的一个或多个第一调查对象数据集合,将所述第一调查对象数据集合确定为与统计业务调查目的对应的对象数据库。

可选地,所述,所述确定模块采用如下方式基于所述第一调查对象数据集合,生成对象数据库,包括:

若得到多个第一调查对象数据集合,则获取从多个第一调查对象数据集合中选择的对象集合,得到多个第二调查对象数据集合;

对所述多个第二调查对象数据集合进行集合运算,得到第三调查对象数据集合,将所述第三调查对象数据集合确定与统计业务调查目的对应的对象数据库。

可选地,所述对象数据库包括表征是否自动更新的参数、表征是否公开的参数和表征发布范围的参数;

所述确定模块还被配置为,设置所述对象数据库上述参数中的一种或者多种的组合:

设置所述对象数据库是否为自动更新数据;

设置所述对象数据库是否为公开展示;

设置所述对象数据库的发布范围。

根据本申请实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本申请第一方面所提供的调查对象数据处理方法的步骤。

本申请的实施例提供的技术方案可以包括以下有益效果:基于各种数据来源获取得到全量的调查对象数据,并对全量的调查对象数据按照统计业务调查目的进行分类,得到主题调查对象数仓,扩展了调查对象数据来源,保证了本申请调查对象数据处理的基础数据来源。针对每一个主题调查对象数仓,按照统一的属性维度和属性维度规范,对每一个调查对象数仓中调查对象数据的属性进行标准化处理,可消除对统计数据真实性精准性的误差,使得各级统计机构人员根据特定业务需求,能够从标准主题调查对象数仓中准确地得到调查对象数据。按照预设的条件规则,从标准主题调查对象数仓中筛选调查对象数据,得到符合条件规则的一个或多个第一调查对象数据集合,使得调查对象数据的界定更具自主性和灵活性,实现更加合理地统计调查对象数据。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

图1是根据一示例性实施例示出的一种调查对象数据处理方法的流程图。

图2是根据一示例性实施例示出的一种调查对象数据处理装置的框图。

图3是根据一示例性实施例示出的一种装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和装置的例子。

图1是根据一示例性实施例示出的一种调查对象数据处理方法的流程图,如图1所示,调查对象数据处理方法,包括以下步骤。

在步骤s11中,根据统计业务调查目的,获取与统计业务调查目的对应的一个或多个主题调查对象数仓。

本申请中的主题调查对象数仓可以是根据调查对象数据预先组织建立的与统计业务调查目的对应的调查对象数据集市。

例如,主题调查对象数仓可以包括国家名录数仓、委办局数仓、统计机构数仓等。

本申请中,可根据用户身份标识,以及统计业务调查目的,获取与统计业务调查目的对应的一个或多个主题调查对象数仓。

另外,在获取与统计业务调查目的对应的一个或多个主题调查对象数仓之前,本申请还包括根据调查对象数据预先确定主题调查对象数仓:

获取多个调查对象数据,以及多个调查对象数据的属性数据,根据属性数据,确定多个调查对象数据中每一个调查对象数据属性的有效性,得到包括有效属性的调查对象数据,基于统计业务调查目的,对包括有效属性的调查对象数据进行分类,得到主题调查对象数仓。

其中,获取多个调查对象数据例如可以从包括国家名录系统中获取名录数据;从其他统计机构获取最新名录数据;从各个委办局包括财政、税收、工商等获取名录数据。另外,还可通过各类统计调查的调查数据中抽取,以及通过各类接口从业务处理系统、通过自动或手动维护获得。

获取多个调查对象数据后,可以对调查对象数据有效属性进行的抽取、清理和集成。并通过分段存储调查对象数据之后,得到构建有机统一的包括有效属性的调查对象数据的全量数仓。调查对象数仓建立后,按不同统计业务调查目的,可以对全量数仓进行分类,组织建立调查对象数据集市,例如国家名录数仓、委办局数仓、统计机构数仓等,为统计调查对象数据的管理员、统计业务员及内外部数据共享用户提供安全有序的主题调查对象数仓的访问方式。

在步骤s12中,针对一个或者多个主题调查对象数仓中的每一个调查对象数仓,按照统一的属性维度和属性维度规范,对每一个调查对象数仓中调查对象数据的属性进行标准化处理,得到标准主题调查对象数仓。

目前,由于调查对象数据的统计标准不同,会产生调查对象数据真实性以及精准性误差的问题。故,为消除对统计数据真实性精准性的误差,使得各级统计机构人员根据特定业务需求,能够从标准主题调查对象数仓中灵活准确地得到调查对象数据,一种实施方式中,本申请可对主题调查对象数仓中的调查对象数据进行标准化处理,具体针对每一个主题调查对象数仓,对主题调查对象数仓中存储的调查对象数据,按照统一的属性维度和属性维度规范,进行标准化处理,得到标准主题调查对象数仓。得到的标准主题调查对象数仓后,统计人员可以对标准主题调查对象数仓中的调查对象数据进行统一标准的选择和约定。

其中,调查对象数据属性可以是根据特定业务需求,对调查对象数据进行的例如组织分类、行业分类、区域、基础信息、统计指标、自定义标签等,能够表征调查对象数据所属性质定义的各类属性,以及属性的数据属性,包括数据类型、格式、精度等。

进而,通过对主题调查对象数仓中调查对象数据按照统一的属性维度和属性维度规范,对每一个调查对象数仓中调查对象数据的属性进行标准化处理,得到标准统一的标准主题调查对象数仓,以标准统一的标准主题调查对象数仓为基础,进行后续管理及维护时,可实现对基础数据管理、补充、交换和使用,实现了标准主题调查对象数仓的通用性、可扩展性、开放性、可延展性。

在步骤s13中,按照预设的条件规则,从标准主题调查对象数仓中筛选调查对象数据,得到符合条件规则的一个或多个第一调查对象数据集合。

其中,预设的条件规则包括:根据调查对象数据的一个属性或者多个属性确定的一个条件规则,或者确定的多个条件规则的组合。

其中,预设条件规则例如可以包括对调查对象数据基于各类运算符进行一个运算或者多个运算的组合,运算符例如包括算术运算符、关系运算符、逻辑运算符、位操作运算符、赋值运算符、逗号运算符、各类函数、组合运算等,进而可全面的支撑对调查对象数据属性的自定义条件规则。预设规则还包括针对运算结果,对调查对象数据选择移入第一调查对象数据集合,或者移出第一调查对象数据集合。

针对调查对象数据的预设条件规则确定后,会根据预设条件规则筛选出一个或者多个调查对象数据集合,本申请为描述方便,将根据预设条件规则筛选出的调查对象数据集合称为第一调查对象数据集合。

此外,在第一调查对象数据集合的基础上,各级统计人员可再次通过自定义的条件规则进一步筛选调查对象数据,并可对进一步筛选的得到的调查对象数据进行单选或者多选的移入或者移出对象集合。

在步骤s14中,基于第一调查对象数据集合,生成对象数据库。

通过对调查对象数据界进行预设条件规则的制定,会初步生成一个或者多个第一对象集合,一种实施方式中,可直接将生成的第一对象集合确定为与统计业务调查目的对应的对象数据库。进而可根据统计人员对第一对象集合的命名,确定得到与统计业务调查目的对应的对象数据库。

此外,在生成一个或者多个第一对象集合之后,本申请还可以基于统计人员从多个第一调查对象数据集合中的筛选结果,获取从多个第一调查对象数据集合中选择的对象集合,得到多个第二调查对象数据集合。

通过对多个第二调查对象数据集合进行集合运算,集合运算例如可以包括并集、交集、相对补集、绝对补集等形成新的对象集合,即第三调查对象数据集合。并且,得到第三调查对象数据集合之后,还可以再次进行集合运算,得到第四调查对象数据集合,以此类推。

通过对某个第n调查对象数据集合可对其中的单个或多个调查对象数据进行权重设置,设置其单个或多个调查对象在某个第n集合中的权重占比,从而定义该对象或对象子集在统计调查或统计分析中的计算系数。

此外,还可以设置调查对象数据集合中一个或者多个调查对象数据的监测参数,来对某调查对象数据或某调查子对象的某个属性进行特别监测。当调查对象属性对应的数据更新达到某个监测条件时,执行对应的运算条件,执行后可更新第n调查对象,也可以生成第n+1调查对象集合。例如,调查对象属性为营业收入,当调查对象营业收入更新并达到预设的数值时,执行调查对象数据的运算条件,执行后可更新该调查对象数据,或者根据该调查对象数据生成第n+1调查对象集合。

进而,依据上述调查对象数据处理方法,可实现法人单位、产业活动单位、个体工商户、统计各行业大类对象库、统计各行业中类对象库、统计各行业小类对象库、统计各专业对象库、统计各处室调查对象库、各部委调查对象库、各产业对象库、各类派生产业对象库、各类主题调查对象库、统计机构内部管理对象数据库等等各类对象数据库的界定与生成。同时,通过该对象界定方法界定出的对象库可应用于多个业务环节,如各类统计调查、统计分析、纳统识别、统计重点监测、委办局间数据交换、统计机构内党建管理办公管理等等。

此外,得到对象数据库之后,一种实施方式中,还包括设置对象数据库上述参数中的一种或者多种的组合:例如设置对象数据库是否为自动更新数据;设置对象数据库是否为公开展示;设置所属对象数据库是否可以进一步进行集合运算;设置所属对象库中对象是否可以进行各类运算;设置所属对象库是否可进行派生加乘;设置所属对象库是否可进行监测设置;设置对象数据库的发布范围,使得各级统计人员可根据统计需求安全可控地获取对象数据库的数据,以及管理对象数据库。

在本申请的示例性实施例中,基于各种数据来源获取得到全量的调查对象数据,并对全量的调查对象数据按照统计业务调查目的进行分类,得到主题调查对象数仓,扩展了调查对象数据来源,保证了本申请调查对象数据处理的基础数据来源。针对调查对象数仓,按照统一的属性维度和属性维度规范,对每一个调查对象数仓中调查对象数据的属性进行标准化处理,可消除对统计数据真实性精准性的误差,使得各级统计机构人员根据特定业务需求,能够从标准主题调查对象数仓中准确地得到调查对象数据。按照预设的条件规则,从标准主题调查对象数仓中筛选调查对象数据,得到符合条件规则的一个或多个第一调查对象数据集合,使得调查对象数据的界定更具自主性和灵活性,实现更加合理地统计调查对象数据。

图2是根据一示例性实施例示出的一种调查对象数据处理装置框图200。参照图2,该装置包括获取模块201、处理模块202、筛选模块203以及确定模块204。

其中,获取模块201,被配置为根据统计业务调查目的,获取与所述统计业务调查目的对应的一个或多个主题调查对象数仓,其中,所述主题调查对象数仓为根据调查对象数据预先确定得到;

处理模块202,被配置为针对每一个主题调查对象数仓,按照统一的属性维度和属性维度规范,对所述每一个调查对象数仓中调查对象数据的属性进行标准化处理,得到标准主题调查对象数仓;

筛选模块203,被配置为按照预设的条件规则,从所述标准主题调查对象数仓中筛选调查对象数据,得到符合所述条件规则的一个或多个第一调查对象数据集合;

确定模块204,被配置为基于所述第一调查对象数据集合,生成对象数据库。

可选地,所述获取模块201采用如下方式根据调查对象数据预先确定主题调查对象数仓:

获取多个调查对象数据,以及多个调查对象数据的属性数据;

根据所述属性数据,确定所述多个调查对象数据中每一个调查对象数据属性的有效性,得到包括有效属性的调查对象数据;

基于统计业务调查目的,对包括有效属性的调查对象数据进行分类,得到主题调查对象数仓。

可选地,所述预设的条件规则包括:根据调查对象数据的一个属性或者多个属性确定的一个条件规则,或者确定的多个条件规则的组合,其中,预设条件规则包括逻辑运算、集合运算、数据运算、组合运算中的一个或多个组合,以及包括针对运算结果,将调查对象数据移入或者移出所述第一调查对象数据集合。

可选地,所述确定模块204采用如下方式基于所述第一调查对象数据集合,生成对象数据库:

根据得到的一个或多个第一调查对象数据集合,将所述第一调查对象数据集合确定为与统计业务调查目的对应的对象数据库。

可选地,所述,所述确定模块204采用如下方式基于所述第一调查对象数据集合,生成对象数据库,包括:

若得到多个第一调查对象数据集合,则获取从多个第一调查对象数据集合中选择的对象集合,得到多个第二调查对象数据集合;

对所述多个第二调查对象数据集合进行集合运算,得到第三调查对象数据集合,将所述第三调查对象数据集合确定与统计业务调查目的对应的对象数据库。

可选地,所述对象数据库包括表征是否自动更新的参数、表征是否公开的参数和表征发布范围的参数;

所述确定模块204还被配置为,设置所述对象数据库上述参数中的一种或者多种的组合:

设置所述对象数据库是否为自动更新数据;

设置所述对象数据库是否为公开展示;

设置所述对象数据库的发布范围。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该装置的实施例中进行了详细描述,此处将不做详细阐述说明。

本申请还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本申请提供的调查对象数据处理方法的步骤。

图3是根据一示例性实施例示出的一种用于调查对象数据处理的装置300的框图。例如,装置300可以被提供为一服务器。参照图3,装置300包括处理组件322,其进一步包括一个或多个处理器,以及由存储器332所代表的存储器资源,用于存储可由处理组件322的执行的指令,例如应用程序。存储器332中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件322被配置为执行指令,以执行上述调查对象数据处理方法

装置300还可以包括一个电源组件326被配置为执行装置300的电源管理,一个有线或无线网络接口350被配置为将装置300连接到网络,和一个输入输出(i/o)接口358。装置300可以操作基于存储在存储器332的操作系统,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或类似。

本领域技术人员在考虑说明书及实践本申请后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1