一种应用于政务领域的数据质量评估方法及相关装置与流程

文档序号:33560738发布日期:2023-03-22 14:12阅读:25来源:国知局
一种应用于政务领域的数据质量评估方法及相关装置与流程

1.本技术涉及数据处理领域,尤其涉及一种应用于政务领域的数据质量评估方法及相关装置。


背景技术:

2.政务领域的政府数据是指政府各职能部门依法在办理业务及进行决策时产生的数据资源,包括对社会公民及法人进行数据采集、业务处理和业务决策产生的数据资源。政府数据由于各种原因存在的失时、失真等问题,导致数据的准确性、有效性、科学性和全面性得不到保障;高质量的数据不仅能提高信息的可利用性,同时也为政府部门的各项决策提供重要依据。对于政务领域的数据质量评估,很多研究人员在理论层面开展了许多工作,也提出了一些数据质量的定性分析方法,以及制定了一些数据质量控制的管理体系措施。
3.但是,现有技术中没有一套针对政务领域的数据质量评估算法模型,政务领域的数据质量评估仅仅停留在理论研究层面,导致政务领域的数据质量评估不具备可量化性、可落地性和可迭代性。


技术实现要素:

4.本技术提供了一种应用于政务领域的数据质量评估方法及相关装置,用于使政务领域的数据质量评估可量化、可落地且可迭代。
5.本技术第一方面提供了一种基于政务领域的数据质量评估方法,包括:
6.根据政务领域的业务场景确定数据质量评价指标,所述数据质量评价指标包括:规范性指标、完整性指标、准确性指标、一致性指标、时效性指标和/或可访问性指标;
7.基于所述数据质量评价指标确定指标约束规则;
8.根据所述数据质量评价指标及所述指标约束规则构建数据质量评估算法模型;
9.获取待评估的政务领域的目标数据集,并确定所述目标数据集对应的目标数据质量评价指标及目标指标约束规则,所述政务领域的目标数据集为目标职能部门在办理目标业务及进行目标决策时产生的数据;
10.确定所述目标指标约束规则的目标权重值;
11.将所述目标指标约束规则、所述目标权重值及所述目标数据集输入所述数据质量评估算法模型,获取所述目标数据集的数据质量评估结果。
12.可选地,所述将所述目标指标约束规则、所述目标权重值及所述目标数据集输入所述数据质量评估算法模型,获取所述目标数据集的数据质量评估结果包括:
13.将所述目标指标约束规则及所述目标权重值输入所述数据质量评估算法模型,通过数量质量绝对量化值公式获取所述目标数据集的数据质量绝对量化值;
14.所述数量质量绝对量化值公式为:
15.[0016][0017]
其中,wi为目标指标约束规则的目标权重值,ri为目标指标约束规则;
[0018]
通过数量质量相对量化值公式获取所述目标数据集的数据质量相对量化值;
[0019]
所述数据质量相对量化值公式为:
[0020][0021]
其中,wi为目标指标约束规则的目标权重值,ei为目标指标约束规则的期望值;
[0022]
根据所述数据质量绝对量化值及所述数据质量相对量化值确定所述目标数据集的数据质量评估结果。
[0023]
可选地,在所述获取目标数据集之后,所述数据质量评估方法还包括:
[0024]
对所述目标数据集进行预处理;
[0025]
所述将所述目标指标约束规则、所述目标权重值及所述目标数据集输入所述数据质量评估算法模型,获取所述目标数据集的数据质量评估结果包括:
[0026]
将所述目标指标约束规则、所述目标权重值及预处理后的目标数据集输入数据质量评估算法模型,获取所述目标数据集的数据质量评估结果。
[0027]
可选地,所述对所述目标数据集进行预处理包括:
[0028]
根据所述目标数据集中的目标数据的数据特征对所述目标数据集进行分层,获取至少两层目标数据集;
[0029]
根据抽样估算公式确定每一层待抽样的目标数据的目标数量,所述抽样估算公式为:
[0030]
z=x2q(1-q)/σ2;
[0031]
其中,z为目标数量、q为预设比例、x为标准正态分布的统计量、σ为预设精度或预设误差;
[0032]
对所述至少两层目标数据集分别进行随机抽样,抽取目标数量的目标数据,并生成预处理后的目标数据集。
[0033]
可选地,在所述将所述目标指标约束规则、所述目标权重值及所述目标数据集输入所述数据质量评估算法模型,获取所述目标数据集的数据质量评估结果之后,所述数据质量评估方法还包括:
[0034]
判断所述数据质量评估结果是否符合正态分布;
[0035]
若否,则根据所述数据质量评估结果调整所述目标权重值,并将所述目标约束规则、调整后的目标权重值及所述目标数据输入所述目标质量评估算法模型,重新获取所述目标数据集的数据质量评估结果,直至所述数据质量评估结果符合正态分布。
[0036]
可选地,指标约束规则包括:数据标准约束规则、数据模型约束规则、数据元素完整性约束规则、数据记录完整性约束规则、数据内容正确性约束规则、数据格式合规性约束规则、相同数据一致性约束规则、关联数据一致性约束规则、基于时间段的约束规则、基于时间点的约束规则、可访问性约束规则及可用性约束规则。
[0037]
本技术第二方面提供了一种应用于政务领域的数据质量评估装置,包括:
[0038]
第一确定单元,用于根据政务领域的业务场景确定数据质量评价指标,所述数据质量评价指标包括:规范性指标、完整性指标、准确性指标、一致性指标、时效性指标和/或
可访问性指标;
[0039]
第二确定单元,用于基于所述数据质量评价指标确定指标约束规则;
[0040]
构建单元,用于根据所述数据质量评价指标及所述指标约束规则构建数据质量评估算法模型;
[0041]
第一获取单元,用于获取待评估的政务领域的目标数据集,并确定所述目标数据集对应的目标数据质量评价指标及目标指标约束规则,所述政务领域的目标数据集为目标职能部门在办理目标业务及进行目标决策时产生的数据;
[0042]
第三确定单元,用于确定所述目标指标约束规则的目标权重值;
[0043]
第二获取单元,用于将所述目标指标约束规则、所述目标权重值及所述目标数据集输入所述数据质量评估算法模型,获取所述目标数据集的数据质量评估结果。
[0044]
可选地,所述第二获取单元具体用于:
[0045]
将所述目标指标约束规则及所述目标权重值输入所述数据质量评估算法模型,通过数量质量绝对量化值公式获取所述目标数据集的数据质量绝对量化值;
[0046]
所述数量质量绝对量化值公式为:
[0047][0048][0049]
其中,wi为目标指标约束规则的目标权重值,ri为目标指标约束规则;
[0050]
通过数量质量相对量化值公式获取所述目标数据集的数据质量相对量化值;
[0051]
所述数据质量相对量化值公式为:
[0052][0053]
其中,wi为目标指标约束规则的目标权重值,ei为目标指标约束规则的期望值;
[0054]
根据所述数据质量绝对量化值及所述数据质量相对量化值确定所述目标数据集的数据质量评估结果。
[0055]
可选地,所述数据质量评估装置还包括:
[0056]
预处理单元,用于对所述目标数据集进行预处理;
[0057]
所述第二获取单元具体用于:
[0058]
将所述目标指标约束规则、所述目标权重值及预处理后的目标数据集输入数据质量评估算法模型,获取所述目标数据集的数据质量评估结果。
[0059]
可选地,所述预处理单元具体用于:
[0060]
根据所述目标数据集中的目标数据的数据特征对所述目标数据集进行分层,获取至少两层目标数据集;
[0061]
根据抽样估算公式确定每一层待抽样的目标数据的目标数量,所述抽样估算公式为:
[0062]
z=x2q(1-q)/σ2;
[0063]
其中,z为目标数量、q为预设比例、x为标准正态分布的统计量、σ为预设精度或预设误差;
[0064]
对所述至少两层目标数据集分别进行随机抽样,抽取目标数量的目标数据,并生
成预处理后的目标数据集。
[0065]
可选地,所述数据质量评估模型还包括:
[0066]
判断单元,用于判断所述数据质量评估结果是否符合正态分布;
[0067]
调整单元,用于若否,则根据所述数据质量评估结果调整所述目标权重值,并将所述目标约束规则、调整后的目标权重值及所述目标数据输入所述目标质量评估算法模型,重新获取所述目标数据集的数据质量评估结果,直至所述数据质量评估结果符合正态分布。
[0068]
可选地,所述指标约束规则包括:数据标准约束规则、数据模型约束规则、数据元素完整性约束规则、数据记录完整性约束规则、数据内容正确性约束规则、数据格式合规性约束规则、相同数据一致性约束规则、关联数据一致性约束规则、基于时间段的约束规则、基于时间点的约束规则、可访问性约束规则及可用性约束规则。
[0069]
本技术第三方面提供了一种应用于政务领域的数据质量评估装置,所述装置包括:
[0070]
处理器、存储器、输入输出单元以及总线;
[0071]
所述处理器与所述存储器、所述输入输出单元以及所述总线相连;
[0072]
所述存储器保存有程序,所述处理器调用所述程序以执行第一方面以及第一方面中任一项可选的一种应用于政务领域的数据质量评估方法。
[0073]
本技术第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质上保存有程序,所述程序在计算机上执行时执行第一方面以及第一方面中任一项可选的一种应用于政务领域的数据质量评估方法。
[0074]
从以上技术方案可以看出,本技术具有以下优点:本技术的数据质量评估方法构建了一个数据质量评估算法模型,根据政务领域的业务场景确定数据质量评价指标;基于数据质量评价指标确定指标约束规则,根据数据质量评价指标及指标约束规则构建数据质量评估算法模型;获取目标数据集并确定目标数据集对应的目标质量评价指标及目标指标约束规则,确定目标指标约束规则的目标权重值,将目标指标约束规则、目标权重值及目标数据集输入数据质量评估算法模型,获取目标数据集的数据质量评估结果,通过上述方法,提供了一套针对政务领域的数据质量评估算法模型,从而使得政务领域的数据质量评价可量化、可落地并且可迭代。
附图说明
[0075]
为了更清楚地说明本技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0076]
图1为本技术提供的一种应用于政务领域的数据质量评估方法一个实施例流程示意图;
[0077]
图2为本技术提供的一种应用于政务领域的数据质量评估方法另一个实施例流程示意图;
[0078]
图3为本技术提供的一种应用于政务领域的数据质量评估装置一个实施例结构示意图;
[0079]
图4为本技术提供的一种应用于政务领域的数据质量评估装置另一个实施例结构示意图;
[0080]
图5为本技术提供的一种应用于政务领域的数据质量评估装置一个实施例结构示意图。
具体实施方式
[0081]
本技术提供了一种应用于政务领域的数据质量评估方法及相关装置,用于使得政务领域的数据质量评价可量化、可落地并且可迭代。
[0082]
需要说明的是,本技术提供的一种应用于政务领域的数据质量评估方法,可以应用于终端,还可以应用于服务器上,例如终端可以是智能手机或电脑、平板电脑、智能电视、智能手表、便携计算机终端也可以是台式计算机等固定终端。为方便阐述,本技术中以终端为执行主体进行举例说明。
[0083]
请参阅图1,图1为本技术提供的一种应用于政务领域的数据质量评估方法的一个实施例,该数据质量评估方法包括:
[0084]
101、终端根据政务领域的业务场景确定数据质量评价指标,该数据质量评价指标包括:规范性指标、完整性指标、准确性指标、一致性指标、时效性指标和/或可访问性指标;
[0085]
在本实施例中,数据质量评价是指对数据进行度量、判断、检查,并记录、分析其结果的活动;政务领域的数据质量评价体系模型如下i=《g,w,z,y,s,k》;其中,g,规范性指标指数据符合数据标准、数据模型、业务规则、元数据或权威参考数据的程度;w,完整性指标指按照数据规则,数据元素被赋予数值的程度;z,准确性指标指数据准确标识其所描述的真实实体(实际对象)真实值的程度;y,一致性指标指数据与其他特定上下文中使用的数据无矛盾的程度;s,时效性指标指数据在时间变化中的正确程度;k,可访问性指标指数据能被访问的程度。
[0086]
102、终端基于数据质量评价指标确定指标约束规则;
[0087]
在本实施例中,终端基于数据质量评价指标规划数据质量评价指标所对应的指标约束规则,一个数据质量评价指标可以对应一个指标约束规则,一个数据质量评价指标也可以对应多个指标约束规则。例如:规范性指标对应的指标约束规则包括:数据标准约束规则及数据模型约束规则;完整性指标对应的指标约束规则包括:数据元素完整性约束规则及数据记录完整性约束顾泽;准确性指标对应指标约束规则包括:数据内容正确性约束规则及数据格式合规性约束规则;一致性指标对应的指标约束规则包括:相同数据一致性约束规则及关联数据一致性约束规则;时效性指标对应的指标约束规则包括:基于时间段的约束规则及基于时间点的约束规则;可访问性指标对应的指标约束规则包括:可访问性约束规则及可用性约束规则。
[0088]
103、终端根据数据质量评价指标及指标约束规则构建数据质量评估算法模型;
[0089]
在本实施例中,终端根据政务领域的数据质量评价指标及指标约束规则构建政务领域的数据质量评估算法模型,该政务领域的数据质量评估算法模型是一个六元组,m=《d,i,r,w,e,s》,其中,d为待评估的政务领域的目标数据集,对于关系数据库而言,一个数据集相当于一个表或一个视图;i为目标数据集需要进行评估的数据质量评价指标,如规范性指标、完整性指标、准确性指标、一致性指标、时效性指标及可访问性指标中的一个或多个;
r为根据目标数据集需要进行评估的数据质量评价指标确定的指标约束规则,指标约束规则r可以转换为逻辑表达式,例如:身份证数据集中对身份证字段的数据完整性指标的指标约束规则为:身份证字段的数据缺失率不能超过5%,若超过5%,则会被扣五分,此时,整体的数据质量得分会下降5分;w为赋予该指标约束规则的权重值,其中,w是大于0的整数,w描述了指标约束规则r在所有规则中所占的比重值;e为对该指标约束规则r的给出的期望值,该期望值为0-100之间的实数,它是在评估之前对该规则所期望得到的结果;s为指标约束规则r的最终结果,s为0-100之间的实数,是检测指标约束规则r后所得到的结果。
[0090]
104、终端获取待评估的政务领域的目标数据集,并确定目标数据集对应的目标数据质量评价指标及目标指标约束规则,政务领域的目标数据集为目标职能部门在办理目标业务及进行目标决策时产生的数据;
[0091]
在本实施例中,政务领域的数据集是指政府各个职能部门依法在办理业务及进行决策时产生的数据资源,包括对社会公民及法人进行数据采集、业务处理和业务决策产生的数据资源。政务领域的数据质量评价是指根据现有的政务领域的历史目标数据集的数据质量问题,初步确定目标数据集对应的目标数据质量评价指标及目标指标约束规则,基于目标数据质量评价指标及目标指标约束规则对目标数据集的数据质量进行检测评价。终端可以通过抽取的方式获取政务领域的目标数据集,抽取的数据可以包括政务数据和互联网数据,其中,对于互联网数据的抽取,应根据业务场景的业务应用需求,实时监测政府网站、行业网站、企业网站、商业门户及文博、微信等社会化媒体的信息,定期采集所需的互联网数据,尤其是涉及业务场景的目标业务的政务公开、政务办事、交流互动等政务服务的数据。对于政务数据的抽取,可以根据提供的政务系统接口、政务应用数据库、政务电子文本、政务档案等多种数据源,采用各类异构数据源采集处理手段,将政务数据按照一定的格式和规则收集汇总;目标数据质量评价指标为数据质量评价指标中的一个或多个,目标指标约束规则为指标约束规则中的一个或多个。
[0092]
105、终端确定目标指标约束规则的目标权重值;
[0093]
在本实施例中,目标指标约束规则的目标权重值描述了该目标指标约束规则在所有目标指标约束规则中所占的比重,按照目标指标约束规则的关注度不同,给所有目标指标约束规则设置相应的目标权重值,使所有目标权重值的加和为1。对于政务领域的不同业务场景,相同的目标指标约束规则的目标权重值可能相同也可能不同。
[0094]
106、终端将目标指标约束规则、目标权重值及目标数据集输入数据质量评估算法模型,获取目标数据集的数据质量评估结果;
[0095]
在本实施例中,信息服务过程中,目标数据集的数据质量评估结果用评估得分来计算,评估得分按照百分制进行计算,得分越高,目标数据集的数据质量评估结果的情况越好。目标数据集的数据质量评估结果的具体获取过程将在下一个实施例中进行详细描述,此处不再赘述。
[0096]
为使本技术提供的一种应用于政务领域的数据质量评估方法更加的明显易懂,下面对本技术提供的一种应用于政务领域的数据质量评估方法进行详细说明:
[0097]
请参阅图2,图2为本技术提供的一种应用于政务领域的数据质量评估方法另一个实施例,该数据质量评估方法包括:
[0098]
201、终端根据政务领域的业务场景确定数据质量评价指标,该数据质量评价指标
包括:规范性指标、完整性指标、准确性指标、一致性指标、时效性指标和/或可访问性指标;
[0099]
202、终端基于数据质量评价指标确定指标约束规则;
[0100]
203、终端基于数据质量评价指标及指标约束规则构建数据质量评估算法模型;
[0101]
204、终端获取待评估的政务领域的目标数据集,并确定目标数据集对应的目标数据质量评价指标及目标指标约束规则,政务领域的目标数据集为目标职能部门在办理目标业务及进行目标决策时产生的数据;
[0102]
本实施例中的步骤201至204与前述图1实施例中的步骤101至104类似,具体此处不再赘述。
[0103]
205、终端对目标数据集进行预处理;
[0104]
在本实施例中,终端对目标数据集进行预处理包括:终端根据目标数据集中的目标数据的数据特征对目标数据集进行分层,获取至少两层目标数据集;终端根据抽样估算公式确定每一层待抽样的目标数据的目标数量,抽样估算公式为:z=x2q(1-q)/σ2;其中,z为目标数量,q为预设比例、x为标准正态分布的统计量、σ为预设精度或预设误差;对至少两层目标数据集分别进行随机抽样,抽取目标数量的目标数据,并生成预处理后的目标数据集。
[0105]
在本实施例中,由于数据质量通常不是均匀分布的,要通过目标数据集中的目标数据样本表达整个政务领域的业务场景的目标业务数据的整体,可以通过预设的数据特征对目标数据集进行分层;对每一层的目标数据采用简单随机抽样的方法进行抽样,并获得多组分层的抽样数据,汇总多组分层的抽样数据,获得预处理后的目标数据集。
[0106]
206、终端确定目标指标约束规则的目标权重值;
[0107]
本实施例中的步骤206与前述图1实施例中的步骤105类似,具体此处不再赘述。
[0108]
207、终端将目标指标约束规则、目标权重值及预处理后的目标数据集输入数据质量评估算法模型,获取目标数据集的数据质量评估结果;
[0109]
在本实施例中,终端将目标指标约束规则、目标权重值及预处理后的目标数据集输入数据质量评估算法模型,获取目标数据集的数据质量评估结果包括:终端将目标指标约束规则及目标权重值输入数据质量评估算法模型,通过数据质量绝对量化值公式获取目标数据集的数据质量的绝对量化值;数据质量绝对量化值公式为:其中,wi为目标指标约束规则的目标权重值,ri为目标指标约束规则;终端通过数据质量相对量化值公式获取目标数据集的数据质量相对量化值;数据质量相对量化值公式为:其中,wi为目标指标约束规则的目标权重值,ei为目标指标约束规则的期望值;终端根据数据质量绝对量化值及数据质量相对量化值确定目标数据集的数据质量评估结果。
[0110]
208、终端判断数据质量评估结果是否符合正态分布;
[0111]
在本实施例中,终端判断数据质量评估结果是否符合正态分布,若是,则终端结束流程,若否,则终端执行步骤208。
[0112]
209、若否,则终端根据数据质量评估结果调整目标权重值,并将目标约束规则、调整后的目标权重值及目标数据输入目标质量评估算法模型,重新获取目标数据集的数据质
量评估结果,直至数据质量评估结果符合正态分布。
[0113]
在本实施例中,若数据质量评估结果不符合正态分布,则终端根据数据质量评估结果调整目标权重值,并将目标约束规则、调整后的目标权重值及目标数据输入目标质量评估算法模型,重新获取目标数据集的数据质量评估结果,直至数据质量评估结果符合正态分布,通过上述方法,进一步提高了数据质量评估结果的准确性及可靠性。
[0114]
上述对本技术提供的一种应用于政务领域的数据质量评估方法进行了说明,下面对本技术提供的一种应用于政务领域的数据质量评估装置进行说明:
[0115]
请参阅图3,图3为本技术提供的一种应用于政务领域的数据质量评估装置一个实施例,该数据质量评估装置包括:
[0116]
第一确定单元301,用于根据政务领域的业务场景确定数据质量评价指标,所述数据质量评价指标包括:规范性指标、完整性指标、准确性指标、一致性指标、时效性指标和/或可访问性指标;
[0117]
第二确定单元302,用于基于所述数据质量评价指标确定指标约束规则;
[0118]
构建单元303,用于根据所述数据质量评价指标及所述指标约束规则构建数据质量评估算法模型;
[0119]
第一获取单元304,用于获取待评估的政务领域的目标数据集,并确定所述目标数据集对应的目标数据质量评价指标及目标指标约束规则,所述政务领域的目标数据集为目标职能部门在办理目标业务及进行目标决策时产生的数据;
[0120]
第三确定单元305,用于确定所述目标指标约束规则的目标权重值;
[0121]
第二获取单元306,用于将所述目标指标约束规则、所述目标权重值及所述目标数据集输入所述数据质量评估算法模型,获取所述目标数据集的数据质量评估结果。
[0122]
本实施例系统中,各单元所执行的功能与前述图1所示方法实施例中的步骤对应,具体此处不再赘述。
[0123]
下面对本技术提供的一种应用于政务领域的数据质量评估装置进行详细说明,请参阅图4,图4为本技术提供的一种应用于政务领域的数据质量评估装置另一个实施例,该数据质量评估装置包括:
[0124]
第一确定单元401,用于根据政务领域的业务场景确定数据质量评价指标,所述数据质量评价指标包括:规范性指标、完整性指标、准确性指标、一致性指标、时效性指标和/或可访问性指标;
[0125]
第二确定单元402,用于基于所述数据质量评价指标确定指标约束规则;
[0126]
构建单元403,用于根据所述数据质量评价指标及所述指标约束规则构建数据质量评估算法模型;
[0127]
第一获取单元404,用于获取待评估的政务领域的目标数据集,并确定所述目标数据集对应的目标数据质量评价指标及目标指标约束规则,所述政务领域的目标数据集为目标职能部门在办理目标业务及进行目标决策时产生的数据;
[0128]
第三确定单元405,用于确定所述目标指标约束规则的目标权重值;
[0129]
第二获取单元406,用于将所述目标指标约束规则、所述目标权重值及所述目标数据集输入所述数据质量评估算法模型,获取所述目标数据集的数据质量评估结果。
[0130]
可选地,所述第二获取单元406具体用于:
[0131]
将所述目标指标约束规则及所述目标权重值输入所述数据质量评估算法模型,通过数量质量绝对量化值公式获取所述目标数据集的数据质量绝对量化值;
[0132]
所述数量质量绝对量化值公式为:
[0133][0134][0135]
其中,wi为目标指标约束规则的目标权重值,ri为目标指标约束规则;
[0136]
通过数量质量相对量化值公式获取所述目标数据集的数据质量相对量化值;
[0137]
所述数据质量相对量化值公式为:
[0138][0139]
其中,wi为目标指标约束规则的目标权重值,ei为目标指标约束规则的期望值;
[0140]
根据所述数据质量绝对量化值及所述数据质量相对量化值确定所述目标数据集的数据质量评估结果。
[0141]
可选地,所述数据质量评估装置还包括:
[0142]
预处理单元407,用于对所述目标数据集进行预处理;
[0143]
所述第二获取单元406具体用于:
[0144]
将所述目标指标约束规则、所述目标权重值及预处理后的目标数据集输入数据质量评估算法模型,获取所述目标数据集的数据质量评估结果。
[0145]
可选地,所述预处理单元406具体用于:
[0146]
根据所述目标数据集中的目标数据的数据特征对所述目标数据集进行分层,获取至少两层目标数据集;
[0147]
根据抽样估算公式确定每一层待抽样的目标数据的目标数量,所述抽样估算公式为:
[0148]
z=x2q(1-q)/σ2;
[0149]
其中,z为目标数量、q为预设比例、x为标准正态分布的统计量、σ为预设精度或预设误差;
[0150]
对所述至少两层目标数据集分别进行随机抽样,抽取目标数量的目标数据,并生成预处理后的目标数据集。
[0151]
可选地,所述数据质量评估模型还包括:
[0152]
判断单元408,用于判断所述数据质量评估结果是否符合正态分布;
[0153]
调整单元409,用于若否,则根据所述数据质量评估结果调整所述目标权重值,并将所述目标约束规则、调整后的目标权重值及所述目标数据输入所述目标质量评估算法模型,重新获取所述目标数据集的数据质量评估结果,直至所述数据质量评估结果符合正态分布。
[0154]
本实施例系统中,各单元所执行的功能与前述图2所示方法实施例中的步骤对应,具体此处不再赘述。
[0155]
本技术还提供了一种应用于政务领域的数据质量评估装置,请参阅图5,图5为本技术提供的一种应用于政务领域的数据质量评估装置一个实施例,该数据质量评估装置包
括:
[0156]
处理器501、存储器502、输入输出单元503、总线504;
[0157]
处理器501与存储器502、输入输出单元503以及总线504相连;
[0158]
存储器502保存有程序,处理器501调用程序以执行如上任一一种应用于政务领域的数据质量评估方法。
[0159]
本技术还涉及一种计算机可读存储介质,计算机可读存储介质上保存有程序,当程序在计算机上运行时,使得计算机执行如上任一一种应用于政务领域的数据质量评估方法。
[0160]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0161]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0162]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0163]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0164]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1