基于大数据的一种手册数据校验方法与流程

文档序号:18940860发布日期:2019-10-23 01:08阅读:571来源:国知局
基于大数据的一种手册数据校验方法与流程

本发明涉及数据校验领域,具体涉及基于大数据的一种手册数据校验方法。



背景技术:

在海关检验过程中,企业需要将自身的电子账册提供给海关部门,在电子账册数据上传的过程中,会有各种各样的影响,有的影响会导致数据出现差错。因此,需要对上传的数据进行校验和比对,然而传统的数据比对方法虽然比对逻辑比较简单,但是比对、运行速度比较慢,比对效率不高,具体地措施在于,在对比数据中提取一条比对数据,然后将对比数据分别逐一的与被对比数据比对并逐一反馈比对结果,可想而知的是,这种比对方法的运算量极为庞大,比对运算效率低。



技术实现要素:

解决的技术问题

针对现有技术中的问题,本发明提出基于大数据的一种手册数据校验方法。

技术方案

本发明通过以下技术方案予以实现:

基于大数据的一种手册数据校验方法,包括步骤:s1:获取手册数据并定义为第一数据集,获取手册的录入数据,定义录入数据为第二数据集,第一数据集与第二数据集中数据的顺序位置一一对应相同;

s2:第一数据集中的数据按照固定的长度拆分为多个第一数据子集,第二数据集中的数据按照固定的长度拆分为多个第二数据子集;

s3:在第一数据子集与第二数据子集中分别进行查询,得到响应搜索命令获得的第一数据反馈子集以及第二数据反馈子集;

s4:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则顺序对下一第一数据反馈子集、第二数据反馈子集进行查询;

s5:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量不相等,则通过数据提取模块提取该第一数据子集与第二数据子集,再通过数据对比模块对该第一数据子集与第二数据子集中的数据进行比对。

进一步地,多个第一数据子集的数据顺序拼接排列后与第一数据集中的数据排列顺序相同。

进一步地,多个第二数据子集的数据顺序拼接排列后与第二数据集中的数据排列顺序相同。

进一步地,在s5中,第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则通过数据对比模块顺序对第一数据子集与第二数据子集中的数据进行比对。

进一步地,在s5中,数据对比模块将第一数据子集与第二数据子集中对应不一致的数据进行标记。

进一步地,多个第一数据子集与第二数据子集中对应不一致的数据采用数据提取模块统一提取并汇成列表显示。

有益效果

采用本发明提供的技术方案,与已知的公有技术相比,具有如下有益效果:

本发明提出了基于大数据的一种手册数据校验方法,能够将手册数据以及录入后的数据分别拆分成若干个第一数据子集与第二数据子集,并在第一数据子集、第二数据子集中分别进行查询,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据相等时,说明该第一数据子集、第二数据子集中出现问题的可能性较小,因此顺序对下一第一数据子集、第二数据子集进行查询,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据不等时,优先对该部分的第一数据子集、第二数据子集比对,获取目标数据不等的原因。本发明采用拆分与查询的方式,能够快速对手册录入前后的数据不对等的区域进行定位,然后再对不对等的原因进一步查询,能够快速发现数据丢失的现象及定位到具体的区域,校验效率高,检测速度快。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的整体框架图;

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面结合实施例对本发明作进一步的描述。

实施例1,结合图1,基于大数据的一种手册数据校验方法,包括步骤:s1:获取手册数据并定义为第一数据集,获取手册的录入数据,定义录入数据为第二数据集,第一数据集与第二数据集中数据的顺序位置一一对应相同;

s2:第一数据集中的数据按照固定的长度拆分为多个第一数据子集,第二数据集中的数据按照固定的长度拆分为多个第二数据子集;

s3:在第一数据子集与第二数据子集中分别进行查询,得到响应搜索命令获得的第一数据反馈子集以及第二数据反馈子集;

s4:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则顺序对下一第一数据反馈子集、第二数据反馈子集进行查询;

s5:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量不相等,则通过数据提取模块提取该第一数据子集与第二数据子集,再通过数据对比模块对该第一数据子集与第二数据子集中的数据进行比对。

本发明提出了基于大数据的一种手册数据校验方法,能够将手册数据以及录入后的数据分别拆分成若干个第一数据子集与第二数据子集,并在第一数据子集、第二数据子集中分别进行查询,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据相等时,说明该第一数据子集、第二数据子集中出现问题的可能性较小,因此顺序对下一第一数据子集、第二数据子集进行查询,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据不等时,优先对该部分的第一数据子集、第二数据子集比对,获取目标数据不等的原因。本发明采用拆分与查询的方式,能够快速对手册录入前后的数据不对等的区域进行定位,然后再对不对等的原因进一步查询,能够快速发现数据丢失的现象及定位到具体的区域,校验效率高,检测速度快。

进一步地,多个第一数据子集的数据顺序拼接排列后与第一数据集中的数据排列顺序相同。

进一步地,多个第二数据子集的数据顺序拼接排列后与第二数据集中的数据排列顺序相同。

进一步地,在s5中,第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则通过数据对比模块顺序对第一数据子集与第二数据子集中的数据进行比对。

进一步地,在s5中,数据对比模块将第一数据子集与第二数据子集中对应不一致的数据进行标记。多个第一数据子集与第二数据子集中对应不一致的数据采用数据提取模块统一提取并汇成列表显示,能够使手册数据录入前后的数据差异一目了然地显示。

在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1