一种数据比对方法和设备与流程

文档序号:12674334阅读:215来源:国知局
一种数据比对方法和设备与流程
本发明涉及数据处理
技术领域
,尤其涉及一种数据比对方法和设备。
背景技术
:税务数据管理和分析过程中会涉及大量的税务数据表,不同税务数据表之间可能会有不同关联关系,各个税务数据表用于存储原始税务数据。目前,为了便于税务数据的管理和分析,利用某些数据加工工具对原始税务数据进行抽取、归类、合并、去除垃圾数据等数据加工操作,得到加工后税务数据,从而根据加工后税务数据对原始税务数据进行管理和分析。然而,目前的数据加工工具中的加工逻辑复杂,不仅包括数据加工逻辑,还包括税务数据表之间的关联关系逻辑,而在对原始税务数据进行数据加工过程中,由于涉及税务数据表之间的关联关系逻辑的实施,可能会导致得到的加工后税务数据为非预期税务数据(错误数据)的问题。因此,需要对加工后税务数据进行比对测试,这样可对错误数据进行纠正,以保证加工后税务数据的正确性。其中,不同的原始税务数据表对应不同的加工后税务数据表,原始税务数据表中存储原始税务数据,加工后税务数据表中存储加工后数据。目前,常用的对加工后税务数据进行比对测试的方法为:针对每个原始税务数据表,仅利用数据加工逻辑对该原始税务数据表中的原始税务数据进行数据加工,得到该原始税务数据表对应的预期税务数据表,预期税务数据表中存储的数据均为预期税务数据(正确数据);人工查找该原始税务数据表对应的加工后税务数据表,并人工比对加工后税务数据表与预期税务数据表中的数据是否一致。然而,这种对加工后税务数据进行比对的方式,加工后税务数据表和预期税务数据表中数据的比对需要人工比对,这就会导致数据比对效率低、比对准确度低的问题。技术实现要素:本发明实施例提供一种数据比对方法和设备,以解决现有数据比对方式中加工后税务数据表和预期税务数据表中数据的比对需要人工比对,所导致的数据比对效率低、比对准确度低的问题。本发明实施例提供的一种数据比对方法,包括:获取预期税务数据以及加工后税务数据,所述预期税务数据和加工后税务数据对应同一原始税务数据表中的原始数据;根据所述预期税务数据中的主数据项,对所述预期税务数据与所述加工后税务数据进行比对,其中,主数据项中存储具有同一属性的至少一个主数据。可选地,所述方法中,对所述预期税务数据与所述加工后税务数据进行比对,具体包括:对按照预设筛选规则筛选后的预期税务数据与按照所述预设筛选规则筛选后的加工后税务数据进行比对。本发明实施例可以选择性的对税务数据进行比对。可选地,所述方法中,所述预设筛选规则包括以下一项或多项:预设税务机关、预设行业、预设纳税人、预设登记注册类型、预设税种、税务数据产生时间段。可选地,所述方法中,根据所述预期税务数据中的主数据项,对所述预期税务数据与所述加工后税务数据进行比对,具体包括:判断所述加工后税务数据的数据项中是否包含所述预期税务数据中的主数据项;若是,确定所述主数据项为所述加工后税务数据的主数据项;针对每条预期税务数据,在所述加工后税务数据的主数据项中查找该条预期税务数据中的主数据;若查找到,对该条预期税务数据的主数据对应的一条加工后税务数据与该条预期税务数据进行比对。本发明实施例,以预期税务数据和加工后税务数据中的主数据项为依据,对预期税务数据和加工后税务数据中的每条数据进行比对,使得税务数据的比对更加细致,并且相对于人工比对来说,提高了税务数据比对的速度和效率可选地,所述方法中,对该条预期税务数据的主数据对应的一条加工后税务数据与该条预期税务数据进行比对,具体包括:针对该条预期税务数据中的每个预期税务数据,比较该预期税务数据与加工后税务数据中该预期税务数据所属数据项中的加工后税务数据是否一致。可选地,所述方法,还包括:若未查找到,确定该条预期税务数据在所述加工后税务数据中不存在。可选地,所述方法,还包括:将所述每条预期税务数据、与每条预期税务数据对应的加工后税务数据、整条税务数据的比对结果以及每个预期税务数据与对应加工后税务数据的比对结果对应存储到预先建立的结果存储表中。本发明实施例还提供一种数据比对设备,包括:获取模块,用于获取预期税务数据以及加工后税务数据,所述预期税务数据和加工后税务数据对应同一原始税务数据表中的原始数据;比对模块,用于根据所述预期税务数据中的主数据项,对所述预期税务数据与所述加工后税务数据进行比对,其中,主数据项中存储具有同一属性的至少一个主数据。可选地,所述比对模块,具体用于:对按照预设筛选规则筛选后的预期税务数据与按照所述预设筛选规则筛选后的加工后税务数据进行比对。可选地,所述预设筛选规则包括以下一项或多项:预设税务机关、预设行业、预设纳税人、预设登记注册类型、预设税种、税务数据产生时间段。可选地,所述比对模块,包括:判断单元,用于判断所述加工后税务数据的数据项中是否包含所述预期税务数据中的主数据项;第一确定单元,用于在所述判断单元判断是的情况下,确定所述主数据项为所述加工后税务数据的主数据项;查找单元,用于针对每条预期税务数据,在所述加工后税务数据的主数据项中查找该条预期税务数据中的主数据;比对单元,用于在所述查找单元查找到的情况下,对该条预期税务数据的主数据对应的一条加工后税务数据与该条预期税务数据进行比对。可选地,所述比对单元,具体用于:针对该条预期税务数据中的每个预期税务数据,比较该预期税务数据与加工后税务数据中该预期税务数据所属数据项中的加工后税务数据是否一致。可选地,所述比对模块,还包括:第二确定单元,用于在所述查找单元未查找到的情况下,确定该条预期税务数据在所述加工后税务数据中不存在。可选地,所述数据比对设备,还包括:存储模块,用于将所述每条预期税务数据、与每条预期税务数据对应的加工后税务数据、整条税务数据的比对结果以及每个预期税务数据与对应加工后税务数据的比对结果对应存储到预先建立的结果存储表中。利用本发明实施例提供的数据比对方法和设备,具有以下有益效果:在预期税务数据中设置主数据项,自动化根据主数据项比对加工后税务数据中的数据是否与预期税务数据一致,具体的预期税务数据和加工后税务数据的比对过程无需人工参与,实现了自动化税务数据比对,相对于人工比对的方式,本发明实施例的税务数据比对效率较高、税务数据比对准确度相对人工比对也有一定提升。附图说明图1本发明实施例提供的数据比对方法流程图示意图;图2本发明实施例提供的数据比对方法的具体实施过程流程图示意图;图3本发明实施例提供数据比对设备结构示意图。具体实施方式下面结合附图和实施例对本发明提供的数据比对方法和设备进行更详细地说明。本发明实施例提供一种数据比对方法,可应用于数据比对设备,如图1所示,包括:步骤101,获取预期税务数据以及加工后税务数据,所述预期税务数据和加工后税务数据对应同一原始税务数据表中的原始数据。具体的,关于预期税务数据和加工后税务数据的说明可参见
背景技术
部分,这里不做赘述。步骤102,根据所述预期税务数据中的主数据项,对所述预期税务数据与所述加工后税务数据进行比对,其中,主数据项中存储具有同一属性的至少一个主数据。具体的,加工后税务数据和预期税务数据中均包含数据项,每个数据项中存储具有同一属性的数据,纳税人数据项中存储各个纳税人的姓名。加工后税务数据的数据项中的数据为加工后税务数据,预期税务数据的数据项中的数据为预期税务数据,通过加工后税务数据的数据项中任一加工后税务数据可唯一确定一条加工后税务数据,同理,通过预期税务数据的数据项中任一预期税务数据可唯一确定一条预期税务数据。需要说明的是,一条加工后税务数据或者一条预期税务数据中的各个数据的属性不同。本发明实施例在预期税务数据中预先设置主数据项,主数据项中存储具有同一属性的至少一个主数据,该主数据为主预期数据,该主数据项可作为与加工后税务数据进行关联的关联标识,从而根据该主数据项查找加工后税务数据中与该主数据项对应的加工后税务数据,并将查找到的加工后税务数据与预期税务数据进行比对。具体实施时,可查找加工后税务数据中是否包含预期税务数据中的主数据项中的所有主数据,如果是,则确定预期税务数据与加工后税务数据一致,否则,确定二者不一致,当然也可采用其它方式根据预期税务数据中的主数据项,对预期税务数据与加工后税务数据进行比对,这里不做限定。本发明实施例,在预期税务数据中设置主数据项,自动化根据主数据项比对加工后税务数据中的数据是否与预期税务数据一致,具体的预期税务数据和加工后税务数据的比对过程无需人工参与,实现了自动化税务数据比对,相对于人工比对的方式,本发明实施例的税务数据比对效率较高、税务数据比对准确度相对人工比对也有一定提升。具体实施时,可能只需要比对预期税务数据和加工后税务数据中的一部分数据,此时,优选地,可按照预设的筛选规则,对预期税务数据和加工后税务数据进行筛选,对按照预设筛选规则筛选后的预期税务数据与按照所述预设筛选规则筛选后的加工后税务数据进行比对。具体的预设筛选规则可以包括以下一项或者多项:预设税务机关、预设行业、预设纳税人、预设登记注册类型、预设税种、税务数据产生时间段。比如,可对筛选出的预设税务机关的预期税务数据和预设税务机关的加工后税务数据进行比对,也可对筛选出的预设行业的预期税务数据和预设行业的加工后税务数据进行比对,还可对对筛选出的预设行业的预设纳税人的预期税务数据和预设行业的预设纳税人的加工后税务数据进行比对。在实际应用中,可将图1提供的实施例编辑成一个自动化测试用例,用户可在该测试用例中输入需要比对的预期税务数据的标识、加工后税务数据的标识,以及预期税务数据中的主数据项,用户选择开始进行数据比对后,该测试用例可自动根据标识获取对应的预期税务数据和加工后税务数据进行比对,此外,用户还可在该测试用例中预先设置筛选条件编辑项输入筛选条件,从而仅对筛选出的预期税务数据和加工后税务数据进行比对。优选地,可按照图2提供的内容,根据所述预期税务数据中的主数据项,对所述预期税务数据与所述加工后税务数据进行比对:步骤201,判断所述加工后税务数据的数据项中是否包含所述预期税务数据中的主数据项,如果是,执行步骤202,否则,执行步骤206。具体的,假设预期税务数据中的主数据项为纳税人,则从加工后税务数据的数据项中查找是否包含纳税人这一数据项。步骤202,确定所述主数据项为所述加工后税务数据的主数据项。本步骤中,将预期税务数据中的主数据项也确定为加工后税务数据中的主数据项。步骤203,针对每条预期税务数据,判断该条预期税务数据中的主数据是否在加工后税务数据的主数据项中存在,如果是,执行步骤204,否则,执行步骤205。具体的,针对每条预期税务数据,在所述加工后税务数据的主数据项中查找该条预期税务数据中的主数据,如果查找到,执行步骤204,如果未查找到,执行步骤205。举例说明,预期税务数据如表一所示,其中数据项包括纳税人、纳税金额、缴税时间,一个数据项对应一种属性,其中纳税人为主数据项。其中,“张三”、“李四”、“王五”为主数据,通过任一主数据可确定一条预期税务数据,比如,“张三”对应的一条预期税务数据为“张三、1000、2010年3月4日”。表一纳税人纳税金额缴税时间张三10002010.3.4李四11002010.3.5王五15002010.3.6加工后税务数据如表二所示,其中数据项包括纳税人、纳税金额、缴税时间,一个数据项对应一个属性,经过判断可知,预期税务数据中纳税人这个数据项在加工后税务数据中存在,因此,确定纳税人这个数据项也为加工后数据的主数据项。其中,“李四”、“王五”为主数据,通过任一主数据可确定一条加工后税务数据,比如,“李四”对应的一条预期税务数据为“李四、1200、2010.3.5”。表二纳税人纳税金额缴税时间10002010.3.4李四12002010.3.5王五15002010.3.6则步骤203中,针对表一中的每条预期税务数据,判断该条预期税务数据中的主数据是否在加工后税务数据的主数据项中存在,根据表一和表二可知,查找的结果为预期税务数据中的主数据“张三”在加工后税务数据中不存在,此时,执行步骤205。预期税务数据中的主数据“李四”和“王五”在加工后税务数据中存在,此时执行步骤204。需要说明的是,理想的比对结果是预期税务数据与加工后税务数据完全一致。步骤204,对该条预期税务数据的主数据对应的一条加工后税务数据与该条预期税务数据进行比对。具体的,该条预期税务数据中的主数据在加工后税务数据的主数据项中存在时,针对该条预期税务数据中的每个预期税务数据,比较该预期税务数据与加工后税务数据中该预期税务数据所属数据项中的加工后税务数据是否一致,即对该主数据对应的一条加工后税务数据中加工后税务数据与该主数据对应的一条预期税务数据中的预期税务数据进行比对,从而确定这两条税务数据中的各个数据是否一致。优选地,对该主数据对应的一条加工后税务数据中的其它加工后税务数据与该主数据对应的一条预期税务数据中的其它预期税务数据进行比对,其中,其它加工后税务数据为不包括主数据的该条加工后税务数据,其它预期税务数据为不包括主数据的该条预期税务数据。继续沿用上例,假设该条预期税务数据为表一中的李四对应的一条预期税务数据即“李四、1100、2010.3.5”,根据该条预期税务数据中的主数据李四可从表二中查找到李四对应的一条加工后税务数据“李四、1200、2010.3.5”,此时,依次对两条税务数据中具有同一属性的税务数据进行比对,即分别比对预期税务数据中的纳税人与加工后税务数据中的纳税人是否一致,比对预期税务数据中的纳税金额与加工后税务数据中的纳税金额是否一致,比对预期税务数据中的纳税时间与加工后税务数据中的纳税时间是否一致,比对完成后可得到的比对结果为纳税人一致,纳税金额不一致,纳税时间一致,此时说明加工后税务数据中的纳税人“李四”的纳税金额这个加工后税务数据错误。步骤205,确定该条预期税务数据在所述加工后税务数据中不存在。步骤206,确定加工后税务数据与所述预期税务数据完全不一致。本发明实施例,以预期税务数据和加工后税务数据中的主数据项为依据,对预期税务数据和加工后税务数据中的每条数据进行比对,使得税务数据的比对更加细致,并且相对于人工比对来说,提高了税务数据比对的速度和效率。优选地,将所述每条预期税务数据、与每条预期税务数据对应的加工后税务数据、整条税务数据的比对结果以及每个预期税务数据与对应加工后税务数据的比对结果对应存储到预先建立的结果存储表中。具体实施时,预先建立结果存储表,用于存储预期税务数据与加工后税务数据的比对结果,具体的针对每条预期税务数据以及与该条预期税务数据具有相同主数据的一条加工后税务数据,对应将这两条税务数据存储到结果存储表中,并在相应地将这两条税务数据整体的比对结果,以及这两条税务数据中每个税务数据的比对结果存储到结果存储表中,从而为用户提供一个比较直观的比对结果。继续沿用表一和表二对应的例子,利用本发明实施例提供的数据比对方法对表一中的预期税务数据和表二中的加工后税务数据进行比对后,对应的结果存储表可如表三所示,其中整条数据的比对结果包括X,Y,Z,X表示预期税务数据中存在加工后税务数据中不存在,Y表示税务数据不完全一致,Z表示税务数据完全一致,Y表示,主数据比对结果包括A,B,A表示预期税务数据中存在加工后数据中不存在,B表示预期税务数据和加工后数据中均存在,每个数据的比对结果包括1,2,1表示一致,2表示不一致,其中,预期税务数据位于加工后税务数据之前,比如,表三中每行第一个纳税人为预期税务数据,第二个纳税人为加工后税务数据,第二个纳税人之后为这两个纳税人的比对结果。表三当然,表三仅为结果存储表的一种展现形式的举例,本发明实施例中的结果存储表的展现形式还可以为其它形式,这里不做限定。此外,结果存储表中还可存储所有条预期税务数据与所有条加工后税务数据的一致的比例,从而能够直观的获取整体数据的比对结果。基于与上述实施例提供的数据比对方法同样的发明构思,本发明实施例还提供一种数据比对设备,如图3所示,包括:获取模块301,用于获取预期税务数据以及加工后税务数据,所述预期税务数据和加工后税务数据对应同一原始税务数据表中的原始数据;比对模块302,用于根据所述预期税务数据中的主数据项,对所述预期税务数据与所述加工后税务数据进行比对,其中,主数据项中存储具有同一属性的至少一个主数据。可选地,所述比对模块302,具体用于:对按照预设筛选规则筛选后的预期税务数据与按照所述预设筛选规则筛选后的加工后税务数据进行比对。可选地,所述预设筛选规则包括以下一项或多项:预设税务机关、预设行业、预设纳税人、预设登记注册类型、预设税种、税务数据产生时间段。可选地,所述比对模块302,包括:判断单元3021,用于判断所述加工后税务数据的数据项中是否包含所述预期税务数据中的主数据项;第一确定单元3022,用于在所述判断单元判断是的情况下,确定所述主数据项为所述加工后税务数据的主数据项;查找单元3023,用于针对每条预期税务数据,在所述加工后税务数据的主数据项中查找该条预期税务数据中的主数据;比对单元3024,用于在所述查找单元查找到的情况下,对该条预期税务数据的主数据对应的一条加工后税务数据与该条预期税务数据进行比对。可选地,所述比对单元3024,具体用于:针对该条预期税务数据中的每个预期税务数据,比较该预期税务数据与加工后税务数据中该预期税务数据所属数据项中的加工后税务数据是否一致。可选地,所述比对模块302,还包括:第二确定单元3025,用于在所述查找单元未查找到的情况下,确定该条预期税务数据在所述加工后税务数据中不存在。可选地,所述数据比对设备,还包括:存储模块303,用于将所述每条预期税务数据、与每条预期税务数据对应的加工后税务数据、整条税务数据的比对结果以及每个预期税务数据与对应加工后税务数据的比对结果对应存储到预先建立的结果存储表中。利用本发明实施例提供的数据比对方法和设备,具有以下有益效果:在预期税务数据中设置主数据项,自动化根据主数据项比对加工后税务数据中的数据是否与预期税务数据一致,具体的预期税务数据和加工后税务数据的比对过程无需人工参与,实现了自动化税务数据比对,相对于人工比对的方式,本发明实施例的税务数据比对效率较高、税务数据比对准确度相对人工比对也有一定提升。本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全应用软件实施例、或结合应用软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1