数据比较系统的制作方法

文档序号:6606731阅读:148来源:国知局
专利名称:数据比较系统的制作方法
技术领域
本说明书总体上涉及用于提供数据比较的系统、方法和工具(通称为系统),并且 更具体但不排他地,涉及用于针对遗留(legacy)系统产生的数据验证新系统产生的数据 的可重用系统。
背景技术
遗留计算机系统正在不断地被更新、更有效的计算机系统替代,以期降低成本和 提高效率。在每个新系统实现之后,必须对新系统产生的数据与遗留系统产生的数据进行 比较。在新系统上线之前以及遗留系统下线之前,必须对两个系统之间的任何差异进行纠 正。对两个系统所产生的数据的比较经常可能是人工执行的。可以将数据载入电子表格, 并且可以人工比较电子表格中的值。由于数据量和资源限制,仅仅选择数据的子集以便使 用该方法来进行比较。人工比较可能需要大量的工时,并且受制于人类错误,并因此可能导 致部署风险。由于遗留系统经常是针对特定实现而定制的,因此自动的数据比较系统无法 存在,或者无法能够有效地比较由两个系统产生的数据。

发明内容
一种数据比较系统,包括存储器、接口以及处理器。存储器可以连接至处理器和接 口,并且可以存储比较数据结构,该比较数据结构存储数据项配对。每个数据项配对可以包 括遗留数据集的遗留数据项以及新数据集的对应新数据项。数据项配对可以具有以下数据 类型字段数据类型、表数据类型、扁平(flat)结构数据类型或者深度(deep)结构数据类 型。表数据类型、深度结构数据类型和扁平结构数据类型每个都可以包括一个或多个记录。 存储器还可以存储与每个数据项配对相关联的容许偏差。该接口可以可操作地连接至存储 器,并且可操作与用户的设备进行通信。处理器可以经由接口从用户的设备接收比较数据 结构以及相关联的容许偏差。如果每个数据项配对的数据类型都是字段数据类型,则处理 器可以调用比较数据子例程,以按照每个相关联的容许偏差来比较每个数据项配对的每个 遗留数据项和每个新数据项。否则,处理器可以针对每个数据项配对的每个记录递归地调 用比较数据子例程,直到每个数据项配对的数据类型都是字段数据类型。处理器继而可以 按照相关联的容许偏差来比较数据项配对的遗留数据项和新数据项。对于本领域技术人员来说,在研究下面的附图和详细描述之后,其他系统、方法、 特征及其相应的优势将是易见的或将变得易见。意在将所有此类附加的系统、方法、特征和 优势包括在本描述中,包括在权利要求的范围中,并且受到所附权利要求的保护。将结合描 述来在下文讨论进一步的方面和优势。


参考下面的附图和描述可以更好地理解系统和/或方法。参照下文附图描述了非 限制性和非穷举的描述。附图中的组成部分未必是按照比例绘制的,而是将强调的重点放 在说明本发明的原理上。在附图中,除非另行指出,否则相似的标号可以贯穿不同的视图表 示相似的部分。图1是数据比较系统的总体概观的框图。图2是实现图1的系统或者其他数据比较系统的网络环境的框图。图3是示出提供图1的系统或者其他数据比较系统中的比较报告的步骤的流程 图。图4是示出在图1的系统或者其他数据比较系统中比较遗留数据集和新数据集的 步骤的流程图。图5是示出在图1的系统或者其他数据比较系统中确定比较是否在容许偏差之内 的步骤的流程图。图6是在图1的系统或者其他数据比较系统中用于创建比较数据结构的用户接口 的截屏。图7是在图1的系统或者其他数据比较系统中用于标识针对数据项配对单元的容 许偏差的用户接口的截屏。图8是用于配置图1的数据比较系统或者其他数据比较系统的用户接口的截屏。图9是图1的系统或者其他数据比较系统中的记录级别报告的截屏。图10是图1的系统或者其他数据比较系统中的字段级别报告的截屏。图11是图1的系统或者其他数据比较系统中的字段级别容许偏差外报告的截屏。图12是图1的系统或者其他数据比较系统中的记录级别图表的截屏。图13是图1的系统或者其他数据比较系统中的字段级别图表的截屏。图14示出了可以在图1、图2中的系统或者其他数据比较系统中使用的通用计算 机系统。
具体实施例方式一种系统、方法和工具(通称为系统),可以涉及提供数据提交系统,并且更具体 但非排他地,涉及用于针对遗留系统产生的数据来验证由新系统产生的数据的可复用系 统。在此描述的原理可以通过不同的形式来体现。该数据比较系统可以用来验证由两个系统(诸如,遗留系统和遗留替换系统)产 生的数据。系统的可重配性允许组织(诸如,提供咨询服务的组织)跨多个客户端以及每个 客户端中的多个数据验证来复用该系统。该系统允许用户在字段级别和记录级别二者处配 置比较的容许偏差水平,由此允许针对每个个体实现来定制容许偏差。该系统通过使用递 归子例程调用来比较复杂数据结构,提供了比较复杂数据结构的有效方式。该系统生成包 含字段级别和记录级别统计的报告,这些统计为用户提供了数据比较的清晰、简明的概要。图1提供了数据比较系统100的总体概观。然而,并非所有绘出的部件都是需要 的,某些实现可以包括附加部件。在不脱离在此描述的权利要求的精神和范围的情况下,可以对部件的布置和类型做出改变。可以提供附加的、不同的或者更少的部件。系统100可以包括一个或多个用户120A-N、服务提供方140、遗留系统150以及新 系统160。用户120A-N可以是管理员、咨询师或者能够配置系统100来对新系统160所产 生的数据与遗留系统150所产生的数据进行比较的其他人。遗留系统150可以是组织所使 用的已有系统,例如计费系统。新系统160可以是被实现用以替代遗留系统150的系统。修 饰词“遗留”和“新”可以用于区分系统150、160这一目的。修饰词“第一”和“第二”也可 以用来区分系统150、160。在一个示例中,新系统160可以是由SAP AG 提供的公用事业 行业特定解决方案(IS-U)。遗留系统150可以是组织先前用来至少执行由新系统160执行 的功能的子集的任何系统。备选地或附加地,遗留系统150可以是组织先前用来访问新系 统160也要访问的数据的任何系统。服务提供方140可以例如通过网络可访问的应用来为用户120A-N提供数据比较 系统。数据比较系统100可以允许用户120A-N有效地比较由遗留系统150产生的数据和 由新系统160产生的数据。数据比较系统100可以包括两个模块变量创建模块和数据比 较模块。数据比较系统100的变量创建模块可以用来配置与比较操作有关的选项,诸如用 于每个字段和/或记录的容许偏差、要包括在比较操作中的字段和/或记录、比较操作的报 告偏好以及与比较操作有关的任何其他选项。容许偏差水平可以标识来自新系统160应当 如何紧密地匹配来自遗留系统150的数据,以便在容许偏差内。变量创建模块可以输出变 量数据结构,其存储变量创建模块中选择的选项。变量创建模块将在下文的图6-图8中详 述。数据比较系统100的数据比较模块可以比较由两个系统产生的数据,并且输出记录级 别和字段级别比较统计。该统计可以按照变量数据结构中标识的偏好来分组。在操作中,用户A 120A可以标识新系统160中的每个字段与遗留系统150中的每 个字段之间的映射。系统150、160之间的映射可以存储在比较数据结构中。比较数据结构 可以是扁平数据结构、树数据结构或者复杂的树数据结构。一旦标识了系统150、160之间 的映射,系统100便可以按照所标识的映射将来自系统150、160每一个的数据项配对加载 到比较数据结构中。从系统150、160加载的数据项的配对可以是字段、表、扁平数据结构、 深度数据结构或者复杂数据结构。继而可以将比较数据结构输入到变量模块中,以标识用 于比较操作的选项,诸如待比较的字段和用于所比较的每个字段的容许偏差。例如,扁平数据结构可以是仅包含固定长度的基本数据类型的数据结构(没有内 部表、引用类型或者字符串)。引用类型可以表示描述引用变量(也即,包含引用的数据对 象)的数据类型。内部表可以包含全都具有相同数据类型的一系列行。扁平数据结构可以 是嵌套数据结构,也即,包含一个或多个其他结构作为组成部分的数据结构,只要指定的类 型均未被包含在任何嵌套级别中即可。深度数据结构可以是包含任何嵌套级别的至少一个 深度组成部分(诸如,字符串、内部表、封装组成部分或者数据或对象引用)的任何结构。在 扁平结构的情况下,结构的数据内容可以在结构本身的存储器中,而深度结构可以包括指 向最深组成部分的位置处数据的指针。由于在深度结构的情况下字段内容没有与字段描述 一起存储,因此指派、偏移量和长度规定以及其他操作可以与扁平结构不同地加以处理。复 杂数据结构可以是具有结构作为组成部分的结构(嵌套结构,扁平的或深度的)、包含内部 表作为组成部分的结构(深度结构)或者包括一系列固定长度的基本数据类型的结构(非 嵌套扁平结构)。
一旦用户A 120A使用变量模块配置了比较操作,便可以向比较模块中输入由变 量模块输出的变量数据结构以及比较数据结构,以比较由系统150、160产生的数据。比较 模块可以使用比较子例程来比较存储在比较数据结构中的、来自每个系统150和160的数 据项。如果数据项是字段,则比较子例程可以比较数据项,并且确定数据项是否严格匹配, 是在标识的容许偏差之内还是标识的容许偏差之外。确定两个数据项是否在彼此的已标 识容许偏差之内的步骤将在下文的图5中详述。如果数据项是表、扁平数据结构或者复杂 数据结构,则可以对表、扁平数据结构或者复杂数据结构中的每个记录递归地调用比较子 例程。子例程可以被继续递归地调用,直到所比较的数据项是字段,此时子例程将比较数据项。递归地调用比较子例程的步骤将在下文的图4中详述。在比较子例程已经针对比较数据结构中存储的所有数据项递归循环之后,数据比 较模块可以生成报告,其包含比较的字段级别和记录级别统计。报告可以指示新系统160 所产生的数据与遗留系统150所产生的数据的匹配的紧密程度。服务提供方140继而可以 向用户A 120A提供该报告。示例性报告在下文图9-图13中详述。图2提供了实现图1的系统或者其他数据比较系统的网络环境200的简化视图。 然而,并非绘出的所有部件都是需要的,并且某些实施方式可以包括该图中未示出的附加 部件。在不脱离在此描述的权利要求的精神和范围的情况下,可以对部件的布置和类型做 出改变。可以提供附加的、不同的或者更少的部件。网络环境200可以包括一个或多个用户120A-N,服务提供方服务器240,服务提 供方数据存储245,遗留系统数据存储250,新系统数据存储260,网络230、250,以及一个或 多个web应用、单机应用、移动应用220A-N(其统称为客户端应用)。服务提供方服务器240 和第三方服务器250的某些或全部可以利用网络235彼此通信。网络230、235可以包括诸如因特网的广域网(WAN)、局域网(LAN)、校园区域网、城 域网或者可以允许数据通信的任何其他网络。网络230可以包括因特网,并且可以包括全 部或部分的网络235 ;网络235可以包括全部或部分的网络230。网络230、235可以划分为 子网。子网可以允许接入连接至系统200中的网络230、235的所有其他部件,或者子网可以 限制连接至网络230、235的部件之间的接入。网络235可以被认为是公共或者专用网络连 接,并且可以包括例如虚拟专用网络,或者在公共因特网上采用的加密或其他安全机制等。web应用、单机应用和移动应用220A-N可以按照支持数据传送的任何配置连接至 网络230。这可以包括到网络230的有线或无线数据连接。任何web应用、单机应用和移动 应用220A-N可以单独地称为客户端应用。web应用220A可以在支持web内容的任何平台 上运行,诸如web浏览器或计算机、移动电话、个人数字助理(PDA)、寻呼机、支持网络的电 视、数字摄录机(诸如TIVO )、汽车和/或支持数据通信的任何装置或平台。单机应用220B可以在可具有处理器、存储器、显示器、用户接口和通信接口的机 器上运行。处理器可以可操作地耦合至存储器、显示器和所述接口,并且可以根据单机应 用220B或者下层操作系统的请求来执行任务。存储器可以支持数据的存储。显示器可以 可操作地耦合至存储器和处理器,并且可以能够向用户B 120B显示信息。用户接口可以 可操作地耦合至存储器、处理器和显示器,并且可以能够与用户B 120B交互。通信接口可 以可操作地耦合至存储器和处理器,并且可以能够通过网络230、235与服务提供方服务器 240通信。单机应用220B可以通过支持通信协议的任何编程语言来编程。这些语言可以包括SAP ADVANCED BUSINESS APPLICATIONPROGRAMMING(ABAP), SUN JAVA ,C++,C#, ASP, SUNJAVASCRIPT ,异步 SUN JAVASCRIPT ,或者 ADOBE FLASHACTIONSCRIPT ,ADOBE FLEX ,以及其他。移动应用220N可以在可具有数据连接的任何移动设备上运行。数据连接可以是 蜂窝连接、无线数据连接、因特网连接、红外连接、蓝牙连接或者能够传输数据的任何其他 连接。例如,移动应用220N可以是在APPLE IPHONE 上运行的应用。服务提供方服务器240可以包括以下一个或多个应用服务器、移动应用服务器、 数据存储、数据库服务器以及中间件服务器。服务提供方服务器240可以存在于一个机器 上,或者可以按照一个或多个机器上的分布式配置运行。服务提供方服务器240和客户端应用220A-N可以是各种类型的一个或多个计算 设备,诸如图14中的计算设备。这种计算设备通常可以包括可配置用于执行计算并且可以 支持利用一个或多个有线和/或无线通信接口来发送和接收数据的任何设备。这种设备可 以配置用于按照多种网络协议中的任何协议来进行通信,这些协议包括但不限于传输控制 协议/网际协议(TCP/IP)协议族中的协议。例如,web应用220A可以采用超文本传输协 议(“HTTP”)从web服务器请求诸如网页之类的信息,web服务器可以是在服务提供方服 务器240上执行的过程。服务提供方服务器240中包括的数据库服务器、应用服务器、移动应用服务器 以及中间件应用可以存在多种配置。服务提供方数据存储245可以是服务提供方服务 器240的部分,并且可以是数据库服务器,诸如MICROSOFT SQL SERVER , ORACLE , IBMDB2 ,SQLITE 或者任何其他数据库软件(关系的或其他)。应用服务器可以是SAP NETffEAVER APPLICATION SERVER , SAPffEB APPLICATION SERVER , APACHE TOMCAT , MICR0S0FTIIS , ADOBE COLDFUSION 或者支持通信协议的任何其他应用服务器。遗 留系统数据存储250和新系统数据存储260可以是数据库服务器,诸如MICROSOFT SQL SERVER , ORACLE IBMDB2 ,SQLITE 或者任何其他数据库软件(关系的或其他)。网络230、235可以配置用于将一个计算设备耦合至另一计算设备,以允许设备之 间的数据通信。一般地,网络230、235可被允许采用任何形式的机器可读介质用于从一个 设备向另一设备传送信息。网络230、235的每一个可以包括无线网络、有线网络、局域网 (LAN)、广域网(WAN)、诸如通过通用串行总线(USB)端口的直接连接等中的一个或多个,并 且可以包括构成因特网的互连网络的集合。网络230、235可以包括可用来在计算设备之间 传递信息的任何通信方法。图3是示出在图1的系统或者其他数据比较系统中提供比较报告的步骤的流程 图。图3的步骤被描述为由服务提供方服务器240执行。然而,这些步骤可由服务提供方 服务器240的处理器执行,或者由服务提供方服务器240的任何其他硬件部件来执行。而 且,这些步骤可选由外部硬件部件来执行。在步骤310,服务提供方服务器240可以接收比较数据结构。比较数据结构可以包 括遗留数据存储250中的字段与新数据存储260中的字段之间的映射。每个映射或称数据 项配对可以包括来自遗留数据存储250的字段以及来自新数据存储260的对应字段。比较 数据结构可以是可扩展标记语言(XML)文档。比较数据结构可以由用户A 120A例如通过 使用XML文档编辑器来创建。服务提供方服务器240可以将比较数据结构存储在服务提供方数据存储245中。在步骤320,服务提供方服务器240可以从遗留数据存储250获取待比较的数据 项。服务提供方服务器240可以将来自遗留数据存储250的数据项存储在比较数据结构中。 在步骤330,服务提供方服务器240可以从新数据存储260获取待比较的数据项。服务提供 方服务器240可以将来自新数据存储260的数据项存储在比较数据结构中。在步骤340, 服务提供方服务器240可以例如从用户A 120A的联网设备接收针对每个映射的容许偏差。 例如,用户A 120A可以访问变量模块,以标识针对每个数据项配对的容许偏差。变量模块 可以输出存储容许偏差的变量数据结构,其可以向服务提供方服务器240提供。容许偏差可以指示当遗留数据存储250和新数据存储260中的数据项不是严格匹 配时,数据项之间可接受的变化程度。容许偏差可以针对每个数据类型而不同。例如,对于 日期,容许偏差可以指示两个日期之间可接受的天数差异。对于数字,容许偏差可以指示两 个数字之间可接受的百分比差异,和/或两个数字之间可接受的绝对差异。对于字符,容许 偏差可以指示比较是否应当是大小写敏感的和/或忽略空格。对于表,容许偏差可以指示 两个表之间可接受的记录数目差异。在步骤350,服务提供方服务器240可以对遗留系统150产生的数据和新系统160 产生的数据进行比较。服务提供方服务器240可以使用步骤340中接收的容许偏差来确定 每个数据项是否严格匹配、是否在容许偏差之内或者不在容许偏差之内。服务提供方服务 器240可以调用比较子例程对比较数据结构中的每个数据项配对进行比较。如果数据项是 字段,则比较子例程将执行比较。然而,如果数据项是表、扁平结构或者深度结构,则可以针 对表、扁平结构或者深度结构中的每个记录递归地调用比较子例程。比较子例程可以继续 被递归调用,直到数据项是字段。比较子例程的步骤在下文的图4中详述。在步骤360,服务提供方服务器240可以编制比较报告。报告可以包括字段级别和 记录级别统计,其指示每个字段和/或记录是否严格匹配,每个字段和/或记录是否在标识 的容许偏差之内,或者每个字段和/或记录是否在标识的容许偏差之外。示例性报告在下 文的图9-图13中示出和讨论。在步骤370,服务提供方服务器240诸如经由用户A 120A 的联网设备向用户A 120A提供报告。用户A 120A可以查看报告,以确定新系统160是否 产生准确的数据。图4是示出在图1的系统或者其他数据比较系统中比较遗留数据集与新数据集的 步骤的流程图。图4的步骤被描述为由服务提供方服务器240执行。然而,这些步骤可由 服务提供方服务器240的处理器执行,或者由服务提供方服务器240的任何其他硬件部件 来执行。备选地,这些步骤可由外部硬件部件来执行。在步骤405,服务提供方服务器240向比较数据结构填入来自遗留数据存储250的 数据项以及来自新数据存储260的数据项。在步骤410,服务提供方服务器240接收变量数 据结构,其存储有应当比较来自遗留数据存储250和新数据存储260的哪些字段的指示,以 及针对每个待比较字段的容许偏差水平。例如,用户A 120A可以使用变量模块来创建变量 数据结构。在步骤415,服务提供方服务器240可以从比较数据结构中选择待比较的第一数 据项配对。存储在比较数据结构中的数据项配对可以是不同的数据类型,诸如字段数据类 型、表数据类型、扁平结构数据类型或者深度结构数据类型。属于表数据类型、扁平结构数 据类型或者深度结构数据类型的数据项配对每一个都可以包括一个或多个记录。每个记录还可以包括字段、表、扁平结构或者深度结构。在步骤420,服务提供方服务器240可以对选定的数据项配对调用比较子例程。在 步骤425,服务提供方服务器240可以通过比较子例程来确定数据项配对的数据类型。在步 骤430,服务提供方服务器240确定数据项是否为表数据类型。如果在步骤430服务提供 方服务器240确定数据项为表数据类型,则服务提供方服务器240移至步骤435。在步骤 435,服务提供方服务器240针对每个数据项的每个表中的每个记录,递归地调用比较子例 程。由此,遗留数据项的每个记录和新数据项的每个对应记录形成了数据项配对,其将递归 地向比较子例程输入。服务提供方服务器240针对遗留数据项表和新数据项表的记录所形 成的每个数据项配对而返回步骤425。在步骤430,如果服务提供方服务器240确定数据项不是表数据类型,则服务提供 方服务器240移至步骤440。在步骤440,服务提供方服务器240确定数据项是否为扁平结 构数据类型或者深度结构数据类型。如果在步骤440服务提供方服务器240确定数据项是 扁平结构数据类型或者深度结构数据类型,则服务提供方服务器240移至步骤445。在步 骤445,服务提供方服务器240对扁平结构或者深度结构中的每个记录递归地调用比较子 例程。由此,遗留数据项扁平或者深度结构的每个记录和新数据项扁平或者深度结构的每 个对应记录形成了数据项配对,其被递归地向比较子例程输入。服务提供方服务器240继 而针对遗留数据项扁平或者深度结构和新数据项扁平或者深度结构的记录所形成的每个 数据项配对而返回步骤425。在步骤440,如果服务提供方服务器240确定数据项不是扁平结构数据类型或者 深度结构数据类型,则服务提供方服务器240移至步骤450。在步骤450,服务提供方服务 器240确定数据项是否为字段数据类型。如果在步骤450服务提供方服务器240确定数据 项不是字段数据类型,则服务提供方服务器240移至步骤455。在步骤455,服务提供方服 务器240向诸如错误日志的日志中写入该项,指示该项是未知的数据类型。服务提供方服 务器240继而移至步骤460。在步骤460,服务提供方服务器240确定比较数据结构中是否 存在附加项。如果在步骤460服务提供方服务器240确定比较数据结构中存在附加项,则 服务提供方服务器240移至步骤465。在步骤465,服务提供方服务器240获取比较数据结 构中的下一数据项配对,并返回步骤420。在步骤450,如果服务提供方服务器240确定项是字段数据类型,则服务提供方服 务器240移至步骤470。在步骤470,服务提供方服务器240对两个字段进行比较。在步骤 480,服务提供方服务器240可以确定项之间的任何差异。服务提供方服务器240还可以确 定项之间的任何差异是否在针对该项而标识的容许偏差之内。服务提供方服务器240继而 可以将差异以及差异是否在容许偏差之内存储在诸如服务提供方数据存储245中。确定任 何差异是否在容许偏差之内的步骤将在下文的图5中详述。服务提供方服务器240继而可 以移至步骤450,并且确定比较数据结构中是否存在待比较的任何其他项。在步骤450,如果服务提供方服务器240确定比较数据存储中没有待比较的其他 项,则服务提供方服务器240移至步骤490。在步骤490,遗留数据存储250与新数据存储 260之间的比较完成。服务提供方服务器240可以生成具有字段级别和记录级别统计的报 告,并且诸如通过用户A 120A的联网设备向用户A 120A提供该报告。图5是示出在图1的系统或者其他数据比较系统中确定比较是否在容许偏差之内的步骤的流程图。图5的步骤被描述为由服务提供方服务器240执行。然而,这些步骤可 由服务提供方服务器240的处理器执行,或者由服务提供方服务器240的任何其他硬件部 件来执行。而且,这些步骤可由外部硬件部件来执行。在步骤505,服务提供方服务器240可以标识数据项配对之间的任何差异。例如, 服务提供方服务器240可以比较数据项配对,并且确定数据项之间的任何差异。在步骤 510,服务提供方服务器240确定所比较的数据项是否是字符数据类型。如果在步骤510服 务提供方服务器240确定所比较的数据项是字符类型,则服务提供方服务器240移至步骤 515。在步骤515,服务提供方服务器240获取与数据项配对相关联的字符容许偏差。字符 容许偏差可以特定于数字字母字符和/或短语,诸如匹配大小写、忽略空格或者一般而言 可以与数字字母字符和/或短语有关的任何容许偏差。在步骤510,如果服务提供方服务器240确定数据项不是字符数据类型,则服务提 供方服务器240移至步骤520。在步骤520,服务提供方服务器240获取与数据项配对相关 联的容许偏差。如上所述,针对日期字段的容许偏差可以是天数差异,针对数值字段的容许 偏差可以是字段之间的绝对差值或者字段之间的百分比差异,而针对表的容许偏差可以是 表之间的记录数目差异。在步骤525,服务提供方服务器240确定数据项是否严格匹配。如果在步骤525服 务提供方服务器240确定数据项严格匹配,则服务提供方服务器240移至步骤530。在步骤 530,服务提供方服务器240存储数据项严格匹配的指示。如果在步骤525服务提供方服务 器240确定数据项不是严格匹配,则服务提供方服务器240移至步骤535。在步骤535,服 务提供方服务器240确定数据项之间差异是否在获取的容许偏差之内。如果在步骤535服 务提供方服务器240确定数据项在获取的容许偏差之内,则服务提供方服务器240移至步 骤540。在步骤540,服务提供方服务器240存储数据项在容许偏差之内的指示。在步骤535,如果服务提供方服务器240确定数据项不在容许偏差之内,则服务提 供方服务器240移至步骤545。在步骤545,服务提供方服务器240存储项在容许偏差之外 的指示。图6是在图1的系统或者其他数据比较系统中用于创建比较数据结构的用户接口 600的截屏。用户接口 600可以包括比较数据结构名称域610、变量名称域620以及变量描 述域630。用户A 120A可以使用用户接口 600来创建新的比较数据结构,以存储来自所比 较的遗留系统150和新系统160的数据。用户A 120A可以在数据结构名称域610中输入 比较数据结果的名称。用户A 120A可以在变量名称域620中输入变量数据结构的名称,并 且用户A 120A可以在变量描述域630中输入对变量数据结构的描述。图7是在图1的系统或者其他数据比较系统中用于标识数据项配对单元的容许偏 差的用户接口 700的截屏。用户接口 700可以包括遗留数据项710、遗留数据项描述720、 比较选择符730以及容许偏差标识符740。用户A 120A可以使用用户接口 700来触发进 行比较的数据项710。例如,在用户接口 700中,具有选中标记的字段将被包括在比较操作 中,而具有“X”的字段将被排除出比较操作。用户A 120A可以查看与每个数据项配对相关 联的容许偏差标识符740。容许偏差标识符740可以标识与每个数据项配对相关联的容许 偏差。图8是用于配置图1的数据比较系统或者其他数据比较系统的用户接口 800的截屏。用户接口 800可以包括变量部分810、批次部分820、选项部分830、容许偏差部分740、 下载部分850以及字段部分860。变量部分810可以显示用于比较的变量数据结构的名称。 用户A 120A可以使用批次部分820来配置比较的批次选项。用户A120A可以在选项部分 830中配置比较的其他选项。可以在容许偏差部分840中调节容许偏差分组。下载部分850 可以用来标识向其下载报告文件的服务器。字段部分860可以允许用户A 120A标识要将 哪些类别的数据项配对包括在报告中,诸如严格匹配的数据项、在容许偏差内的数据项和/ 或在容许偏差外的数据项。图9是图1的系统或者其他数据比较系统中的记录级别报告900的截屏。记录级 别报告900可以显示每个记录中严格匹配字段的百分比、在容许偏差之内的百分比以及在 容许偏差之外的百分比。对于记录级别报告900而言,在100%的记录中95-100%的字段 严格匹配,在100 %的记录中0-5 %的字段在容许偏差范围内,并且在100 %的记录中0-5 % 的字段在容许偏差之外。例如,96 %的字段可以严格匹配,2 %的字段可以在容许偏差之内, 并且2 %的字段可以在容许偏差之内。图10是图1的系统或者其他数据比较系统中的字段级别报告1000的截屏。字段 级别报告1000显示了每个字段严格匹配的百分比,每个字段在容许偏差之内的百分比,以 及每个字段在容许偏差之外的百分比。在字段级别报告1000中,可以基于与每个字段相关 联的国家将字段分组。图11是图1的系统或者其他数据比较系统中的字段级别容许偏差外报告1100的 截屏。容许偏差外报告1100可以显示在所标识容许偏差之外的字段。用户A 120A可以使 用容许偏差外报告1100来重配新系统160,使得新系统160产生的所有数据在容许偏差之 内。在容许偏差外报告1100中,遗留数据存储250中的国家字段具有值“GB”,而新数据存 储260中的对应字段具有值“1B”。由于字段是字符并且不匹配,因此字段在容许偏差之外。 而且,遗留数据存储250中的客户类型字段具有值“P”,而新数据存储260中的客户类型字 段具有值“ 1 ”。由于值是字符并且不是严格匹配,因此字段不在容许偏差之内。图12是图1的系统或者其他数据比较系统中的记录级别图表1200的截屏。记录 级别图表1200提供了每个记录中严格匹配的字段百分比、每个记录中在容许偏差内的字 段百分比以及每个记录中在容许偏差外的字段百分比的图形表示。例如,在记录级别图表 120中,在约75 %的记录中,95-100 %的字段严格匹配,而在约20 %的记录中,90-95 %的字 段严格匹配。备选地,在约80%的记录中,0-5%的字段在容许偏差之外,并且在约92%的 记录中,0-5 %的字段在容许偏差之内。图13是图1的系统或者其他数据比较系统中的字段级别图表1300的截屏。字段 级别图表1300显示严格匹配的、在容许偏差内的或者在容许偏差外的每个字段的百分比。 例如,在字段级别图表1300中,约98%的“ MANDT”字段严格匹配,其约100%的“ID”字段 严格匹配。图14示出了 一个通用计算机系统1400,其可以代表服务提供方服务器240或者在 此提及的任何其他计算设备。计算机系统1400可以包括一组指令1424,其可被执行以使 计算机系统1400执行在此公开的任意一个或多个方法或基于计算机的功能。计算机系统 1400可以作为单机设备来操作,或者可以例如使用网络而连接至其他计算机系统或者外围 设备。
在联网部署中,计算机系统可以按照服务器-客户端用户网络环境中的服务器的 能力或是作为客户端用户计算机进行操作,或者可以作为端对端(或者分布式)网络环境 中的对等计算机系统来操作。计算机系统1400还可以实现为各种设备或者并入这些设备 中,这些设备诸如个人计算机(PC)、平板PC、机顶盒(STB)、个人数字助理(PDA)、移动设备、 掌上型计算机、膝上型计算机、桌面计算机、通信设备、无线电话、陆线电话、控制系统、照相 机、扫描仪、传真机、打印机、寻呼机、个人受信设备、web工具、网络路由器、交换机或桥或者 能够执行规定由该机器进行的动作的指令集1424(顺序的或其他)的任何其他机器。在 特定实施方式中,计算机系统1400可以使用提供话音、视频或者数据通信的电子设备来实 现。此外,尽管仅示出了单个计算机系统1400,但是术语“系统”还应当包括独立地或结合 地执行一组或多组指令以执行一个或者多个计算机功能的系统或者子系统的任意集合。如图10所示,计算机系统1400可以包括处理器1402,诸如中央处理单元(CPU)、 图形处理单元(GPU)或二者。处理器1402可以是多种系统中的部件。例如,处理器1402 可以是标准个人计算机或者工作站的部分。处理器1402可以是一个或多个通用处理器、数 字信号处理器、专用集成电路、现场可编程门阵列、服务器、网络、数字电路、模拟电路、其组 合或者其他目前已知或将来开发的用于分析和处理数据的设备。处理器1402可以实现软 件程序,诸如人工生成的(也即,编程的)代码。计算机系统1400可以包括存储器1404,其可以经由总线1408进行通信。存储器 1404可以是主存储器、静态存储器或者动态存储器。存储器1404可以包括但不限于计算 机可读存储介质,诸如各类易失性和非易失性存储介质,包括但不限于随机访问存储器、只 读存储器、可编程只读存储器、电可编程只读存储器、电可擦除只读存储器、闪存、磁带或磁 盘、光学介质等。在一种情况下,存储器1404可以包括用于处理器1402的高速缓存或者随 机访问存储器。备选地或附加地,存储器1404可以与处理器1402分离,诸如处理器的高速 缓冲存储器、系统存储器或者其他存储器。存储器1404可以是用于存储数据的外部存储设 备或者数据库。示例可以包括硬驱动、压缩盘(“CD”)、数字视频盘(“DVD”)、存储卡、存 储棒、软盘、通用串行总线(“USB”)存储设备或者可操作以存储数据的任何其他设备。存 储器1404可操作以存储处理器1402可执行的指令1424。在附图中示出或者在此描述的功 能、动作或任务可以由执行存储器1404中存储的指令1424的编程处理器1402来执行。功 能、动作或者任务可以独立于具体类型的指令集、存储介质、处理器或者处理策略,并且可 以由单独操作和结合操作的软件、硬件、集成电路、固件、微代码等来执行。同样,处理策略 可以包括多处理、多任务、并行处理等。计算机系统1400还可以包括显示器1414,诸如液晶显示器(IXD)、有机发光二极 管(OLED)、平板显示器、固态显示器、阴极射线管(CRT)、投影仪、打印机或者其他现在已知 或将来开发的用于输出确定信息的显示设备。显示器1414可以充当供用户查看处理器
1402的操作的接口,或者特别地充当与存储器1404或者驱动单元1406中存储的软件的接□。而且,计算机系统1400可以包括输入设备1412,其配置用于允许用户与系统1400 的任何部件进行交互。输入设备1412可以是数字小键盘、键盘或者诸如鼠标或操纵杆的光 标控制设备、触摸屏、远程控制或者可操作以与系统1400交互的任何其他设备。计算机系统1400还可以包括盘或光学驱动单元1406。盘驱动单元1406可以包括计算机可读介质1422,其中可以嵌入一组或多组指令1424,例如软件。此外,指令1424可 以执行在此描述的一个或多个方法或逻辑。在计算机系统1400的执行期间,指令1424可 以完全或者至少部分驻留在存储器1404中和/或处理器1402中。存储器1404和处理器 1402还可以包括上述计算机可读介质。本公开预想到包括指令1424或者响应于传播信号而接收和执行指令1424的计算 机可读介质1422 ;使得连接至网络235的设备可以通过网络235来传送话音、视频、音频、 图像或者任何其他数据。此外,指令1424可以经由通信接口 1418通过网络235来传输或 接收。通信接口 1418可以是处理器1402的部分,或者可以是独立的部件。通信接口 1418 可以通过软件来创建,或者可以是硬件的物理连接。通信接口 1418可以配置为与网络235、 外部介质、显示器1414、系统1400中的任何其他部件或其组合连接。如下所述,与网络235 的连接可以是物理连接,诸如有线以太网连接,或者可以无线地建立。同样,与系统1400的 其他部件的其他连接可以是物理连接或者可以无线地建立。在服务提供方服务器240的情 况下,服务提供方服务器可以通过通信接口 1418与用户120A-N通信。网络235可以包括有线网络、无线网络或其组合。无线网络可以是蜂窝电话网络、 802. 11,802. 16、802. 20或者WiMax网络。此外,网络235可以是公共网络(诸如因特网)、 专用网络(诸如内部网)或其组合,并且可以使用目前可用或者将来开发的各种联网协议, 包括但不限于基于TCP/IP的联网协议。计算机可读介质1422可以是单个介质,或者计算机可读介质1422可以是单个介 质或多个介质,诸如集中式或分布式数据库,和/或存储一组或多组指令的关联高速缓存 和服务器。术语“计算机可读介质”还可以包括能够存储、编码或者携带指令集以供处理器 执行或者可以使计算机系统执行在此公开的任意一个或多个方法或操作的任何介质。计算机可读介质1422可以包括固态存储器,诸如存储卡或容纳一个或多个非易 失性只读存储器的其他封装。计算机可读介质1422还可以是随机访问存储器或者其他易 失性可重写存储器。另外,计算机可读介质1422可以包括磁光学或者光学介质,组合如盘 或带或用来捕获载波信号(诸如,通过传输介质传送的信号)的其他存储设备。电子邮件 的数字文件附件或者其他自包含的信息存档或存档集合可以被认为是分发介质,其可以是 有形的存储介质。由此,可以认为本公开包括可以将数据或指令存储在其中的任意一个或 多个计算机可读介质或分发介质以及其他等效物和后续介质。备选地或附加地,可以构造诸如专用集成电路、可编程逻辑阵列以及其他硬件设 备等专用硬件实现来实现在此描述的一个或多个方法。可以包括各种实施方式的装置和系 统的应用可以宽泛地包括各种电子和计算机系统。在此描述的一个或多个实施方式可以 使用一个或多个特定的互连硬件模块或者设备来实现功能,其中这些模块或者设备具有可 以在模块之间以及通过模块传送的相关控制和数据信号,或者可以作为专用集成电路的部 分。由此,本发明可以涵盖软件、固件和硬件实现。在此描述的方法可以由计算机系统可执行的软件程序来实现。此外,实现可以包 括分布式处理、部件/对象分布式处理和并行处理。备选地或附加地,可以构造虚拟计算机 系统处理来实现在此描述的一个或多个方法或功能。尽管将部件和功能描述为可以参考特定的标准和协议在特定的实施方式中实现, 但是部件和功能不限于此类标准和协议。例如,用于因特网和其他分组交换网络传输的标准(例如,TCP/IP、UDP/IP、HTML、HTTP)代表本领域的示例。此类标准通常周期性地被具有 基本上相同功能的更快或更有效的等效物取代。由此,与在此公开的那些标准和协议具有 相同或相似功能的替代标准和协议被认为是其等效物。在此描述的说明意在提供对各种实施方式的结构的一般性理解。说明并非意在充 当对利用在此描述的结构或方法的装置、处理器和系统的所有元件和特征的完全描述。在 阅读本公开之后,多种其他实施方式对于本领域的技术人员而言是易见的。根据本公开可 以使用和导出其他实施方式,使得在不脱离本公开的范围的情况下可以进行结构上和逻辑 上的替换和修改。而且,说明仅仅是代表性的,并且可以不是按比例绘制的。说明中的某些 比例可能被放大,而其他比例可能被最小化。由此,本公开和附图应当被认为是说明性的而 非限制性的。上文公开的主题应被认为是说明性的而非限制性的,并且所附权利要求意在涵盖 处于描述的真正精神和范围之内的所有这些修改、增强和其他实施方式。由此,在法律所允 许的最大程度上,范围由对所附权利要求及其等效项的最宽泛的可允许解释来确定,而不 应当由上文的详细描述来限制或限定。
权利要求
1.一种用于在遗留数据存储与新数据存储之间执行基于容许偏差的比较的计算机实 现的方法,所述方法包括(a)由处理器从用户的设备接收包括多个数据项配对的比较数据结构,每个数据项配 对标识遗留数据集的遗留数据项和新数据集的新数据项,其中每个数据项配对包括的数据 类型为表数据类型、扁平结构数据类型、深度结构数据类型或者字段数据类型,并且其中所 述表数据类型、所述扁平结构数据类型以及所述深度结构数据类型中每一个包括多个记 录;(b)由所述处理器从所述用户的所述设备接收多个容许偏差,每个容许偏差与所述数 据项配对之一相关联;(c)由所述处理器调用比较数据子例程,以比较所述多个数据项配对的每个数据项配对;(d)由所述处理器确定每个数据项配对的数据类型是否包括所述表数据类型、所述扁 平结构数据类型或者所述字段数据类型;(e)如果每个数据项配对的数据类型包括所述字段数据类型,则由所述处理器按照相 关联的所述容许偏差来比较每个数据项配对的每个遗留数据项与每个新数据项;以及(f)否则,由所述处理器针对每个数据项配对的每个记录来重复步骤(c)-(e),直到每 个数据项配对的数据类型包括所述字段数据类型,继而按照相关联的所述容许偏差来比较 每个数据项配对的每个遗留数据项与每个新数据项。
2.如权利要求1所述的计算机实现的方法,进一步包括(g)由所述处理器将所述比较的结果转换为报告,其中所述报告描述所述遗留数据项 与新数据项严格匹配的百分比、所述遗留数据项与新数据项在相关联的所述容许偏差之内 的百分比以及所述遗留数据项与所述新数据项在相关联的所述容许偏差之外的百分比;以 及(h)由所述处理器向所述用户的所述设备提供所述报告。
3.如权利要求2所述的计算机实现的方法,其中所述报告包括多个字段级别统计和多 个记录级别统计。
4.如权利要求3所述的计算机实现的方法,其中所述报告基于所述多个字段中的字段 来分组所述多个字段级别统计。
5.如权利要求1所述的计算机实现的方法,其中由所述处理器从所述用户的所述设备 接收所述多个容许偏差,每个容许偏差与所述数据项配对之一相关联进一步包括由所述处理器向所述用户的所述设备提供用户接口,用于标识所述多个容许偏差以及 与每个容许偏差相关联的数据项配对;以及从所述用户的所述设备接收所述多个容许偏差,每个容许偏差与所述数据项配对之一 相关联。
6.如权利要求1所述的计算机实现的方法,其中如果每个数据项配对的数据类型包括 所述字段数据类型则由所述处理器按照相关联的所述容许偏差来比较每个数据项配对的 每个遗留数据项与每个新数据项进一步包括如果每个数据项配对的数据类型包括所述字段数据类型,则由所述处理器对每个数据 项配对的每个遗留数据项与每个新数据项进行比较,以确定每个遗留数据项与每个新数据项之间的差异;以及由所述处理器为每个数据项配对指派类别,所述类别基于每个数据项配对的所述差异 是否在与每个数据项配对相关联的所述容许偏差之内。
7.如权利要求6所述的计算机实现的方法,其中每个类别包括以下之一严格匹配类 别,容许偏差内类别,或容许偏差外类别。
8.如权利要求7所述的计算机实现的方法,进一步包括(g)由所述处理器将每个类别转换为报告,其中所述报告描述被指派以所述严格匹配 类别的数据项配对的百分比、被指派以所述容许偏差内类别的数据项配对的百分比以及被 指派以所述容许偏差外类别的数据项配对的百分比;以及(h)由所述处理器向所述用户的所述设备提供所述报告。
9.如权利要求1所述的计算机实现的方法,其中至少一个数据项包括字符数据类型的 数据类型,并且相关联的所述容许偏差包括大小写敏感容许偏差和空格敏感容许偏差的至 少一个。
10.如权利要求1所述的计算机实现的方法,其中至少一个数据项包括日期数据类型 的数据类型,并且相关联的所述容许偏差包括天数差异容许偏差。
11.如权利要求1所述的计算机实现的方法,其中所述遗留数据集和所述新数据集包 括多个票据。
12.如权利要求1所述的计算机实现的方法,进一步包括(g)向所述用户的所述设备提供用于标识要比较哪些所述数据项配对的用户接口;以及(h)由所述处理器从所述用户的所述设备接收对要比较的数据项配对的选择。
13.如权利要求12所述的计算机实现的方法,其中如果每个数据项配对的数据类型包 括所述字段数据类型则由所述处理器按照相关联的所述容许偏差来比较每个数据项配对 的每个遗留数据项与每个新数据项进一步包括如果每个数据项配对的数据类型包括所述字段数据类型,并且如果所述数据项配对被 包括在步骤(g)中由所述用户的所述设备提供的所述选择中,则由所述处理器按照相关联 的所述容许偏差来比较每个数据项配对的每个遗留数据项与每个新数据项。
14.一种用于在遗留数据存储与新数据存储之间执行基于容许偏差的比较的计算机实 现的方法,所述方法包括由处理器从用户的设备接收比较数据结构,其中所述比较数据结构描述第一数据集 的第一多个数据项与第二数据集的第二多个数据项之间的多个映射,其中所述数据项包括 表、字段、深度结构或者扁平结构中的至少一个;由所述处理器向所述比较数据结构填入来自所述第一数据集的所述第一多个数据项 和来自所述第二数据集的所述第二多个数据项;由所述处理器接收多个容许偏差,每个容许偏差同所述第一多个数据项与所述第二多 个数据项之间的所述映射之一相关联,其中每个容许偏差描述所述多个映射中每个映射的 可接受变化;由所述处理器按照所述多个映射以及所述多个容许偏差来比较所述比较数据结构中 的所述第一多个数据项与所述比较数据结构中的所述第二多个数据项,其中如果所述第一多个数据项和所述第二多个数据项包括所述表、所述扁平结构或者所述深度结构,则递归 地比较所述第一多个数据项与所述第二多个数据项;由所述处理器将所述比较的结果转换为报告,其中所述报告描述所述第一数据项与第 二数据项严格匹配的百分比、所述第一数据项与第二数据项在相关联的所述容许偏差之内 的百分比以及所述第一数据项与所述第二数据项在相关联的所述容许偏差之外的百分比; 以及由所述处理器向所述用户的所述设备提供所述报告。
15.如权利要求14所述的计算机实现的方法,其中所述报告包括多个字段级别统计和 多个记录级别统计。
16.如权利要求15所述的计算机实现的方法,其中所述报告基于所述多个字段中的字 段来分组所述多个字段级别统计。
17.如权利要求14所述的计算机实现的方法,其中至少一个数据项包括字符数据类型 的数据类型,并且相关联的所述容许偏差包括大小写敏感容许偏差和空格敏感容许偏差的 至少一个。
18.如权利要求14所述的计算机实现的方法,其中至少一个数据项包括日期数据类型 的数据类型,并且相关联的所述容许偏差包括天数差异容许偏差。
19.如权利要求14所述的计算机实现的方法,其中所述第一数据集和所述第二数据集 包括多个票据。
20.如权利要求14所述的计算机实现的方法,进一步包括向所述用户的所述设备提供用于标识要比较哪些所述映射的用户接口 ;以及由所述处理器从所述用户的所述设备接收对要比较的映射的选择。
21.如权利要求20所述的计算机实现的方法,其中如果每个映射被所述用户选择,则 由所述处理器按照所述多个映射以及所述多个容许偏差来比较所述比较数据结构中的所 述第一多个数据项与所述比较数据结构中的所述第二多个数据项。
22.—种数据比较系统,所述系统包括存储器,用于存储包括多个数据项配对的比较数据结构,每个数据项配对标识遗留数 据集的遗留数据项和新数据集的新数据项,其中每个数据项配对包括的数据类型为字段数 据类型、表数据类型、扁平结构数据类型或深度结构数据类型,进一步地其中所述表数据类 型、所述扁平结构数据类型以及所述深度结构数据类型中每一个包括多个记录;以及多个 容许偏差,每个容许偏差与所述数据项配对之一相关联;可操作地连接至所述存储器的接口,所述接口可操作用于与用户的设备进行通信;以及可操作地连接至所述存储器和所述接口的处理器,所述处理器可操作用于经由所述 接口从所述用户的所述设备接收所述比较数据结构和所述多个容许偏差;调用比较数据子 例程,以比较由每个数据项配对标识的每个遗留数据项与每个新数据项;确定每个数据项 配对的数据类型是否包括所述字段数据类型、所述表数据类型、所述扁平结构数据类型或 者所述深度结构数据类型;如果每个数据项配对的数据类型包括所述字段数据类型,则按 照相关联的所述容许偏差来比较每个遗留数据项与每个新数据项;否则,针对每个数据项 配对的每个记录递归地调用所述比较数据子例程,直到每个数据项配对的数据类型包括所述字段数据类型,继而按照相关联的所述容许偏差来比较每个数据项配对的所述遗留数据 项与所述新数据项。
23.如权利要求22所述的系统,其中所述处理器进一步可操作用于将所述比较的结 果转换为报告,其中所述报告描述第一数据项与第二数据项严格匹配的百分比、所述第一 数据项与第二数据项在相关联的所述容许偏差之内的百分比以及所述第一数据项与第二 数据项在相关联的所述容许偏差之外的百分比;以及经由所述接口向所述用户的所述设备 提供所述报告。
24.如权利要求23所述的系统,其中所述报告包括多个字段级别统计和多个记录级别 统计。
25.如权利要求24所述的系统,其中所述报告基于所述多个字段中的字段来分组所述 多个字段级别统计。
26.如权利要求22所述的系统,其中所述处理器进一步可操作用于经由所述接口向 所述用户的所述设备提供用户接口,以用于标识所述多个容许偏差以及与每个容许偏差相 关联的数据项配对;以及经由所述接口从所述用户的所述设备接收所述多个容许偏差,每 个容许偏差与所述数据项配对之一相关联。
27.如权利要求22所述的系统,其中所述处理器进一步可操作用于如果每个遗留数 据项和每个新数据项包括所述字段,则比较每个遗留数据项与每个新数据项,以确定每个 遗留数据项与每个新数据项之间的差异;以及为每个数据项配对指派类别,所述类别基于 每个数据项配对的所述差异是否在相关联的所述容许偏差之内。
28.如权利要求27所述的系统,其中每个类别包括以下之一严格匹配类别,容许偏差 内类别,以及容许偏差外类别。
29.如权利要求28所述的系统,其中所述处理器进一步可操作用于将每个类别转换 为报告,其中所述报告描述被指派以所述严格匹配类别的数据项配对的百分比、被指派以 所述容许偏差内类别的数据项配对的百分比以及被指派以所述容许偏差外类别的数据项 配对的百分比;以及经由所述接口向所述用户的所述设备提供所述报告。
30.如权利要求22所述的系统,其中至少一个数据项包括字符数据类型的数据类型, 并且相关联的所述容许偏差包括大小写敏感容许偏差和空格敏感容许偏差的至少一个。
31.如权利要求22所述的系统,其中至少一个数据项包括日期数据类型的数据类型, 并且相关联的所述容许偏差包括天数差异容许偏差。
32.如权利要求22所述的系统,其中所述遗留数据集和所述新数据集包括多个票据。
33.如权利要求22所述的系统,其中所述处理器进一步可操作用于经由所述接口向 所述用户的所述设备提供用户接口,以用于标识要比较哪些所述数据项配对;以及经由所 述接口从所述用户的所述设备接收对要比较的数据项配对的选择。
34.如权利要求33所述的系统,其中所述处理器进一步可操作用于如果每个遗留数 据项和每个新数据项包括所述字段,并且如果所述数据项配对被所述用户选择,则按照相 关联的所述容许偏差来比较每个遗留数据项与每个新数据项。
全文摘要
描述了一种数据比较系统。该系统可以包括存储器、接口以及处理器。存储器可以存储包含多个数据项配对的比较数据结构,每个配对包括遗留数据集的遗留数据项以及新数据集的对应新数据项;以及与每个数据项配对相关联的容许偏差。处理器可以接收比较数据结构以及相关联的容许偏差。如果数据项是字段,则处理器可以调用比较数据子例程以按照相关联的容许偏差来比较每个数据项配对。否则,处理器可以针对每个数据项的每个记录递归地调用比较数据子例程,直到数据项是字段。处理器继而可以按照相关联的容许偏差来比较数据项。
文档编号G06Q10/00GK101996361SQ20101023896
公开日2011年3月30日 申请日期2010年7月27日 优先权日2009年8月6日
发明者A·休, G·庞 申请人:埃森哲环球服务有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1