在数据库和身份分辨系统中追踪实体的制作方法

文档序号:6613024阅读:190来源:国知局
专利名称:在数据库和身份分辨系统中追踪实体的制作方法
技术领域
本发明一般涉及使用数据库的信息存储和检索领域,并且尤其涉及可能
具有一个以上标识符的实体的身份分辨(identity resolution )。
背景技术
数据库系统广泛用于保持以这种方式组织的、关于真实(与虚拟相对, 例如计算机中的信息)世界对象(例如,如个人、人群、组织和公司)的信
息,所述方式为关于对象的信息变得易于访问。这种功能的基本意义是识别 每个对象的能力,关于所述对象的信息要以明确定义的方式保存和访问,使 得每个对象具有身份。
词"身份"可以定义为真实世界对象(称作"热体(warm body)")的别 名,其通常由热体指定。例如,身份可以是姓名、社会保障号、驾驶执照号 或者公共医疗补助号等。
词"账户"可以定义为标识符和关于单个热体的其它信息的集合。通过 定义,单个账户表示一个,唯一并且始终相同的热体。例如,单个账户可以 包括各种身份(如姓名、社会保障号、驾驶执照号)以及其它信息(如发色、 年龄和身高)。账户典型地由数据库系统的用户指定。账户的一些示例是信用 卡账户、银行账户和航空公司旅客账户。
词"实体"可以定义为一个或多个账户的集合。各实体典型地由数据库 系统指定,并且在表示热体时可以宽松地描述为系统的意图。"热体"可以定 义为真实世界中的物理的物体(例如,通常为人,但是也可能是可以保持关 于其信息的对象,如飞机、机动车或公司),其典型地具有多个标识符、多个 账户和多个实体。 -
身份分辨系统的 一个基本功能是将每个不同的热体表示为唯一 实体。例 如,如果身份分辨系统具有第一实体和第二实体表示相同热体的信息,则身 份分辨系统可以将两个独立的实体"融合(resolve)"成单个实体。相反地, 如果身份分辨系统中的单个实体具有表现为属于两个独立热体的信息,则身
份分辩系统可能试图将单个实体"分解(un-resolve )"成与两个不同热体匹 配的两个单独实体。
身份分辨系统的一个主要目的是将表面上完全不同的账户融合在一起。 即,当前该系统可能出于两个账户代表两个截然不同的热体的假设。随着更 多的信息进入系统,身份分辨系统可以检测这两个账户之间的"足够"相似 之处,从而该系统确定这两个账户实际上表示相同的热体,在该情况下,系 统"融合"这两个账户。当这种分辩决定正确时,系统根据需要行使功能。 然后,当前系统已知为表示相同热体的所有账户保持在单个实体中。在理想 情况下,对于在系统中具有账户的每个唯一热体,在系统中将存在单个实体。 然而最初该系统通常具有每个热体多个实体。在系统中通过定义保持下列关 系
账户数目 > 实体数目 > 热体数目。
一般地,随着时间推进和更多信息进入账户系统,系统中的实体数量偏 离系统中的账户数量,并且会集降朝向附接到这些账户的热体的数量。
然而,通常遇到某些类型的问题。例如,该系统可能错误地融合了两个 实体,即该系统错误地认为(例如,保持信息)两个截然不同的热体是相同 的热体,称作"错误融合问题"。例如,也存在"错误分解问题",其中已经 正确融合的而指相同热体的两个账户在某一时刻错误地分解,即该系统错误 地进入这样的状态,其中该系统认为两个账户表示两个截然不同的热体。
随着在身份分辨系统中各实体被融合和分解,存在涉及保持跟踪各实体 和它们的身份的若干已知问题。 一个问题可以称作"丟失实体标识符问题", 其中在两个实体融合成单个实体之后,该单个实体不能够通过其之前标识符 的一个或另 一个分辨,使得系统用户在使用之前标识符搜索时,找不到该(新) 单个实体,其现在对用户表现为丢失。
另一问题可以称作"丢失实体版本问题"。例如,感兴趣的实体在融合之 后仍然可分辨,然而该实体例如通过增加/删除账户可能已经充分改变,从而 虽然之前版本满足用户查看该实体所需的上下文(context),但是当前版本的 结构在用户查看该实体的上下文中不再有意义。
另一问题可以称作"实体切换热体/账户问题"。例如,该系统最初将一 个实体身份与一个热体相关联,然后在一系列融合和分解之后,使用该相同
的实体身份来指完全不同的热体,使得期望实体身份应当与热体身份相同的
系统用户可能变得困惑。
另一问题可以称作"账户漂移问题"。例如,在长期的融合和分解期间, 单个账户可能通过自身显露出许多不同的实体,而这些实体的每一个可能具 有与所有其它实体不同的身份。在这种情况下,该账户呈现为从一个实体"漂
移"到另一个。该问题的关键特征是,系统像是反复对相同的账户/热体表面 地重新确立实体身份。因而,账户表现为通过自身从一个实体漂移至另一个, 使得系统用户可能变得困惑。
虽然具有当前的技术,本领域中仍然需要对可能具有一个以上标识符的 实体进行实体追踪和身份分辨,其提供对本领域中遇到的大量问题(如"丟 失实体标识符问题"、"丟失实体版本问题"、"实体切换热体/账户问题"以及
"账户漂移问题")的解决方案。

发明内容
在本发明的 一个实施例中,在数据库中追踪实体的计算机实现方法包括 给多个账户中每一个账户分配仅属于该账户的唯一原始实体标识符,其中该 唯一原始实体标识符是分配给仅包括该账户、而不包括其它账户的唯一原始 实体的唯一实体标识符;以及保持追踪多个账户的每一个账户的年龄。
在本发明另 一实施例中,公开了 一种由身份分辨系统访问的数据库的身
份分辨系统,其执行创建具有账户标识符列、原始实体标识符列和当前实 体标识符列的实体追踪表;并且响应于账户进入身份分辨系统,创建实体追 踪表的一行,其具有用于该账户的账户标识符、分配给该账户的唯一实体的 原始实体标识符、以及等于原始实体标识符的当前实体标识符。
在本发明的另 一实施例中, 一种计算机程序产品包括计算机可使用的介 质,该介质包括计算机可读程序,其中该计算机可读程序在计算机上执行时, 使得计算机1 )创建具有账户标识符列、原始实体标识符列和当前实体标识 符列的实体追踪表;以及2)创建新版本的实体,包括按序遍及所有实体 将版本号分配给新版本;以及为新版本的实体中包括的每个实体在实体版本 表中创建一行,其中创建的每行具有实体版本标识符列中的版本号、实体标 识符列中的新版本实体的标识符、以及时标列中的新版本实体的时标。
参考下列附图、说明书和权利要求,本发明的这些和其它特征、方面和 优点将变得更好理解。


图1是图示根据本发明实施例的、具有身份分辨系统的数据库系统的系
统方块图2是图示根据本发明实施例的实体追踪方法的流程图; 图3是组3A、图3B和图3C,每幅图示出了根据本发明实施例的账 户和实体的示例性图形表示;
图4是根据本发明实施例的示例性实体追踪表;
图5是图示根据本发明实施例的、使用实体追踪表(如图4中所示的实
体追踪表)的实体追踪的方法的流程图6是根据本发明实施例的示例性实体版本追踪表;
图7是通过由图6的表表示的时间改变的实体版本的图形表示;以及
图8是图示根据本发明实施例的、使用实体版本追踪表(如图6中所示
的实体版本追踪表)的实体版本追踪的方法的流程图。
为了帮助理解,在可能之处,已经使用相同的标号来指定对一些附图共
同的相同元件。
具体实施例方式
以下的详细描述是当前预期的实施本发明的最优模式。该描述并不是限 制性的,而是仅用于图示本发明一般原理的目的,因为本发明的范围由权利 要求最优定义。
广义地,本发明的实施例提供了在数据库系统中、在身份分辨系统的实 体的身份分辨期间对实体的追踪。各实施例可以结合商业数据库一同使用, 例如,任何追踪与"热体"有关的账户(如信用卡账户、4艮行账户和航空公司 旅客账户)的数据库,所述热体具有唯一身份(如个人或公司)。例如,根据本 发明的身份分辨系统可以由银行或信用卡公司使用以保持追踪账户,或者可 以由例如航空公司旅客保留和订票系统中的航空公司使用。
通过维持数据库中每个实体的唯一身份(例如,实体中包括的最早账户 的唯一实体的标识符),本发明的各实施例不同于例如现有技术身份分辩系
统,该现有技术身份分辩系统通过为各实体创建新标识符、或者重新使用各 标识符用于不同的实体而不是该标识符最初属于的实体,不维持这样的唯一 标识符。通过解决未被现有技术解决的大量身份追踪问题(例如,"丢失实体
标识符问题"、"实体切换热体/账户问题"以及"账户漂移问题"),本发明的 实施例由此与现有技术身份分辨系统不同。另外,通过在身份分辨系统中维 持实体版本的历史,本发明的实施例例如与现有技术身份分辨系统不同,该 现有技术身份分辨系统不维持版本历史,因此不能解决由本发明的实施例解 决的"丢失实体版本"问题。
图1图示根据本发明一个实施例的数据库系统100。系统100可以包括
数据存储设备102,其可以包括盘驱动器或其他计算机可读的数据存储设备, 其可以例如通过网络存取。数据存储设备102可以包括数据组104,其可以 通过计算机系统106从数据存储设备102中可读取。计算机系统106可以包 括用于接收例如来自人类用户、或者其它系统和设备(未示出)的输入的设 备。计算机系统106还可以包括例如用于显示人类用户的信息、.或者用于提 供电输出到其它系统和设备的设备,并且允许这种到身份分辨系统109和来 自其的外部通信。特别地,计算机系统106可以提供对数据组104插入和删 除事务(transaction) 108。事务108可以例如从身份分辨系统109中产生。 同样,计算机系统106可以经由数据组104的数据存取110从数据组104接 收信息,并且提供该信息到身份分辨系统109。
图2图示用于实体追踪方法200的一种示例性实现,其可以在例如图1 中所示的数据库系统100中实现。账户可以例如通过具有关于由计算机系统 106接收的账户的信息,在处理202进入系统100。例如,计算机系统106可 以接收从人类用户、或者经由网络连接从一些其它计算机输入的数据。该信 息可以经由事务108进入数据组104。该信息也可以由身份分辨系统109处 理,而关于账户的附加信息(例如实体和身份信息),也可以经由事务108从 身份分辨系统109进入数据组104。在处理202,身份分辨系统109可以确定 账户是否已经在系统100中,或者,可以保持追踪账户进入系统的时间,因 此可以确定账户是否首次进入系统100。
参考图3的图3A,账户(例如,图3A中所示的账户al 301 )首次进入 系统100时,在处理202处的方法200可以给账户al 301分配它自己的唯一 实体el 311 (在图3A中由围绕al 301的圓的el 311的框图形表示)。因此, 直接在账户al 301进入系统100之后,在系统100中可能存在一个实体el 311,其包括该账户a1301,并且该实体el 311可以不包括其它账户(如在图 3A见到的)。因而,每个账户(例如,al301)可以具有"原始"(或最老)实体(例如,el 311),并且每个实体(例如,el 311)可以具有"原始"(或 最老)账户(例如,al 301 )。
参考图3B,实体(例如,图3B中所示的实体el 311 )可以定义为一个 或多个账户(例如,图3B中所示的账户al 301和a2 302)的集合。在处理 204,方法200可以在实体(例如,el 311 )的账户(例如,al 301和a2 302 ) 的集合中查找最老的账户(例如,al 301)。该最老的账户可以具有原始实体, 该原始实体可具有标识符(例如,"123")。在处理204,方法200可以将该 最老的实体的标识符(即,"123")重新用作正讨论的实体的标识符。使用图 3B作为示例,假设"el"是账户al 301的原始实体el 311的标识符,并且 "e2"是账户a2 302的原始实体e2 312的标识符。同样,假设账户al 301早 于账户a2 302 (即,al 301在a2 302之前进入系统)。当系统将账户al 301 和a2 302合并(即,融合)为单个实体(图3B中的e311 )时,分配给该合 并的实体(图3B中的el 311 )的标识符可以是"el",因为al 301早于a2 302, 并且"el"是al 301的原始实体el 311的标识符。
在图3A、 3B和3C的图形表示中,每个实体方框可以直接包括精确的一 个账户圆环。更具体地,实体el 311的方框可以直接包括其原始账户al 301 的账户圆环,实体e2 312的方框可以直接包括其原始账户a2 302的圓环,并 且实体e3 313的方框可以直接包括其原始账户a3 303的圆环。通过定义,因 为实体el 311的方框也包括实体e2 312的方框(参见图3B ),实体el 311可 以被认为间接地包括账户a2 302。图3A、 3B和3C的图形表示可以反映由方 法200在处理s202和s204建立的、账户及其原始实体之间(或在实体及其 原始账户之间)的连续(或永久)身份关系,其中每个实体可以仅直接包括 其唯一识别的账户(例如,其原始实体的账户),并且可以间接包括所有其它 账户,其每个账户仍然可以包括在其自己的唯一识别(原始)的实体中。
图3C图示这样的示例,其中如图3B中所示的账户al 301和a2 302可 以与早于al 301或a2 302的a3 303合并。在该示例中,图3B的表示不作为 实体e3 313的方框中的实体方框出现。作为代替,所有合并的账户在表示中 放置在相同级别(level)(而不是分级的),反应了由方法200在处理206建 立的关系,其中每个实体仅直接包括其唯一识别的账户(例如,其原始实体 的账户),并且间接包括(在单个级别)所有其它账户,其每个账户仍然可以 包括在其唯一识别(例如,原始)的实体中。在图3C中所示的示例中,由于
a3 303可能是账户al 301、 a2 302和a3 303中最老的,a3 303的原始实体的 标识符(例如,标识符"e3"),可以用作融合实体(例如实体e3 313)的标 识符。
由于由方法200建立的、账户及其原始(唯一识别)实体之间的永久身 份连接,可能是这种情况,身份分辨系统109中的任何实体包括账户也"包 括"账户的原始实体,并且相反地对于包括在身份分辨系统109中的实体中 的任何账户,该实体也"包括"账户的原始(或识别)实体。因而,可以认 为下列表达是等效的
-"已经将账户al、 a2和a3融合(或合并)成单个实体el",
- "已经将实体el、 e2和e3融合(或合并)成单个实体el", -"实体el包括账户al、 a2和a3",以及
- "实体el '包括,实体el、 e2和e3"。
换句话说,在使用实体追踪方法200的身份分辨系统(如身份分辨系统109) 中,上述四个表达式可以都具有相同的意义。
图5图示在数据库系统(如数据库系统100)中、使用表(如图4中所 示的实体追踪表401 )的实体追踪方法400的一个示例性实施例。
在处理402,方法400可以创建实体追踪表401,在每行实体追踪表401 中具有用于账户标识符的列411 (标注为账户_标识符),用于原始实体标识 符的列412 (标注为原始一实体—标识符)、以及用于当前实体标识符的列413 (标注为当前—实体—标识符)。例如,在计算机系统106上实施方法400,可 以导致计算机系统106将用于设立实体追踪表401的合适信息写入数据存储 设备102,并且存储在实体追踪表401中的信息同样可以通过计算机系统106, 对身份分辨系统109的用户可访问。
在处理404,响应于账户(例如,al 301 )首次进入身份分辨系统109, 方法400可以创建实体追踪表401的一行421,具有用于该账户的账户标识 符(例如,第一行421中的al 431和实体追踪表401的账户j示识符列411 )、 分配给该账户的唯一实体的原始实体标识符(例如,第一行421中的el441 和原始—实体—标识符列412 )、以及等于原始实体标识符的当前实体标识符(例 如,第一行421中的el 451和当前—实体一标识符列413 )。方法400也可以提 供年龄时标即账户首次进入系统时的原始时标(并且其不改变),使得可以比 较各账户以确定哪个账户最老。
在实体追踪表401中,账户—标识符列411和原始—实体一标识符列412
中的各值可以是静态的,即,当在创建行时设置并且之后不再改变。当前—
实体—标识符列413中的值可以是动态的,即,始终更新以反映实体当前包括 相应账户(即在表的同一行中识别的账户)。例如,在实体追踪表401的第二 行422中,当前一实体—标识符452的值可能已经从其原始值e2 442更新到el 。
实体追踪表401可以用于例如检索下列的任何
任何给定账户的原始实体;
任何给定实体的原始账户;
当前包括任何给定账户的实体;
当前"包括"任何给定实体的实体;
当前由任何给定实体包括的所有账户;或
当前由任何给定实体"包括"的所有实体。
前实体标识符列、设置为包括在该实体中的最老账户的原始实体标识符,为 每个实体提供标识符。例如,在实体追踪表401的第二行422中,当前一实体 —标识符452的值可能已经设置为"el",因为帐户a2 302在其首次进入身份 分辨系统109时(在接收其原始实体标识符e2 442之后),可能已经放置在实 体el 301中,并且al301可能已经是al 301和a2 302中最老的帐户。
在处理408,通过将第一实体的账户和第二实体的账户放入合并的实体 中,并通过将包括在单个实体中的每个账户的行中的当前实体标识符列设置 为包括第一和第二实体中的最老账户的原始实体标识符、给该合并的实体分 配标识符,方法400可以将第一实体和第二实体融合成单个、合并的实体。 例如,在实体追踪表401的行422中,当前—实体—标识符452的值可能已经 从其原始值e2 442设置为"el",因为el 311和e2 312可能已经合并(即, 融合),并且al 301可能已经是al301和a2 302中最老的账户,并且同样地, 在行421中,当前—实体j示识符列413的值可能已经设置为el 451 (或留在 e1451,因为e1451可能已经是其原始值),因为el 311和e2 312可能已经 合并(即,融合),并且al 301可能已经是al 301和a2 302中最老的账户。
图6和7示出了方法500的操作的示例,并且图8图示用于在数据库系 统中(如数据库系统100 )使用表(如表501 )的实体版本追踪的方法500的 实施例。图6和7提供了方法500的操作的特定筒化示例。 在处理502(见图8 ),方法500可以创建实体版本追踪表501(参见图6 ), 其具有用于之前实体版本标识符的列511 (标注为之前一实体—版本—标识符), 用于子实体标识符的列512(标注为子—实体—标识符)、用于分辨类型的列513 (标注为分辩—类型)、用于实体版本标识符的列514 (标注为实体—版本—标 识符)、用于实体标识符的列515 (标注为实体j示识符)、以及用于时标的列 516 (标注为"时标")。对应于在特定时间(例如,时间t0、 tl、 t2等)的特 定实体版本的数据(例如,如图7的示例所示),可以放置在实体版本追踪表 501的每行中。例如,在计算机系统106上实施方法500,可以导致计算机系 统106将用于设立实体版本追踪表501的合适信息写入数据存储设备102, 并且存储在实体追踪表501中的信息同样可以通过计算机系统106,使得对 身份分辨系统109的用户可访问。
在处理504,方法500可以给身份分辨系统109中的每个实体分配标识 符,例如,如由方法300或由方法400分配的,卩吏得例如实体版本追踪表501 可以结合实体追踪表401使用。在处理504,方法500也可以提供用于每个 实体版本的时标。由方法500为每个实体版本提供的时标,可能与由方法300 或400为每个账户提供的年龄时标截然不同,并且单独的维持。
实体版本追踪表501的列511 -516,可以示出身份分辨系统109中的每 个实体的每个版本(历史的和当前的)的结构(例如,由实体包括的)。给出 它的实体j反本一标识符(实体版本追踪表501的实体一版本—标识符列514中 的数据),可以检索任何实体的每个版本。实体版本追踪表501的列也可以允 许从任何时间点至任何其它时间点、向前或向后重建任何实体的历史。例如, 实体的向后历史可以是根源在某时间tn的、图7给出的图形表示中的树,并 且在开始时间t0回到树的叶子。在时间tO,哪一 "叶子"实体将包括在任何 实体的历史树中将不明显。然而,实体版本追踪表501可以包括足够的信息, 以找到任何实体版本的历史树中的所有叶子实体,即使该历史树包括融合和 分解。
实体版本追踪表501的各列可以如图6中所示排序,使得可以以特定方 式从左至右"读,,它们。例如,可以如下读第六行526 (具有下划线的内容)
"在时间U,兰1_的Yl融合成4的Yf'。 可以观察到,上述句子在图7的图形表示中,由在时间t0的版本v3 603和在 时间tl的版本v5 605表示。图7中表示的每个账户可能已经根据方法300或
方法400被分配了实体标识符。图6和7所示的示例可以假设账户al 611 、 a2 612、 a3 613和a4 614以该顺序进入身份分辨系统109中。
图7中示为vl和v2等的实体版本号,可以按序遍及所有实体并非遍及 独立实体分配,如方法500的处理504。例如,如在时间t3存在的el 607的
"第三,,版本,可以标注为"v7"而非"v3"。遍及所有实体分配序列号可以 允许方法500清楚和简明地指定任何实体的任何版本。因而,例如,如果用 户要求el 607的"第三"版本(即,其为图7中的v7 607),而不是直接要求 el的"v7",则身份分辨系统109可能需要搜索实体版本追踪表501。身份分 辨系统109可以易于编程,以在遍及所有实体编序的版本号和遍及独立实体 编序的版本号之间转化,并且因此计算机系统106 (包括GUI (图形用户界 面))可以隐藏该区别。
方法500的操作的一些其它方面,可以从图6中所示的实体版本追踪表 501和图7中所示的相关图形表示中观察。例如,实体版本追踪表501中的 第一批三个粗体(非斜体)行527、 528和529,示出在时间t2 (见表501中 的列516、行527 - 529 )实体el ( v6 606 )的版本6 (v6,见表501中的歹'J 514和图7中的v6 606),可以如图7中所示由子实体el 621、 e2 622和e3 623 组成。由于每个实体具有其自己的唯一原始账户,所以这三个相同的粗体行
(即,行527、 528和529)结合实体追踪表401,可以(通过查看行527、 528和529的子_实体一标识符列512中所示的al 611、 a2 612和a3 613的原 始实体标识符"el"、 "e2,,和"e3")指示el的v6( v6 606 )可以由账户al 611、 a2 612和a3 613构成,通过查看v6 606的结构该el的v6也能在图7中见到。 相同的行527、 528和529也可以指示哪些实体(的历史版本)融合(每行 527、 528和529在分辩—类型中具有R)在一起来创建el的v6(v6 606),例 如
el的vl (行527的之前一实体—版本—标识符,子一实体—标识符); e2的v5 (行528的之前—实体—版本_标识符,子—实体一标识符); e3的v5 (行529的之前—实体—版本一标识符,子_实体—标识符)
组合以创建el的v6 (v6 606)。如图7中可见,可以观察到在时间t0、 tl和
t2图形表示了这些关系。
相似地,斜体粗行(行534和535 )示出了 el的v8 ( v8 608 )可以包括
子实体el 621和e3 623 (表501的列512 (行534和535 )分别示出了账户
al 621和a3 623的实体标识符"el"和"e3",使得实体el的v8 ( v8 608 ) 可以被认为包括账户al 621和a3 623,如图7中时间t4处可见)。更特别地, 行534和535示出了 el的v8 ( v8 608 )可能已经从v7 607分解(每行534 和535在分辩_类型列513中具有U),例如
el的v7 (行534的之前_实体一版本一标识符,子_实体—标识符); e3的v7 (行535的之前—实体一版本—标识符,子_实体一标识符)。 如图7中可见,可以观察到在时间t3和t4图形表示了这些关系。因此,实体 版本追踪表501可用于追踪身份分辨系统109中的任何实体的任何部分或完 整历史。
因此,当身份分辨系统109创建实体的新版本时,在处理506,方法500 可以在实体版本追踪表501中创建新行,所述实体版本追踪表501具有新版 本(例如,如在处理504遍及所有实体分配)的版本号(在实体—版本_标识 符列514中);用于其中存在新版本的实体的实体标识符(在实体_标识符列 515中);以及实体的新版本的时标(在"时标"歹'j 516中)。方法500也可 以例如通过在分辩—类型列中(分别地)输入R或U,指示创建新版本的操作 类型(例如,融合或分解)。如上所述,方法500也可以通过将适于新版本的 历史的数据,放置在为新实体版本创建的每行的之前一实体—版本_标识符列 511和子_实体_标识符列512中,创建新实体版本的各行。
本发明能够采取完全硬件实施例、完全软件实施例或者包括硬件和软件 元件的实施例的形式。在优选实施例中,本发明以软件实现,该软件包括但 不局限于固件、驻留软件、微代码等。
此外,本发明能够采取从计算机可使用的、或计算机可读的介质中可访 问的计算机程序产品的形式,该产品提供程序代码用于由或结合计算机或任 何指令执行系统使用。为了该描述的目的,计算机可使用的或计算机可读的 介质能够是任何装置,其能够包括、存储、传达、传播或传送该程序,用于 由或结合指令执行系统、装置或设备使用。
该介质能够是电、磁、光、电^ 兹、红外或半导体系统(或装置或设备) 或者传播介质。计算机可读介质的示例包括半导体或固态存储器、磁带、可 移除计算机盘、随机存取存储器(RAM)、只读存储器(ROM)、刚性磁盘和 光盘。光盘的当前示例包括致密盘-只读存储器(CD-ROM))、致密盘-读 /写(CD-R/W)和DVD。
适于存储和/或执行程序代码的数据处理系统将包括至少 一个处理器,其 通过系统总线直接或间接耦合到存储器元件。存储器元件能够包括实际执行 程序代码期间采用的本地存储器、大容量存储和高速緩沖存储器,其提供至 少部分程序代码的暂时存储,以便减少执行期间必须从大容量存储中检索代 码的次数。
输入/输出或I/0设备(包括但不局限于键盘、显示器、指示设备等)能 够直接或通过中间I/O控制器耦合到系统。网络适配器也可以耦合到系统, 以使得数据处理系统通过中间的私用或公用网络,变为与其它数据处理系统 或远程打印机或存储设备耦合。调制解调器、电缆调制解调器和以太网卡仅 是少数当前可用的网络适配器类型。
当然,应当理解的是,前述涉及本发明的示例性实施例,并且可以进行 各种修改而不偏离在权利要求中提出的本发明的精神和范围。
权利要求
1.一种用于在数据库中追踪实体的计算机实现的方法,包括为多个账户中的每个账户分配只属于该账户的唯一原始实体标识符,其中该唯一原始实体标识符是分配唯一原始实体的唯一实体标识符,该唯一原始实体仅包括该账户而不包括其它账户;以及保持追踪多个账户中的每个账户的年龄。
2. 根据权利要求1所述的方法,其中该唯一原始实体的标识符是包括在该唯一原始实体中的最老账户的唯一 原始实体标识符。
3. 根据权利要求1所述的方法,其中该唯一原始实体的标识符是包括在该唯一原始实体中的最新账户的唯一 原始实体标识符。
4. 根据权利要求1所述的方法,其中在第 一账户是包括了在唯一原始实体中包括的所有账户的大多数标识符 的唯一账户的情况下,该唯一原始实体的标识符是第一账户的唯一原始实体 标识符;以及在第二账户包括了在唯一原始实体中包括的所有账户的大多数多标识 符、并且是包括了在唯一原始实体中包括的所有账户中最老的情况下,该唯 一原始实体的标识符是第二账户的唯一原始实体标识符。
5. 根据权利要求1所述的方法,还包括通过下述步骤将第一实体和第二实体融合成单个实体 将第一实体的第一组账户和第二实体的第二组账户放置在单个实体中,以形成单个实体的单组账户;以及将标识符分配该单个实体,其中分配的标识符是单个实体的单组账户中 最老账户的唯一原始实体标识符。
6. 根据权利要求1所述的方法,还包括 通过下述步骤将第一实体分解成第二实体和第三实体 将第一实体的第一组账户放置在第二实体中;将第 一实体的第二组账户放置在第三实体中,其中多个账户中的账户不 同时包括在第 一组账户和第二组账户中; 将第一标识符分配给第二实体,其中分配的第一标识符是第一组账户的 最老账户的唯一原始实体标识符;以及将第二标识符分配给第三实体,其中分配的第二标识符是第二组账户的最老账户的唯一原始实体标识符。
7. 根据权利要求1所述的方法,还包括 为每个账户分配年龄时标。
8. —种用于数据库的身份分辨系统,所述数据库正由身份分辨系统访问, 该身份分辨系统包括创建具有账户标识符列、原始实体标识符列、以及当前实体标识符列的 实体追踪表;以及响应于账户进入身份分辨系统,创建实体追踪表行,具有用于账户的账 户标识符、分配给该账户的唯一实体的原始实体标识符、以及等于原始实体 标识符的当前实体标识符。
9. 根据权利要求8所述的系统,该系统还包括响应于账户首次进入身份分辨系统,为该账户提供年龄时标。
10. 根据权利要求8所述的系统,该系统还包括通过将包括在实体中的每个账户的行中的当前实体标识符列设置为包括 在该实体中的最老账户的原始实体标识符,为每个实体提供标识符。
11. 根据权利要求8所述的系统,该系统还包括通过下述步骤将第一实体和第二实体融合成单个实体 将第一实体的账户和第二实体的账户放置在单个实体中;以及通过将包括在该单个实体中的每个账户的行中的当前实体标识符列设置 为包括第 一和第二实体中的最老账户的原始实体标识符,给该单个实体分配 标识符。
12. 根据权利要求8所述的系统,该系统还包括响应于账户首次进入身份分辨系统,为账户提供年龄时标,其中年龄时 标不改变。
13. 根据权利要求8所述的系统,该系统还包括在身份分辨系统中找到任何给定账户的原始实体,其中该原始实体是响 应于进入身份分辨系统的给定账户,分配给给定账户的唯一实体。
全文摘要
一种在数据库系统中追踪实体用于身份分辨的方法,包括为多个账户的每个账户分配只属于该账户的唯一实体,并且该实体中包括该账户;保持追踪多个账户的每个账户的年龄;并且将标识符分配给任何实体作为包括在实体中的最老账户的唯一实体的标识符。该简单的将标识符分配账户和实体的方法解决了本领域中已知的大量身份分辨问题,包括丢失实体标识符问题、丢失实体版本问题、实体切换热体/账户问题、以及账户漂移问题。
文档编号G06F17/30GK101183375SQ20071016579
公开日2008年5月21日 申请日期2007年11月9日 优先权日2006年11月17日
发明者布兰德·L·亨特, 马克·M·梅佐芬伊 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1