本公开涉及参考源匹配的准确性。
背景技术:
1、实体维护着大量的可能是杂乱无章的和/或不完整的数据。例如,实体可以维护与对象(subject)(例如个体,产品,组织等)相关的多个不完整记录。一个记录可以包含对象的地址,电子邮箱,性别,和地理位置,而另一个记录可以包含对象的姓名,地址,电话号码,出生日期,和信用卡信息。这些记录中的每一个都可以是不完整的。产品和组织可存在类似的不完整记录。目前,希望统一(reconcile)这些分离的记录的实体通常必须手动组合这些记录,这导致了过程效率低下而且耗时,并可能接触到个人身份信息。
2、由于数据源众多,对数据资产之间的匹配(matches)进行链接,去重,或寻找仍然是大多数组织的最大问题之一。为满足客户和业务利益相关者的需求而进行的多渠道数据收集和内部拷贝造成了协调方面的问题。像不完整性,数据条目错误,和随时间变化等其他问题使得难以建立数据的主(即“黄金”)记录。
3、实体面临的另一个问题是确保他们可拥有的记录具有数据完整性。例如,实体可具有看似与同一数据对象相关联的两个不完整记录。但是,一个记录可列出与另一个记录不同的电子邮箱地址或电话号码。这种数据差异会降低数据记录的完整性,并使实体更难统一多个不完整的数据记录,因为实体会不确定哪个记录是真正正确的。此外,实体会不确定某一记录在多大程度上是正确的。现代企业在准确的数据收集和统一方面受到阻碍。
4、因此,对一些系统和方法的需求不断增加,这些系统和方法能够应对现代数据收集和统一方面的挑战,包括将同一数据对象的多个不完整记录进行匹配时效率低下,当记录不一致时丧失完整性,以及当作出此类对数据记录进行匹配和统一的尝试时可能接触到个人身份信息(pll),敏感业务信息,和/或任何形式的机密信息。
5、针对这些和其它一般考虑,作出了本文所公开的多个方面。此外,尽管可以讨论相对具体的问题,但应当理解,这些示例不应被局限于解决在本公开的背景技术或其他地方确定(identified)的具体问题。
技术实现思路
1.一种参考源匹配系统,包括:
2.如权利要求1所述的系统,其中来自所述第一源的所述至少一个令牌与至少两个数据记录相关联。
3.如权利要求1所述的系统,其中所述至少一个通用参考令牌储存库包括以下至少一项:客户令牌和参考源令牌。
4.如权利要求1所述的系统,其中所述第一源是以下至少一项:客户源和参考源。
5.如权利要求1所述的系统,其中所述第二源是以下至少一项:客户源和参考源。
6.如权利要求1所述的系统,其被配置为将来自所述第一源的所述至少一个令牌与来自所述第二源的所述至少一个令牌进行比较,其中所述比较应用以下至少一项:ab匹配和传递匹配。
7.如权利要求4所述的系统,其中所述参考源是以下至少一项:政府实体,信用局,和银行。
8.如权利要求6所述的系统,其中所述比较还包括在至少两个客户令牌和至少一个参考源令牌之间应用传递匹配。
9.如权利要求6所述的系统,其中所述比较还包括在以下至少一项之间应用ab匹配:两个客户令牌和两个参考源令牌。
10.如权利要求4所述的系统,其中所述参考源是通用参考源,其中所述通用参考源包括多个参考源。
11.一种创建通用令牌储存库的方法,包括:
12.如权利要求11所述的方法,其中来自所述第一源的所述至少一个令牌和来自所述第二源的所述至少一个令牌用相同的加密算法加密。
13.如权利要求11所述的方法,还包括:
14.如权利要求13所述的方法,其中所述第三源是以下至少一项:客户源和参考源。
15.如权利要求14所述的方法,其中所述参考源是以下至少一项:政府,信用局,和银行。
16.如权利要求11所述的方法,还包括:
17.如权利要求16所述的方法,其中所述第三源是以下至少一项:客户源和参考源。
18.如权利要求16所述的方法,其中所述第四源是以下至少一项:客户源和参考源。
19.如权利要求11所述的方法,其中所述独特令牌包括置信度值,其中所述置信度值表示准确度。
20.一种计算机可读介质,其存储有非暂时性计算机可执行指令,当执行该指令时使计算系统执行参考源匹配方法: