用于数据匹配和匿名化的设备和方法与流程

文档序号:11935262阅读:来源:国知局

技术特征:

1.一种方法,包括:

接收多个数据集,每个数据集包括客户标识符字段,客户标识符字段指定与每个数据集中的每个条目关联的唯一客户标识符,所述多个数据集包括第一组数据集和第二组数据集,每个数据集根据客户标识符可与每个其他数据集关联;

保存所述多个数据集;

生成包括客户标识符字段和匿名标识符字段的键映射表,键映射表的客户标识符字段包括所述多个数据集中的第一组数据集的唯一客户标识符,匿名标识符字段包括唯一匿名标识符,每个匿名标识符对应于键映射表的客户标识符,每个匿名标识符不同于其对应的客户标识符;

保存键映射表;和

通过根据键映射表用对应的匿名标识符替换第二组数据集中的每个唯一客户标识符,致使第二组数据集中的每个数据集不可与第一组数据集中的每个数据集关联,还包括根据匿名标识符,致使第二组数据集中的每个数据集可与第二组数据集中的每个其他数据集关联。

2.按照权利要求1所述的方法,其中键映射表被保存在与多个数据集不同的位置中。

3.按照权利要求1所述的方法,还包括在不采用第一组数据集或键映射表的情况下,根据与第二组数据集的第一数据集中的第一条目关联的匿名标识符,使所述第一条目与第二组数据集的第二数据集中的第二条目相关。

4.按照权利要求1所述的方法,还包括删除键映射表。

5.按照权利要求1所述的方法,还包括利用选自以下:公钥加密方案和对称密钥加密方案的加密方案,对键映射表加密。

6.按照权利要求1所述的方法,其中第一组数据集包括多个家庭的人口统计信息,第二组数据集包括多个家庭的交易信息。

7.一种方法,包括:

接收包括客户标识符字段的参照数据集,参照数字集的客户标识符字段指定与参照数据集中的每个条目关联的唯一客户标识符;

接收包括客户标识符字段的第一数据集,第一数据集的客户标识符字段指定与第一数据集中的每个条目关联的唯一客户标识符,根据客户标识符字段,第一数据集可与参照数据集关联;

保存参照数据集和第一数据集;

通过根据键映射表用对应的匿名标识符替换第二数据集的每个唯一客户标识符,致使第一数据集不可与参照数据集关联,键映射表包括客户标识符字段和匿名标识符字段,键映射表的客户标识符字段包括第二数据集的唯一客户标识符,匿名标识符字段包括唯一匿名标识符,每个匿名标识符对应于键映射表的客户标识符,每个匿名标识符不同于其对应的客户标识符;

接收一个或多个另外的数据集,每个另外的数据集包括客户标识符字段,所述一个或多个另外的数据集根据客户标识符字段可与参照数据集关联,并不可与第一数据集关联;

通过根据键映射表,将每个另外的数据集中的每个唯一客户标识符替换为其对应的匿名标识符,致使所述一个或多个另外的数据集不可与参照数据集关联,所述致使包括根据匿名标识符字段,致使所述一个或多个另外的数据集可与第一数据集关联。

8.按照权利要求7所述的方法,其中键映射表被保存在与参照数据集和第一数据集不同的位置中。

9.按照权利要求7所述的方法,还包括使参照数据集中的第一条目与第一数据集中的第二条目相关,包括:

在参照数据集中,识别与第一条目关联的客户标识符;

在键映射表中,识别与识别的第一标识符对应的匿名标识符;

识别与识别的匿名标识符对应的第一数据集中的第二条目;和

返回与参照数据集中的第一条目相关的第一数据集中的第二条目。

10.按照权利要求7所述的方法,还包括删除键映射表。

11.按照权利要求7所述的方法,还包括利用选自以下:公钥加密方案和对称密钥加密方案的加密方案,对键映射表加密。

12.按照权利要求7所述的方法,其中参照数据集包括多个家庭的人口统计信息,所述第一数据集和所述另外的数据集中的至少一个包括多个家庭的交易信息。

13.按照权利要求7所述的方法,还包括:

在不采用参照数据集或键映射表的情况下,根据与第一数据集中的第一条目关联的匿名标识符,使所述第一条目与所述另外的数据集之一中的第二条目相关。

14.按照权利要求7所述的方法,还包括:

生成包括客户标识符字段和匿名标识符字段的键映射表;和

把键映射表保存在与参照数据集、第一数据集以及所述一个或多个另外的数据集不同的位置。

15.一种设备,包括:

数据模块,所述数据模块被配置成:

接收多个数据集,每个数据集包括客户标识符字段,客户标识符字段指定与每个数据集中的每个条目关联的唯一客户标识符,所述多个数据集包括第一组数据集和第二组数据集,每个数据集根据客户标识符可与每个其他数据集关联;和

保存所述多个数据集;

键模块,所述键模块被配置成生成包括客户标识符字段和匿名标识符字段的键映射表,键映射表的客户标识符字段包括所述多个数据集中的第一组数据集的唯一客户标识符,匿名标识符字段包括唯一匿名标识符,每个匿名标识符对应于键映射表的客户标识符,每个匿名标识符不同于其对应的客户标识符,

所述数据模块还被配置成保存键映射表,

所述键模块还被配置成通过根据键映射表用对应的匿名标识符替换第二组数据集中的每个唯一客户标识符,致使第二组数据集中的每个数据集不可与第一组数据集中的每个数据集关联,包括根据匿名标识符,致使第二组数据集中的每个数据集可与第二组数据集中的每个其他数据集关联。

16.按照权利要求15所述的设备,其中数据模块还被配置成把键映射表保存在与第一组数据集和第二组数据集不同的位置。

17.按照权利要求15所述的设备,其中数据模块还被配置成通过以下操作使第二组数据集的第一数据集中的第一条目与第二组数据集的第二数据集中的第二条目相关:

在第一数据集中识别与第一条目相关的匿名标识符;

识别与识别的匿名标识符对应的第二数据集中的第二条目;和

返回与第一数据集中的第一条目关联的第二数据集中的第二条目。

18.按照权利要求15所述的设备,数据模块还被配置成删除键映射表。

19.按照权利要求15所述的设备,还包括被配置成利用选自以下:公钥加密方案和对称密钥加密方案的加密方案,对键映射表加密的加密模块。

20.按照权利要求15所述的设备,其中第一组数据集包括多个家庭的人口统计信息,第二组数据集包括多个家庭的交易信息。

21.一种方法,包括:

接收包括客户标识符字段的第一数据集,所述客户标识符字段指定与第一数据集中的每个条目关联的唯一客户标识符;

保存第一数据集;

根据键映射表,用对应的匿名标识符替换第一数据集的每个唯一客户标识符,键映射表包括客户标识符字段和匿名标识符字段,键映射表的客户标识符字段包括第一数据集的唯一客户标识符,匿名标识符字段包括唯一匿名标识符,每个匿名标识符对应于键映射表的客户标识符,每个匿名标识符不同于其对应的客户标识符;

接收一个或多个另外的数据集,每个另外的数据集包括客户标识符字段,所述一个或多个另外的数据集不可与第一数据集关联;

通过根据键映射表,将每个另外的数据集中的每个唯一客户标识符替换为其对应的匿名标识符,根据匿名标识符致使所述一个或多个另外的数据集可与第一数据集关联。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1