基于数据匿名化的多层存储的制作方法

文档序号:9401964阅读:364来源:国知局
基于数据匿名化的多层存储的制作方法
【专利说明】
【背景技术】
[0001]可以使数据匿名化以向与该数据相关联的人和/或团体提供匿名。可以使用数据匿名化(anonymizat1n)技术来模糊数据的一部分,使得更难以使数据与特定的个人或团体相关联。例如在数据包括诸如与健康护理、银行业务记录或被视为私密的其他数据相关的信息之类的个人信息的情况下,数据匿名化可能是希望的。
【附图说明】
[0002]附图描述了示例实施例。以下的详细描述参考附图,其中:
图1是图示基于匿名化的多层存储系统的一个示例的框图。
[0003]图2是图示基于数据匿名化创建多层存储的方法的一个示例的流程图。
[0004]图3A是图示基于数据匿名化的多层存储的一个示例的框图。
[0005]图3B是图示基于添加新的数据层来更新在多层存储中的数据层的一个示例的框图。
[0006]图3C是图示更新多层存储以移除层中的一个的一个示例的框图。
【具体实施方式】
[0007]在一个实现中,多层存储系统使数据的不同层与不同用户组相关联,并且每层具有不同的统计数据匿名化级别。不同用户组可以与用于数据访问的不同层相关联,使得他们接收具有不同匿名化级别的数据。匿名化可以基于例如用户组的可信性(trustworthiness)和/或用户组的特定的数据使用。
[0008]可以确定以适当的匿名化置信水平使数据匿名化的匿名化方案。匿名化方案涉及哪些数据将模糊和可以基于隐私和有效性的比较确定的模糊的方式。例如,处理器可以将使数据记录与个人相关联的可能性分析成在提供被用于在用户的数据分析中的正确结果的信息中如被匿名化的数据的有效性。在一个实现中,处理器不断地更新数据库层、匿名化级别和/或用户组分派来维持期望的匿名化和有效性级别。
[0009]利用将由不同用户组访问的不同匿名化方案使数据的一部分匿名化并且分离地存储数据可以允许在具有不同访问级别的不同用户组之间使用相同的数据模式。另外,具有访问的多个数据层的匿名化方案可以提供比存储匿名化的所有数据更大的安全性,其中响应于用户查询某些组被提供用于反转匿名化的信息。
[0010]图1是图示基于匿名化的多层存储系统的一个示例的框图。例如,计算系统100可以将项目存储在具有多个数据层的存储系统中,其中不同用户组访问不同层。不同层具有不同的统计匿名化级别,使得某些级别以具有能够反转匿名化方案以使数据与个人和/或团体相关联的较低可能性的方式存储数据。作为示例,层可以被分成公共的、混合的和私有的云。从公共的云可用的数据可以具有比在私有的云中可用的数据更大的匿名化置信水平,并且混合的云可以以在公共的和私有的云的匿名化的置信水平中间的匿名化置信水平来存储数据。计算系统100可以包括处理器101、机器可读存储介质102和记忆装置106。可以将计算系统100包括在单个或多个装置中。
[0011]记忆装置106可以是用于存储由处理器101可访问的数据的任何合适的记忆装置。在某些实现中,可以将记忆装置106和机器可读存储介质102包括在相同的设备中。记忆装置106可以包括第一数据层107和第二数据层108。记忆装置106可以包括任何数量的数据层。可以将数据层107和108存储在相同的设备中或不同的设备中。例如,可以将数据层107中的每个存储在单独的web服务器中。用户可以经由网络访问在记忆装置106中的不同层。数据层107和108可以存储具有不同匿名化级别的相同基础数据,使得不同的用户集合与数据层107和108中的每个相关联,允许用户的不同集合访问具有不同匿名化级别的数据。
[0012]处理器101可以是中央处理单元(CPU)、基于半导体的微处理器或适于指令的取回和执行的任何其他设备。作为替代或除获取、解码和执行指令之外,处理器101还可以包括一个或多个集成电路(IC)或其他电子电路,所述其他电子电路包括用于执行下文描述的功能的多个电子部件。可以由多个处理器执行下文描述的功能。
[0013]处理器101可以与机器可读存储介质102通信。机器可读存储介质102可以是任何合适的机器可读介质,诸如存储可执行指令或其他数据(例如,硬盘驱动器、随机访问存储器、闪存等)的电子的、磁的、光学的或其他物理的存储设备。机器可读存储介质102可以是例如计算机可读非瞬时介质。机器可读存储介质102可以包括数据匿名化指令103、数据存储指令104和用户访问权限相关联指令105。
[0014]数据匿名化指令103可以包括使数据的至少一部分匿名化的指令。可以从与数据库层中的一个相关联的用户接收数据或者可以从另一记忆装置接收数据。计算系统100可以包括用于向不同的存储层发送数据的集中式处理器。在一个实现中,集中式处理器在向数据层发送数据之前执行匿名化。在一个实现中,记忆装置106包括其中不同层彼此通信的分层结构。当与层相关联的用户尝试存储数据时,与用户相关联的数据层可以将信息传输到其他层用于存储。接收的数据层可以与处理器相关联以在存储之前使数据匿名化。
[0015]数据匿名化指令103可以包括用于确定匿名化方案的指令,诸如将使数据的哪部分匿名化和/或用于数据的匿名化方法。例如,在更多字段被匿名化、与个人更高度相关的字段被匿名化的情况下和/或匿名化方法更难以反转的情况下可以实现匿名化中的较高的统计置信。数据匿名化指令103可以包括用于基于数据将被存储在其中的哪层使数据匿名化的指令。可以基于关于针对特定组访问匿名化的数据的数据的使用和匿名化的置信水平的信息来执行匿名化。例如,可以提供指示反转匿名化而虽然匿名化但仍标识与数据记录相关联的个人或团体的统计机会的优选的匿名化级别。还可以提供关于到与特定层相关联的用户组的不同的数据字段的优先级的信息。例如,可能存在对于执行用户功能而言必要的某些字段、期望的某些字段和不相关的其他字段。数据匿名化指令103可以包括用于确定用于以将较高优先级字段中的更多字段保留到用户组的方式使数据匿名化到优选级别的方式的指令。例如,可以选择数据字段和数据字段标签用于匿名化,并且可以选择匿名化令牌或随机值(nonce)。可以针对可以被存储在数据层中的每个类型的记录确定匿名化方案。
[0016]数据存储指令104可以包括用以将接收的数据存储在记忆装置106中的指令。数据存储指令104可以包括用于将接收的数据存储在相关联的数据层中,所述数据层具有与该层相关联的数据的匿名化级别。例如,数据可以被接收并且被存储在第一数据层107中。数据可以被匿名化并且被存储在第二数据层108中。相同的数据可以被存储在具有模糊的和/或以不同方式模糊的不同的数据的两个位置中。稍后可以针对特定层更新匿名化级别,例如通过详细描述在特定数据字段中的数据使得其不再作为匿名化方案的部分被模糊。更新可以发生在特定层中而不对存储在其他层中的相同数据做出改变。
[0017]用户访问权限关联指令105可以包括用于将用户和/或用户组分派到记忆装置106层的指令。可以基于将与用户相关联的隐私级别使该用户与层相关联。例如,第一用户可以被视为更可信的用户。在某些情况下,考虑用户的数据使用的目的。例如,可以通过使不同的字段匿名化来实现在匿名化中的相同级别的统计置信,并且可以将用户组分派到具有对不作为匿名化的部分被模糊的用户组的用户重要的字段的层。
[0018]用户可以与数据层相关联,使得从相关联的层取回针对数据的用户请求。当用户存储数据时,与该层相关联的处理器可以向其他数据层发送数据以利用针对其他数据层的适当的匿名化级别进行存储。在某些实现中,通过将数据发送到层中的每个的中央处理器执行数据存储。在某些实现中,接收层将信息发送到在匿名化中的层之上和之下的层,并且那些数据层然后将信息传播到其他层以利用适当的匿名化级别和方案进行存储。
[0019]图2是图示基于数据匿名化创建多层存储的方法的一个示例的流程图。每层可以与不同用户组相关联并且可以具有匿名化的不同统计级别。例如,第一组可以与较低的访问级别和较高的匿名化的级别相关联。可以例如通过使更多的数据字段匿名化和/或利用更难以反转的方案使它们匿名化来实现较高的匿名化的级别。第二用户组可以与较高的访问的级别相关联,诸如在第二用户组很可能使用更多的数据字段和/或是更可信的用户的组的情况下。在一个实现中,通过图1的计算系统100实现该方法。
[0020]在20
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1