基于具有生命周期的容器的大数据分级脱敏方法和系统与流程

文档序号:20875641发布日期:2020-05-26 16:28阅读:267来源:国知局
基于具有生命周期的容器的大数据分级脱敏方法和系统与流程

本发明涉及数据加密技术领域,尤其涉及一种基于具有生命周期的容器的大数据分级脱敏方法和系统。



背景技术:

随着大数据技术的迅猛发展,大量敏感信息积累在企业的信息系统中。企业的正常生产经营极度依赖于信息系统的数据安全保障,一旦信息系统内数据保护不当,导致企业的经营信息、重要人员信息、客户信息、核心产品技术信息等商业机密泄露或被窃取,将造成企业生产经营方面的重大风险与隐患。尤其是企业信息系统中大量涉及企业上下游客户资料、供应链交易明细信息等敏感数据信息,已成为追逐政治或经济利益的网络犯罪集团及个人关注和攻击的主要目标。

敏感数据在其生命周期的各个环节,也即数据的产生、存储、应用、交换等环节中均存在被泄露和攻击的风险。因此,加强对企业信息系统中数据的保护力度是有效维护企业自身权益,确保企业保值、增值的必要前提和重要途径。

一方面,传统的脱敏技术方法多以静态脱敏为主,设计流程固定,工具能力有限,专用性较强,配置规则复杂,维护困难,而且现有计算机硬件以及破解软件的算法越来越先进,传统的脱敏算法会很容易被破解。一旦脱敏算法被破解,那么经过批量还原处理就可以获得真实数据,造成敏感数据的严重泄露。

另一方面,由于信息化不断深入,业务系统的数据量越来越大,数据产生速度越来越快,短短几天内的数据量就能达到之前10年全部的信息容量。其中敏感信息的数据量也是飞速增长,达到tb、pb量级,而传统的脱敏技术方法多为针对关系型数据库的脱敏技术及产品,面对如此大容量的敏感数据时,很难有效地处理与解决敏感数据脱敏问题。



技术实现要素:

针对现有技术中静态脱敏算法易被破解,以及敏感数据量级大,很难有效地处理与解决敏感数据脱敏的技术问题,本发明提供一种基于具有生命周期的容器的大数据分级脱敏方法和系统,以解决目前大数据脱敏方法安全性和可靠性不足的问题。

第一方面,本发明提供一种基于具有生命周期的容器的大数据分级脱敏方法,所述方法包括:

对预先生成的预脱敏数据进行数据清理生成敏感数据,并识别所述敏感数据以确定敏感数据的第一类型,以及对所述敏感数据进行分级,确定敏感等级;

对每个敏感等级的第一类型的敏感数据,按照数据使用对象和数据内容价值的不同进行分类,确定每个敏感等级的第一类型的敏感数据的第二类型;

创建具有生命周期的容器,并基于虚拟出的网络层,向所述容器分配网络地址,根据所述容器的端口信息和向所述容器分配的网络地址,确定并存储所述容器的端口与网络地址的映射关系;

基于所述容器的端口与网络地址的映射关系,将已经确定等级的敏感数据存储至所述具有生命周期的容器;

根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法后建立各自对应的数据脱敏模型;

根据建立的数据脱敏模型对对应第二类型的敏感数据进行脱敏,并将脱敏后的数据存储在具有生命周期的容器中;

响应指定对象发送的数据获取请求,将存储在所述容器中的脱敏后数据传输至所述指定对象,其中,当容器中的数据的存储时长达到预定时长,和/或在将存储至所述容器中的数据传输至所述指定对象之后,则容器的生命周期结束,销毁容器,并删除容器中存储的数据。

进一步地,所述方法在之前还包括生成预脱敏数据,所述生成预脱敏数据包括:

通过大数据抽取工具提取业务系统中分布的、异构数据源中的源数据,其中,所述源数据包括结构化数据和非结构化数据;

将所述源数据经过清洗、转化、整合、结构化操作后生成预脱敏数据,并传输至大数据存储系统中的脱敏数据库。

进一步地,对预先生成的预脱敏数据进行数据清理生成敏感数据,并识别所述敏感数据以确定敏感数据的第一类型,以及对所述敏感数据进行分级,确定敏感等级包括:

对所述预先生成的预脱敏数据进行数据清理,消除所述预脱敏数据中的重复值、缺失值和异常值后生成敏感数据;

对所述敏感数据按照数据属性的不同进行划分,确定敏感数据的第一类型;

根据敏感数据的机密性、完整性和可用性评估其安全价值,确定其敏感等级。

进一步地,所述根据敏感数据的机密性、完整性和可用性评估其安全价值,确定其敏感等级包括:

对敏感数据按照预先设定的每个安全价值评分项的分值区间进行评分,其中,所述安全价值评分项包括敏感数据是否能直接识别出特定的企业对象,与企业对象的实际经营活动状态是否密切相关,通过该数据信息是否能获得其他关联信息,使用该数据信息可能对企业造成潜在经济损失与带来潜在信息威胁的程度;

将所述敏感数据每个安全价值评分项的评分进行求和,确定所述敏感数据的安全价值评分;

根据敏感等级与安全价值评分的对应关系,确定所述敏感数据的敏感等级。

进一步地,基于所述容器的端口与网络地址的映射关系,将已经确定等级的敏感数据存储至所述具有生命周期的容器包括:

对接收的敏感数据报文的协议字段进行解析,确定敏感数据报文的目的网络地址;

基于网络地址与容器端口的映射关系,确定敏感数据报文的目的网络地址对应的容器端口;

根据敏感数据报文的目的网络地址对应的容器端口,将敏感数据分发至具有生命周期的容器的相应存储位置。

进一步地,根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法后建立各自对应的数据脱敏模型包括:

根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法,其中,所述脱敏算法是不可逆的,并且是自动化、可重复的;

基于每种第二类型的敏感数据配置的脱敏算法建立数据脱敏模型,其中,所述数据脱敏模型满足脱敏后的数据具有原数据的特征,且数据的完整性尽可能予以保留,对所有具有关联性及可能生成敏感数据的非敏感字段同样进行脱敏处理,以及可对脱敏后的数据标记敏感等级。

第二方面,本发明提供一种基于具有生命周期的容器的大数据分级脱敏系统,所述系统包括:

敏感等级单元,其用于对预先生成的预脱敏数据进行数据清理生成敏感数据,并识别所述敏感数据以确定敏感数据的第一类型,以及对所述敏感数据进行分级,确定敏感等级;

数据分类单元,其用于对每个敏感等级的第一类型的敏感数据,按照数据使用对象和数据内容价值的不同进行分类,确定每个敏感等级的第一类型的敏感数据的第二类型;

容器建立单元,其用于创建具有生命周期的容器,并基于虚拟出的网络层,向所述容器分配网络地址,根据所述容器的端口信息和向所述容器分配的网络地址,确定并存储所述容器的端口与网络地址的映射关系;

数据存储单元,其用于基于所述容器的端口与网络地址的映射关系,将已经确定等级的敏感数据存储至所述具有生命周期的容器;

脱敏模型单元,其用于根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法后建立各自对应的数据脱敏模型;

数据脱敏单元,其用于根据建立的数据脱敏模型对对应第二类型的敏感数据进行脱敏,并将脱敏后的数据存储在具有生命周期的容器中;

数据传输单元,其用于响应指定对象发送的数据获取请求,将存储在所述容器中的脱敏后数据传输至所述指定对象,其中,当容器中的数据的存储时长达到预定时长,和/或在将存储至所述容器中的数据传输至所述指定对象之后,则容器的生命周期结束,销毁容器,并删除容器中存储的数据。

进一步地,所述系统还包括数据预处理单元,其用于生成预脱敏数据,其中,所述数据预处理单元包括:

数据提取单元,其用于通过大数据抽取工具提取业务系统中分布的、异构数据源中的源数据,其中,所述源数据包括结构化数据和非结构化数据;

数据处理单元,其用于将所述源数据经过清洗、转化、整合、结构化操作后生成预脱敏数据,并传输至大数据存储系统中的脱敏数据库。

进一步地,敏感等级单元包括:

敏感数据单元,其用于对所述预先生成的预脱敏数据进行数据清理,消除所述预脱敏数据中的重复值、缺失值和异常值后生成敏感数据;

数据划分单元,其用于对所述敏感数据按照数据属性的不同进行划分,确定敏感数据的第一类型;

等级确定单元,其用于根据敏感数据的机密性、完整性和可用性评估其安全价值,确定其敏感等级。

进一步地,所述等级确定单元根据敏感数据的机密性、完整性和可用性评估其安全价值,确定其敏感等级包括:

对敏感数据按照预先设定的每个安全价值评分项的分值区间进行评分,其中,所述安全价值评分项包括敏感数据是否能直接识别出特定的企业对象,与企业对象的实际经营活动状态是否密切相关,通过该数据信息是否能获得其他关联信息,使用该数据信息可能对企业造成潜在经济损失与带来潜在信息威胁的程度;

将所述敏感数据每个安全价值评分项的评分进行求和,确定所述敏感数据的安全价值评分;

根据敏感等级与安全价值评分的对应关系,确定所述敏感数据的敏感等级。

进一步地,数据存储单元包括:

数据解析单元,其用于对接收的敏感数据报文的协议字段进行解析,确定敏感数据报文的目的网络地址;

端口确定单元,其用于基于网络地址与容器端口的映射关系,确定敏感数据报文的目的网络地址对应的容器端口;

数据分发单元,其用于根据敏感数据报文的目的网络地址对应的容器端口,将敏感数据分发至具有生命周期的容器的相应存储位置。

进一步地,脱敏模型单元包括:

算法配置单元,其用于根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法,其中,所述脱敏算法是不可逆的,并且是自动化、可重复的;

模型建立单元,其用于基于第二类型的敏感数据配置的脱敏算法建立数据脱敏模型,其中,所述数据脱敏模型满足脱敏后的数据具有原数据的特征,且数据的完整性尽可能予以保留,对所有具有关联性及可能生成敏感数据的非敏感字段同样进行脱敏处理,以及可对脱敏后的数据标记敏感等级。

综上,本发明提供的基于具有生命周期的容器的大数据分级脱敏方法和系统。所述方法和系统通过对敏感数据进行分级,并通过创建具有生命周期的容器,在所述容器中对不同等级的敏感数据建立不同的分级脱敏模型来实现对数据脱敏的生命周期管理。所述方法和系统通过具有生命周期的容器技术,降低了系统资源消耗及数据传输服务运维工作成本,提高了数据处理与传输的效率,通过建立分级脱敏模型针对不同级别不同层次的敏感数据脱敏使用不同的加密算法,在不改变原数据特征的前提下大大降低了敏感数据被窃取与破解风险,解决了大数据平台在数据安全方面的缺陷,提升了大数据平台的安全性,有效降低了大数据信息泄露风险。

附图说明

通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:

图1为本发明优选实施方式的基于具有生命周期的容器的大数据分级脱敏方法的流程示意图;

图2是本发明优选实施方式的基于具有生命周期的容器的大数据分级脱敏系统的结构示意图。

具体实施方式

现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。

除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。

图1为本发明优选实施方式的基于具有生命周期的容器的大数据分级脱敏方法的流程示意图。如图1所示,本优选实施方式所述的基于具有生命周期的容器的大数据分级脱敏方法从步骤101开始。

在步骤101,生成预脱敏数据。

在本优选实施方式中,本优选实施方式通过大数据抽取工具将业务系统中分布的、异构数据源中的源数据,所述源数据包括结构化数据和非结构化数据。与关系型数据库中的结构化数据不同,本优先实施方式的大数据平台处理的数据中还包括大量的非结构化数据。针对非结构化数据,一种常用的方式,是通过标引/打标签的方式,使数据具有明确的含义,以及数据之间具有明确的关联关系,从而转换为结构化数据。因此,将所述源数据经过清洗、转化、整合、结构化操作后抽取到大数据存储系统中的脱敏数据库。查询及使用数据只能从大数据脱敏数据库中获取。

在步骤102,对所述预脱敏数据进行数据清理生成敏感数据,并识别所述敏感数据以确定敏感数据的第一类型,以及对所述敏感数据进行分级,确定敏感等级。

对预脱敏数据进行清理生成敏感数据后,对敏感数据进行分级管理的第一步是对所述敏感数据进行识别以明确其类型,例如企业核心人员信息、银行账户信息、客户信息等。

对第三数据进行分级管理还应根据其机密性、完整性及可用性划分评估其安全价值,确定其敏感等级。在对敏感数据进行分级的过程中,应与数据提供方及数据管理部门充分沟通,确保信息的定级合理性,防止矫枉过正,防护过度,造成资源浪费及数据信息损失。一般而言,敏感数据分级采用核心商密、普通商密、内部敏感、非敏感四个敏感级别。

在步骤103,对每个敏感等级的第一类型的敏感数据,按照数据使用对象和数据内容价值的不同进行分类,确定每个敏感等级的第一类型的敏感数据的第二类型。

敏感数据的分类应以敏感数据的分级为基础。在分级完成后,对每个等级的敏感数据,采用机器学习模型,并结合实际应用经验对敏感数据进行分类。例如,针对企业信息敏感数据分类时,主要考虑数据使用对象性质和信息内容两个方面的因素:

a)针对通过按类型划分的数据使用对象,采取有限制的差异化数据服务策略,在保证数据服务合法合规,数据安全得到保障的前提下,满足各层级使用对象的业务需求,实现数据资产的价值转化,有利于大数据平台数据综合服务能力的提升,优化业务浪费,获得更高的增值。因此,按照使用对象性质分类是一种非常重要和基础的划分方式。

b)由于数据使用对象的差异,其数据信息内容价值必然有别,泄露后带来的的影响也不相同。针对不同的使用对象信息数据采取不同的管理措施,减少或避免开发测试对关键数据信息的直接使用,能够有效地降低数据信息泄露的安全隐患。因此,按照信息内容划分客户信息是分类区别数据使用对象信息保护的重要前提。

在步骤104,创建具有生命周期的容器,并基于虚拟出的网络层,向所述容器分配网络地址,根据所述容器的端口信息和向所述容器分配的网络地址,确定并存储所述容器的端口与网络地址的映射关系。

在步骤105,基于所述容器的端口与网络地址的映射关系,将已经确定等级的敏感数据存储至所述具有生命周期的容器。

在步骤106,根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法后建立各自对应的数据脱敏模型。

在本优选实施方式中,将企业信息按照使用对象的不同,把敏感数据分为企业基本属性数据与企业交易数值数据。业基本属性数据为企业名称、各类编码(纳税人识别号、统一社会信用代码、发票代码/号码、商品编码等)以及企业地址、电话、开户行等基本信息,此类数据脱敏采用传统脱敏方法,根据其数据属性可在脱敏策略配置选项中选取相应的加密算法进行脱敏,例如:商品编码1040201240000000000可选择非对称加密算法(md5)脱敏转换为ef5c11c555b5e09fe75bf466b57338bcee11c40b;购买方qq号码3279248039@qq.com可选择掩码算法脱敏转换为**********@qq.com;销售方地址“北京市通州区潞城镇新城工业区一区9号”可选择截取算法脱敏转换为“北京市通州区”。

企业交易数值数据为金额、税额、价税合计、商品单价、税率这样的交易数值型数据,此类数据脱敏采用同态加密算法,即对待脱敏数据进行特定的代数运算得到仍然是加密的结果,将其解密所得到的结果与对明文进行同样的运算结果一样。同态加密算法操作步骤为:

(1)将原始数据按比例缩放,使之落入一个特定区间。

(2)使用扰乱技术,通过加入噪声的方式对缩放后的原始数据进行干扰,以实现对原始数据的扭曲、改变。噪声项计算采取将原始数据进行去量纲归一化处理,然后将二者进行加权合成。

在实际应用中,加密算法模型噪声项计算根据应用场景不同采用极大极小值归一化方法与反余切转换归一化方法。如数据采集及更新周期为一段观测时段(年/季/月度),则采用极大极小值归一化方法;如数据为实时采集实时更新,则采用反余切转换归一化方法。具体公式如下:

极大极小值归一化方法:

其中,为极大极小值归一化方法加密后的转换值,ω为归一化干扰项加权系数,σ为随机干扰项,x为该观测时段全量样本值。

反余切转换归一化方法:

其中,为反余切转换归一化方法加密后的转换值,ω为归一化干扰项加权系数,σ为随机干扰项,τ为原值缩放系数。

上述加密算法的优势为:消除了原始数据的单位量纲限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。加噪音扰乱后的数据仍保留着原始数据的分布特征。

在步骤107,根据建立的数据脱敏模型对对应第二类型的敏感数据进行脱敏,并将脱敏后的数据存储在具有生命周期的容器中。

本优选实施方式中,数据脱敏模型能够自动识别容器内脱敏后的数据等级,根据不同等级标记敏感数据的敏感级标识。脱敏后的核心商密、普通商密以及内部敏感三个级别的敏感数据存储至容器之中。

在将脱敏处理后的数据存储至容器中之后,还可以创建所述容器的镜像容器,以对容器中的数据进行备份,避免对容器中的数据处理失误时需要重新获取系统中的数据进行处理而导致处理效率低的问题。

在步骤108,响应指定对象发送的数据获取请求,将存储在所述容器中的脱敏后数据传输至所述指定对象,其中,当容器中的数据的存储时长达到预定时长,和/或在将存储至所述容器中的数据传输至所述指定对象之后,则容器的生命周期结束,销毁容器,并删除容器中存储的数据。

优选地,所述生成预脱敏数据包括:

通过大数据抽取工具提取业务系统中分布的、异构数据源中的结构化及非结构化数据;

将所述源数据经过清洗、转化、整合、结构化操作后生成预脱敏数据,并传输至大数据存储系统中的脱敏数据库。

优选地,对预先生成的预脱敏数据进行数据清理生成敏感数据,并识别所述敏感数据以确定敏感数据的第一类型,以及对所述敏感数据进行分级,确定敏感等级包括:

对所述预先生成的预脱敏数据进行数据清理,消除所述预脱敏数据中的重复值、缺失值和异常值后生成敏感数据;

对所述敏感数据按照数据属性的不同进行划分,确定敏感数据的第一类型;

根据敏感数据的机密性、完整性和可用性评估其安全价值,确定其敏感等级。

优选地,所述根据敏感数据的机密性、完整性和可用性评估其安全价值,确定其敏感等级包括:

对敏感数据按照预先设定的每个安全价值评分项的分值区间进行评分,其中,所述安全价值评分项包括敏感数据是否能直接识别出特定的企业对象,与企业对象的实际经营活动状态是否密切相关,通过该数据信息是否能获得其他关联信息,使用该数据信息可能对企业造成潜在经济损失与带来潜在信息威胁的程度;

将所述敏感数据每个安全价值评分项的评分进行求和,确定所述敏感数据的安全价值评分;

根据敏感等级与安全价值评分的对应关系,确定所述敏感数据的敏感等级。

优选地,基于所述容器的端口与网络地址的映射关系,将已经确定等级的敏感数据存储至所述具有生命周期的容器包括:

对接收的敏感数据报文的协议字段进行解析,确定敏感数据报文的目的网络地址;

基于网络地址与容器端口的映射关系,确定敏感数据报文的目的网络地址对应的容器端口;

根据敏感数据报文的目的网络地址对应的容器端口,将敏感数据分发至具有生命周期的容器的相应存储位置。

优选地,根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法后建立各自对应的数据脱敏模型包括:

根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法,其中,所述脱敏算法是不可逆的,并且是自动化、可重复的;

基于每种第二类型的敏感数据配置的脱敏算法建立数据脱敏模型,其中,所述数据脱敏模型满足脱敏后的数据具有原数据的特征,且数据的完整性尽可能予以保留,对所有具有关联性及可能生成敏感数据的非敏感字段同样进行脱敏处理,以及可对脱敏后的数据标记敏感等级。

图2是本发明优选实施方式的基于具有生命周期的容器的大数据分级脱敏系统的结构示意图。如图2所示,本优选实施方式所述的基于具有生命周期的容器的大数据分级脱敏系统200包括:

预处理单元201,其用于生成预脱敏数据;

敏感等级单元202,其用于对预先生成的预脱敏数据进行数据清理生成敏感数据,并识别所述敏感数据以确定敏感数据的第一类型,以及对所述敏感数据进行分级,确定敏感等级;

数据分类单元203,其用于对每个敏感等级的第一类型的敏感数据,按照数据使用对象和数据内容价值的不同进行分类,确定每个敏感等级的第一类型的敏感数据的第二类型;

容器建立单元204,其用于创建具有生命周期的容器,并基于虚拟出的网络层,向所述容器分配网络地址,根据所述容器的端口信息和向所述容器分配的网络地址,确定并存储所述容器的端口与网络地址的映射关系;

数据存储单元205,其用于基于所述容器的端口与网络地址的映射关系,将已经确定等级的敏感数据存储至所述具有生命周期的容器;

脱敏模型单元206,其用于根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法后建立各自对应的数据脱敏模型;

数据脱敏单元207,其用于根据建立的数据脱敏模型对对应第二类型的敏感数据进行脱敏,并将脱敏后的数据存储在具有生命周期的容器中;

数据传输单元208,其用于响应指定对象发送的数据获取请求,将存储在所述容器中的脱敏后数据传输至所述指定对象,其中,当容器中的数据的存储时长达到预定时长,和/或在将存储至所述容器中的数据传输至所述指定对象之后,则容器的生命周期结束,销毁容器,并删除容器中存储的数据。

优选地,所述数据预处理单元201包括:

数据提取单元211,其用于通过大数据抽取工具提取业务系统中分布的、异构数据源中的源数据,其中,所述源数据包括结构化数据和非结构化数据;

数据处理单元212,其用于将所述源数据经过清洗、转化、整合、结构化操作后生成预脱敏数据,并传输至大数据存储系统中的脱敏数据库。

优选地,敏感等级单元202包括:

敏感数据单元221,其用于对所述预先生成的预脱敏数据进行数据清理,消除所述预脱敏数据中的重复值、缺失值和异常值后生成敏感数据;

数据划分单元222,其用于对所述敏感数据按照数据属性的不同进行划分,确定敏感数据的第一类型;

等级确定单元223,其用于根据敏感数据的机密性、完整性和可用性评估其安全价值,确定其敏感等级。

优选地,所述等级确定单元223根据敏感数据的机密性、完整性和可用性评估其安全价值,确定其敏感等级包括:

对敏感数据按照预先设定的每个安全价值评分项的分值区间进行评分,其中,所述安全价值评分项包括敏感数据是否能直接识别出特定的企业对象,与企业对象的实际经营活动状态是否密切相关,通过该数据信息是否能获得其他关联信息,使用该数据信息可能对企业造成潜在经济损失与带来潜在信息威胁的程度;

将所述敏感数据每个安全价值评分项的评分进行求和,确定所述敏感数据的安全价值评分;

根据敏感等级与安全价值评分的对应关系,确定所述敏感数据的敏感等级。

优选地,数据存储单元205包括:

数据解析单元251,其用于对接收的敏感数据报文的协议字段进行解析,确定敏感数据报文的目的网络地址;

端口确定单元252,其用于基于网络地址与容器端口的映射关系,确定敏感数据报文的目的网络地址对应的容器端口;

数据分发单元253,其用于根据敏感数据报文的目的网络地址对应的容器端口,将敏感数据分发至具有生命周期的容器的相应存储位置。

优选地,脱敏模型单元206包括:

算法配置单元261,其用于根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法,其中,所述脱敏算法是不可逆的,并且是自动化、可重复的;

模型建立单元262,其用于基于第二类型的敏感数据配置的脱敏算法建立数据脱敏模型,其中,所述数据脱敏模型满足脱敏后的数据具有原数据的特征,且数据的完整性尽可能予以保留,对所有具有关联性及可能生成敏感数据的非敏感字段同样进行脱敏处理,以及可对脱敏后的数据标记敏感等级。

本优选实施方式所述的基于具有生命周期的容器的大数据分级脱敏系统对敏感数据进行脱敏的步骤与基于具有生命周期的容器的大数据分级脱敏方法采取的步骤相同,达到的技术效果也相同,在此不再赘述。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

以上已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。

通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个//该[装置、组件等]”都被开放地解释为装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1