一种数据脱敏方法及装置与流程

文档序号:14941108发布日期:2018-07-13 20:49阅读:152来源:国知局
本发明涉及计算机
技术领域
,特别涉及一种数据脱敏方法及装置。
背景技术
:随着计算机应用技术的快速发展,如何实现对数据进行保护已成为我们所面临的重要问题之一,经常需要对部分较为敏感的源数据进行脱敏处理,即通过相应的规则对源数据进行变形以形成脱敏数据。目前,对多个源数据进行脱敏处理时,通常需要针对每一个源数据分别设置相应的脱敏规则,然后根据各个源数据所分别对应的脱敏规则,对每一个源数据分别进行脱敏处理以将各个源数据分别转换成相应的脱敏数据。可见,当需要对大量的源数据进行脱敏处理时,若针对每一个待脱敏数据均设置相应的脱敏规则,则需要耗费较长的处理时长,处理速度较慢。技术实现要素:本发明实施例提供了一种数据脱敏方法及装置,对大量的源数据进行脱敏处理时,处理速度较快。第一方面,本发明提供了一种数据脱敏方法,包括:预先设置至少一种脱敏规则;根据至少两个源数据所分别对应的数据类别构建信息资源目录;确定所述信息资源目录中至少一种数据类别与至少一种脱敏规则之间的对应关系;根据所述信息资源目录及所述对应关系创建脱敏任务,并执行所述脱敏任务以将每一个所述源数据分别转换成对应的脱敏数据。优选地,所述至少一种脱敏规则的类型,包括加密、屏蔽、替换及散列中的任意一种或多种。优选地,所述根据所述信息资源目录及所述对应关系创建脱敏任务,包括:获取所述至少两个源数据的源数据信息,以及获取数据表信息;利用所述数据源信息、所述数据表信息以及所述信息资源目录、所述对应关系创建脱敏任务;执行所述脱敏任务,以根据所述数据源信息依次读取每一个所述源数据,针对于读取的所述源数据,根据所述信息资源目录和所述对应关系确定对应的目标脱敏规则,根据所述目标脱敏规则将所述源数据转换成对应的脱敏数据,并根据所述数据表信息对所述脱敏数据进行存储。优选地,还包括:在执行所述脱敏任务时,生成对应于所述脱敏任务的日志信息。第二方面,本发明实施例提供了一种数据脱敏装置,包括:规则管理模块,用于预先设置至少一种脱敏规则;目录管理模块,用于根据至少两个源数据所分别对应的数据类别构建信息资源目录;方案管理模块,用于确定所述信息资源目录中至少一种数据类别与至少一种脱敏规则之间的对应关系;脱敏处理模块,用于根据所述信息资源目录及所述对应关系创建脱敏任务,并执行所述脱敏任务以将每一个所述源数据分别转换成对应的脱敏数据。优选地,所述至少一种脱敏规则的类型,包括加密、屏蔽、替换及散列中的任意一种或多种。优选地,所述脱敏处理模块,包括:信息获取单元、任务创建单元和脱敏处理单元;其中,所述信息获取单元,用于获取所述至少两个源数据的源数据信息,以及获取数据表信息;所述任务创建单元,用于利用所述数据源信息、所述数据表信息以及所述信息资源目录、所述对应关系创建脱敏任务;所述脱敏处理单元,用于执行所述脱敏任务,以根据所述数据源信息依次读取每一个所述源数据,针对于读取的所述源数据,根据所述信息资源目录和所述对应关系确定对应的目标脱敏规则,根据所述目标脱敏规则将所述源数据转换成对应的脱敏数据,并根据所述数据表信息对所述脱敏数据进行存储。优选地,还包括:日志管理模块;其中,所述日志管理模块,用于在执行所述脱敏任务时,生成对应于所述脱敏任务的日志信息。优选地,所述脱敏处理单元,进一步用于在接收到外部输入的对应于所述脱敏任务的管理请求时,根据所述管理请求对所述脱敏任务进行管理。本发明实施例提供了一种数据脱敏方法及装置,该方法中,通过预先设置至少一种脱敏规则,当需要对大量的源数据进行脱敏处理时,则可根据至少两个源数据所分别对应的数据类别构建信息资源目录,并确定信息资源目录中至少一种数据类别与至少一种脱敏规则之间的对应关系,后续则可根据信息资源目录及所述对应关系创建脱敏任务,并执行所述脱敏任务以将每一个所述源数据分别转换成对应的脱敏数据。由于大量数据源中可能存在部分数据源对应相同的数据类别,通过确定信息资源目录中至少一种数据类别与至少一种脱敏规则之间的对应关系,可更为快速的实现为各个数据源分配相应的脱敏规则,因此,通过本发明实施例提供的技术方案,对大量的源数据进行脱敏处理时,处理速度较快。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明一实施例提供的一种数据脱敏方法的流程图;图2是本发明一实施例提供的另一种数据脱敏方法的流程图;图3是本发明一实施例提供的一种数据脱敏装置的结构示意图;图4是本发明一实施例提供的另一种数据脱敏装置的结构示意图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。如图1所示,本发明实施例提供了一种数据脱敏方法,包括:步骤101,预先设置至少一种脱敏规则;步骤102,根据至少两个源数据所分别对应的数据类别构建信息资源目录;步骤103,确定所述信息资源目录中至少一种数据类别与至少一种脱敏规则之间的对应关系;步骤104,根据所述信息资源目录及所述对应关系创建脱敏任务,并执行所述脱敏任务以将每一个所述源数据分别转换成对应的脱敏数据。如图1所示的实施例,通过预先设置至少一种脱敏规则,当需要对大量的源数据进行脱敏处理时,则可根据至少两个源数据所分别对应的数据类别构建信息资源目录,并确定信息资源目录中至少一种数据类别与至少一种脱敏规则之间的对应关系,后续则可根据信息资源目录及所述对应关系创建脱敏任务,并执行所述脱敏任务以将每一个所述源数据分别转换成对应的脱敏数据。由于大量数据源中可能存在部分数据源对应相同的数据类别,通过确定信息资源目录中至少一种数据类别与至少一种脱敏规则之间的对应关系,可更为快速的实现为各个数据源分配相应的脱敏规则,因此,通过本发明实施例提供的技术方案,对大量的源数据进行脱敏处理时,处理速度较快。本发明一个实施例中,所述至少一种脱敏规则的类型包括但不限于加密、屏蔽、替换及散列中的任意一种或多种。比如,还可以是排序及枚举等其他类型。本发明一个实施例中,所述根据所述信息资源目录及所述对应关系创建脱敏任务,包括:获取所述至少两个源数据的源数据信息,以及获取数据表信息;利用所述数据源信息、所述数据表信息以及所述信息资源目录、所述对应关系创建脱敏任务;执行所述脱敏任务,以根据所述数据源信息依次读取每一个所述源数据,针对于读取的所述源数据,根据所述信息资源目录和所述对应关系确定对应的目标脱敏规则,根据所述目标脱敏规则将所述源数据转换成对应的脱敏数据,并根据所述数据表信息对所述脱敏数据进行存储。本发明上述实施例中,具体可以通过获取各个数据源的元数据信息以及相应的数据表信息,则可利用获取的数据源信息、数据表信息以及信息资源目录、对应关系创建一个脱敏任务,实现针对于同一个信息资源目录所对应的大量源数据仅创建一个脱敏任务,无需针对每一个数据源分别创建脱敏任务,通过执行创建的一个脱敏任务来即可实现将大量数据源分别转换成相应的脱敏数据,并针对转换得到的脱敏数据进行存储,可进一步提高处理速度。这里,为了方便对脱敏过程进行控制,当接收到用户输入的对应于创建的脱敏任务的管理请求时,还可以对该脱敏任务进行相应的管理,比如,对处于执行中的脱敏任务进行暂停执行、结束执行或删除创建的脱敏任务等。本发明一个实施例中,还包括:在执行所述脱敏任务时,生成对应于所述脱敏任务的日志信息。日志信息包括但不限于脱敏任务的名称、执行脱敏任务时所对应的开始时间和结束时间、成功处理的源数据条数、处理失败的源数据条数以及处理失败的原因等,这些日志信息均可在接收到用户输入的查询请求时提供给用户,以便用户了解脱敏任务的执行情况。为了更加清楚的说明本发明的技术方案及优点,下面以对源数据a、b、c、d进行脱敏处理为例,如图2所示,具体可以包括如下各个步骤:步骤201,预先设置至少一种脱敏规则。比如,可设置一种加密规则x和一种替换规则y。步骤202,根据源数据a、b、c、d所分别对应的数据类别构建信息资源目录。举例来说,以源数据a、b、c、d所分别对应的主键值是a、b、c、d,且以源数据a和b所对应的数据类别为身份证号码,源数据c和d所对应的数据类别是加密密码为例。则可构建如下表1所示的信息资源目录:表1身份证号码加密密码acbd当然,在可能实现的情况下,信息资源目录中也可直接存储各个源数据或各个源数据所分别对应的存储地址。步骤203,确定信息资源目录中至少一种数据类别与至少一种脱敏规则之间的对应关系。这里,用户即可结合实际业务需求为信息资源目录中的每一种数据类别分别分配一种脱敏规则。比如,若用户需要向源数据a和b分配脱敏规则x、向源数据c和d分配脱敏规则y,则仅需要建立“身份证号码”与脱敏规则“x”之间的对应关系以及“加密密码”与脱敏规则“y”之间的对应关系即可。显而易见的,这里仅需要建立信息资源目录中各个数据类型与各个脱敏规则之间的对应关系即可实现为源数据a、b、c、d分别分配相应的脱敏规则,无需单独针对源数据a、b、c、d逐一分配相应的脱敏规则,处理更快。步骤204,获取至少两个源数据的源数据信息,以及获取数据表信息。这里,即获取源数据a、b、c、d所分别对应的主键值或存储地址,以便后续根据获取的源数据信息依次访问源数据a、b、c、d。当然,在可能实现的情况下,源数据信息还可以包括获取源数据a、b、c、d的获取条件、写入脱敏数据库的模式以及批量提交的数据条数等。这里,数据表信息具体指的是用于存储脱敏数据的数据库中相应数据库表的名称或者相应的存储地址。步骤205,利用数据源信息、数据表信息以及信息资源目录、对应关系创建脱敏任务。本发明实施例中,脱敏任务还可以包括任务任务名称、路由策略、负责人、报警邮箱、定时规则等其他任务信息。步骤206,执行所述脱敏任务,并生成对应于脱敏任务的日志信息。本发明实施例中,对创建的脱敏任务进行执行时,具体过程为根据数据源信息依次读取源数据a、b、c、d,针对于读取的每一个源数据a、b、c、d,根据信息资源目录和对应关系确定对应的目标脱敏规则,根据目标脱敏规则将源数据转换成对应的脱敏数据,并根据数据表信息对所述脱敏数据进行存储。如图3所示,本发明实施例提供了一种数据脱敏装置,包括:规则管理模块301,用于预先设置至少一种脱敏规则;目录管理模块302,用于根据至少两个源数据所分别对应的数据类别构建信息资源目录;方案管理模块303,用于确定所述信息资源目录中至少一种数据类别与至少一种脱敏规则之间的对应关系;脱敏处理模块304,用于根据所述信息资源目录及所述对应关系创建脱敏任务,并执行所述脱敏任务以将每一个所述源数据分别转换成对应的脱敏数据。本发明一个实施例中,所述至少一种脱敏规则的类型,包括加密、屏蔽、替换及散列中的任意一种或多种。如图4所示,本发明一个实施例中,所述脱敏处理模块304,包括:信息获取单元3041、任务创建单元3042和脱敏处理单元3043;其中,所述信息获取单元3041,用于获取所述至少两个源数据的源数据信息,以及获取数据表信息;所述任务创建单元3042,用于利用所述数据源信息、所述数据表信息以及所述信息资源目录、所述对应关系创建脱敏任务;所述脱敏处理单元3043,用于执行所述脱敏任务,以根据所述数据源信息依次读取每一个所述源数据,针对于读取的所述源数据,根据所述信息资源目录和所述对应关系确定对应的目标脱敏规则,根据所述目标脱敏规则将所述源数据转换成对应的脱敏数据,并根据所述数据表信息对所述脱敏数据进行存储。本发明一个实施例中,还包括:日志管理模块(附图中未示出);其中,所述日志管理模块,用于在执行所述脱敏任务时,生成对应于所述脱敏任务的日志信息。基于如图4所示的实施例,本发明一个实施例中,所述脱敏处理单元3043,进一步用于在接收到外部输入的对应于所述脱敏任务的管理请求时,根据所述管理请求对所述脱敏任务进行管理。上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。本发明实施例提供了一种可读介质,包括执行指令,当存储控制器的处理器执行所述执行指令时,所述存储控制器执行本发明任意一个实施例中提供的数据脱敏方法。本发明实施例提供了一种存储控制器,包括:处理器、存储器和总线;所述处理器和所述存储器通过所述总线连接;所述存储器,当所述存储控制器运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述存储控制器执行本发明任意一个实施例中提供的数据脱敏方法。综上所述,本发明各个实施例至少具有如下有益效果:1、本发明一实施例中,通过预先设置至少一种脱敏规则,当需要对大量的源数据进行脱敏处理时,则可根据至少两个源数据所分别对应的数据类别构建信息资源目录,并确定信息资源目录中至少一种数据类别与至少一种脱敏规则之间的对应关系,后续则可根据信息资源目录及所述对应关系创建脱敏任务,并执行所述脱敏任务以将每一个所述源数据分别转换成对应的脱敏数据。由于大量数据源中可能存在部分数据源对应相同的数据类别,通过确定信息资源目录中至少一种数据类别与至少一种脱敏规则之间的对应关系,可更为快速的实现为各个数据源分配相应的脱敏规则,因此,通过本发明实施例提供的技术方案,对大量的源数据进行脱敏处理时,处理速度较快。2、本发明一实施例中,具体可以通过获取各个数据源的元数据信息以及相应的数据表信息,则可利用获取的数据源信息、数据表信息以及信息资源目录、对应关系创建一个脱敏任务,实现针对于同一个信息资源目录所对应的大量源数据仅创建一个脱敏任务,无需针对每一个数据源分别创建脱敏任务,通过执行创建的一个脱敏任务来即可实现将大量数据源分别转换成相应的脱敏数据,并针对转换得到的脱敏数据进行存储,可进一步提高处理速度。3、本发明一个实施例中,在执行脱敏任务时,生成对应于脱敏任务的日志信息。日志信息包括但不限于脱敏任务的名称、执行脱敏任务时所对应的开始时间和结束时间、成功处理的源数据条数、处理失败的源数据条数以及处理失败的原因等,这些日志信息均可在接收到用户输入的查询请求时提供给用户,以便用户了解脱敏任务的执行情况。需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1