本公开涉及数据集处理,尤其涉及一种数据集脱敏处理模板的设计方法、脱敏规则模板和电子设备。
背景技术:
1、在数据集开发过程中,需要对数据集进行数据预览和详细查看,用户根据平台的卡片预览和查看数据集,同时能够通过数据集详情页,查看当前数据集的基本属性。
2、然而,针对开发数据过程中所产生的数据集,用户在进行开发数据集的查看和通过系统卡片查看之时,均需对开发数据进行保密、脱敏处理,判断展示给用户的数据集中是否存在数据避免数据被不具备相应权限的用户偷看。
3、而现有技术中,针对数据脱敏,时常利用人工通过脱敏规则对数据集进行检测,判断是否触发脱敏条件的数据集。该方式因其需要从数据库频繁调用存储的脱敏规则,因此面对海量数据集的脱敏检测,其适配性不高,效率低下,只能进行小规模的数据集检测。此外,在脱敏检测之前,还要管理员配置脱敏规则,因此比较费时。
技术实现思路
1、为了解决上述问题,本申请提出一种数据集脱敏处理模板的设计方法、脱敏规则模板和电子设备。
2、本申请一方面,提出一种数据集脱敏处理模板的设计方法,包括如下步骤:
3、标记数据集状态;
4、配置探测规则表和数据集字段信息表:
5、所述探测规则表用于通过配置的探测规则对数据集中的字段进行探测,标记每个字段是否是敏感字段;
6、所述数据集字段信息表用于收集数据集字段,其中,在所述数据集字段信息表中添加有如下字段:
7、is_sensitive,字段敏感,用于标记字段是否敏感;
8、is_detection_sensitive,字段探测敏感,用于探测是否敏感;
9、配置脱敏权限表和脱敏规则表,所述脱敏权限表用于为不同用户设定不同的数据集脱敏权限,所述脱敏规则表用于在数据集中配置脱敏规则;
10、构建数据集基础信息表,并将其与所述脱敏权限表进行关联;同时将所述脱敏规则表和所述数据集字段信息表进行关联,得到脱敏规则模板。
11、作为本申请的一可选实施方案,可选地,标记数据集状态,包括如下标记方式:
12、手动标记开关:将数据集标记为非敏感与敏感未脱敏;
13、当手动标记为敏感之后:
14、若是当前数据集已配置脱敏规则,则将其标记为:已脱敏;
15、若是当前数据集未配置脱敏规则,则将其标记为:未脱敏。
16、作为本申请的一可选实施方案,可选地,所述探测规则表的使用方法,包括如下步骤:
17、开始探测:
18、获取数据集探测规则,匹配数据集每个字段,判断字段是否敏感:
19、若是,则修改字段敏感属性为is_sensitive,探测完成;
20、反之探测完成。
21、作为本申请的一可选实施方案,可选地,所述脱敏权限表的使用方法,包括如下步骤:
22、开始配置脱敏权限:
23、在模板页或者数据集详情页点击编辑,选择用户,选择权限;
24、选择完毕,保存数据源id:
25、数据集id或者模板id;
26、配置完毕。
27、作为本申请的一可选实施方案,可选地,所述脱敏规则表的配置方法,包括如下步骤:
28、在模板中配置:
29、脱敏规则,包含各条脱敏规则id和文件dom-id,脱敏规则类型:遮盖/哈希,以及对应的脱敏规则详情json;
30、匹配规则:字段名完全匹配;
31、sourceid:数据源id,包含字段id或模板id;
32、dsid:用来判断数据集是否已脱敏;
33、保存匹配规则和模板id。
34、作为本申请的一可选实施方案,可选地,所述脱敏规则表的使用方法,包括如下步骤:
35、在数据集中配置脱敏规则,选择脱敏规则:遮盖或哈希;
36、保存所选脱敏规则的字段id;
37、配置完成。
38、本申请另一方面,提出一种脱敏规则模板,采用上述所述数据集脱敏处理模板的设计方法生成;所述脱敏规则模板在数据集的卡片预览和数据集详情页查看之时进行使用。
39、本申请另一方面,还提出一种电子设备,包括:
40、处理器;
41、用于存储处理器可执行指令的存储器;
42、其中,所述处理器被配置为执行所述可执行指令时实现所述的一种数据集脱敏处理模板的设计方法。
43、本发明的技术效果:
44、本申请通过在用户利用卡片对数据集进行预览和查看之时,以及在数据集详情页内查看相应的数据集之时,由系统进行脱敏提醒。采用脱敏规则模板对数据集进行脱敏识别和标记,主要包含数据集的状态标记,对数据集的探测,以及脱敏规则,脱敏权限等配置设计,通过生成相应的数据集脱敏规则模板,进行模板调用并对数据机执行脱敏处理,以此实现高效率的脱敏执行任务。利用设计生成的脱敏规则模板,针对海量数据集进行模板调用以及利用模板执行脱敏任务,高效完成对各类数据集的在线预览与查看。脱敏规则模板上配置有脱敏规则、脱敏权限和探测规则,能够将脱敏工作通过模板进行执行,解放人工脱敏的工作压力。
45、根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
1.一种数据集脱敏处理模板的设计方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种数据集脱敏处理模板的设计方法,其特征在于,标记数据集状态,包括如下标记方式:
3.根据权利要求2所述的一种数据集脱敏处理模板的设计方法,其特征在于,所述探测规则表的使用方法,包括如下步骤:
4.根据权利要求1所述的一种数据集脱敏处理模板的设计方法,其特征在于,所述脱敏权限表的使用方法,包括如下步骤:
5.根据权利要求1-4任一项所述的一种数据集脱敏处理模板的设计方法,其特征在于,所述脱敏规则表的配置方法,包括如下步骤:
6.根据权利要求5所述的一种数据集脱敏处理模板的设计方法,其特征在于,所述脱敏规则表的使用方法,包括如下步骤:
7.一种脱敏规则模板,采用权利要求1-6中任一项所述的所述数据集脱敏处理模板的设计方法生成;
8.一种电子设备,其特征在于,包括: