本发明属于数据管理,尤其涉及一种数据跟踪方法、装置、设备及计算机存储介质。
背景技术:
1、数据血缘作为一种抽象的概念,用来描述数据之间的关系。在数据治理及价值挖掘场景中运营主体需要通过数据血缘,关注数据资源的上下游信息,即数据从哪里来、有哪些下游继续使用、下游的产出物。
2、现有技术主要通过采用字段特征提取的方式来构建数据血缘,并根据表级或字段血缘图谱进行节点溯源分析。但是实际信息系统的数据生命周期中,数据通过数据任务的加载,经历了取数、变形,并存到其他表中等过程。如果不继续对该表的数据进行跟踪,变形后的数据有很大概率被违规使用或存在数据不经意泄露的风险。因此,现有的数据跟踪方法在血缘基础上对数据进行持续跟踪标记的能力较差,导致数据的安全性较低。
技术实现思路
1、本申请实施例提供一种数据跟踪方法、装置、设备及计算机存储介质,以解决在对数据进行持续跟踪标记的能力较差,导致数据的安全性较低的问题。
2、第一方面,本申请实施例提供一种数据跟踪方法,包括:
3、基于预设的匹配规则,在待监管数据库中筛选出目标数据,所述目标数据携带有预设的数据标记;
4、获取所述待监管数据库接收到的多个计算任务,每个所述计算任务包括参与计算的起始数据节点和终止数据节点;
5、连接所有所述计算任务包括的起始数据节点和终止数据节点中具有相同节点名的节点,获得数据血缘关系,所述数据血缘关系包括每个所述计算任务所调用的数据的初始流转路径;
6、对于每个所述起始数据节点,在所述起始数据节点所携带的数据包括所述数据标记的情况下,基于所述数据血缘关系,将所述数据标记添加至所述起始数据节点所对应的终止数据节点中;
7、在所述数据血缘关系中筛选出包括所述数据标记的起始数据节点和终止数据节点,获得所述目标数据的数据流转路径信息。
8、第二方面,本申请实施例提供一种数据跟踪装置,所述装置包括:
9、标记模块,用于基于预设的匹配规则,在待监管数据库中筛选出目标数据,所述目标数据携带有预设的数据标记;
10、第一获取模块,用于获取所述待监管数据库接收到的多个计算任务,每个所述计算任务包括参与计算的起始数据节点和终止数据节点;
11、连接模块,用于连接所有所述计算任务包括的起始数据节点和终止数据节点中具有相同节点名的节点,获得数据血缘关系,所述数据血缘关系包括每个所述计算任务所调用的数据的初始流转路径;
12、添加模块,用于对于每个所述起始数据节点,在所述起始数据节点所携带的数据包括所述数据标记的情况下,基于所述数据血缘关系,将所述数据标记添加至所述起始数据节点所对应的终止数据节点中;
13、筛选模块,用于在所述数据血缘关系中筛选出包括所述数据标记的起始数据节点和终止数据节点,获得所述目标数据的数据流转路径信息。
14、第三方面,本申请实施例提供了一种终端设备,设备包括:处理器以及存储有计算机程序指令的存储器;
15、处理器执行计算机程序指令时实现如第一方面的数据跟踪方法。
16、第四方面,本申请实施例提供了一种计算机存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面的数据跟踪方法。
17、第五方面,本申请实施例提供了一种计算机程序产品,其特征在于,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行如第一方面的数据跟踪方法。
18、本发明实施例的数据跟踪方法、装置、设备及计算机存储介质,通过获取所述待监管数据库接收到的多个计算任务,并连接所有所述计算任务包括的起始数据节点和终止数据节点中具有相同节点名的节点,获得数据血缘关系,并基于预设的匹配规则,在待监管数据库中筛选出目标数据,并对目标数据添加数据标记,能够实现待监管数据库中的目标数据的标记。以及在所述起始数据节点所携带的数据为目标数据的情况下,基于数据血缘关系,将目标数据的数据标记添加至终止数据节点中,能够实现数据标记的从数据的上游传递到数据的下游,防止目标数据经历了取数、变形,并存到其他表等过程而无法被追踪的问题,通过在数据血缘关系中筛选出包括所述数据标记的起始数据节点和终止数据节点,获得数据流转路径信息,能够对目标数据的流转路径进行筛选,提高对数据进行持续跟踪标记的能力,进而提高数据的安全性。
1.一种数据跟踪方法,其特征在于,方法包括:
2.如权利要求1所述的数据跟踪方法,其特征在于,所述基于预设的匹配规则,在待监管数据库中筛选出目标数据,包括:
3.如权利要求1所述的数据跟踪方法,其特征在于,所述数据标记的格式包括:资源域、业务、分类、敏感级别和随机数。
4.如权利要求1所述的数据跟踪方法,其特征在于,所述获取所述待监管数据库接收到的多个计算任务,包括:
5.如权利要求3所述的数据跟踪方法,其特征在于,所述将所述数据标记添加至所述起始数据节点所对应的终止数据节点中之后,所述在所述数据血缘关系中筛选出包括所述数据标记的起始数据节点和终止数据节点,获得所述目标数据的数据流转路径信息之前,所述方法还包括:
6.如权利要求5所述的数据跟踪方法,其特征在于,所述在所述数据血缘关系中筛选出包括所述数据标记的起始数据节点和终止数据节点,获得所述目标数据的数据流转路径信息,包括:
7.如权利要求1所述的数据跟踪方法,其特征在于,所述在所述数据血缘关系中筛选出包括所述数据标记的起始数据节点和终止数据节点,获得所述目标数据的数据流转路径信息之后,所述方法还包括:
8.如权利要求7所述的数据跟踪方法,其特征在于,所述在所述敏感数据发生数据流转的情况下,将所述敏感数据对应的所述敏感等级和所述用户访问日志与预设的安全合规策略进行匹配,确定所述敏感数据的数据流转风险之后,所述方法还包括:
9.如权利要求1所述的数据跟踪方法,其特征在于,所述在所述数据血缘关系中筛选出包括所述数据标记的起始数据节点和终止数据节点,获得所述目标数据的数据流转路径信息之后,所述方法还包括:
10.一种数据跟踪装置,其特征在于,所述装置包括:
11.一种终端设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-9中任意一项所述的数据跟踪方法。