一种敏感数据的检测方法及系统与流程

文档序号:36256407发布日期:2023-12-03 18:40阅读:90来源:国知局
一种敏感数据的检测方法及系统与流程

本发明属于敏感数据检测,尤其涉及一种敏感数据的检测方法及系统。


背景技术:

1、企业在生产活动和经营管理中会产生大量有巨大价值的敏感数据,如果处理不当会导致数据安全事件的发生,对这些敏感数据进行有效的发现和及时脱敏是实现数据安全共享的前提。

2、传统的敏感数据识别方法通常更适用于静态数据,这些方法通常依赖于在数据存储或传输过程中应用的静态规则或模式匹配,更适用于静态数据的批处理或定期检查,通常难以应对实时数据的动态性,特别是对于具有生命周期的数据、实时变化的数据或流数据,通常不考虑数据的生命周期,对于那些在一段时间后变得不再敏感的数据,这可能会导致不必要的检测开销。

3、且传统方法对分散在不同文本或数据源中的敏感数据片段的检测会存在以下困难:可能会错过那些分散在不同文本或数据源中的敏感数据片段,因为这些片段通常不会以完整的形式出现,难以通过简单的匹配进行检测;且传统方法通常没有内置的机制来将分散的敏感数据片段重组成完整的敏感数据,这使得在分析和处理这些数据时变得更加困难;在分散的敏感数据片段中,上下文信息可能会丢失,这意味着难以理解敏感数据的含义和背后的故事,这在某些情况下可能导致误解或无法有效处理敏感数据。


技术实现思路

1、本发明提供一种敏感数据的检测方法及系统,旨在解决上述背景技术提到的问题。

2、本发明是这样实现的,提供一种敏感数据的检测方法,步骤包括:

3、定义敏感数据模式并构建模式库及模式映射表,其中,敏感数据模式包括完整的敏感数据模式和敏感数据片段模式,均包含相应的数据结构和属性,敏感数据片段模式的属性中存储有敏感数据片段模式的全局唯一标识符,模式映射表的信息包括敏感数据片段模式及其全局唯一标识符、关联的敏感数据片段模式及其全局唯一标识符、敏感数据片段之间的关系类型、及重组逻辑;

4、对不运行和运行时的目标应用程序分别进行静态分析及动态分析以分别获取静态潜在插桩点和动态潜在插桩点,并结合静态潜在插桩点和动态潜在插桩点确定目标插桩点;

5、在目标应用程序中,创建一个新的类,在新创建的类中定义一个包含插桩逻辑的方法,在插桩逻辑的方法中:接收来自各数据源的流动数据作为参数,遍历模式库中的各敏感数据模式来匹配检测流动数据中是否包含敏感数据,并根据敏感数据模式类型判断敏感数据属于完整的敏感数据还是敏感数据片段,若为敏感数据片段,则为敏感数据片段分配对应的全局唯一标识符及将标记了全局唯一标识符的敏感数据片段加入缓冲区,并在各敏感数据片段的生命周期内,在缓冲区中为各敏感数据片段进行匹配,再在组合区中调用模式映射表中的重组逻辑对匹配好的敏感数据片段进行关联重组以得到还原后完整的敏感数据;

6、将编写了插桩逻辑的类和方法的源代码编译为字节码,并插入到目标应用程序的目标插桩点中;

7、在目标应用程序运行时,通过目标插桩点中的插桩逻辑对数据流进行实时监控,当数据流通过目标插桩点时,通过目标插桩点中的插桩逻辑对数据流进行分析并对数据流中的敏感数据的存在情况进行检测及根据敏感数据的存在情况进行相应的数据处理;

8、若目标插桩点中的插桩逻辑检测到敏感数据,则触发告警机制,并对敏感数据进行脱敏处理。

9、更进一步的,所述将标记了全局唯一标识符的敏感数据片段加入缓冲区的步骤前还包括:

10、每检测到一个敏感数据片段后,在缓冲区为敏感数据片段分配一个初始化后的启动计时器的函数,其中,启动计时器的函数中创建了一个计时器对象及定义了一个计时器回调函数,计时器对象在触发时间后触发倒计时,在倒计时时间后时间归0,计时器回调函数中包含了计时器对象倒计时归0时的处理逻辑;

11、为检测到的敏感数据片段定义属性,所述属性包括数据属性、id属性和时间属性,并将敏感数据片段的数据内容存储至数据属性中、敏感数据片段的全局唯一标识符存储至id属性中、预设的触发时间及预设的倒计时时间存储至时间属性中,预设的触发时间设定为0,预设的倒计时时间为敏感数据片段的生命周期;

12、所述将标记了全局唯一标识符的敏感数据片段加入缓冲区的步骤包括:

13、提取敏感数据片段的数据属性、id属性和时间属性,将敏感数据片段的数据属性及id属性对应加入缓冲区的列表中,同时,将敏感数据片段的数据属性、id属性和时间属性作为输入参数输入启动计时器的函数中,以使启动计时器的函数中的计时器对象在预设的触发时间后触发倒计时,并在预设的倒计时时间后归0。

14、更进一步的,所述在各敏感数据片段的生命周期内,在缓冲区中为各敏感数据片段进行匹配,再在组合区中调用模式映射表中的重组逻辑对匹配好的敏感数据片段进行关联重组以得到还原后完整的敏感数据的步骤包括:

15、在当前的敏感数据片段对应的计时器对象的时间归0前, 根据当前的敏感数据片段的id属性从模式映射表中查找与当前的敏感数据片段关联的敏感数据片段的全局唯一标识符;

16、将关联的敏感数据片段的全局唯一标识符在当前的缓冲区的列表中进行一次遍历匹配,以查找当前的缓冲区的列表中是否存在id属性与关联的敏感数据片段的全局唯一标识符相同的敏感数据片段;

17、若存在,则匹配成功,并将当前的敏感数据片段及匹配成功的敏感数据片段的数据属性和id属性调取至组合区,同时将缓冲区的列表中当前的敏感数据片段及匹配成功的敏感数据片段的数据属性和id属性进行删除,及对缓冲区中与敏感数据片段及匹配成功的敏感数据片段对应的启动计时器的函数进行初始化;

18、从模式映射表中获取对应的敏感数据片段之间的关系类型及重组逻辑,并在组合区中根据敏感数据片段之间的关系类型及重组逻辑对其进行关联重组以得到还原后完整的敏感数据。

19、更进一步的,所述将关联的敏感数据片段的全局唯一标识符在当前的缓冲区的列表中进行一次遍历匹配,以查找当前的缓冲区的列表中是否存在id属性与关联的敏感数据片段的全局唯一标识符相同的敏感数据片段的步骤后还包括:

20、若不存在,则进行二次遍历或多次遍历或多次遍历,直至匹配成功或当前的敏感数据片段对应的计时器对象的时间归0,则停止匹配;

21、若停止匹配时仍匹配不成功,则将缓冲区的列表中当前的敏感数据片段的数据属性和id属性进行删除,及对缓冲区中与当前的敏感数据片段对应的启动计时器的函数进行初始化。

22、更进一步的,所述在组合区中根据敏感数据片段之间的关系类型及重组逻辑对其进行关联重组以得到还原后完整的敏感数据的步骤包括:

23、若关系类型为链式关系,则确定关系属性为主要父节点的敏感数据片段及关系属性为子节点的敏感数据片段,并分别获取主要父节点的数据及子节点的数据;

24、从子节点的数据及主要父节点的数据中分别提取子关联字段和父关联字段;

25、将子关联字段与父关联字段进行关联以得到链式关系;

26、根据链式关系将子节点的数据连接到主要父节点的数据中以得到重组后的敏感数据。

27、更进一步的,所述对不运行和运行时的目标应用程序分别进行静态分析及动态分析以分别获取静态潜在插桩点和动态潜在插桩点,并结合静态潜在插桩点和动态潜在插桩点确定目标插桩点的步骤包括:

28、在目标应用程序不运行时,使用静态代码分析工具对目标应用程序的源代码进行静态分析,以识别获取代码中的静态潜在插桩点,并对静态潜在插桩点进行标记,静态潜在插桩点为数据库查询、数据处理、文件读写或网络通信的关键点;

29、在目标应用程序运行时,通过在目标应用程序上运行动态分析工具,对目标应用程序的执行过程、目标应用程序运行时的数据流动进行跟踪分析,以识别数据流在不同方法之间传递经过的路径并捕获相应的路径上与敏感数据相关的操作点,作为动态潜在插桩点,并对动态潜在插桩点进行标记,与敏感数据相关的操作包括但不限于敏感数据的输入、输出、存储和传输;

30、识别获取被二次标记过的潜在插桩点,作为目标插桩点,以便在目标插桩点实时监控和处理流动数据中的敏感信息。

31、本发明还提供一种敏感数据的检测系统,用于执行敏感数据的检测方法,包括:

32、构建模块:用于定义敏感数据模式并构建模式库及模式映射表,其中,敏感数据模式包括完整的敏感数据模式和敏感数据片段模式,均包含相应的数据结构和属性,敏感数据片段模式的属性中存储有敏感数据片段模式的全局唯一标识符,模式映射表的信息包括敏感数据片段模式及其全局唯一标识符、关联的敏感数据片段模式及其全局唯一标识符、敏感数据片段之间的关系类型、及重组逻辑;

33、插桩点模块:用于对不运行和运行时的目标应用程序分别进行静态分析及动态分析以分别获取静态潜在插桩点和动态潜在插桩点,并结合静态潜在插桩点和动态潜在插桩点确定目标插桩点;

34、插桩逻辑模块:用于在目标应用程序中,创建一个新的类,在新创建的类中定义一个包含插桩逻辑的方法,在插桩逻辑的方法中:接收来自各数据源的流动数据作为参数,遍历模式库中的各敏感数据模式来匹配检测流动数据中是否包含敏感数据,并根据敏感数据模式类型判断敏感数据属于完整的敏感数据还是敏感数据片段,若为敏感数据片段,则为敏感数据片段分配对应的全局唯一标识符及将标记了全局唯一标识符的敏感数据片段加入缓冲区,并在各敏感数据片段的生命周期内,在缓冲区中为各敏感数据片段进行匹配,再在组合区中调用模式映射表中的重组逻辑对匹配好的敏感数据片段进行关联重组以得到还原后完整的敏感数据;

35、插入模块:用于将编写了插桩逻辑的类和方法的源代码编译为字节码,并插入到目标应用程序的目标插桩点中;

36、检测模块:用于在目标应用程序运行时,通过目标插桩点中的插桩逻辑对数据流进行实时监控,当数据流通过目标插桩点时,通过目标插桩点中的插桩逻辑对数据流进行分析并对数据流中的敏感数据的存在情况进行检测及根据敏感数据的存在情况进行相应的数据处理;

37、脱敏模块:用于若目标插桩点中的插桩逻辑检测到敏感数据,则触发告警机制,并对敏感数据进行脱敏处理。

38、本发明的有益效果在于,与现有技术相比,本发明的敏感数据的检测方法及系统,通过在静态和动态综合分析获取的插桩点上插入插桩逻辑进行插桩检测,不仅能够对目标应用程序运行时的数据流进行实时监控,从而及时检测到敏感数据的存在,还能够根据应用程序的实际执行情况而实时执行插桩逻辑,检测灵活,适用于动态变化的应用程序环境,可以更准确地捕获和分析敏感数据。且监测流动的数据能够发现数据的很多上下文信息,如数据源、数据类型、数据流向、有效时间周期内的关联数据,从而能够有助于捕获有效时间周期内关联的敏感数据片段。通过自定义的插桩逻辑与模式库和模式映射表的交互,能够对各类敏感数据进行检测,如完整的敏感数据及分拆的敏感数据片段,并能够将分散在不同数据源中的敏感数据片段在数据的生命周期内进行有效关联和重组,还原成完整的敏感数据,以确保敏感数据的完整性和时效性,这对于有时效的分散数据的分析和处理非常有用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1