一种配置化的日志脱敏方法、装置和电子设备与流程

文档序号:19880029发布日期:2020-02-08 06:55阅读:290来源:国知局
一种配置化的日志脱敏方法、装置和电子设备与流程

本发明涉及计算机信息处理领域,具体而言,涉及一种配置化的日志脱敏方法、装置、电子设备及计算机可读介质。



背景技术:

金融平台的业务系统内存在大量系统日志,如果在格式化日志数据时,未对日志数据进行脱敏处理,则会导致用户敏感信息泄露。现有技术中,开发人员在进行脱敏处理时,需要针对敏感字段逐一定位已有的项目代码,并相应地对代码进行大量的修改,效率低下,不够规范。如果稍有不慎,就会导致用户信息泄露。对于通过统一配置指定的脱敏对象和字段,对日志数据进行脱敏的处理技术尚不成熟。



技术实现要素:

本发明要解决的技术问题是如何通过配置脱敏对象和字段对日志数据进行脱敏,从而提高脱敏准确性和效率。

本发明的一方面提供一种配置化的日志脱敏方法,其特征在于,包括:获取并标准化处理日志数据;构建敏感数据过滤器,所述敏感数据过滤器包括可配置的至少一个敏感数据侦测组件;使用所述敏感数据过滤器对所述标准化处理的日志数据进行侦测以确定待脱敏数据;设置数据脱敏规则;基于所述数据脱敏规则对所述待脱敏数据进行脱敏处理。

根据本发明的一种优选实施方式,所述标准化处理日志数据,进一步包括:对所述日志数据进行预处理,以形成统一格式、类型和结构的数据。

根据本发明的一种优选实施方式,所述至少一个敏感数据侦测组件,用于侦测不同种类的待脱敏数据。

根据本发明的一种优选实施方式,还包括:根据待脱敏数据的种类,配置所述敏感数据侦测组件。

根据本发明的一种优选实施方式,所述敏感数据侦测组件可以为值过滤器。

根据本发明的一种优选实施方式,所述待脱敏数据种类可包括用户隐私数据、涉及用户安全数据、商业性敏感数据。

根据本发明的一种优选实施方式,所述待脱敏数据,具体可包括:通讯号码、银行卡号、身份证号、用户名、账号密码、ip地址中的至少一种。

根据本发明的一种优选实施方式,所述设置数据脱敏规则,进一步包括:设置待脱敏数据的脱敏方式;设置待脱敏数据完成脱敏后的数据格式。

根据本发明的一种优选实施方式,所述脱敏方式,具体可包括:数据替换、数据重排、数据加密、数据截断、数据掩码、数据偏移中的至少一种。

本发明的第二方面提供一种配置化的日志脱敏装置,其特征在于,包括:

日志数据处理模块,用于获取并标准化处理日志数据;

过滤器构建模块,用于构建敏感数据过滤器,所述敏感数据过滤器包括可配置的至少一个敏感数据侦测组件;

待脱敏数据确定模块,用于使用所述敏感数据过滤器对所述标准化处理的日志数据进行侦测以确定待脱敏数据;

脱敏规则设置模块,用于设置数据脱敏规则;

脱敏处理模块,用于基于所述数据脱敏规则对所述待脱敏数据进行脱敏处理。

根据本发明的一种优选实施方式,所述标准化处理日志数据,进一步包括:

对所述日志数据进行预处理,以形成统一格式、类型和结构的数据。

根据本发明的一种优选实施方式,所述至少一个敏感数据侦测组件,用于侦测不同种类的待脱敏数据。

根据本发明的一种优选实施方式,还包括:侦测组件配置模块,用于根据待脱敏数据的种类,配置所述敏感数据侦测组件。

根据本发明的一种优选实施方式,所述敏感数据侦测组件可以为值过滤器。

根据本发明的一种优选实施方式,所述待脱敏数据种类可包括用户隐私数据、涉及用户安全数据、商业性敏感数据。

根据本发明的一种优选实施方式,所述待脱敏数据,具体可包括:通讯号码、银行卡号、身份证号、用户名、账号密码、ip地址中的至少一种。

根据本发明的一种优选实施方式,所述脱敏规则设置模块,进一步包括:脱敏方式设置单元,用于设置待脱敏数据的脱敏方式;数据格式设置单元设置待脱敏数据完成脱敏后的数据格式。

根据本发明的一种优选实施方式,所述脱敏方式,具体可包括:数据替换、数据重排、数据加密、数据截断、数据掩码、数据偏移中的至少一种。

本发明的第三方面提供一种电子设备,其中,该电子设备包括:处理器;以及,

存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行任一项所述的方法。

本发明的第四方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现任一项所述的方法。

本发明的技术方案,具有如下有益效果:

本发明通过构建敏感数据过滤器,并配置敏感数据侦测组件实现对指定脱敏对象和字段的脱敏,操作简单、灵活提高脱敏准确性和效率。

附图说明

为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。

图1是本发明的配置化的日志脱敏方法流程示意图;

图2是本发明的一具体实施例的配置化的日志脱敏方法根据待脱敏数据种类配置敏感数据侦测组件的原理示意图;

图3是本发明的配置化的日志脱敏装置模块架构示意图;

图4是本发明的配置化的日志脱敏的电子设备结构框架示意图;

图5是本发明的计算机可读存储介质示意图。

具体实施方式

现在将参考附图更全面地描述本发明的示例性实施例。然而,示例性实施例能够以多种形式实施,且不应被理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例能够使得本发明更加全面和完整,更加便于将发明构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的元件、组件或部分,因而将省略对它们的重复描述。

在符合本发明的技术构思的前提下,在某个特定的实施例中描述的特征、结构、特性或其他细节不排除可以以合适的方式结合在一个或更多其他的实施例中。

在对于具体实施例的描述中,本发明描述的特征、结构、特性或其他细节是为了使本领域的技术人员对实施例进行充分理解。但是,并不排除本领域技术人员可以实践本发明的技术方案而没有特定特征、结构、特性或其他细节的一个或更多。

附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。

附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但这不应受这些定语限制。这些定语乃是用以区分一者与另一者。例如,第一器件亦可称为第二器件而不偏离本发明实质的技术方案。

术语“和/或”或者“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。

金融平台的业务系统内存在大量系统日志,日志信息能够通过打印组件进行打印。但日志信息中可能包括用户敏感信息。因此,在打印日志信息时,需对日志中的用户敏感信息进行脱敏处理。

开发人员在对用户敏感信息进行脱敏处理时,通常需重写应用日志框架log4j2的信息工厂messagefactory。该种解决思路存在的问题是:一、针对敏感字段逐一定位已有的项目代码,逐一去排查用户敏感信息,并相应地对代码进行大量的修改,效率低下,浪费人力,不够规范;二、不好根除用户敏感信息,写如果稍有不慎,造成用户部分敏感信息泄露。

本发明的解决思路是:扩展应用日志框架log4j2的信息工厂messagefactory,而非重写信息工厂messagefactory。在日志模板格式化数据时,对应用日志框架log4j2的信息工厂messagefactory进行扩展,构建敏感数据过滤器,并配置敏感数据侦测组件实现对指定脱敏对象和字段的脱敏。本发明能够避免逐一去排查用户敏感信息,而是通过敏感数据过滤器,对需脱敏的用户敏感信息进行统一、规范配置,操作简单、灵活,提高脱敏准确性和效率。

图1是本发明的配置化的日志脱敏方法流程示意图;如图1所示,本发明的配置化的日志脱敏方法,包括:

s101:获取并标准化处理日志数据。

开发者通过日志收集组件实现对日志数据的获取。例如:.net平台的log4net,支持多种存储方式(文件、数据库),多种格式,多种日志拆分方式。java平台主流的log4j、slf4j、logback。

slf4j是对所有日志框架制定的一种规范、标准、接口,并不是一个框架的具体的实现,因为接口并不能独立使用,需要和具体的日志框架实现配合使用,其中,日志框架实现包括log4j、logback。

log4j是apache实现的一个开源日志组件,logback同样是由log4j的作者设计完成的,拥有更好的特性,用来取代log4j的一个日志框架,是slf4j的原生实现。

log4j2是log4j1.x和logback的改进版,使得日志的吞吐量、性能比log4j1.x提高10倍,并解决一些死锁的bug,而且配置更加简单灵活。

获取到日志数据后,对日志数据进行标准化处理。

其中,标准化处理日志数据,进一步包括:对所述日志数据进行预处理,以形成统一格式、类型和结构的数据。

具体地,金融平台的业务系统的日志数据来源较多,从各数据源获取的日志数据为脏数据,并不能够用于后续的数据分析。通过对日志数据进行数据清理,数据集成,数据变换,数据归约等预处理后,统一日志数据的格式、类型和结构,同时,也便于后续数据挖掘过程中提取脱敏对象和字段,大大提高了数据挖掘模式的质量,降低实际挖掘所需要的时间。

s102:构建敏感数据过滤器,所述敏感数据过滤器包括可配置的至少一个敏感数据侦测组件。

鉴于现有技术对日志数据中的待脱敏数据需逐一排查,浪费人力。本发明则通过构建敏感数据过滤器,对待脱敏数据进行统一配置。

待脱敏数据的种类可包括用户隐私数据、涉及用户安全数据、商业性敏感数据。

图2是本发明的一具体实施例的配置化的日志脱敏方法根据待脱敏数据种类配置敏感数据侦测组件的原理示意图;如图2所示,根据待脱敏数据的种类,配置敏感数据侦测组件。

例如,待脱敏数据包括用户隐私数据,则配置针对用户隐私数据的敏感数据侦测组件;再例如,根据要求要增加对商业性敏感数据的脱敏,则增加针对商业性敏感数据的敏感数据侦测组件。

敏感数据侦测组件配置完成后,则敏感数据侦测组件可用于侦测不同种类的待脱敏数据。

待脱敏数据的种类以及敏感数据侦测组件确定后,通过对至少一个敏感数据侦测组件进行封装来构建敏感数据过滤器。

敏感数据过滤器设置有脱敏开关、耗时开关、并且规定日志最大长度。敏感数据过滤器能够对日志模板关键字脱敏或日志参数对象关键字脱敏。

本发明的敏感数据过滤器设置有facade接口。facade接口为抽象层概念,因为对于不同的java程序,日志框架log4j、logback、log4j2不方便移植。通过facade接口搭配日志框架,通过进行日志记录,这样在更换框架时,就可以只修改facade的小部分参数,就可以直接完成框架的更换。

其中,敏感数据侦测组件可以为值过滤器。

s103:使用所述敏感数据过滤器对所述标准化处理的日志数据进行侦测以确定待脱敏数据。

其中,所述待脱敏数据,具体可包括:通讯号码、银行卡号、身份证号、用户名、账号密码、ip地址中的至少一种。

作为示例,敏感数据过滤器对标准化处理的日志数据进行侦测后,确定待脱敏数据为用户通讯号码mobile。

值过滤器valuefilter的实现接口如下:

现有技术中,技术人员在对用户通讯号码mobile进行脱敏处理时,会去代码中进行定位,然后对位于不同模块下的与用户通讯号码mobile相关的代码进行大量的修改。

但是,通过本发明的方法,技术人员仅需通过更改值过滤器中针对用户通讯号码mobile的组件即可,技术人员无需再到各模块下进行代码的修改。

通过上述代码可看出,技术人员能够通过值过滤器灵活、方便地指定待脱敏的对象或字段。

s104:设置数据脱敏规则。

其中,所述设置数据脱敏规则,进一步包括:设置待脱敏数据的脱敏方式;设置待脱敏数据完成脱敏后的数据格式。

其中,所述脱敏方式,具体可包括:数据替换、数据重排、数据加密、数据截断、数据掩码、数据偏移中的至少一种。

其中,完成脱敏后的数据格式,具体可包括:统一的符号或文字表示等。

具体地,可例如通过数据替换,将用户身份证号、通讯号码等敏感信息统一为星号*或井号#等符号表示。

s105:基于所述数据脱敏规则对所述待脱敏数据进行脱敏处理。

作为示例,仍选择对用户通讯号码mobile的脱敏方式,从上述代码可看出,对用户通讯号码mobile的脱敏方式为数据替换,用户通讯号码mobile完成脱敏后的数据格式为星号“****”。

本发明通过构建敏感数据过滤器,并配置敏感数据侦测组件实现对指定脱敏对象和字段的脱敏,操作简单、灵活提高脱敏准确性和效率。

本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由计算机数据处理设备执行的程序(计算机程序)。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、rom、ram等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。

下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。

本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。

图3是本发明的配置化的日志脱敏装置模块架构示意图;如图3所示,本发明的配置化的日志脱敏装置300,包括:日志数据处理模块301,过滤器构建模块302,待脱敏数据确定模块303,脱敏规则设置模块304,脱敏处理模块305。

日志数据处理模块,用于获取并标准化处理日志数据。

过滤器构建模块,用于构建敏感数据过滤器,所述敏感数据过滤器包括可配置的至少一个敏感数据侦测组件。

待脱敏数据确定模块,用于使用所述敏感数据过滤器对所述标准化处理的日志数据进行侦测以确定待脱敏数据。

脱敏规则设置模块,用于设置数据脱敏规则。

脱敏处理模块,用于基于所述数据脱敏规则对所述待脱敏数据进行脱敏处理。

其中,所述标准化处理日志数据,进一步包括:对所述日志数据进行预处理,以形成统一格式、类型和结构的数据。

其中,所述至少一个敏感数据侦测组件,用于侦测不同种类的待脱敏数据。

其中,本发明的配置化的日志脱敏装置,还包括:侦测组件配置模块,用于根据待脱敏数据的种类,配置所述敏感数据侦测组件。

本发明的配置化的日志脱敏装置中,所述敏感数据侦测组件可以为值过滤器。

本发明的配置化的日志脱敏装置,所述待脱敏数据种类可包括用户隐私数据、涉及用户安全数据、商业性敏感数据。

本发明的配置化的日志脱敏装置,所述待脱敏数据,具体可包括:通讯号码、银行卡号、身份证号、用户名、账号密码、ip地址中的至少一种。

本发明的配置化的日志脱敏装置,所述脱敏规则设置模块,进一步包括:脱敏方式设置单元,用于设置待脱敏数据的脱敏方式;数据格式设置单元设置待脱敏数据完成脱敏后的数据格式。

本发明的配置化的日志脱敏装置,所述脱敏方式,具体可包括:数据替换、数据重排、数据加密、数据截断、数据掩码、数据偏移中的至少一种。

下面描述本发明的电子设备实施例,该电子设备可以视为对于上述本发明的方法和装置实施例的具体实体实施方式。对于本发明电子设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明电子设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。

图4是本发明的配置化的日志脱敏的电子设备结构框架示意图。下面参照图4来描述根据本发明该实施例的电子设备400。图4显示的电子设备400仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示,电子设备400以通用计算设备的形式表现。电子设备400的组件可以包括但不限于:至少一个处理单元410、至少一个存储单元420、连接不同系统组件(包括存储单元420和处理单元410)的总线430、显示单元440等。

其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元410执行,使得所述处理单元410执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元410可以执行如图1所示的步骤。

所述存储单元420可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)4201和/或高速缓存存储单元4202,还可以进一步包括只读存储单元(rom)4203。

所述存储单元420还可以包括具有一组(至少一个)程序模块4205的程序/实用工具4204,这样的程序模块4205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线430可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备400也可以与一个或多个外部设备500(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备400交互的设备通信,和/或与使得该电子设备400能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口450进行。并且,电子设备400还可以通过网络适配器460与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器460可以通过总线430与电子设备400的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。当所述计算机程序被一个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法,即:获取并标准化处理日志数据;构建敏感数据过滤器,所述敏感数据过滤器包括可配置的至少一个敏感数据侦测组件;使用所述敏感数据过滤器对所述标准化处理的日志数据进行侦测以确定待脱敏数据;设置数据脱敏规则;基于所述数据脱敏规则对所述待脱敏数据进行脱敏处理。

所述计算机程序可以存储于一个或多个计算机可读介质上,如图……所示。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

综上所述,本发明可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1