一种基于敏感数据库的自学习管理系统的制作方法

文档序号:26644981发布日期:2021-09-15 02:08阅读:90来源:国知局
一种基于敏感数据库的自学习管理系统的制作方法

1.本发明涉及数据处理技术领域,尤其涉及一种基于敏感数据库的自学习管理系统。


背景技术:

2.敏感数据是指泄漏后可能会给社会或个人带来严重危害的数据。包括个人隐私数据,如姓名、身份证号码、住址、电话、银行账号、邮箱、密码、医疗信息、教育背景等;也包括企业或社会机构不适合公布的数据,如企业的经营情况,企业的网络结构、ip地址列表等。特别是目前智能电网系统的普及,对信息收集的粒度提高,同时也就提高了用电信息的泄漏风险。
3.现有的技术中,在对敏感数据进行处理的过程中,通常都是根据人工提前设定的评判准则进行划分,然后再将敏感数据进行归类,这种敏感数据的管理方法已经不适用于数据泛滥的时代,现在的数据处理领域,数据的更新速度快,不同数据的组合类型也在发生变化,使用原有的敏感数据管理系统已经不能满足现有的识别场景,很容易对一些新型的敏感数据漏判,导致数据处理过程的安全性和效率降低。


技术实现要素:

4.针对现有技术存在的不足,本发明目的是提供一种基于敏感数据库的自学习管理系统,能够通过自学习管理系统,根据新产生的敏感数据进行重新更新归类,能够提高对敏感数据归类的准确性,以解决现有的敏感数据的处理过程较为死板,处理效率和安全性较低的问题。
5.为了实现上述目的,本发明是通过如下的技术方案来实现:一种基于敏感数据库的自学习管理系统,包括数据库更新模块、存储模块、自学习模块以及处理模块,所述存储模块内存储有初始敏感数据库,所述自学习模块用于根据初始敏感数据库进行敏感数据特征的构建,所述处理模块用于将接收到的数据进行归类处理,所述数据库更新模块用于将归类处理后的敏感数据存储至存储模块中;
6.所述自学习模块包括第一学习单元以及第二学习单元;所述第一学习单元用于根据初始敏感数据库进行敏感数据特征的构建,所述第二学习单元用于根据更新后的敏感数据库进行敏感数据特征的构建;
7.所述第一学习单元包括敏感数据分类子单元以及第一特征构建子单元;所述敏感数据分类子单元配置有敏感数据分类策略,所述敏感数据分类策略包括:将初始敏感数据库中的敏感数据进行分类,分类级别为高度敏感数据、中度敏感数据以及轻度敏感数据;
8.再将高度敏感数据、中度敏感数据以及轻度敏感数据进行数据标签分类,数据标签分为数据来源区域、数字数据、组合数据、体征数据、支付记录数据以及登录记录数据;
9.所述第一特征构建子单元包括第一特征构建策略,所述第一特征构建策略包括:将高度敏感数据中的数据来源区域进行提取,并标记为高度区域特征;
10.将高度敏感数据中的数字数据和支付记录数据进行提取,并将同时标记支付记录数据和数字数据的组合标记为高度支付密码特征;
11.将高度敏感数据中的组合数据和登录记录数据进行提取,并将同时标记组合数据和登录记录数据的组合标记为高度登录密码特征;
12.将高度敏感数据中的数字数据和登录记录数据进行提取,并将同时标记数字数据和登录记录数据的组合标记为高度登录账号特征;
13.将高度敏感数据中的体征数据和支付记录数据进行提取,并将同时标记体征数据和支付记录数据的组合标记为高度支付体征特征;
14.将高度敏感数据中的体征数据和登录记录数据进行提取,并将同时标记体征数据和登录记录数据的组合标记为高度登录体征特征;
15.所述处理模块包括敏感数据划分单元,所述敏感数据划分单元配置有比对策略,所述比对策略包括:将接收到的数据进行数据标签分类,然后将接收到的数据分别与高度区域特征、高度支付密码特征、高度登录密码特征、高度登录账号特征、高度支付体征特征以及高度登录体征特征进行比对,比对符合上述特征时,将数据归为一级高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类;
16.所述数据库更新模块包括缓存单元,所述缓存单元用于存储第一时间内新归类的一级高度敏感数据;
17.所述存储模块包括高度敏感数据存储单元,所述高度敏感数据存储单元配置有移存策略,所述移存策略包括:每隔第一时间将缓存单元中的存储数据移存进高度敏感数据存储单元内。
18.进一步地,所述第二学习单元包括第二特征构建子单元,所述第二特征构建子单元配置有第二特征构建策略,所述第二特征构建策略包括:将具有高度区域特征和高度支付密码特征的数据进行提取,并将同时具备高度区域特征和高度支付密码特征的数据标记为高度集中支付区域特征。
19.进一步地,所述第二特征构建策略还包括:将具有高度登录账号特征和高度区域特征的数据进行提取,并将同时具备高度登录账号特征和高度区域特征的数据标记为高度集中登录区域特征。
20.进一步地,所述第二特征构建策略还包括:将具有高度支付密码特征的数据和高度登录密码特征的数据进行提取,并将同时具备高度支付密码特征和高度登录密码特征的数据标记为高度密码使用特征。
21.进一步地,所述第二特征构建策略还包括:将具有高度支付体征特征和高度登录体征特征的数据进行提取,并将同时具备高度支付体征特征和高度登录体征特征的数据标记为高度体征特征。
22.进一步地,所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据分别与高度集中支付区域特征、高度集中登录区域特征、高度密码使用特征以及高度体征特征进行比对,比对符合上述特征时,将数据归为二级高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
23.进一步地,所述第二学习单元还包括特征细分子单元,所述特征细分子单元配置有特征细分策略,所述特征细分策略包括:将高度密码使用特征进行拆分,记录高度密码使
用特征的位数以及使用组合符号的类型数,并将不同位数对应的组合符号的类型数进行归类,并选取不同位数下组合符号类型数出现次数最多的为相互匹配的组合,并标记为位数对应类型数特征。
24.进一步地,所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据与位数对应类型数特征进行比对,比对符合上述特征时,将数据归为细分敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
25.进一步地,所述数据标签还包括视频数据、图片数据以及手机拍摄来源数据;
26.所述第一特征构建策略还包括:将高度敏感数据中的视频数据和手机拍摄来源数据进行提取,并将同时标记视频数据和手机拍摄来源数据的组合标记为高度视频特征;
27.将高度敏感数据中的图片数据和手机拍摄来源数据进行提取,并将同时标记图片数据和手机拍摄来源数据的组合标记为高度图片特征。
28.进一步地,所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据与高度视频特征和高度图片特征进行比对,比对符合上述特征时,将数据归为高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
29.本发明的有益效果:本发明通过敏感数据分类策略,能够将初始敏感数据库中的敏感数据进行分类,分类级别为高度敏感数据、中度敏感数据以及轻度敏感数据;再将高度敏感数据、中度敏感数据以及轻度敏感数据进行数据标签分类,数据标签分为数据来源区域、数字数据、组合数据、体征数据、支付记录数据以及登录记录数据,根据这些特征进行学习,并第一特征构建策略能够构建出高度区域特征、高度支付密码特征、高度登录密码特征、高度登录账号特征、高度支付体征特征以及高度登录体征特征,从而能够快速对接收的数据进行敏感数据的分类,提高敏感数据的自学习处理效率。
30.本发明通过设置第二学习单元,所述第二学习单元能够根据更新后的敏感数据库进行敏感数据特征的构建,能够再次构建出高度集中支付区域特征、高度集中登录区域特征、高度密码使用特征以及高度体征特征,实现对敏感数据的敏感度的升级,提高对高度敏感数据的分类准确性;同时增加了特征细分策略,能够针对高度密码使用特征的位数以及使用组合符号的类型数进行特征细分,提高了对密码数据的识别准确性;数据标签中增加视频数据、图片数据以及手机拍摄来源数据,能够得出高度视频特征以及高度图片特征,提高敏感数据分类的全面性。
附图说明
31.通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
32.图1为本发明的实施例一的原理框图;
33.图2为本发明的实施例二的原理框图。
34.图中:1、自学习管理系统;11、自学习模块;111、第一学习单元;1111、敏感数据分类子单元;1112、第一特征构建子单元;112、第二学习单元;1121、第二特征构建子单元;1122、特征细分子单元;12、处理模块;121、敏感数据划分单元;13、数据库更新模块;131、缓存单元;14、存储模块;141、存储单元。
具体实施方式
35.为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
36.实施例一,请参阅图1,一种基于敏感数据库的自学习管理系统,包括数据库更新模块13、存储模块14、自学习模块11以及处理模块12,所述存储模块14内存储有初始敏感数据库,所述自学习模块11用于根据初始敏感数据库进行敏感数据特征的构建,所述处理模块12用于将接收到的数据进行归类处理,所述数据库更新模块13用于将归类处理后的敏感数据存储至存储模块14中。
37.所述自学习模块11包括第一学习单元111以及第二学习单元112;所述第一学习单元111用于根据初始敏感数据库进行敏感数据特征的构建,所述第二学习单元112用于根据更新后的敏感数据库进行敏感数据特征的构建。
38.所述第一学习单元111包括敏感数据分类子单元1111以及第一特征构建子单元1112;所述敏感数据分类子单元1111配置有敏感数据分类策略,所述敏感数据分类策略包括:将初始敏感数据库中的敏感数据进行分类,分类级别为高度敏感数据、中度敏感数据以及轻度敏感数据;
39.再将高度敏感数据、中度敏感数据以及轻度敏感数据进行数据标签分类,数据标签分为数据来源区域、数字数据、组合数据、体征数据、支付记录数据以及登录记录数据。
40.所述第一特征构建子单元1112包括第一特征构建策略,所述第一特征构建策略包括:将高度敏感数据中的数据来源区域进行提取,并标记为高度区域特征,高度区域通常划分为国家级研究院、科研所、银行等需要保证数据安全的区域,从该区域输出的数据需要划定为高度敏感数据。
41.将高度敏感数据中的数字数据和支付记录数据进行提取,并将同时标记支付记录数据和数字数据的组合标记为高度支付密码特征,如果数字数据和支付记录数据同时出现的情况下,此数字数据大概率为支付密码,因此需要划定为高度敏感数据。
42.将高度敏感数据中的组合数据和登录记录数据进行提取,并将同时标记组合数据和登录记录数据的组合标记为高度登录密码特征,如果组合数据和登录记录数据同时出现的情况下,此组合数据大概率为登录密码数据,因此需要划定为高度敏感数据。
43.将高度敏感数据中的数字数据和登录记录数据进行提取,并将同时标记数字数据和登录记录数据的组合标记为高度登录账号特征,当数组数据和登录记录数据同时出现的情况下,此数字数据大概率为登录账号或手机号,因此需要划定为高度敏感数据。
44.将高度敏感数据中的体征数据和支付记录数据进行提取,并将同时标记体征数据和支付记录数据的组合标记为高度支付体征特征,当体征数据和支付记录数据同时出现的情况下,此体征数据大概率为支付时的体征密码,如指纹密码。
45.将高度敏感数据中的体征数据和登录记录数据进行提取,并将同时标记体征数据和登录记录数据的组合标记为高度登录体征特征,当体征数据和登录记录数据同时出现的情况下,此体征数据大概率为登录时的体征密码,如指纹密码。
46.所述处理模块12包括敏感数据划分单元121,所述敏感数据划分单元121配置有比对策略,所述比对策略包括:将接收到的数据进行数据标签分类,然后将接收到的数据分别与高度区域特征、高度支付密码特征、高度登录密码特征、高度登录账号特征、高度支付体
征特征以及高度登录体征特征进行比对,比对符合上述特征时,将数据归为一级高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
47.所述数据标签还包括视频数据、图片数据以及手机拍摄来源数据;
48.所述第一特征构建策略还包括:将高度敏感数据中的视频数据和手机拍摄来源数据进行提取,并将同时标记视频数据和手机拍摄来源数据的组合标记为高度视频特征;
49.将高度敏感数据中的图片数据和手机拍摄来源数据进行提取,并将同时标记图片数据和手机拍摄来源数据的组合标记为高度图片特征。
50.所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据与高度视频特征和高度图片特征进行比对,比对符合上述特征时,将数据归为高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
51.所述数据库更新模块13包括缓存单元131,所述缓存单元131用于存储第一时间内新归类的一级高度敏感数据;
52.所述存储模块14包括高度敏感数据存储单元141,所述高度敏感数据存储单元141配置有移存策略,所述移存策略包括:每隔第一时间将缓存单元131中的存储数据移存进高度敏感数据存储单元141内。
53.实施例二,请参阅图2,实施例二在实施例一的基础上,增加了第二学习单元112,第二学习单元112能够根据更新后的敏感数据库进行特征提取,从而进一步提高了高度敏感数据的细分程度,提高对敏感数据分类的准确性。所述第二学习单元112包括第二特征构建子单元1121,所述第二特征构建子单元1121配置有第二特征构建策略,所述第二特征构建策略包括:将具有高度区域特征和高度支付密码特征的数据进行提取,并将同时具备高度区域特征和高度支付密码特征的数据标记为高度集中支付区域特征,这一特征比较常见于银行或者商场等集中出现支付行为的领域中,因此对这一区域的数据处理的安全优先级也较高。
54.所述第二特征构建策略还包括:将具有高度登录账号特征和高度区域特征的数据进行提取,并将同时具备高度登录账号特征和高度区域特征的数据标记为高度集中登录区域特征,这一特征比较常见于网吧等用户终端较多的娱乐场所,用户会频繁的登录账号。
55.所述第二特征构建策略还包括:将具有高度支付密码特征的数据和高度登录密码特征的数据进行提取,并将同时具备高度支付密码特征和高度登录密码特征的数据标记为高度密码使用特征。提取这一特征,能够对密码相关的数据进行识别,从而对密码进行着重加密处理。
56.所述第二特征构建策略还包括:将具有高度支付体征特征和高度登录体征特征的数据进行提取,并将同时具备高度支付体征特征和高度登录体征特征的数据标记为高度体征特征。人体体征的数据包含很多种,如果是用于支付和登录时,那么此体征的特征大概率用于体征密码,如指纹密码和人脸识别密码。
57.所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据分别与高度集中支付区域特征、高度集中登录区域特征、高度密码使用特征以及高度体征特征进行比对,比对符合上述特征时,将数据归为二级高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
58.所述第二学习单元112还包括特征细分子单元1122,所述特征细分子单元1122配
置有特征细分策略,所述特征细分策略包括:将高度密码使用特征进行拆分,记录高度密码使用特征的位数以及使用组合符号的类型数,并将不同位数对应的组合符号的类型数进行归类,并选取不同位数下组合符号类型数出现次数最多的为相互匹配的组合,并标记为位数对应类型数特征。
59.所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据与位数对应类型数特征进行比对,比对符合上述特征时,将数据归为细分敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
60.工作原理:在对数据进行处理的过程中,自学习模块11能够根据存储模块14中存储的初始敏感数据库进行特征提取,并将高度敏感数据进行标签和特征分类,通过处理模块12能够对新接收的数据进行高度敏感数据的分类,从而提高对敏感数据的自学习分类效率,标记后的高度敏感数据先缓存在数据库更新模块13中,在一定时间后,统一集中存储在存储模块14中,并且通过在自学习模块11中增加第二学习单元112,能够对存储模块14中新增加的敏感数据进行再学习分类,从而进一步提高敏感数据分类的准确性和细致性,提高对敏感数据的整体的自学习管理效率。
61.最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1