本发明涉及数据处理领域,具体来说,涉及一种基于大数据的各节点存储的安全存储控制方法。
背景技术:
1、随着计算机技术的发展和网络技术的进步,人类的工作和生活发生了巨大的变化,现在人们每天都在接触、读取、存储、处理的信息,诸如通过移动终端进行社会交往、获取新闻、查询知识元素、购物、娱乐等,这使得创造的数据量成倍地增加。由此形成的海量数据被称为大数据。大数据在给用户带来便利的同时,也带来了一些安全隐患。
2、而大数据技术与云技术的发展密切相关,通过利用云技术来加强和提高网络信息数据存储的安全性,作为越来越受重视的焦点。因此利用云技术来对大数据进行备份和存储是可取的手段。
3、然而,现有技术中针对云存储,主要关注于负载的均衡,即如何把负载合理地存储到各个节点中,或者通过对数据进行加密而分布式存储,在数据存储安全领域中,数据存储的通常方式为:将待存储的用户明文重要原始数据使用加密算法进行加密,得到密文数据;然后将得到的密文数据直接存储到系统存储介质中。众所周知,由于加密算法多数是公开的,因此,黑客很有可能根据已知的公开算法写出破解密文数据的攻击解密程序,或者黑客在盗取密钥后,将重要数据盗取,从而在黑客获得密钥后,将存储在各个节点中的重要数据加以复制、解密盗取,进而降低了数据存储时的安全性。
4、针对相关技术中的问题,目前尚未提出有效的解决方案。
技术实现思路
1、针对相关技术中的问题,本发明提出一种基于大数据的各节点存储的安全存储控制方法,以克服现有相关技术所存在的上述技术问题。
2、为此,本发明采用的具体技术方案如下:
3、一种基于大数据的各节点存储的安全存储控制方法,该安全存储控制方法包括以下步骤:
4、s1、获取待存储数据,并对待存储数据进行预处理;
5、s2、对预处理后的待存储数据进行切片处理,获取切片后的数据块,并利用aes算法对数据块设置安全屏障,得到密文区间;
6、s3、判断密文区间的对象类型,选择其对应的编码策略,并根据编码策略对密文区间进行编码;
7、s4、对本地存储空间中节点空间的容量及安全性进行评估;
8、s5、利用lstm构建异常行为检测模型,并将异常行为检测模型在编码后的密文区间中运行;
9、s6、基于节点空间的容量及安全性,将编码后的密文区间存储到各节点空间中。
10、进一步的,所述获取待存储数据,并对待存储数据进行预处理包括以下步骤:
11、s11、对待存储数据进行分析,获取待存储数据的分析结果;
12、s12、基于获取的分析结果确定数据清洗转换规则与工作流;
13、s13、从待存储数据中抽取部分数据作为样本数据,并利用数据清洗转换规则与工作流对样本数据进行验证;
14、s14、若样本数据满足清洗要求,则对待存储数据进行数据清洗,清除待存储数据中的数据质量问题。
15、进一步的,所述数据质量问题包括数据缺失、数据错误、数据重复、数据不一致及数据异常值。
16、进一步的,所述对预处理后的待存储数据进行切片处理,获取切片后的数据块,并利用aes算法对数据块设置安全屏障,得到密文区间包括以下步骤:
17、s21、对预处理后的待存储数据进行分析,并获取待存储数据的分布情况;
18、s22、根据待存储数据的分布情况,选择合适的切分点;
19、s23、根据选定的切分点将待存储数据切分成多个数据分布相似的数据块;
20、s24、获取数据块中的初始化随机数种子,产生字节随机数作为密钥区;
21、s25、按照aes算法所需的密钥字节长度,产生字节随机数,并将字节随机数作为秘钥;
22、s26、将密钥填充获取的密钥区中,并设置加密算法标识;
23、s27、将数据块按照获取的密钥及aes算法进行加密,并在加密后的数据块中插入获取的密钥区,得到加密后的密文区间。
24、进一步的,所述根据待存储数据的分布情况,选择合适的切分点包括以下步骤:
25、s221、确定待存储数据的分布类型,并对待存储数据进行统计分析;
26、s222、根据待存储数据的分布情况,选择合适的切分点,并对切分点进行检验;
27、s223、将不合理的切分点进行调整,并重新进行检验,得到合适的切分点。
28、进一步的,所述按照aes算法所需的密钥字节长度,产生字节随机数,并将字节随机数作为秘钥包括以下步骤:
29、s251、根据aes算法所需的密钥长度,并利用随机数生成器产生字节随机数;
30、s252、将生成的字节随机数转换为二进制表示,得到由0和1组成的比特流;
31、s253、将得到的比特流作为aes算法的秘钥。
32、进一步的,所述利用lstm构建异常行为检测模型,并将异常行为检测模型在编码后的密文区间中运行包括以下步骤:
33、s51、获取各节点空间中密文区间的异常行为记录,并对异常行为记录进行解析,得到行为值及参数值向量;
34、s52、利用lstm构建异常行为检测模型,并将解析得到的行为值与参数值向量输入至异常行为检测模型中进行检测;
35、s53、若行为值与参数值向量检测结果为异常,则将该密文区间标记为异常区间,并对异常区间中的异常行为进行拦截。
36、进一步的,所述异常行为检测模型包括行为值异常检测模型及参数值异常检测模型。
37、进一步的,所述利用lstm构建异常行为检测模型,并将解析得到的行为值与参数值向量输入至异常行为检测模型中进行检测包括以下步骤:
38、s521、利用行为值异常检测模型对输入的行为值进行检测;
39、s522、若行为值检测正常,则利用参数值异常检测模型对参数值向量进行检测;
40、s523、若行为值及参数值向量检测均为正常,则将该密文区间标记为安全区间,若异常行为值及参数值向量检测存在任意一项异常,则将该密文区间标记为异常区间。
41、进一步的,所述利用行为值异常检测模型对输入的行为值进行检测包括以下步骤:
42、s5211、获取行为值序列,并将不同的行为值定义为一个类;
43、s5212、构建三层的lstm网络结构并利用行为值序列训练成一个多类分类器;
44、s5213、利用交叉熵作为损失函数,并将行为值的历史记录输入至多类分类器中,输出行为值的概率分布;
45、s5214、根据行为值的概率分布,对存在的行为值进行排序,若下一个行为值出现在前一个候选值之内,则将该行为值标记为正常,否则将该行为值标记为异常。
46、本发明的有益效果为:
47、1、本发明提供的安全存储控制方法能够在对数据存储前对待存储数据进行清洗,从而可以去除待存储数据中的错误、不完整、重复及无效数据,提高待存储数据的质量和准确性,降低数据处理成本,同时也可以提高决策的准确性和数据的安全性,并且通过对待存储数据的清洗能够去除数据中包含敏感信息的数据,进而提高数据的安全性。
48、2、本发明提供的安全存储控制方法能够将待存储数据切分成多个数据块,并且将数据块存储到多个节点空间中,可以避免单点故障导致数据丢失,即使某个节点空间出现故障,其他节点空间仍然可以继续提供服务,确保数据的可靠性及安全性,并且通过aes算法能够对数据块进行加密,获取加密后的密文区间,从而可以提高数据的安全性及完整性,防止敏感信息泄露或被不当使用。
49、3、本发明提供的安全存储控制方法通过异常行为检测模型对密文区间中的异常行为进行识别并拦截,从而可以及时发现潜在的安全威胁,保护数据及节点空间的安全性,防止数据泄露并篡改,进一步提高数据的完整性及可信度,进而提高了各节点空间对数据存储的安全性及可靠性。