一种基于云盘的大数据文件安全保护方法及系统与流程

文档序号:11865215阅读:281来源:国知局
一种基于云盘的大数据文件安全保护方法及系统与流程

本发明涉及计算机数据安全技术领域,尤其涉及一种将大数据文件保存在云盘上的数据安全。



背景技术:

大数据是高科技时代的产物,麦肯锡全球研究所给出的关于大数据的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征,同时随着云时代的来临,大数据也吸引了越来越多的关注,企业组织利用相关大数据和分析可以帮助它们降低成本、提高效率、开发新产品、做出更明智的业务决策等等。

因此为节省存储资源开支、降低运维维护成本以及提高企业系统运行效率,可以将大数据文件存储到云服务提供商以网络云盘的形式向用户提供的存储空间中,例如360云盘、百度云盘、小米云盘,等等。但是大多数具有用户数据直接访问权的云服务提供商并非是完全可信的,也就是说,存放在云盘中的数据可能被非法用户访问,存在信息泄密的风险;或者也有企业用户建立私有云,当将私有云部署在企业数据中心的防火墙外时,依然存在数据安全问题;因此,为了克服上述不足,用户数据通常采取加密保护后上传的方式保存在云盘。但是,加密的数据仍然不能避免保存在云盘上数据信息被非法获取的情况,因为被加密的数据仍有被破解的可能性,例如:2015年7月6日,意大利著名黑客公司Hacking Team的服务器受到攻击,该公司约400GB的加密数据被窃取并被破解,包括Hacking Team一些产品的源代码、邮件、录音和客户详细信息。与此类似的有斯诺登事件、CSDN用户密码泄露,12306用户身份信息泄露等。

这对于利用云盘来管理数据的用户,仅依靠对存放在云盘的数据进行加密的手段来增强数据安全性是远远不够的。



技术实现要素:

为了解决现有技术中的上述问题,本发明提出了一种基于云盘的大数据文件安全保护方法,其特征在于包括以下步骤:

(1)提取需要保存在云盘的数据文件;

(2)将所述数据文件拆分为至少两个部分;

(3)所述至少两个部分中的第一部分存放在云盘,其余部分存放在用户本地存储设备中。

优选的,其余部分的数据量m满足以下条件:

当n>500KB时,

当50KB<n≤500KB时,

当0<n≤50KB时,0.5n≤m<n;

其中,n为所述每个数据文件的数据总量,m、n的单位均为KB。

优选的,还包括下述步骤:

(4)对数据文件建立信息索引,并保存在用户本地存储设备中,所述信息索引包括:数据文件的数据总量,被拆分的数量,拆分的各部分数据所存储的位置、编号;其中,所述所存储的位置记录所述被拆分的数据部分存储的云盘地址,或者用户的本地存储设备地址,所述编号记录被拆分的各部分数据在拆分前的数据文件中的位置顺序;

优选的,所述用户本地存储设备包括:计算机、手机、iPad、软盘、移动硬盘。

优选的,还包括下述步骤:

(5)当用户数据文件时,首先读取该数据文件对应的存储在用户本地存储设备上的索引信息,根据索引信息中的编号将各部分数据按位置顺序还原成一临时数据文件;将所述还原的临时数据文件的容量与索引信息中的数据容量进行比较,如果两者相等,则还原的临时文件是有效的数据文件,如果两者不相等,则还原的临时文件出现错误;

优选的,根据索引信息中的拆分的数量、拆分的各部分数据所存储的位置将被拆分的各部分数据读取到本地存储设备的同一目录下。

进一步,还可以包括下述步骤:

(6)将所述第一部分被进一步拆分为多个部分;

(7)将所述多个部分分别存放在不同的云盘;

优选的,对所述由第一部分和被进一步拆分为多个部分分别使用不同的加密算法;

优选的,所述数据文件为多个。

与上述方法相对应,本发明提出了一种基于云盘的大数据文件安全保护系统,其特征在于包括以下装置:

提取需要保存在云盘的数据文件的装置;

将数据文件拆分为至少两个部分的装置;

所述至少两个部分中的第一部分存放在云盘,其余部分存放在用户本地存储设备的装置。

其中,其余部分的数据量m满足以下条件:

当n>500KB时,

当50KB<n≤500KB时,

当0<n≤50KB时,0.5n≤m<n;

其中,n为所述每个数据文件的数据总量,m、n的单位均为KB。

并且,上述信息索引建立装置具有:

对数据文件建立信息索引,并保存在用户本地存储设备中,所述信息索引包括:所述数据文件的数据总量,被拆分的数量,拆分的各部分数据所存储的位置、编号;其中,所述所存储的位置记录所述被拆分的数据部分存储的云盘地址,或者用户的本地存储设备地址,所述编号记录被拆分的各部分数据在拆分前的数据文件中的位置顺序;

优选的,所述用户本地存储设备包括:计算机、移动硬盘、光盘、服务器;

优选的,所述索引信息还包括使用的加密算法。

优选的,还包括数据恢复装置,所述数据恢复装置具有:

根据索引信息中的编号将存储于云盘和用户本地存储设备上的文件按照位置顺序还原成一临时数据文件;将所述还原的临时数据文件的总量与索引信息中的数据容量进行比较,如果两者相等,则还原的临时文件是有效的数据文件,如果两者不相等,则还原的临时文件出现错误;

优选的,根据索引信息中的拆分的数量、拆分的各部分数据所存储的位置将被拆分的各部分数据读取到本地存储设备的同一目录下。

进一步的,括下述装置:

将所述第一部分被进一步拆分为多个部分的装置;

将所述多个部分存放在不同云盘的装置;

优选的,将所述多个部分分别使用不同的加密算法。

本发明的有益效果是:

1、将数据存储到云服务提供商以网络云盘的形式向用户提供的存储空间中,以便于用户节省存储资源开支、降低运维维护成本以及提高数据的安全性;

2、依靠对存放在云盘的数据进行加密的手段来增强数据安全性;

3、使云盘上的数据不能够组织成一个完整的数据库文件,当云盘上数据即使被未授权用户获取或者破解,由于数据不完整导致所述非授权用户无法获得有效的信息,防止云盘上的数据被非法获取或破解所导致的信息泄露,提高保存在云盘上的数据的安全性。

【附图说明】

此处所说明的附图是用来提供对本发明的进一步理解,构成本申请的一部分,但并不构成对本发明的不当限定,在附图中:

图1是用云盘保存数据的系统图;

图2是本发明的一个优选的方法流程图。

【具体实施方式】

下面将结合附图以及具体实施例来详细说明本发明,其中的示意性实施例以及说明仅用来解释本发明,但并不作为对本发明的不当限定。

本发明的基本思想是:一个数据文件的数据仅是部分保存在云盘上,即云盘上的数据不能够组织成一个完整的数据文件,使得当云盘上数据即使被未授权用户获取或者破解,由于数据不完整导致所述非授权用户无法获得有效的信息,防止云盘上的数据被非法获取或破解所导致的信息泄露,因此提高了保存在云盘上的数据的安全性。

参见图1,图1是用云盘保存数据的系统示意图。用户计算机将原保存在计算机本地存储器的数据通过网络保存到云服务器上,通过这种方式,可以节约用户本地存储空间,尤其针对将数据存储在手机等智能设备上的用户,可以极大的节约存储空间、降低设备成倍以及提高系统运行效率。但是,由于云服务器并非都是可信的,因此,存储在云盘的数据文件存在被非法访问或者破解的风险。参见图2所示的本发明的一个优选的方法流程图,不作为本发明所要求的保护范围的限制。首先在步骤S200,得到需要保存到云盘的数据文件;在步骤S201,将数据文件拆分为至少两个部分;接着在步骤S202,其中所述至少两个部分中的第一部分存放在云盘;其余部分存放用户计算机本地。这使得云盘上保存的数据不能够构成一个完整的数据文件,因此,即使云盘上的数据被非法获取,也由于数据的不完整性,使得获取的数据文件无效,从而有效地提高了数据文件的安全性。

此外,为了防止利用数据恢复的手段将不完整的数据恢复成完整数据,因此,存放在用户计算机本地的数据量不能太小,经大数据和各类破解算法的测试,存放在用户计算机本地的所述其余部分的数据量m需满足以下条件:

当n>500KB时,

当50KB<n≤500KB时,

当0<n≤50KB时,0.5n≤m<n;

其中,n为所述每件数据文件的数据总量,m、n的单位均为KB。可见,当数据文件的容量较小时,例如小于50KB时,则需要在用户计算机本地存放较多的数据部分,以防止非法用户通过数据恢复的手段将云盘的部分数据恢复成原始数据。

在步骤S203-S204,可将所述第一部分进一步拆分为第二部分和第三部分;第二部分和第三部分的数据量的比例可任意设定,并将第二和第三部分分别用不同的加密算法加密后,存放在不同的云盘。通过使用不用的加密算法,使得存放在云盘上数据的更加难以破解,并且,由于存放在不同的云盘里,使得每个云盘存放的文件数据量更小,因此,即使某个云盘的数据部分被解密,也难以基于该解密的数据恢复出原始的数据文件,从而有效的提高了原始数据文件的数据安全性。

本发明包括但不限于将所述第一部分进一步拆分为第二部分和第三部分,也可根据需要拆分为多个部分,每一部分都可以存储在不同的云盘上,同时支持分别加密。

在步骤S205,对每个数据文件建立信息索引,并保存在用户的计算机中,所述信息索引包括:数据文件的总数据容量,拆分的数量,拆分的各部分数据所存储的位置、编号和使用的加密算法;其中,所述所存储的位置记录所述被拆分的数据部分存储在哪一个云盘中,或者用户的计算机中,所述编号记录被拆分的各部分数据在拆分前的数据文件中的位置顺序。通过建立信息索引,确保用户在访问云盘数据时,能够快速的将拆分的数据部分恢复成原始的数据文件,提高云盘数据的访问效率。

在步骤S206,当用户读取云盘的数据文件时,首先读取该数据文件对应的存储在用户计算机上的索引信息,根据索引信息中的拆分的数量、拆分的各部分数据所存储的位置将被拆分的各部分数据读取到本地计算机的同一目录下;根据索引信息中的使用的加密算法,对加密的数据部分用对应的解密算法解密;根据索引信息中的编号将各部分数据按位置顺序还原成一临时数据文件;将所述还原的临时数据文件的容量与索引信息中的数据容量进行比较,如果两者相等,则还原的临时文件是有效的数据文件,如果两者不相等,则还原的临时文件出现错误。通过该步骤对恢复的数据文件进行容量校验,确保基于拆分的数据部分恢复的数据文件的正确性。

本领域普通技术人员可以理解上述实施例的全部或部分步骤可以使用计算机程序流程来实现,所述计算机程序可以存储于一计算机可读存储介质中,所述计算机程序在相应的硬件平台上(如系统、设备、装置、器件等)执行,在执行时,包括方法实施例的步骤之一或其组合。可选地,上述实施例的全部或部分步骤也可以使用集成电路来实现,这些步骤可以被分别制作成一个个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。上述实施例中的装置/功能模块/功能单元可以采用通用的计算装置来实现,它们可以集中在单个的计算装置上,也可以分布在多个计算装置所组成的网络上。上述实施例中的装置/功能模块/功能单元以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。上述提到的计算机可读取存储介质可以是只读存储器,磁盘、光盘、移动硬盘、计算机以及服务器等用户的本地存储设备。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1