混合云环境下的数据索引列表存储策略的制作方法

文档序号:12364052阅读:259来源:国知局
混合云环境下的数据索引列表存储策略的制作方法与工艺
本发明涉及一种混合云环境下的数据索引列表存储策略。
背景技术
:云计算、云存储技术在近几年内得到了快速发展,国内外涌现了各式各样的公有云存储服务,这些公有云服务对于个人用户是免费的,但对于需要通过API(应用程序接口)访问的企业用户是收费的。云存储服务满足了企业的存储需求,同时又降低了企业购买、维护大容量存储设备的开销,企业等用户越来越倾向于将数据存储在服务提供商的云存储系统上以节省成本。但对于有大量数据存储需求的云存储服务消费者而言,云存储服务仍然需要不菲的存储费用。2011年,NIST(NationalInstituteofStandardsandTechnology,美国国家标准与技术研究院)提出了云代理。云代理独立于云存储资源提供商运行,负责发现和分析云用户的需求,拆分成不同的任务发布到云端,云存储提供商根据这些任务给出各自的报价和SLA(Service-LevelAgreement,服务等级协议)交给云代理比较和选择;云代理向用户提供报价和合同,并租用云存储资源提供商的资源交给用户使用。但是,我们知道数据的重复存储会带来巨大冗余和空间的浪费,而企业用户放到公有云的数据一般是非关键公共数据,在公有云中很可能会存在相同数据导致重复存储,传统的云存储服务提供商给出的SLA中没有重复资源的描述,传统的云代理选择云存储服务商的策略中也没有考虑云存储服务商是否存在重复资源。数据的重复存储将带来较大的不必要成本支出浪费,带来低性价比问题,这必然是云存储用户所不希望的,故云存储中的数据重复存储已成为一个迫切需要解决的问题,数据存储量越大的企业对此的需求也是越大的。技术实现要素:有鉴于此,本发明的目的在于提供一种混合云环境下的数据索引列表存储策略,增加了数据自身与云空间可访问资源重复的匹配项,并提出数据索引列表存储策略来进行完善。为实现上述目的,本发明采用如下技术方案:一种混合云环境下的数据索引列表存储策略,其特征在于,包括以下步骤:步骤S1:在混合云的环境中创建用户可访问空间,所述用户可访问空间包括用户自身所拥有的私有云空间、云代理为用户开辟好的资源池以及通过云代理可检索得到的其他用户共享的数据资源;步骤S2:为所述用户可访问空间中的已存储数据建立索引列表,所述索引列表用于记录已存储数据的信息,包括已存储信息的文件名、文件大小、存储路径、存储时间、是否全存和存储用户;步骤S3:在存储数据时,通过所述索引列表将要存储数据的信息和已存储数据的信息进行匹配,找出与要存储数据相同的可访问资源,并统计其资源数X;步骤S4:为步骤S3得到与要存储数据相同的可访问资源设定数量阈值S,在存储数据时,根据所述资源数X与数量阈值S的大小,选择对要存储数据进行存储或者只存储相同资源的可访问索引列表。进一步的,在所述用户可访问空间中,用户可访问的资源包括其他用户的共享资源与本用户自身的存储资源。进一步的,所述索引列表中的是否全存的具体含义为:若为是,则代表数据被完整存储;若为否,则代表只存储相同资源的可访问索引列表。进一步的,所述步骤S3中的要存储数据的信息包括要存储信息的文件名、文件大小、存储路径、存储时间、是否全存和存储用户。进一步的,所述步骤S4中,若资源数X低于数量阈值S,则对要存储数据进行完整存储以减少数据丢失的概率;若资源数X高于或等于数量阈值S,则只存储相同资源的可访问索引列表以降低存储成本。进一步的,在进行完整存储时,根据数据的安全性需求选择将要存储数据存于私有云或公有云中。本发明与现有技术相比具有以下有益效果:本发明通过为相同资源数设定阈值来决定完整存储数据还是只存储相同资源的可访问索引列表,这能有效减少数据重复存储带来的巨大冗余和空间浪费,极大提高混合云中的云存储性能,为用户节省成本。附图说明图1是本发明的流程图。图2是本发明用户存储数据时系统存储操作的流程图。图3是本发明一实施例的系统框图。具体实施方式下面结合附图及实施例对本发明做进一步说明。请参照图3,于本实施例中,用户拥有自身的私有云,同时该用户的云代理已开辟了由公有云1、公有云2和公有云3组成的资源池,则该用户的用户可访问空间为自身私有云、云代理为用户开辟好的资源池(此例中由公有云1、公有云2和公有云3组成)以及云代理可检索得到的其他用户共享的资源(设有用户2、用户3、用户4上传共享数据)。并设该用户可访问空间中有数据资源A、B、C、D、E、F、G、H、I、J,各数据资源的具体分布情况可见下表1:表1:数据在用户可访问空间中的分布情况私有云公有云1公有云2公有云3A、C、E、G、IA、B、C、I、JA、D、G、H、IA、C、F、H、I请参照图1,混合云环境下的数据索引列表存储策略包括以下步骤:步骤S1:在混合云的环境中创建用户可访问空间,所述用户可访问空间包括用户自身所拥有的私有云空间、云代理为用户开辟好的资源池以及通过云代理可检索得到的其他用户共享的数据资源;步骤S2:为所述用户可访问空间中的已存储数据建立索引列表,所述索引列表用于记录已存储数据的信息,包括已存储信息的文件名、文件大小、存储路径、存储时间、是否全存和存储用户等信息;其中是否全存的具体含义为:若为是,则代表数据被完整存储;若为否,则代表存储的是相同资源的可访问索引列表。索引列表存放于每个数据所在的云中,下表2为私有云数据的索引列表,表3、表4、表5分别为公有云1、公有云2、公有云3的数据索引列表:表2:私有云数据的索引列表文件名文件大小存储路径存储时间是否全存存储用户A6G私有云20160606是用户1C3G私有云20160503是用户1E10G私有云20150909是用户1G36G私有云20150503是用户1I28G私有云20130228是用户1表3:公有云1的数据索引列表文件名文件大小存储路径存储时间是否全存存储用户A6G公有云120160601是用户1B13G公有云120160621是用户4C3G公有云120160203是用户3I28G公有云120160303是用户1J35G公有云120160620是用户2表4:公有云2的数据索引列表文件名文件大小存储路径存储时间是否全存存储用户A6G公有云220160606是用户1D16G公有云220160503是用户1G36G公有云220150909是用户4H1G公有云220150503是用户3表5:公有云3的数据索引列表文件名文件大小存储路径存储时间是否全存存储用户A6G公有云320160602是用户1C3G公有云320160607是用户2F24G公有云320160613是用户1H1G公有云320160618是用户4I28G公有云320160621是用户1步骤S3:请参照图2,在存储数据时,通过所述索引列表将要存储数据的信息和已存储数据的信息进行匹配(将文件名和文件大小进行对比,当已存储数据的文件名和文件大小都相同时确定为要存储数据相同的可访问资源),找出与要存储数据相同的可访问资源,并统计其资源数X;步骤S4:请继续参照图2,为步骤S3得到与要存储数据相同的可访问资源设定数量阈值S,于本实施例中S=3,在存储数据时,根据所述资源数X与数量阈值S的大小,选择对要存储数据进行存储或者只存储相同资源的可访问索引列表,具体为:若资源数X低于数量阈值S,则对要存储数据进行完整存储以减少数据丢失的概率;若资源数X高于数量阈值S,则只存储相同资源的可访问索引列表以降低存储成本。特别的,在进行完整存储时,根据数据的安全性需求选择将要存储数据存于私有云或公有云中。下面以数据C和数据H为例进行介绍:当该用户要存储数据C时,首先将数据C与用户可访问空间中的数据索引列表进行信息匹配,可得匹配结果:私有云、公有云1和公有云3都有相同的数据C,即相同的可访问资源数X为3。则显然X≥S,故我们存储与数据C相同的数据的可访问索引列表,被存储的内容为下表6:表6:存储数据C时存储的内容文件名文件大小存储路径存储时间是否全存存储用户C3G私有云20160503是用户1C3G公有云120160203是用户3C3G公有云320160607是用户2当该用户要存储数据H时,首先将数据H与用户可访问空间中的数据索引列表进行信息匹配,可得匹配结果:公有云2和公有云3都有相同的数据H,即相同的可访问资源数X为2。则显然X〈S,故我们选择直接对数据H进行存储。以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1