一种基于可取回概率的云存储方法和装置与流程

文档序号:12135293阅读:505来源:国知局
一种基于可取回概率的云存储方法和装置与流程

本发明涉及网络通信技术领域,特别是指一种基于可取回概率的云存储方法和装置。



背景技术:

云存储是在云计算概念上延伸和发展出来的一个新的概念,是一种新兴的网络存储技术,是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。

云存储为用户提供了随用随取的存储服务,但是当用户将数据交给CPS时就不得不考虑数据的安全问题。数据安全主要包括数据机密性、数据完整性、数据可用性这三个方面。传统解决数据机密性依赖各种加密算法,例如:同态加密算法、代理重加密、基于属性的加密、广播加密等;解决数据完整性则主要采用公开审计方案,公开审计方案主要分为两类:POR和PDP;解决数据完整性大多采用冗余策略,冗余策略主要包括备份和编码。

在实现本发明的过程中,发明人发现现有技术至少存在以下问题:首先,加密算法和公开审计均有很大的算法复杂度,因此会带来巨大的计算消耗,对于计算能力有限并且存储数据量巨大的用户来说,这种计算开销可能是无法承担的;第二,基于密码学的方法带来了密钥管理的问题,一旦密钥泄露,用户的隐私也就不复存在,同时,密钥丢失也会造成用户无法取回数据。



技术实现要素:

有鉴于此,本发明的目的在于提出一种基于可取回概率的云存储方法和装置,用以在无秘钥状态下提供尽可能高的数据存取安全保障。

基于上述目的本发明提供的一种基于可取回概率的云存储方法,包括:

建立每个云服务提供商的单次可取回概率模型;所述单次可取回概率模型包括单次可取回概率,即从各所述云服务提供商单次取回文件的成功率;

建立文件存储模型;所述文件存储模型包括文件的单次可取回概率与所述文件大小的关系;

使用遗传算法,根据所述单次可取回概率模型和文件存储模型,得到单次可取回概率最大的存储方案。

可选的,所述建立每个云服务提供商的单次可取回概率模型,具体包括:

根据文件大小,将文件划分为不同容量等级;

对于单个云服务提供商,分别统计用户存取不同容量等级的文件时的失败率;

对每一容量等级存取不同容量等级的文件时的失败率进行线性拟合,得到所述单个云服务提供商的单次可取回概率模型。

可选的,所述使用遗传算法,根据所述单次可取回概率模型和文件存储模型,得到单次可取回概率最大的存储方案,具体包括:

获取用户指定的费用上限Cmax和费用下限Cmin;令C=(c1,c2,…,cn),n为大于等于2的自然数,其中ci,i∈[1,n]表示云服务提供商i的服务费用;令S=(s1,s2,…,sn)T,其中sj,j∈[1,n]表示文件j的大小;令F(s1,s2,…,sn)表示文件1文件n的总体可取回概率;则约束条件为:Cmin<C*S<Cmax,基于上述约束条件,使用遗传算法求解F(s1,s2,…,sn)的最大值。

可选的,所述基于上述约束条件,使用遗传算法求解F(s1,s2,…,sn)的最大值,具体包括:

选择各个文件的初始值,将其编码成0/1字符串,作为初始染色体s;

对初始染色体s进行k次变异,产生k个后代,作为初始种群;

将文件单次可取回概率作为个体的适应度值,分别计算出所述初始种群中所有个体各自的适应度值和所述所有个体的积累概率;

用轮盘赌选择法选择出所述初始种群k个后代,并进行交叉变异等一系列操作;

重复上述过程直至达到限定代数,然后根据得到编码得到最佳放置方案。

本发明的另一方面还提供一种基于可取回概率的云存储装置,包括:

模型管理单元,用于建立每个云服务提供商的单次可取回概率模型;所述单次可取回概率模型包括单次可取回概率,即从各所述云服务提供商单次取回文件的成功率;所述模型管理单元还用于建立文件存储模型;所述文件存储模型包括文件的单次可取回概率与所述文件大小的关系;

运算单元,用于使用遗传算法,根据所述单次可取回概率模型和文件存储模型,得到单次可取回概率最大的存储方案。

可选的,所述模型管理单元用于根据文件大小,将文件划分为不同容量等级;对于单个云服务提供商,分别统计用户存取不同容量等级的文件时的失败率;对每一容量等级存取不同容量等级的文件时的失败率进行线性拟合,得到所述单个云服务提供商的单次可取回概率模型。

可选的,所述运算单元用于获取用户指定的费用上限Cmax和费用下限Cmin;令C=(c1,c2,…,cn),n为大于等于2的自然数,其中ci,i∈[1,n]表示云服务提供商i的服务费用;令S=(s1,s2,…,sn)T,其中sj,j∈[1,n]表示文件j的大小;令F(s1,s2,…,sn)表示文件1至文件n的总体可取回概率;则约束条件为:Cmin<C*S<Cmax,基于上述约束条件,使用遗传算法求解F(s1,s2,…,sn)的最大值。

可选的,所述运算单元用于选择各个文件的初始值,将其编码成0/1字符串,作为初始染色体s;对初始染色体s进行k次变异,产生k个后代,作为初始种群;将文件单次可取回概率作为个体的适应度值,分别计算出所述初始种群中所有个体各自的适应度值和所述所有个体的积累概率;用轮盘赌选择法选择出所述初始种群的k个后代,并进行交叉变异等一系列操作;重复上述过程直至达到限定代数,然后根据得到编码得到最佳放置方案。

从上面所述可以看出,本发明提供的方法和装置基于不同云服务提供商之间的竞争关系,通过将数据存储在不同在的云服务提供商上,保证数据机密性;利用多个云服务提供商之间的数据冗余保证数据的完整性和可用性;同时采用遗传算法求解单次可取回概率最大的存储方案,从而供云服务运营商进行参考和服务调整,以提高服务质量,保障用户的数据安全。

附图说明

图1为本发明提供的一种基于可取回概率的云存储方法的实施例的流程示意图;

图2为本发明提供的一种基于可取回概率的云存储方法的可选实施例的流程示意图;

图3为本发明提供的一种基于可取回概率的云存储方法的又一实施例中遗传算法的流程示意图;

图4为本发明提供的一种基于可取回概率的云存储装置的实施例的模块示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。

需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。

图1为本发明提供的一种基于可取回概率的云存储方法的实施例的流程示意图。如图所示,本发明的一个方面提供一种基于可取回概率的云存储方法的实施例,包括:

S10,建立每个云服务提供商的单次可取回概率模型;所述单次可取回概率模型包括单次可取回概率,即从各所述云服务提供商单次取回文件的成功率。具体来说,步骤S10中的单次可取回概率模型,是指用户从某一指定云服务提供商处进行文件上传、下载时的平均成功率和失败率,这一概率是综合不同文件大小的可取回概率后得到的综合结果。

S11,建立文件存储模型;所述文件存储模型包括文件的单次可取回概率与所述文件大小的关系。

S12,使用遗传算法,根据所述单次可取回概率模型和文件存储模型,得到单次可取回概率最大的存储方案。

本实施例提供的方法基于不同云服务提供商之间的竞争关系,通过将数据存储在不同在的云服务提供商上,保证数据机密性;利用多个云服务提供商之间的数据冗余保证数据的完整性和可用性;同时采用遗传算法求解单次可取回概率最大的存储方案,从而供云服务运营商进行参考和服务调整,以提高服务质量,保障用户的数据安全。

图2为本发明提供的一种基于可取回概率的云存储方法的可选实施例的流程示意图。如图所示,在一可选的实施例中,S10,建立每个云服务提供商的单次可取回概率模型,具体包括:

S20,根据文件大小,将文件划分为不同容量等级。例如,可以将文件根据大小划分为0~10M,10~100M,100M~1G,1G~∞等容量等级。当然这种划分方式只是一个作为参考的示例,不应当理解为唯一的划分方式,其他合理的划分方式也应当包含在本发明的保护范围之内。

S21,对于单个云服务提供商,分别统计用户存取不同容量等级的文件时的失败率(或成功率)。这里的统计是具体到每个容量等级的,例如对于某一云服务提供商而言,用户在存取容量为10~100M的文件时,平均成功率可以达到99.9%,而在存取容量为100~1G的文件时,平均成功率可能只能达到99.5%等,这里只是给出一个示例,并非代表实际或模拟测试结果。

S22,对每一容量等级存取不同容量等级的文件时的失败率进行线性拟合,得到所述单个云服务提供商的单次可取回概率模型。通过统计不同容量等级文件的存取失败率(或成功率),通过线性拟合,可以得到某一云服务提供商的整体单次可取回概率模型。

本实施例通过统计云服务提供商对不同容量等级文件的存取失败率,通过线性拟合的方式得到云服务提供商的单次可取回概率模型,为前述使用遗传算法进行存储方式的优化奠定了条件。

在另一可选的实施例中,S12,使用遗传算法,根据所述单次可取回概率模型和文件存储模型,得到单次可取回概率最大的存储方案,具体包括:

获取用户指定的费用上限Cmax和费用下限Cmin;令C=(c1,c2,…,cn),n为大于等于2的自然数,其中ci,i∈[1,n]表示云服务提供商i的服务费用;令S=(s1,s2,…,sn)T,其中sj,j∈[1,n]表示文件j的大小;令F(s1,s2,…,sn)表示文件1文件n的总体可取回概率;则约束条件为:Cmin<C*S<Cmax,基于上述约束条件,使用遗传算法求解F(s1,s2,…,sn)的最大值。具体的,ci,i∈[1,n]表示云服务提供商i对于单位大小文件存储服务收取的费用,单位可以是元每GB或者M每GB等等;而sj,j∈[1,n]的单位就对应为GB或者M。

即所述云服务提供商的最优存储方案,可以优化为一个非线性规划问题,其中约束条件包括:

C=(c1,c2,…,cn),S=(s1,s2,…,sn)T,n为大于等于2的自然数

Cmin<C*S<Cmax

需要求解:

F(s1,s2,…,sn)的最大值。

本发明实施例中,使用遗传算法对上述非线性规划问题进行求解,从而得到尽快得到最优解。

图3为本发明提供的一种基于可取回概率的云存储方法的又一实施例中遗传算法的流程示意图。如图所示,在又一可选的实施例中,所述基于上述约束条件,使用遗传算法求解F(s1,s2,…,sn)的最大值,具体包括:

S30,选择各个文件的初始值,将其编码成0/1字符串,作为初始染色体s。

S31,对初始染色体s进行k次变异,产生k个后代,作为初始种群。设置终止代数T,T的取值不做限定,可以根据需要确定。

S32,将文件单次可取回概率作为个体的适应度值,分别计算出所述初始种群中所有个体各自的适应度值和所述所有个体的积累概率。

S33,用轮盘赌选择法选择出所述初始种群k个后代,并进行交叉变异等一系列操作。在每次进行交叉变异等操作后,选择适应度值较高的后代,作为下一代,重复上述遗传筛选过程。

S34,重复上述过程直至达到限定代数T,然后根据得到编码得到最佳放置方案。

图4为本发明提供的一种基于可取回概率的云存储装置的实施例的模块示意图。如图所示,本发明还提供一种基于可取回概率的云存储装置,包括:

模型管理单元40,用于建立每个云服务提供商的单次可取回概率模型;所述单次可取回概率模型包括单次可取回概率,即从各所述云服务提供商单次取回文件的成功率;所述模型管理单元还用于建立文件存储模型;所述文件存储模型包括文件的单次可取回概率与所述文件大小的关系。

运算单元41,用于使用遗传算法,根据所述单次可取回概率模型和文件存储模型,得到单次可取回概率最大的存储方案。

本实施例提供的装置基于不同云服务提供商之间的竞争关系,通过将数据存储在不同在的云服务提供商上,保证数据机密性;利用多个云服务提供商之间的数据冗余保证数据的完整性和可用性;同时采用遗传算法求解单次可取回概率最大的存储方案,从而供云服务运营商进行参考和服务调整,以提高服务质量,保障用户的数据安全。

可选的,所述模型管理单元40用于根据文件大小,将文件划分为不同容量等级;对于单个云服务提供商,分别统计用户存取不同容量等级的文件时的失败率;对每一容量等级存取不同容量等级的文件时的失败率进行线性拟合,得到所述单个云服务提供商的单次可取回概率模型。

可选的,所述运算单元41用于获取用户指定的费用上限Cmax和费用下限Cmin;令C=(c1,c2,…,cn),n为大于等于2的自然数,其中ci,i∈[1,n]表示云服务提供商i的服务费用;令S=(s1,s2,…,sn)T,其中sj,j∈[1,n]表示文件j的大小;令F(s1,s2,…,sn)表示文件1至文件n的总体可取回概率;则约束条件为:Cmin<C*S<Cmax,基于上述约束条件,使用遗传算法求解F(s1,s2,…,sn)的最大值。

可选的,所述运算单元41用于选择各个文件的初始值,将其编码成0/1字符串,作为初始染色体s;对初始染色体s进行k次变异,产生k个后代,作为初始种群,k的值通常取较小值;将文件单次可取回概率作为个体的适应度值,分别计算出所述初始种群中所有个体各自的适应度值和所述所有个体的积累概率;用轮盘赌选择法选择出所述初始种群的k个后代,并进行交叉变异等一系列操作;重复上述过程直至达到限定代数,然后根据得到编码得到最佳放置方案。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。

所述领域的普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。

另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。

本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1