基于模型的资源分配的制作方法

文档序号:7736131阅读:190来源:国知局
专利名称:基于模型的资源分配的制作方法
技术领域
本说明书涉及用于数据存储和访问的分布式系统中的资源分配。
背景技术
例如可通过互联网访问的基于分布式网络的数据存储具有各种应用。一个应用是 视频存储和访问。在过去的十年中,随着住户可立刻容易地获得高速互联网服务,在线视频流在互 联网用户中越来越受到欢迎。例如,传统的视频传送系统(例如,有线电视系统)可能不再 能满足客户日益增长的对方便访问和即时传送的需求,电影客户可能很快转向能够提供这 种服务的在线视频存储。但是,以负担得起的费用向大规模的客户提供可靠的下载服务现在存在许多挑 战。例如,构建基于网络的视频存储和传送系统可能遇到动态分布的实时资源分配问题,该 问题以NP完全问题(NP complete problem)为特征。用于解决NP完全问题的传统方法试 图以某种方式将问题限制为针对确定解决方案进行穷举式搜索。这些途径(procedure)通 常在计算上代价高昂,然而仍会产生不合需要的结果。

发明内容
一方面,总的来说,本发明以一种计算机实现的方法为特征,该方法包括接收对第 一内容项目(item)组的访问模式的描述;以及至少部分地基于所述访问模式的描述来划 分存储空间。访问模式的描述是至少第一属性的函数,该第一属性描绘要存储在存储系统 中的第二内容项目组的一个或多个操作目标的特征。划分存储空间包括限定与第一属性的 值的范围相关的多个种类(category)中的每一个;并使多个种类中的每一个与多个资源 分配设置的中各自的一个相关联。实施方式可包括以下特征中的一个或更多个。存储系统可具有预定配置。计算机实现的方法可进一步包括确定多个资源分配设 置中的每一个,使得与多个资源分配设置相关联的资源需求的集合与存储系统的预定配置 相一致。资源需求的集合包括对访问和存储容量的需求。计算机实现的方法可进一步包括基于划分存储空间的结果确定存储第二内容项 目组的存储系统的配置。确定存储系统的配置的步骤可包括确定存储系统的一组存储元件 中的每一个的特性。确定存储系统的配置的步骤还可包括基于划分存储空间的结果迭代地 产生存储系统的候选配置;并根据预定的设计目标选择存储系统的优选配置。预定的设计目标可以以设计目标函数为特征。迭代地产生候选配置的步骤包括向 与第一属性的值的范围有关的多个种类中的每一个提供一组初始限定;且对该组初始限定 进行调整以优化设计目标函数。设计目标可包括最小化存储系统的资源需求的水平,和/或最小化第二项目组中 不同项目的潜在资源消耗之间的竞争程度。
访问模式的描述可以是描绘第二内容项目组的一个或多个操作目标的特征的多 个属性的函数。关于多个属性的每一个的各个值范围来限定多个种类的每一个。多个种类 共同地表示第一属性的值的完整范围。第二内容组的操作目标可包括以下中的一个或多个可访问性,完整性,弹性和功 率消耗。对第一内容组的访问模式的描述可涉及以下类型的一个或多个的描述访问速率、 带宽消耗程度、统计使用分布、地理使用分布和基于经验数据的计划使用分布。对于多个种类的每一个,各个资源分配设置可包括与将被存储在所述存储系统中 的种类相关联的项目的实例(instance)数量的说明。第一项目组可与第二内容项目组共享共同的特性,使得对第一项目组的访问模式 形成计划第二项目组的访问模式的合理基础。第一和第二项目组中的每一个可以是电影标 题的集合。可替代地,第一和第二项目组中的每个可以是以下类型的一个或多个的内容的 集合在线视频广告、用户生成的内容、音乐视频、体育活动的视频、新闻片段和TV剧集。第二项目组可至少包括第一项目组中包括的项目的子组。可替代地,第二项目组 在内容上可与第一项目组基本上不同。此外,第二组可不包括第一项目组中的任何项目。另一方面,总的来说,本发明以一种系统为特征,该系统包括接口,用于接收对第 一内容项目组的访问模式的描述;机器可读介质,存储可由处理器执行的指令,以至少部分 地基于访问模式的描述划分存储空间。访问模式的描述是至少第一属性的函数,该第一属 性描绘要存储在存储系统中的第二内容项目组的一个或多个操作目标的特征。划分存储空 间的指令包括限定与第一属性的值的范围相关的多个种类中的每一个;以及使多个种类中 的每一个与多个资源分配设置中的各自的一个相关联的指令。该系统进一步包括用于存储 该多个资源分配设置的数据库。本发明的方面可包括以下特征中的一个或更多个。划分存储空间的指令可进一步包括基于划分存储空间的结果确定用于存储第二 内容项目组的存储系统的配置的指令。划分存储空间的指令可进一步包括限定描绘存储系统的预定设计目标的特征的 设计目标函数;并计算优化设计目标函数的存储系统的优选配置的指令。设计目标可包括减少存储系统的资源需求的水平,且可进一步包括最小化存储系 统的资源需求的水平。可替代地或另外,设计目标可包括减小第二项目组中的不同项目的 潜在资源消耗之间的竞争程度,且可进一步包括最小化第二项目组中不同项目的潜在资源 消耗之间的竞争程度。其他一般的方面包括上述方面和特征的其他组合,表示为方法、设备、系统、计算 机程序产品以及其他方式的其他方面和特征。根据以下说明和权利要求,本发明的其他特征和优点变得明显。在一个方面,总的来说,本发明以一种计算机实现的方法为特征,该方法包括获 得描绘第一内容项目的实际使用水平的特征的信息;基于获得的信息来确定是否满足再供 应条件,且如果满足,生成要与存储环境的资源相关联地执行的再供应操作的说明;以及执 行再供应操作。第一内容项目根据第一资源分配设置被存储在存储环境的资源的第一组元 件上。再供应操作包括识别用于存储第一内容项目的第二资源分配设置;并根据第二资源 分配设置来分配存储环境的资源的第二组元件。
本发明的其他方面可包括一个或更多个以下特征。执行再供应操作可包括根据第二资源分配设置将第一内容项目的一个或更多个 新实例存储在资源的第二组元件上;以及从存储环境的资源的第一组元件移除第一内容项 目的一个或多个在先存储的实例。再供应操作可包括第一类型的基于异常的再供应操作。计算机实现的方法可进 一步包括检测第一内容项目的实际使用水平和使用的供应水平之间的不一致,使用的供应 水平特征在于与第一资源分配设置相关联的第一组方案属性;以及比较该不一致与异常标 准,从而确定异常供应的出现。异常标准可包括异常阈值。该计算机实现的方法可进一步包括,在确定异常供应的出现时,创建与第一内容 项目相关联的供应异常对象;将供应异常对象保持在未完成的再供应列表中;并确定要响 应于供应异常对象要执行的基于异常的再供应操作。未完成的再供应列表包括多个供应 异常对象,多个供应异常对象的每一个与多个基于异常的再供应操作中的各自的一个相关 联。该计算机实现的方法可进一步包括基于多个再供应操作的每一个的相对紧急程度和存 储环境的资源的可用性来以优先顺序排列多个基于异常的再供应操作。基于异常的再供应操作可包括识别代表第一内容项目的实际使用的水平的第二 组方案属性。第二组方案属性与第二资源分配设置相关联。基于异常的再供应操作可进一 步包括当第一内容项目的实际使用水平超过使用的供应水平第一预定阈值量时执行的提 高供应操作;以及当第一内容项目的使用的供应水平超过实际使用的水平第二预定阈值量 时执行的降低供应操作。获得的信息可包括以下中的一个或多个在给定时间对第一内容项目的同时访问 请求的数量,在检测时间段期间对第一项目的访问请求的集合,以及由于资源不可用导致 被拒绝的访问请求的数目和频率。另一方面,总的来说,本发明以一种计算机实现的技术为特征,该技术包括接受 一个计划,该计划用于管理与在存储环境的资源上存储的第一项目相关联的资源分配,该 计划至少包括与规则触发器(trigger)相关联的第一规则;以及在激活该规则触发器时应 用第一规则。第一规则将资源分配中的调整与第一项目相关联。第一项目特征在于一组初 始属性集,且根据与该一组初始属性一致的多个资源分配设置中的一个而被存储在存储环 境的资源上。 本发明的进一步方面可包括一个或更多个以下特征。多个资源分配设置可被保持在第一数据库中。第一规则包括可适用于描绘了第一项目的特征的一组初始属性的调整的说明,且 应用第一规则的方法包括根据调整的说明计算第一项目的一组经调整的属性;从与第一项 目的一组经调整的属性一致的多个资源分配设置中选择一个;以及基于多个资源分配设置 中选择的一个来分配资源以存储第一项目的一个或多个实例。可适用于一组初始属性的调 整包括对一组初始属性中的至少一个的当前值应用折扣因数。第一规则可包括针对对第一 项目从候选资源分配设置的列表顺序选择一个的描述。规则触发器部分地由跟随有激活窗口的开始点限定。开始点和激活窗口可部分地 基于对第一项目的访问模式关于时间的趋势的估计来确定。规则触发器可由开始点的序列 限定。开始点序列的每一个跟随有各个激活窗口。应用第一规则的方法可包括在出现开始点序列的每一个时对第一项目迭代地应用第一规则。第一项目特征在于各自的一组初始属性,且根据多个资源分配设置中的各自的一 个资源分配设置而被存储在存储环境的资源上。应用第一规则的方法可包括根据预定顺序对项目组的每一个应用第一规则。第一 规则可包括多个分量,各分量专用于项目组中的不同项目。在计划中阐明了预定顺序。该 计划可进一步包括多个规则,每个规则与各自的规则触发器相关联。计算机实现的方法可进一步包括响应于存储环境的操作状态中的变化来修改用 于管理资源分配的计划。存储环境的操作状态可包括存储环境的资源的硬件配置。存储环 境的操作状态还可包括对存储在存储环境的资源上的项目组中的一个或多个项目的访问 的模式。其他一般的方面包括上述方面和特征的其他组合,以及表示为方法、设备、系统、 计算机程序产品以及以其他方式的其他方面和特征。一方面,总的来说,本发明以一种计算机实现的方法为特征,该方法包括检测代 表多个内容项目的访问模式的实际工作负荷;比较该实际工作负荷与规定工作负荷,从而 确定相对于规定工作负荷的实质偏离的发生;且在确定发生实质偏离时,至少部分地基于 实际工作负荷修改规定工作负荷。根据多个资源分配设置中的一个将多个项目存储在存储 环境的资源上。规定工作负荷包括多个种类,种类中的每一个与多个资源分配设置中的各 自的一个相关联。本发明的其他方面可包括以下一个或更多个特征。可与第一属性的值的各个范围相关地限定多个种类的每一个。第一属性描绘多个 内容项目的一个或多个操作目标的特征。修改规定工作负荷的方法包括通过将第一种类的 定义改变成第一属性的值的新范围而至少修改第一种类。修改规定工作负荷的方法可进一 步包括将已修改的第一种类与多个资源分配设置中的适当一个设置相关联,使得该关联的 结果与存储环境中资源的可用性一致。存储环境中的资源包括存储资源和访问资源。对于多个种类中的每一个,相关联的各自的资源分配设置可包括与存储在存储系 统中的种类相关联的项目的实例数目的第一说明,以及针对项目的元素而部分限定的目的 地的第二说明。存储环境的资源可至少包括具有多个不同区域的第一存储分量,且针对项 目的元素而部分限定的目的地的第二说明将项目的元素与多个不同区域中的一个相关联。 对于多个种类中的每一个,通过应用资源分配设置中的各自的一个资源分配设置,各个级 别的资源容量被分配到种类中的项目。各个级别的资源容量至少包括与存储环境的资源上 存储的种类中的项目的实例数目有关的存储容量;以及与对种类中的项目提供的可允许访 问带宽有关的访问容量。修改规定工作负荷的方法可包括,对于多个种类中的至少一些种类,通过改变与 种类相关联的资源分配设置中的各自的一个资源分配设置,改变各个级别的资源容量。改 变资源分配设置的各个设置的方法可包括改变与存储在存储系统中的种类相关联的项目 的实例数目的第一说明,或可替代地,包括改变针对项目元素而部分限定的目的地的第二 说明。规定工作负荷可被保持在第一数据库中。计算机实现的方法可进一步包括基于修 改规定工作负荷的结果产生新规定工作负荷。新规定工作负荷使得能够将存储环境的资源重新分配给多个项目,该重新分配反映了实际工作负荷。当实际工作负荷相对于规定工作 负荷的偏离超过偏离阈值时出现实质偏离。检测实际工作负荷的方法可包括获得关于以下中的一个或多个的信息在给定时 间对多个项目中的每一个的同时访问请求的数量,在检测期间对多个项目的每一个的访问 请求的集合;以及关于多个项目中的每一个由于资源不可用而被拒绝的访问请求的数目和频率。另一方面,总的来说,本发明以一种计算机实现的方法为特征,该方法包括检测 代表多个内容项目的访问模式的实际工作负荷,该多个项目根据多个资源分配设置中的一 个而被存储在存储环境的资源上;比较该实际工作负荷与第一工作负荷模型,从而确定相 对于第一工作负荷模型的实质偏离的发生;且在确定实质偏离的发生时,至少部分地基于 实际工作负荷确定第二工作负荷模型。第一工作负荷模型包括第一方案集,其方案中的每 一个与第一组资源分配设置组中的各自的一个相关联。第二工作负荷模型包括第二组方 案,其方案中的每一个与第二组资源分配设置组中的各自的一个相关联。其他一般的方面包括上述方面和特征的其他组合,以及表示为方法、设备、系统、 计算机程序产品以及以其他方式的其他方面和特征。通过以下说明和权利要求,本发明的其他特征和优点将变得明显。


图1是用于数据存储和访问的示例分布式系统的框图。图2是示出了基于模型的内容供应的操作的流程图。图3是示出了基于属性的建模的示例方法的流程图。图4A和图4B示出了使用单个属性建模的一个实例。图5示出了另一个使用多个属性建模的实例。图6是示出了基于异常(anomaly-based)的内容再供应(re-provisioning)的示 例方法的示图。图7是示出了基于进度表的内容再供应的示例实现的流程图。图8A和图8B示出了重建模型的一个实例。
具体实施例方式1系统概要在分布式系统中,存在以宽范围的属性(例如,数据类型、长度、受欢迎度和访问 模式)和操作目标(例如,性能、完整性和弹性(resilience))为特征的内容库,使得每个 内容可涉及不同级别上系统资源的使用。例如,更高受欢迎度的内容通常会需要更多访问 资源(例如,读出带宽)以提高其流动性能(streaming performance);而另一方面,更重 要性的内容可能需要更多存储空间(例如,用于存储冗余数据)以确保数据完整性。以一种能够良好服务于内容使用的操作目标的方式来管理有限量的系统资源会 是一个复杂的问题。而且,随着系统在规模上增大,困难程度会逐渐增加。在一些系统中, 在管理涉及多个方面(multiple dimension)的系统资源(诸如,存储和访问资源)中应用 领域专用知识是有利的。
参考图1,简略地说,分布式系统100由用于内容存储和传送的三个基本类型计算 平台构成存储服务器平台130、访问服务器平台120和客户端平台110。术语“平台”用来 指代(例如)可管理(host)在单个计算机上或分布于多个计算机的组件集合。存储服务器平台130可管理多个存储服务器132,该存储服务器包含读取和写入 数据的存储和提供的能力。例如,每个服务器可管理在一个计算机上,或其功能自身可分布 在多个硬件元件上。访问服务器平台120提供访问服务,这些访问服务向多个应用共同地提供访问关 于系统的存储服务器的数据/内容的一个或多个方法。一些访问服务根据规定的访问协议 /制度(regime)/接口(例如,HTTP、RTSP, NFS等)来处理数据。其他访问服务管理系统 资源并相应地调节对内容的访问。管理系统资源的服务包括(例如)为了存储和传送内容 而分配系统资源的内容供应服务124,以及当被系统中的各种会话请求调用时允许会话的 准入服务126。总的来说,访问服务器平台120 —方面通过分布式网络160与存储服务器平台130 互连,另一方面通过访问(或接入)网络170与客户端平台110互连。访问网络170允许 各种类型的客户端经由一个或多个信道与访问服务器平台120通信。例如,操作客户端 112(例如,在线视频存储的管理员)可经由操作网络140与管理服务器121通信,而访问客 户端114(例如,在线视频存储的客户)可经由传送网络150与下载服务器122通信。管理 服务器121和下载服务器122 二者可与系统的其余部分交互,以处理诸如上载和下载内容 的各种客户端请求。在将内容上载到存储器中时,内容供应服务1 确定能够在满足内容的操作目标 的全部可用存储资源中设置数据的良好方式。操作目标的实例包括性能目标(诸如,可访 问性)、完整性、弹性和功率消耗,其中的每一个都可以一个或多个属性为特征。例如,与特 定标题的观看频率相关联的受欢迎度属性可表示内容可访问性的期望度——系统可能期 望服务的一种操作目标。考虑到系统中每个个体的目标而做出良好的供应决定的过程可表示NP完全问 题,此问题对于大型系统尤其复杂。解决此问题的一个方法涉及应用领域知识(domain knowledge)以组织问题空间(problem space)并形成能够以更有效的方式引导最佳解决 方案的搜索的部分解决方案(例如,模型)。例如,对库的标题的访问模式可用来建立模型 工作负荷,该模型工作负荷包含均被映射到部分确定的分配方案的有限的一组种类,该部 分确定的分配方案表示资源设置的方式。使用该模型,然后可将内容供应作为两步骤处理 来探讨——首先,将每部分内容归属到适当的种类,其次,在那个种类的本地方案内进行资 源分配。将在以下部分更详细地描述基于模型的内容供应。2基于模型的内容供应参考图2,在用于内容供应的基于模型的方法的一个实现中,内容供应服务利用配 置阶段210期间获得的基于模型的部分解决方案,以预先计算稍后在供应阶段220期间使 用的信息,从而确定系统的存储资源上内容的良好设置。在配置阶段210,例如,经验数据212用来生成表示系统旨在支持的工作负荷类型 的模型工作负荷214。经验数据可涵盖从视频的全部使用的词语描述到来自运行中的系统 的所有事件(包括视频观看事件)的详细网络日志的范围。经验数据212的一个实例是视频存储操作员提供的统计使用分布,以每M小时服务窗口上每个库标题观看次数为特征。 另一个实例是在大范围区域的客户中观看习惯的地理概况。在经验数据难以获得或不充 分的情况下,也可将诸如客户内容使用预测和服务目标的其他信息用于创建模型工作负荷 214。模型工作负荷214可在被引入到系统中之前被手动生成,或由系统自身自动生成 (例如,以探试的方式)。基于模型工作负荷214创建规定的工作负荷218。一般说来,规定 工作负荷218通过以离散方式划分问题空间来向资源分配问题提供部分解决方案。例如, 可通过将模型工作负荷214映射到如下特定系统配置来生成规定的工作负荷218 1)系统 规模是固定的,缩放工作负荷以适合于系统;2)工作负荷是固定的,缩放系统规模以匹配 工作负荷;二者之一或3) 二者的组合。在内容属性作为操作目标的特征来提供的一些应用 中,规定的工作负荷218可被视为属性空间的划分,定义一组基于属性的类(在本文中称为 方案(schema)),其中每个个体可被映射到与那个类相关联的资源设置类型。稍后将更详细 地说明创建规定的工作负荷218的几种方法。规定的工作负荷218在系统中可被表示为描述如何提供和访问系统中的对象的 配置数据的集合(即方案数据库219)。方案数据库219包括方案和供应表,方案和供应表 一起提供了每个方案和与该方案相关联的资源设置的定义描述。以基于受欢迎度的内容供 应为例。可将一个方案定义成包括库中被最频繁观看的前5%的标题。对于打算对这个类 中的每个标题通过800Mbps的总限额来提供最大800Mbps带宽或对该类中的所有标题提供 更多带宽的系统,方案数据库219描述了可支持这种带宽目标的一组设置组合,包括例如 在八个盘(disk)的跨度(span)上分布内容数据。稍后在内容供应期间使用这些类型的信 息以帮助内容供应服务1 确定对内容的(多个)操作目标(这里为可访问性)进行处理 的分配资源的好方式。除了提供期望的内容可访问性之外,规定工作负荷218和相关联的方案还被设计 成减小系统中标题间竞争的程度。造成高度的标题间竞争的规定工作负荷的实例包括在最 大读出速率为IOOMbps的单个服务器上存储“Shrek I”和“Shrek II”中每个的四个副本。 当Mhrek I”处于占据服务器的大部分或所有访问能力(access capacity)的峰值使用 (例如,以90Mbps流动)时,致使此服务器上的其余数据(包括“Sirek II”)不可访问,而 系统中其他服务器的资源可能闲置。相比之下,竞争性更少的规定工作负荷,例如在四个不 同服务器的每个服务器存储“Sirek I”和“Sirek II”的一个副本,使得一个对象的峰值使 用不超过服务器输出能力的25%,而不阻止对这些服务器上的其他数据的访问。在供应阶段220期间,内容供应服务124利用方案数据库219中的信息以用下列 方式供应内容。在接收到上载一部分内容的请求222时,内容供应服务首先通过对照方 案数据库中的划分结果匹配内容属性(多个内容属性)来确定此内容的合适方案(步骤 224)。如果(例如)此内容位于前5%受欢迎标题中,选择上述示例方案。因此,将在八个 盘分解内容数据。假设这八个盘是必备的,仍存在将内容映射到存储器的多种方式。对于 包括16个存储盘的系统,一个选择是将内容映射到1号至8号盘,而第二个选择是使用9 号至16号盘(或者其他八个盘组合)。在各种映射中,内容供应服务124选择最佳映射,例如,占用服务器最低的一个映 射(步骤226)。如果在此最佳映射中有足够的可用资源(步骤228),内容供应服务IM着手根据最佳映射分配在八个盘驱动的每一个上的一组物理块(步骤230),随后管理服务器 121将内容数据传送到这些位置(步骤23 。如果内容供应服务IM未能在最佳映射中找 到足够的资源,则其选择下一映射以重复评价过程228,直到发现和交付了可用的映射。在 期望系统上有一部分内容的多个副本的情况下,内容供应服务可针对每个单独副本确定最 佳可用映射并相应地存储数据。在完成数据传送之后,映射结果(包括数据的盘位置)记 载在对象目录129中,使得将来内容可方便地被其他服务(例如,准入服务126)所访问。通常,当系统正常操作时,只要标题的集合体(aggregate)使用的资源在设计的 限制之内,就有新内容的可用空间。在非常少的情况下,如果在穷举搜索之后认为没有可用 映射(例如,由于系统预约超额),则报告错误236。可通过操作员介入,或可选地通过系统 自身经由其他服务(例如,管理服务)来处理错误。3创津樽型通过划分问题空间并形成部分解,模型和规定的工作负荷可帮助内容供应服务 124以更有效的方式管理跨多个方面的资源。存在创建好模型的各种方法。例如,一种方法 是在η-空间中进行k-ary细分,其中,k是细分因数(例如,k = 2是二进制细分),η是独 立属性的数目。这里,属性可以是操作目标(如受欢迎度、弹性和完整性)、独立资源池及其 特性(这种盘的阵列和盘的模型)和/或资源管理中的其他方面中的一个的特征。参考图3,一般地,基于属性建模的一些应用进行如下。步骤1 获得表示库中标题的访问模式的经验使用分布。使用分布可以是作为 一个或多个属性(例如,标题等级)的函数的访问速率的描述(例如,每秒的观看数,同 时观看的平均数目,每秒的兆位数)。该信息可从实际使用数据(例如,来自Netflix、 Blockbuster.Hollywood电影等的存储记录)获得,或基于预测(例如,使用视频租赁数据 来推测其使用特性)来获得。在一些应用中,形成连续数学模型来描述使用数据。步骤2 基于使用分布划分属性空间。这里,定义一组方案,每个方案与一个或多 个属性的范围(例如,标题等级的前百分之五)相关联。方案通常描述了如何为具有一组 给定属性的标题指派系统中的资源。每个方案被映射到存储分配模式,该存储分配模式包 括(例如)其上设置有此方案中的标题的盘和针对每个标题存储的副本的数目的组合。步骤3 通过基于划分结果累计库的每个标题的资源需求来计算资源利用(例如, 总的存储量)。在一些应用中,总资源需求用作确定将在系统中使用的存储服务器的数目和 类型的基础。可以以迭代方式手动或自动地执行这三个步骤,并进一步地,通过考虑一组限制, 来优化一个或更多个目标函数(例如,成本、资源利用、标题间竞争、功率消耗)。例如,在需 要使效用成本(utility cost)最小化的情况下,在指派初始划分参数之后,可迭代执行步 骤2和步骤3以确定划分的好(或最佳)方式,该方式产生最小量的效用成本,同时满足限 制供应的某些方面(例如,总体存储量和每个盘的最大读出速率)的特定限制。如果在特 定步骤的处理没有有效地收敛,可再进入之前的步骤并进行修改。为了进一步阐释基于属性的建模,以下更详细地描述两个实例。3. 1例I——用单个属性建模参考图4A和图4B,在第一实例中,基于单个属性——受欢迎度来创建内容供应的 模型。这里,受欢迎度是一部分内容的预期需求的表达。例如,如果内容受欢迎,对其的需求很可能就高,因而供应系统将试图以满足预期需求所需的资源来供应内容。图410是用户生成的视频库中一百万个标题的访问率(例如,每天观看数)相对 于受欢迎度等级以对数-对数刻度绘制的分布。如图所示,访问率(从而对访问带宽的需 求)在标题间变化较大。一些最受欢迎的标题每天被观看一百万次以上,最低等级中的标 题每天被访问一次以下。生成基于受欢迎度的模型工作负荷能够由此允许以与服务目标 (诸如标题可访问性)相协调的方式分配系统资源。图420中示出了考虑了受欢迎度而创建模型工作负荷的一种方式。创建了一组 量,作为细分该连续使用分布曲线410的结果。每个量与一个标题等级的范围相关联,在该 范围内所有标题将共享部分确定的分配方案。此模型工作负荷(例如)通过将更多系统资 源集中在具有更大需求的个体上而提供了稍后指导内容供应处理的框架。注意,在生成模 型工作负荷时,可使用各种量化方案(例如,二进制细分或三进制细分,或甚至非一致或非 公式细分)。不同的量化方案关于不同的经验数据组、具体应用(例如,提供诸如电影或在 线广告的不同数据种类的内容)或将用来支持工作负荷的系统配置具有优点或缺点。图4B示出了可在此实例中应用的一组方案。如图430所示,沿标题等级轴跨越给 定范围的每个量对应于一个具体方案。如供应表440所示,同一方案中的标题共享一组预 定的设置和服务特性,包括(例如)盘的数目和存储每个标题的盘区域,每个标题的原始 副本的数目以及诸如系统能够提供的最大访问带宽的性能特性。例如,落入前百分之五内 的标题将根据方案1 (Si)供应-即,在存储器上具有12个副本,在96个盘的跨度的盘区域 I(Rl)上分解每个副本。这种设置提供最大800Mbps的访问带宽。基于这些方案,可计算整个库所需的存储容量的量,且该量可用来确定系统的硬 件要求。例如,如果根据规定工作负荷IM标题所需的存储量约为90TB,则可将系统配置成 包括96个ITB盘,这96个ITB盘由各自具有M个盘驱动的4个服务器来组织。此外,如 果期望在系统上提供36(ibpS的访问带宽用于服务40K同时会话(每个会话在900Kbs处编 码),每个盘驱动被选择为具有至少400Mbps的持续读出速率。3. 2例II——以多个属性建立模型参考图5,在第二实例中,在创建模型工作负荷中使用两组属性(例如,受欢迎度 和弹性)。在此描述中,弹性与存在组件故障时对信息对象保持的服务的预测水平有关。例 如,在访问弹性对象时,对于在盘A上遇到失败读取的客户,仍可通过读取盘B上的数据的 可替代副本而继续享受服务。一般地,对象需要变得越有弹性,则内容供应系统需要对该对 象分配越多的资源(和可能更多类型的资源)。图510示出了二维属性空间的示例细分。与单属性模型建立相对照,现在每个方 案由两个属性的各自的范围的组合来定义。再者,对每个方案中的标题指派一组预定的设 置和服务特性。例如,方案1中的标题对应于高弹性和高受欢迎度,因此每个标题以4个原 始副本存储在12个盘的快速区域(Rl)中以提供良好的弹性和可访问性。相比之下,方案 5中的标题对应于低受欢迎度和低弹性,因此每个标题仅以一个原始副本存储在4个盘的 慢速区域(R5)中。每个方案可由属性值的指定范围来定义。例如,方案2由[A1s2min, A1s2 _]范围中的受欢迎度属性值和[A2s2min,A2s2max]范围中的弹性属性值来定义。该方案规定 标题的三个原始副本的每一个被写在8个盘的跨度的R2中。该设置引起系统对S2中的每 个标题可支持600Mbps的访问能力。
在多于两个的属性被用于生成模型工作负荷的一些应用中,可使用相似的方式进 行多维属性空间的细分。例如,每个方案将由这些属性的每一个的值范围的组合来定义。一 旦基于标题的属性值将该标题分配给适当的方案,则根据指派给此具体方案的预定设置执 行内容供应。可用来生成模型工作负荷的另一属性实例是完整性。在此描述中,内容完整性与 组件故障后甚至在系统的灾难性故障后恢复内容的能力有关。例如,如果盘彻底毁坏且不 能恢复,该盘上包含的那部分内容可从系统内或跨系统的该内容预备副本和/或根据编码 的重建方法来恢复。其他属性实例包括地理亲近性和排斥性、拓扑亲近性和排斥性以及功率消耗。3. 3其他实例在一些实例中,在建立模型中可包含进手动的或自动的优化以实现一个或更多个 设计目标。假定在建立模型之前已确定了存储服务器的数目和类型,则一个设计目标可以 是(例如)最佳地使用可用资源。如果还没有确定系统的硬件组件,则另一设计目标可以 是最小化整个系统资源需求,同时满足单个标题或所有标题的服务目标。为了进行优化,一般首先定义目标函数并确定可最小化或最大化其值的输入。(有 时,对输入可采用的值施加一组限制)。在图5所述的实例中,方案的限定可被视为对需要 被最小化的效用成本的目标函数的输入。以最初的一组输入开始(例如,图中方案的当前 边界条件),通过在输入中进行小步幅的调整(诸如,沿每个属性轴移动方案2的边界)以 到达获得最低系统成本的条件,可找到优化的一组方案限定。(参见以下的用于调整模型和 方案从而优化运行的系统的重建模型)。在一些系统中,使用基于模型的方式管理资源分配的一个优点是在建立整个系统 之前可测试组件和子系统的性能和行为。模型可被细化到子系统或组件级,且在将子系统 或组件结合进整个系统之前,对该子系统或组件作出测试。例如,多层测试脚本可用于测试 并合格化不同级别上的子系统(例如单独的盘驱动,一组盘驱动和完整的存储服务器),且 最终被扩展到整个系统(包括访问服务器、存储服务器、盘调度程序等)。对测试结果进行 分析并将测试结果用于确定期望的系统配置或修改。这些结果还可为下一级的系统开发提 供可验证的性能目标。4.内容再供应一旦内容被成功地供应至系统且可用于访问,则可通过从存储器和访问服务器收 集内容统计数据(如会话计数和带宽消耗)来跟踪内容的实际使用。对象的实际使用可能 偏离其供应水平,而大偏离会影响资源利用的整体效率。例如,过量供应的对象可能正在消 耗未处于使用中、但仍然被阻止分配给其它对象的资源,而同时供应不足的对象被指派了 不充分的资源,这导致进入的访问请求被拒绝。因此,为了使系统能够持续操作在整体上最 佳的状态中,提供了内容再供应服务。存在着会期望内容再供应的许多情况。当初始供应的标题无属性时出现第一情 况(例如置于默认方案中并据此进行供应),该标题的实际使用稍后被用于确定适于使用 哪个方案以及是否需要再供应该标题。当初始供应标题使用不代表实际使用的属性时(例 如,当市场促销宣传电影的近期受欢迎度时)出现第二情况,系统检测实际水平和供应水 平之间的差异(“异常”),并通过选择最反映标题的实际使用的方案来命令再供应该标题。当存在属性的计划生命周期管理(例如“老化”)时出现内容重新配置的第三种情况,且标 题被计划成根据预定的原则(例如,在标题的释放周期的有效期范围内,向标题提供不断 减少的带宽)在方案之间移动。在这些情况中的每一个中,内容再供应服务提供至少两种操作1)提高供应 (up-provisioning),其将供应升级至通常将更多的资源指派给内容的更高级别的方案;以 及2)降低供应(down-provisioning),其将供应降级至将一定量的资源释放回系统的更低 级别的方案。在基于异常和基于阈值的内容再供应的背景中,更详细地描述这些操作。4. 1基于异常和基于阈倌的再供应一般来说,基于异常和基于阈值的内容再供应处理(1)使用已不代表其实际使用 的属性供应的内容或( 其使用已被不可预测地改变、使得供应不再代表并适合于实际使 用的内容。除了是不正确的方案指派(例如,由于错误的数据和/或默认方案指派)的结 果之外,“异常”还可由许多其他因素造成,包括(例如)导致内容的近期受欢迎度变化的市 场导向和不可预测事件(如演员的死亡)。当检测到异常或一部分内容的使用超过了指示 内容被过量供应或未充足供应的阈值时,则将自动再供应该部分内容。以下详细描述基于异常的再供应的一个实例。参考图6,内容再供应服务125与系统中的其他服务(包括准入服务1 和内容监 控器12 交互以提供以下功能。准入服务1 针对当前被访问的每一部分内容来收集和保持一组运行统计数据 (步骤61 。运行统计数据的实例包括在任何给定时间和随着时间的逝去针对每个对象所 允许的同时会话的数量和涉及所有对象的总的使用。准入服务126还以每个方案为基础将 供应异常阈值作为服务配置文件的一部分来保持(步骤614)。当标题的实际使用(例如即 时访问速率)越过了其对应方案的异常阈值时(例如,包括超过提高供应的预定阈值,或降 到降低供应的预定阈值以下),其指示非预期的暂时使用,则创建供应异常对象(步骤616) 并将其提供给内容监控器123。内容监控器123保持供应准入服务1 提交的异常对象的工作队列(步骤622), 并确定且优选以优先顺序排列未完成的再供应列表(步骤624)。例如,基于每个供应异常 的类型,内容监控器123确定是否可通过再供应纠正异常。对于需要提高供应且已处于供 应的最高级别的内容,则将发送“供应异常未修复”事件且对该内容不需要进一步的处理。 在一些实例中,内容监控器123将要提高供应的内容置于更高的优先级,以使系统能够准 入尽可能多的涉及该内容的未来的服务请求。在当不能立刻获得用于提高供应的资源时的 一些其他实例中,准予降低供应内容的请求优先于提高供应的请求,从而为提高供应而释 放系统资源。对于未完成再供应的列表上的每个项目,内容监控器123确定代表其实际使 用的一组新属性并随后生成再供应命令(步骤626)以指示再供应服务125相应地再供应 该项目。在内容再供应服务125接收到再供应命令之后(步骤63 ,基于新属性再供应内 容(步骤634)。类似于之前描述的通常内容供应步骤,再供应服务125选择对应于新属性 的方案,根据方案指派资源以将内容的新副本写到存储器上。当已向内容给予其新供应时, 再供应服务125更新对象目录中的内容信息(步骤636)并从存储器移除内容数据的旧实 例。
除了基于异常的再供应之外,另一类型的再供应通过考虑进标题使用的短期和/ 或长期变化性(例如,观看趋势),使用阈值机制做出再供应决定。以下描述基于阈值的再 供应的一个实例。一旦标题被存储在系统上且使得可被客户访问,该标题的使用(或受欢迎度)将 自然地变化。新标题(例如,电影、TV剧集、新闻片段)被首次引入时通常经历较高使用; 随着时间的逝去,使用通常降低,尽管不同标题的使用可能以不同的速率降低。在某些情况 下,新标题(例如用户生成的视频)在被首次引入时将经历非常少的使用,且在其整个寿命 中保持很少使用或不使用;但是,社会舆论(social buzz)可能带来对一些标题中的一些 的关注,导致使用增加。随着关注减退,使用降低。在这个基于阈值的再供应实例中,标题的使用趋势(例如)通过计算标题的观看 速率关于时间的第一导数来进行监控。然后对照阈值测量该趋势,以确定标题的使用是否 遵循此标题的设计趋势。此设计趋势可以以每个方案为基础进行构建(即同一方案中的每 个标题与相同/相似的设计趋势相关联),或可选地,针对每个标题基于标题自身特性(例 如,基于诸如标题的类型和内容的属性)进行具体地构建。如果标题使用的实际趋势偏离 于设计趋势(例如,与设计的缓慢减退相反,在过去的一周内标题经历了使用增加),标题 将被置于要被再供应的再供应列表中。在许多情况下,系统在方便的时间(例如,在轻服务 负荷持续时间)实施基于阈值的再供应决定发起的再供应动作,以减小对系统的其他操作 的干扰。存在可用在此基于阈值再供应的实例中的一些算法。第一实现基于非加权后向观 看时间窗和使用阈值。通过离散地采样连续的时间事件,估计标题的使用分布并使该分布 与阈值相比较以确定是否需要发生再供应动作。第二实现基于标题使用的时间敏感加权移 动平均/和。更具体地,在认识到经验使用事件固有地表示适于分布函数的统计概率时,使 用分布函数来对拖尾的移动平均/和加权。此第二实现可减少非加权实现中可能发生的采 样误差和混淆,并改善整体系统效率。4. 2基于进度表的再供应在一些实例中,执行基于进度表的内容再供应来作为生命周期管理的结果,例如, 可以以计划的方式向预期会随着时间逝去经历渐减的使用的标题提供随时间日益减小的 带宽。一般来说,基于进度表的再供应处理在后台以较低优先级运行以使其对其它操作的 影响最小。基于进度表的内容再供应的一个实例进行如下。参考图7,起初,再供应进度表与系统中的标题相关联(步骤70幻。可手动地(例 如,操作员基于领域知识而设计的)确定或自动地(例如,使用通过收集内容统计数据和分 析访问模式的趋势而建模的内容老化函数)确定再供应进度表。进度表可包含生命周期的 起始参考点和要采取的一系列设计的再供应动作(例如,将标题从其当前方案再供应到另 一指定方案,或在标题的属性中进行指定的改变),以及何时采取这些动作(包括例如触发 动作的时钟时间集)。再供应进度表一旦被建立,以后就可基于对象随时间的实际使用和整 体系统目标来修正。当再供应动作(例如)通过时钟时间或其他触发事件被触发时(步骤704),基于 进度表来计算标题的新属性(步骤706)。然后使用这些新属性再供应该标题(步骤708)。 在完成该再供应动作之后,再供应服务等待下一起动点以开始另一轮再供应动作(步骤710)。在一些实施例中,以契约(contractual)为基础构建再供应进度表。例如,进度表 包括一组再供应动作的启动日期/时间,以及在该时间要采取的动作的详情(例如,每个动 作中标题的具体供应级别)。在一些其他实例中,再供应进度表进一步包括针对再供应目的构建的一组使用模 型,其中每个使用模型对应于再供应动作的特定组。在系统操作期间,对照这一组使用模型 来测量标题的实际使用,以确定最佳匹配的使用模型。然后,再供应服务根据对应于该最佳 匹配模型的动作对该标题进行再供应。在计划重新再供应标题时的下一触发,如果标题的 实际使用符合之前确定的最佳匹配模型中描述的使用,将根据对应于此模型的动作重新再 供应标题。但是,如果实际使用明显偏离在之前确定的最佳匹配模型中的描述使用,则为该 标题选择新的最佳匹配模型。随后,根据对应于此新模型的一组动作来再供应该标题。通常,涉及内容再供应的服务(诸如,内容再供应服务125和内容监控器123)可 由一个或多个物理服务器来提供。这些服务器可以是一个或多个访问服务器平台120(如 图1所示),或一个或多个外部再供应平台,或二者的组合。5重津樽型如上所述,当单独一部分内容的实际使用显现出与已被供应内容的方案不一致 时,内容再供应服务用于将该内容再指派至更能准确代表实际使用的适当方案。但是,在一 些情况下,如果这样的不一致在更大范围上出现,则大量的再供应请求可能出现在系统中 或大量的再供应请求可被满足,这会导致可能使系统不平衡并威胁其性能和稳定性的再供 应风暴。另外,当在偏离规定级别的级别上执行实际工作负荷的大部分时,规定的工作负荷 自身不再适于系统实现期望的性能和行为。而且,存在会影响可被分配的可用资源量并且 从而影响内容应被供应的方式的特定系统更新(例如出故障的服务器的减损或添加新服 务器到系统)。在这些情况下,推荐在全局范围上的系统重新配置和/或重建模型。在一些 实施例中,系统的实际使用现在用作新经验数据(新212)以创建新模型工作负荷,新规定 的工作负荷,新方案等;根据之前和新的经验数据以及系统目标之间的差别的程度,这些可 代表对系统的微小或较大的改变。参考图8A和图8B,在一个实例中,当在系统的实际工作负荷830和当前用于内容 供应的规定工作负荷810之间检测到大的不一致时,执行重建模型以配置更好地匹配实际 工作负荷830的新的规定工作负荷820 (包括方案和供应表)。如实际工作负荷830所示, 被指派在前两个总量中的标题是供应不足的,这是因为他们的平均访问速率实质上高于规 定水平(即,分别是800Mbps和600Mbps)。与之对照,其余总量中的标题被过量供应在系统 操作期间未被完全消耗的带宽容量。结果,最大总体系统性能可远低于之前设计的最大总 体系统性能。恢复该损失的一个方式是使方案之间相对资源分配重新平衡,如新的规定工作负 荷820所示。在此,用于前两个总量中的标题的访问带宽分别被提升到950Mbps和800Mbps, 而库的其余部分已相应地降低到更低的水平。新的一组方案(S1’、S2’、S3’、S4’等)现在 取代了之前的组(S1、S2、S3、S4等)以反映资源分配中的变化。注意,在上述实例中,与每个方案相关联的资源分配的模式(例如,盘跨度和盘区 域)受到影响,但是方案的边界(即,基于属性空间的划分的方案的限定)保持不变。但是,可不必是这种情况。存在用于在重建模型中创建新的规定工作负荷的许多其他方式。一个 替代方式(例如)涉及划分属性空间中的变化(例如通过修改方案边界和/或方案的总体 数量)和/或映射到每个方案的资源分配的模式。一旦配置了新的规定工作负荷,内容供应服务将根据新的方案处理未来的上载请 求。另一方面,之前供应的内容可被逐渐再供应并迁移到新地点以使系统回到最优化。在 该时间段期间新旧规定的工作负荷可并存在系统中以便利该迁移。重建模型的另一实例随着将(例如)服务器的新资源添加到系统而出现。如果以 上实例表示4个存储服务器和4个访问服务器的系统,将系统扩展到例如6个存储服务器 和6个访问服务器会导致要分配的系统资源增加50%。(这里,存储和访问服务器的数目 不必是相同的)。根据期望的新系统使用,对规定的工作负荷至少可进行三个改变。(1)如 果由于系统充满更多较低受欢迎度的标题而增大该系统,则可添加一个或多个较低受欢迎 度的方案。(2)如果整体系统使用在增大,而标题间的使用比例与之前相同,则对所有方案 按比例提供更多的系统资源。(3)如果系统由于添加了更多更高受欢迎度的标题而增大,则 可添加一个或多个更高受欢迎度方案。注意这三种情形不是穷举性的。应理解,前述说明旨在于阐述而不是限制本发明的范围,本发明的范围由所附权 利要求的范围来限定。其他实施方式在之后的权利要求的范围内。
权利要求
1.一种计算机实现的方法,包括接收对第一内容项目组的访问模式的描述,所述访问模式的描述是至少第一属性的函 数,所述第一属性描绘要存储在存储系统中的第二内容项目组的一个或多个操作目标的特 征;以及至少部分地基于所述访问模式的描述来划分存储空间,包括 限定与所述第一属性的值的范围相关的多个种类中的每一个;以及 使所述多个种类中的每一个与多个资源分配设置中的各自的一个相关联。
2.根据权利要求1所述的方法,其中,所述存储系统具有预定配置。
3.根据权利要求2所述的方法,进一步包括确定所述多个资源分配设置中的每一个,使得与所述多个资源分配设置相关联的资源 需求的集合与所述存储系统的预定配置相一致。
4.根据权利要求3所述的方法,其中,所述资源需求的集合包括对访问和存储容量的需求。
5.根据权利要求1所述的方法,进一步包括基于划分所述存储空间的结果,确定用于存储所述第二内容项目组的所述存储系统的配置。
6.根据权利要求5所述的方法,其中,确定所述存储系统的配置包括确定所述存储系 统的一组存储组件中的每一个的特性。
7.根据权利要求5所述的方法,其中,确定所述存储系统的配置包括 基于划分所述存储空间的结果,迭代地产生所述存储系统的候选配置;以及 根据预定的设计目标选择所述存储系统的优选配置。
8.根据权利要求7所述的方法,其中,所述预定的设计目标以设计目标函数为特征,且 迭代地产生所述候选配置包括向与所述第一属性的值的范围有关的多个种类中的每一个提供一组初始限定;以及 对所述一组初始限定进行调整以优化所述设计目标函数。
9.根据权利要求7所述的方法,其中,所述设计目标包括最小化所述存储系统的资源 需求的水平。
10.根据权利要求7所述的方法,其中,所述设计目标包括最小化所述第二项目组中的 不同项目的潜在资源消耗之间的竞争程度。
11.根据权利要求1所述的方法,其中,所述访问模式的描述是描绘所述第二内容项目 组的一个或多个操作目标的特征的多个属性的函数。
12.根据权利要求11所述的方法,其中,关于所述多个属性中的每一个的值的各个范 围来限定所述多个种类的每一个。
13.根据权利要求1所述的方法,其中,所述多个种类共同地表示所述第一属性的值的 完整范围。
14.根据权利要求1所述的方法,其中,所述第二内容组的一个或多个操作目标包括以 下操作目标中的一个或多个可访问性,完整性,弹性和功率消耗。
15.根据权利要求1所述的方法,其中,所述访问模式的描述涉及以下类型中的一个或 多个的描述访问速率、带宽消耗程度、统计使用分布、地理使用分布和基于经验数据的计划使用分布。
16.根据权利要求1所述的方法,其中,对于多个种类的每一个,各个资源分配设置包 括与将被存储在所述存储系统中的种类相关联的项目的实例数量的说明。
17.根据权利要求1所述的方法,其中,所述第一项目组与所述第二内容项目组共享共 同的特性,使得对所述第一项目组的访问模式形成计划所述第二项目组的访问模式的合理 ■石出。
18.根据权利要求17所述的方法,其中,所述第一和第二项目组中的每一个是电影标 题的集合。
19.根据权利要求17所述的方法,其中,所述第一和第二项目组中的每一个是以下类 型的一个或多个的内容的集合在线视频广告、用户生成的内容、音乐视频、体育活动的视 频、新闻片段和TV剧集。
20.根据权利要求1所述的方法,其中,所述第二项目组至少包括所述第一项目组中包 括的项目的子组。
21.根据权利要求1所述的方法,其中,所述第二项目组在内容上与所述第一项目组基 本上不同。
22.根据权利要求21所述的方法,其中,所述第二组不包括所述第一项目组中的任何 项目。
23.—种系统,包括接口,用于接收对第一内容项目组的访问模式的描述,所述访问模式的描述是至少第 一属性的函数,所述第一属性描绘要存储在存储系统中的第二内容项目组的一个或多个操 作目标的特征;机器可读介质,存储可由处理器执行的指令,以至少部分地基于所述访问模式的描述 划分存储空间,其中,划分所述存储空间的指令包括如下操作的指令限定与所述第一属性的值的范围相关的多个种类中的每一个;以及使所述多个种类中的每一个与多个资源分配设置中的各自的一个相关联;以及数据库,用于存储所述多个资源分配设置。
24.根据权利要求23所述的系统,其中,划分所述存储空间的指令进一步包括如下操 作的指令基于划分所述存储空间的结果,确定用于存储所述第二内容项目组的所述存储系统的配置。
25.根据权利要求23所述的系统,其中,划分所述存储空间的指令进一步包括如下操 作的指令限定描绘所述存储系统的预定设计目标的特征的设计目标函数;以及计算优化所述设计目标函数的所述存储系统的优选配置。
26.根据权利要求25所述的系统,其中,所述设计目标包括减少所述存储系统的资源 需求的水平。
27.根据权利要求沈所述的系统,其中,所述设计目标进一步包括最小化所述存储系 统的资源需求的水平。
28.根据权利要求25所述的系统,其中,所述设计目标包括减小所述第二项目组中的不同项目的潜在资源消耗之间的竞争程度。
29.根据权利要求观所述的系统,其中,所述设计目标进一步包括最小化所述第二项 目组中不同项目的潜在资源消耗之间的竞争程度。
30.一种计算机实现的方法,包括获得描绘第一内容项目的实际使用水平的特征的信息,所述第一内容项目根据第一资 源分配设置被存储在存储环境的资源的第一组元件上;基于获得的所述信息来确定是否满足再供应条件,且如果满足,生成要与所述存储环 境的资源相关联地执行的再供应操作的说明,所述再供应操作包括 识别用于存储所述第一内容项目的第二资源分配设置;以及 根据所述第二资源分配设置来分配所述存储环境的资源的第二组元件;以及 执行所述再供应操作。
31.根据权利要求30所述的计算机实现的方法,其中,执行所述再供应操作包括 根据所述第二资源分配设置,将所述第一内容项目的一个或多个新实例存储在资源的所述第二组元件上;以及从所述存储环境的资源的所述第一组元件移除所述第一内容项目的一个或多个在先 存储的实例。
32.根据权利要求30所述的计算机实现的方法,其中,所述再供应操作包括第一类型 的基于异常的再供应操作。
33.根据权利要求32所述的计算机实现的方法,进一步包括检测第一内容项目的实际使用水平和使用的供应水平之间的不一致,所述使用的供应 水平特征在于与所述第一资源分配设置相关联的第一组方案属性;以及 比较该不一致与异常标准,从而确定异常供应的出现。
34.根据权利要求33所述的计算机实现的方法,其中,所述异常标准包括异常阈值。
35.根据权利要求32所述的计算机实现的方法,进一步包括在确定供应异常出现时创建与所述第一内容项目相关联的供应异常对象; 将所述供应异常对象保持在未完成的再供应列表中;以及 确定响应于所述供应异常对象要执行的基于异常的再供应操作。
36.根据权利要求35所述的计算机实现的方法,其中,所述基于异常的再供应操作包括识别代表所述第一内容项目的实际使用的水平的第二组方案属性,所述第二组方案属 性与所述第二资源分配设置相关联。
37.根据权利要求35所述的计算机实现的方法,其中,所述基于异常的再供应操作包括当所述第一内容项目的实际使用的水平超过使用的供应水平第一预定阈值量时执行 的提高供应操作;以及当所述第一内容项目的使用的供应水平超过实际使用的水平第二预定阈值量时执行 的降低供应操作。
38.根据权利要求35所述的计算机实现的方法,其中,所述未完成的再供应列表包括多个供应异常对象,所述多个供应异常对象中的每一个与多个基于异常的再供应操作中的 各自的一个相关联。
39.根据权利要求38所述的计算机实现的方法,进一步包括基于多个再供应操作的每一个的相对紧急程度和所述存储环境的资源的可用性来以 优先顺序排列多个基于异常的再供应操作。
40.根据权利要求30所述的计算机实现的方法,其中,获得的所述信息可包括以下中 的一个或多个在给定时间对所述第一内容项目的同时访问请求的数量,在检测期间对所 述第一项目的访问请求的集合,以及由于资源不可用导致被拒绝的访问请求的数目和频 率。
41.一种计算机实现的方法,该方法包括接受一个计划,所述计划用于管理与在存储环境的资源上存储的第一项目相关联的资 源分配,该计划至少包括与规则触发器相关联的第一规则;以及在激活所述规则触发器时应用所述第一规则,所述第一规则将资源分配中的调整与所 述第一项目相关联,其中所述第一项目特征在于一组初始属性,且根据与所述一组初始属性一致的多个资 源分配设置中的一个而被存储在存储环境的资源上。
42.根据权利要求41所述的计算机实现的方法,其中,所述多个资源分配设置被保持在第一数据库中。
43.根据权利要求42所述的计算机实现的方法,其中,所述第一规则包括适用于描绘 了所述第一项目的特征的一组初始属性的调整的说明,且应用所述第一规则的方法包括根据所述调整的说明计算所述第一项目的一组经调整的属性;从与所述第一项目的一组经调整的属性一致的多个资源分配设置中选择一个;以及基于所述多个资源分配设置中选择的一个来分配资源以存储所述第一项目的一个或 多个实例。
44.根据权利要求43所述的计算机实现的方法,其中,适用于所述一组初始属性的调 整包括对所述一组初始属性中的至少一个的当前值应用折扣因数。
45.根据权利要求43所述的计算机实现的方法,其中,所述第一规则包括针对所述第 一项目从候选资源分配设置的列表顺序选择一个的描述。
46.根据权利要求43所述的计算机实现的方法,其中,所述规则触发器部分地由跟随 有激活窗口的开始点限定。
47.根据权利要求46所述的计算机实现的方法,其中,所述开始点和所述激活窗口部 分地基于对所述第一项目的访问模式关于时间的趋势的估计来确定。
48.根据权利要求43所述的计算机实现的方法,其中,所述规则触发器由开始点的序 列限定,所述开始点序列的每一个跟随有各个激活窗口。
49.根据权利要求48所述的计算机实现的方法,其中,应用所述第一规则的方法包括在出现开始点序列的每一个时对所述第一项目迭代地应用第一规则。
50.根据权利要求41所述的计算机实现的方法,其中,所述第一项目特征在于各自的 一组初始属性,且根据多个资源分配设置中的各自的一个资源分配设置而被存储在所述存 储环境的资源上。
51.根据权利要求50所述的计算机实现的方法,其中,应用所述第一规则的方法包括根据预定顺序对项目组的每一个应用所述第一规则。
52.根据权利要求51所述的计算机实现的方法,其中,所述第一规则包括多个分量,各 分量专用于项目组中的不同项目。
53.根据权利要求51所述的计算机实现的方法,其中,在所述计划中指明所述预定顺序。
54.根据权利要求41所述的计算机实现的方法,其中,所述计划进一步包括多个规则, 每个规则与各自的规则触发器相关联。
55.根据权利要求41所述的计算机实现的方法,进一步包括响应于所述存储环境的操作状态中的变化来修改用于管理资源分配的计划。
56.根据权利要求55所述的计算机实现的方法,其中,所述存储环境的操作状态包括 所述存储环境的资源的硬件配置。
57.根据权利要求55所述的计算机实现的方法,其中,所述存储环境的操作状态包括 对存储在所述存储环境的资源上的项目组中的一个或多个项目的访问的模式。
58.一种计算机实现的方法,包括检测代表多个内容项目的访问模式的实际工作负荷,根据多个资源分配设置中的一个 将所述多个项目存储在存储环境的资源上;比较所述实际工作负荷与规定工作负荷,从而确定相对于所述规定工作负荷的实质偏 离的发生,所述规定工作负荷包括多个种类,种类中的每一个与多个资源分配设置中的各 自的一个相关联;以及在确定发生实质偏离时,至少部分地基于所述实际工作负荷修改所述规定工作负荷。
59.根据权利要求58所述的计算机实现的方法,其中,与第一属性的值的各个范围相 关地限定所述多个种类的每一个,所述第一属性描绘所述多个内容项目的一个或多个操作 目标的特征。
60.根据权利要求59所述的计算机实现的方法,其中,修改所述规定工作负荷的方法 包括通过将所述第一种类的定义改变成所述第一属性的值的新范围而至少修改第一种类。
61.根据权利要求60所述的计算机实现的方法,其中,修改所述规定工作负荷的方法 进一步包括将已修改的第一种类与所述多个资源分配设置中的适当一个设置相关联,使得所述关 联的结果与所述存储环境中资源的可用性一致。
62.根据权利要求61所述的计算机实现的方法,其中,所述存储环境中的资源包括存 储资源和访问资源。
63.根据权利要求58所述的计算机实现的方法,其中,对于所述多个种类中的每一个, 相关联的各自的资源分配设置包括与存储在所述存储系统中的种类相关联的项目的实例 数目的第一说明,以及针对项目的元素而部分限定的目的地的第二说明。
64.根据权利要求63所述的计算机实现的方法,其中,所述存储环境的资源至少包括 具有多个不同区域的第一存储分量,且针对项目的元素而部分限定的目的地的第二说明将 项目的元素与多个不同区域中的一个相关联。
65.根据权利要求64所述的计算机实现的方法,其中,对于所述多个种类中的每一个, 通过应用所述资源分配设置中的各自的一个资源分配设置,各个级别的资源容量被分配到 种类中的项目。
66.根据权利要求65所述的计算机实现的方法,其中,所述各个级别的资源容量至少 包括与所述存储环境的资源上存储的种类中的项目的实例数目有关的存储容量;以及与对所述种类中的项目提供的可允许访问带宽有关的访问容量。
67.根据权利要求65所述的计算机实现的方法,其中,修改所述规定工作负荷的方法 包括,对于所述多个种类中的至少一些种类通过改变与所述种类相关联的资源分配设置中的各自的一个资源分配设置,改变各个 级别的资源容量。
68.根据权利要求67所述的计算机实现的方法,其中,改变资源分配设置的各个设置 包括 改变与存储在所述存储系统中的种类相关联的项目的实例数目的第一说明。
69.根据权利要求67所述的计算机实现的方法,其中,改变资源分配设置中的各自的 一个资源分配设置包括改变针对项目的元素而部分限定的目的地的第二说明。
70.根据权利要求58所述的计算机实现的方法,其中,所述规定工作负荷被保持在第一数据库中。
71.根据权利要求58所述的计算机实现的方法,进一步包括基于修改所述规定工作负荷的结果产生新规定工作负荷;其中,所述新规定工作负荷使得能够将所述存储环境的资源重新分配给多个项目,该 重新分配反映了所述实际工作负荷。
72.根据权利要求58所述的计算机实现的方法,其中,当所述实际工作负荷相对于所 述规定工作负荷的偏离超过偏离阈值时出现实质偏离。
73.根据权利要求58所述的计算机实现的方法,其中,检测所述实际工作负荷的方法 包括获得关于以下中的一个或多个的信息在给定时间对多个项目中的每一个的同时访问 请求的数量,在检测期间对多个项目的每一个的访问请求的集合,以及关于多个项目中的 每一个由于资源不可用而被拒绝的访问请求的数目和频率。
74.一种计算机实现的方法,包括检测代表多个内容项目的访问模式的实际工作负荷,所述多个项目根据多个资源分配 设置中的一个而被存储在存储环境的资源上;比较所述实际工作负荷与第一工作负荷模型,从而确定相对于第一工作负荷模型的实 质偏离的发生,所述第一工作负荷模型包括第一方案集,其方案中的每一个与第一组资源 分配设置组中的各自的一个相关联;以及在确定实质偏离的发生时,至少部分地基于所述实际工作负荷确定第二工作负荷模 型,所述第二工作负荷模型包括第二组方案,其方案中的每一个与第二资源分配设置组中 的各自的一个相关联。
全文摘要
一种计算机实现的方法,包括接收对第一内容项目组的访问模式的描述;以及至少部分地基于该访问模式的描述来划分存储空间。访问模式的描述是至少第一属性的函数,该第一属性描绘要存储在存储系统中的第二内容项目组的一个或多个操作目标的特征。划分存储空间包括限定与第一属性的值的范围相关的多个种类中的每一个;并使多个种类中的每一个与多个资源分配设置中的各自的一个相关联。
文档编号H04N21/266GK102132577SQ200980132893
公开日2011年7月20日 申请日期2009年7月9日 优先权日2008年7月10日
发明者布兰科·J·格罗瓦克, 戴维·C·卡弗尔 申请人:丛林网络公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1