对象存储生命周期管理方法、管理装置、设备及介质与流程

文档序号:30079885发布日期:2022-05-18 04:08阅读:141来源:国知局
对象存储生命周期管理方法、管理装置、设备及介质与流程

1.本发明涉及计算机技术领域,尤其涉及一种对象存储生命周期管理方法、管理装置、计算机设备及介质。


背景技术:

2.随着互联网的发展,互联网数据量(非结构化数据)越来越大,分布式对象存储应运而生。这种新兴的存储方式,适用于图片、视频等非结构化数据的存储。它同时又具有块存储高速直接访问磁盘的特点以及文件存储分布式共享的特点,因此一经推出就得到广泛的发展与应用。
3.桶生命周期。通过对桶内指定前缀或者标签的对象设置指定的到期规则,可以实现对桶内对象的自动到期删除操作。目前对象存储中设置对象到期删除或者转移时需要遍历桶内对象,然后对比对象的上次修改时间和当前时间,从而决定是否删除该对象。列举所有对象需要遍历桶索引池中该桶所有的索引分片中记录的对象,同时获取该对象的时间。目前方法中,当大量桶以及桶内对象较多时,需要遍历所有对象,严重占用集群性能且会出现对象遍历不到导致桶内对象无法及时删除的问题。
4.目前对象存储中,通过桶生命周期可以自动的删除桶内符合条件的对象。桶生命周期线程需要遍历桶内对象,对比对象修改时间和当前时间,决定是否删除该对象。对象上传需要在桶索引池子中的桶索引分片上通过键值对的方式记录该对象的信息。列举桶内对象时便是通过列举桶索引分片上的记录的对象。目前方法中一个桶默认128个桶索引分片,上传对象时根据对象名hash(哈希,一种散列函数)的方法将对象信息记录到对应分片上。这种方法必须列举桶所有索引分片上的对象,才能确定对象的修改时间。故本专利提出了一种基于时间的桶索引分片方法,从而使得桶生命周期线程在执行时可以直接从对应的分片上找到过期的对象,实现了一种高效的对象过期删除方案。


技术实现要素:

5.有鉴于此,本发明实施例的目的在于提出一种对象存储生命周期管理方法。该方法通过修改桶索引方式,即将一个桶索引上存储相近时间的对象的动态桶索引方案。同时在索引分片head(头)中添加该索引上对象上传的时间范围。在生命周期线程执行时,可以精准的找到需要删除对象,减少不必要的对象遍历。
6.基于上述目的,本发明实施例的一方面提供了一种对象存储生命周期管理方法。所述方法包括:创建桶并创建基于时间的桶索引分片策略;上传对象,查找最大桶索引分片号并记录对象信息,更新桶索引分片head上记录的最后上传对象时间,并在对象元数据中记录所述对象信息的桶索引分片号;以及执行生命周期线程,根据生命周期规则计算需删除的对象,以删除符合时间要求的对象。
7.在一些实施方式中,建桶并创建基于时间的桶索引分片策略包括:创建桶时先创建一个桶索引分片,桶索引分片命名为桶id(识别号)+分片号,桶索引分片的head中添加第
一字段和第二字段,第一字段记录存储的第一个对象的修改时间,第二字段记录存储的最后一个对象的修改时间。
8.在一些实施方式中,创建桶并创建基于时间的桶索引分片策略还包括:桶索引分片号从0开始编号,桶索引分片存储阈值个对象,当桶索引分片存储的对象个数超过阈值时创建新的桶索引分片且桶索引分片号递增。优选地,所述阈值为10万。
9.在一些实施方式中,上传对象,查找最大桶索引分片号并记录对象信息,更新桶索引分片head上记录的最后上传对象时间,并在对象元数据中记录所述对象信息的桶索引分片号包括:对象写元数据时,查找最大桶索引分片号,并查看其对应的桶索引分片上记录的对象个数;若个数小于阈值,则将对象信息记录于最大桶索引分片号、更新最大桶索引分片的head上记录的后上传对象时间,并在对象元数据中记录所述对象信息的桶索引分片号;若个数等于阈值,则创建新的桶索引分片号并重复个数小于阈值的步骤。
10.在一些实施方式中,上传对象还包括:若覆盖原对象信息,则查找所述对象信息所在的桶索引分片,并在所述桶索引分片上删除对象信息并在最大桶索引分片号对应的桶索引分片上记录所述对象信息。
11.在一些实施方式中,执行生命周期线程,根据生命周期规则计算需删除的对象,以删除符合时间要求的对象包括:执行生命周期线程,根据生命周期规则计算需删除的对象,遍历桶索引分片head上记录的最后上传对象时间以得到符合时间要求的桶索引分片,遍历符合时间要求的桶索引分片上记录的对象信息,以删除符合时间要求的对象。
12.在一些实施方式中,执行生命周期线程,根据生命周期规则计算需删除的对象,以删除符合时间要求的对象还包括:
13.遍历桶索引分片head上记录的对象个数;
14.判断相邻的桶索引分片中记录的对象的个数之和是否小于阈值;
15.若超过两个相邻的桶索引分片中记录的对象的个数之和小于阈值,则合并涉及的桶索引分片为一个桶索引分片、以最小桶索引分片号为新的桶索引分片号并修改后续的桶索引分片的桶索引分片号;
16.更新新的桶索引分片的head中记录的第一个对象的修改时间和最后一个对象的修改时间,同时更新桶元数据中记录的桶索引分片数。
17.本发明实施例的另一方面,还提供了一种对象存储生命周期管理装置。所述装置包括创建单元、对象上传单元和生命周期执行单元。创建单元,用于创建桶和桶索引分片策略;对象上传单元,用于上传和更改对象信息;生命周期执行单元,用于根据生命周期规则计算需删除的对象、删除符合时间要求的对象以及合并多个记录对象之和小于阈值的相邻桶索引分片。
18.在一些实施例中,创建单元创建桶时先创建一个桶索引分片,桶索引分片命名为桶id+分片号,桶索引分片的head中添加第一字段和第二字段,第一字段记录存储的第一个对象的修改时间,第二字段记录存储的最后一个对象的修改时间。
19.在一些实施例中,创建单元创建的桶索引分片号从0开始编号,桶索引分片存储阈值个对象,当桶索引分片存储的对象个数超过阈值时创建新的桶索引分片且桶索引分片号递增。
20.在一些实施例中,对象上传单元在对象写元数据时,查找最大桶索引分片号,并查
看其对应的桶索引分片上记录的对象个数;若个数小于阈值,则将对象信息记录于最大桶索引分片号、更新最大桶索引分片的head上记录的后上传对象时间,并在对象元数据中记录所述对象信息的桶索引分片号;若个数等于阈值,则创建新的桶索引分片号并重复个数小于阈值的步骤。
21.在一些实施例中,对象上传单元上传对象时,若覆盖原对象信息,则查找所述对象信息所在的桶索引分片,并在所述桶索引分片上删除对象信息并在最大桶索引分片号对应的桶索引分片上记录所述对象信息。
22.在一些实施例中,生命周期执行单元执行生命周期线程,根据生命周期规则计算需删除的对象,遍历桶索引分片head上记录的最后上传对象时间以得到符合时间要求的桶索引分片,遍历符合时间要求的桶索引分片上记录的对象信息,以删除符合时间要求的对象。
23.在一些实施例中,生命周期执行单元遍历桶索引分片head上记录的对象个数;判断相邻的桶索引分片中记录的对象的个数之和是否小于阈值;若超过两个相邻的桶索引分片中记录的对象的个数之和小于阈值,则合并涉及的桶索引分片为一个桶索引分片、以最小桶索引分片号为新的桶索引分片号并修改后续的桶索引分片的桶索引分片号;更新新的桶索引分片的head中记录的第一个对象的修改时间和最后一个对象的修改时间,同时更新桶元数据中记录的桶索引分片数。
24.本发明实施例的再一方面,还提供了一种计算机设备,包括:至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现方法的步骤包括:创建桶并创建基于时间的桶索引分片策略;上传对象,查找最大桶索引分片号并记录对象信息,更新桶索引分片head上记录的最后上传对象时间,并在对象元数据中记录所述对象信息的桶索引分片号;以及执行生命周期线程,根据生命周期规则计算需删除的对象,以删除符合时间要求的对象。
25.本发明实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
26.本发明至少具有以下有益技术效果:
27.本发明的对象存储生命周期管理方法创建桶并创建基于时间的桶索引分片策略;上传对象,查找最大桶索引分片号并记录对象信息,更新桶索引分片head上记录的最后上传对象时间,并在对象元数据中记录所述对象信息的桶索引分片号;以及执行生命周期线程,根据生命周期规则计算需删除的对象,以删除符合时间要求的对象。该方法通过修改桶索引方式,即将一个桶索引上存储相近时间的对象的动态桶索引方案。同时在索引分片head中添加该索引上对象上传的时间范围。在生命周期线程执行时,可以精准的找到需要删除对象,减少不必要的对象遍历。同时通过动态桶分片方案限制了桶索引分片的个数,实现了更高效的对象存储生命周期方案。
附图说明
28.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以
根据这些附图获得其他的实施例。
29.图1为本发明提供的对象存储生命周期管理方法的实施例的示意图;
30.图2为本发明提供的对象存储生命周期管理装置的实施例的示意图;
31.图3为本发明提供的计算机设备的实施例的示意图;
32.图4为本发明提供的计算机可读存储介质的实施例的示意图。
具体实施方式
33.为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
34.需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
35.基于上述目的,本发明实施例的第一个方面,提出了对象存储生命周期管理方法的实施例。图1示出的是本发明提供的对象存储生命周期管理方法的实施例的示意图。如图1所示,本发明实施例的对象存储生命周期管理方法包括如下步骤:
36.001、创建桶并创建基于时间的桶索引分片策略;
37.002、上传对象,查找最大桶索引分片号并记录对象信息,更新桶索引分片head上记录的最后上传对象时间,并在对象元数据中记录所述对象信息的桶索引分片号;
38.003、执行生命周期线程,根据生命周期规则计算需删除的对象,以删除符合时间要求的对象。
39.在本实施例中,创建桶的过程中创建了基于日期也就是时间的动态桶索引分片方案。在创建的桶中上传对象时,首先要查找到可以存储该对象的桶索引分片的桶索引分片号。将该对象的上传时间记录到桶索引分片head中,将含有对象信息的桶索引分片号记录到对象元数据中。在后期执行生命周期线程时,根据生命周期规则计算出不需要的对象,根据时间查找并删除对象。
40.在本发明的一些实施例中,创建桶并创建基于时间的桶索引分片策略包括:创建桶时先创建一个桶索引分片,桶索引分片命名为桶id+分片号,桶索引分片的head中添加第一字段和第二字段,第一字段记录存储的第一个对象的修改时间,第二字段记录存储的最后一个对象的修改时间。创建桶并创建基于时间的桶索引分片策略还包括:桶索引分片号从0开始编号,桶索引分片存储阈值个对象,当桶索引分片存储的对象个数超过阈值时创建新的桶索引分片且桶索引分片号递增。
41.在本实施例中,创建桶时可以创建基于日期的桶索引分片策略,通过该策略创建的桶默认只有一个桶索引分片,分片命名方式为桶id+分片号,分片号默认从0开始,桶索引分片上head中添加两个字段,分别为分片第一个对象的修改时间和最后一个对象的修改时间,每个索引分片默认保存10万个对象记录,当索引分片上记录的对象超过10万时,创建新的索引分片,分片号依次递增。
42.在本发明的一些实施例中,上传对象,查找最大桶索引分片号并记录对象信息,更新桶索引分片head上记录的最后上传对象时间,并在对象元数据中记录所述对象信息的桶索引分片号包括:对象写元数据时,查找最大桶索引分片号,并查看其对应的桶索引分片上
记录的对象个数;若个数小于阈值,则将对象信息记录于最大桶索引分片号、更新最大桶索引分片的head上记录的后上传对象时间,并在对象元数据中记录所述对象信息的桶索引分片号;若个数等于阈值,则创建新的桶索引分片号并重复个数小于阈值的步骤。上传对象还包括:若覆盖原对象信息,则查找所述对象信息所在的桶索引分片,并在所述桶索引分片上删除对象信息并在最大桶索引分片号对应的桶索引分片上记录所述对象信息。
43.在本实施例中,对象写元数据时,查看桶当前记录的最大分片号,查看该桶索引分片上已经记录的对象个数,若少于10w个,则将该对象信息记录在该分片上,同时更新head上记录的最近上传对象时间,同时在对象元数据中记录该对象在哪个桶索引分片;若个数为10w个,则创建新的桶索引分片,同时将对象信息记录在该分片上,同时设置对象的最早对象上传时间和最新对象上传时间,并在对象元数据中记录该对象在哪个桶索引分片。若是覆盖上传情况,需要根据原对象上元数据中找到记录的原桶索引分片,在该分片上删除对象记录,同时在最新的桶索引分片上记录该对象。
44.在本发明的一些实施例中,执行生命周期线程,根据生命周期规则计算需删除的对象,以删除符合时间要求的对象包括:执行生命周期线程,根据生命周期规则计算需删除的对象,遍历桶索引分片head上记录的最后上传对象时间以得到符合时间要求的桶索引分片,遍历符合时间要求的桶索引分片上记录的对象信息,以删除符合时间要求的对象。执行生命周期线程,根据生命周期规则计算需删除的对象,以删除符合时间要求的对象还包括:遍历桶索引分片head上记录的对象个数;判断相邻的桶索引分片中记录的对象的个数之和是否小于阈值;若超过两个相邻的桶索引分片中记录的对象的个数之和小于阈值,则合并涉及的桶索引分片为一个桶索引分片、以最小桶索引分片号为新的桶索引分片号并修改后续的桶索引分片的桶索引分片号;更新新的桶索引分片的head中记录的第一个对象的修改时间和最后一个对象的修改时间,同时更新桶元数据中记录的桶索引分片数。
45.在本实施例中,生命周期线程执行时,找到设置生命周期的桶,查看桶生命周期设置的到期天数,从而计算哪个时间前上传的对象需要删除。遍历桶的索引分片,获取分片head中记录桶内对象的时间范围,从而确定该桶索引分片对象是否满足删除添加。满足条件后再遍历桶索引分片上的对象,找到具体的需要删除的对象。动态桶分片线程分片号头遍历桶索引分片中head记录的对象个数。若超过两个相邻的分片个数之和小于10w,和将这几个分片合并成一个分片。分片号为几个分片中最小的,同时更新该分片最早上传对象和最晚上传对象时间,后面的分片号同时进行修改。同时更新桶元数据中记录的桶索引分片数。
46.本领域技术人员应当理解,可以根据需要或实际情况调整阈值的设定,本技术在此不做限制。
47.基于上述目的,本发明实施例的第二个方面,提出了一种对象存储生命周期管理装置。图2示出的是本发明提供的对象存储生命周期管理装置的实施例的示意图。如图2所示,本发明实施例的对象存储生命周期管理装置包括如下部件:创建单元011,用于创建桶和桶索引分片策略;对象上传单元012,用于上传和更改对象信息;生命周期执行单元013,用于根据生命周期规则计算需删除的对象、删除符合时间要求的对象以及合并多个记录对象之和小于阈值的相邻桶索引分片。
48.在本发明的一些实施例中,创建单元011进一步配置为:创建桶时先创建一个桶索
引分片,桶索引分片命名为桶id+分片号,桶索引分片的head中添加第一字段和第二字段,第一字段记录存储的第一个对象的修改时间,第二字段记录存储的最后一个对象的修改时间。
49.在本发明的一些实施例中,对象上传单元012进一步配置为:对象写元数据时,查找最大桶索引分片号,并查看其对应的桶索引分片上记录的对象个数;若个数小于阈值,则将对象信息记录于最大桶索引分片号、更新最大桶索引分片的head上记录的后上传对象时间,并在对象元数据中记录所述对象信息的桶索引分片号;若个数等于阈值,则创建新的桶索引分片号并重复个数小于阈值的步骤。
50.在本发明的一些实施例中,生命周期执行单元013进一步配置为:执行生命周期线程,根据生命周期规则计算需删除的对象,遍历桶索引分片head上记录的最后上传对象时间以得到符合时间要求的桶索引分片,遍历符合时间要求的桶索引分片上记录的对象信息,以删除符合时间要求的对象。
51.基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备。图3示出的是本发明提供的计算机设备的实施例的示意图。如图3所示,本发明实施例的计算机设备包括如下装置:至少一个处理器021;以及存储器022,存储器022存储有可在处理器上运行的计算机指令023,指令由处理器执行时实现方法的步骤包括:创建桶并创建基于时间的桶索引分片策略;上传对象,查找最大桶索引分片号并记录对象信息,更新桶索引分片head上记录的最后上传对象时间,并在对象元数据中记录所述对象信息的桶索引分片号;以及执行生命周期线程,根据生命周期规则计算需删除的对象,以删除符合时间要求的对象。
52.本发明还提供了一种计算机可读存储介质。图4示出的是本发明提供的计算机可读存储介质的实施例的示意图。如图4所示,计算机可读存储介质031存储有被处理器执行时执行如上方法的计算机程序032。
53.最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,服务器集中测试的方法的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(rom)或随机存储记忆体(ram)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
54.此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。
55.此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
56.本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
57.在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括ram、rom、eeprom、cd-rom或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(dsl)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、d0l或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(cd)、激光盘、光盘、数字多功能盘(dvd)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
58.以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
59.应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
60.上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
61.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
62.所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1