时序化的数据处理方法、装置及系统的制作方法

文档序号:6584379阅读:262来源:国知局
专利名称:时序化的数据处理方法、装置及系统的制作方法
技术领域
本发明涉及数据存储与管理技术,尤其涉及一种时序化的数据处理方法、装置及系统。
背景技术
随着高密度海量数据存储需求的不断发展,越来越多的应用场合通过集中存储系统来实现对于各种数据的存储和访问,例如,数据备份、视频监控、视频编辑、地质勘探、数据归档应用等,而在这些数据处理的过程中,其都
具有明确的时间特征,同时具有如下特点
所述数据的存储通常是非结构化存储或近似非结构化存储,且存储过程对IO带宽要求比较高,如必须达到数十MB/s以上,数据总量比较大且是不间断产生的;而所述数据的访问通常都具有或者暗含时序性特征信息;所述数据一旦进入存储系统,再次访问的概率往往较低,但往往又不能完全离线存储,据统计,所述数据的访问频率,大部分可能低于l次/月。
在现有的集中存储系统中,数据的存储和访问通常使用如下方法根据数据被访问的特性,将数据分为3个层次,在线存储、近线存储和离线存储。上面所述数据的存储可以归类为典型的近线存储需求,但近线存储的关键点和难点是数据进入近线存储系统的判断依据,所以,近些年来围绕近线存储的一些方法和系统,基本上都是围绕热点数据进行管理,所谓热点,就是在一定的时间窗口内,对各个数据的访问频率统计,根据统计情况,将数据分别存储在在线存储系统和近线存储系统。对于上面所述数据管理的需求,则难以通过热点进行分类,主要的问题在于数据普遍的访问率低下,再次访问也是在偶然情况下发生,几乎不会出现阶段性局部数据被反复访问的情况。
发明人发现由于分级存储的所有数据都是根据访问频率进行分级的,在数据量很大,且所存储的数据不具有热点#征,则需要容量很大的在线存储系统予以支撑,而这往往会使得文件基本操作的时间较长,进而导致用户进行数据处理的时间过长,从而降低了前端应用系统的数据处理效率。

发明内容
有鉴于此,本发明要解决的技术问题是,提供一种时序化的数据处理方法、装置及系统,在进行数据处理时考虑数据之间的时序性关系,从而能够优化数据的存储和管理。
为此,本发明实施例采用如下技术方案一种时序化的数据处理方法,该方法包括
获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;单元;
通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作。
一种时序化的数据处理装置,包括
第一获取单元,用于获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;所述序列化通道对应数据类型;
确定单元,用于根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;
处理单元,用于通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作。
一种时序化的数据处理系统,包括应用终端、数据处理装置以及存储单元;其中,
应用终端,用于接收用户的数据处理请求,把该请求发送给数据处理装
置;
数据处理装置,用于接收所述应用终端发送的数据处理请求,从所述数据处理请求中获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;其中,所述序列化通道对应数据类型;根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作;
存储单元,用于存储数据,并在数据处理装置的控制下进行数据处理。对于上述技术方案的技术效果分析如下
以数据的时间信息作为数据处理的索引,并为各个不同类型的数据设置对应的序列化通道,依据数据的时间信息以及序列化通道确定数据的存储单元,进而对数据进行应用处理类型指示的处理,整个过程中,以数据的时间信息和序列化通道作为依据,考虑到了数据本身的时序性特点以及类型特点,从而数据的存储和管理。


图1为本发明实施例时序化的数据处理方法流程示意图2为本发明实施例时序化的数据写入方法流程示意图3为本发明实施例时序化的数据转移方法流程示意图4为本发明实施例数据清除方法流程示意图5为本发明实施例时序化的数据读取方法流程示意图6为本发明实施例时序化的数据删除方法流程示意图7为本发明实施例时序化的数据处理装置结构示意图8为本发明实施例另一种时序化的数据处理装置结构示意图9为本发明实施例时序化的数据处理系统结构示意图。
具体实施例方式
本发明实施例的基本思想在于,在数据处理过程中充分考虑被处理数据的时序性并结合数据类型,从而提供了一种时序化的数据处理方法、装置及系统,从而能够提高数据处理效率。
具体的,考虑到数据其生产的时序性关系和访问特点,采用一种基于时序的分级管理方式,可以有效降低在线存储系统的规^莫和成本。在新的存储系统中,采用两级存储体系, 一级存储系统用于存储最新生成的数据,二级存储系统用于存储具有某个时间阈值之前的数据,前者采用一般的、符合在线存储需求的系统,如NAS、 SAN、甚至是DSA系统,后者釆用一个或多个廉价的存储设备,并将所述存储设备形成一个逻辑闭环的存储链进行管理。
8数据存储时,首先存入一级存储系统中,同时,元数据服务器记录所存储数据的存储地址及时间特征,然后,通过一定的工程技术,当数据存储时间超过指定时间阈值后,数据从一级存储自动转移到二级存储链中,同时更新元数据服务器中的数据存储的记录,同时更新所二级存储链中,独立存储设备所关联的时间范围。当数据被访问时,根据所约定的路径规则,提取数据的时间,定位存储设备,向锁定存储设备访问相关数据。在拥有多个类似应用
的情形下,可以进一步的在二级存储链中实施序列化通道机制,即通过路
径映射,将不同应用的数据存储到约定路径之中,从而实现二级存储链在多个应用中的共享,实现多个一级存储系统对一个二级存储链。通过上述设计,
一级存储可以实现瘦身,从而达到降低成本的目的;二级存储设备在大部分时间都处于局部工作状态,可以实施休眠^u制,降^^系统的能库毛;同时,二级存储基于存储链的管理方式,可以方便实施动态扩容,管理上非常简单;通过元数据服务器提供的统一视图,可以实现POSIX兼容。
以下,结合附图详细说明本发明实施例时序化数据处理方法、装置及系统的实现。
在该方法中,将数据的存储分为一级存储和二级存储,其中,将存储时间与当前时间的时间间隔不大于预设第一时间阔值的数据进行一级存储;将存储时间与当前时间的时间间隔大于预设第 一 时间阈值的数据进行二级存储。其中,用于对数据进行一级存储的存储单元称为一级存储系统,其在具体实施时可以使用适合业务需要的存储系统作为存储环境,例如SAN、 NAS、DAS、集群文件系统、RAID、甚至是具有SSD、 IDA的存储系统;而二级存储可以使用廉价的^兹盘或者带RAID的主机作为二级存储单元。
另外,该方法还根据应用类型,为不同应用的数据设置对应的序列化通道,例如,为视频监控数据设置对应的序列化通道1,为地质勘测数据设置对应的序列化通道2等。并且,为各个序列化通道建立数据信息表,在该数据信息表中记录数据的时l可信息、数据量、状态信息等属性信息。其中,数据的时间信息可以以时间的方式实现。所述状态信息才艮据应用处理类型可以划分为转移、写入、读取、删除、正常等。当数据的状态为正常时,可以响应其他的如读取、删除、转移等应用处理,但是,当处于读取状态时,则不允许进行删除、转移等应用处理,当数据处于删除、转移等状态时类似,这里不赘述。另外,可以将所有的序列化通道对应的数据信息表统一存储,形成元数据服务系统,以便于统一管理。
其中,每个序列化通道对应一个一级存储系统,每个存储单元的具体存储量可以根据实际应用以及应用类型等确定,这里并不限制,这里限定序列化通道对应 一个一级存储系统的意在限定每个序列化通道对应不同的 一级存
储系统。所述二级存储单元为所有序列化通道共用,一^:包括多个存储单元,这时,将所述多个存储单元进行编号排序,在进行数据存储时,以存储单元的顺序依次将数据存储于所述磁盘上,在待存储数据的数据量大于当前磁盘的剩余存储空间时,将当前存储单元的下一个存储单元作为当前存储单元进行后续的存储操作,直至最后一个存储单元无法存储当前待存储数据时,转到第一个存储单元,将第一个存储单元作为当前;兹盘,如此循环。通过只对二级存储单元中当前存储单元进行处理,且依照存储单元顺序进行数据存储,从而可以使得未被使用的磁盘处于休眠状态,只在需要时才进行激活,这样,可以减少存储单元的能耗。具体的,当判断磁盘是否可以休眠时,可以根据磁盘是否被访问、最后被访问时间、当前磁盘中所存储数据的状态信息等确定,这里不再赘述。
如图1所示,为本发明时序化数据处理方法流程示意图,包括以下步骤
步骤101:获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型。
步骤102:根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元。
处理操作。
图1所示的本发明实施例,以数据的时间信息作为数据处理的索引,并为各个不同类型的数据设置对应的序列化通道,依据数据的时间信息以及序列化通道确定数据的存储单元,进而对数据进行应用处理类型指示的处理,整个过程中,以数据本身的时间信息和应用类型作为处理依据,从而可以优化数据的存储和管理。
图2为本发明时序化数据处理方法中的数据写入方法流程示意图,包括
以下步骤
步骤201:接收用户的数据写入请求。
其中,在具体实施时用户一般通过前端的应用终端进行数据的各种应用处理。
步骤202:根据数据写入请求获取所述待写入数据的时间信息以及应用处理类型。
其中,所述待写入数据的时间信息可以为接收到所述数据写入请求的时间或者所述待写入数据的生成时间等,可以在实际应用中根据应用环境设置,这里并不限制。
其中,应用处理类型包括写入、读取、删除等,在本实施例的上述步骤中,仅^l以数据写入请求为例,因此,应用处理类型为写入。
步骤203:根据所述数据写入请求的路径信息确定待写入数据所归属的序列化通道。
具体的,本步骤的实现可以包括但不局限为根据所述数据写入请求的路径信息确定待写入数据的数据类型;根据待写入数据的数据类型确定所述待写入数据所归属的序列化通道;其中, 一般不同类型的数据,其对应用户所使用的应用终端不同,而不同应用终端对应的^各径信息也不同,因此可以根据数据写入请求所属应用终端,也即根据数据写入请求的路径信息确定数据来源,进而确定待写入数据的数据类型。
步骤204: 根据时间信息以及序列化通道确定待写入数据的存储单元。
具体的,本步骤的实现可以包括但不局限为判断待写入数据的时间信息对应的时间与当前时间的时间间隔是否大于第一时间阈值,如果否,将待
写入数据存储于序列化通道对应的一级存储单元中;如果是,将待写入数据存储于二级存储单元中。
步骤205:将待写入数据存储在确定的所述存储单元中。其中,本实施例
中的所述待写入数据可以是一个文件,也可以是多个文件,这里并不限制。 其中,如果所确定的存储单元为二级存储单元时,鉴于二级存储单元中
包含多个存储磁盘,则本步骤的实现可以包括但不局限为
判断第二存储单元中的当前存储磁盘中的剩余存储空间是否大于所述待 写入数据的数据量,如果是,将待写入数据写入当前存储磁盘;否则,将当 前存储磁盘的下一个存储磁盘作为当前存储磁盘,进行所述判断操作,直到 最后 一 个存储磁盘的剩余存储空间仍不大于所述待写入数据的数据量时,循 环至第一个存储磁盘,继续进行判断。
步骤206:将待写入数据的存储路径信息更新到其存储单元对应的数据信 息表中。
其中,所述数据信息表记录各个数据的状态信息、存储路径信息以及其 他信息,如数据量等。其中, 一般以文件为个体进行记录,以便于后期的数 据读取等操作。
在图2所示的实施例中,给出了进行数据写入处理的具体方法流程,其 中,在进行数据写入时,在每个序列化通道中,根据数据的时间信息进行数 据的存储,从而因为在数据存储时考虑到了数据的时序性,所以能够4艮好的 提高数据处理效率。
当数据存储到对应的序列化通道的 一级存储单元后,且当文件的时间信 息对应的时间与当前时间的时间间隔超过时间阈值时,将发生数据从一级存 储单元到二级存储单元的数据转移过程。
所述数据转移过程如图3所示,包括以下步骤
步骤301:获取一级存储单元中数据的时间信息和状态信息。
具体的获取方式为从一级存储单元所属序列化通道所对应的数据信息 表中获取,但并不局限于此。
12步骤3 02:判断该时间信息对应的存储时间与当前时间之间的时间间隔是 否超过第一时间阈值,如果是,执行步骤303,否则,返回获取一级存储单元 中的下 一数据的时间信息。
所述数据可以以单个文件的形式作为执行对象,也即所述当前数据指的 是当前文件,所述下一数据指的是下一个文件。
步骤303:判断所述数据是否处于可转移状态,如果是,执行步骤304, 否则,返回步骤302,进行下一数据的判断。
这里,主要通过分析所述数据的状态信息,根据分析结果确定判断所述 数据是否处于正常状态,来确定所述数据是否处于可转移状态,如果所述分 析结果指示所述数据处于其他如删除、读取等状态时,则认为该数据处于不 可转移状态。
步骤304:将所述数据存储到二级存储单元中。
具体过程与上述步骤205的存储过程基本相同,这里不赘述。
步骤305:更新数据信息表中相应数据的数据信息。
其中,在进行数据从一级存储单元到二级存储单元的转移时,可以不对 一级存储单元中数据立即删除,而只是将纟皮转移数据对应的信息标记为删除, 以保证转移数据的安全。此后,需要对一级存储单元中的数据进行统一清理, 以防占用过多的存储资源。图4为一级存储单元中自主进行数据清除的方法 流程示意图,该图4中所示方法可以预先设置处理周期,在预定时间自主触 发,或者也可以预先配置触发策略,这里并不限制。其中图4所示方法包括
步骤401:获取序列化通道所对应的数据信息表。
步骤402:从所述数据信息表中查找到状态为"已经转移"的数据,并获 取查找到的数据的时间信息。
步骤403:根据所述获取到的数据的时间信息,判断所述数据时间信息对 应的时间与当前时间的间隔是否大于第二时间阈值,如果是,扭j亍步骤404; 否则,返回获取下一个数据。
13这里的所述数据一般以文件作为个体,因此,步骤403 —般为循环步骤, 间隔是否大于第二时间阚值,并进行相应处理。
步骤404:判断该数据的当前状态是否处于可清理状态,如果是,则执行 步骤405;否则,返回步骤403,获取下一个数据的数据信息。
步骤405:删除所述处于可清理状态的数据。
步骤406:更新数据信息表中相应数据的数据信息。
图5为本发明实施例数据读取方法流程示意图,如图5所示,包括
步骤501:接收用户的数据读取请求。
步骤502:根据数据读取请求获取待读取数据的时间信息、序列化通道以 及应用处理类型。
这里,与步骤203类似的,可以通过读:f又请求的5^径信息来获取序列化 通道,这里不再赘述。
步骤503:根据所述序列化通道以及时间信息确定待读取数据,并相应获 取待读取数据的状态信息以及存储路径信息。
这里,可以从前述的数据状态信息表查询到待读取数据以及所述数据的 状态信息以及存储路径信息。另外,查询到的待读取数据可能为多个文件, 这时,需要步骤504的循环执行以确定是否可以读取查询到的每个文件。
步骤504:判断所述数据的状态是否可以支持所述应用处理类型指示的处 理(即是否处于可读取状态),如果是,执行步骤505,否则,拒绝所述数 据的读取,执行步骤506。
这里,也可以通过判断所述数据的状态是否正常来完成。
步骤505:更新所述数据的状态信息为读取,并且读取所述数据后将读取 到的数据返回给用户。
其中,通过将待读取数据的状态信息更新为读取,可以防止其他如删除 等操作的执行,以免影响读取过程或者删除过程等。当读取结束后,需要将数据的状态信息修改为正常。
步骤506:向用户返回拒绝数据读取的信息。
本步骤的实现可以为通过向用户所在的客户端返回拒绝数据读取信令 等方式来通知用户所在的应用终端当前数据的拒绝读取状态,进而通过应用 终端通知用户,这里不再赘述。
图5所示的本发明实施例数据读取方法,通过应用类型确定序列化通道, 并根据时间信息确定待读取数据,进而根据状态信息确定是否可以进行数据 读取,利用所述序列化通道以及时间信息,从而提高了待读取数据的查找速 率,进而提高了数据读取效率。
图6为本发明实施例数据删除方法流程示意图,如图6所示,该数据删 除方法包括
步骤601:接收用户的数据删除请求。
步骤602:根据数据删除请求获取待删除数据的时间信息、序列化通道以 及应用处理类型。本实施中,所述应用处理类型为删除。
步骤603:根据所述序列化通道以及时间信息确定待删除数据的状态以及 存储路径信息。
步骤604:判断所述数据的当前状态是否可以支持所述应用处理类型指示 的处理(即是否处于可删除状态),如果是,执行步骤605;否则,拒绝用 户的删除操作,执行步骤606。
判断数据的当前状态是否处于可删除状态前需要确定该数据目前未被 访问、该数据目前未处于转移状态等。
步骤605:根据所述存储路径信息删除所述待删除数据;执行步骤607。
这里, 一般会存在相应的进行删除的应用程序,通过调用该应用程序删 除所述数据,具体实现方法这里不再赘述。
步骤606'.向用户返回拒绝数据删除的信息。
具体的,本步骤的实现可以为通过向用户所在的客户端返回拒绝凝:据删除信令等的方式将拒绝数据删除的信息通知用户所在的应用终端,进而通 过应用终端通知用户,这里不再赘述。
步骤607:更新数据信息表中相应数据的数据信息。
图6所示的本发明实施例中,根据数据的时间信息以及类型查找待删除 数据,从而提高了查找速率,进而提高了删除处理的处理效率。
图7为本发明实施例时序化数据处理装置结构示意图,如图7所示,该 处理装置包括
第一获取单元710,用于获取待处理数据的时间信息、所归属的序列化通 道以及应用处理类型;
确定单元720,用于根据所述第一获取单元710获取到的时间信息以及所 述序列化通道确定所述待处理数据对应的存储单元;
处理单元730,用于通过所述确定单元720确定的存储单元对所述待处理 数据进行应用处理类型指示的处理操作。
图7所示的本发明实施例数据处理装置,以数据的时间信息作为数据处 理的索引,并为各个不同类型的数据设置对应的序列化通道,依据数据的时 间信息以及序列化通道确定数据的存储单元,进而对数据进行应用处理类型 指示的处理,整个过程中,以数据的时间信息和序列化通道作为依据,从而 考虑到了数据的时序性和类型,提高了数据处理效率。
图8为数据写入时的数据处理装置结构示意图,如图8所示,该装置在 图7所示实施例的基础上还包括
第二获取单元840,用于接收用户的数据处理请求,并把所述请求发送给 第一获取单元810。
进一步地,第一获取单元810具体可以用于
从所述数据处理请求中获取待处理数据的时间信息以及应用处理类型; 从所述数据处理请求中获取待处理数据的路径信息,根据所述路径信息确定 待处理数据的类型,进而确定待处理数据所归属的序列化通道;
此时,第一获耳又单元810可以通过如图8所示的子单元完成,包括第一获取子单元8101,用于从所述数据处理请求中获取待处理数据的时
间信息以及应用处理类型;
第二获取子单元8102,用于从所述数据处理请求中获取待处理数据的路 径信息,根据所述路径信息确定待处理数据的类型,进而确定待处理数据所 归属的序列化通道。
确定单元820具体可以用于判断所述时间信息指示的时间与当前时间 之间的时间间隔是否大于第一时间阈值,如果是,确定所述待处理数据的存 储单元为第二存储单元;否则,确定所述待处理数据的存储单元为序列化通 道对应的第一存储单元。
所述处理单元830可以具体用于通过所述第二存^f诸单元或者所述序列 化通道对应的第一存储单元对所述待处理数据进行应用处理类型指示的处理 操作。此时,处理单元830可以包括
第一处理子单元8301,用于通过所述序列化通道对应的第一存储单元对 所述待处理数据进行应用处理类型指示的处理操作;或者,
第二处理子单元8302,用于通过所述第二存储单元对所述待处理数据进 行应用处理类型指示的处理操作。
另外,第二处理子单元8302还可以具体用于判断第二存储单元中的当 前存储磁盘中剩余存储空间是否大于所述待写入数据的数据量,如果是,将 待写入数据写入当前存储磁盘;否则,将当前存储磁盘的下一个存储磁盘作 为当前存储磁盘,进行所述判断操作,直到最后一个存储磁盘的剩余存储空 间仍不大于所述待写入数据的数据量时,循环至第一个存储磁盘。
当应用处理类型为读取或删除时的数据处理装置结构与图8所示的结构 相同,其与图8所示装置的区别在于
确定单元820具体可以用于才艮据时间信息查找所述序列化通道对应的 数据信息表,将查找得到的数据作为待处理数据,从所述数据信息表中获取 所述待处理数据的存储路径信息。
另外,确定单元820还可以用于从所述数据信息表中获取所述待读取数据的状态信息,并根据状态信息判断各待读取数据是否处于可处理状态, 如果是,控制处理单元830执行所述处理操作。
图8所示的数据处理装置,在进行数据处理时,以数据的时间信息以及 所归属的序列化通道为依据,从而提高了数据处理效率。
图9所示为本发明实施例时序化的数据处理系统,如图9所示,包括
应用终端910、数据处理装置920以及存储单元930,所述存储单元930 包括第一存储单元和第二存储单元;其中,
应用终端910,用于接收用户的数据处理请求,并把该请求发送给数据处 理装置920;
数据处理装置920,用于接收数据处理请求,获取待处理数据的时间信息、 所归属的序列化通道以及应用处理类型;所述数据处理装置920获取到的序 列化通道对应应用类型;才艮据所述时间信息以及所述序列化通道确定所述待 处理数据对应的存储单元;通过所述存储单元对所述待处理数据进行应用处 理类型指示的处理操作;
存储单元930,用于存储数据,并在数据处理装置的控制下进行数据处理。
其中,所述系统还包括元数据库940,用于存储数据信息,其中所述元 数据库940存储的数据信息包括数据的时间信息、所归属的序列化通道以 及状态信息。
所述元数据库940可以设置于数据处理装置之外的设备中,例如建立与 数据处理装置连接的元数据库服务器等;或者,所述元数据库940也可以设 置于数据处理装置中,这里并不限制,只要数据处理装置可以获取数据信息 即可。
本领域普通技术人员可以理解,实现上述实施例方法的过程可以通过程 序指令相关的硬件来完成,所述的程序可以存储于可读取存储介质中,该程
序在执行时执行上述方法中的对应步骤。
18以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普 通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润 饰,这些改进和润饰也应视为本发明的保护范围。
权利要求
1、一种时序化的数据处理方法,其特征在于,该方法包括获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作。
2、 根据权利要求1所述的方法,其特征在于,所述获取步骤之前还包括 接收用户的数据处理请求。
3、 根据权利要求2所述的方法,其特征在于,通过以下方式获取待处理 数据的时间信息、所归属的序列化通道从所述数据处理请求中获取待处理数据的时间信息;从所述数据处理请 求中获取待处理数据的路径信息,根据所述路径信息确定待处理数据的类型, 进而确定待处理数据所归属的序列化通道。
4、 根据权利要求3所述的方法,其特征在于,所述应用处理类型为写入 时,通过以下方式确定所述待处理数据的存储单元判断所述时间信息指示的时间与当前时间之间的时间间隔是否大于第一 时间阈值,如果是,确定所述待处理数据的存储单元为第二存储单元;否则, 确定所述待处理数据的存储单元为序列化通道对应的第 一存储单元。
5、 根据权利要求4所述的方法,其特征在于,所述通过所述存储单元对 所述待处理数据进^ff应用处理类型指示的处理操作包括通过所述第二存储单元或者所述序列化通道对应的第一存储单元对所述 待处理数据进行应用处理类型指示的处理操作。
6、 根据权利要求5所述的方法,其特征在于,当所述应用处理类型为写 入时,将待写入数据写入确定的所述第二存储单元通过以下步骤实现判断第二存储单元中当前存储》兹盘中的剩余存储空间是否大于所述待写 入数据的数据量,如果是,将待写入数据写入当前存储磁盘;否则,将当前 存储磁盘的下一个存储磁盘作为当前存储磁盘,进行所述判断操作,直到最 后一个存储磁盘的剩余存储空间仍不大于所述待写入数据的数据量时,循环 至第一个存储磁盘。
7、 根据权利要求3所述的方法,其特征在于,所述应用处理类型为读取或删除时,通过以下方式确定所述待处理数据的存储单元根据时间信息查找所述序列化通道对应的数据信息表,将从所述数据信息表中查找得到的对应数据作为待处理数据,并获取所述待处理数据的存储路径信息。
8、 根据权利要求7所述的方法,其特征在于,还包括从所述数据信息表中获取所述待处理数据的状态信息,并根据状态信息判断各待处理数据是否处于可处理状态,如果是,执行所述进行应用处理类型指示的处理操:作的步骤。
9、 一种时序化的数据处理装置,其特征在于,包括第一获取单元,用于获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;所述序列化通道对应数据类型;确定单元,用于根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;处理单元,用于通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作。
10、 根据权利要求9所述的装置,其特征在于,还包括第二获取单元,用于接收用户的数据处理请求,把所述请求发送给第一获取单元。
11、 根据权利要求IO所述的装置,其特征在于,第一获取单元具体用于从所述数据处理请求中获取待处理数据的时间信息以及应用处理类型;从所述数据处理请求中获取待处理数据的路径信息,才艮据所述路径信息确定待处理数据的类型,进而确定待处理数据所归属的序列化通道。
12、 根据权利要求11所述的装置,其特征在于,所述应用处理类型为写入时,确定单元具体用于判断所述时间信息指示的时间与当前时间之间的时间间隔是否大于第一时间阈值,如果是,确定所述待处理数据的存储单元为第二存储单元;否贝'J,确定所述待处理数据的存储单元为序列化通道对应的第 一存储单元。
13、 根据权利要求12所述的装置,其特征在于,处理单元包括第 一处理子单元,用于通过所述序列化通道对应的第 一存储单元对所述待处理数据进行应用处理类型指示的处理操作;或者,第二处理子单元,用于通过所述第二存储单元对所述待处理数据进行应用处理类型指示的处理:捧作。
14、 根据权利要求13所述的装置,其特征在于,第二处理子单元具体用于判断第二存储单元中的当前存储磁盘中剩余存储空间是否大于所述待写入数据的数据量,如果是,将待写入数据写入当前存储磁盘;否则,将当前存储磁盘的下一个存储磁盘作为当前存储磁盘,进行所述判断操作,直到最后 一 个存储磁盘的剩余存储空间仍不大于所述待写入数据的数据量时,循环至第一个存储^磁盘。
15、 根据权利要求11所述的装置,其特征在于,所述应用处理类型为读取或删除时,确定单元具体用于根据时间信息查找所述序列化通道对应的数据信息表,将查找得到的数据作为待处理数据,从所述数据信息表中获取所述待处理数据的存储路径信自
16、 根据权利要求15所述的装置,其特征在于,确定单元还用于从所述数据信息表中获取所述待处理数据的状态信息,并根据状态信息判断各待处理数据是否处于可处理状态,如果是,控制处理单元执行所述处理操作。
17、 一种时序化的数据处理系统,其特征在于,包括应用终端、数据处理装置以及存储单元;其中,应用终端,用于接收用户的数据处理请求,把该请求发送给数据处理装置;数据处理装置,用于接收所述应用终端发送的数据处理请求,从所述数据处理请求中获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;其中,所述序列化通道对应数据类型;根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作;存储单元,用于存储数据,并在数据处理装置的控制下进行数据处理。
18、根据权利要求17所述的系统,其特征在于,还包括元数据库,用于存储数据信息,所述数据信息包括数据的时间信息、所归属的序列化通道以及状态信息。
全文摘要
本发明公开了一种时序化数据处理方法、装置及系统,所述方法包括获取待处理数据的时间信息、所归属的序列化通道以及应用处理类型;所述序列化通道对应应用类型;根据所述时间信息以及所述序列化通道确定所述待处理数据对应的存储单元;通过所述存储单元对所述待处理数据进行应用处理类型指示的处理操作。所述方法、装置及系统能够优化数据的存储和管理。
文档编号G06F3/06GK101673192SQ200910235460
公开日2010年3月17日 申请日期2009年10月26日 优先权日2009年10月26日
发明者杨耀敏, 蒋建平 申请人:北京世纪互联宽带数据中心有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1