一种对移动终端中的数据进行分级处理的方法及系统与流程

文档序号:16087867发布日期:2018-11-27 22:39阅读:128来源:国知局

本发明涉及数据处理领域,并且更具体地,涉及一种对移动终端中的数据进行分级处理的方法及系统。



背景技术:

目前,随着诸如手机的移动终端越来越得到广泛的应用,移动终端的处理器、存储器、摄像头等器件的改进幅度非常大。然而,随着用户对于各种应用的运行速度、图像等的要求越来越高,应用所占用的处理资源或存储资源也越来越多。为此,在对诸如处理器、存储器、摄像头等器件进行改进的同时,还需要对移动终端中的数据的存取性能进行改进以提升移动终端的数据处理能力。



技术实现要素:

根据本发明的一个方面,提供一种对移动终端中的数据进行分级处理的方法,所述方法包括:

接收针对于所述移动终端内第一存储器中存储的目标数据组的获取请求;

基于所述获取请求,确定所述目标数据组在所述第一存储器内多个压缩数据段中所位于的当前压缩数据段并且确定所述目标数据组在所述当前压缩数据段内多个压缩数据区中所位于的当前压缩数据区;

基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组;

扫描所述当前压缩数据段内所有的压缩数据区,将所述当前压缩数据区标记为第一解压级,确定所述当前压缩数据段内除所述当前压缩数据区之外的并且具有关联数据组的至少一个关联压缩数据区,将所述当前压缩数据段的至少一个关联压缩数据区内高压缩率或中压缩率的子区域标记为第二解压级,将所述当前压缩数据段的至少一个关联压缩数据区内低压缩率的子区域标记为第三解压级,其中高压缩率、中压缩率和低压缩率的压缩程度依次升高;其中第一解压级、第二解压级和第三解压级的解压次序依次降低;

在所述当前压缩数据段内按照解压级进行解压缩:在对标记为第一解压级的所述当前压缩数据区进行解压缩后,对至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩,然后对至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩;

在所述当前压缩数据段内按照解压级进行解压缩的同时,确定多个压缩数据段中除所述当前压缩数据段之外并且具有关联数据组的至少一个关联压缩数据段,其中每个关联压缩数据段内的至少一个关联压缩数据区存储了关联数据组;

将每个关联压缩数据段的至少一个关联压缩数据区内的高压缩率的子区域标记为第二解压级,并且将每个关联压缩数据段的至少一个关联压缩数据区内的中压缩率或低压缩率的子区域标记为第三解压级;以及

响应于所述当前压缩数据段内的解压缩的完成,在所述至少一个关联压缩数据段内按照解压级进行解压缩:首先对每个关联压缩数据段内的至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩,然后对每个关联压缩数据段内的至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩。

当所述移动终端的处理器或控制器需要使用在第一存储器中存储的目标数据组时,发送针对于所述移动终端内第一存储器中存储的目标数据组的获取请求。

在检测到所述移动终端内的操作系统被加载到所述第一存储器中并且所述操作系统启动完成时,根据预先设置的加载配置文件确定所述移动终端的待加载的多个应用,将与所述待加载的多个应用中每个应用相关联的文件包从第二存储器复制到所述第一存储器中。

所述第一存储器为易失性存储器,并且所述第二存储器为非易失性存储器。

在所述操作系统启动完成之后并且在根据预先设置的加载配置文件确定所述移动终端的待加载的多个应用之前,在所述第一存储器中创建用于存储压缩数据的多个压缩数据段,其中每个压缩数据段包括多个压缩数据区,并且每个压缩数据区包括多个子区域。

其中与每个应用相关联的文件包包括经过压缩的至少一个数据组,并且在所述第一存储器中,使用数据组作为对数据进行压缩存储时的基本存储单元。

其中与每个应用相关联的文件包包括经过压缩的至少一个数据组,并且在所述第二存储器中,使用文件包作为对数据进行压缩存储时的基本存储单元。

其中经过压缩的单个数据组被存储在压缩数据段的单个压缩数据区中,并且单个压缩数据区中能够存储至少一个经过压缩的数据组。

所述获取请求包括需要获取的目标数据组的标识符;

基于所述获取请求,确定所述目标数据组在所述第一存储器内多个压缩数据段中所位于的当前压缩数据段并且确定所述目标数据组在所述当前压缩数据段内多个压缩数据区中所位于的当前压缩数据区包括:

对所述获取请求进行解析以确定目标数据组的标识符;

根据所述目标数据组的标识符对所述第一存储器中的数据段索引信息表进行查询,根据查询结果确定所述目标数据组在所述第一存储器内多个压缩数据段中所位于的当前压缩数据段;

根据所述目标数据组的标识符对所述当前压缩数据段的目录区域内的数据区索引信息表进行查询,根据查询结果确定所述目标数据组在当前压缩数据段内多个压缩数据区中所位于的当前压缩数据区。

在根据预先设置的加载配置文件确定所述移动终端的待加载的多个应用之后,将关联统计文件从第二存储器复制到第一存储器中,所述关联统计文件包括多条关联统计信息,其中每条关联统计信息用于指示每个数据组的多个关联数据组。

还包括确定多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度,基于内容关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中将任意的两个数据组的摘要信息进行内容匹配的匹配值来确定所述任意的两个数据组之间的内容关联度。

所述预先设置的选择规则包括:排序列表中内容关联度大于关联度阈值的多个数据组,或者排序列表中内容关联度排名在预定名次之前的多个数据组。

还包括确定多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度,基于运行关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度。

所述预先设置的选择规则包括:排序列表中运行关联度大于关联度阈值的多个数据组,或者排序列表中运行关联度排名在预定名次之前的多个数据组。

还包括确定多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度,基于反馈关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

所述预先设置的选择规则包括:排序列表中反馈关联度大于关联度阈值的多个数据组,或者排序列表中反馈关联度排名在预定名次之前的多个数据组。

还包括确定多个数据组中除当前数据组之外的每个数据组与当前数据组的综合关联度,基于综合关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中将任意两个数据组的摘要信息进行内容匹配来确定所述任意两个数据组之间的内容关联度;

其中获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度;

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和运行关联度进行加权计算以确定综合关联度。

所述预先设置的选择规则包括:排序列表中综合关联度大于关联度阈值的多个数据组,或者排序列表中综合关联度排名在预定名次之前的多个数据组。

还包括确定多个数据组中除当前数据组之外的每个数据组与当前数据组的综合关联度,基于综合关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中将任意两个数据组的摘要信息进行内容匹配来确定所述任意两个数据组之间的内容关联度;

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和反馈关联度进行加权计算以确定综合关联度。

所述预先设置的选择规则包括:排序列表中综合关联度大于关联度阈值的多个数据组,或者排序列表中综合关联度排名在预定名次之前的多个数据组。

还包括确定多个数据组中除当前数据组之外的每个数据组与当前数据组的综合关联度,基于综合关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度;

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度和反馈关联度进行加权计算以确定综合关联度。

所述预先设置的选择规则包括:排序列表中综合关联度大于关联度阈值的多个数据组,或者排序列表中综合关联度排名在预定名次之前的多个数据组。

还包括确定多个数据组中除当前数据组之外的每个数据组与当前数据组的综合关联度,基于综合关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中将任意两个数据组的摘要信息进行内容匹配来确定所述任意两个数据组之间的内容关联度;

其中获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度;

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度、运行关联度和反馈关联度进行加权计算以确定综合关联度。

所述预先设置的选择规则包括:排序列表中综合关联度大于关联度阈值的多个数据组,或者排序列表中综合关联度排名在预定名次之前的多个数据组。

还包括基于所述多个关联数据组中每个关联数据组在进行关联运行时与目标数据组的关联运行次数、关联运行时间和同步启动次数,在所述关联统计信息中为每个关联数据组设置关联等级,所述关联等级包括:强关联和弱关联。

还包括获取每个数据组的运行历史信息,根据运行历史信息确定每个关联数据组在进行关联运行时与目标数据组的关联运行次数、关联运行时间和同步启动次数。

其中关联运行次数是在统计时间段内,两个数据组进行关联运行的次数;

其中关联运行时间是在统计时间段内,两个数据组进行关联运行的时间长度;

其中同步启动次数是在统计时间段内,两个数据组进行同步启动的次数;

其中关联运行是指两个数据组各自被调用或开始运行的时间的差值大于第一预定时间间隔并且小于第二预定时间间隔;

其中同步启动是指两个数据组各自被调用或开始运行的时间的差值小于或等于第一预定时间间隔。

基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组包括:

基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的并且关联等级为强关联的多个关联数据组。

基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组包括:

基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的并且关联等级为弱关联的多个关联数据组。

每个关联压缩数据区中具有至少一个关联数据组。

其中,根据压缩配置文件为压缩数据区中的每个子区域指定区域压缩率,其中所述区域压缩率包括高压缩率、中压缩率或低压缩率;

利用所指定的区域压缩率对每个子区域中存储的数据组进行压缩。

所述压缩配置文件包括多个压缩信息表,其中每个压缩信息表与多个压缩数据段中的一个压缩数据段相关联并且包括用于记录相关联的压缩数据段内每个压缩数据区的压缩信息的多个区域子表;

每个区域子表用于记录压缩数据区内多个子区域中每个子区域的区域压缩率。

其中高压缩率为90%、中压缩率为80%以及低压缩率为70%(实际上是压缩率的范围)。

其中在对当前压缩数据段的至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩包括:从低地址向高地址方向或从高地址向低地址方向对多个子区域解压缩。

其中在对当前压缩数据段的至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩包括:从低地址向高地址方向或从高地址向低地址方向对多个子区域解压缩。

将对当前数据段的所述当前压缩数据区进行解压缩所产生的数据存储在所述第一存储器的第一数据区中;以及

将对当前数据段的至少一个关联压缩数据区内的子区域进行解压缩所产生的数据存储在所述第一存储器的第二数据区中。

将具有至少一个关联数据组的压缩数据段选择作为关联压缩数据段,并且将关联压缩数据段内具有至少一个关联数据组的压缩数据区确定为关联压缩数据区。

将对每个关联压缩数据段内的至少一个关联压缩数据区内的子区域进行解压缩所产生的数据存储在所述第一存储器的第二数据区中。

在所述至少一个关联压缩数据段内按照解压级进行解压缩之前还包括,将每个关联压缩数据段内不具有关联数据组的非关联压缩数据区标记为不可读区域,并且在所述至少一个关联压缩数据段内按照解压级进行解压缩时,对标记为不可读区域的非关联压缩数据区不进行任何处理。

在所述当前压缩数据段内按照解压级进行解压缩之前还包括,将所述当前压缩数据段内不具有目标数据组或关联数据组的非关联压缩数据区标记为不可读区域,并且在所述当前压缩数据段内按照解压级进行解压缩时,对标记为不可读区域的非关联压缩数据区不进行任何处理。

根据本发明的另一个方面,提供一种对移动终端中的数据进行分级处理的系统,所述系统包括:

接收单元,接收针对于所述移动终端内第一存储器中存储的目标数据组的获取请求;

第一检索单元,基于所述获取请求,确定所述目标数据组在所述第一存储器内多个压缩数据段中所位于的当前压缩数据段并且确定所述目标数据组在所述当前压缩数据段内多个压缩数据区中所位于的当前压缩数据区;

关联单元,基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组;

第一扫描单元,扫描所述当前压缩数据段内所有的压缩数据区,将所述当前压缩数据区标记为第一解压级,确定所述当前压缩数据段内除所述当前压缩数据区之外的并且具有关联数据组的至少一个关联压缩数据区,将所述当前压缩数据段的至少一个关联压缩数据区内高压缩率或中压缩率的子区域标记为第二解压级,将所述当前压缩数据段的至少一个关联压缩数据区内低压缩率的子区域标记为第三解压级,其中高压缩率、中压缩率和低压缩率的压缩程度依次升高;其中第一解压级、第二解压级和第三解压级的解压次序依次降低;

第一解压单元,在所述当前压缩数据段内按照解压级进行解压缩:在对标记为第一解压级的所述当前压缩数据区进行解压缩后,对至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩,然后对至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩;

第二检索单元,在所述当前压缩数据段内按照解压级进行解压缩的同时,确定多个压缩数据段中除所述当前压缩数据段之外并且具有关联数据组的至少一个关联压缩数据段,其中每个关联压缩数据段内的至少一个关联压缩数据区存储了关联数据组;

第二扫描单元,将每个关联压缩数据段的至少一个关联压缩数据区内的高压缩率的子区域标记为第二解压级,并且将每个关联压缩数据段的至少一个关联压缩数据区内的中压缩率或低压缩率的子区域标记为第三解压级;以及

第二解压单元,响应于所述当前压缩数据段内的解压缩的完成,在所述至少一个关联压缩数据段内按照解压级进行解压缩:首先对每个关联压缩数据段内的至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩,然后对每个关联压缩数据段内的至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩。

当所述移动终端的处理器或控制器需要使用在第一存储器中存储的目标数据组时,所述处理器或控制器发送针对于所述移动终端内第一存储器中存储的目标数据组的获取请求。

还包括加载单元,在检测到所述移动终端内的操作系统被加载到所述第一存储器中并且所述操作系统启动完成时,根据预先设置的加载配置文件确定所述移动终端的待加载的多个应用,将与所述待加载的多个应用中每个应用相关联的文件包从第二存储器复制到所述第一存储器中。

所述第一存储器为易失性存储器,并且所述第二存储器为非易失性存储器。

还包括初始化单元,在所述操作系统启动完成之后并且在根据预先设置的加载配置文件确定所述移动终端的待加载的多个应用之前,在所述第一存储器中创建用于存储压缩数据的多个压缩数据段,其中每个压缩数据段包括多个压缩数据区,并且每个压缩数据区包括多个子区域。

其中与每个应用相关联的文件包包括经过压缩的至少一个数据组,并且在所述第一存储器中,使用数据组作为对数据进行压缩存储时的基本存储单元。

其中与每个应用相关联的文件包包括经过压缩的至少一个数据组,并且在所述第二存储器中,使用文件包作为对数据进行压缩存储时的基本存储单元。

其中经过压缩的单个数据组被存储在压缩数据段的单个压缩数据区中,并且单个压缩数据区中能够存储至少一个经过压缩的数据组。

所述获取请求包括需要获取的目标数据组的标识符;

所述第一检索单元包括:

解析单元,对所述获取请求进行解析以确定目标数据组的标识符;

查询单元,根据所述目标数据组的标识符对所述第一存储器中的数据段索引信息表进行查询,根据查询结果确定所述目标数据组在所述第一存储器内多个压缩数据段中所位于的当前压缩数据段;

确定单元,根据所述目标数据组的标识符对所述当前压缩数据段的目录区域内的数据区索引信息表进行查询,根据查询结果确定所述目标数据组在当前压缩数据段内多个压缩数据区中所位于的当前压缩数据区。

在根据预先设置的加载配置文件确定所述移动终端的待加载的多个应用之后,将关联统计文件从第二存储器复制到第一存储器中,所述关联统计文件包括多条关联统计信息,其中每条关联统计信息用于指示每个数据组的多个关联数据组。

还包括处理单元,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度,基于内容关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中将任意的两个数据组的摘要信息进行内容匹配的匹配值来确定所述任意的两个数据组之间的内容关联度。

所述预先设置的选择规则包括:排序列表中内容关联度大于关联度阈值的多个数据组,或者排序列表中内容关联度排名在预定名次之前的多个数据组。

还包括处理单元,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度,基于运行关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度。

所述预先设置的选择规则包括:排序列表中运行关联度大于关联度阈值的多个数据组,或者排序列表中运行关联度排名在预定名次之前的多个数据组。

还包括处理单元,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度,基于反馈关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

所述预先设置的选择规则包括:排序列表中反馈关联度大于关联度阈值的多个数据组,或者排序列表中反馈关联度排名在预定名次之前的多个数据组。

还包括处理单元,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的综合关联度,基于综合关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中将任意两个数据组的摘要信息进行内容匹配来确定所述任意两个数据组之间的内容关联度;

其中获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度;

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和运行关联度进行加权计算以确定综合关联度。

所述预先设置的选择规则包括:排序列表中综合关联度大于关联度阈值的多个数据组,或者排序列表中综合关联度排名在预定名次之前的多个数据组。

还包括处理单元,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的综合关联度,基于综合关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中将任意两个数据组的摘要信息进行内容匹配来确定所述任意两个数据组之间的内容关联度;

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和反馈关联度进行加权计算以确定综合关联度。

所述预先设置的选择规则包括:排序列表中综合关联度大于关联度阈值的多个数据组,或者排序列表中综合关联度排名在预定名次之前的多个数据组。

还包括处理单元,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的综合关联度,基于综合关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度;

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度和反馈关联度进行加权计算以确定综合关联度。

所述预先设置的选择规则包括:排序列表中综合关联度大于关联度阈值的多个数据组,或者排序列表中综合关联度排名在预定名次之前的多个数据组。

还包括处理单元,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的综合关联度,基于综合关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组;

其中将任意两个数据组的摘要信息进行内容匹配来确定所述任意两个数据组之间的内容关联度;

其中获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度;

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度、运行关联度和反馈关联度进行加权计算以确定综合关联度。

所述预先设置的选择规则包括:排序列表中综合关联度大于关联度阈值的多个数据组,或者排序列表中综合关联度排名在预定名次之前的多个数据组。

还包括设置单元,基于所述多个关联数据组中每个关联数据组在进行关联运行时与目标数据组的关联运行次数、关联运行时间和同步启动次数,在所述关联统计信息中为每个关联数据组设置关联等级,所述关联等级包括:强关联和弱关联。

设置单元获取每个数据组的运行历史信息,根据运行历史信息确定每个关联数据组在进行关联运行时与目标数据组的关联运行次数、关联运行时间和同步启动次数。

其中关联运行次数是在统计时间段内,两个数据组进行关联运行的次数;

其中关联运行时间是在统计时间段内,两个数据组进行关联运行的时间长度;

其中同步启动次数是在统计时间段内,两个数据组进行同步启动的次数;

其中关联运行是指两个数据组各自被调用或开始运行的时间的差值大于第一预定时间间隔并且小于第二预定时间间隔;

其中同步启动是指两个数据组各自被调用或开始运行的时间的差值小于或等于第一预定时间间隔。

其中关联单元基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组包括:

关联单元基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的并且关联等级为强关联的多个关联数据组。

关联单元基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组包括:

关联单元基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的并且关联等级为弱关联的多个关联数据组。

每个关联压缩数据区中具有至少一个关联数据组。

还包括分配单元,根据压缩配置文件为压缩数据区中的每个子区域指定区域压缩率,其中所述区域压缩率包括高压缩率、中压缩率或低压缩率;

利用所指定的区域压缩率对每个子区域中存储的数据组进行压缩。

所述压缩配置文件包括多个压缩信息表,其中每个压缩信息表与多个压缩数据段中的一个压缩数据段相关联并且包括用于记录相关联的压缩数据段内每个压缩数据区的压缩信息的多个区域子表;

每个区域子表用于记录压缩数据区内多个子区域中每个子区域的区域压缩率。

其中高压缩率为90%、中压缩率为80%以及低压缩率为70%(实际上是压缩率的范围)。

其中在对当前压缩数据段的至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩包括:从低地址向高地址方向或从高地址向低地址方向对多个子区域解压缩。

其中在对当前压缩数据段的至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩包括:从低地址向高地址方向或从高地址向低地址方向对多个子区域解压缩。

将对当前数据段的所述当前压缩数据区进行解压缩所产生的数据存储在所述第一存储器的第一数据区中;以及

将对当前数据段的至少一个关联压缩数据区内的子区域进行解压缩所产生的数据存储在所述第一存储器的第二数据区中。

将具有至少一个关联数据组的压缩数据段选择作为关联压缩数据段,并且将关联压缩数据段内具有至少一个关联数据组的压缩数据区确定为关联压缩数据区。

将对每个关联压缩数据段内的至少一个关联压缩数据区内的子区域进行解压缩所产生的数据存储在所述第一存储器的第二数据区中。

在第二解压单元对所述至少一个关联压缩数据段内按照解压级进行解压缩之前还包括,将每个关联压缩数据段内不具有关联数据组的非关联压缩数据区标记为不可读区域,并且在所述至少一个关联压缩数据段内按照解压级进行解压缩时,对标记为不可读区域的非关联压缩数据区不进行任何处理。

在第一解压单元所述当前压缩数据段内按照解压级进行解压缩之前还包括,将所述当前压缩数据段内不具有目标数据组或关联数据组的非关联压缩数据区标记为不可读区域,并且在所述当前压缩数据段内按照解压级进行解压缩时,对标记为不可读区域的非关联压缩数据区不进行任何处理。

附图说明

通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:

图1为根据本发明实施方式的对数据进行分级处理的方法的流程图;

图2为根据本发明实施方式的存储设备的逻辑结构的示意图;

图3为根据本发明实施方式的压缩数据段的逻辑结构的示意图;

图4为根据本发明实施方式的确定目标数据组的存储位置的方法的流程图;

图5为根据本发明实施方式的用于确定关联数据组的方法的流程图;

图6为根据本发明另一实施方式的用于确定关联数据组的方法的流程图;

图7为根据本发明再一实施方式的用于确定关联数据组的方法的流程图;

图8为根据本发明又一实施方式的用于确定关联数据组的方法的流程图;

图9为根据本发明实施方式的对数据进行分级处理的系统的结构示意图;以及

图10为根据本发明实施方式的第一检索单元的结构示意图。

具体实施方式

图1为根据本发明实施方式的对数据进行分级处理的方法100的流程图。如图1所示,方法100从步骤101处开始。

在步骤101,接收针对于所述移动终端内第一存储器中存储的目标数据组的获取请求。通常,当移动终端的处理器、控制器、通信接口等器件需要使用在第一存储器中存储的目标数据组时,发送针对于移动终端内第一存储器中存储的目标数据组的获取请求。当移动终端根据用户请求进行数据处理、数据存储、数据计算等操作时,通常会需要读取多个数据组。数据组通常存储在第一存储器和第二存储器中,并且在需要时被移动终端内的器件所读取并使用。通常,本发明将处理器、控制器、通信接口等器件所需要使用的数据组称为目标数据组。

在检测到移动终端内的操作系统被加载到第一存储器中并且操作系统启动完成时,根据预先设置的加载配置文件确定所述移动终端的待加载的多个应用。随后,将与所述待加载的多个应用中每个应用相关联的文件包从第二存储器复制到所述第一存储器中。其中,第一存储器为易失性存储器,例如随机存取存储器RAM,内存,并且所述第二存储器为非易失性存储器,例如闪速存储器。当移动终端关机时,操作系统被存储在第二存储器中,并且当移动终端启动运行时,将操作系统从第二存储器加载到第一存储器中。加载配置文件可以是移动终端出厂时预先设置的,或者可以是由移动终端的用户所预先设置的。其中,加载配置文件中可以记载移动终端内多个应用中能够在操作系统启动时自动启动的一个或多个应用。通常,每个应用均具有相关联的文件包或至少一个文件包,并且每个文件包中可以包括多个文件子包,即通过层级方式来构建每个应用的文件结构。

在移动终端的操作系统启动完成(这里是指操作系统的系统服务、系统应用、资源管理、网络初始化等启动完成,而用户应用并未加载的时候)之后并且在根据预先设置的加载配置文件确定移动终端的待加载的多个应用之前,在第一存储器中创建用于存储压缩数据的多个压缩数据段,如图2所示。图2为根据本发明实施方式的存储设备200的逻辑结构的示意图。在图2中,存储设备200(例如,第一存储器)包括:引导区201、第一数据区202、第二数据区203、压缩存储区204和保留存储区205。其中引导区201用于存储与操作系统的启动相关联的系统文件以及用于指示存储设备200内的存储目录信息的目录文件。第一数据区202和第二数据区203具有多个数据段并且均用于存储未经压缩的数据组,或经过解压缩的数据组。通常,第一数据区202和第二数据区203中存储的数据组是能够被处理器、控制器、通信接口等器件直接读取、获取、访问、处理或计算的数据集合。

压缩存储区204用于存储经过压缩的数据组。应当了解的是,在第二存储器中,与每个应用相关联的数据文件通常是按照压缩文件的方式进行存储。通常,单个数据文件可以包括至少一个数据组。因此,在第二存储器中,数据组或数据文件均是以压缩的数据文件或压缩的数据组形式进行存储的。在第二存储器中,通常以压缩的数据文件为单位进行存储,并且当压缩的数据文件被加载到第一存储器中时,会将压缩的数据文件进行拆分(通常,数据文件包括至少一个数据组)以生成多个经过压缩的数据组。应当了解的是,在第二存储器中,多媒体文件,例如图片、视频、音频、文档等,可以按照压缩的形式或非压缩的形式进行存储。保留存储区205包括多个数据段和多个压缩数据段,并且用于存储备份文件、或用于存储系统预留资源、或用于存储应急文件、或用于移动终端进行应急存储时的存储区域。

压缩存储区204包括用于存储压缩数据的多个压缩数据段,例如,压缩数据段204-1、压缩数据段204-2、压缩数据段204-3、压缩数据段204-5、......等。图2中将压缩数据段204-1、压缩数据段204-2、压缩数据段204-3以及压缩数据段204-5的存储空间(或容量)设置为不同,但是应当了解的是,每个压缩数据段的存储空间(或容量)可以相同或不同,或部分相同。

多个压缩数据段中的每个压缩数据段包括多个压缩数据区,并且每个压缩数据区包括多个子区域,如图3所示。图3为根据本发明实施方式的压缩数据段300的逻辑结构的示意图。在图3中,压缩数据段300包括:压缩数据区301、压缩数据区302、压缩数据区303、......等。压缩数据区301包括:低压缩率的子区域301-1、高压缩率的子区域301-2、中压缩率的子区域301-3、......;压缩数据区302包括:低压缩率的子区域302-1、中压缩率的子区域302-2、中压缩率的子区域302-3、......;压缩数据区303包括:低压缩率的子区域303-1、高压缩率的子区域303-2、......。

每个压缩数据区以及每个子区域的存储空间(或容量)可以相同或不同,或部分相同。此外,相同或不同存储区域内的每个子区域的压缩率可以相同或不同,并且每个子区域的压缩率可以是高压缩率、中压缩率或低压缩率。例如,高压缩率为90%、中压缩率为80%以及低压缩率为70%。可替换地,高压缩率为压缩率89%-99%、中压缩率为压缩率79%-89%(不含89%)以及低压缩率为压缩率小于79%。可替换地,高压缩率为压缩率85%-100%(不含100%)、中压缩率为压缩率70%-85%(不含85%)以及低压缩率为压缩率小于70%。上述数值仅是示意性的,所属领域技术人员应当了解,压缩率的取值或取值范围可以是任何合理数值。

其中与每个应用相关联的文件包包括经过压缩的至少一个数据组,并且在第一存储器中,使用数据组(经过压缩的数据组)作为对数据进行压缩存储时的基本存储单元。或者,在第一存储器中,使用数据组(未经压缩的数据组)作为对数据进行存储时的基本存储单元。也就是说,在第一存储器中,每个应用均以多个经过压缩的数据组或未经压缩的数据组的形式进行存储。

与每个应用相关联的文件包包括经过压缩的至少一个数据组,并且在所述第二存储器中,使用文件包作为对数据进行压缩存储时的基本存储单元。也就是说,在第二存储器中,每个应用均以文件包的形式进行存储。

此外,任意的经过压缩的数据组能够被存储在压缩数据段的单个压缩数据区中。即,不存在跨压缩数据区进行存储的数据组。单个压缩数据区中能够存储至少一个经过压缩的数据组。

在步骤102,基于获取请求,确定目标数据组在第一存储器内多个压缩数据段中所位于的当前压缩数据段并且确定目标数据组在当前压缩数据段内多个压缩数据区中所位于的当前压缩数据区。通常,本申请将目标数据组所在的压缩数据段称为当前压缩数据段并且将目标数据组所在的压缩数据区称为当前压缩数据区。在本申请中,目标数据组也可以被称为经过压缩的目标数据组。通常,在压缩存储区(包括多个压缩数据段)中存储的数据或数据组均为经过压缩的数据或数据组。

图4为根据本发明实施方式的确定目标数据组的存储位置的方法400的流程图。其中获取请求包括需要获取的目标数据组的标识符。如图4所示,基于所述获取请求,确定所述目标数据组在所述第一存储器内多个压缩数据段中所位于的当前压缩数据段并且确定所述目标数据组在所述当前压缩数据段内多个压缩数据区中所位于的当前压缩数据区包括:

步骤401,对所述获取请求进行解析以确定目标数据组的标识符。获取请求包括:请求方标识、目标数据组的标识符、请求优先级、请求时间等。

步骤402,根据所述目标数据组的标识符对所述第一存储器中的数据段索引信息表进行查询,根据查询结果确定所述目标数据组在所述第一存储器内多个压缩数据段中所位于的当前压缩数据段。第一存储器中包括数据段索引信息表,并且数据段索引信息表包括第一数据区、第二数据区、压缩存储区和保留存储区中每个的数据段索引信息。针对于压缩存储区,数据段索引信息包括每个压缩数据段的标识、起始地址、结束地址、存储容量等。针对于第一数据区和第二数据区,数据段索引信息包括每个(非压缩)数据段的标识、起始地址、结束地址、存储容量等。针对于保留存储区,数据段索引信息包括每个压缩数据段或非压缩数据段的标识、起始地址、结束地址、存储容量等。

优选地,可以将第一数据区、第二数据区、压缩存储区和保留存储区中每个的数据段索引信息构成单个数据段索引信息表,并且将这个单个数据段索引信息表存储在引导区中。可替换地,可以将第一数据区、第二数据区、压缩存储区和保留存储区中每个的数据段索引信息构成各自的数据段索引信息表,并且将第一数据区、第二数据区、压缩存储区和保留存储区的数据段索引信息表存储在各自的存储区域内。数据段索引信息可以包括二元组<数据组的标识符、所属数据段的标识符>。

步骤403,根据所述目标数据组的标识符对所述当前压缩数据段的目录区域内的数据区索引信息表进行查询,根据查询结果确定所述目标数据组在当前压缩数据段内多个压缩数据区中所位于的当前压缩数据区。其中,每个数据段或压缩数据段的目录区域内存储数据区索引信息表。数据区索引信息表可以包括二元组<数据组的标识符、所属(压缩)数据区的标识符>。

在步骤103,基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组。在根据预先设置的加载配置文件确定所述移动终端的待加载的多个应用之后,将关联统计文件从第二存储器复制到第一存储器中。所述关联统计文件包括多条关联统计信息,其中每条关联统计信息用于指示每个数据组(即,经过压缩的数据组)的多个关联数据组(即,经过压缩的数据组)。此外,特定数据组的关联统计信息还包括特定数据组的多个关联数据组中每个关联数据组与所述特定数据组的内容关联度、运行关联度、反馈关联度或综合关联度。

图5为根据本发明实施方式的用于确定关联数据组的方法500的流程图。如图5所示,方法500从步骤501开始。在步骤501,确定多个数据组(即,经过压缩的数据组)中除当前数据组之外的每个数据组与当前数据组的内容关联度。通过将多个数据组中的每个数据组作为当前数据组,本申请能够确定多个数据组中任意两个数据组之间的内容关联度。

在步骤502,基于内容关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表。通过将多个数据组中的每个数据组作为当前数据组,本申请可以获得每个数据组各自的排序列表,其中排序列表中多个数据组中除自身之外的每个数据组根据内容关联度进行降序排列。例如,在当前数据组的排序列表中,与当前数据组的内容关联度最大的数据组排在第一位,并且与当前数据组的内容关联度最小的数据组排在最后一位。当存在与当前数据组的内容关联度相同的至少两个数据组时,根据至少两个数据组的标识符确定先后顺序,或根据随机方式确定至少两个数据组的先后顺序。

在步骤503,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组。所述预先设置的选择规则包括:排序列表中内容关联度大于关联度阈值的多个数据组,或者排序列表中内容关联度排名在预定名次之前的多个数据组等。通常,可以根据用户输入或系统设置来确定关联度阈值,例如关联度阈值为70%、80%、85%等。或者,根据用户输入或系统设置来确定预定名次,例如,预定名次为前20名、前30名、前35名等。

其中将任意的两个数据组的摘要信息进行内容匹配的匹配值作为所述任意的两个数据组之间的内容关联度。本申请根据每个数据组的内容、作用、来源等信息为每个数据组确定摘要信息,并且摘要信息用于描述数据组的各种相关特征。本申请通过文本比对、语义比对等内容匹配方式确定任意两个数据组的摘要信息的匹配值。

图6为根据本发明另一实施方式的用于确定关联数据组的方法600的流程图。如图6所示,方法600从步骤601开始。在步骤601,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度。通过将多个数据组中的每个数据组作为当前数据组,本申请能够确定多个数据组中任意两个数据组之间的运行关联度。

在步骤602,基于运行关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表。通过将多个数据组中的每个数据组作为当前数据组,本申请可以获得每个数据组各自的排序列表,其中排序列表中多个数据组中除自身之外的每个数据组根据运行关联度进行降序排列。例如,在当前数据组的排序列表中,与当前数据组的运行关联度最大的数据组排在第一位,并且与当前数据组的运行关联度最小的数据组排在最后一位。当存在与当前数据组的运行关联度相同的至少两个数据组时,根据至少两个数据组的标识符确定先后顺序,或根据随机方式确定至少两个数据组的先后顺序。

在步骤603,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组。预先设置的选择规则包括:排序列表中运行关联度大于关联度阈值的多个数据组,或者排序列表中运行关联度排名在预定名次之前的多个数据组。通常,可以根据用户输入或系统设置来确定关联度阈值,例如关联度阈值为5次、8次、10次等。或者,根据用户输入或系统设置来确定预定名次,例如,预定名次为前20名、前30名、前35名等。

本申请获取每个数据组的运行历史信息,其中运行历史信息包括每个数据组的运行时间、被读取时间、被写入时间、被解压时间等。然后,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,即在每个基本时间单元内运行了哪些数据组。通常,可以根据用户输入或系统设置来确定基本时间单元,例如,5分钟、10分钟、15分钟等。本申请将时间划分为连续的基本时间单元,并且将基本时间单元作为基础的统计单元。然后,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度。例如,第一数据组在第1、3、5、6、7、8和9基本时间单元内运行,并且第二数据组在第2、3、4、6、7、8和9基本时间单元内运行,则第一数据组和第二数据组在相同的基本时间单元内运行的次数为5。任意数据组在同一基本时间单元内运行多次时,在运行关联度计算时只记为1次。应当了解的是,在确定运行关联度时,通常会预先确定统计时间的长度,即根据预定数量的基本时间单元进行运行关联度的计算,例如,30个基本时间单元、50个基本时间单元、60个基本时间单元等。

图7为根据本发明再一实施方式的用于确定关联数据组的方法700的流程图。如图7所示,方法700从步骤701开始。在步骤701,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度。通过将多个数据组中的每个数据组作为当前数据组,本申请能够确定多个数据组中任意两个数据组之间的反馈关联度。

在步骤702,基于反馈关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表。通过将多个数据组中的每个数据组作为当前数据组,本申请可以获得每个数据组各自的排序列表,其中排序列表中多个数据组中除自身之外的每个数据组根据反馈关联度进行降序排列。例如,在当前数据组的排序列表中,与当前数据组的反馈关联度最大的数据组排在第一位,并且与当前数据组的反馈关联度最小的数据组排在最后一位。当存在与当前数据组的反馈关联度相同的至少两个数据组时,根据至少两个数据组的标识符确定先后顺序,或根据随机方式确定至少两个数据组的先后顺序。

在步骤703,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组。预先设置的选择规则包括:排序列表中反馈关联度大于关联度阈值的多个数据组,或者排序列表中反馈关联度排名在预定名次之前的多个数据组。通常,可以根据用户输入或系统设置来确定关联度阈值,例如关联度阈值为15、25、35等。或者,根据用户输入或系统设置来确定预定名次,例如,预定名次为前20名、前30名、前35名等。

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。预先设置的关联度规则例如是由用户、操作系统、系统应用、用户应用等预先设置的关联度规则。关联度规则可以用于指示多个数据组中任意两个数据组之间的关联程度。例如,关联度规则指示第一数据组和第五数据组的关联度较高,例如反馈关联度为20,指示第一数据组和第二数据组的关联度中等,例如反馈关联度为15,以及指示第一数据组和第三数据组的关联度较低,例如反馈关联度为10。动态运行数据例如是由操作系统、系统应用、用户应用等根据数据组的运行数据所确定的多个数据组中任意两个数据组之间的关联程度。例如,动态运行数据指示第二数据组和第五数据组的关联度较高,例如反馈关联度为25,指示第二数据组和第三数据组的关联度中等,例如反馈关联度为15,以及指示第二数据组和第六数据组的关联度较低,例如反馈关联度为5。其中,数据组对的格式为<数据组名称、数据组名称>,并且用于指示两个不同的数据组之间的反馈关联度。例如,关联度规则指示第一数据组和第五数据组的关联度较高,例如反馈关联度为15,则数据组对<第一数据组、第五数据组>的反馈关联度为15。

此外,反馈关联度可以是多个数值的累加和。例如,系统应用根据动态运行数据确定第一数据组和第二数据组的反馈关联度为5、第一用户应用根据动态运行数据确定第一数据组和第二数据组的反馈关联度为10以及第二用户应用根据动态运行数据确定第一数据组和第二数据组的反馈关联度为15时,则第一数据组和第二数据组的反馈关联度为30。

图8为根据本发明又一实施方式的用于确定关联数据组的方法800的流程图。如图8所示,方法800从步骤801开始。在步骤801,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的综合关联度。通过将多个数据组中的每个数据组作为当前数据组,本申请能够确定多个数据组中任意两个数据组之间的综合关联度。

在步骤802,基于综合关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表。通过将多个数据组中的每个数据组作为当前数据组,本申请可以获得每个数据组各自的排序列表,其中排序列表中多个数据组中除自身之外的每个数据组根据综合关联度进行降序排列。例如,在当前数据组的排序列表中,与当前数据组的反馈关联度最大的数据组排在第一位,并且与当前数据组的综合关联度最小的数据组排在最后一位。当存在与当前数据组的综合关联度相同的至少两个数据组时,根据至少两个数据组的标识符确定先后顺序,或根据随机方式确定至少两个数据组的先后顺序。

在步骤803,根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组。预先设置的选择规则包括:排序列表中综合关联度大于关联度阈值的多个数据组,或者排序列表中综合关联度排名在预定名次之前的多个数据组。通常,可以根据用户输入或系统设置来确定关联度阈值,例如关联度阈值为70%、80%、85%等。或者,根据用户输入或系统设置来确定预定名次,例如,预定名次为前20名、前30名、前35名等。

在下面的内容中,确定内容关联度、运行关联度和反馈关联度的方式请参照如上的图5-7的内容。

第一实施方式

将任意两个数据组的摘要信息进行内容匹配作为所述任意两个数据组之间的(百分比形式的)内容关联度。

其中获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度。

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和运行关联度进行加权计算以确定综合关联度。具体地,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度中的最大值,即最大运行关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度除以最大运行关联度,以确定每个数据组与当前数据组的百分比形式的运行关联度。根据用户设置或系统设置、或根据运行状态的动态设置为内容关联度和(百分比形式的)运行关联度确定相同或不同的权重值。根据所确定的权重值,对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和(百分比形式的)运行关联度进行加权计算以确定综合关联度。

第二实施方式

其中将任意两个数据组的摘要信息进行内容匹配作为所述任意两个数据组之间的(百分比形式的)内容关联度;

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和反馈关联度进行加权计算以确定综合关联度。具体地,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度中的最大值,即最大反馈关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度除以最大反馈关联度,以确定每个数据组与当前数据组的百分比形式的反馈关联度。根据用户设置或系统设置、或根据运行状态的动态设置为内容关联度和(百分比形式的)反馈关联度确定相同或不同的权重值。根据所确定的权重值,对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和(百分比形式的)反馈关联度进行加权计算以确定综合关联度。

第三实施方式

其中获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度;

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度和反馈关联度进行加权计算以确定综合关联度。具体地,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度中的最大值,即最大运行关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度除以最大运行关联度,以确定每个数据组与当前数据组的百分比形式的运行关联度。确定多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度中的最大值,即最大反馈关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度除以最大反馈关联度,以确定每个数据组与当前数据组的百分比形式的反馈关联度。根据用户设置或系统设置、或根据运行状态的动态设置为(百分比形式的)运行关联度和(百分比形式的)反馈关联度确定相同或不同的权重值。根据所确定的权重值,对多个数据组中除当前数据组之外的每个数据组与当前数据组的(百分比形式的)运行关联度和(百分比形式的)反馈关联度进行加权计算以确定综合关联度。

第四实施方式

其中将任意两个数据组的摘要信息进行内容匹配作为所述任意两个数据组之间的(百分比形式的)内容关联度;

其中获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度;

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

其中对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度、运行关联度和反馈关联度进行加权计算以确定综合关联度。具体地,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度中的最大值,即最大运行关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度除以最大运行关联度,以确定每个数据组与当前数据组的百分比形式的运行关联度。确定多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度中的最大值,即最大反馈关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度除以最大反馈关联度,以确定每个数据组与当前数据组的百分比形式的反馈关联度。根据用户设置或系统设置、或根据运行状态的动态设置为(百分比形式的)内容关联度、(百分比形式的)运行关联度和(百分比形式的)反馈关联度确定相同或不同的权重值。根据所确定的权重值,对多个数据组中除当前数据组之外的每个数据组与当前数据组的(百分比形式的)内容关联度、(百分比形式的)运行关联度和(百分比形式的)反馈关联度进行加权计算以确定综合关联度。例如,(百分比形式的)内容关联度、(百分比形式的)运行关联度和(百分比形式的)反馈关联度的权重值为1/3、1/3和1/3;1/2、1/4和1/4;1/4、1/4和1/2等。

根据另一实施方式,本申请基于所述多个关联数据组中每个关联数据组在进行关联运行时与目标数据组的关联运行次数、关联运行时间和同步启动次数,在所述关联统计信息中为每个关联数据组设置关联等级。所述关联等级包括:强关联和弱关联。此前,获取每个数据组的运行历史信息(运行历史信息通常存储在运行历史文件中,并且例如可以通过日志文件等记录信息来获得),根据运行历史信息确定每个关联数据组在进行关联运行时与目标数据组的关联运行次数、关联运行时间和同步启动次数。

其中关联运行次数是在统计时间段(例如,10分钟、20分钟、30分钟等)内,两个数据组进行关联运行的次数(例如,5次、6次、8次等);其中关联运行时间是在统计时间段内,两个数据组进行关联运行的时间长度(例如,2分钟、3分钟、5分钟等);其中同步启动次数是在统计时间段内,两个数据组进行同步启动的次数(例如,3次、4次、5次等);其中关联运行是指两个数据组各自被调用或开始运行的时间的差值大于第一预定时间间隔并且小于第二预定时间间隔。其中同步启动是指两个数据组各自被调用或开始运行的时间的差值小于或等于第一预定时间间隔。其中第二预定时间间隔大于第一预定时间间隔,例如第二预定时间间隔为30秒,并且第一预定时间间隔为5秒。

在确定数据组的关联等级后,本申请可以根据关联等级对目标数据组(或任意数据组)的关联数据组进行过滤或筛选。例如,基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组包括:基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的并且关联等级为强关联的多个关联数据组。基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组包括:基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的并且关联等级为弱关联的多个关联数据组。

在步骤104,扫描所述当前压缩数据段内所有的压缩数据区,将所述当前压缩数据区标记为第一解压级,确定所述当前压缩数据段内除所述当前压缩数据区之外的并且具有关联数据组的至少一个关联压缩数据区,将所述当前压缩数据段的至少一个关联压缩数据区的每个关联压缩数据区内高压缩率或中压缩率的子区域标记为第二解压级,将所述当前压缩数据段的至少一个关联压缩数据区的每个关联压缩数据区内低压缩率的子区域标记为第三解压级,其中高压缩率、中压缩率和低压缩率的压缩程度依次升高;其中第一解压级、第二解压级和第三解压级的解压次序依次降低。应当了解的是,第一解压级、第二解压级和第三解压级可以用于指示对数据组进行解压缩的顺序等级,例如第一批次、第二批次、第三批次等。或者,将两个或多个解压级确定为相同的批次。其中,每个关联压缩数据区中具有/存储至少一个关联数据组(经过压缩的数据组)。其中,根据压缩配置文件为压缩数据区中的每个子区域指定区域压缩率,其中所述区域压缩率包括高压缩率、中压缩率或低压缩率。本申请利用所指定的区域压缩率对每个子区域中存储的数据组进行压缩,即子区域中的数据组的压缩率与子区域的区域压缩率相同。

根据每个关联数据组的标识符对所述当前压缩数据段的目录区域内的数据区索引信息表进行查询,根据查询结果确定当前压缩数据段内多个压缩数据区具有关联数据组的关联压缩数据区。其中,每个数据段或压缩数据段的目录区域内存储数据区索引信息表。数据区索引信息表可以包括二元组<数据组的标识符、所属(压缩)数据区的标识符>。压缩配置文件包括多个压缩信息表,其中每个压缩信息表与多个压缩数据段中的一个压缩数据段相关联并且包括用于记录相关联的压缩数据段内每个压缩数据区的压缩信息的多个区域子表。每个区域子表用于记录压缩数据区内多个子区域中每个子区域的区域压缩率。

在步骤105,在所述当前压缩数据段内按照解压级进行解压缩:在对标记为第一解压级的所述当前压缩数据区进行解压缩后,对至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩,然后对至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩。其中在对当前压缩数据段的至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩包括:从低地址向高地址方向或从高地址向低地址方向对多个子区域解压缩。其中在对当前压缩数据段的至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩包括:从低地址向高地址方向或从高地址向低地址方向对多个子区域解压缩。将对当前数据段的所述当前压缩数据区进行解压缩所产生的数据存储在所述第一存储器的第一数据区中。以及将对当前数据段的至少一个关联压缩数据区内的子区域进行解压缩所产生的数据存储在所述第一存储器的第二数据区中。

在步骤106,在所述当前压缩数据段内按照解压级进行解压缩的同时,确定多个压缩数据段中除所述当前压缩数据段之外并且具有关联数据组的至少一个关联压缩数据段,其中每个关联压缩数据段内的至少一个关联压缩数据区存储了关联数据组。

根据每个关联数据组的标识符对第一存储器中的数据段索引信息表进行查询,根据查询结果确定每个关联数据组在所述第一存储器内多个压缩数据段中所位于的压缩数据段。将具有至少一个关联数据组的压缩数据段确定为关联压缩数据段。根据每个关联数据组的标识符对每个关联压缩数据段的目录区域内的数据区索引信息表进行查询,根据查询结果确定每个关联压缩数据段内多个压缩数据区中具有关联数据组的关联压缩数据区。其中,每个数据段或压缩数据段的目录区域内存储数据区索引信息表。数据区索引信息表可以包括二元组<数据组的标识符、所属(压缩)数据区的标识符>。

在步骤107,将每个关联压缩数据段的至少一个关联压缩数据区内的高压缩率的子区域标记为第二解压级,并且将每个关联压缩数据段的至少一个关联压缩数据区内的中压缩率或低压缩率的子区域标记为第三解压级。应当了解的是,第一解压级、第二解压级和第三解压级可以用于指示对数据组进行解压缩的顺序等级,例如第一批次、第二批次、第三批次等。或者,将两个或多个解压级确定为相同的批次。其中,每个关联压缩数据区中具有/存储至少一个关联数据组(经过压缩的数据组)。

在步骤108,响应于所述当前压缩数据段内的解压缩的完成,在所述至少一个关联压缩数据段内按照解压级进行解压缩:首先对每个关联压缩数据段内的至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩,然后对每个关联压缩数据段内的至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩。将具有至少一个关联数据组的压缩数据段选择作为关联压缩数据段,并且将关联压缩数据段内具有至少一个关联数据组的压缩数据区确定为关联压缩数据区。将对每个关联压缩数据段内的至少一个关联压缩数据区内的子区域进行解压缩所产生的数据存储在所述第一存储器的第二数据区中。在所述至少一个关联压缩数据段内按照解压级进行解压缩之前还包括,将每个关联压缩数据段内不具有关联数据组的非关联压缩数据区标记为不可读区域,并且在所述至少一个关联压缩数据段内按照解压级进行解压缩时,对标记为不可读区域的非关联压缩数据区不进行任何处理。在所述当前压缩数据段内按照解压级进行解压缩之前还包括,将所述当前压缩数据段内不具有目标数据组或关联数据组的非关联压缩数据区标记为不可读区域,并且在所述当前压缩数据段内按照解压级进行解压缩时,对标记为不可读区域的非关联压缩数据区不进行任何处理。

图9为根据本发明实施方式的对数据进行分级处理的系统900的结构示意图。如图9所示,系统900包括:接收单元901、第一检索单元902、关联单元903、第一扫描单元904、第一解压单元905、第二检索单元906、第二扫描单元907、第二解压单元908、加载单元909、初始化单元910、处理单元911、设置单元912以及分配单元913。

接收单元901,接收针对于所述移动终端内第一存储器中存储的目标数据组的获取请求。通常,当移动终端的处理器、控制器、通信接口等器件需要使用在第一存储器中存储的目标数据组时,发送针对于移动终端内第一存储器中存储的目标数据组的获取请求。当移动终端根据用户请求进行数据处理、数据存储、数据计算等操作时,通常会需要读取多个数据组。数据组通常存储在第一存储器和第二存储器中,并且在需要时被移动终端内的器件所读取并使用。通常,本发明将处理器、控制器、通信接口等器件所需要使用的数据组称为目标数据组。

加载单元909,在检测到所述移动终端内的操作系统被加载到所述第一存储器中并且所述操作系统启动完成时,根据预先设置的加载配置文件确定所述移动终端的待加载的多个应用,随后,将与所述待加载的多个应用中每个应用相关联的文件包从第二存储器复制到所述第一存储器中。其中,第一存储器为易失性存储器,例如随机存取存储器RAM,内存,并且所述第二存储器为非易失性存储器,例如闪速存储器。当移动终端关机时,操作系统被存储在第二存储器中,并且当移动终端启动运行时,将操作系统从第二存储器加载到第一存储器中。加载配置文件可以是移动终端出厂时预先设置的,或者可以是由移动终端的用户所预先设置的。其中,加载配置文件中可以记载移动终端内多个应用中能够在操作系统启动时自动启动的一个或多个应用。通常,每个应用均具有相关联的文件包或至少一个文件包,并且每个文件包中可以包括多个文件子包,即通过层级方式来构建每个应用的文件结构。

初始化单元910,在所述操作系统启动完成之后并且在根据预先设置的加载配置文件确定所述移动终端的待加载的多个应用之前,在所述第一存储器中创建用于存储压缩数据的多个压缩数据段,其中每个压缩数据段包括多个压缩数据区,并且每个压缩数据区包括多个子区域。

第一检索单元902,基于获取请求,确定目标数据组在第一存储器内多个压缩数据段中所位于的当前压缩数据段并且确定目标数据组在当前压缩数据段内多个压缩数据区中所位于的当前压缩数据区。通常,本申请将目标数据组所在的压缩数据段称为当前压缩数据段并且将目标数据组所在的压缩数据区称为当前压缩数据区。在本申请中,目标数据组也可以被称为经过压缩的目标数据组。通常,在压缩存储区(包括多个压缩数据段)中存储的数据或数据组均为经过压缩的数据或数据组。

图10为根据本发明实施方式的第一检索单元1000的结构示意图。如图10所示,第一检索单元1000(即,图9中的第一检索单元902)包括:解析单元1001、查询单元1002以及确定单元1003。解析单元1001对所述获取请求进行解析以确定目标数据组的标识符。获取请求包括:请求方标识、目标数据组的标识符、请求优先级、请求时间等。

查询单元1002根据所述目标数据组的标识符对所述第一存储器中的数据段索引信息表进行查询,根据查询结果确定所述目标数据组在所述第一存储器内多个压缩数据段中所位于的当前压缩数据段。第一存储器中包括数据段索引信息表,并且数据段索引信息表包括第一数据区、第二数据区、压缩存储区和保留存储区中每个的数据段索引信息。针对于压缩存储区,数据段索引信息包括每个压缩数据段的标识、起始地址、结束地址、存储容量等。针对于第一数据区和第二数据区,数据段索引信息包括每个(非压缩)数据段的标识、起始地址、结束地址、存储容量等。针对于保留存储区,数据段索引信息包括每个压缩数据段或非压缩数据段的标识、起始地址、结束地址、存储容量等。

优选地,可以将第一数据区、第二数据区、压缩存储区和保留存储区中每个的数据段索引信息构成单个数据段索引信息表,并且将这个单个数据段索引信息表存储在引导区中。可替换地,可以将第一数据区、第二数据区、压缩存储区和保留存储区中每个的数据段索引信息构成各自的数据段索引信息表,并且将第一数据区、第二数据区、压缩存储区和保留存储区的数据段索引信息表存储在各自的存储区域内。数据段索引信息可以包括二元组<数据组的标识符、所属数据段的标识符>。

确定单元1003根据所述目标数据组的标识符对所述当前压缩数据段的目录区域内的数据区索引信息表进行查询,根据查询结果确定所述目标数据组在当前压缩数据段内多个压缩数据区中所位于的当前压缩数据区。其中,每个数据段或压缩数据段的目录区域内存储数据区索引信息表。数据区索引信息表可以包括二元组<数据组的标识符、所属(压缩)数据区的标识符>。

关联单元903,基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组。基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组。在根据预先设置的加载配置文件确定所述移动终端的待加载的多个应用之后,将关联统计文件从第二存储器复制到第一存储器中。所述关联统计文件包括多条关联统计信息,其中每条关联统计信息用于指示每个数据组(即,经过压缩的数据组)的多个关联数据组(即,经过压缩的数据组)。此外,特定数据组的关联统计信息还包括特定数据组的多个关联数据组中每个关联数据组与所述特定数据组的内容关联度、运行关联度、反馈关联度或综合关联度。

处理单元911确定多个数据组(即,经过压缩的数据组)中除当前数据组之外的每个数据组与当前数据组的内容关联度。通过将多个数据组中的每个数据组作为当前数据组,本申请能够确定多个数据组中任意两个数据组之间的内容关联度。

处理单元911基于内容关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表。通过将多个数据组中的每个数据组作为当前数据组,本申请可以获得每个数据组各自的排序列表,其中排序列表中多个数据组中除自身之外的每个数据组根据内容关联度进行降序排列。例如,在当前数据组的排序列表中,与当前数据组的内容关联度最大的数据组排在第一位,并且与当前数据组的内容关联度最小的数据组排在最后一位。当存在与当前数据组的内容关联度相同的至少两个数据组时,根据至少两个数据组的标识符确定先后顺序,或根据随机方式确定至少两个数据组的先后顺序。

处理单元911根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组。所述预先设置的选择规则包括:排序列表中内容关联度大于关联度阈值的多个数据组,或者排序列表中内容关联度排名在预定名次之前的多个数据组等。通常,可以根据用户输入或系统设置来确定关联度阈值,例如关联度阈值为70%、80%、85%等。或者,根据用户输入或系统设置来确定预定名次,例如,预定名次为前20名、前30名、前35名等。

其中将任意的两个数据组的摘要信息进行内容匹配的匹配值作为所述任意的两个数据组之间的内容关联度。本申请根据每个数据组的内容、作用、来源等信息为每个数据组确定摘要信息,并且摘要信息用于描述数据组的各种相关特征。本申请通过文本比对、语义比对等内容匹配方式确定任意两个数据组的摘要信息的匹配值。

处理单元911确定多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度。通过将多个数据组中的每个数据组作为当前数据组,本申请能够确定多个数据组中任意两个数据组之间的运行关联度。

处理单元911基于运行关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表。通过将多个数据组中的每个数据组作为当前数据组,本申请可以获得每个数据组各自的排序列表,其中排序列表中多个数据组中除自身之外的每个数据组根据运行关联度进行降序排列。例如,在当前数据组的排序列表中,与当前数据组的运行关联度最大的数据组排在第一位,并且与当前数据组的运行关联度最小的数据组排在最后一位。当存在与当前数据组的运行关联度相同的至少两个数据组时,根据至少两个数据组的标识符确定先后顺序,或根据随机方式确定至少两个数据组的先后顺序。

处理单元911根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组。预先设置的选择规则包括:排序列表中运行关联度大于关联度阈值的多个数据组,或者排序列表中运行关联度排名在预定名次之前的多个数据组。通常,可以根据用户输入或系统设置来确定关联度阈值,例如关联度阈值为5次、8次、10次等。或者,根据用户输入或系统设置来确定预定名次,例如,预定名次为前20名、前30名、前35名等。

本申请获取每个数据组的运行历史信息,其中运行历史信息包括每个数据组的运行时间、被读取时间、被写入时间、被解压时间等。然后,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,即在每个基本时间单元内运行了哪些数据组。通常,可以根据用户输入或系统设置来确定基本时间单元,例如,5分钟、10分钟、15分钟等。本申请将时间划分为连续的基本时间单元,并且将基本时间单元作为基础的统计单元。然后,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度。例如,第一数据组在第1、3、5、6、7、8和9基本时间单元内运行,并且第二数据组在第2、3、4、6、7、8和9基本时间单元内运行,则第一数据组和第二数据组在相同的基本时间单元内运行的次数为5。任意数据组在同一基本时间单元内运行多次时,在运行关联度计算时只记为1次。应当了解的是,在确定运行关联度时,通常会预先确定统计时间的长度,即根据预定数量的基本时间单元进行运行关联度的计算,例如,30个基本时间单元、50个基本时间单元、60个基本时间单元等。

处理单元911确定多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度。通过将多个数据组中的每个数据组作为当前数据组,本申请能够确定多个数据组中任意两个数据组之间的反馈关联度。

处理单元911基于反馈关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表。通过将多个数据组中的每个数据组作为当前数据组,本申请可以获得每个数据组各自的排序列表,其中排序列表中多个数据组中除自身之外的每个数据组根据反馈关联度进行降序排列。例如,在当前数据组的排序列表中,与当前数据组的反馈关联度最大的数据组排在第一位,并且与当前数据组的反馈关联度最小的数据组排在最后一位。当存在与当前数据组的反馈关联度相同的至少两个数据组时,根据至少两个数据组的标识符确定先后顺序,或根据随机方式确定至少两个数据组的先后顺序。

处理单元911根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组。预先设置的选择规则包括:排序列表中反馈关联度大于关联度阈值的多个数据组,或者排序列表中反馈关联度排名在预定名次之前的多个数据组。通常,可以根据用户输入或系统设置来确定关联度阈值,例如关联度阈值为15、25、35等。或者,根据用户输入或系统设置来确定预定名次,例如,预定名次为前20名、前30名、前35名等。

其中将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。预先设置的关联度规则例如是由用户、操作系统、系统应用、用户应用等预先设置的关联度规则。关联度规则可以用于指示多个数据组中任意两个数据组之间的关联程度。例如,关联度规则指示第一数据组和第五数据组的关联度较高,例如反馈关联度为20,指示第一数据组和第二数据组的关联度中等,例如反馈关联度为15,以及指示第一数据组和第三数据组的关联度较低,例如反馈关联度为10。动态运行数据例如是由操作系统、系统应用、用户应用等根据数据组的运行数据所确定的多个数据组中任意两个数据组之间的关联程度。例如,动态运行数据指示第二数据组和第五数据组的关联度较高,例如反馈关联度为25,指示第二数据组和第三数据组的关联度中等,例如反馈关联度为15,以及指示第二数据组和第六数据组的关联度较低,例如反馈关联度为5。其中,数据组对的格式为<数据组名称、数据组名称>,并且用于指示两个不同的数据组之间的反馈关联度。例如,关联度规则指示第一数据组和第五数据组的关联度较高,例如反馈关联度为15,则数据组对<第一数据组、第五数据组>的反馈关联度为15。

此外,反馈关联度可以是多个数值的累加和。例如,系统应用根据动态运行数据确定第一数据组和第二数据组的反馈关联度为5、第一用户应用根据动态运行数据确定第一数据组和第二数据组的反馈关联度为10以及第二用户应用根据动态运行数据确定第一数据组和第二数据组的反馈关联度为15时,则第一数据组和第二数据组的反馈关联度为30。

处理单元911确定多个数据组中除当前数据组之外的每个数据组与当前数据组的综合关联度。通过将多个数据组中的每个数据组作为当前数据组,本申请能够确定多个数据组中任意两个数据组之间的综合关联度。

处理单元911基于综合关联度对除当前数据组之外的每个数据组进行降序排列以生成排序列表。通过将多个数据组中的每个数据组作为当前数据组,本申请可以获得每个数据组各自的排序列表,其中排序列表中多个数据组中除自身之外的每个数据组根据综合关联度进行降序排列。例如,在当前数据组的排序列表中,与当前数据组的反馈关联度最大的数据组排在第一位,并且与当前数据组的综合关联度最小的数据组排在最后一位。当存在与当前数据组的综合关联度相同的至少两个数据组时,根据至少两个数据组的标识符确定先后顺序,或根据随机方式确定至少两个数据组的先后顺序。

处理单元911根据预先设置的选择规则从所述排序列表中选择多个数据组以作为所述当前数据组的多个关联数据组。预先设置的选择规则包括:排序列表中综合关联度大于关联度阈值的多个数据组,或者排序列表中综合关联度排名在预定名次之前的多个数据组。通常,可以根据用户输入或系统设置来确定关联度阈值,例如关联度阈值为70%、80%、85%等。或者,根据用户输入或系统设置来确定预定名次,例如,预定名次为前20名、前30名、前35名等。

第一实施方式

处理单元911将任意两个数据组的摘要信息进行内容匹配作为所述任意两个数据组之间的(百分比形式的)内容关联度。

处理单元911获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度。

处理单元911对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和运行关联度进行加权计算以确定综合关联度。具体地,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度中的最大值,即最大运行关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度除以最大运行关联度,以确定每个数据组与当前数据组的百分比形式的运行关联度。根据用户设置或系统设置、或根据运行状态的动态设置为内容关联度和(百分比形式的)运行关联度确定相同或不同的权重值。根据所确定的权重值,对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和(百分比形式的)运行关联度进行加权计算以确定综合关联度。

第二实施方式

处理单元911将任意两个数据组的摘要信息进行内容匹配作为所述任意两个数据组之间的(百分比形式的)内容关联度;

处理单元911将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

处理单元911对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和反馈关联度进行加权计算以确定综合关联度。具体地,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度中的最大值,即最大反馈关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度除以最大反馈关联度,以确定每个数据组与当前数据组的百分比形式的反馈关联度。根据用户设置或系统设置、或根据运行状态的动态设置为内容关联度和(百分比形式的)反馈关联度确定相同或不同的权重值。根据所确定的权重值,对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度和(百分比形式的)反馈关联度进行加权计算以确定综合关联度。

第三实施方式

处理单元911获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度;

处理单元911将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

处理单元911对多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度和反馈关联度进行加权计算以确定综合关联度。具体地,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度中的最大值,即最大运行关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度除以最大运行关联度,以确定每个数据组与当前数据组的百分比形式的运行关联度。确定多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度中的最大值,即最大反馈关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度除以最大反馈关联度,以确定每个数据组与当前数据组的百分比形式的反馈关联度。根据用户设置或系统设置、或根据运行状态的动态设置为(百分比形式的)运行关联度和(百分比形式的)反馈关联度确定相同或不同的权重值。根据所确定的权重值,对多个数据组中除当前数据组之外的每个数据组与当前数据组的(百分比形式的)运行关联度和(百分比形式的)反馈关联度进行加权计算以确定综合关联度。

第四实施方式

处理单元911将任意两个数据组的摘要信息进行内容匹配作为所述任意两个数据组之间的(百分比形式的)内容关联度;

处理单元911获取每个数据组的运行历史信息,根据运行历史信息确定每个基本时间单元内运行的数据组的统计数据,确定任意的两个数据组在相同的基本时间单元内运行的次数,基于在相同的基本时间单元内运行的次数来确定任意的两个数据组之间的运行关联度;

处理单元911将任意的两个数据组之间的反馈关联度的初始值设置为0,并且对预先设置的关联度规则或对动态运行数据进行解析以确定多个数据组对中需要进行反馈关联度设置的数据组对,根据关联度规则或动态运行数据为每个需要进行反馈关联度设置的数据组对中的两个数据组设置反馈关联度。

处理单元911对多个数据组中除当前数据组之外的每个数据组与当前数据组的内容关联度、运行关联度和反馈关联度进行加权计算以确定综合关联度。具体地,确定多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度中的最大值,即最大运行关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的运行关联度除以最大运行关联度,以确定每个数据组与当前数据组的百分比形式的运行关联度。确定多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度中的最大值,即最大反馈关联度。然后,将多个数据组中除当前数据组之外的每个数据组与当前数据组的反馈关联度除以最大反馈关联度,以确定每个数据组与当前数据组的百分比形式的反馈关联度。根据用户设置或系统设置、或根据运行状态的动态设置为(百分比形式的)内容关联度、(百分比形式的)运行关联度和(百分比形式的)反馈关联度确定相同或不同的权重值。根据所确定的权重值,对多个数据组中除当前数据组之外的每个数据组与当前数据组的(百分比形式的)内容关联度、(百分比形式的)运行关联度和(百分比形式的)反馈关联度进行加权计算以确定综合关联度。例如,(百分比形式的)内容关联度、(百分比形式的)运行关联度和(百分比形式的)反馈关联度的权重值为1/3、1/3和1/3;1/2、1/4和1/4;1/4、1/4和1/2等。

设置单元912,基于所述多个关联数据组中每个关联数据组在进行关联运行时与目标数据组的关联运行次数、关联运行时间和同步启动次数,在所述关联统计信息中为每个关联数据组设置关联等级。所述关联等级包括:强关联和弱关联。此前,获取每个数据组的运行历史信息(运行历史信息通常存储在运行历史文件中,并且例如可以通过日志文件等记录信息来获得),根据运行历史信息确定每个关联数据组在进行关联运行时与目标数据组的关联运行次数、关联运行时间和同步启动次数。

其中关联运行次数是在统计时间段(例如,10分钟、20分钟、30分钟等)内,两个数据组进行关联运行的次数(例如,5次、6次、8次等);其中关联运行时间是在统计时间段内,两个数据组进行关联运行的时间长度(例如,2分钟、3分钟、5分钟等);其中同步启动次数是在统计时间段内,两个数据组进行同步启动的次数(例如,3次、4次、5次等);其中关联运行是指两个数据组各自被调用或开始运行的时间的差值大于第一预定时间间隔并且小于第二预定时间间隔。其中同步启动是指两个数据组各自被调用或开始运行的时间的差值小于或等于第一预定时间间隔。其中第二预定时间间隔大于第一预定时间间隔,例如第二预定时间间隔为30秒,并且第一预定时间间隔为5秒。

在确定数据组的关联等级后,本申请可以根据关联等级对目标数据组(或任意数据组)的关联数据组进行过滤或筛选。例如,基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组包括:基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的并且关联等级为强关联的多个关联数据组。基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的多个关联数据组包括:基于所述目标数据组的关联统计信息,确定所述目标数据组在运行时需要关联运行的并且关联等级为弱关联的多个关联数据组。

第一扫描单元904,扫描所述当前压缩数据段内所有的压缩数据区,将所述当前压缩数据区标记为第一解压级,确定所述当前压缩数据段内除所述当前压缩数据区之外的并且具有关联数据组的至少一个关联压缩数据区,将所述当前压缩数据段的至少一个关联压缩数据区的每个关联压缩数据区内高压缩率或中压缩率的子区域标记为第二解压级,将所述当前压缩数据段的至少一个关联压缩数据区的每个关联压缩数据区内低压缩率的子区域标记为第三解压级,其中高压缩率、中压缩率和低压缩率的压缩程度依次升高;其中第一解压级、第二解压级和第三解压级的解压次序依次降低。应当了解的是,第一解压级、第二解压级和第三解压级可以用于指示对数据组进行解压缩的顺序等级,例如第一批次、第二批次、第三批次等。或者,将两个或多个解压级确定为相同的批次。其中,每个关联压缩数据区中具有/存储至少一个关联数据组(经过压缩的数据组)。

分配单元913,根据压缩配置文件为压缩数据区中的每个子区域指定区域压缩率,其中所述区域压缩率包括高压缩率、中压缩率或低压缩率。本申请利用所指定的区域压缩率对每个子区域中存储的数据组进行压缩,即子区域中的数据组的压缩率与子区域的区域压缩率相同。

根据每个关联数据组的标识符对所述当前压缩数据段的目录区域内的数据区索引信息表进行查询,根据查询结果确定当前压缩数据段内多个压缩数据区具有关联数据组的关联压缩数据区。其中,每个数据段或压缩数据段的目录区域内存储数据区索引信息表。数据区索引信息表可以包括二元组<数据组的标识符、所属(压缩)数据区的标识符>。压缩配置文件包括多个压缩信息表,其中每个压缩信息表与多个压缩数据段中的一个压缩数据段相关联并且包括用于记录相关联的压缩数据段内每个压缩数据区的压缩信息的多个区域子表。每个区域子表用于记录压缩数据区内多个子区域中每个子区域的区域压缩率。

第一解压单元905,在所述当前压缩数据段内按照解压级进行解压缩:在对标记为第一解压级的所述当前压缩数据区进行解压缩后,对至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩,然后对至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩。其中在对当前压缩数据段的至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩包括:从低地址向高地址方向或从高地址向低地址方向对多个子区域解压缩。其中在对当前压缩数据段的至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩包括:从低地址向高地址方向或从高地址向低地址方向对多个子区域解压缩。将对当前数据段的所述当前压缩数据区进行解压缩所产生的数据存储在所述第一存储器的第一数据区中。以及将对当前数据段的至少一个关联压缩数据区内的子区域进行解压缩所产生的数据存储在所述第一存储器的第二数据区中。

第二检索单元906,在所述当前压缩数据段内按照解压级进行解压缩的同时,确定多个压缩数据段中除所述当前压缩数据段之外并且具有关联数据组的至少一个关联压缩数据段,其中每个关联压缩数据段内的至少一个关联压缩数据区存储了关联数据组。

根据每个关联数据组的标识符对第一存储器中的数据段索引信息表进行查询,根据查询结果确定每个关联数据组在所述第一存储器内多个压缩数据段中所位于的压缩数据段。将具有至少一个关联数据组的压缩数据段确定为关联压缩数据段。根据每个关联数据组的标识符对每个关联压缩数据段的目录区域内的数据区索引信息表进行查询,根据查询结果确定每个关联压缩数据段内多个压缩数据区中具有关联数据组的关联压缩数据区。其中,每个数据段或压缩数据段的目录区域内存储数据区索引信息表。数据区索引信息表可以包括二元组<数据组的标识符、所属(压缩)数据区的标识符>。

第二扫描单元907,,将每个关联压缩数据段的至少一个关联压缩数据区内的高压缩率的子区域标记为第二解压级,并且将每个关联压缩数据段的至少一个关联压缩数据区内的中压缩率或低压缩率的子区域标记为第三解压级。应当了解的是,第一解压级、第二解压级和第三解压级可以用于指示对数据组进行解压缩的顺序等级,例如第一批次、第二批次、第三批次等。或者,将两个或多个解压级确定为相同的批次。其中,每个关联压缩数据区中具有/存储至少一个关联数据组(经过压缩的数据组)。

第二解压单元908,响应于所述当前压缩数据段内的解压缩的完成,在所述至少一个关联压缩数据段内按照解压级进行解压缩:首先对每个关联压缩数据段内的至少一个关联压缩数据区内标记为第二解压级的子区域进行解压缩,然后对每个关联压缩数据段内的至少一个关联压缩数据区内标记为第三解压级的子区域进行解压缩。将具有至少一个关联数据组的压缩数据段选择作为关联压缩数据段,并且将关联压缩数据段内具有至少一个关联数据组的压缩数据区确定为关联压缩数据区。将对每个关联压缩数据段内的至少一个关联压缩数据区内的子区域进行解压缩所产生的数据存储在所述第一存储器的第二数据区中。在所述至少一个关联压缩数据段内按照解压级进行解压缩之前还包括,将每个关联压缩数据段内不具有关联数据组的非关联压缩数据区标记为不可读区域,并且在所述至少一个关联压缩数据段内按照解压级进行解压缩时,对标记为不可读区域的非关联压缩数据区不进行任何处理。在所述当前压缩数据段内按照解压级进行解压缩之前还包括,将所述当前压缩数据段内不具有目标数据组或关联数据组的非关联压缩数据区标记为不可读区域,并且在所述当前压缩数据段内按照解压级进行解压缩时,对标记为不可读区域的非关联压缩数据区不进行任何处理。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1