确定移动互联网内目标移动终端的数据状态的方法及系统与流程

文档序号:17080121发布日期:2019-03-09 00:09阅读:197来源:国知局
确定移动互联网内目标移动终端的数据状态的方法及系统与流程

本发明涉及移动互联网领域,并且更具体地,涉及一种用于确定移动互联网内目标移动终端的数据状态的方法及系统。



背景技术:

目前,随着移动互联网的发展,越来越多的人使用移动终端来进行数据传输、数据存储等。为此,用户可能会在移动终端中存储大量的数据文件。随着使用时间的增加,越来越多的数据文件会导致移动终端的存储空间变小、运行效率降低。为此,需要根据移动终端内数据文件的特性来对数据文件进行有效的管理。



技术实现要素:

根据本发明的一个方面,提供一种用于确定移动互联网内目标移动终端的数据状态的方法,所述方法包括:

获取移动互联网内多个移动终端中的目标移动终端内多个数据文件中每个数据文件的摘要信息,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行内容匹配以生成内容匹配度矩阵:

其中aij为第i个数据文件与第j个数据文件的内容匹配度并且aij=aji,a11、a22、…、aii、…ajj、amm的值均为100%,其中i,j和m均为自然数,并且m≥i≥1,m≥j≥1并且i与j不相等,m为目标移动终端内数据文件的数量;

计算每个数据文件的内容匹配度的平均值avgi,

计算目标移动终端内所有数据文件的内容匹配度的平均值avgtotal

获取目标移动终端内所安装的应用的应用数量an,基于目标移动终端内数据文件的数量m和应用数量an确定调节因子α,

根据调节因子α和所有数据文件的内容匹配度的平均值avgtotal确定内容匹配度阈值thold:

将多个数据文件中内容匹配度的平均值小于内容匹配度阈值thold的数据文件确定为低关联度的数据文件并且将多个数据文件中内容匹配度的平均值大于或等于内容匹配度阈值thold的数据文件确定为非低关联度的数据文件,从而确定多个低关联度的数据文件和多个非低关联度的数据文件,确定低关联度的数据文件的数量和非低关联度的数据文件的数量;

获取用于记录所述目标移动终端内多个数据文件中每个数据文件的运行日志的日志记录文件,并且基于当前的统计数据时间段和日志记录文件确定每个数据文件的有效运行信息,根据每个数据文件的有效信息确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数和每个非低关联度的数据文件在当前的统计时间段内的运行次数;

读取所述目标移动终端的第一存储器中的存储记录文件并对所述存储记录文件进行解析以确定每个低关联度的数据文件的存储尺寸和每个非低关联度的数据文件的存储尺寸,以及根据所述存储记录文件确定所述第一存储器的总存储容量和空闲存储容量;

基于低关联度的数据文件的数量、非低关联度的数据文件的数量、每个低关联度的数据文件的存储尺寸、每个非低关联度的数据文件的存储尺寸、第一存储器的总存储容量、第一存储器的空闲存储容量、每个低关联度的数据文件在当前的统计时间段内的运行次数、每个非低关联度的数据文件在当前的统计时间段内的运行次数、每个低关联度的数据文件的内容匹配度的平均值以及每个非低关联度的数据文件的内容匹配度的平均值来计算目标移动终端内的数据文件关联系数:

其中,cor为目标移动终端内的数据文件关联系数,lcn为低关联度的数据文件的数量,nlcn为非低关联度的数据文件的数量,lcsk为第k个低关联度的数据文件的存储尺寸,nlcsl为第l个非低关联度的数据文件的存储尺寸;c为第一存储器的总存储容量,r为第一存储器的空闲存储容量;lcrk为第k个低关联度的数据文件在当前的统计时间段内的运行次数,nlcrl为第l个非低关联度的数据文件在当前的统计时间段内的运行次数;lcavgk为第k个低关联度的数据文件的内容匹配度的平均值,nlcavgl为第l个非低关联度的数据文件的内容匹配度的平均值;其中k和l为自然数,lcn≥k≥1并且nlcn≥l≥1,其中lcn≥100并且nlcn≥100

当目标移动终端内的数据文件关联系数cor大于低关联度设备阈值时,确定所述目标移动终端的数据状态为低关联数据存储状态。

还包括确定每个低关联度的数据文件的内容匹配度的平均值和每个非低关联度的数据文件的内容匹配度的平均值;

根据来自用户的数据状态确认请求从所述多个移动终端中选择目标移动终端,或者根据来自系统的指示消息从所述多个移动终端中选择目标移动终端;

其中所述数据状态确认请求包括所述目标移动终端的标识符,并且所述指示消息包括所述目标移动终端的标识符;

其中所述用户是目标移动终端的用户。

所述将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行内容匹配以生成内容匹配度矩阵包括:

将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于语义的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵;

或者,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于关键字的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵;

或者,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于文本比对的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵。

所述内容匹配度阈值thold为15%、20%、25%、30%、35%、40%、45%、50%、55%、60%或65%。

每个数据文件的日志记录文件包括多个日志记录,并且每个日志记录用于记录数据文件的运行日志,每个日志记录包括:数据文件的标识符、运行起始时间、运行结束时间。

根据用户输入来确定当前的统计数据时间段,或者根据系统预设信息来确定当前的统计数据时间段;

其中所述当前的统计数据时间段是以当前日期的前一天为结束日期并且以过去的特定日期为起始日期的一段时间,所述当前的统计数据时间段包括10个自然日、15个自然日、20个自然日或30个自然日;

其中所述当前的统计数据时间段是以当前小时的前一小时为结束时间并且以过去的特定小时为起始日期的一段时间,所述当前的统计数据时间段包括50个小时、80个小时、100个小时或200个小时;

所述当前的统计数据时间段包括多个自然日,或者所述当前的统计数据时间段包括多个小时。

基于当前的统计数据时间段和日志记录文件确定每个数据文件的有效运行信息包括:

从每个数据文件的日志记录文件的多个日志记录中选择运行起始时间和运行结束时间均在当前的统计数据时间段内的日志记录,以将所选择的每个数据文件的多个日志记录构成每个数据文件的有效运行信息。

根据每个数据文件的有效信息确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数和每个非低关联度的数据文件在当前的统计时间段内的运行次数:

根据每个低关联度的数据文件的有效信息中的日志记录的数量确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数;

根据每个非低关联度的数据文件的有效信息中的日志记录的数量确定每个非低关联度的数据文件在当前的统计数据时间段内的运行次数。

所述存储记录文件包括每个数据文件的存储尺寸、第一存储器的总存储容量和第一存储器的空闲存储容量。

当确定所述目标移动终端的数据状态为低关联数据存储状态时,按照内容匹配度的平均值的降序顺序将每个低关联度的数据文件进行排序以生成排序列表,确定数据文件分组的数量并生成g个数据文件分组,按照排序列表中内容匹配度的平均值的降序顺序,从内容匹配度的平均值最大的数据文件开始,将排序列表中的每个数据文件依次循环分配到g个数据文件分组中。

当检测到g个数据文件分组中的特定数据文件分组内被删除的数据文件的数量等于或大于删除阈值时,将所述特定数据文件分组删除。

还包括第二存储器,所述第二存储器为随机存取存储器,所述第一存储器为闪存。

其中低关联度设备阈值为70、80、90、100、120、150、180、200或300。

根据本发明的另一方面,提供一种用于确定移动互联网内目标移动终端的数据状态的系统,所述系统包括:

生成单元,获取移动互联网内多个移动终端中的目标移动终端内多个数据文件中每个数据文件的摘要信息,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行内容匹配以生成内容匹配度矩阵:

其中aij为第i个数据文件与第j个数据文件的内容匹配度并且aij=aji,a11、a22、…、aii、…ajj、amm的值均为100%,其中i,j和m均为自然数,并且m≥i≥1,m≥j≥1并且i与j不相等,m为目标移动终端内数据文件的数量;

第一计算单元,计算每个数据文件的内容匹配度的平均值avgi,

计算目标移动终端内所有数据文件的内容匹配度的平均值avgtotal

获取目标移动终端内所安装的应用的应用数量an,基于目标移动终端内数据文件的数量m和应用数量an确定调节因子α,

根据调节因子α和所有数据文件的内容匹配度的平均值avgtotal确定内容匹配度阈值thold:

确定单元,将多个数据文件中内容匹配度的平均值小于内容匹配度阈值thold的数据文件确定为低关联度的数据文件并且将多个数据文件中内容匹配度的平均值大于或等于内容匹配度阈值thold的数据文件确定为非低关联度的数据文件,从而确定多个低关联度的数据文件和多个非低关联度的数据文件,确定低关联度的数据文件的数量和非低关联度的数据文件的数量;

获取单元,获取用于记录所述目标移动终端内多个数据文件中每个数据文件的运行日志的日志记录文件,并且基于当前的统计数据时间段和日志记录文件确定每个数据文件的有效运行信息,根据每个数据文件的有效信息确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数和每个非低关联度的数据文件在当前的统计时间段内的运行次数;

读取单元,读取所述目标移动终端的第一存储器中的存储记录文件并对所述存储记录文件进行解析以确定每个低关联度的数据文件的存储尺寸和每个非低关联度的数据文件的存储尺寸,以及根据所述存储记录文件确定所述第一存储器的总存储容量和空闲存储容量;

第二计算单元,基于低关联度的数据文件的数量、非低关联度的数据文件的数量、每个低关联度的数据文件的存储尺寸、每个非低关联度的数据文件的存储尺寸、第一存储器的总存储容量、第一存储器的空闲存储容量、每个低关联度的数据文件在当前的统计时间段内的运行次数、每个非低关联度的数据文件在当前的统计时间段内的运行次数、每个低关联度的数据文件的内容匹配度的平均值以及每个非低关联度的数据文件的内容匹配度的平均值来计算目标移动终端内的数据文件关联系数:

其中,cor为目标移动终端内的数据文件关联系数,lcn为低关联度的数据文件的数量,nlcn为非低关联度的数据文件的数量,lcsk为第k个低关联度的数据文件的存储尺寸,nlcsl为第l个非低关联度的数据文件的存储尺寸;c为第一存储器的总存储容量,r为第一存储器的空闲存储容量;lcrk为第k个低关联度的数据文件在当前的统计时间段内的运行次数,nlcrl为第l个非低关联度的数据文件在当前的统计时间段内的运行次数;lcavgk为第k个低关联度的数据文件的内容匹配度的平均值,nlcavgl为第l个非低关联度的数据文件的内容匹配度的平均值;其中k和l为自然数,lcn≥k≥1并且nlcn≥l≥1,其中lcn≥100并且nlcn≥100,当目标移动终端内的数据文件关联系数cor大于低关联度设备阈值时,确定所述目标移动终端的数据状态为低关联数据存储状态。

所述确定单元还用于确定每个低关联度的数据文件的内容匹配度的平均值和每个非低关联度的数据文件的内容匹配度的平均值。

根据来自用户的数据状态确认请求从所述多个移动终端中选择目标移动终端,或者根据来自系统的指示消息从所述多个移动终端中选择目标移动终端;

其中所述数据状态确认请求包括所述目标移动终端的标识符,并且所述指示消息包括所述目标移动终端的标识符;

其中所述用户是目标移动终端的用户。

所述将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行内容匹配以生成内容匹配度矩阵包括:

将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于语义的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵;

或者,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于关键字的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵;

或者,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于文本比对的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵。

所述内容匹配度阈值thold为15%、20%或25%。

每个数据文件的日志记录文件包括多个日志记录,并且每个日志记录用于记录数据文件的运行日志,每个日志记录包括:数据文件的标识符、运行起始时间、运行结束时间。

根据用户输入来确定当前的统计数据时间段,或者根据系统预设信息来确定当前的统计数据时间段;

其中所述当前的统计数据时间段是以当前日期的前一天为结束日期并且以过去的特定日期为起始日期的一段时间,所述当前的统计数据时间段包括10个自然日、15个自然日、20个自然日或30个自然日;

其中所述当前的统计数据时间段是以当前小时的前一小时为结束时间并且以过去的特定小时为起始日期的一段时间,所述当前的统计数据时间段包括50个小时、80个小时、100个小时或200个小时;

所述当前的统计数据时间段包括多个自然日,或者所述当前的统计数据时间段包括多个小时。

基于当前的统计数据时间段和日志记录文件确定每个数据文件的有效运行信息包括:

从每个数据文件的日志记录文件的多个日志记录中选择运行起始时间和运行结束时间均在当前的统计数据时间段内的日志记录,以将所选择的每个数据文件的多个日志记录构成每个数据文件的有效运行信息。

根据每个数据文件的有效信息确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数和每个非低关联度的数据文件在当前的统计时间段内的运行次数:

根据每个低关联度的数据文件的有效信息中的日志记录的数量确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数;

根据每个非低关联度的数据文件的有效信息中的日志记录的数量确定每个非低关联度的数据文件在当前的统计数据时间段内的运行次数。

所述存储记录文件包括每个数据文件的存储尺寸、第一存储器的总存储容量和第一存储器的空闲存储容量。

当确定所述目标移动终端的数据状态为低关联数据存储状态时,按照内容匹配度的平均值的降序顺序将每个低关联度的数据文件进行排序以生成排序列表,确定数据文件分组的数量并生成g个数据文件分组,按照排序列表中内容匹配度的平均值的降序顺序,从内容匹配度的平均值最大的数据文件开始,将排序列表中的每个数据文件依次循环分配到g个数据文件分组中。

当检测到g个数据文件分组中的特定数据文件分组内被删除的数据文件的数量等于或大于删除阈值时,将所述特定数据文件分组删除。

还包括第二存储器,所述第二存储器为随机存取存储器,所述第一存储器为闪存。

其中低关联度设备阈值为70、80、90、100、120、150、180、200或300。

附图说明

通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:

图1为根据本发明实施例的用于确定移动互联网内目标移动终端的数据状态的方法的流程图;

图2为根据本发明实施例的对数据文件进行分类的示意图;以及

图3为根据本发明实施例的用于确定移动互联网内目标移动终端的数据状态的系统的结构示意图。

具体实施方式

图1为根据本发明实施例的用于确定移动互联网内目标移动终端的数据状态的方法100的流程图。步骤101,获取移动互联网内多个移动终端中的目标移动终端内多个数据文件中每个数据文件的摘要信息,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行内容匹配以生成内容匹配度矩阵:

其中aij为第i个数据文件与第j个数据文件的内容匹配度并且aij=aji,a11、a22、…、aii、…ajj、amm的值均为100%,其中i,j和m均为自然数,并且m≥i≥1,m≥j≥1并且i与j不相等,m为目标移动终端内数据文件的数量。

其中根据来自用户的数据状态确认请求从所述多个移动终端中选择目标移动终端,或者根据来自系统的指示消息从所述多个移动终端中选择目标移动终端。其中所述数据状态确认请求包括所述目标移动终端的标识符,并且所述指示消息包括所述目标移动终端的标识符;其中所述用户是目标移动终端的用户。

所述将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行内容匹配以生成内容匹配度矩阵包括:将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于语义的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵;或者,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于关键字的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵;或者,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于文本比对的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵。

步骤102,计算每个数据文件的内容匹配度的平均值avgi,

计算目标移动终端内所有数据文件的内容匹配度的平均值avgtotal

步骤103,获取目标移动终端内所安装的应用的应用数量an,基于目标移动终端内数据文件的数量m和应用数量an确定调节因子α,

根据调节因子α和所有数据文件的内容匹配度的平均值avgtotal确定内容匹配度阈值thold:

步骤104,将多个数据文件中内容匹配度的平均值小于内容匹配度阈值thold的数据文件确定为低关联度的数据文件并且将多个数据文件中内容匹配度的平均值大于或等于内容匹配度阈值thold的数据文件确定为非低关联度的数据文件,从而确定多个低关联度的数据文件和多个非低关联度的数据文件,确定低关联度的数据文件的数量和非低关联度的数据文件的数量;确定每个低关联度的数据文件的内容匹配度的平均值和每个非低关联度的数据文件的内容匹配度的平均值。所述内容匹配度阈值thold为15%、20%或25%。

步骤105,获取用于记录所述目标移动终端内多个数据文件中每个数据文件的运行日志的日志记录文件,并且基于当前的统计数据时间段和日志记录文件确定每个数据文件的有效运行信息,根据每个数据文件的有效信息确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数和每个非低关联度的数据文件在当前的统计时间段内的运行次数。每个数据文件的日志记录文件包括多个日志记录,并且每个日志记录用于记录数据文件的运行日志,每个日志记录包括:数据文件的标识符、运行起始时间、运行结束时间。

根据用户输入来确定当前的统计数据时间段,或者根据系统预设信息来确定当前的统计数据时间段;其中所述当前的统计数据时间段是以当前日期的前一天为结束日期并且以过去的特定日期为起始日期的一段时间,所述当前的统计数据时间段包括10个自然日、15个自然日、20个自然日或30个自然日;其中所述当前的统计数据时间段是以当前小时的前一小时为结束时间并且以过去的特定小时为起始日期的一段时间,所述当前的统计数据时间段包括50个小时、80个小时、100个小时或200个小时;所述当前的统计数据时间段包括多个自然日,或者所述当前的统计数据时间段包括多个小时。

基于当前的统计数据时间段和日志记录文件确定每个数据文件的有效运行信息包括:从每个数据文件的日志记录文件的多个日志记录中选择运行起始时间和运行结束时间均在当前的统计数据时间段内的日志记录,以将所选择的每个数据文件的多个日志记录构成每个数据文件的有效运行信息。

根据每个数据文件的有效信息确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数和每个非低关联度的数据文件在当前的统计时间段内的运行次数:根据每个低关联度的数据文件的有效信息中的日志记录的数量确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数;根据每个非低关联度的数据文件的有效信息中的日志记录的数量确定每个非低关联度的数据文件在当前的统计数据时间段内的运行次数。

步骤106,读取所述目标移动终端的第一存储器中的存储记录文件并对所述存储记录文件进行解析以确定每个低关联度的数据文件的存储尺寸和每个非低关联度的数据文件的存储尺寸,以及根据所述存储记录文件确定所述第一存储器的总存储容量和空闲存储容量。所述存储记录文件包括每个数据文件的存储尺寸、第一存储器的总存储容量和第一存储器的空闲存储容量。

步骤107,基于低关联度的数据文件的数量、非低关联度的数据文件的数量、每个低关联度的数据文件的存储尺寸、每个非低关联度的数据文件的存储尺寸、第一存储器的总存储容量、第一存储器的空闲存储容量、每个低关联度的数据文件在当前的统计时间段内的运行次数、每个非低关联度的数据文件在当前的统计时间段内的运行次数、每个低关联度的数据文件的内容匹配度的平均值以及每个非低关联度的数据文件的内容匹配度的平均值来计算目标移动终端内的数据文件关联系数:

其中,cor为目标移动终端内的数据文件关联系数,lcn为低关联度的数据文件的数量,nlcn为非低关联度的数据文件的数量,lcsk为第k个低关联度的数据文件的存储尺寸,nlcsl为第l个非低关联度的数据文件的存储尺寸;c为第一存储器的总存储容量,r为第一存储器的空闲存储容量;lcrk为第k个低关联度的数据文件在当前的统计时间段内的运行次数,nlcrl为第l个非低关联度的数据文件在当前的统计时间段内的运行次数;lcavgk为第k个低关联度的数据文件的内容匹配度的平均值,nlcavgl为第l个非低关联度的数据文件的内容匹配度的平均值;其中k和l为自然数,lcn≥k≥1并且nlcn≥l≥1,其中lcn≥100并且nlcn≥100,当目标移动终端内的数据文件关联系数cor大于低关联度设备阈值时,确定所述目标移动终端的数据状态为低关联数据存储状态。

当确定所述目标移动终端的数据状态为低关联数据存储状态时,按照内容匹配度的平均值的降序顺序将每个低关联度的数据文件进行排序以生成排序列表,确定数据文件分组的数量并生成g个数据文件分组,按照排序列表中内容匹配度的平均值的降序顺序,从内容匹配度的平均值最大的数据文件开始,将排序列表中的每个数据文件依次循环分配到g个数据文件分组中。当检测到g个数据文件分组中的特定数据文件分组内被删除的数据文件的数量等于或超过删除阈值时,将所述特定数据文件分组删除。

例如,按照内容匹配度的平均值avg的降序顺序将10个低关联度的数据文件进行排序以生成排序列表:[数据文件1、35%],[数据文件2、34%],[数据文件3、32%],[数据文件4、31%],[数据文件5、30%],[数据文件6、27%],[数据文件7、26%],[数据文件8、22%],[数据文件9、18%],[数据文件10、12%]。其中数据文件的编号是为了进行说明而进行顺序编号的,实际上可以是任何的数据文件名称,例如数据文件的唯一的标识符。排序列表中,数据文件的内容匹配度的平均值是降序顺序,35%、34%、…、12%。例如,当数据文件分组的数量g为3时,需要将排序列表中的10个数据文件分配到3个数据文件分组中。

在本申请中,可以将排序列表中的10个数据文件随机分配到3个数据文件分组中。或者按照排序列表中内容匹配度的平均值的降序顺序,从内容匹配度的平均值最大的数据文件开始,将排序列表中的每个数据文件依次循环分配到g个数据文件分组中。即,将[数据文件1、35%]分配到第1数据文件分组中,将[数据文件2、34%]分配到第2数据文件分组中,将[数据文件3、32%]分配到第3数据文件分组中,将[数据文件4、31%]分配到第1数据文件分组中,将[数据文件5、30%]分配到第2数据文件分组中,将[数据文件6、27%]分配到第3数据文件分组中,将[数据文件7、26%]分配到第1数据文件分组中,将[数据文件8、22%]分配到第2数据文件分组中,将[数据文件9、18%]分配到第3数据文件分组中,将[数据文件10、12%]分配到第1数据文件分组中。

此后,在删除阈值为2并且第1数据文件分组中已经被删除了2个数据文件时,则将第1数据文件分组删除,即将第1数据文件分组中剩余的数据文件全部删除。其中删除阈值为2个、3个、5个、8个或10个等任意合理数值。

移动终端内还包括第二存储器,所述第二存储器为随机存取存储器,所述第一存储器为闪存。其中第二存储器用于用作内存,以供处理器进行数据缓存。第一存储器为用于存储数据内容并且在移动终端关闭的情况下不丢失内容的存储器。

图2为根据本发明实施例的对数据文件进行分类200的示意图。如图2所示,对数据文件进行分类之前,获取移动互联网内多个移动终端中的目标移动终端内多个数据文件中每个数据文件的摘要信息,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行内容匹配以生成内容匹配度矩阵。计算每个数据文件的内容匹配度的平均值avgi,并基于每个数据文件的内容匹配度的平均值avgi计算目标移动终端内所有数据文件的内容匹配度的平均值avgtotal。获取目标移动终端内所安装的应用的应用数量an,基于目标移动终端内数据文件的数量m和应用数量an确定调节因子α,根据调节因子α和所有数据文件的内容匹配度的平均值avgtotal确定内容匹配度阈值。将多个数据文件中内容匹配度的平均值小于内容匹配度阈值thold的数据文件确定为低关联度的数据文件并且将多个数据文件中内容匹配度的平均值大于或等于内容匹配度阈值thold的数据文件确定为非低关联度的数据文件。

按照内容匹配度的平均值的升序顺序或降序顺序将每个低关联度的数据文件进行排序以生成低关联度的数据文件的排序列表201。按照内容匹配度的平均值的升序顺序或降序顺序将每个非低关联度的数据文件进行排序以生成非低关联度的数据文件的排序列表202。

图3为根据本发明实施例的用于确定移动互联网内目标移动终端的数据状态的系统300的结构示意图。系统300包括:生成单元301、第一计算单元302、确定单元303、获取单元304、读取单元305和第二计算单元306。

生成单元301,获取移动互联网内多个移动终端中的目标移动终端内多个数据文件中每个数据文件的摘要信息,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行内容匹配以生成内容匹配度矩阵:

其中aij为第i个数据文件与第j个数据文件的内容匹配度并且aij=aji,a11、a22、…、aii、…ajj、amm的值均为100%,其中i,j和m均为自然数,并且m≥i≥1,m≥j≥1并且i与j不相等,m为目标移动终端内数据文件的数量。

其中根据来自用户的数据状态确认请求从所述多个移动终端中选择目标移动终端,或者根据来自系统的指示消息从所述多个移动终端中选择目标移动终端。其中所述数据状态确认请求包括所述目标移动终端的标识符,并且所述指示消息包括所述目标移动终端的标识符;其中所述用户是目标移动终端的用户。

所述将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行内容匹配以生成内容匹配度矩阵包括:将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于语义的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵;或者,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于关键字的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵;或者,将每个数据文件的摘要信息与多个数据文件中任意一个数据文件的摘要信息进行基于文本比对的内容匹配,以获取内容匹配度,基于内容匹配度生成内容匹配度矩阵。

第一计算单元302计算每个数据文件的内容匹配度的平均值avgi,

计算目标移动终端内所有数据文件的内容匹配度的平均值avgtotal

获取目标移动终端内所安装的应用的应用数量an,基于目标移动终端内数据文件的数量m和应用数量an确定调节因子α,

根据调节因子α和所有数据文件的内容匹配度的平均值avgtotal确定内容匹配度阈值thold:

确定单元303将多个数据文件中内容匹配度的平均值小于内容匹配度阈值thold的数据文件确定为低关联度的数据文件并且将多个数据文件中内容匹配度的平均值大于或等于内容匹配度阈值thold的数据文件确定为非低关联度的数据文件,从而确定多个低关联度的数据文件和多个非低关联度的数据文件,确定低关联度的数据文件的数量和非低关联度的数据文件的数量;确定每个低关联度的数据文件的内容匹配度的平均值和每个非低关联度的数据文件的内容匹配度的平均值。所述内容匹配度阈值thold为15%、20%或25%。

获取单元304获取用于记录所述目标移动终端内多个数据文件中每个数据文件的运行日志的日志记录文件,并且基于当前的统计数据时间段和日志记录文件确定每个数据文件的有效运行信息,根据每个数据文件的有效信息确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数和每个非低关联度的数据文件在当前的统计时间段内的运行次数。每个数据文件的日志记录文件包括多个日志记录,并且每个日志记录用于记录数据文件的运行日志,每个日志记录包括:数据文件的标识符、运行起始时间、运行结束时间。

根据用户输入来确定当前的统计数据时间段,或者根据系统预设信息来确定当前的统计数据时间段;其中所述当前的统计数据时间段是以当前日期的前一天为结束日期并且以过去的特定日期为起始日期的一段时间,所述当前的统计数据时间段包括10个自然日、15个自然日、20个自然日或30个自然日;其中所述当前的统计数据时间段是以当前小时的前一小时为结束时间并且以过去的特定小时为起始日期的一段时间,所述当前的统计数据时间段包括50个小时、80个小时、100个小时或200个小时;所述当前的统计数据时间段包括多个自然日,或者所述当前的统计数据时间段包括多个小时。

基于当前的统计数据时间段和日志记录文件确定每个数据文件的有效运行信息包括:从每个数据文件的日志记录文件的多个日志记录中选择运行起始时间和运行结束时间均在当前的统计数据时间段内的日志记录,以将所选择的每个数据文件的多个日志记录构成每个数据文件的有效运行信息。

根据每个数据文件的有效信息确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数和每个非低关联度的数据文件在当前的统计时间段内的运行次数:根据每个低关联度的数据文件的有效信息中的日志记录的数量确定每个低关联度的数据文件在当前的统计数据时间段内的运行次数;根据每个非低关联度的数据文件的有效信息中的日志记录的数量确定每个非低关联度的数据文件在当前的统计数据时间段内的运行次数。

读取单元305读取所述目标移动终端的第一存储器中的存储记录文件并对所述存储记录文件进行解析以确定每个低关联度的数据文件的存储尺寸和每个非低关联度的数据文件的存储尺寸,以及根据所述存储记录文件确定所述第一存储器的总存储容量和空闲存储容量。所述存储记录文件包括每个数据文件的存储尺寸、第一存储器的总存储容量和第一存储器的空闲存储容量。

第二计算单元306基于低关联度的数据文件的数量、非低关联度的数据文件的数量、每个低关联度的数据文件的存储尺寸、每个非低关联度的数据文件的存储尺寸、第一存储器的总存储容量、第一存储器的空闲存储容量、每个低关联度的数据文件在当前的统计时间段内的运行次数、每个非低关联度的数据文件在当前的统计时间段内的运行次数、每个低关联度的数据文件的内容匹配度的平均值以及每个非低关联度的数据文件的内容匹配度的平均值来计算目标移动终端内的数据文件关联系数:

其中,cor为目标移动终端内的数据文件关联系数,lcn为低关联度的数据文件的数量,nlcn为非低关联度的数据文件的数量,lcsk为第k个低关联度的数据文件的存储尺寸,nlcsl为第l个非低关联度的数据文件的存储尺寸;c为第一存储器的总存储容量,r为第一存储器的空闲存储容量;lcrk为第k个低关联度的数据文件在当前的统计时间段内的运行次数,nlcrl为第l个非低关联度的数据文件在当前的统计时间段内的运行次数;lcavgk为第k个低关联度的数据文件的内容匹配度的平均值,nlcavgl为第l个非低关联度的数据文件的内容匹配度的平均值;其中k和l为自然数,lcn≥k≥1并且nlcn≥l≥1,其中lcn≥100并且nlcn≥100,当目标移动终端内的数据文件关联系数cor大于低关联度设备阈值时,确定所述目标移动终端的数据状态为低关联数据存储状态。

当确定所述目标移动终端的数据状态为低关联数据存储状态时,按照内容匹配度的平均值的降序顺序将每个低关联度的数据文件进行排序以生成排序列表,确定数据文件分组的数量并生成g个数据文件分组,按照排序列表中内容匹配度的平均值的降序顺序,从内容匹配度的平均值最大的数据文件开始,将排序列表中的每个数据文件依次循环分配到g个数据文件分组中。当检测到g个数据文件分组中的特定数据文件分组内被删除的数据文件的数量等于或大于删除阈值时,将所述特定数据文件分组删除。

例如,按照内容匹配度的平均值avg的降序顺序将10个低关联度的数据文件进行排序以生成排序列表:[数据文件1、35%],[数据文件2、34%],[数据文件3、32%],[数据文件4、31%],[数据文件5、30%],[数据文件6、27%],[数据文件7、26%],[数据文件8、22%],[数据文件9、18%],[数据文件10、12%]。其中数据文件的编号是为了进行说明而进行顺序编号的,实际上可以是任何的数据文件名称,例如数据文件的唯一的标识符。排序列表中,数据文件的内容匹配度的平均值是降序顺序,35%、34%、…、12%。例如,当数据文件分组的数量g为3时,需要将排序列表中的10个数据文件分配到3个数据文件分组中。

在本申请中,可以将排序列表中的10个数据文件随机分配到3个数据文件分组中。或者按照排序列表中内容匹配度的平均值的降序顺序,从内容匹配度的平均值最大的数据文件开始,将排序列表中的每个数据文件依次循环分配到g个数据文件分组中。即,将[数据文件1、35%]分配到第1数据文件分组中,将[数据文件2、34%]分配到第2数据文件分组中,将[数据文件3、32%]分配到第3数据文件分组中,将[数据文件4、31%]分配到第1数据文件分组中,将[数据文件5、30%]分配到第2数据文件分组中,将[数据文件6、27%]分配到第3数据文件分组中,将[数据文件7、26%]分配到第1数据文件分组中,将[数据文件8、22%]分配到第2数据文件分组中,将[数据文件9、18%]分配到第3数据文件分组中,将[数据文件10、12%]分配到第1数据文件分组中。

此后,在删除阈值为2并且第1数据文件分组中已经被删除了2个数据文件时,则将第1数据文件分组删除,即将第1数据文件分组中剩余的数据文件全部删除。其中删除阈值为2个、3个、5个、8个或10个等任意合理数值。

移动终端内还包括第二存储器,所述第二存储器为随机存取存储器,所述第一存储器为闪存。其中第二存储器用于用作内存,以供处理器进行数据缓存。第一存储器为用于存储数据内容并且在移动终端关闭的情况下不丢失内容的存储器。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1