确定垃圾文件大小的方法和装置及电子设备的制造方法

文档序号:9453129阅读:445来源:国知局
确定垃圾文件大小的方法和装置及电子设备的制造方法
【技术领域】
[0001]本发明涉及垃圾文件清理技术领域,尤其涉及一种确定垃圾文件大小的方法和装置及电子设备。
【背景技术】
[0002]当前用户手机存储中,由于应用的开发规范不当,导致大量存储空间被无用数据占用,致使手机存储空间不足,存储数据杂乱不堪,因此清理更多的无用数据,释放更多存储空间,成为用户的强烈需求。而各国清理需求并不一致,需结合各国因素预估该国首次可清理的垃圾文件大小,进而可以根据该大小制定相应的运营策略。

【发明内容】

[0003]本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0004]为此,本发明的一个目的在于提出一种确定垃圾文件大小的方法,该方法可以预估出每个目标区域的首次可清理的垃圾文件大小。
[0005]本发明的另一个目的在于提出一种确定垃圾文件大小的装置。
[0006]本发明的另一个目的在于提出一种电子设备。
[0007]为达到上述目的,本发明第一方面实施例提出的确定垃圾文件大小的方法,包括:获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据;根据所述特征点数据,将所述所有目标区域分成训练集和测试集;根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。
[0008]可选的,所述根据所述特征点数据,将所述所有目标区域分成训练集和测试集,包括:根据所述特征点数据,确定所述所有目标区域中每个目标区域的清理效果;按照所述清理效果从好到差的顺序,选择预设个数的目标区域组成训练集;将所述所有目标区域中除组成所述训练集的目标区域之外的其他目标区域,组成测试集。
[0009]可选的,所述根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小,包括:根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系;根据所述函数关系,以及所述测试集中每个目标区域的特征点数据,得到所述测试集中每个目标区域的首次可清理的垃圾文件大小。
[0010]可选的,所述根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系,包括:采用分类回归树算法,根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系。
[0011]可选的,所述确定所述测试集中每个目标区域的首次可清理的垃圾文件大小之后,所述方法还包括:根据确定出的每个目标区域的首次可清理的垃圾文件大小,计算预设的衡量参数;判断所述衡量参数是否满足预设的最优条件;如果满足,保存所述确定出的每个目标区域的首次可清理的垃圾文件大小。
[0012]可选的,所述判断所述衡量参数是否满足预设的最优条件之后,所述方法还包括:如果不满足,重新组成新的训练集和测试集,并重新确定新的测试集中每个目标区域的首次可清理的垃圾文件大小。
[0013]可选的,所述确定所述测试集中每个目标区域的首次可清理的垃圾文件大小之后,所述方法还包括:按照首次可清理的垃圾文件大小的从大到小的顺序,对相应目标区域进行垃圾文件清理的处理。
[0014]可选的,所述获取已有的所有目标区域中每个目标区域的特征点数据,包括:获取已有的所有目标区域中每个目标区域的初始数据;根据预设规则,对所述初始数据进行过滤,得到所述特征点数据。
[0015]可选的,所述根据预设规则,对所述初始数据进行过滤,包括:去除所述初始数据中的无效数据。
[0016]可选的,所述特征点数据包括如下项中的至少一项:已有的首次可清理的垃圾文件大小;首次垃圾清理的用户数;非首次可清理的垃圾文件大小;非首次垃圾清理的用户数;安装比例较高的预设个数的安装包中已运营的安装包的占比率;要完成预设比例的覆盖率,剩余待运营的安装包个数;平均安装包个数;不同机型的占比率;检出的首次可清理的垃圾文件大小在预设范围内的用户数的占比率。
[0017]本发明第一方面实施例提出的确定垃圾文件大小的方法,通过得到训练集和测试集,并根据训练集中每个目标区域的特征点数据得到测试集中每个目标区域的首次可清理的垃圾文件大小,可以预估出每个目标区域的首次可清理的垃圾文件大小。
[0018]为达到上述目的,本发明第二方面实施例提出的确定垃圾文件大小的装置,包括:获取模块,用于获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据;划分模块,用于根据所述特征点数据,将所述所有目标区域分成训练集和测试集;确定模块,用于根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。
[0019]可选的,所述划分模块具体用于:根据所述特征点数据,确定所述所有目标区域中每个目标区域的清理效果;按照所述清理效果从好到差的顺序,选择预设个数的目标区域组成训练集;将所述所有目标区域中除组成所述训练集的目标区域之外的其他目标区域,组成测试集。
[0020]可选的,所述确定模块包括:第一单元,用于根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系;第二单元,用于根据所述函数关系,以及所述测试集中每个目标区域的特征点数据,得到所述测试集中每个目标区域的首次可清理的垃圾文件大小。
[0021]可选的,所述第一单元具体用于:采用分类回归树算法,根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系。
[0022]可选的,还包括:计算模块,用于根据确定出的每个目标区域的首次可清理的垃圾文件大小,计算预设的衡量参数;判断模块,用于判断所述衡量参数是否满足预设的最优条件;保存模块,用于如果满足,保存所述确定出的每个目标区域的首次可清理的垃圾文件大小。
[0023]可选的,还包括:调整模块,用于如果不满足,重新组成新的训练集和测试集,并重新确定新的测试集中每个目标区域的首次可清理的垃圾文件大小。
[0024]可选的,还包括:处理模块,用于按照首次可清理的垃圾文件大小的从大到小的顺序,对相应目标区域进行垃圾文件清理的处理。
[0025]可选的,所述获取模块具体用于:获取已有的所有目标区域中每个目标区域的初始数据;根据预设规则,对所述初始数据进行过滤,得到所述特征点数据。
[0026]可选的,所述获取模块具体用于根据预设规则,对所述初始数据进行过滤,得到所述特征点数据,包括:去除所述初始数据中的无效数据。
[0027]本发明第二方面实施例提出的确定垃圾文件大小的装置,通过得到训练集和测试集,并根据训练集中每个目标区域的特征点数据得到测试集中每个目标区域的首次可清理的垃圾文件大小,可以预估出每个目标区域的首次可清理的垃圾文件大小。
[0028]为达到上述目的,本发明第三方面实施例提出的电子设备,包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据;根据所述特征点数据,将所述所有目标区域分成训练集和测试集;根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。
[0029]可选的,所述根据所述特征点数据,将所述所有目标区域分成训练集和测试集,包括:根据所述特征点数据,确定所述所有目标区域中每个目标区域的清理效果;按照所述清理效果从好到差的顺序,选择预设个数的目标区域组成训练集;将所述所有目标区域中除组成所述训练集的目标区域之外的其他目标区域,组成测试集。
[0030]可选的,所述根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小,包括:根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系;根据所述函数关系,以及所述测试集中每个目标区域的特征点数据,得到所述测试集中每个目标区域的首次可清理的垃圾文件大小。
[0031]可选的,所述根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系,包括:采用分类回归树算法,根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系。
[0032]可选的,所述确定所述测试集中每个目标区域的首次可清理的垃圾文件大小之后,所述方法还包括:根据确定出的每个目标区域的首次可清理的垃圾文件大小,计算预设的衡量参数;判断所述衡量参数是否满足预设的最优条件;如果满足,保存所述确定出的每个目标区域的首次可清理的垃圾文件大小。
[0033]可选的,所述判断所述衡量参数是否满足预设的最优条件之后,所述方法还
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1