确定垃圾文件大小的方法和装置及电子设备的制造方法_5

文档序号:9453129阅读:来源:国知局
个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系,包括:采用分类回归树算法,根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系。
[0213]可选的,所述确定所述测试集中每个目标区域的首次可清理的垃圾文件大小之后,所述方法还包括:根据确定出的每个目标区域的首次可清理的垃圾文件大小,计算预设的衡量参数;判断所述衡量参数是否满足预设的最优条件;如果满足,保存所述确定出的每个目标区域的首次可清理的垃圾文件大小。
[0214]可选的,所述判断所述衡量参数是否满足预设的最优条件之后,所述方法还包括:如果不满足,重新组成新的训练集和测试集,并重新确定新的测试集中每个目标区域的首次可清理的垃圾文件大小。
[0215]可选的,所述确定所述测试集中每个目标区域的首次可清理的垃圾文件大小之后,所述方法还包括:按照首次可清理的垃圾文件大小的从大到小的顺序,对相应目标区域进行垃圾文件清理的处理。
[0216]可选的,所述获取已有的所有目标区域中每个目标区域的特征点数据,包括:获取已有的所有目标区域中每个目标区域的初始数据;根据预设规则,对所述初始数据进行过滤,得到所述特征点数据。
[0217]可选的,所述根据预设规则,对所述初始数据进行过滤,包括:去除所述初始数据中的无效数据。
[0218]可选的,所述特征点数据包括如下项中的至少一项:已有的首次可清理的垃圾文件大小;首次垃圾清理的用户数;非首次可清理的垃圾文件大小;非首次垃圾清理的用户数;安装比例较高的预设个数的安装包中已运营的安装包的占比率;要完成预设比例的覆盖率,剩余待运营的安装包个数;平均安装包个数;不同机型的占比率;检出的首次可清理的垃圾文件大小在预设范围内的用户数的占比率。
[0219]上述步骤的具体内容可以参见上述实施例中的相关描述,在此不再赘述。
[0220]本实施例中,通过得到训练集和测试集,并根据训练集中每个目标区域的特征点数据得到测试集中每个目标区域的首扫size,可以预估目标区域的首扫size。
[0221]需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
[0222]流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
[0223]应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0224]本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0225]此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0226]上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0227]在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0228]尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
【主权项】
1.一种确定垃圾文件大小的方法,其特征在于,包括: 获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据; 根据所述特征点数据,将所述所有目标区域分成训练集和测试集; 根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。2.根据权利要求1所述的方法,其特征在于,所述根据所述特征点数据,将所述所有目标区域分成训练集和测试集,包括: 根据所述特征点数据,确定所述所有目标区域中每个目标区域的清理效果; 按照所述清理效果从好到差的顺序,选择预设个数的目标区域组成训练集; 将所述所有目标区域中除组成所述训练集的目标区域之外的其他目标区域,组成测试集。3.根据权利要求1所述的方法,其特征在于,所述根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小,包括: 根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系; 根据所述函数关系,以及所述测试集中每个目标区域的特征点数据,得到所述测试集中每个目标区域的首次可清理的垃圾文件大小。4.根据权利要求3所述的方法,其特征在于,所述根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系,包括: 采用分类回归树算法,根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系。5.根据权利要求1所述的方法,其特征在于,所述确定所述测试集中每个目标区域的首次可清理的垃圾文件大小之后,所述方法还包括: 根据确定出的每个目标区域的首次可清理的垃圾文件大小,计算预设的衡量参数; 判断所述衡量参数是否满足预设的最优条件; 如果满足,保存所述确定出的每个目标区域的首次可清理的垃圾文件大小。6.根据权利要求5所述的方法,其特征在于,所述判断所述衡量参数是否满足预设的最优条件之后,所述方法还包括: 如果不满足,重新组成新的训练集和测试集,并重新确定新的测试集中每个目标区域的首次可清理的垃圾文件大小。7.根据权利要求1所述的方法,其特征在于,所述确定所述测试集中每个目标区域的首次可清理的垃圾文件大小之后,所述方法还包括: 按照首次可清理的垃圾文件大小的从大到小的顺序,对相应目标区域进行垃圾文件清理的处理。8.根据权利要求1所述的方法,其特征在于,所述获取已有的所有目标区域中每个目标区域的特征点数据,包括: 获取已有的所有目标区域中每个目标区域的初始数据; 根据预设规则,对所述初始数据进行过滤,得到所述特征点数据。9.一种确定垃圾文件大小的装置,其特征在于,包括: 获取模块,用于获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据; 划分模块,用于根据所述特征点数据,将所述所有目标区域分成训练集和测试集; 确定模块,用于根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。10.一种电子设备,其特征在于,包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤: 获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据; 根据所述特征点数据,将所述所有目标区域分成训练集和测试集; 根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。
【专利摘要】本发明提出一种确定垃圾文件大小的方法和装置及电子设备,该确定垃圾文件大小的方法包括:获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据;根据所述特征点数据,将所述所有目标区域分成训练集和测试集;根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。该方法能够预估出每个目标区域的首次可清理的垃圾文件大小。
【IPC分类】G06F17/30
【公开号】CN105205131
【申请号】CN201510586565
【发明人】闫泳杉
【申请人】北京金山安全软件有限公司
【公开日】2015年12月30日
【申请日】2015年9月15日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1