一种待清理文件确定方法及装置的制造方法

文档序号:9249316阅读:370来源:国知局
一种待清理文件确定方法及装置的制造方法
【技术领域】
[0001]本发明涉及数据处理技术领域,特别涉及一种待清理文件确定方法及装置。
【背景技术】
[0002]在移动设备中,安装有各种各样的应用程序,在用户使用移动设备的过程中,这些应用程序会创建一些文件,比如,应用程序接收到的一些图片会存储在图片文件中,应用程序运行时需要的一些数据会存在缓存文件中,这些图片文件或者缓存文件可能在使用过之后就不再需要了,但是却会占用移动设备大量的存储空间,造成移动设备的存储空间不足。因此需要清理这些文件,以释放移动设备的存储空间。
[0003]根据现有技术,为了实现对移动设备文件的清理,需要预先设置一个可清理文件列表,该列表中记载了若干已知可清理文件的文件特征信息(例如文件的路径、文件所属的应用程序安装包名称等等)。进行文件清理时,首先对移动终端存储空间进行扫描,提取存储空间中文件的特征信息,将提取到的特征信息与列表中记载的特征信息进行比较,如果列表中记载的一个已知可清理文件的所有特征信息分别与存储空间中某个文件的相应特征信息一致,则将存储空间中的该文件确定为可清理文件。
[0004]根据现有技术的方案,要求列表中记载的一个已知可清理文件的所有特征信息分别与存储空间中某个文件的相应特征信息一致,才允许对存储空间中的这个文件进行清理。为了减小被清理的概率,可清理文件对应的应用程序的生产商往往会对可清理文件的部分特征信息进行一些微小的变化,如改变安装包名称中的一个字,从而使得现有的清理技术无法将改变了特征信息的文件识别为可清理文件,不对改变了特征信息的文件进行清理。现有技术通过将变化后的特征信息及时得加入可清理文件列表中来解决这个问题。但是,特征信息的增加会占用额外的空间,同时进行特征信息比较时需要比较的特征信息也较多,提高了比较过程给系统造成的运行负担。

【发明内容】

[0005]本发明实施例的目的在于提供一种待清理文件确定方法和装置,以在不增加可清理文件列表中可清理文件的特征信息的数量的情况下,确定待清理文件。
[0006]为达到上述的一个目的,本发明实施例公开了一种待清理文件确定方法,包括:
[0007]对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
[0008]根据预设的可清理文件列表,判断所述目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;
[0009]在所述目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;
[0010]根据判断结果,确定所述目标文件是否为待清理文件。
[0011]可选的,所述对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息,包括:
[0012]接收用户的开始扫描指令;
[0013]根据所述开始扫描指令对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
[0014]或者,
[0015]判断是否满足预设的时间条件;
[0016]在满足预设的时间条件的情况下,对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息。
[0017]可选的,所述判断是否满足预设的时间条件,包括:
[0018]判断当前时刻是否到达预设的扫描时间点;或者,
[0019]判断上一次扫描后经过的时长是否达到预设的时长阈值。
[0020]可选的,所述第一类特征信息为路径,所述第二类特征信息为安装包名称,所述在所述目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值,包括:
[0021]在所述目标文件的路径与可清理文件的路径相同的情况下,获取所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称;
[0022]计算所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度;
[0023]判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值;
[0024]在所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值的情况下,确定所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值。
[0025]可选的,所述判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值,包括:
[0026]将所述目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称分别按照字符段切分为多个安装包名称片段;
[0027]判断所述目标文件所属应用程序的多个安装包名称片段中是否存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段,所述相似指所述目标文件所属应用程序的安装包名称片段和所述可清理文件所属应用程序的安装包名称片段的相似度超过预设的第二文本相似度阈值;
[0028]如果存在,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。
[0029]可选的,所述判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值,还包括:
[0030]在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,获取所述目标文件所属应用程序的安装包名称的分类信息;
[0031]获取可清理文件所属应用程序的安装包名称的分类信息;
[0032]判断所述目标文件所属应用程序的安装包名称的分类信息和可清理文件所属应用程序的安装包名称的分类信息是否一致;
[0033]在所述目标文件所属应用程序的安装包名称的分类信息和可清理文件所属应用程序的安装包名称的分类信息一致的情况下,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。
[0034]可选的,所述根据判断结果,确定所述目标文件是否为待清理文件,包括:
[0035]在所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值的情况下,根据预设的可清理文件列表,判断所述可清理文件的用户清理次数是否超过预设值;
[0036]在所述可清理文件的用户清理次数超过预设值的情况下,确定所述目标文件为待清理文件。
[0037]一种待清理文件确定装置,包括:
[0038]提取模块,用于对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
[0039]第一判断模块,用于根据预设的可清理文件列表,判断所述目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;
[0040]第二判断模块,用于在所述目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;
[0041]确定模块,用于根据所述第二判断模块的判断结果,确定所述目标文件是否为待清理文件。
[0042]可选的,所述提取模块,包括:
[0043]接收单元,用于接收用户的开始扫描指令;
[0044]第一提取单元,用于根据所述接收单元接收的开始扫描指令对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
[0045]第一判断单元,用于判断是否满足预设的时间条件;
[0046]第二提取单元,用于在所述判断单元判断满足预设的时间条件的情况下,对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息。
[0047]可选的,所述第一判断单元,具体用于:
[0048]判断当前时刻是否到达预设的扫描时间点;或者,
[0049]判断上一次扫描后经过的时长是否达到预设的时长阈值。
[0050]可选的,所述第一类特征信息为路径,所述第二类特征信息为安装包名称,所述第二判断模块,包括:
[0051]包名获得单元,用于在所述目标文件的路径与可清理文件的路径相同的情况下,获取所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称;
[0052]相似度计算单元,用于计算所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度;
[0053]第二判断单元,用于判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值;
[0054]第一确定单元,用于在所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值的情况下,确定所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值。
[0055]可选的,所述第二判断单元,包括:
[0056]切分子单元,用于将所述目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称分别按照字符段切分为多个安装包名称片段;
[
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1