本发明涉及计算机技术领域,具体而言,本发明涉及一种文件的清理方法和一种客户端文件的清理方法,及一种文件的清理装置和一种文件清理的客户端。
背景技术:
随着软件相关技术的飞速发展,人们的生活和工作对应用程序的依赖度也随之提高,人们在终端设备中使用的应用程序的种类也越来越多,当越来越多的应用程序在终端设备中运行时,将会产生大量的垃圾文件,导致终端设备的大量存储空间被无用数据占用,严重时将致使终端设备储空间不足,从而影响终端设备的运行效率,因此需要对终端设备的垃圾文件进行清理。
现有的垃圾文件清理技术,在确定垃圾文件的过程中,需要人工在垃圾文件库中进行判断比对及筛选操作,无法实现自动化的确认垃圾文件,由于人工确定的垃圾文件的类型存在一定的错误率,且由于人工筛选存在一定时间滞后情况,无法及时的获取各类型的垃圾文件。因此现有的垃圾清理文件技术在清理垃圾文件时容易出现错误清理或清理不干净的情况,从而可能导致将用户的有用文件清除,使得相应的应用程序运行出错。因此,需要一种文件的清理方案,实现安全高效的垃圾文件清理。
技术实现要素:
为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:
本发明的实施例提出了一种文件的清理方法,包括:
接收客户端发送的待清理文件的特征数据;
将待清理文件的特征数据输入预存的判断模型以获取输出结果;
基于输出结果确定待清理文件的文件清理目录;
将待清理文件的文件清理目录下发至相应的客户端。
可选地,该方法还包括:
获取多个文件的相关信息及相应的清理方式以作为原始样本数据;
基于原始样本数据构建训练特征;
将训练特征通过预定的算法进行训练以确定判断模型;
其中,预定的算法包括GBDT分类算法。
优选地,将待清理文件的特征数据输入预存的判断模型以获取输出结果,包括:
将待清理文件的特征数据输入预存的判断模型,依据判断模型中的判断规则来确定待清理文件中的文件是否需要清理,并作为输出结果;
其中,判断规则包括以下至少一项:
清理包含预定名称后缀的文件;
清理系统的日志文件;
清理应用程序卸载后的残留文件;
清理具有相同后缀名文件的数量大小超过预定阈值的文件。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
本发明的另一实施例提出了一种客户端文件的清理方法,包括:
基于文件清理的触发操作,提取待清理文件的特征数据;
将待清理文件的特征数据发送至服务器进行训练;
接收服务器返回的待清理文件的文件清理目录;
根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
优选地,对待清理文件执行相应的操作包括一键清理、手动清理、建议保留中的至少一项。
优选地,根据待清理文件的清理目录,对文件执行相应的一键清理操作,包括:
获取待清理文件的清理目录中清理文件的文件名称;
根据清理文件的文件名称,对客户端中对应文件名称的文件执行一键清理操作。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
本发明的又另一实施例提出了一种文件的清理装置,包括:
第一接收模块,用于接收客户端发送的待清理文件的特征数据;
输入模块,用于将待清理文件的特征数据输入预存的判断模型以获取输出结果;
确定模块,用于基于输出结果确定待清理文件的文件清理目录;
下发模块,用于将待清理文件的文件清理目录下发至相应的客户端。
可选地,该装置还包括:
获取模块,用于获取多个文件的相关信息及相应的清理方式以作为原始样本数据;
构建模块,用于基于原始样本数据构建训练特征;
训练模块,用于将训练特征通过预定的算法进行训练以确定判断模型;
其中,预定的算法包括GBDT分类算法。
优选地,输入模块用于将待清理文件的特征数据输入预存的判断模型,依据判断模型中的判断规则来确定待清理文件中的文件是否需要清理,并作为输出结果;
其中,判断规则包括以下至少一项:
清理包含预定名称后缀的文件;
清理系统的日志文件;
清理应用程序卸载后的残留文件;
清理具有相同后缀名文件的数量大小超过预定阈值的文件。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
本发明的再另一实施例提出了一种文件清理的客户端,包括:
提取模块,用于基于文件清理的触发操作,提取待清理文件的特征数据;
发送模块,用于将待清理文件的特征数据发送至服务器进行训练;
第二接收模块,用于接收服务器返回的待清理文件的文件清理目录;
执行模块,用于根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
优选地,对待清理文件执行相应的操作包括一键清理、手动清理、建议保留中的至少一项。
优选地,执行模块,包括:
获取单元,用于获取待清理文件的清理目录中清理文件的文件名称;
一键清理单元,用于根据清理文件的文件名称,对客户端中对应文件名称的文件执行一键清理操作。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
本发明的实施例中,提出了一种文件的清理方案,接收客户端发送的待清理文件的特征数据,将待清理文件的特征数据输入预存的判断模型以获取输出结果,实现了自动化对客户端发送的待清理文件的特征数据进行精确快速地处理,为后续确定待清理文件的文件清理目录提供了可靠的前提保障;基于输出结果确定待清理文件的文件清理目录,将待清理文件的文件清理目录下发至相应的客户端,为相应的客户端精确快速地根据待清理文件的文件清理目录清理相应的文件提供了重要的前提保障。进一步地,通过清理相应客户端的待清理文件,使得相应客户端所在终端设备提高了运行效率,从而提高了用户使用体验。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明中一个实施例的文件的清理方法的流程图;
图2为本发明中另一实施例的客户端文件的清理方法的流程图;
图3为本发明中又一实施例的文件的清理装置的结构示意图;
图4为本发明中再一实施例的文件清理的客户端的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
图1为本发明中一个实施例的文件的清理方法的流程图。
本发明的实施例中,各步骤所执行的内容概述如下:步骤S110:接收客户端发送的待清理文件的特征数据;步骤S120:将待清理文件的特征数据输入预存的判断模型以获取输出结果;步骤S130:基于输出结果确定待清理文件的文件清理目录;步骤S140:将待清理文件的文件清理目录下发至相应的客户端。
本发明的实施例中,提出了一种文件的清理方法,接收客户端发送的待清理文件的特征数据,将待清理文件的特征数据输入预存的判断模型以获取输出结果,实现了自动化对客户端发送的待清理文件的特征数据进行精确快速地处理,为后续确定待清理文件的文件清理目录提供了可靠的前提保障;基于输出结果确定待清理文件的文件清理目录,将待清理文件的文件清理目录下发至相应的客户端,为相应的客户端精确快速地根据待清理文件的文件清理目录清理相应的文件提供了重要的前提保障。进一步地,通过清理相应客户端的待清理文件,使得相应客户端所在终端设备提高了运行效率,从而提高了用户使用体验。
以下针对各个步骤的具体实现做进一步的说明:
步骤S110:接收客户端发送的待清理文件的特征数据。
具体地,服务器接收客户端发送的待清理文件的特征数据。
其中,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件清理目录下文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
例如,服务器接收终端设备发送的待清理文件的特征数据,如应用程序QQ的包名信息“com.tencent.mm”、QQ在终端设备中的根路径信息“../data/”、QQ在终端设备中的子路径信息“../data/data/com.tencent.qq/databases/”、QQ包名的标签信息“1”、QQ包名的分类信息“即时通信”、文件的后缀信息,如终端设备“../data/”目录下的文件包含的两种后缀名分别为“.temp”和“.txt”、应用程序文件的大小和应用程序文件的数量,如终端设备“../data/data/com.tencent.qq/databases/”路径下各个文件的大小信息和所有文件的总数量100个、后缀名为“.temp”文件的总数量为50个和后缀名为“.txt”文件的总数量为10个。
步骤S120:将待清理文件的特征数据输入预存的判断模型以获取输出结果。
具体地,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,以获取训练后的输出结果。
在实际应用中,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练之前,可预先将待清理文件的特征数据进行归一化处理,再将归一化处理后的待清理文件的特征数据输入判断模型进行训练得到训练后的输出结果,输出结果包括了待清理文件对应的文件类型、清理类型和清理建议等信息。
又例如,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,预存的判断模型训练待清理文件的特征数据的方法如将待清理文件的特征数据通过矩阵数据分析法进行分析处理,在矩阵图的基础上,把各个待清理文件的特征数据分别放在行和列,随后在行和列的交叉点中用数量来描述这些因素之间的对比,再进行数量计算,定量分析,确定相对需要清理的可能性较大的待清理文件的特征数据,得到训练后的输出结果,输出结果包括了待清理文件对应的文件类型、清理类型和清理建议等信息。
在一优选实施例中,步骤S120具体包括步骤S121(图中未示出);步骤S121:将待清理文件的特征数据输入预存的判断模型,依据判断模型中的判断规则来确定待清理文件中的文件是否需要清理,并作为输出结果;
其中,判断规则包括以下至少一项:
清理包含预定名称后缀的文件;
清理系统的日志文件;
清理应用程序卸载后的残留文件;
清理具有相同后缀名文件的数量大小超过预定阈值的文件。
例如,服务器将接收到的终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,预存的判断模型训练待清理文件的特征数据的方法如将待清理文件的特征数据通过矩阵数据分析法进行分析处理,确定相对需要清理的可能性较大的待清理文件的特征数据;判断模型中的判断规则如清理包含“.temp”后缀的文件、清理系统的日志文件、清理应用程序卸载后的残留文件和清理具有相同后缀名文件的数量大小超过200个的文件,随后依据判断规则,判断通过矩阵数据分析法进行分析处理后确定相对需要清理的可能性较大的各待清理文件的特征数据中包含“.temp”后缀的文件、日志文件、QQ卸载后的残留文件、微信卸载后的残留文件为需要清理的文件,各待清理文件的特征数据中具有相同后缀名“.txt”文件的数量大小300个,依据判断规则清理具有相同后缀名文件的数量大小超过200个的文件,可判断各后缀名为“.txt”的文件为需要清理的文件,并输出判断结果,输出结果包括了各待清理文件对应的文件类型如系统文件或日志文件等、清理类型如一键清理或手动清理和清理建议如建议保留等信息。
步骤S130:基于输出结果确定待清理文件的文件清理目录。
具体地,基于预存的判断模型的输出结果确定待清理文件的文件清理目录。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
例如,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,基于训练后的输出结果中的各待清理文件对应的文件类型、清理类型和清理建议等信息,确定待清理文件的文件清理目录,如文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”,对应该文件描述信息的清理类型信息为“文本清理”、清理建议信息为“一键清理”和卸载残留信息为“非卸载残留文件”。
步骤S140:将待清理文件的文件清理目录下发至相应的客户端。
具体地,将基于输出结果确定待清理文件的文件清理目录下发至发送该待清理文件特征数据的客户端。
例如,服务器将接收终端设备A的客户端发送的待清理文件的特征数据输入预存的判断模型进行训练,基于训练后的输出结果中的各待清理文件对应的文件类型、清理类型和清理建议等信息,确定待清理文件的文件清理目录,随后,将该文件清理目录下发至终端设备A该相应的客户端。
在一优选实施例中,该方法还包括步骤S150(图中未示出)、步骤S160(图中未示出)和步骤S170(图中未示出);步骤S150:获取多个文件的相关信息及相应的清理方式以作为原始样本数据;步骤S160:基于原始样本数据构建训练特征;步骤S170:将训练特征通过预定的算法进行训练以确定判断模型。
优选地,预定的算法包括GBDT分类算法。
例如,服务器从历史数据中获取各待清理文件的相关信息,包括各待清理文件的特征数据,以及各待清理文件的清理方式,清理方式包括一键清理、手动清理和建议保留,作为原始样本数据,基于已获取的原始样本数据通过矩阵数据分析法构建训练特征,将训练特征通过GBDT分类算法进行训练以确定判断模型。
图2为本发明中另一实施例的客户端文件的清理方法的流程图。
本发明的实施例中,各步骤所执行的内容概述如下:步骤S210:基于文件清理的触发操作,提取待清理文件的特征数据;步骤S220:将待清理文件的特征数据发送至服务器进行训练;步骤S230:接收服务器返回的待清理文件的文件清理目录;步骤S240:根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
以下针对各个步骤的具体实现做进一步的说明:
步骤S210:基于文件清理的触发操作,提取待清理文件的特征数据。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、目录下文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
例如,在客户端的终端设备中,用户点击应用程序APP提供的人机交互界面中的文件清理按钮,随后基于对文件清理按钮的点击触发操作,APP提取待清理文件的特征数据,如应用程序QQ的包名信息“com.tencent.mm”、QQ在终端设备中的根路径信息“../data/”、QQ在终端设备中的子路径信息“../data/data/com.tencent.qq/databases/”、QQ包名的标签信息“1”、QQ包名的分类信息“即时通信”、文件的后缀信息,如终端设备“../data/”目录下的文件包含的两种后缀名分别为“.temp”和“.txt”、应用程序文件的大小和应用程序文件的数量,如终端设备“../data/data/com.tencent.qq/databases/”路径下各个文件的大小信息和所有文件的总数量1000个、后缀名为“.temp”文件的总数量为500个和后缀名为“.txt”文件的总数量为100个。
步骤S220:将待清理文件的特征数据发送至服务器进行训练。
例如,在客户端的终端设备A中,用户触发文件清理按钮,客户端提取待清理文件的特征数据,随后将已提取的待清理文件的特征数据发送至服务器的预存的判断模型进行训练,服务器根据输出结果确定待清理文件的文件清理目录,随后服务器将该确定待清理文件的文件清理目录下发至终端设备A的该客户端。
步骤S230:接收服务器返回的待清理文件的文件清理目录。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
例如,接上例,客户端的终端设备A,接收服务器返回的的待清理文件的文件清理目录,文件清理目录中包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留,如文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”,对应该文件描述信息的清理类型信息为“文本清理”、清理建议信息为“一键清理”和卸载残留信息为“非卸载残留文件”。
步骤S240:根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
其中,对待清理文件执行相应的操作包括一键清理、手动清理、建议保留中的至少一项。
在一优选实施例中,步骤S240进一步包括步骤S241(图中未示出)和步骤S242(图中未示出);步骤S241:获取待清理文件的清理目录中清理文件的文件名称;步骤S242:根据清理文件的文件名称,对客户端中对应文件名称的文件执行一键清理操作。
例如,客户端接收到服务器返回的的待清理文件的文件清理目录,根据待清理文件的文件清理目录中文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”对应的清理建议信息为“一键清理”,对终端设备中“../data/data/com.tencent.qq/databases/”路径下的“aaa.temp”文件执行一键清理的操作,根据待清理文件的文件清理目录中文件的描述信息为“文件名:bb.cache,文件路径:../data/data/com.tencent.qq/databases/”对应的清理建议信息为“建议保留”,对终端设备中“../data/data/com.tencent.qq/databases/”路径下的“bb.cache”文件不执行任何操作。
图3为本发明中又另一实施例的文件的清理装置的结构示意图。
本发明的实施例中,各模块所执行的内容概述如下:第一接收模块310接收客户端发送的待清理文件的特征数据;输入模块320将待清理文件的特征数据输入预存的判断模型以获取输出结果;确定模块330基于输出结果确定待清理文件的文件清理目录;下发模块340将待清理文件的文件清理目录下发至相应的客户端。
本发明的实施例中,提出了一种文件的清理装置,接收客户端发送的待清理文件的特征数据,将待清理文件的特征数据输入预存的判断模型以获取输出结果,实现了自动化对客户端发送的待清理文件的特征数据进行精确快速地处理,为后续确定待清理文件的文件清理目录提供了可靠的前提保障;基于输出结果确定待清理文件的文件清理目录,将待清理文件的文件清理目录下发至相应的客户端,为相应的客户端精确快速地根据待清理文件的文件清理目录清理相应的文件提供了重要的前提保障。进一步地,通过清理相应客户端的待清理文件,使得相应客户端所在终端设备提高了运行效率,从而提高了用户使用体验。
以下针对各个模块的具体实现做进一步的说明:
第一接收模块310接收客户端发送的待清理文件的特征数据。
具体地,服务器接收客户端发送的待清理文件的特征数据。
其中,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件清理目录下文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
例如,服务器接收终端设备发送的待清理文件的特征数据,如应用程序QQ的包名信息“com.tencent.mm”、QQ在终端设备中的根路径信息“../data/”、QQ在终端设备中的子路径信息“../data/data/com.tencent.qq/databases/”、QQ包名的标签信息“1”、QQ包名的分类信息“即时通信”、文件的后缀信息,如终端设备“../data/”目录下的文件包含的两种后缀名分别为“.temp”和“.txt”、应用程序文件的大小和应用程序文件的数量,如终端设备“../data/data/com.tencent.qq/databases/”路径下各个文件的大小信息和所有文件的总数量100个、后缀名为“.temp”文件的总数量为50个和后缀名为“.txt”文件的总数量为10个。
输入模块320将待清理文件的特征数据输入预存的判断模型以获取输出结果。
具体地,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,以获取训练后的输出结果。
在实际应用中,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练之前,可预先将待清理文件的特征数据进行归一化处理,再将归一化处理后的待清理文件的特征数据输入判断模型进行训练得到训练后的输出结果,输出结果包括了待清理文件对应的文件类型、清理类型和清理建议等信息。
又例如,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,预存的判断模型训练待清理文件的特征数据的方法如将待清理文件的特征数据通过矩阵数据分析法进行分析处理,在矩阵图的基础上,把各个待清理文件的特征数据分别放在行和列,随后在行和列的交叉点中用数量来描述这些因素之间的对比,再进行数量计算,定量分析,确定相对需要清理的可能性较大的待清理文件的特征数据,得到训练后的输出结果,输出结果包括了待清理文件对应的文件类型、清理类型和清理建议等信息。
在一优选实施例中,输入模块320将待清理文件的特征数据输入预存的判断模型,依据判断模型中的判断规则来确定待清理文件中的文件是否需要清理,并作为输出结果;
其中,判断规则包括以下至少一项:
清理包含预定名称后缀的文件;
清理系统的日志文件;
清理应用程序卸载后的残留文件;
清理具有相同后缀名文件的数量大小超过预定阈值的文件。
例如,服务器将接收到的终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,预存的判断模型训练待清理文件的特征数据的方法如将待清理文件的特征数据通过矩阵数据分析法进行分析处理,确定相对需要清理的可能性较大的待清理文件的特征数据;判断模型中的判断规则如清理包含“.temp”后缀的文件、清理系统的日志文件、清理应用程序卸载后的残留文件和清理具有相同后缀名文件的数量大小超过200个的文件,随后依据判断规则,判断通过矩阵数据分析法进行分析处理后确定相对需要清理的可能性较大的各待清理文件的特征数据中包含“.temp”后缀的文件、日志文件、QQ卸载后的残留文件、微信卸载后的残留文件为需要清理的文件,各待清理文件的特征数据中具有相同后缀名“.txt”文件的数量大小300个,依据判断规则清理具有相同后缀名文件的数量大小超过200个的文件,可判断各后缀名为“.txt”的文件为需要清理的文件,并输出判断结果,输出结果包括了各待清理文件对应的文件类型如系统文件或日志文件等、清理类型如一键清理或手动清理和清理建议如建议保留等信息。
确定模块330基于输出结果确定待清理文件的文件清理目录。
具体地,基于预存的判断模型的输出结果确定待清理文件的文件清理目录。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
例如,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,基于训练后的输出结果中的各待清理文件对应的文件类型、清理类型和清理建议等信息,确定待清理文件的文件清理目录,如文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”,对应该文件描述信息的清理类型信息为“文本清理”、清理建议信息为“一键清理”和卸载残留信息为“非卸载残留文件”。
下发模块340将待清理文件的文件清理目录下发至相应的客户端。
具体地,将基于输出结果确定待清理文件的文件清理目录下发至发送该待清理文件特征数据的客户端。
例如,服务器将接收终端设备A的客户端发送的待清理文件的特征数据输入预存的判断模型进行训练,基于训练后的输出结果中的各待清理文件对应的文件类型、清理类型和清理建议等信息,确定待清理文件的文件清理目录,随后,将该文件清理目录下发至终端设备A该相应的客户端。
在一优选实施例中,该装置还包括获取模块350(图中未示出)、构建模块360(图中未示出)和训练模块370(图中未示出);获取模块350获取多个文件的相关信息及相应的清理方式以作为原始样本数据;构建模块360基于原始样本数据构建训练特征;训练模块370将训练特征通过预定的算法进行训练以确定判断模型。
优选地,预定的算法包括GBDT分类算法。
例如,服务器从历史数据中获取各待清理文件的相关信息,包括各待清理文件的特征数据,以及各待清理文件的清理方式,清理方式包括一键清理、手动清理和建议保留,作为原始样本数据,基于已获取的原始样本数据通过矩阵数据分析法构建训练特征,将训练特征通过GBDT分类算法进行训练以确定判断模型。
图4为本发明中再另一实施例的文件清理的客户端的结构示意图。
本发明的实施例中,各模块所执行的内容概述如下:提取模块410基于文件清理的触发操作,提取待清理文件的特征数据;发送模块420将待清理文件的特征数据发送至服务器进行训练;第二接收模块430接收服务器返回的待清理文件的文件清理目录;执行模块440根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
以下针对各个模块的具体实现做进一步的说明:
提取模块410基于文件清理的触发操作,提取待清理文件的特征数据。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、目录下文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
例如,在客户端的终端设备中,用户点击应用程序APP提供的人机交互界面中的文件清理按钮,随后基于对文件清理按钮的点击触发操作,APP提取待清理文件的特征数据,如应用程序QQ的包名信息“com.tencent.mm”、QQ在终端设备中的根路径信息“../data/”、QQ在终端设备中的子路径信息“../data/data/com.tencent.qq/databases/”、QQ包名的标签信息“1”、QQ包名的分类信息“即时通信”、文件的后缀信息,如终端设备“../data/”目录下的文件包含的两种后缀名分别为“.temp”和“.txt”、应用程序文件的大小和应用程序文件的数量,如终端设备“../data/data/com.tencent.qq/databases/”路径下各个文件的大小信息和所有文件的总数量1000个、后缀名为“.temp”文件的总数量为500个和后缀名为“.txt”文件的总数量为100个。
发送模块420将待清理文件的特征数据发送至服务器进行训练。
例如,在客户端的终端设备A中,用户触发文件清理按钮,客户端提取待清理文件的特征数据,随后将已提取的待清理文件的特征数据发送至服务器的预存的判断模型进行训练,服务器根据输出结果确定待清理文件的文件清理目录,随后服务器将该确定待清理文件的文件清理目录下发至终端设备A的该客户端。
第二接收模块430接收服务器返回的待清理文件的文件清理目录。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
例如,接上例,客户端的终端设备A,接收服务器返回的的待清理文件的文件清理目录,文件清理目录中包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留,如文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”,对应该文件描述信息的清理类型信息为“文本清理”、清理建议信息为“一键清理”和卸载残留信息为“非卸载残留文件”。
执行模块440根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
其中,对待清理文件执行相应的操作包括一键清理、手动清理、建议保留中的至少一项。
在一优选实施例中,执行模块440包括获取单元441(图中未示出)和一键清理单元442(图中未示出);获取单元441获取待清理文件的清理目录中清理文件的文件名称;一键清理单元442根据清理文件的文件名称,对客户端中对应文件名称的文件执行一键清理操作。
例如,客户端接收到服务器返回的的待清理文件的文件清理目录,根据待清理文件的文件清理目录中文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”对应的清理建议信息为“一键清理”,对终端设备中“../data/data/com.tencent.qq/databases/”路径下的“aaa.temp”文件执行一键清理的操作,根据待清理文件的文件清理目录中文件的描述信息为“文件名:bb.cache,文件路径:../data/data/com.tencent.qq/databases/”对应的清理建议信息为“建议保留”,对终端设备中“../data/data/com.tencent.qq/databases/”路径下的“bb.cache”文件不执行任何操作。
本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随即存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。