应用清理方法、装置、存储介质及电子设备与流程

文档序号:15049812发布日期:2018-07-28 00:01阅读:199来源:国知局
本申请涉及通信
技术领域
,具体涉及一种应用清理方法、装置、存储介质及电子设备。
背景技术
:目前,智能手机等电子设备上,通常会有多个应用同时运行,其中,一个应用在前台运行,其他应用在后台运行。如果长时间不清理后台运行的应用,则会导致电子设备的可用内存变小、中央处理器(centralprocessingunit,cpu)占用率过高,导致电子设备出现运行速度变慢,卡顿,耗电过快等问题。因此,有必要提供一种方法解决上述问题。技术实现要素:有鉴于此,本申请实施例提供了一种应用清理方法、装置、存储介质及电子设备,能够提高电子设备的运行流畅度,降低功耗。第一方面,本申请实施例了提供了的一种应用清理方法,包括:采集应用的多维特征作为训练样本,并构建至少两个训练集,所述至少两个训练集具有不同类型的多维特征;根据所述训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型;采集所述应用的多维特征作为预测样本,得到至少两个预测集,所述预测集与相应的训练集具有相同类型的多维特征;根据所述预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,所述预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;根据所述预测概率预测所述应用是否可清理。第二方面,本申请实施例了提供了的一种应用清理装置,包括:训练集构建单元,用于采集应用的多维特征作为训练样本,并构建至少两个训练集,所述至少两个训练集具有不同类型的多维特征;模型训练单元,用于根据所述训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型;采集单元,用于采集所述应用的多维特征作为预测样本,得到至少两个预测集,所述预测集与相应的训练集具有相同类型的多维特征;输出单元,用于根据所述预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,所述预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;预测单元,用于根据所述预测概率预测所述应用是否可清理。第三方面,本申请实施例提供的存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如本申请任一实施例提供的应用清理方法。第四方面,本申请实施例提供的电子设备,包括处理器和存储器,所述存储器有计算机程序,其特征在于,所述处理器通过调用所述计算机程序,用于执行如本申请任一实施例提供的应用清理方法。本申请实施例采集应用的多维特征作为训练样本,并构建至少两个训练集,至少两个训练集具有不同类型的多维特征;根据训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型;采集应用的多维特征作为预测样本,得到至少两个预测集,预测集与相应的训练集具有相同类型的多维特征;根据预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,该预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;根据预测概率预测应用是否可清理;以便清理可以清理的应用,以此实现了应用的自动清理,提高了电子设备的运行流畅度,降低了功耗。附图说明为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的应用清理方法的应用场景示意图。图2是本申请实施例提供的应用清理方法的一个流程示意图。图3是本申请实施例提供的应用清理预测的一个原理示意图。图4是本申请实施例提供的应用清理方法的另一个流程示意图。图5是本申请实施例提供的一种应用清理预测的另一个原理示意图。图6是本申请实施例提供的应用清理装置的一个结构示意图。图7是本申请实施例提供的应用清理装置的另一个结构示意图。图8是本申请实施例提供的应用清理装置的又一结构示意图。图9是本申请实施例提供的电子设备的一个结构示意图。图10是本申请实施例提供的电子设备的另一结构示意图。具体实施方式请参照图式,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。本文所使用的术语“模块”可看做为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文所述的装置及方法可以以软件的方式进行实施,当然也可在硬件上进行实施,均在本申请保护范围之内。本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是某些实施例还包括没有列出的步骤或模块,或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。本申请实施例提供一种应用清理方法,该应用清理方法的执行主体可以是本申请实施例提供的应用清理装置,或者集成了该应用清理装置的电子设备,其中该应用清理装置可以采用硬件或者软件的方式实现。其中,电子设备可以是智能手机、平板电脑、掌上电脑、笔记本电脑、或者台式电脑等设备。请参阅图1,图1为本申请实施例提供的应用清理方法的应用场景示意图,以应用清理装置集成在电子设备中为例,电子设备可以采集应用的多维特征作为训练样本,并构建至少两个训练集,至少两个训练集具有不同类型的多维特征;根据训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型;采集应用的多维特征作为预测样本,得到至少两个预测集,预测集与相应的训练集具有相同类型的多维特征;根据预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,该预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;根据预测概率预测应用是否可清理。电子设备还可以对预测可清理的应用进行清理。具体地,例如图1所示,以判断后台运行的应用程序a(如邮箱应用、游戏应用等)是否可以清理为例,可以在历史时间段内,采集应用a的多维特征(例如应用a在后台运行的时长、应用a运行的时间信息等)作为训练样本,并构建至少两个训练集,采集应用a的多维特征作为预测样本,得到至少两个预测集,预测集与相应的训练集具有相同类型的多维特征;根据预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,该预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;根据预测概率预测应用a是否可清理。当预测应用a可清理时,电子设备对应用a进行清理。请参阅图2,图2为本申请实施例提供的应用清理方法的流程示意图。本申请实施例提供的应用清理方法的具体流程可以如下:201、采集应用的多维特征作为训练样本,并构建至少两个训练集,至少两个训练集具有不同类型的多维特征。本实施例所提及的应用,可以是电子设备上安装的任何一个应用,例如办公应用、通信应用、游戏应用、购物应用等。该应用可以为前台运行的应用,即前台运行,也可以为后台运行的应用,即后台应用。应用的多维特征信息具有一定长度的维度,其每个维度上的参数均对应表征应用的一种特征信息,即该多维特征信息由多个特征信息构成。该多个特征信息可以包括应用自身相关的特征信息,例如:应用切入到后台的时长;应用切入到后台期间,电子设备的灭屏时长;应用进入前台的次数;应用处于前台的时间;应用进入后台的方式,例如被主页键(home键)切换进入、被返回键切换进入,被其他应用切换进入等;应用的类型,包括一级(常用应用)、二级(其他应用)等。该多个特征信息还可以包括应用所在的电子设备的相关特征信息,例如:电子设备的灭屏时间、亮屏时间、当前电量,电子设备的无线网络连接状态,电子设备是否在充电状态等。应用的训练集中,可以包括在历史时间段内,按照预设频率采集的多个训练样本。历史时间段,例如可以是过去7天、10天;预设频率,例如可以是每10分钟采集一次、每半小时采集一次。可以理解的是,一次采集的应用的多维特征数据构成一个训练样本,多个训练样本,构成训练集。本申请实施例中,可以构建至少两个训练集,具体地,训练集的数量可以根据实际需求设定,如两个、三个、四个、五个等等。本申请实施例中,可以采集应用的多维特征作为样本,并构建应用的样本集;将样本集划分成至少两个具有不同类型多维特征的子样本集,得到至少两个训练集。其中,训练集用于对逻辑回归模型进行训练。至少两个训练集具有不同类型的多维特征指的是:至少两个训练集具有的多维特征的特征类型部分不相同或者完全不相同;也即各个训练集具有的部分特征或者所有特征的类型不相同。例如,训练集1包括多个特征,训练集2包括多个特征,这两个训练集具有不同类型的多维特征可以为训练集1中所有特征的特征类型与训练集2中所有特征的特征类型完全不相同,或者训练集1与训练集2中部分特征类型相同。例如,训练集1包括:特征1、特征2……特征i,训练集2包括特征i+1……特征n;此时,训练集1与训练集2中所有特征的特征类均不相同。又例如,训练集1包括:特征1、特征2……特征i,训练集2包括特征3……特征n;此时,训练集1与训练集2中部分特征的特征类不相同。在一实施例中,至少个训练集包含的特征数量可以是相同的,比如均包含十个特征,但是每个训练集的十个特征与其他训练集的十个特征的特征类型不相同。例如以三个训练集、即训练集1、训练集2、训练集3为例,其中,训练集1、训练集2、训练集3的特征类型不相同,但是特征数量均为十个,也即一个训练样本可以由十个特征构成。比如,如下:训练集1的特征可以包括:app上一次切入后台到现在的时长;app上一次切入后台到现在的期间中,累计屏幕关闭时间长度;app上一次在前台被使用时长;app上上一次在前台被使用时长;app上上上一次在前台被使用时长;app一天里(按每天统计)进入前台的次数;app一天里(休息日按工作日、休息日分开统计)进入前台的次数;app一天中(按每天统计)处于前台的时间。训练集2的特征包括:目标app在后台停留时间直方图第一个bin(0-5分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(5-10分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(10-15分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(25-30分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(30分钟以后对应的次数占比);目标app一级类型;目标app二级类型;目标app被切换的方式,分为被home键切换、被recent键切换、被其他app切换;训练集3的特征包括:屏幕量灭时间;当前屏幕亮灭状态;当前是否有在充电;当前的电量;当前wifi状态;当前时间所处当天的时间段index;该后台app紧跟当前前台app后被打开次数,不分工作日休息日统计所得;该后台app紧跟当前前台app后被打开次数,分工作日休息日统计;当前前台app进入后台到目标app进入前台按每天统计的平均间隔时间;当前前台app进入后台到目标app进入前台期间按每天统计的平均屏幕熄灭时间。在构成训练集之后,可以对训练集中的每个样本进行标记,得到每个样本的样本标签,由于本实施要实现的是预测应用是否可以清理,因此,所标记的样本标签包括可清理和不可清理,。此时,样本类别可以包括可清理、不可清理。。具体可根据用户对应用的历史使用习惯进行标记,例如:当应用进入后台30分钟后,用户关闭了该应用,则标记为“可清理”;再例如,当应用进入后台3分钟之后,用户将应用切换到了前台运行,则标记为“不可清理”。具体地,可以用数值“1”表示“可清理”,用数值“0”表示“不可清理”,反之亦可。为便于分类、训练,可以将应用的多维特征信息中,未用数值直接表示的特征信息用具体的数值量化出来,例如针对电子设备的无线网连接状态这个特征信息,可以用数值1表示正常的状态,用数值0表示异常的状态(反之亦可);再例如,针对电子设备是否在充电状态这个特征信息,可以用数值1表示充电状态,用数值0表示未充电状态(反之亦可)。202、根据训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型。其中,逻辑回归(logisticregression,lr)模型集合包含至少两个逻辑回归模型,一个逻辑回归模型对应一个训练集,即逻辑回归模型的数量与训练集的数量相同,如均为三个等。逻辑回归(logisticregression,lr)模型是机器学习中的一种分类模型,由于算法的简单和高效,在实际中应用非常广泛。逻辑回归主要通过构造一个重要的指标:发生比来判定因变量的类别。其引入概率的概念,把事件(如应用可清理)发生定义为y=1,事件(如应用不可清理)未发生定义为y=0,那么事件发生的概率为p,事件未发生的概率为1-p,把p看成x的线性函数。在实际应用中,逻辑回归模型的表现形式有多种,比如,以分类器形式,按照分类器的分类能力,可以将分类器划分成:弱分类器和强分类器。所以,分类器一般指的计时逻辑回归模型。参考图3,以n个训练集(训练集1、训练集2……训练集n),n个逻辑回归模型为(逻辑回归模型1、逻辑回归模型2……逻辑回归模型n),n大于2,根据训练集1训练逻辑回归模型1,根据训练集2训练逻辑回归模型2……根据训练集n训练逻辑回归模型n,这样得到训练后逻辑回归模型1、训练后逻辑回归模型2……训练后逻辑回归模型n。本申请实施例,可以利用训练集对相应的逻辑回归模型进行训练,得到相应的训练后逻辑回归模型。其中,对逻辑回归模型进行训练指的利用训练集求解逻辑回归模型中的模型参数。也即步骤“根据训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练”可以包括:根据训练集获取逻辑回归模型集合中相应逻辑回归模型的损失函数;根据损失函数估计逻辑回归模型中的目标模型参数。其中,损失函数(lossfunction)是用来估量模型的预测值f(x)与真实值y的不一致程度,它是一个非负实值函数,通常使用l(y,f(x)),或者l(w)来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。其中,w为模型参数。本申请实施例中,可以利用损失函数估计逻辑回归模型的模型参数。比如,可以基于梯度下降法对损失函数求解最大值,以得到逻辑回归模型中的目标模型参数。例如,当基于梯度下降法求解损失函数l(w)的最大值时,w的取值,此时,w的取值即为模型参数值。比如,以n个训练集(训练集1、训练集2……训练集n),n个逻辑回归模型为(逻辑回归模型1、逻辑回归模型2……逻辑回归模型n),n大于2。根据训练集1获取逻辑回归模型1的损失函数,并基于梯度下降法对损失函数求解最大值,以得到逻辑回归模型1中的目标模型参数w,根据训练集2获取逻辑回归模型2的损失函数,并基于梯度下降法对损失函数求解最大值,以得到逻辑回归模型2中的目标模型参数w……根据训练集n获取逻辑回归模型n的损失函数,并基于梯度下降法对损失函数求解最大值,以得到逻辑回归模型n中的目标模型参数w。例如,对于每个训练集t={(x1,y1),(x2,y2),...,(xn,yn)},其中xi∈in,n=10,yi∈{0,1},即xi为10维向量,yi为二分类标签信息(如应用可清理、或者应用不可清理)。基于该训练集获取到的逻辑回归模型的损失函数为:其中,w为待求解的逻辑回归模型的模型参数,n为训练样本数量,。通过梯度下降法对l(w)求最大值即可求得估计参数此时学习到的逻辑回归模型为:p(y=1|x),p(y=0|x)即输出两个类别的概率大小;比如,p(y=1|x)为应用可清理的概率,p(y=0|x)为应用不可清理的概率。203、采集应用的多维特征作为预测样本,得到至少两个预测集,预测集与相应的训练集具有相同类型的多维特征。比如,可以根据预测时间采集应用的多维特征作为预测样本。其中,预测时间可以根据需求设定,如可以为当前时间等。譬如,可以在预测时间点采集应用的多维特征作为预测样本。其中,预测集的数量与训练集的数量相同,一个预测集对应一个训练集以及一个逻辑回归模型;预测集与相应的训练集具有相同类型的多维特征。在一实施例中,预测集的特征数量与相应训练集的特征数量相同。参考图3,例如,训练集数量为n时,训练集1、训练集2……训练集n,此时,预测集数量也为n,预测集1、预测集2……预测集n,其中,预测集1与训练集1具有相同类型和数量的特征,预测集2与训练集2具有相同类型和数量的特征,依次类推,预测集n与训练集n具有相同类型和数量的特征。例如,以上述训练集1、训练集2、训练集3为例,此时,预测集1的特征可以包括:app上一次切入后台到现在的时长;app上一次切入后台到现在的期间中,累计屏幕关闭时间长度;app上一次在前台被使用时长;app上上一次在前台被使用时长;app上上上一次在前台被使用时长;app一天里(按每天统计)进入前台的次数;app一天里(休息日按工作日、休息日分开统计)进入前台的次数;app一天中(按每天统计)处于前台的时间。预测集2的特征包括:目标app在后台停留时间直方图第一个bin(0-5分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(5-10分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(10-15分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(25-30分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(30分钟以后对应的次数占比);目标app一级类型;目标app二级类型;目标app被切换的方式,分为被home键切换、被recent键切换、被其他app切换;预测集3的特征包括:屏幕量灭时间;当前屏幕亮灭状态;当前是否有在充电;当前的电量;当前wifi状态;当前时间所处当天的时间段index;该后台app紧跟当前前台app后被打开次数,不分工作日休息日统计所得;该后台app紧跟当前前台app后被打开次数,分工作日休息日统计;当前前台app进入后台到目标app进入前台按每天统计的平均间隔时间;当前前台app进入后台到目标app进入前台期间按每天统计的平均屏幕熄灭时间。204、根据预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率。根据预测集机器及其对应的训练后逻辑回归模型,输出相应的预测概率,得到多个预测概率。一个逻辑回归模型输出一个包含应用可清理的第一概率、和应用不可清理的第二概率的预测概率。比如,参考图3,根据预测集1及其对应的训练后逻辑回归模型1输出相应的预测概率1、根据预测集2及其对应的训练后逻辑回归模型2输出相应的预测概率、……根据预测集n及其对应的训练后逻辑回归模型n输出相应的预测概率n。其中,预测概率可以包括应用可清理的概率以及应用不可清理的概率。例如,通过梯度下降法对l(w)求最大值即可求得估计参数此时学习到的逻辑回归模型为:p(y=1|x),p(y=0|x)即输出两个类别的概率大小;比如,p(y=1|x)为应用可清理的概率(或者应用不可清理的概率),p(y=0|x)为应用不可清理的概率(或者应用可清理的概率)。205、根据预测概率预测应用是否可清理。根据预测概率预测应用是否可清理的方式有多种,比如,可以计算应用可清理的概率总和、以及应用不可清理的概率总和,如果应用清理的概率总和大于应用不可清理的概率总和,那么确定应用可情况,反之亦可。在一实施例中,为了简化应用预测运行,提升预测速度,可以针对每个预测概率中两个概率选取一个概率,然后,基于选取的概率来预测应用是否可清理。比如,步骤“根据预测概率预测应用是否可清理”可以包括:针对每个预测概率,对预测概率内应用可清理的第一概率与应用不可清理的第二概率进行比较,得到比较结果;根据比较结果输出应用可清理的第一预测结果、或者应用不可清理的第二预测结果;根据第一预测结果的数量和第二预测结果的数量,确定应用是否可清理。在一实施例中,步骤“根据比较结果输出应用可清理的第一预测结果、或者应用不可清理的第二预测结果”可以包括:当第一概率大于第二概率时,输出应用可清理的第一预测结果;当第一概率不大于第二概率时,输出应用不可清理的第二预测结果。例如,对于某个预测概率,如果y=1表示应用可清理、y=0表示应用不可清理,假设p(y=1|x)大于p(y=0|x),此时,输出应用可清理的第一预测结果;假设p(y=1|x)不大于p(y=0|x),此时,输出应用不可清理的第二预测结果。本申请实施例中,可以基于应用可清理的第一预测结果数量以及应用不可清理的不可清理的第二预测结果数量,最终确定应用是否清理;也即,图3中对各自预测结果进行投票,得到最终预测结果。比如,步骤“根据第一预测结果的数量和第二预测结果的数量,确定应用是否可清理”可以包括:当第一预测结果的数量大于第二预测结果的数量时,确定应用可清理;当第一预测结果的数量不大于第二预测结果的数量时,确定应用不可清理。例如,以n个训练集为例,输出的预测结果有n个(包含第一概率和第二概率),此时,如果n个预测结果中应用可清理的第一预测结果数量a大于应用不可清理的第二预测结果数量b时,最终确定应用可清理,如果n个预测结果中应用可清理的第一预测结果数量a不大于应用不可清理的第二预测结果数量b时,最终确定应用不可清理;其中a+b=n。由上可知,本申请实施例采集应用的多维特征作为训练样本,并构建至少两个训练集,至少两个训练集具有不同类型的多维特征;根据训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型;采集应用的多维特征作为预测样本,得到至少两个预测集,预测集与相应的训练集具有相同类型的多维特征;根据预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,该预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;根据至少两个预测概率预测应用是否可清理;以便清理可以清理的应用,以此实现了应用的自动清理,提高了电子设备的运行流畅度,降低了功耗。进一步地,由于样本集的每个样本中,包括了反映用户使用应用的行为习惯的多个特征信息,因此本申请实施例可以使得对对应应用的清理更加个性化和智能化。进一步地,本申请将bagging思想应用到用户行为特征分类上,通过结合多个个独立的逻辑回归模型,投票预测最终结果,可以挖掘到用户的使用习惯。随着用户使用设备时间变长,训练会愈发充分,系统预测也会愈发准确;可以提升用户行为预测的准确性,进而提高清理的准确度。下面将在上述实施例描述的方法基础上,对本申请的清理方法做进一步介绍。参考图4,该应用清理方法可以包括:301、采集应用的多维特征作为训练样本,并对训练样本进行标记,到每个训练样本的样本标签。本实施例所提及的应用,可以是电子设备上安装的任何一个应用,例如办公应用、通信应用、游戏应用、购物应用等。该应用可以为前台运行的应用,即前台运行,也可以为后台运行的应用,即后台应用。应用的多维特征信息具有一定长度的维度,其每个维度上的参数均对应表征应用的一种特征信息,即该多维特征信息由多个特征信息构成。该多个特征信息可以包括应用自身相关的特征信息,例如:应用切入到后台的时长;应用切入到后台期间,电子设备的灭屏时长等等。该多个特征信息还可以包括应用所在的电子设备的相关特征信息,例如:电子设备的灭屏时间、亮屏时间、当前电量,电子设备的无线网络连接状态,电子设备是否在充电状态等。为便于预测应用是否可清理。可以对训练集中的每个样本进行标记,得到每个样本的样本标签,由于本实施要实现的是预测应用是否可以清理,因此,所标记的样本标签包括可清理和不可清理,。此时,样本类别可以包括可清理、不可清理。具体可根据用户对应用的历史使用习惯进行标记,例如:当应用进入后台30分钟后,用户关闭了该应用,则标记为“可清理”;再例如,当应用进入后台3分钟之后,用户将应用切换到了前台运行,则标记为“不可清理”。具体地,可以用数值“1”表示“可清理”,用数值“0”表示“不可清理”,反之亦可。302、将训练样本划分成多个具有不同类型特征的训练集。本申请实施例中,可以构建至少两个训练集,具体地,训练集的数量可以根据实际需求设定,如两个、三个、四个、五个等等。其中,训练集用于对逻辑回归模型进行训练。至少两个训练集具有不同类型的多维特征指的是:至少两个训练集具有的多维特征的特征类型部分不相同或者完全不相同;也即各个训练集具有的部分特征或者所有特征的类型不相同。比如,训练集1包括多个特征,训练集2包括多个特征,这两个训练集具有不同类型的多维特征可以为训练集1中所有特征的特征类型与训练集2中所有特征的特征类型完全不相同,或者训练集1与训练集2中部分特征类型相同。例如,参考图5,以三个训练集、即训练集1、训练集2、训练集3为例,其中,训练集1、训练集2、训练集3的特征类型不相同,但是特征数量均为十个,也即一个训练样本可以由十个特征构成。比如,如下:训练集1的特征可以包括:app上一次切入后台到现在的时长;app上一次切入后台到现在的期间中,累计屏幕关闭时间长度;app上一次在前台被使用时长;app上上一次在前台被使用时长;app上上上一次在前台被使用时长;app一天里(按每天统计)进入前台的次数;app一天里(休息日按工作日、休息日分开统计)进入前台的次数;app一天中(按每天统计)处于前台的时间。训练集2的特征包括:目标app在后台停留时间直方图第一个bin(0-5分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(5-10分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(10-15分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(25-30分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(30分钟以后对应的次数占比);目标app一级类型;目标app二级类型;目标app被切换的方式,分为被home键切换、被recent键切换、被其他app切换;训练集3的特征包括:屏幕量灭时间;当前屏幕亮灭状态;当前是否有在充电;当前的电量;当前wifi状态;当前时间所处当天的时间段index;该后台app紧跟当前前台app后被打开次数,不分工作日休息日统计所得;该后台app紧跟当前前台app后被打开次数,分工作日休息日统计;当前前台app进入后台到目标app进入前台按每天统计的平均间隔时间;当前前台app进入后台到目标app进入前台期间按每天统计的平均屏幕熄灭时间。303、根据训练集对相应的弱分类器进行训练,得到至少个训练后弱分类器。其中,弱分类器即为逻辑回归模型,是逻辑回归模型的一种表现形式。实际应用中按照分类器的分类能力,可以将分类器划分成:弱分类器和强分类器。所以,分类器一般指的计时逻辑回归模型。本申请实施例可以设置多个弱分类器,弱分类器的数量与训练集的数量相同,一个弱分类器对应一个训练集。参考图5,以3个训练集和3个弱分类器为例,可以利用训练集1对弱分类器进行训练,利用训练集2对弱分类器2进行训练、利用训练3对弱分类器进行训练。本申请实施例中,对弱分类器进行训练指的是利用训练集求解弱分类器的逻辑回归模型中的模型参数。比如,可以根据训练集获取弱分类器的逻辑回归模型函数的损失函数,损失函数估计逻辑回归模型函数的模型参数。其中,损失函数(lossfunction)是用来估量模型的预测值f(x)与真实值y的不一致程度,它是一个非负实值函数,通常使用l(y,f(x)),或者l(w)来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。其中,w为模型参数。本申请实施例中,可以利用损失函数估计逻辑回归模型的模型参数。比如,可以基于梯度下降法对损失函数求解最大值,以得到逻辑回归模型中的目标模型参数。例如,当基于梯度下降法求解损失函数l(w)的最大值时,w的取值,此时,w的取值即为模型参数值。例如,对于每个训练集t={(x1,y1),(x2,y2),...,(xn,yn)},其中xi∈in,n=10,yi∈{0,1},即xi为10维向量,yi为二分类标签信息(如应用可清理、或者应用不可清理)。基于该训练集获取到的逻辑回归模型的损失函数为:其中,w为待求解的逻辑回归模型的模型参数,n为t包含训练样本数量,g为损失函数的系数或者某个函数(如指数函数等)。通过梯度下降法对l(w)求最大值即可求得估计参数此时学习到的逻辑回归模型为:p(y=1|x),p(y=0|x)即输出两个类别的概率大小;比如,p(y=1|x)为应用可清理的概率,p(y=0|x)为应用不可清理的概率。304、采集应用的多维特征作为预测样本,得到多个预测集,预测集与相应的训练集具有相同类型的多维特征。比如,可以根据预测时间采集应用的多维特征作为预测样本。其中,预测时间可以根据需求设定,如可以为当前时间等。譬如,可以在预测时间点采集应用的多维特征作为预测样本。其中,预测集的数量与训练集的数量相同,一个预测集对应一个训练集以及一个逻辑回归模型;预测集与相应的训练集具有相同类型的多维特征。在一实施例中,预测集的特征数量与相应训练集的特征数量相同。例如,以上述训练集1、训练集2、训练集3为例,此时,预测集1的特征可以包括:app上一次切入后台到现在的时长;app上一次切入后台到现在的期间中,累计屏幕关闭时间长度;app上一次在前台被使用时长;app上上一次在前台被使用时长;app上上上一次在前台被使用时长;app一天里(按每天统计)进入前台的次数;app一天里(休息日按工作日、休息日分开统计)进入前台的次数;app一天中(按每天统计)处于前台的时间。预测集2的特征包括:目标app在后台停留时间直方图第一个bin(0-5分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(5-10分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(10-15分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(25-30分钟对应的次数占比);目标app在后台停留时间直方图第一个bin(30分钟以后对应的次数占比);目标app一级类型;目标app二级类型;目标app被切换的方式,分为被home键切换、被recent键切换、被其他app切换;预测集3的特征包括:屏幕量灭时间;当前屏幕亮灭状态;当前是否有在充电;当前的电量;当前wifi状态;当前时间所处当天的时间段index;该后台app紧跟当前前台app后被打开次数,不分工作日休息日统计所得;该后台app紧跟当前前台app后被打开次数,分工作日休息日统计;当前前台app进入后台到目标app进入前台按每天统计的平均间隔时间;当前前台app进入后台到目标app进入前台期间按每天统计的平均屏幕熄灭时间。305、根据预测集及其对应的训练后弱分类器,输出相应的预测概率,预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率。例如,将预测集输入到相应的训练后弱分类器,此时,弱分类器将会输出相应的预测概率。例如,参考图5,可以将预测集1输入至弱分类器1,此时,弱分类器1将会输出预测概率1,将预测集3输入至弱分类器2、此时,弱分类器2将会输出预测概率2,将预测集3输入至弱分类器3、此时,弱分类器3将会输出预测概率3。306、比较预测概率中应用可清理的第一概率与应用不可清理的第二概率,根据比较结果输出预测应用可清理的第一预测结果、或者预测应用不可清理的第二预测结果。具体地,当第一概率大于第二概率时,输出应用可清理的第一预测结果;当第一概率不大于第二概率时,输出应用不可清理的第二预测结果。比如,对于某个预测概率p,如果y=1表示应用可清理、y=0表示应用不可清理,假设p(y=1|x)大于p(y=0|x),此时,输出预测应用可清理的第一预测结果;假设p(y=1|x)不大于p(y=0|x),此时,输出预测应用不可清理的第二预测结果。在针对每个弱分类器的输出概率进行比较后,便可以得到一系列的预测结果,包含应用可清理的第一预测结果、和/或应用不可清理的第二预测结果。例如,参考图5,弱分类器1输出p(y=1|x)和p(y=0|x),比较p(y=1|x)和p(y=0|x)输出相应的预测结果(应用可清理的第一预测结果、或应用不可清理的第二预测结果),弱分类器2输出p(y=1|x)和p(y=0|x),比较p(y=1|x)和p(y=0|x)输出相应的预测结果(应用可清理的第一预测结果、或应用不可清理的第二预测结果)、弱分类器3输出p(y=1|x)和p(y=0|x),比较p(y=1|x)和p(y=0|x)输出相应的预测结果(应用可清理的第一预测结果、或应用不可清理的第二预测结果)。此时,便可以得到三个预测结果。307、根据预测结果中第一预测结果的数量和第二预测结果的数量,确定应用是否可清理。当第一预测结果的数量大于第二预测结果的数量时,确定应用可清理;当第一预测结果的数量不大于第二预测结果的数量时,确定应用不可清理。例如,参考图5,比较三个分类器的输出概率后,便可以输出三个预测结果,假设应用可清理的第一预测结果数量为2,应用不可清理的第二预测结果数量为1,此时,便可以确定应用可清理,即最终预测结果为应用可清理。在一个具体的例子中,可以利用预先训练的逻辑回归模型预测后台运行的多个应用是否可清理,如表1所示,则确定可以清理后台运行的应用a1和应用a3,而保持应用a2在后台运行的状态不变。应用预测结果应用a1可清理应用a2不可清理应用a3可清理表1由上可知,本申请实施例采集应用的多维特征作为训练样本,并构建至少两个训练集,至少两个训练集具有不同类型的多维特征;根据训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型;采集应用的多维特征作为预测样本,得到至少两个预测集,预测集与相应的训练集具有相同类型的多维特征;根据预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,该预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;根据至少两个预测概率预测应用是否可清理;以便清理可以清理的应用,以此实现了应用的自动清理,提高了电子设备的运行流畅度,降低了功耗。进一步地,由于样本集的每个样本中,包括了反映用户使用应用的行为习惯的多个特征信息,因此本申请实施例可以使得对对应应用的清理更加个性化和智能化。进一步地,本申请将bagging思想应用到用户行为特征分类上,通过结合多个个独立的逻辑回归模型,投票预测最终结果,可以挖掘到用户的使用习惯。随着用户使用设备时间变长,训练会愈发充分,系统预测也会愈发准确;可以提升用户行为预测的准确性,进而提高清理的准确度。请参阅图6,图6为本申请实施例提供的应用清理装置的结构示意图。其中该应用清理装置应用于电子设备,该其中该应用清理装置应用于电子设备,该应用清理装置包括训练集构建单元401、模型训练单元402、采集单元403、输出单元404以及预测单元405,如下:训练集构建单元401,用于采集应用的多维特征作为训练样本,并构建至少两个训练集,所述至少两个训练集具有不同类型的多维特征;模型训练单元402,用于根据所述训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型;采集单元403,用于采集所述应用的多维特征作为预测样本,得到至少两个预测集,所述预测集与相应的训练集具有相同类型的多维特征;输出单元404,用于根据所述预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,所述预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;预测单元405,用于根据所述预测概率预测所述应用是否可清理。其中,训练集构建单元401,可以用于:采集应用的多维特征作为样本,并构建所述应用的样本集;将所述样本集划分成至少两个具有不同类型多维特征的子样本集,得到至少两个训练集。在一实施例中,参考图7,模型训练单元402,可以包括:函数获取子单元4021,用于根据所述训练集获取逻辑回归模型集合中相应逻辑回归模型的损失函数;参数估计子单元4022,用于根据所述损失函数估计所述逻辑回归模型中的目标模型参数。其中,所述参数估计子单元4022,可以用于:基于梯度下降法对所述损失函数求解最大值,以得到所述逻辑回归模型中的目标模型参数。在一实施例中,参考图8,预测单元405,包括:结果输出子单元4051,用于针对每个预测概率,对所述预测概率内应用可清理的第一概率与应用不可清理的第二概率进行比较,得到比较结果;根据比较结果输出应用可清理的第一预测结果、或者应用不可清理的第二预测结果;确定子单元4052,用于根据第一预测结果的数量和第二预测结果的数量,确定所述应用是否可清理。比如,结果输出子单元4051,可以用于:当所述第一概率大于所述第二概率时,输出应用可清理的第一预测结果;当所述第一概率不大于所述第二概率时,输出应用不可清理的第二预测结果。在一实施例中,确定子单元4052,可以用于:当所述第一预测结果的数量大于所述第二预测结果的数量时,确定所述应用可清理;当所述第一预测结果的数量不大于所述第二预测结果的数量时,确定所述应用不可清理。具体实施时,以上各个单元可以作为独立的实体实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单位的具体实施可参见前面的实施例,在此不再赘述。由上可知,本实施例采用在电子设备中,通过训练集构建单元401采集应用的多维特征作为训练样本,并构建至少两个训练集,至少两个训练集具有不同类型的多维特征;由模型训练单元402根据训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型;由采集单元403采集应用的多维特征作为预测样本,得到至少两个预测集,预测集与相应的训练集具有相同类型的多维特征;由输出单元404根据预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,该预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;由预测单元405根据预测概率预测应用是否可清理;以便清理可以清理的应用,以此实现了应用的自动清理,提高了电子设备的运行流畅度,降低了功耗。本申请实施例还提供一种电子设备。请参阅图9,电子设备500包括处理器501以及存储器502。其中,处理器501与存储器502电性连接。所述处理器500是电子设备500的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器502内的计算机程序,以及调用存储在存储器502内的数据,执行电子设备500的各种功能并处理数据,从而对电子设备500进行整体监控。所述存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。在本申请实施例中,电子设备500中的处理器501会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器502中,并由处理器501运行存储在存储器502中的计算机程序,从而实现各种功能,如下:采集应用的多维特征作为训练样本,并构建至少两个训练集,所述至少两个训练集具有不同类型的多维特征;根据所述训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型;采集所述应用的多维特征作为预测样本,得到至少两个预测集,所述预测集与相应的训练集具有相同类型的多维特征;根据所述预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,所述预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;根据所述预测概率预测所述应用是否可清理。在一实施例中,在根据所述训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练时,处理器501可以具体执行以下步骤:根据所述训练集获取逻辑回归模型集合中相应逻辑回归模型的损失函数;根据所述损失函数估计所述逻辑回归模型中的目标模型参数。在一实施例中,在根据所述损失函数获取所述逻辑回归模型的目标模型参数时,处理器501可以具体执行以下步骤:基于梯度下降法对所述损失函数求解最大值,以得到所述逻辑回归模型中的目标模型参数。在一实施例中,在根据所述预测概率预测所述应用是否可清理时,处理器501可以具体执行以下步骤:针对每个预测概率,对所述预测概率内应用可清理的第一概率与应用不可清理的第二概率进行比较,得到比较结果;根据比较结果输出应用可清理的第一预测结果、或者应用不可清理的第二预测结果;根据第一预测结果的数量和第二预测结果的数量,确定所述应用是否可清理。在一实施例中,在根据比较结果输出应用可清理的第一预测结果、或者应用不可清理的第二预测结果时,处理器501可以具体执行以下步骤:当所述第一概率大于所述第二概率时,输出应用可清理的第一预测结果;当所述第一概率不大于所述第二概率时,输出应用不可清理的第二预测结果。在一实施例中,在根据第一预测结果的数量和第二预测结果的数量,确定所述应用是否可清理时,处理器501可以具体执行以下步骤:当所述第一预测结果的数量大于所述第二预测结果的数量时,确定所述应用可清理;当所述第一预测结果的数量不大于所述第二预测结果的数量时,确定所述应用不可清理。由上述可知,本申请实施例的电子设备,采集应用的多维特征作为训练样本,并构建至少两个训练集,至少两个训练集具有不同类型的多维特征;根据训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型;采集应用的多维特征作为预测样本,得到至少两个预测集,预测集与相应的训练集具有相同类型的多维特征;根据预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,该预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;根据预测概率预测应用是否可清理;以便清理可以清理的应用,以此实现了应用的自动清理,提高了电子设备的运行流畅度,降低了功耗。请一并参阅图10,在某些实施方式中,电子设备500还可以包括:显示器503、射频电路504、音频电路505以及电源506。其中,其中,显示器503、射频电路504、音频电路505以及电源506分别与处理器501电性连接。所述显示器503可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器503可以包括显示面板,在某些实施方式中,可以采用液晶显示器(liquidcrystaldisplay,lcd)、或者有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板。所述射频电路504可以用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。所述音频电路505可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。所述电源506可以用于给电子设备500的各个部件供电。在一些实施例中,电源506可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。尽管图10中未示出,电子设备500还可以包括摄像头、蓝牙模块等,在此不再赘述。本申请实施例还提供一种存储介质,所述存储介质存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述任一实施例中的应用清理方法,比如:采集应用的多维特征作为训练样本,并构建至少两个训练集,至少两个训练集具有不同类型的多维特征;根据训练集对逻辑回归模型集合中相应的逻辑回归模型进行训练,得到至少两个训练后逻辑回归模型;其中,一个训练集对应一个逻辑回归模型;采集应用的多维特征作为预测样本,得到至少两个预测集,预测集与相应的训练集具有相同类型的多维特征;根据预测集及其对应的训练后逻辑回归模型,输出相应的预测概率,该预测概率包括:应用可清理的第一概率、和应用不可清理的第二概率;根据预测概率预测应用是否可清理;以便清理可以清理的应用,以此实现了应用的自动清理,提高了电子设备的运行流畅度,降低了功耗。在本申请实施例中,存储介质可以是磁碟、光盘、只读存储器(readonlymemory,rom,)、或者随机存取记忆体(randomaccessmemory,ram)等。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。需要说明的是,对本申请实施例的应用清理方法而言,本领域普通测试人员可以理解实现本申请实施例的应用清理方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,所述计算机程序可存储于一计算机可读取存储介质中,如存储在电子设备的存储器中,并被该电子设备内的至少一个处理器执行,在执行过程中可包括如应用清理方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。对本申请实施例的应用清理装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,所述存储介质譬如为只读存储器,磁盘或光盘等。以上对本申请实施例所提供的一种应用清理方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1