一种基于svm的移动终端应用分类系统和方法

文档序号:6621460阅读:734来源:国知局
一种基于svm的移动终端应用分类系统和方法
【专利摘要】本发明公开了一种基于SVM的移动终端应用分类系统和方法,该系统是由终端应用消耗数据采集模块、数据类型指标模块、基于SVM的分类模块组成;终端应用消耗数据采集模块是检测应用在特定环境中消耗的各类资源数量,包括电量、流量、权限开放情况、测试时延、丢包率、延时抖动等作为应用分类的基础;数据类型指标模块提供一个指标类型库,为前面采集到的数据处理提供依据,也是联接数据采集模块和分类模块的重要部分,并且为每一个采集到的数据按照分类作用的程度提供权重值;基于SVM的分类模块将处理后的终端数据利用向量机实现最终的分类;本发明为动态的应用分类机制,分类的种类在服务器端能动态的控制。
【专利说明】—种基于SVM的移动终端应用分类系统和方法

【技术领域】
[0001]本发明涉及一种基于SVM的移动终端应用分类系统和方法,属于移动通讯【技术领域】。

【背景技术】
[0002]在全球智能终端发展迅猛潮流和移动应用传播日益广泛的今天,移动终端上的应用无论从数量水平还是功能水平上都有了很大的提高。但是随着移动终端应用地增多,用户对移动终端应用地管理就显得不能得心应手。通常的移动终端都提供了应用程序分类的功能,对于移动终端出厂定制的应用程序已经被分类完成,而对于用户在使用过程中获取的其他应用程序,例如:用户从互联网上面下载的自己喜欢的应用程序,却只能在安装过程中由用户进行人工指定分类,由于对应用程序本身应该所属的分类的认识有误,会造成软件被安装到了不恰当的分类中。所以对于移动终端应用分类前需要合理的分析和判断,才能将应用做出准确的分类。当前,已存在一些很多移动终端应用分类技术,包括1.利用移动终端所附带的Manifest文件,获取Manifest文件包含的权限许可标识,进而对比许可标识分类表来获取对应的分类。而这种分类方法操作简单,分类结果存在很大的不可靠性。由于应用的分类完全由Manifest文件来控制,一旦Manifest文件是被更改过的,对应的应用分类也就随之改变,很容易造成分类错误。2.—种基于功耗的应用分类方法,移动终端启动飞行模式,保持屏幕常亮,获取并记录电池的初始电压和初始时间,打开被测应用后每隔预设时间获取一次电池电压及时间,并判断当前的时间是否为被测应用的功耗稳定时间点;若是,则记录当前的电池电压和时间;根据当前的电池电压和时间,初始电压和初始时间计算出被测应用的功耗值,根据该功耗值对被测应用进行功耗级别分类。但是由于是以功耗值的大小对应用进行分类,这种分类方法还是有一定的局限性,将应用的分类完全由功耗来决定,虽然易于操作,但分类效果不是非常好。3.移动终端连接应用商店服务器,获取并存储应用商店服务器提供的应用类别与应用特征数据库。移动终端分析应用附带的配置文件,获取配置文件包含的特征信息。将获取的特征信息和应用类别与应用特征数据库中存储的特征信息比对,根据比对结果将应用显示到所属应用类别文件夹中,实现应用的自动分类,但是这种分类方法也需要依据应用的配置文件包含的特征信息,并且这种分类方法影响了分类结果的准确性。而本发明能够很好地解决上面的问题。


【发明内容】

[0003]本发明目的在于解决了针对当前移动终端应用种类繁多,对用户的使用和应用的管理产生极大不便的问题,提出了一种基于SVM(即:支持向量机)的移动终端应用分类方法和系统。
[0004]本发明解决其技术问题所采取的技术方案是:本发明提供一种基于SVM(即:支持向量机)的移动终端应用分类方法和系统,该系统是由终端应用消耗数据采集模块、数据类型指标模块、基于SVM的分类模块组成。终端应用消耗数据采集模块是检测应用在特定环境中消耗的各类资源数量,包括电量、流量、权限开放情况、测试时延、丢包率、延时抖动等作为应用分类的基础。数据类型指标模块是提供一个指标类型库,为前面采集到的数据处理提供依据,也是联接数据采集模块和分类模块的重要部分。并且为每一个采集到的数据按照分类作用的程度提供权重值。基于SVM的分类模块将处理后的终端数据利用向量机进行最终的分类。
[0005]本发明采用移动应用特征识别分类技术,是基于多种类型的移动终端应用,结合现有的特征识别和分类技术,支持向量机技术,对移动应用进行特征识别并实现聚类,从而将现有的智能终端移动应用划分为不同业务类型。本发明以即时通讯为主的带来信令影响的业务应用、以浏览类为主的与传统业务类似的业务应用、以流媒体、下载为主的带来流量影响的业务。在移动应用是属于某一测试的前提下,对移动应用进行分类。
[0006]本发明还提供一种基于SVM的移动终端应用分类系统的实现方法,该方法包括如下步骤:
[0007]步骤1:移动终端在采集模块采集被测试应用软硬件消耗数据之前,需要确保测试时长,测试内容都必须是在同一指标下。确保所有测试应用的在测试基本消耗数据时都在同一条件下。
[0008]步骤2:移动终端在测试前提条件下通过采集模块采集应用的各项基本软硬件消耗数据,再由数据发送模块将采集数据发送到服务端。
[0009]步骤3:服务端通过数据接收模块从移动终端获取基本的测试应用的采集数据,并发送到数据存储中心。
[0010]步骤4:数据中心主要保存着所有已被测试应用的基本消耗数据,所以对于第一次测试的应用可以直接将测试的消耗数据存储到数据存储中心,对于在数据中心存在对当前测试应用的历史记录则将新旧记录通过2:8的原则(即:原有测试记录数据的占8,新的测试记录数据的占2的比例)替换原有的数据记录。
[0011]步骤5:将数据中心最新的被测试应用的测试数据提取出来,而且需要对数据进行归一化预处理,即把原始数据规整到[0,1]范围内,再转换成测试应用的特征数据记录文件,最后发送到SVM分类中心。
[0012]步骤6:在SVM分类模块用于分类测试应用的采集数据之前,需要定义一个类库,用于存储已分类的应用的特征数据。所以创建一个特征类库文件。
[0013]步骤7 =SVM分类模块通过特征库文件和新采集的应用测试记录文件得出应用的类型,最后将应用类型通过服务器端的发送模块发送到移动终端。
[0014]步骤8:移动终端接收模块获取服务器端的运行结果,最终给测试应用分类。
[0015]有益效果:
[0016]1、本发明是基于SVM的应用分类,构造移动应用的分类向量机,采用移动终端应用的软硬件消耗数据对应用分类。
[0017]2、本发明在服务器端增加数据存储中心,可使移动终端的新旧软硬件消耗数据通过数据存储中心整合,形成更合理的测试数据来提高分类的准确度。
[0018]3、本发明为动态的应用分类机制,分类的种类在服务器端能动态的控制。

【专利附图】

【附图说明】
[0019]图1为本发明的方法流程图。
[0020]图2为本发明的系统结构示意图。
[0021]图3为本发明SVM工作原理图。

【具体实施方式】
[0022]下面结合说明书附图对本发明作进一步地详细说明。
[0023]如图2和图3所示,本发明提供一种基于SVM的移动终端应用分类系统,该系统是由终端应用消耗数据采集模块、数据类型指标模块、基于SVM的分类模块组成。终端应用消耗数据采集模块是检测应用在特定环境中消耗的各类资源数量,包括电量、流量、权限开放情况、测试时延、丢包率、延时抖动等作为应用分类的基础。数据类型指标模块是提供一个指标类型库,为前面采集到的数据处理提供依据,也是联接数据采集模块和分类模块的重要部分。并且为每一个采集到的数据按照分类作用的程度提供权重值。基于SVM的分类模块将处理后的终端数据利用向量机进行最终的分类。
[0024]本发明采用移动应用特征识别分类技术,是基于多种类型的移动终端应用,结合现有的特征识别和分类技术,支持向量机技术,对移动应用进行特征识别并实现聚类,从而将现有的智能终端移动应用划分为不同业务类型。本发明以即时通讯为主而带来信令影响的业务应用、以浏览类为主而与传统业务类似的业务应用、以流媒体、下载为主的带来流量影响的业务。在移动应用是属于某一测试的前提下,对移动应用进行分类。
[0025]本发明的【具体实施方式】进一步包括如下:
[0026]1.客户端和服务器端的模型
[0027]本发明客户端负责被测试应用的软硬件消耗数据的采集和最终的分类结果显示,采集的数据交由服务器进行处理,包括数据中心新旧数据创建和合并替换,并进行归一化处理,分类的主要核心是使用SVM的支持向量技术,利用预先创建的分类特征文件,对测试数据分类,分类特征文件则是在整个分类系统分类高准确性的核心,需要通过测试大量各类不同的优秀应用获取的基本消耗数据来创建,保证了分类的准确度和对未来移动应用的友好性提供指导性的支持。
[0028]2.SVM的分类模块
[0029]本发明为了取得理想的分类结果,采用以径向基为核函数的SVM分类模型,并用交叉验证法对模型参数进行优化。将测试得到的移动应用的耗电量、软硬件消耗量、隐私安全等基本数据作为模型的特征输入值,将大量的测试数据作为训练集,由于这些参数值不是同一量纲,因此在进行训练之前,需要对数据进行归一化预处理,即把原始数据规整到[0,1]范围内。然后对支持向量机进行训练,用得到的模型对实时监测的数据进行分类,模型建立的整体流程如图所示。
[0030]因为移动应用种类的数目有限且可数,适合先采用静态分类方法。按照现有的移动应用业务不同,预先分为下面五类应用:网络浏览器类应用,即时通信类应用,社交网络、信息管理类应用,音视频分享类应用,游戏类应用。这样也能方便移动应用业务的拓展。对需要分析的移动应用可以使用向量机的分类算法,划分到上述的几大类的应用当中。
[0031]本发明为了识别应用的分类,需要先定义一个类库,用于存储已分类的应用的特征数据。所以创建一个特征类库文件。
[0032]文件格式:
[0033][label] [indexl]:[valuel] [index2]:[value2]...
[0034][label] [indexl]:[valuel] [index2]:[value2]...
[0035]一行一条记录数据,如:
[0036]+1 1:0.708 2:1 3:1 4:0.320 5:0.105 6:1
[0037]label或者说是class,就是要分类的种类,都设定为整数。
[0038]index是有顺序的索引,通常是连续的整数。
[0039]value就是用来测试的数据,都是一堆实数。
[0040]在本发明中label代表移动应用的分类如上所示,预分为五类,用各种不同的整数代表不同的种类,value则代表对每个应用测试所得的数据,将这些准备的特征数据生成model文件,则可用于对新输入的数据进行预测数据的类别。
[0041]综上所述,本发明基于SVM的应用分类,构造移动应用的分类向量机,采用移动终端应用的软硬件消耗数据对应用分类;本发明在服务器端增加数据存储中心,可使移动终端的新旧软硬件消耗数据通过数据存储中心整合,形成更合理的测试数据来提高分类的准确度;本发明为动态的应用分类机制,分类的种类在服务器端能动态的控制。
[0042]如图1所示,本发明还提供一种基于SVM的移动终端应用分类系统的实现方法,该方法包括如下步骤:
[0043]步骤1:移动终端在采集模块采集被测试应用软硬件消耗数据之前,需要确保测试时长,测试内容都必须是在同一指标下。确保所有测试应用的在测试基本消耗数据时都在同一条件下。
[0044]步骤2:移动终端在测试前提条件下通过采集模块采集应用的各项基本软硬件消耗数据,再由数据发送模块将采集数据发送到服务端。
[0045]步骤3:服务端通过数据接收模块从移动终端获取基本的测试应用的采集数据,并发送到数据存储中心。
[0046]步骤4:数据中心主要保存着所有已被测试应用的基本消耗数据,所以对于第一次测试的应用可以直接将测试的消耗数据存储到数据存储中心,对于在数据中心存在对当前测试应用的历史记录则将新旧记录通过2:8的原则(即:原有测试记录数据的占8,新的测试记录数据的占2的比例)替换原有的数据记录。
[0047]步骤5:将数据中心最新的被测试应用的测试数据提取出来,而且需要对数据进行归一化预处理,即把原始数据规整到[0,1]范围内,再转换成测试应用的特征数据记录文件,最后发送到SVM分类中心。
[0048]步骤6:在SVM分类模块用于分类测试应用的采集数据之前,需要定义一个类库,用于存储已分类的应用的特征数据。所以创建一个特征类库文件。
[0049]步骤7 =SVM分类模块通过特征库文件和新采集的应用测试记录文件得出应用的类型,最后将应用类型通过服务器端的发送模块发送到移动终端。
[0050]步骤8:移动终端接收模块获取服务器端的运行结果,最终给测试应用分类。
【权利要求】
1.一种基于SVM的移动终端应用分类系统,其特征在于:所述系统是由终端应用消耗数据采集模块、数据类型指标模块、基于SVM的分类模块组成,终端应用消耗数据采集模块是检测应用在特定环境中消耗的各类资源数量,数据类型指标模块是提供一个指标类型库,为前面采集到的数据处理提供依据,也是联接数据采集模块和分类模块的重要部分,并且为每一个采集到的数据按照分类作用的程度提供权重值,基于SVM的分类模块将处理后的终端数据利用向量机进行最终的分类。
2.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于,所述系统终端应用消耗数据采集模块的各类资源包括:电量、流量、权限开放情况、测试时延、丢包率、延时抖动作为应用分类的基础。
3.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于:所述系统是采用移动应用特征识别分类技术;是基于多种类型的移动终端应用,支持向量机技术,对移动应用进行特征识别和聚类。
4.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于:所述系统是基于SVM的应用分类,构造移动应用的分类向量机,采用移动终端应用的软硬件消耗数据对应用分类。
5.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于:所述系统为动态的应用分类机制,分类的种类在服务器端能动态的控制。
6.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于,所述系统还包括:在服务器端增加数据存储中心,可使移动终端的新旧软硬件消耗数据通过数据存储中心整合。
7.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于:所述系统需要先定义一个类库,用于存储已分类的应用的特征数据。
8.一种基于SVM的移动终端应用分类系统的实现方法,其特征在于,所述方法包括如下步骤: 步骤1:移动终端在采集模块采集被测试应用软硬件消耗数据之前,需要确保测试时长,测试内容都必须是在同一指标下,确保所有测试应用的在测试基本消耗数据时都在同一条件下; 步骤2:移动终端在测试前提条件下通过采集模块采集应用的各项基本软硬件消耗数据,再由数据发送模块将采集数据发送到服务端; 步骤3:服务端通过数据接收模块从移动终端获取基本的测试应用的采集数据,并发送到数据存储中心; 步骤4:数据中心保存着所有已被测试应用的基本消耗数据,对于第一次测试的应用直接将测试的消耗数据存储到数据存储中心,对于在数据中心存在对当前测试应用的历史记录则将新旧记录通过2:8的原则替换原有的数据记录; 步骤5:将数据中心最新的被测试应用的测试数据提取出来,需要对数据进行归一化预处理,即把原始数据规整到[O,I]范围内,再转换成测试应用的特征数据记录文件,最后发送到SVM分类中心; 步骤6:在SVM分类模块用于分类测试应用的采集数据之前,需要定义一个类库,用于存储已分类的应用的特征数据; 步骤7:SVM分类模块通过特征库文件和新采集的应用测试记录文件得出应用的类型,最后将应用类型通过服务器端的发送模块发送到移动终端; 步骤8:移动终端接收模块获取服务器端的运行结果,最终给测试应用分类。
【文档编号】G06F17/30GK104182470SQ201410361685
【公开日】2014年12月3日 申请日期:2014年7月25日 优先权日:2014年7月25日
【发明者】孙知信, 谷华, 宫婧 申请人:南京邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1