一种特征筛选方法以及特征筛选装置与流程

文档序号:17698103发布日期:2019-05-17 21:51阅读:326来源:国知局
一种特征筛选方法以及特征筛选装置与流程

本申请涉及深度学习技术领域,具体而言,涉及一种特征筛选方法以及特征筛选装置。



背景技术:

相关技术中,在机器学习领域,为了实现对目标分类模型的训练,通常需要确定一个或者多个能够对该目标分类模型的输出造成影响的目标特征,然后根据各个训练样本在确定的各个特征下的特征值,生成与各个训练样本对应的特征向量,并基于生成的特征向量实现对目标分类模型的训练。

目前的特征确定方法,通常是基于目标分类模型训练过程来实现的,也即确定多个可能对目标分类模型的输出造成影响的待选特征,并根据确定的多个待选特征,随机或者基于穷举算法形成多个不同的待选特征组合。然后针对每个待选特征组合,构建与该待选特征组合对应的待选特征向量,并基于待选特征向量对目标分类模型进行训练。之后再使用验证集对各个待选特征组合分别对应的目标模型进行验证,并将其中精度最高的目标分类模型对应的待选特征集合中的各个待选特征,确定为与该目标分类模型对应的选定特征。

当前的特征筛选存在效率低,且无法达到较好的筛选效果的问题。



技术实现要素:

有鉴于此,本申请实施例的目的在于提供一种特征筛选方法以及特征筛选装置,能够有针对性的从待选特征中确定选定特征,达到效率更高,且能够达到更高的筛选效果。

第一方面,本申请实施例提供了一种特征筛选方法,包括:

获取m个训练样本分别在n个待选特征下的特征值,以及所述m个训练样本对应的分类标签;所述m、n分别为大于0的整数;

确定所述n个待选特征中每个待选特征的重要性度量值;

根据每个待选特征的重要性度量值,确定多个特征集合;

针对每个特征集合:

使用m个训练样本在该特征集合包含的每个待选特征下的特征值和所述m个待选特征对应的分类标签,训练分类模型,获得该特征集合对应的分类准确率;

将分类准确率最高的特征集合包含的待选特征确定为选定特征。

第二方面,本申请实施例提供一种特征筛选装置,包括:

获取模块,用于获取m个训练样本分别在n个待选特征下的特征值,以及所述m个训练样本对应的分类标签;所述m、n分别为大于0的整数;

确定模块,用于确定所述n个待选特征中每个待选特征的重要性度量值;

筛选模块,用于根据每个待选特征的重要性度量值,确定多个特征集合;以及

针对每个特征集合:

使用m个训练样本在该特征集合包含的每个待选特征下的特征值和所述m个待选特征对应的分类标签,训练分类模型,获得分类准确率;

将分类准确率最高的特征集合包含的待选特征确定为选定特征。

本申请实施例通过多个训练样本分别在不同的待选特征下的特征值,以及对应的分类标签,确定每个待选特征的重要性度量值,然后根据每个待选特征的重要性度量值,确定多个特征集合,然后获得每个特征集合对应的分类准确率,并将分类准确率最高的特征集合包含的待选特征确定为选定特征,从而能够有针对性的从待选特征中确定选定特征,较之现有技术中的盲目确定待选特征组合再行验证的过程,效率更高,且能够达到更高的筛选效果。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例一所提供的一种特征筛选方法的流程图;

图2示出了本申请各实施例所提供的特征筛选方法中,确定每个待选特征的重要性度量值的具体方法的流程图;

图3示出了本申请实施例二所提供的特征筛选方法应用于无线网络性能评价时,构成的每个特征集合的分类准确率的示意图;

图4示出了本申请实施例三所提供的一种特征筛选装置的示意图;

图5示出了本申请实施例四所提供的一种计算机设备的示意图。

具体实施方式

以对无线网络的性能进行评价为例,无线网络具有覆盖范围广、信息需求高、用户数量庞大、网络应用丰富等特点,这就对网络性能提出了很高的要求。通过对无线网络的网络性能进行分析和评估为网络管理员提供优化调整网络的数据,已经成为了无线网络管理的一个共识。由于影响网络性能的因素复杂,而且评价网络性能所使用特征很多,如何选择合适的特征以对网络性能作出客观的评价,则显得尤为重要。

当前在对无线网路性能进行评价的时候,通常需要先确定多个待选特征,然后采用随机或者穷举的方式根据多个待选特征,生成不同的待选特征组合,并基于不同的待选特征组合,分别训练一个网络性能评价模型,然后基于验证数据对各个网络性能评价模型的精度进行验证,并将其中精度符合要求的网络性能评价模型对应的待选特征组合,确定为评价网络性能的选定特征组合。

这种特征确定方法由于在构建待选特征组合时的盲目性,造成了该种特征确定方法存在效率低,且无法达到最佳筛选效果的问题。

与相关技术不同,本申请实施例通过确定每个待选特征的重要性度量值,并根据每个待选特征的重要性度量值来从不同的待选特征中筛选出用于模型训练和应用的待选特征,能够有针对性的构建特征集合,并对特征集合对应的分类准确率进行验证,从而能以更少的时间和更高的效率,确定选定特征。

下面将结合本申请中附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

为便于对本实施例进行理解,首先对本申请实施例所公开的一种特征筛选方法进行详细介绍。需要注意的是,本申请实施例提供的特征筛选方法,可以用于所有需要进行特征筛选的场景,本申请实施例以应用于无线网络性能评价场景对该特征筛选方法加以说明。

实施例一

参见图1所示,为本申请实施例一提供的特征筛选方法的流程图,方法包括步骤s101~s103,其中:

s101:获取m个训练样本分别在n个待选特征下的特征值,以及m个训练样本对应的分类标签。

在具体实施中,m、n分别为大于0的整数。

针对不同的应用场景,所确定的待选特征会有所区别;在确定待选特征的时候,可以将当前应用场景中可能会对模型输出结果造成影响的特征都确定为待选特征,也可以从这些特征中针对性的筛选部分特征作为待选。

示例性的,将该方法应用于无线网络性能评价的时候,待选特征为可能会无线网络性能评估模型的评估结果造成影响的所有特征,所确定的选定特征用于无线网络性能评估,待选特征例如包括:

信号强度、时延、错包率、丢包率、重传率、上行速率比、下行速率比、信道利用率、漫游次数、终端类型、协议类型、单播流量和连接时间点中一种或者多种。

不同分类标签分别对应模型输出的不同结果。例如,将该方法应用于无线网络性能评价的时候,分类标签包括:“正常”和“差”两种。又例如,将该方法应用于对道路的拥堵情况进行预估的时候,分类标签包括:“拥堵”、“缓行”以及“畅通”三种。

示例性的,当本申请实施例提供的特征筛选方法应用于无线网络性能评价时,训练样本是从预设时间段内的通过目标无线接入点(accesspoint,ap)连接无线网的目标用户中筛选的训练样本。

从目标用户中筛选训练样本的时候,可以获取所有目标用户在通过目标ap连接无线网络的相关原始数据。在原始数据中包存在噪声和数据缺失,甚至数据不一致的情况,影响后续的特征筛选,因此要对底数据进行预处理。

预处理包括如下一种或者多种:

(1)数据筛选:由于存放原始数据的数据表中有很多字段与待选特征无关,需要删除原始数据中的冗余字段,保留与待选特征相关的字段。例如目标用户在通过目标ap访问无线网络的时候,所得到的原始数据包括:用户终端的媒体访问控制(mediaaccesscontrol,mac)地址、终端类型、互联网协议(internetprotocol,ip)地址、ap序列号、ap名称、接入控制器(accesscontroller,ac)序列号、终端协商模式、认证模式、信号强度、漫游次数、信道利用率、接收速率、发送速率、时延、丢包率、错包率、重传率、最大协商速率、时间,协议类型、ap发往终端报文数、ap接收终端报文数、ap的状态、raido值等信息。其中用户终端的mac地址、终端类型、终端协商模式等,均为冗余字段,要将相关的冗余字段都删除。

其中,上述每个字段都可以视为目标用户对应的一种特征。数据筛选,就是要从上述字段中,筛选出待选特征。

(2)数据清洗:在各个目标用户的原始数据中,会存在数据缺失和数据异常的情况。在目标用户数量足够的情况下,可以将存在数据缺失和数据异常的目标用户作为非训练样本删除;在目标用户数量不足够的情况下,可以通过其他未存在数据缺失和数据异常的目标用户的相关数据,重构缺失的数据和异常的数据。

(3)数据变换:对于原始数据中的某些字段,数据类型为字符串类型,无法直接使用字符串类型的待选特征来进行模型训练,因此需要将字符串类型的数据转换成数值型的数据。比如终端类型根据终端品牌的不同,可能有数十种。可以采用独热(one-hot)的编码方式,即每一个类别对应一个0、1组成的向量,类别数对应向量的维数,即一个类别对应向量的一维,当该终端类型为某一类别时,该类别对应的向量位置取1,其他部分则全部置0。

还可以预先设置对应的数值,例如a品牌的终端类型数值为1;b品牌的终端类型数值为2;c品牌的终端类型数据为3等。

(4)特征构造:为了提取更有用的信息,可以利用已有的特征构造新的特征,并将构造的特征作为待选特征。例如:在上述待选特征中的上行速率比和下行速率比并未包含在原始数据中。而在用户终端的原始数据中包括用户终端的接收速率、用户终端的发送速率、用户终端的最大协商速率。由于不同终端支持的最大协商速率不同,因此可以根据构造新的特征:上行速率比和下行速率比。并基于各个用户终端在与用户终端的接收速率、用户终端的发送速率、用户终端的最大协商速率对应的字段,计算该用户终端在上行速率比和下行速率比下的特征值。

其中,上行速率比为用户终端的发送速率与最大协商速率之间的比值;下行熟虑比为用户终端的接收速率与最大协商速率之间的比值。

(5)数据规范化:由于待选特征之间的单位不同,数值间的差别可能很大,可能会对后续的特征筛选结果造成影响,因此可以进行标准化处理。

示例性的,在对各个待选特征下的特征值进行标准化处理的时候,可以采用零均值规范化方法:

其中为各个目标用户在一待选特征x下的特征值的均值,σ为各个目标用户在该待选特征x下的特征值的标准差。x为某一目标用户在该待选特征x下的特征值;x*为该目标用户在该待选特征x下的特征值的标准化处理结果。

在经过上述处理后,形成多个训练样本分别在不同待选特征下的特征值,并为每个训练样本添加分类标签。

s102:确定n个待选特征中每个待选特征的重要性度量值。

在具体实施中,各个待选特征的重要性度量值,是指各个待选特征在分类模型中的重要程度。

图2示出本申请实施例提供的一种确定每个待选特征的重要性度量值的具体方法的流程图,该流程针对任一待选特征的重要性度量值的确定过程进行说明,包括:

s201:根据各个训练样本在该待选特征下的特征值,确定该待选特征的信息熵。

此处,可以采用下述方法计算一个待选特征的信息熵:

针对任一待选特征,确定每个训练样本在该待选特征下的特征值对应的概率密度;根据每个训练样本在该待选特征下的特征值对应的概率密度,计算该待选特征的信息熵。

其中,对于待选特征x,其对应的特征值集合记为sx,该集合由每个训练样本在待选特征x下的特征值组成,假设有m个训练样本,则sx包含了待选特征x对应的m个特征值、记为(x1,x1…xi…xm)。

待选特征x的信息熵h(x)满足下述公式(1):

其中,p(xi)表示待选特征x取值xi时的概率密度。

s202:根据各个训练样本在该待选特征下的特征值以及对应的分类标签,确定该待选特征的不确定性信息。

此处,可以采用下述方法计算每个待选特征的不确定性信息:

针对任一训练样本在该待选特征下的特征值:确定该特征值与每个所述分类标签对应的条件概率以及联合概率;根据每个训练样本在该待选特征下的特征值对应的所述条件概率和联合概率,确定该待选特征的不确定性信息。

假设,待选特征x对应的n个特征值集合记为sx(x1,x1…xi…xm);y表示样本的分类,其对应多个分类标签,例如“正常”、“差”,假设样本对应n个分类标签,则分类标签组成的集合记为ty(y1、y2…yj…yn)。

则待选特征x的不确定性信息h(x|y)满足公式(2):

其中,p(xi,yj)表示样本分类为yj时待选特征x取值为xi的联合概率,p(xi|yj)表示样本分类为yj时待选特征x取值为xi的条件概率。

s203:根据该待选特征的信息熵,以及该待选特征的不确定性信息,确定该待选特征的重要性度量值。

此处,针对任一待选特征,将该待选特征的信息熵与该待选特征对应的不确定性信息的差值,确定为该待选特征的重要性度量值。

具体地,待选特征x的重要性度量值i(x;y)满足公式(3):

p(yj)表示样本分类y取值yj时的概率密度。

需要注意的是,上述s201和s202并无执行的先后顺序。

承接上述s102,在获取各个待选特征的重要性度量值后,还包括s103。

s103:根据每个待选特征的重要性度量值,确定多个特征集合。

在具体实施中,重要性度量值能够表征每个待选特征在分类模型中的重要程度,但并不是每个待选特征对都有利于分类模型性能的提高。冗余的待选特征作为噪声影响分类模型的性能,而较少的特征则会丢失重要的细节信息,降低分类模型的分类准确率,同时还要考虑“维度灾难”的影响。因此,可以先确定出多个特征集合,每个特征集合可以包含不同的待选特征,分别针对特征集合进行模型的训练,来筛选出最优的特征集合,从而将最优的特征集合中包含的待选特征确定为选定特征。则,后续可以使用这些特征对于目标(例如网络质量、医疗数据等)进行分类。

多个特征集合中每个特征集合包含的待选特征数量不同;

并且,对于任意两个特征集合:

待选特征数量多的第一特征集合包含待选特征数量少的第二特征集合中的待选特征;且属于第一特征集合、但不属于第二特征集合的待选特征的重要性度量值,小于第二特征集合中的待选特征的重要性度量值。

具体地,可以采用下述方式确定多个特征集合:可以将全部的n个待选特征作为初始的特征集合;将初始特征集合中重要性度量值最小的一个待选特征去除掉,得到第2个特征集合;将第2个特征集合中重要性度量值最小的一个待选特征去除掉,得到第3个特征集合,依次类推,直到得到的特征集合中仅包括1个待选特征。

在一个实施例中,可以预设特征集合中包含的待选特征数量的范围。则初始特征集合包含的待选特征的数量可以为该范围的最大值,即从全部的n个待选特征中依次去掉重要性度量值最小的待选特征,直到剩下该范围的最大值相应数量的待选特征,得到初始特征集合;特征集合中的待选特征数量达到该范围的最小值时,该特征集合可以作为最后一个特征集合。需要说明的是,针对已经确定的特征集合,在模型训练时不需要按照获得特征集合的顺序进行。

示例性的,待选特征按照重要性度量值从大倒小的顺序为:a1~a16。

所确定的多个特征集包括:a1~a16;a1~a15;a1~a14;……;a1~a2;a1。

假设预设特征集合中包含的待选特征数量的范围为5~10,则所确定的多个特征集合包括:a1~a10;a1~a9;a1~a8;a1~a7;a1~a6;a1~a5;

s104:针对每个特征集合,使用m个训练样本在该特征集合包含的每个待选特征下的特征值和m个待选特征对应的分类标签,训练分类模型,获得该特征集合对应的分类准确率。

例如,针对特征集合a1~a10,根据某个样本在a1~a10下的特征值,使用分类模型来确定该样本的分类,若确定出的分类结果与该样本的分类标签相同,则分类正确;否则分类错误。得到m个样本的分类结果后即可确定m个样本中分类准确的概率,将其确定为特征集合a1~a10对应的分类准确率。

按照上述的方式即可确定每个特征集合对应的分类准确率。

s105:将分类准确率最高的特征集合包含的待选特征确定为选定特征。

此处,当分类准确率最高的特征集合有两个或者以上时,将其中待选特征数量最少的特征集合包含的待选特征确定为选定特征。

本申请实施例通过多个训练样本分别在不同的待选特征下的特征值,以及对应的分类标签,确定每个待选特征的重要性度量值,然后根据每个待选特征的重要性度量值,确定多个特征集合,然后获得每个特征集合对应的分类准确率,并将分类准确率最高的特征集合包含的待选特征确定为选定特征,从而能够有针对性的从待选特征中确定选定特征,较之现有技术中的盲目确定待选特征组合再行验证的过程,效率更高,且能够达到更高的筛选效果。

实施例二

示例性的,本申请实施例二提供一种将该方法应用于无线网络性能评价场景时,构成的每个特征集合的分类准确率的示意图。

其中:所确定的待选特征包括:信号强度、时延、错包率、丢包率、重传率、上行速率比、下行速率比、信道利用率、漫游次数、终端类型、协议类型、单播流量和连接时间点13个待选特征,各个待选特征的重要性度量值如下表1所示:

表1

根据各个待选特征的重要性度量值进行排序,采用序列向后搜索方法,每次从待选特征集中去掉一个重要性度量值最小的待选特征,逐次进行迭代,确定13个特征集合,每个特征集合的分类准确率如图3所示,可以看出随着重要性度量值较小的待选特征的依次删除,分类器的分类准确率整体上呈现逐步提高的趋势;这主要是因为不相关特征和冗余特征的消除提高了分类器性能;当分类准确率到达最高值97.85%后,又开始呈现下降趋势,则是因为有用的待选特征被删除,降低了分类器的性能。经过特征筛选后,最优的特征组合包含信号强度、信道利用率、下行速率比、上行速率比、时延、丢包率、重传率、错包率这8个待选特征,将信号强度、信道利用率、下行速率比、上行速率比、时延、丢包率、重传率、错包率确定为无线网络性能评估模型训练和应用的选定特征。

基于同一发明构思,本申请实施例中还提供了与特征筛选对应的特征筛选装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述特征筛选方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。

实施例三

参照图4所示,为本申请实施例三提供的一种特征筛选装置的示意图,所述装置包括:获取模块41、确定模块42、筛选模块43;其中,

获取模块41,用于获取m个训练样本分别在n个待选特征下的特征值,以及所述m个训练样本对应的分类标签;所述m、n分别为大于0的整数;

确定模块42,用于确定所述n个待选特征中每个待选特征的重要性度量值;

筛选模块43,用于根据每个待选特征的重要性度量值,确定多个特征集合;以及

针对每个特征集合:

使用m个训练样本在该特征集合包含的每个待选特征下的特征值和所述m个待选特征对应的分类标签,训练分类模型,获得分类准确率;

将分类准确率最高的特征集合包含的待选特征确定为选定特征。

本申请实施例通过多个训练样本分别在不同的待选特征下的特征值,以及对应的分类标签,确定每个待选特征的重要性度量值,然后根据每个待选特征的重要性度量值,确定多个特征集合,然后获得每个特征集合对应的分类准确率,并将分类准确率最高的特征集合包含的待选特征确定为选定特征,从而能够有针对性的从待选特征中确定选定特征,较之现有技术中的盲目确定待选特征组合再行验证的过程,效率更高,且能够达到更高的筛选效果。

一种可能的实施方式中,所述多个特征集合中每个特征集合包含的待选特征数量不同;

并且,对于任意两个特征集合:

待选特征数量多的第一特征集合包含待选特征数量少的第二特征集合中的待选特征;且属于第一特征集合、但不属于第二特征集合的待选特征的重要性度量值,小于第二特征集合中的待选特征的重要性度量值。

一种可能的实施方式中,所述确定模块42,用于采用下述方式确定待选特征的重要性度量值:

针对任意一个待选特征:

根据各个所述训练样本在该待选特征下的特征值,确定该待选特征的信息熵;以及

根据各个所述训练样本在该待选特征下的特征值以及对应的所述分类标签,确定该待选特征的不确定性信息;

根据该待选特征的信息熵,以及该待选特征的不确定性信息,确定该待选特征的重要性度量值。

一种可能的实施方式中,所述确定模块42,用于采用下述方式确定待选特征的信息熵:

确定每个训练样本在该待选特征下的特征值对应的概率密度;

根据每个训练样本在该待选特征下的特征值对应的概率密度,计算该待选特征的信息熵。

一种可能的实施方式中,确定模块42,用于采用下述方式确定待选特征的不确定性信息:

针对任一训练样本在该待选特征下的特征值:确定该特征值与每个所述分类标签对应的条件概率以及联合概率;

根据每个训练样本在该待选特征下的特征值对应的所述条件概率和联合概率,确定该待选特征的不确定性信息。

一种可能的实施方式中,确定模块42,用于采用下述方式根据该待选特征的信息熵,以及该待选特征的不确定性信息,确定该待选特征的重要性度量值:

将该待选特征的信息熵与该待选特征的不确定性信息的差值,确定为该待选特征的重要性度量值。

实施例四

对应于图1中的特征筛选方法,本申请实施例还提供了一种计算机设备500,如图5所示,为本申请实施例提供的计算机设备500结构示意图,包括:

处理器51、存储器52、和总线53;存储器52用于存储执行指令,包括内存521和外部存储器522;这里的内存521也称内存储器,用于暂时存放处理器51中的运算数据,以及与硬盘等外部存储器522交换的数据,处理器51通过内存521与外部存储器522进行数据交换,当所述用户设备50运行时,所述处理器51与所述存储器52之间通过总线53通信,使得所述处理器51在用户态执行以下指令:

获取m个训练样本分别在n个待选特征下的特征值,以及所述m个训练样本对应的分类标签;所述m、n分别为大于0的整数;

确定所述n个待选特征中每个待选特征的重要性度量值;

根据每个待选特征的重要性度量值,确定多个特征集合;

针对每个特征集合:

使用m个训练样本在该特征集合包含的每个待选特征下的特征值和所述m个待选特征对应的分类标签,训练分类模型,获得该特征集合对应的分类准确率;

将分类准确率最高的特征集合包含的待选特征确定为选定特征。

一种可能的实施方式中,处理器51执行的指令中,所述多个特征集合中每个特征集合包含的待选特征数量不同;

并且,对于任意两个特征集合:

待选特征数量多的第一特征集合包含待选特征数量少的第二特征集合中的待选特征;且属于第一特征集合、但不属于第二特征集合的待选特征的重要性度量值,小于第二特征集合中的待选特征的重要性度量值。

一种可能的实施方式中,处理器51执行的指令中,确定待选特征的重要性度量值,包括:

针对任意一个待选特征:

根据各个所述训练样本在该待选特征下的特征值,确定该待选特征的信息熵;以及

根据各个所述训练样本在该待选特征下的特征值以及对应的所述分类标签,确定该待选特征的不确定性信息;

根据该待选特征的信息熵,以及该待选特征的不确定性信息,确定该待选特征的重要性度量值。

一种可能的实施方式中,处理器51执行的指令中,所述确定待选特征的信息熵,包括:

确定每个训练样本在该待选特征下的特征值对应的概率密度;

根据每个训练样本在该待选特征下的特征值对应的概率密度,计算该待选特征的信息熵。

一种可能的实施方式中,处理器51执行的指令中,所述确定待选特征的不确定性信息,包括:

针对任一训练样本在该待选特征下的特征值:确定该特征值与每个所述分类标签对应的条件概率以及联合概率;

根据每个训练样本在该待选特征下的特征值对应的所述条件概率和联合概率,确定该待选特征的不确定性信息。

一种可能的实施方式中,处理器51执行的指令中,所述根据该待选特征的信息熵,以及该待选特征的不确定性信息,确定该待选特征的重要性度量值,包括:

将该待选特征的信息熵与该待选特征的不确定性信息的差值,确定为该待选特征的重要性度量值。

对应于图1中的特征筛选方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器51运行时执行上述特征筛选方法的步骤。

具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述特征筛选方法,从而解决现有技术中存在的特征筛选存在效率低,且无法达到较好的筛选效果的问题,能够有针对性的从待选特征中确定选定特征,达到效率更高,且能够达到更高的筛选效果。

本申请实施例所提供的特征筛选方法以及特征筛选装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1