本申请涉及人工智能领域,更具体的说,是涉及特征选择算法推荐模型的训练方法、装置、服务器及介质。
背景技术:
1、机器学习模型是当今社会最热门的话题之一,由此衍生出的研究子课题层出不穷。在这些研究子课题中,如何训练得到具有优异鲁棒性的机器学习模型是一个热门话题。针对某一个应用场景,该应用场景对应有多个属性特征,多个属性特征中有些属性特征对于训练机器学习模型具有正向的作用,如使得机器学习模型更加准确,有的属性特征对于训练机器学习模型具有负向作用,如使得机器学习模型更加不准确。所以从多个特征中选择出对于训练机器学习模型具有正向的作用的属性特征,使用对于训练机器学习模型具有正向的作用的属性特征训练机器学习模型,可以得到准确率更高的机器学习模型。
2、因此用于从多个属性特征中筛选对于训练机器学习模型具有正向的作用的属性特征的特征选择算法应用而生。目前存在很多特征选择算法,对于一个特定的应用场景应该使用哪一种特征选择算法筛选该应用场景的多个属性特征,依靠技术人员的人工判断不准确。
技术实现思路
1、有鉴于此,本申请提供了一种特征选择算法推荐模型的训练方法、装置、服务器及介质。
2、为实现上述目的,本申请提供如下技术方案:
3、根据本公开实施例的第一方面,提供一种特征选择算法推荐模型的训练方法,包括:
4、获取多个应用场景分别对应的样本特征集;所述应用场景对应的样本特征集包括多个标注分类标签分别对应的样本特征子集,所述样本特征子集包括多个属性特征的属性值;
5、针对每一所述应用场景,获取所述应用场景对应的多个优质特征集,每一所述优质特征集包括基于预设特征选择算法从所述样本特征子集中筛选出针对第一机器学习模型的训练有正向作用的属性特征;不同所述优质特征子集对应的预设特征选择算法不同;
6、针对每一所述应用场景,获取所述应用场景对应的所述多个优质特征集的准确程度,每一所述优质特征集的准确程度是指以被赋予属性值所述优质特征集作为输入,以被赋予属性值的所述优质特征集所属的样本特征子集的标注分类标签作为训练目标,训练得到的所述第一机器学习模型的准确程度;
7、针对每一所述应用场景,确定所述应用场景对应的所述多个优质特征集的准确程度中,最大的所述准确程度对应的优质特征集合为目标优质特征集;
8、针对每一所述应用场景,确定所述应用场景的所述目标优质特征集对应的目标预设特征选择算法的标识;
9、针对每一所述应用场景,获取所述应用场景对应的样本特征集包括的所述样本特征子集对应的元特征集,所述样本特征子集对应的元特征集表征所述样本特征子集包含的属性特征之间的关系;
10、将多个所述样本特征子集分别对应的所述元特征集作为第二机器学习模型的输入,以多个所述样本特征子集所属应用场景对应的所述目标预设特征选择算法的标识作为训练目标,训练得到特征选择算法推荐模型。
11、根据本公开实施例的第二方面,提供一种特征选择算法推荐模型的训练装置,包括:
12、第一获取模块,用于获取多个应用场景分别对应的样本特征集;所述应用场景对应的样本特征集包括多个标注分类标签分别对应的样本特征子集,所述样本特征子集包括多个属性特征的属性值;
13、第二获取模块,用于针对每一所述应用场景,获取所述应用场景对应的多个优质特征集,每一所述优质特征集包括基于预设特征选择算法从所述样本特征子集中筛选出针对第一机器学习模型的训练有正向作用的属性特征;不同所述优质特征子集对应的预设特征选择算法不同;
14、第三获取模块,用于针对每一所述应用场景,获取所述应用场景对应的所述多个优质特征集的准确程度,每一所述优质特征集的准确程度是指以被赋予属性值所述优质特征集作为输入,以被赋予属性值的所述优质特征集所属的样本特征子集的标注分类标签作为训练目标,训练得到的所述第一机器学习模型的准确程度;
15、第一确定模块,用于针对每一所述应用场景,确定所述应用场景对应的所述多个优质特征集的准确程度中,最大的所述准确程度对应的优质特征集合为目标优质特征集;
16、第二确定模块,用于针对每一所述应用场景,确定所述应用场景的所述目标优质特征集对应的目标预设特征选择算法的标识;
17、第四获取模块,用于针对每一所述应用场景,获取所述应用场景对应的样本特征集包括的所述样本特征子集对应的元特征集,所述样本特征子集对应的元特征集表征所述样本特征子集包含的属性特征之间的关系;
18、训练模块,用于将多个所述样本特征子集分别对应的所述元特征集作为第二机器学习模型的输入,以多个所述样本特征子集所属应用场景对应的所述目标预设特征选择算法的标识作为训练目标,训练得到特征选择算法推荐模型。
19、根据本公开实施例的第三方面,提供一种服务器,包括:
20、处理器;
21、用于存储所述处理器可执行指令的存储器;
22、其中,所述处理器被配置为执行所述指令,以实现如第一方面所述特征选择算法推荐模型的训练方法。
23、根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如第一方面所述特征选择算法推荐模型的训练方法。
24、经由上述的技术方案可知,本申请提供了一种特征选择算法推荐模型的训练方法,每一应用场景具有多个标注分类标签分别对应的样本特征子集,使用多个不同预设特征选择算法,分别得到同一应用场景对应的不同优质特征集;针对同一应用场景,使用不同优质特征集训练得到不同的第一机器学习模型;可以理解的是,使得第一机器学习模型准确程度最高的优质特征集是最优的优质特征集,那么,筛选出最优的优质特征集的预设特征选择算法对于该应用场景而言是最优的目标预设特征选择算法;由于不同应用场景的属性特征不同,为了使得训练后的第二机器学习模型适合任一应用场景,针对每一应用场景,获取应用场景对应的样本特征子集对应的元特征集;不同应用场景的样本特征子集对应的元特征集包含的属性信息的数量相同。将多个样本特征子集分别对应的元特征集作为第二机器学习模型的输入,以多个样本特征子集所属应用场景对应的目标预设特征选择算法的标识作为训练目标,训练得到特征选择算法推荐模型。后续可以使用特征选择算法推荐模型推荐最优的预设特征选择算法,无需人为基于经验获得最优的预设特征选择算法,所以更加准确。
1.一种特征选择算法推荐模型的训练方法,其特征在于,包括:
2.根据权利要求1所述特征选择算法推荐模型的训练方法,其特征在于,所述获取所述应用场景对应的样本特征集包括的所述样本特征子集对应的元特征集步骤,包括:
3.根据权利要求1或2所述特征选择算法推荐模型的训练方法,其特征在于,还包括:
4.根据权利要求3所述特征选择算法推荐模型的训练方法,其特征在于,
5.根据权利要求1或2或4任一所述特征选择算法推荐模型的训练方法,其特征在于,所述应用场景对应的多个优质特征集的数目为5,5个所述优质特征集对应5个所述预设特征选择算法;5个所述预设特征选择算法分别为:过滤式特征选择方法、包裹式特征选择方法、嵌入式特征选择方法、组结构特征选择算法、树结构特征选择算法。
6.一种特征选择算法推荐模型的训练装置,其特征在于,包括:
7.根据权利要求6所述特征选择算法推荐模型的训练装置,其特征在于,所述第四获取模块包括:
8.根据权利要求6或7所述特征选择算法推荐模型的训练装置,其特征在于,还包括:
9.一种服务器,其特征在于,包括:
10.一种计算机可读存储介质,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如权利要求1至5中任一项所述特征选择算法推荐模型的训练方法。