基于数据特征的深度神经网络自训练方法与流程

文档序号：12469177阅读：来源：国知局

技术特征：

1.一种基于数据特征的深度神经网络自训练方法，其特征在于：包括以下步骤：

(1)从事先准备好的不同样本集提取对应的标准特征，该标准特征表征样本集本身数据分布的特点，并且能够用来唯一区分不同的样本集；

(2)将已知样本集与对应的标准特征输入训练器，寻找具有不同特征的样本集需要怎样的参数设置才能达到尽可能高的训练精度；

(3)当引入新样本集时，根据新样本集的特征来自动选取一组最优的深度神经网络参数，从而保证当以该参数构造神经网络并对新样本进行训练时，能够得到尽可能高的预测精度。

2.根据权利要求1所述的基于数据特征的深度神经网络自训练方法，其特征在于：所述步骤(1)中，采用的样本集满足以下条件：数据类型相同，数据维度相同，样本容量相同或基本相同；如果某个样本集的样本容量稍少于其他样本集，则提取标准特征时其他样本集也只处理与其相同数目的样本；如果某个样本集的样本容量远少于其他样本集，则通过复制或人工加入微量噪声的方法将该样本集扩展到适当的大小，使其满足上述条件；对于多组样本集，分别将每组样本集作为标准化神经网络的输入，无论输入数据的类型和维度如何，该神经网络的输出都被转化为双精度浮点数向量；对于所有样本集，标准化神经网络的结构是固定的，其权重参数也是提前规定好的，以使其输出的特征具有标准性；对于长度较长的特征向量，经过PCA降维后，得到长度较短的特征向量，即各个样本集所唯一对应的标准特征；

所述步骤(2)中，用训练器寻找样本集标准特征与深度神经网络参数选取之间关系的方法包括以下步骤：

(2.1)对于某一个已知样本集S_n，n取值从1到N，随机生成M组参数P⁽ⁿ⁾_m，m取值从1到M，根据参数P⁽ⁿ⁾_m建立深度神经网络DNN⁽ⁿ⁾_m，将样本集S_n作为网络DNN⁽ⁿ⁾_m的训练集，并训练深度神经网络，训练完毕后以测试集测试其精度，如果没有特定测试集，则将整个样本集S_n作为测试集；

(2.2)如果网络DNN⁽ⁿ⁾_m测试精度设为C⁽ⁿ⁾_m，对所有参数组遍历执行建立网络、训练网络、测试精度的过程，然后选取测试精度C⁽ⁿ⁾_m最高的一组P⁽ⁿ⁾_m，再取样本集S_n对应的标准特征F_n，即找到一组样本集特征与最优深度神经网络参数的关系对；

(2.3)对所有已知样本集处理完毕后，就得到了若干P⁽ⁿ⁾_m-F_n关系对，可视为经过参数-特征空间中某超平面上的点，通过这些点就能够拟合该超平面，得到一般化的参数-特征关系；

上述步骤(2.1)-(2.3)中，S_n表示第n个样本集，P⁽ⁿ⁾_m表示对应第n个样本集的第m组参数，DNN⁽ⁿ⁾_m表示根据参数P⁽ⁿ⁾_m产生的深度神经网络；C⁽ⁿ⁾_m代表从样本S_n训练网络DNN⁽ⁿ⁾_m得到的测试精度；

所述步骤(3)中，在已知样本数据基本特征分布的情况下，利用机器学习算法的分类与预测能力，自动选取若干组恰当的深度神经网络结构参数，所述参数包括但不限于网络的深度、卷积层中卷积核的数量和尺寸、梯度方法、初始训练步长、损失函数，再以这些组参数分别自动迭代训练深度神经网络，验证其预测精度；如果某些参数组能够产生符合要求的预测精度，则将产生最高精度的参数组合返回给用户；如果遍历所有参数组合也没能达到所需的预测精度，则从精度最好的一组参数出发，产生一组新的参数进行训练，直到产生所需的预测精度为止；得到最优参数之后，即可建立相应的深度神经网络，并且能够保证其分类精度达到相应的标准。

3.根据权利要求2所述的基于数据特征的深度神经网络自训练方法，其特征在于：所述步骤(3)中，在选取参数组的过程中，只要在误差允许范围内，总选取节点数最少的那一组参数。

完整全部详细技术资料下载

当前第2页1 2 3