1.一种基于有监督学习的etc客户识别模型构建方法,其特征在于,包括:
采集原始etc客户训练数据及原始etc客户测试数据;
根据原始etc客户训练数据中的目标特征信息,按照预设衍生规则衍生新属性特征信息,将基于原始etc客户训练数据中目标特征信息衍生得到的新属性特征信息移植至原始etc客户测试数据中,获得移植后的etc客户测试数据;
根据原始etc客户训练数据及移植后的etc客户测试数据训练基于有监督学习的etc客户识别模型,获得构建的基于有监督学习的etc客户识别模型。
2.如权利要求1所述的基于有监督学习的etc客户识别模型构建方法,其特征在于,在采集原始etc客户训练数据及原始etc客户测试数据之后,还包括:
分别对采集的原始etc客户训练数据及原始etc客户测试数据进行清洗,获得清洗后的etc客户训练数据及清洗后的etc客户测试数据;
根据原始etc客户训练数据中的目标特征信息,按照预设衍生规则衍生新属性特征信息,将基于原始etc客户训练数据中目标特征信息衍生得到的新属性特征信息移植至原始etc客户测试数据中,获得移植后的etc客户测试数据,包括:
根据清洗后etc客户训练数据中的目标特征信息,按照预设衍生规则衍生新属性特征信息,将基于清洗后etc客户训练数据中目标特征信息衍生得到的新属性特征信息移植至清洗后的etc客户测试数据中,获得移植后的etc客户测试数据;
根据原始etc客户训练数据及移植后的etc客户测试数据训练基于有监督学习的etc客户识别模型,获得构建的基于有监督学习的etc客户识别模型,包括:
根据清洗后的etc客户训练数据及移植后的etc客户测试数据训练基于有监督学习的etc客户识别模型,获得构建的基于有监督学习的etc客户识别模型。
3.如权利要求2所述的基于有监督学习的etc客户识别模型构建方法,其特征在于,根据清洗后etc客户训练数据中的目标特征信息,按照预设衍生规则衍生新属性特征信息,将基于清洗后etc客户训练数据中目标特征信息衍生得到的新属性特征信息移植至清洗后的etc客户测试数据中,获得移植后的etc客户测试数据,包括:
根据清洗后etc客户训练数据中的目标特征信息与目标属性特征交叉衍生新属性特征信息;
将基于清洗后etc客户训练数据中目标特征信息与目标属性特征交叉衍生得到的新属性特征信息移植至清洗后的etc客户测试数据中,获得移植后的etc客户测试数据。
4.如权利要求2所述的基于有监督学习的etc客户识别模型构建方法,其特征在于,目标特征信息列包括目标特征信息列,新属性特征信息包括新属性特征信息列,根据清洗后etc客户训练数据中的目标特征信息,按照预设衍生规则衍生新属性特征信息,将基于清洗后etc客户训练数据中目标特征信息衍生得到的新属性特征信息移植至清洗后的etc客户测试数据中,获得移植后的etc客户测试数据,包括:
在清洗后etc客户测试数据中增加基于目标特征信息列衍生得到的新属性特征信息列对应的空列;
根据清洗后etc客户训练数据和清洗后etc客户测试数据是否包含共有特征列确定主键;
将基于目标特征信息列衍生得到的新属性特征信息列中与清洗后etc客户训练数据和清洗后etc客户测试数据主键相同的行对应的匹配列对应位置的值填充至空列的匹配列中;
将预设固定值或清洗后etc客户测试数据中属性特征列的交叉值填充至空列中除匹配列之外的未匹配列中。
5.如权利要求4所述的基于有监督学习的etc客户识别模型构建方法,其特征在于,根据清洗后etc客户训练数据和清洗后etc客户测试数据是否包含共有特征列确定主键,包括:
在清洗后etc客户训练数据和清洗后etc客户测试数据包含共有特征列时,将清洗后etc客户训练数据和清洗后etc客户测试数据包含的共有特征列作为主键;或
在清洗后etc客户训练数据和清洗后etc客户测试数据未包含共有特征列时,将清洗后etc客户训练数据包含的多个预设属性特征的组合作为主键。
6.一种基于有监督学习的etc客户识别模型构建装置,其特征在于,包括:
原始数据采集模块,用于采集原始etc客户训练数据及原始etc客户测试数据;
衍生特征移植模块,用于根据原始etc客户训练数据中的目标特征信息,按照预设衍生规则衍生新属性特征信息,将基于原始etc客户训练数据中目标特征信息衍生得到的新属性特征信息移植至原始etc客户测试数据中,获得移植后的etc客户测试数据;
模型训练构建模块,用于根据原始etc客户训练数据及移植后的etc客户测试数据训练基于有监督学习的etc客户识别模型,获得构建的基于有监督学习的etc客户识别模型。
7.如权利要求6所述的基于有监督学习的etc客户识别模型构建装置,其特征在于,还包括:
数据清洗模块,用于分别对采集的原始etc客户训练数据及原始etc客户测试数据进行清洗,获得清洗后的etc客户训练数据及清洗后的etc客户测试数据;
衍生特征移植模块,还用于根据清洗后etc客户训练数据中的目标特征信息,按照预设衍生规则衍生新属性特征信息,将基于清洗后etc客户训练数据中目标特征信息衍生得到的新属性特征信息添加至清洗后的etc客户测试数据中,获得移植后的etc客户测试数据;
模型训练构建模块,还用于根据清洗后的etc客户训练数据及移植后的etc客户测试数据训练基于有监督学习的etc客户识别模型,获得构建的基于有监督学习的etc客户识别模型。
8.如权利要求7所述的基于有监督学习的etc客户识别模型构建装置,其特征在于,衍生特征移植模块包括:
属性特征衍生单元,用于根据清洗后etc客户训练数据中的目标特征信息与目标属性特征交叉衍生新属性特征信息;
衍生特征移植单元,用于将基于清洗后etc客户训练数据中目标特征信息与目标属性特征交叉衍生得到的新属性特征信息移植至清洗后的etc客户测试数据中,获得移植后的etc客户测试数据。
9.如权利要求7所述的基于有监督学习的etc客户识别模型构建装置,其特征在于,衍生特征移植模块包括:
空列增加单元,用于在清洗后etc客户测试数据中增加基于目标特征信息列衍生得到的新属性特征信息列对应的空列;
主键确定单元,用于根据清洗后etc客户训练数据和清洗后etc客户测试数据是否包含共有特征列确定主键;
匹配列填充单元,用于将基于目标特征信息列衍生得到的新属性特征信息列中与清洗后etc客户测试数据清洗后etc客户训练数据和清洗后etc客户测试数据主键相同的行对应的匹配列对应位置的值填充至空列的匹配列中;
未匹配列填充单元,用于将预设固定值或清洗后etc客户测试数据中属性特征列的交叉值填充至空列中除匹配列之外的未匹配列中。
10.如权利要求8所述的基于有监督学习的etc客户识别模型构建装置,其特征在于,主键确定单元包括:
第一主键确定子单元,用于在清洗后etc客户训练数据和清洗后etc客户测试数据包含共有特征列时,将清洗后etc客户训练数据和清洗后etc客户测试数据包含的共有特征列作为主键;或
第二主键确定子单元,用于在清洗后etc客户训练数据和清洗后etc客户测试数据未包含共有特征列时,将清洗后etc客户训练数据包含的多个预设属性特征的组合作为主键。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一所述基于有监督学习的etc客户识别模型构建方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至6任一所述基于有监督学习的etc客户识别模型构建方法的计算机程序。