1.一种大数据精准营销模型的构建方法,其特征在于,包括如下步骤:
A)读取建模数据样本文件并输入建模数据样本;所述建模数据样本文件包含影响变量和目标变量;
B)按照设定的比例将所述建模数据样本划分为训练样本和测试样本;
C)采取众数的方法对所述训练样本和测试样本进行缺失值补全;
D)对所述训练样本中的连续型的影响变量做离散化处理;
E)计算离散化处理后的每个影响变量中各属性的信息熵,并对缺失值补全后的数据进行替换,并存储替换规则;
F)采用二元逻辑回归的方法固定所述建模数据样本文件的最后一列为目标变量,其他为自变量,利用所述训练样本训练所述大数据精准营销模型;
G)利用所述测试样本对所述大数据精准营销模型进行测试,并输出测试结果,利用AUC值来判断所述大数据精准营销模型的好坏;
H)读取目标数据样本文件并输入目标数据样本;所述目标数据样本文件包含影响变量;
I)利用统计的方法对所述目标数据样本进行缺失值补全;
J)对所述目标数据样本中连续型的影响变量按照所述建模数据样本的规则做离散化替换,替换成离散型数据;
K)按照所述替换规则对所述离散型数据做离散化替换;
L)计算所述目标数据样本中每一个目标数据的概率值;
M)输出概率列表。
2.根据权利要求1所述的大数据精准营销模型的构建方法,其特征在于,所述步骤A)进一步包括:
A1)读取建模数据样本文件,并判断是否找到所述建模数据样本文件,如是,执行步骤A2);否则,退出;
A2)校验写入的所述建模数据样本是否具有所述目标变量且所述目标变量为二元变量,如是,执行步骤B);否则,报错后返回步骤A1)。
3.根据权利要求1或2所述的大数据精准营销模型的构建方法,其特征在于,所述步骤H)进一步包括:
H1)读取所述目标数据样本文件,并判断是否找到所述建模数据样本文件,如是,执行步骤H2);否则,退出;
H2)校验所述目标数据样本文件中的字段与所述建模数据样本是否一致,如是,执行步骤I);否则,报错后返回步骤H1)。
4.根据权利要求1所述的大数据精准营销模型的构建方法,其特征在于,所述设定的比例为7:3。
5.根据权利要求1所述的大数据精准营销模型的构建方法,其特征在于,当所述AUC值小于0.6时,确定所述大数据精准营销模型的测试结果不好。
6.一种实现如权利要求1所述的大数据精准营销模型的构建方法的装置,其特征在于,包括:
建模数据样本输入单元:用于读取建模数据样本文件并输入建模数据样本;所述建模数据样本文件包含影响变量和目标变量;
样本划分单元:用于按照设定的比例将所述建模数据样本划分为训练样本和测试样本;
样本缺失值补全单元:用于采取众数的方法对所述训练样本和测试样本进行缺失值补全;
离散处理单元:用于对所述训练样本中的连续型的影响变量做离散化处理;
信息熵计算替换单元:用于计算离散化处理后的每个影响变量中各属性的信息熵,并对缺失值补全后的数据进行替换,并存储替换规则;
模型训练单元:用于采用二元逻辑回归的方法固定所述建模数据样本文件的最后一列为目标变量,其他为自变量,利用所述训练样本训练所述大数据精准营销模型;
测试单元:用于利用所述测试样本对所述大数据精准营销模型进行测试,并输出测试结果,利用AUC值来判断所述大数据精准营销模型的好坏;
目标数据样本输入单元:用于读取目标数据样本文件并输入目标数据样本;所述目标数据样本文件包含影响变量;
目标数据补全单元:用于利用统计的方法对所述目标数据样本进行缺失值补全;
离散化替换单元:对所述目标数据样本中连续型的影响变量按照所述建模数据样本的规则做离散化替换,替换成离散型数据;
信息熵替换单元:用于按照所述替换规则对所述离散型数据做离散化替换;
概率计算单元:用于计算所述目标数据样本中每一个目标数据的概率值;
结果输出单元:用于输出概率列表。
7.根据权利要求6所述的实现如权利要求1所述的大数据精准营销模型的构建方法的装置,其特征在于,所述建模数据样本输入单元进一步包括:
建模数据样本文件读取判断模块:用于读取建模数据样本文件,并判断是否找到所述建模数据样本文件,如是,进入建模数据样本校验模块;否则,退出;
建模数据样本校验模块:用于校验写入的所述建模数据样本是否具有所述目标变量且所述目标变量为二元变量,如是,进入所述样本划分单元;否则,报错后返回所述建模数据样本文件读取判断模块。
8.根据权利要求6或7所述的实现如权利要求1所述的大数据精准营销模型的构建方法的装置,其特征在于,所述目标数据样本输入单元进一步包括:
目标数据样本文件读取判断模块:用于读取所述目标数据样本文件,并判断是否找到所述建模数据样本文件,如是,进入样本判断模块;否则,退出;
样本判断模块:用于校验所述目标数据样本文件中的字段与所述建模数据样本是否一致,如是,进入目标数据补全单元;否则,报错后返回所述目标数据样本文件读取判断模块。
9.根据权利要求6所述的实现如权利要求1所述的大数据精准营销模型的构建方法的装置,其特征在于,所述设定的比例为7:3。
10.根据权利要求6所述的实现如权利要求1所述的大数据精准营销模型的构建方法的装置,其特征在于,当所述AUC值小于0.6时,确定所述大数据精准营销模型的测试结果不好。