1.一种基于企业特征预测中标概率的方法,其特征在于,包括:
获取待测企业的当前的投标信息以及企业信息,所述企业信息包括历史投标记录以及企业资质信息;
从所述投标信息以及所述企业信息中提取所述待测企业的指定企业特征;
将所述指定企业特征输入至预设的预测模型进行计算,得到预测结果,所述预测模型基于gbdt以及lr构建训练而成,所述预测结果为所述待测企业当前投标的中标概率。
2.根据权利要求1所述的基于企业特征预测中标概率的方法,其特征在于,所述预测模型包括gbdt模块以及lr模块,所述将所述指定企业特征输入至预设的预测模型进行预测,得到预测结果的步骤,包括:
将所述指定企业特征输入所述gbdt模块中,遍历所述gbdt模块每个决策树,得到一组离散的特征组合;
将所述特征组合进行转换得到相应的指定编码;
将所述指定编码传入所述lr模块进行线性加权预测,得到所述预测结果。
3.根据权利要求2所述的基于企业特征预测中标概率的方法,其特征在于,所述将所述指定编码传入所述lr模块进行线性加权预测,得到所述预测结果的步骤,包括:
利用以下公式计算出所述预测结果:
y=sigmoid(xtw);
其中,y为所述待测企业的中标概率,x为所述指定编码,w为特征权重。
4.根据权利要求2所述的基于企业特征预测中标概率的方法,其特征在于,所述预测模型的训练过程包括:
获取多个样本形成样本集,并将所述样本集分为训练集以及测试集,所述样本集中的样本为经过特征选择后的企业特征;
将所述训练集输入预设的初始决策树模型进行训练,以形成所述gbdt模块,并输出新的训练数据;
将所述新的训练数据输入至预设的初始线性分类模型进行训练,得到所述lr模块;
依据所述测试集对所述gbdt模块及lr模块进行测试,得到测试结果;
依据所述测试结果进行调整,以得到所述预测模型。
5.根据权利要求4所述的基于企业特征预测中标概率的方法,其特征在于,所述获取预设的训练集的步骤,包括:
获取投标企业的多个不同的指定特征;
将所述指定特征分别进行分组,得到多个对应所述指定特征的特征组;
分别计算每个所述特征组内的中标企业占所有中标企业的第一比例,以及分别计算每个所述特征组内非中标企业占所有非中标企业的第二比例;
依据所述特征组内中标企业的数量、所述特征组内非中标企业的数量、所有中标企业的数量、所有非中标企业的数量、第一比例以及第二比例,计算得到所述指定特征的每个所述特征组的证据权重;
依据所述证据权重计算出每个所述特征组的iv值;
依据每个所述特征组的iv值计算出所述指定特征的iv值;
将iv值超过预设阈值的指定特征记为所述企业特征,并将所述企业特征作为所述样本加入所述样本集。
6.一种基于企业特征预测中标概率的装置,其特征在于,包括:
获取信息单元,用于获取待测企业的当前的投标信息以及企业信息,所述企业信息包括历史投标记录以及企业资质信息;
提取特征单元,用于从所述投标信息以及所述企业信息中提取所述待测企业的指定企业特征;
计算结果单元,用于将所述指定企业特征输入至预设的预测模型进行计算,得到预测结果,所述预测模型基于gbdt以及lr构建训练而成,所述预测结果为所述待测企业当前投标的中标概率。
7.根据权利要求6所述的基于企业特征预测中标概率的装置,其特征在于,所述预测模型包括gbdt模块以及lr模块,所述计算结果单元,包括:
遍历决树单元,用于将所述指定企业特征输入所述gbdt模块中,遍历所述gbdt模块每个决策树,得到一组离散的特征组合;
转换编码单元,用于将所述特征组合进行转换得到相应的指定编码;
加权预测单元,用于将所述指定编码传入所述lr模块进行线性加权预测,得到所述预测结果。
8.根据权利要求7所述的基于企业特征预测中标概率的装置,其特征在于,所述加权预测单元包括:
利用以下公式计算出所述预测结果:
y=sigmoid(xtw);
其中,y为所述待测企业的中标概率,x为所述指定编码,w为特征权重。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的基于企业特征预测中标概率的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的基于企业特征预测中标概率的方法的步骤。