一种CHAID树模型融合与策略设计方法与流程

文档序号:23160234发布日期:2020-12-04 13:54阅读:248来源:国知局
一种CHAID树模型融合与策略设计方法与流程

本发明涉及汽车金融技术领域,具体来说,涉及一种chaid树模型融合与策略设计方法。



背景技术:

现有的模型融合方案是通过不同数据建模,用得到的不同模型预测概率、评分进行加权平均,产生一个最终的预测概率、评分;现有的策略方案是找到表现最优的模型、加权平均模型或者使用id3、c4.5、cart树进行拟合,通过其建立策略。

汽车金融领域现有模型融合方案存在两点弊端:因为数据、算法的原因,模型预测存在不确定性,实际上每个模型对不同样本的预测结果与准确度均不一样,而简单的加权平均并不能完全解决这个问题;单个模型的未查得样本在建模时并不能进入模型,由于多个模型进行融合时,每个模型未查得的样本在实际业务场景中很难保持一致,那么进行模型融合时,如何对每个模型的未查得样本进行取值,这对模型融合工作是一个巨大的阻碍,会给未来的模型实际部署以及上线带来隐患。

汽车金融领域现有策略设计方案同样存在一些弊端:如果选择表现最优模型做策略,首先,使用表现最优模型意味着使用单模型做策略,实际业务场景中由于单模型建模时会有相当部分的样本未查得,这样的结果会导致这部分样本不得不调用其他策略以判断其好坏,最终会增加不确定性和运行成本;其次,由于使用单模型,如果实际业务场景下的样本和建模时的样本存在变化,使用表现最优模型会在相当程度上增加模型上线时的风险。如果使用加权平均模型做策略,会不可避免地落入加权平均模型的缺陷中,未查得样本的如何取值会在极大影响策略的准确性与运行效率。

针对相关技术中的问题,目前尚未提出有效的解决方案。



技术实现要素:

针对相关技术中的问题,本发明提出一种chaid树模型融合与策略设计方法,以克服现有相关技术所存在的上述技术问题。

为此,本发明采用的具体技术方案如下:

一种chaid树模型融合与策略设计方法,包括以下步骤:

获取合适的模型样本;

根据汽车金融行业标准,确定样本的正负;

获取能够判别客户行为的变量,如消费偏好,人口属性,还款能力,应用兴趣,游戏偏好,地理位置等等;

对不同数据源的变量建模得到多模型,通过卡方自动交互检测法决策树(chaid树)对模型预测概率或者评分拟合,得到预测概率或评分的树状结构,首先可以针对树形结构进行差异化的模型融合方式,其次针对单模型未查得样本,chaid树单独对用其他模型查得样本解释;

在策略设计上,同样对不同数据源的变量建模得到多模型,通过chaid树拟合预测概率或者评分,根据chaid树的划分方式选取合适的叶子节点,选取符合业务要求和lift较高的叶子节点,配置相应的策略;针对变量做策略时,可以将需要做策略的变量放入chaid树进行拟合,同样依据叶子节点,计算其lift,挑选表现较好的叶子节点。

优选的,chaid决策树做模型融合有别于一般的模型融合方式,它能够挖掘样本潜力并且具有良好的可解释性。

优选的,chaid决策树做策略设计时,它既可以处理分类变量也可以处理连续变量,并且每层可以处理缺失数据以增大样本价值。

优选的,获取样本特征维度:网贷行为,消费偏好,人口属性,还款能力,应用兴趣,游戏偏好,地理位置,行业标签。

优选的,通过chaid树对各模型预测概率或评分拟合,通过树形结构进行差异化的模型融合方式。

优选的,根据业务要求和实际应用情况筛选策略,在决策引擎等上线平台上部署多模型策略。

本发明的有益效果为:chaid决策树做模型融合有别于一般的模型融合方式,它能够挖掘样本潜力并且具有良好的可解释性;chaid决策树做策略设计时,它既可以处理分类变量也可以处理连续变量,并且每层可以处理缺失数据以增大样本价值,既可以较好解决模型间对不同样本的偏差问题又可以用充分利用现有的样本以充分挖掘其内在价值,在策略设计上,本申请提案既可以处理分类变量,也可以处理连续变量,并且每层可以处理缺失或未查得样本挖掘样本潜力,对于汽车金融场景中实际应用十分有利。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的一种chaid树模型融合与策略设计方法的chaid树模型融合的技术流程图;

图2是根据本发明实施例的一种chaid树模型融合与策略设计方法的chaid树多模型策略设计的技术流程图

图3是根据本发明实施例的一种chaid树模型融合与策略设计方法的chaid树变量策略设计的技术流程图。

具体实施方式

为进一步说明各实施例,本发明提供有附图,这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点,图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。

根据本发明的实施例,提供了一种chaid树模型融合与策略设计方法。

实施例一;

如图1-3所示,根据本发明实施例的chaid树模型融合与策略设计方法,包括以下步骤:

获取合适的模型样本;

根据汽车金融行业标准,确定样本的正负;

获取能够判别客户行为的变量,如消费偏好,人口属性,还款能力,应用兴趣,游戏偏好,地理位置等等;

对不同数据源的变量建模得到多模型,通过卡方自动交互检测法决策树(chaid树)对模型预测概率或者评分拟合,得到预测概率或评分的树状结构,首先可以针对树形结构进行差异化的模型融合方式,其次针对单模型未查得样本,chaid树单独对用其他模型查得样本解释;

在策略设计上,同样对不同数据源的变量建模得到多模型,通过chaid树拟合预测概率或者评分,根据chaid树的划分方式选取合适的叶子节点,选取符合业务要求和lift较高的叶子节点,配置相应的策略;针对变量做策略时,可以将需要做策略的变量放入chaid树进行拟合,同样依据叶子节点,计算其lift,挑选表现较好的叶子节点。

实施例二;

如图1-3所示,chaid决策树做模型融合有别于一般的模型融合方式,它能够挖掘样本潜力并且具有良好的可解释性,chaid决策树做策略设计时,它既可以处理分类变量也可以处理连续变量,并且每层可以处理缺失数据以增大样本价值。

实施例三;

如图1-3所示,获取样本特征维度:网贷行为,消费偏好,人口属性,还款能力,应用兴趣,游戏偏好,地理位置,行业标签,通过chaid树对各模型预测概率或评分拟合,通过树形结构进行差异化的模型融合方式,根据业务要求和实际应用情况筛选策略,在决策引擎等上线平台上部署多模型策略。

综上所述,借助于本发明的上述技术方案,模型融合会不可避免地造成偏差导致拟合效果不好,而且难以处理不同模型间未查得的样本会导致后续模型上线出现风险,与现有技术不同,本发明的核心在于,本申请提案采用chaid树融合模型的方式,既可以较好解决模型间对不同样本的偏差问题又可以用充分利用现有的样本以充分挖掘其内在价值,在策略设计上,本申请提案既可以处理分类变量,也可以处理连续变量,并且每层可以处理缺失或未查得样本挖掘样本潜力,对于汽车金融场景中实际应用十分有利。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1