基于bbd或/和rf模型获取潜客级别的方法和系统的制作方法

文档序号:9376548阅读:339来源:国知局
基于bbd或/和rf模型获取潜客级别的方法和系统的制作方法
【技术领域】
[0001] 本发明涉及潜在数据挖掘技术领域,尤其涉及一种基于BBD或/和RF模型获取潜 客级别的方法和系统。
【背景技术】
[0002] 每天,有一部分购车潜在用户会以很大的概率在短期内转化为实际购车用户(比 如有过下SL行为的用户),如果售车网站通过对网站用户的历史行为分析,预测出用户的 潜在级别,就可以提前对用户做预判,从而帮助厂商、经销商和网站自己做相应的运营策 略,以提高或影响用户的体验或决策过程。因此,整个潜在客户(简称潜客)的挖掘工作属 于售车网站UP中重要的一部分。
[0003] 目前,一般采用如下方法做潜客分析:
[0004] 从数据库中抽样用户行为日志,但由于数据量问题,时间周期较短;人工对用户行 为日志分析,比如,用户访问了网站的哪个频道,频次如何,时长怎样;人工对不同类型、不 同来源行为做权重设置,比如:用户下过销售线索,权重为:〇. 5 ;人工对上述权重做组合, 并人工确定阈值,划分潜客级别。
[0005] 但是,现有技术均存在以下缺陷:
[0006] 大部分数据都是基于数据库的,所以能够处理的数据量有限,而要想深入了解用 户行为往往需要大量的数据分析;人工进行用户行为分析工作量较大,且容易出错;人工 利用先验知识对用户的不同行为确定权重及做权重组合,导致人工干扰较多,且结果无法 衡量,效果无法得到保证。

【发明内容】

[0007] 本发明的目的在于提供一种基于BBD或/和RF模型获取潜客级别的方法和系统, 从而解决现有技术中存在的前述问题。
[0008] 为了实现上述目的,本发明采用的技术方案如下:
[0009] -种基于BBD模型获取潜客级别的方法,包括如下步骤:
[0010] Sl,构建BBD模型,所述BBD模型的形式如下:
[0011]
[0012]式中,
[0013] C :用户历史下单行为次数,
[0014] I :用户历史浏览行为次数,
[0015] Ctr :用户潜在下单概率,
[0016] α、β :BBD模型的参数;
[0017] S2,采用MLE方法,建立如下算式:
[0018]
[0019] 式中,
[0020] η :样本的个数;
[0021] S3,对S2中的算式取In后获得完全数据的log likelihood function ;
[0022] S4,计算所述完全数据的log likelihood function的数学期望;
[0023] S5,根据所述数学期望获得如下形式的迭代式; Γλλο/ι?
[0026] S6,根据S5中的迭代式计算所述BBD模型的参数:α、β的值;
[0027] S7,将α、β的值代入SI中的所述BBD模型中,根据所述BBD模型计算用户潜在 下单概率。
[0028] 其中,Sl中,用户历史下单行为服从二项分布:
[0029]
[0030] 下单概率服从beta分布:

[0031] '、 · ··, 〇
[0032] 优选地,S3中,所述完全数据的log likelihood function为:
[0033]
[0034] 优选地,S4中,所述计算所述完全数据的log likelihood function的数学期望, 采用EM算法,具体为:
[0035]

LUUbI」一柙盎t BBU悮型犾耿潸各级别的糸轨,忸拈:
[0052] 数据平台:包括特征数据层和画像数据层,所述特征数据层包括:网站用户的历 史行为数据、由行为数据挖掘出的行为特征数据及由已有用户画像数据生成的特征数据; 画像数据层包括:由所述特征数据通过模型学习得到的用户画像数据;
[0053] 计算平台:包括模型层、算法层和计算层,所述模型层包括:BBD模型;所述算法层 包括:SGD/GD、LBFGS和CD优化算法;所述计算层通过读取所述数据平台的所述特征数据, 使用所述算法层提供的优化算法训练得到所述BBD模型参数;
[0054] 应用平台:读取所述计算平台得到的BBD模型和所述数据平台存储的所述特征数 据,应用BBD模型并输出潜客级别。
[0055] -种基于BBD模型和RF模型获取潜客级别的方法,包括如下步骤:
[0056] 步骤1,利用机器学习模型,构建基于BBD模型和RF模型的RF融合模型;其中,BBD 模型求解的方法如权利要求1-6任一项中所述的基于BBD模型获取潜客级别的方法;
[0057] 步骤2,应用所述RF融合模型并输出潜客级别数据。
[0058] 其中,所述步骤1包括如下步骤:
[0059] 步骤101,将样本集划分为训练样本集一、训练样本集二和测试样本集;
[0060] 步骤102,利用所述训练样本集一进行BBD模型求解,且进行BBD模型求解的方法 如权利要求1-6任一项所述的方法,获取BBD模型并输出结果;
[0061] 步骤103,利用所述训练样本集二进行RF模型求解,获取RF模型并输出结果;
[0062] 步骤104,将步骤102和103中获得的BBD模型的输出结果和RF模型的输出结果 进行合并,作为训练样本集三,并利用所述训练样本集三进行RF融合模型求解,生成RF融 合模型;
[0063] 步骤105,利用所述测试样本集对所述RF融合模型进行测试,得到测试结果;
[0064] 步骤106,根据测试结果判断是否调整BBD模型,如果是,则跳转到步骤102,否则, 判断是否调整RF模型,如果是,则跳转到步骤103,否则,输出所述RF融合模型的评价指标, 以及所述RF融合模型。
[0065] -种基于BBD模型和RF模型获取潜客级别的系统,包括:
[0066] 数据平台:包括特征数据层和画像数据层,所述特征数据层包括:网站用户的历 史行为数据、由行为数据挖掘出的行为特征数据及由已有用户画像数据生成的特征数据; 画像数据层包括:由所述特征数据通过模型学习得到的用户画像数据;
[0067] 计算平台:包括模型层、算法层和计算层,所述模型层包括:BBD模型、RF模型和RF 融合模型;所述算法层包括:SGD/GD、LBFGS和CD优化算法;所述计算层通过读取所述数据 平台的所述特征数据,使用所述算法层提供的优化算法训练得到所述BBD模型、RF模型的 参数,获取RF融合模型的参数;
[0068] 应用平台:读取所述计算平台得到的RF融合模型以及所述数据平台存储的所述 特征数据,应用RF融合模型输出潜客级别。
[0069] 本发明的有益效果是:本发明实施例提供的基于BBD或/和RF模型获取潜客级别 的方法和系统,通过构建和使用BBD或/和RF模型,获取潜客级别,充分利用了用户历史行 为数据,利用大数据平台提取用户在多天(比如120天)内的行为数据,从而可以深入了解 用户行为;另外,构建特征工程系统,自动化计算用户偏好、时长、频次等行为特征,采用模 式识别方法,通过对数据概率分布的合理假设,让模型自己学习数据规律,自动确定自变量 与因变量之间的权重关系,既解决了人工进行用户行为分析工作量大的问题,也完全排除 了人工影响,同时,还有明确的衡量指标:AUC、Recall、Precision、MSE,自动通过真实数据 对模型效果做衡量,从而使输出的潜客级别的结果得到有效的衡量,保证结果的有效性。
【附图说明】
[0070] 图1是本发明实施例一提供的基于BBD模型获取潜客级别的方法流程示意图;
[0071] 图2是本发明实施例二提供的基于BBD模型获取潜客级别的系统结构示意图;
[0072] 图3是本发明实施例三提供的基于BBD模型和RF模型获取潜客级别的方法流程 示意图;
[0073] 图4是本发明实施例四提供的基于BBD模型和RF
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1