一种目标客户筛选方法及装置与流程

文档序号:13805543阅读:2356来源:国知局
一种目标客户筛选方法及装置与流程

本发明涉及数据仓库技术领域,特别涉及一种目标客户筛选方法及装置。



背景技术:

在市场竞争日趋激烈的情况下,如何提高目标客户群选取的精准度、提高营销成功率、降低营销成本是各电商运营商一直关心的问题。现阶段,一般是针对专门领域的营销活动,建立数据挖掘模型,匹配特征和用户偏好等方式来筛选客户群。数据挖掘模型一般是基于历史数据分析构建,找出相应用户群的筛选规则,然后利用相应的规则得到营销客户群,构建的过程没有利用到最新的营销反馈结果。

现有技术主要存在以下2个缺陷:

1、数据挖掘模型调整的滞后性。

数据挖掘筛选出的规则往往依赖于输出指标、维度的完备性,以及数据挖掘团队的经验。模型训练经过验证后,即把模型结果固定下来,由相应的规则筛选出目标用户群。而模型的输入指标、指标的权重均保持固定不变,无法随着业务的变化而自动调整。直到模型性能下降到一定程度,引起营销人员的重视,进而投入大量人力、物力以及时间对数据挖掘模型进行二次优化。

2、营销反馈无法得到充分利用。

传统的营销反馈信息仅仅用来评价营销活动的效果,或者用来评估模型的优劣,没有实际反馈信息的充分利用,没有实现真正意义上的营销闭环。

随着市场环境的变化,用户行为也会发生改变。原有的静态模型规则或者客户标签,越来越无法适应市场、客户行为的变化,导致客户群筛选并不精准,营销效果也越来越差。



技术实现要素:

本发明要解决的技术问题是提供一种目标客户筛选方法及装置,用以解决现有的静态数据挖掘模型不能结合营销反馈结果动态调整,造成营销客户筛选不准确,营销效果差的问题。

为了解决上述技术问题,本发明实施例提供一种目标客户筛选方法,包括:

在待分类客户样本中筛选出预进行推送预设信息的本次目标客户;

获取对所述本次目标客户进行预设信息推送后的推送反馈结果;

根据所述推送反馈结果对筛选本次目标客户的筛选模型进行修正,以根据修正后的筛选模型进行下次目标客户的筛选。

进一步地,所述在待分类客户样本中筛选出预进行推送预设信息的本次目标客户的步骤包括:

获取筛选模型;

根据所述筛选模型,分别计算待分类客户样本中每个客户样本在每个类别上的概率值;

根据每个客户样本的所述概率值,在待分类客户样本中选取出推送预设信息的本次目标客户。

进一步地,所述筛选模型为朴素贝叶斯分类器时,所述获取筛选模型的步骤包括:

获取用于构建朴素贝叶斯分类器的训练数据和测试数据;

利用所述训练数据构建得到初始的分类器;

利用所述测试数据对所述分类器进行选择,得到朴素贝叶斯分类器。

进一步地,所述利用所述训练数据构建得到初始的分类器的步骤包括:

利用训练数据得到初始的分类器的先验概率和条件概率;

根据先验概率和条件概率得到训练数据、测试数据中每个样本所属的类别,并计算训练误差、测试误差,选取测试误差最小的分类器作为初始的分类器。

进一步地,所述利用训练数据得到初始的分类器的先验概率和条件概率的步骤包括:

利用公式:计算得到训练数据在每个类别上的先验概率;

利用公式:计算得到训练数据的条件概率;

其中,训练数据t={(x1,y1),(x2,y2),...,(xn,yn)},n表示所述训练数据中包含样本x的总个数;p(y=ck)表示在类别y上的先验概率;yi为y的目标变量,表示样本类别,且yi∈{c1,c2,...,ck},ck为样本类别值;i(·)表示求样本类别概率函数;p(x(j)=ajl|y=ck)表示训练数据的条件概率;表示第i个样本的第j个特征,且ajl是第j个特征取得第l个值;j=1,2,...,n,l=1,2,...,sj,k=1,2,...,k。

进一步地,所述根据先验概率和条件概率得到训练数据、测试数据中每个样本所属的类别,并计算训练误差、测试误差,选取测试误差最小的分类器作为初始的分类器的步骤包括:

利用公式:将训练数据中每个样本在预设类别上求得的最大值所对应的类别作为该样本的类别;其中,

y表示具有最大值的样本类别;p(y=ck)表示在类别y上的先验概率;y表示样本类别;ck为样本类别值;p(x(j)=x(j)|y=ck)表示条件概率,x(j)为x的目标变量,x表示样本实例,且x=(x(1),x(2),...,x(n))t

进一步地,所述利用所述测试数据对所述分类器进行选择,得到朴素贝叶斯分类器的步骤包括:

多次调整训练数据中目标变量的浓度与贝叶斯估计的参数,根据每次调整后的目标变量的浓度与贝叶斯估计的参数,在测试数据中计算评估指标值,获取最大的一个评估指标值所对应的目标事件浓度及贝叶斯估计的参数,得到朴素贝叶斯分类器;

其中,所述朴素贝叶斯分类器的先验概率为:

条件概率为:

其中,pλ(y=ck)为朴素贝叶斯分类器的先验概率;yi为y的目标变量,表示样本类别,且yi∈{c1,c2,...,ck},ck为样本类别值;i(·)表示求样本类别概率;λ为贝叶斯估计的参数;pλ(x(j)=ajl|y=ck)为朴素贝叶斯分类器的条件概率;表示第i个样本的第j个特征,且ajl是第j个特征取得第l个值;j=1,2,...,n,l=1,2,...,sj,k=1,2,...,k。

进一步地,所述评估指标值利用公式:计算得到;

其中,f1为评估指标值,p实际为正例,表示初始的分类器在测试数据上的查准率,且p=预测为正例的样本个数/预测为正例的样本个数;r为初始的分类器在测试数据上的查全率,且r=预测为正例的样本个数/实际正例的样本个数。

进一步地,所述根据每个客户样本的所述概率值,在待分类客户样本中选取出推送预设信息的本次目标客户的步骤包括:

计算待分类客户样本归属不同类别的概率值,选取目标类概率值大于非目标类概率值的样本,并把概率值由大到小降序排列,选取排列在前面的预设个数的客户样本作为本次目标客户。

进一步地,所述根据所述推送反馈结果对筛选本次目标客户的筛选模型进行修正的步骤包括:

将所述推送反馈结果与本次目标客户的类别标签进行比较,在本次目标客户中获取推送反馈结果为推送未成功的第一样本;

根据所述第一样本对筛选模型进行调整。

进一步地,当所述筛选模型为朴素贝叶斯分类器时,所述根据所述第一样本对筛选模型进行调整的步骤包括:

根据公式:重新计算朴素贝叶斯分类器的先验概率;

根据公式:重新计算朴素贝叶斯分类器的条件概率;

其中,p1(y=ck)表示朴素贝叶斯分类器的先验概率;yi为y的目标变量,表示样本类别,且yi∈{c1,c2,...,ck},ck为样本类别值;i(·)表示求样本类别概率;n表示训练数据中包含样本x的总个数;p1(x(j)=ajl|y=ck)表示朴素贝叶斯分类器的条件概率;表示第i个样本的第j个特征,且ajl是第j个特征取得第l个值;j=1,2,...,n,l=1,2,...,sj,k=1,2,...,k;n1为第一样本的个数。

本发明实施例提供一种目标客户筛选装置,包括:

筛选模块,用于在待分类客户样本中筛选出预进行推送预设信息的本次目标客户;

反馈结果获取模块,用于获取对所述本次目标客户进行预设信息推送后的推送反馈结果;

修正模块,用于根据所述推送反馈结果对筛选本次目标客户的筛选模型进行修正,以根据修正后的筛选模型进行下次目标客户的筛选。

进一步地,所述筛选模块包括:

模型获取子模块,用于获取筛选模型;

概率计算子模块,用于根据所述筛选模型,分别计算待分类客户样本中每个客户样本在每个类别上的概率值;

选取子模块,用于根据每个客户样本的所述概率值,在待分类客户样本中选取出推送预设信息的本次目标客户。

进一步地,所述修正模块包括:

反馈结果筛选子模块,用于将所述推送反馈结果与本次目标客户的类别标签进行比较,在本次目标客户中获取推送反馈结果为推送未成功的第一样本;

调整子模块,用于根据所述第一样本对筛选模型进行调整。

本发明的有益效果是:

上述方案,通过利用营销反馈结果动态调整数据挖掘模型,提高了营销客户筛选的准确性,大大提高了营销的命中率和精准度,提高了营销效果,大幅度降低了营销成本,提高了营销投入产出比以及营销收益。

附图说明

图1表示本发明实施例一的目标客户筛选方法的流程示意图。

图2表示步骤100的具体实现流程图;

图3表示步骤110的具体实现流程图;

图4表示步骤112的具体实现流程图;

图5表示步骤300的具体实现流程图;

图6表示本发明实施例一的增量学习模型的结构示意图;

图7表示本发明实施例一的基于朴素贝叶斯增量学习系统架构图;

图8表示本发明实施例二的目标客户筛选装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。

本发明针对现有的静态数据挖掘模型不能结合营销反馈结果动态调整,造成营销客户筛选不准确,营销效果差的问题,提供一种目标客户筛选方法及装置。

实施例一

如图1所示,本发明实施例的目标客户筛选方法,包括:

步骤100,在待分类客户样本中筛选出预进行推送预设信息的本次目标客户;

需要说明的是,该预设信息通常指的是营销信息,例如,推送给用户4g换机信息、订阅某一功能服务的信息等。

步骤200,获取对所述本次目标客户进行预设信息推送后的推送反馈结果;

用户在接受到预设信息推送后,会根据信息内容作出相应的选择,接受该预设信息或是拒绝该预设信息,该推送反馈结果即为进行营销的营销反馈结果,通常包括营销成功(用户接受营销推送服务)和营销不成功(用户拒绝营销推送服务)的结果。

步骤300,根据所述推送反馈结果对筛选本次目标客户的筛选模型进行修正,以根据修正后的筛选模型进行下次目标客户的筛选。

本发明实施例,通过利用营销反馈结果动态调整数据挖掘模型,提高了营销客户筛选的准确性,大大提高了营销的命中率和精准度,提高了营销效果,大幅度降低了营销成本,提高了营销投入产出比以及营销收益。

可选地,如图2所示,步骤100在具体实现时,包括:

步骤110,获取筛选模型;

需要说明的是,本实施例中,采用朴素贝叶斯分类器作为客户样本的筛选模型。

步骤120,根据所述筛选模型,分别计算待分类客户样本中每个客户样本在每个类别上的概率值;

步骤130,根据每个客户样本的所述概率值,在待分类客户样本中选取出推送预设信息的本次目标客户。

该步骤100主要实现的是在利用朴素贝叶斯分类器筛选出目标客户(即营销客户),通常情况下,将利用朴素贝叶斯分类器得到的概率值较大的客户样本作为营销客户。

进一步地,如图3所示,步骤110在具体实现时,包括:

步骤111,获取用于构建朴素贝叶斯分类器的训练数据和测试数据;

步骤112,利用所述训练数据构建得到初始的分类器;

步骤113,利用所述测试数据对所述分类器进行选择,得到朴素贝叶斯分类器。

需要说明的是,在进行朴素贝叶斯分类器的构建时,通常是先利用一部分客户样本作为训练数据,构建原始的分类器,然后再利用测试数据对原始的分类器进行测试、优化,最后得到朴素贝叶斯分类器。

具体地,如图4所示,步骤112在实现时,包括:

步骤1121,利用训练数据得到初始的分类器的先验概率和条件概率;

步骤1122,根据先验概率和条件概率得到训练数据、测试数据中每个样本所属的类别,并计算训练误差、测试误差,选取测试误差最小的分类器作为初始的分类器。

通常情况下,步骤1121的具体实现方式为:

利用公式:计算得到训练数据在每个类别上的先验概率;

利用公式:计算得到训练数据的条件概率;

其中,训练数据t={(x1,y1),(x2,y2),...,(xn,yn)},n表示所述训练数据中包含样本x的总个数;p(y=ck)表示在类别y上的先验概率;yi为y的目标变量,表示样本类别,且yi∈{c1,c2,...,ck},ck为样本类别值;i(·)表示求样本类别概率函数;p(x(j)=ajl|y=ck)表示训练数据的条件概率;表示第i个样本的第j个特征,且ajl是第j个特征取得第l个值;j=1,2,...,n,l=1,2,...,sj,k=1,2,...,k,k表示样本类别的个数。

通常情况下,步骤1122的具体实现方式为:

利用公式:将训练数据中每个样本在预设类别上求得的最大值所对应的类别作为该样本的类别;其中,

y表示具有最大值的样本类别;p(y=ck)表示在类别y上的先验概率;y表示样本类别;ck为样本类别值;p(x(j)=x(j)|y=ck)表示条件概率,x(j)为x的目标变量,x表示样本实例,且x=(x(1),x(2),...,x(n))t

具体地,步骤113的具体实现方式为:

多次调整训练数据中目标变量的浓度与贝叶斯估计的参数,根据每次调整后的目标变量的浓度与贝叶斯估计的参数,在测试数据中计算评估指标值,获取最大的一个评估指标值所对应的目标事件浓度及贝叶斯估计的参数,得到朴素贝叶斯分类器;

其中,所述朴素贝叶斯分类器的先验概率为:

条件概率为:

其中,pλ(y=ck)为朴素贝叶斯分类器的先验概率;yi为y的目标变量,表示样本类别,且yi∈{c1,c2,...,ck},ck为样本类别值;i(·)表示求样本类别概率;λ为贝叶斯估计的参数,且λ≥0;pλ(x(j)=ajl|y=ck)为朴素贝叶斯分类器的条件概率;表示第i个样本的第j个特征,且ajl是第j个特征取得第l个值;j=1,2,...,n,l=1,2,...,sj,k=1,2,...,k。

需要说明的是,对于用极大似然估计可能会出现所要估计的概率值为0的情况,这时会影响到后验概率的计算结果,使分类产生偏差。为了解决这一问题,需采用上述的贝叶斯估计的参数来计算条件概率和先验概率。

上述的评估指标值利用公式:计算得到;

其中,f1为评估指标值,p实际为正例,表示初始的分类器在测试数据上的查准率,且p=预测为正例的样本个数/预测为正例的样本个数;r为初始的分类器在测试数据上的查全率,且r=预测为正例的样本个数/实际正例的样本个数。

可选地,步骤130的具体实现方式为:

计算待分类客户样本归属不同类别的概率值,选取目标类概率值大于非目标类概率值的样本,并把概率值由大到小降序排列,选取排列在前面的预设个数的客户样本作为本次目标客户。

以二分问题为例,计算得到每个样本属于正例、负例的概率,在正例的概率大于负例的概率的样本中选取概率排在前面的多个客户样本作为本次目标客户,进行营销信息的推送。

具体地,如图5所示,步骤300在实现方式时,包括:

步骤310,将所述推送反馈结果与本次目标客户的类别标签进行比较,在本次目标客户中获取推送反馈结果为推送未成功的第一样本;

需要说明的是,采集推送未成功的客户样本的意义在于对比成功与未成功客户样本之间的差异,通过二者之间的差异进一步实现对朴素贝叶斯分类器的调整。

步骤320,根据所述第一样本对筛选模型进行调整。

进一步地,所述步骤320的具体实现方式为:

根据公式:重新计算朴素贝叶斯分类器的先验概率;

根据公式:重新计算朴素贝叶斯分类器的条件概率;

其中,p1(y=ck)表示朴素贝叶斯分类器的先验概率;yi为y的目标变量,表示样本类别,且yi∈{c1,c2,...,ck},ck为样本类别值;i(·)表示求样本类别概率;n表示训练数据中包含样本x的总个数;p1(x(j)=ajl|y=ck)表示朴素贝叶斯分类器的条件概率;表示第i个样本的第j个特征,且ajl是第j个特征取得第l个值;j=1,2,...,n,l=1,2,...,sj,k=1,2,...,k;n1为第一样本的个数。

需要说明的是,数据挖掘过程面对的一个重要问题是不断演化的新数据,现有的分类器需要不断的适应它。对于大批量的数据集进行处理时,如果新增样本与已知样本合并后处理,一方面会增加学习的难度,另外一方面也因为样本集过大而消耗过多的时间和存储空间。一个有效的解决方法是将新增样本集分别训练,并随着样本集的积累逐步提供学习精度。营销反馈数据属于有标记的增量数据。因此,本发明实施例中利用营销反馈数据来优化模型的特征权重。具体为:将得到的推送反馈结果(即增量数据),先利用现有的分类器检验其类标签,如果匹配则保留当前分类器,否则用新样本修正当前的分类器,选取的新增样本需要有助于提高当前分类器的分类精度,以调整朴素贝叶斯分类器的先验概率和条件概率。同时需要说明的是,由于新样本的加入,使得先验概率中加入了样本信息,后验概率也就由先验概率和新增样本信息共同确定。

如图6所示,本发明实施例的原理为:先验知识决定样本知识,加入的新样本进行样本知识的调整,后验知识由样本知识和先验知识决定,同时后验知识又调整先验知识,决定测试示例的预测结果由后验知识生成。

下面结合图7对本发明实施例在实际中的应用进行具体说明如下:

以潜在4g换机用户增量学习为例:首先从数据仓库中抽取与用户可能换机的相关行为属性数据集,比如用户的arpu(averagerevenueperuser,即每用户平均收入,用于衡量电信运营商和互联网公司业务收入的指标)、通话时长、上网行为特征等数据,按照适当比例把数据拆分为训练集、测试集,在训练集上进行朴素贝叶斯分类器的构建,并利用测试集对分类器的参数进行选择,得到初始化的朴素贝叶斯分类器;其次,从数据仓库中抽取待分类的样本,即客户的行为特征数据,应用初始化的朴素贝叶斯分类器,计算得到客户可能的换机概率,即目标客户;通过营销服务装置,对目标客户进行短信、人工外呼等方式进行营销接触;利用营销服务反馈采集装置,对营销结果予以采集、营销结果数据入库;在营销数据采集的基础上,利用增量学习装置,对初始化的分类器对应的先验概率、后验概率进行动态调优,并利用测试集对调优后的模型进行筛选,得到更新后的分类器,进入下一轮的迭代循环。在此过程中,朴素贝叶斯分类器不断根据增量营销反馈数据,进行自我更新。

理论上讲,任何营销活动都是有目标客户群的,选择目标客户群都是有条件的,这些条件都是可以通过增量学习装置不断学习获取的,所以通过本发明实施例的基于朴素贝叶斯的增量学习系统可以提高目标客户的精准度,提高营销效果,客户群筛选制约因素越多,越能体现出本发明的实用价值。

需要说明的是,本发明不仅使得营销目标客户定位更加精准,而且首次利用营销反馈信息动态构建朴素贝叶斯分类器,大大提高了营销的命中率和精准度,提高了营销效果,大幅度降低了营销成本,提高了营销投入产出比,最大化营销收益。

实施例二

如图8所示,本发明实施例提供一种目标客户筛选装置,包括:

筛选模块10,用于在待分类客户样本中筛选出预进行推送预设信息的本次目标客户;

反馈结果获取模块20,用于获取对所述本次目标客户进行预设信息推送后的推送反馈结果;

修正模块30,用于根据所述推送反馈结果对筛选本次目标客户的筛选模型进行修正,以根据修正后的筛选模型进行下次目标客户的筛选。

具体地,所述筛选模块10包括:

模型获取子模块,用于获取筛选模型;

概率计算子模块,用于根据所述筛选模型,分别计算待分类客户样本中每个客户样本在每个类别上的概率值;

选取子模块,用于根据每个客户样本的所述概率值,在待分类客户样本中选取出推送预设信息的本次目标客户。

所述筛选模型为朴素贝叶斯分类器时,可选地,所述模型获取子模块包括:

获取单元,用于获取用于构建朴素贝叶斯分类器的训练数据和测试数据;

分类器构建单元,用于利用所述训练数据构建得到初始的分类器;

选择单元,用于利用所述测试数据对所述分类器进行选择,得到朴素贝叶斯分类器。

具体地,所述分类器构建单元具体用于:

利用训练数据得到初始的分类器的先验概率和条件概率;

根据先验概率和条件概率得到训练数据、测试数据中每个样本所属的类别,并计算训练误差、测试误差,选取测试误差最小的分类器作为初始的分类器。

可选地,利用训练数据得到初始的分类器的先验概率和条件概率的具体实现方式为:

利用公式:计算得到训练数据在每个类别上的先验概率;

利用公式:计算得到训练数据的条件概率;

其中,训练数据t={(x1,y1),(x2,y2),...,(xn,yn)},n表示所述训练数据中包含样本x的总个数;p(y=ck)表示在类别y上的先验概率;yi为y的目标变量,表示样本类别,且yi∈{c1,c2,...,ck},ck为样本类别值;i(·)表示求样本类别概率函数;p(x(j)=ajl|y=ck)表示训练数据的条件概率;表示第i个样本的第j个特征,且ajl是第j个特征取得第l个值;j=1,2,...,n,l=1,2,...,sj,k=1,2,...,k。

可选地,根据先验概率和条件概率得到训练数据、测试数据中每个样本所属的类别,并计算训练误差、测试误差,选取测试误差最小的分类器作为初始的分类器的具体实现方式为:

利用公式:将训练数据中每个样本在预设类别上求得的最大值所对应的类别作为该样本的类别;其中,

y表示具有最大值的样本类别;p(y=ck)表示在类别y上的先验概率;y表示样本类别;ck为样本类别值;p(x(j)=x(j)|y=ck)表示条件概率,x(j)为x的目标变量,x表示样本实例,且x=(x(1),x(2),...,x(n))t

具体地,所述选择单元用于:

多次调整训练数据中目标变量的浓度与贝叶斯估计的参数,根据每次调整后的目标变量的浓度与贝叶斯估计的参数,在测试数据中计算评估指标值,获取最大的一个评估指标值所对应的目标事件浓度及贝叶斯估计的参数,得到朴素贝叶斯分类器;

其中,所述朴素贝叶斯分类器的先验概率为:

条件概率为:

其中,pλ(y=ck)为朴素贝叶斯分类器的先验概率;yi为y的目标变量,表示样本类别,且yi∈{c1,c2,...,ck},ck为样本类别值;i(·)表示求样本类别概率;λ为贝叶斯估计的参数;pλ(x(j)=ajl|y=ck)为朴素贝叶斯分类器的条件概率;表示第i个样本的第j个特征,且ajl是第j个特征取得第l个值;j=1,2,...,n,l=1,2,...,sj,k=1,2,...,k。

其中,所述评估指标值利用公式:计算得到;

其中,f1为评估指标值,p实际为正例,表示初始的分类器在测试数据上的查准率,且p=预测为正例的样本个数/预测为正例的样本个数;r为初始的分类器在测试数据上的查全率,且r=预测为正例的样本个数/实际正例的样本个数。

可选地,所述选取子模块具体用于:

计算待分类客户样本归属不同类别的概率值,选取目标类概率值大于非目标类概率值的样本,并把概率值由大到小降序排列,选取排列在前面的预设个数的客户样本作为本次目标客户。

可选地,所述修正模块30包括:

反馈结果筛选子模块,用于将所述推送反馈结果与本次目标客户的类别标签进行比较,在本次目标客户中获取推送反馈结果为推送未成功的第一样本;

调整子模块,用于根据所述第一样本对筛选模型进行调整。

其中,当所述筛选模型为朴素贝叶斯分类器时,所述调整子模块具体用于:

根据公式:重新计算朴素贝叶斯分类器的先验概率;

根据公式:重新计算朴素贝叶斯分类器的条件概率;

其中,p1(y=ck)表示朴素贝叶斯分类器的先验概率;yi为y的目标变量,表示样本类别,且yi∈{c1,c2,...,ck},ck为样本类别值;i(·)表示求样本类别概率;n表示训练数据中包含样本x的总个数;p1(x(j)=ajl|y=ck)表示朴素贝叶斯分类器的条件概率;表示第i个样本的第j个特征,且ajl是第j个特征取得第l个值;j=1,2,...,n,l=1,2,...,sj,k=1,2,...,k;n1为第一样本的个数。

需要说明的是,该装置实施例是与上述方法相对应的装置,上述方法实施例的所有实现方式均适用于该装置实施例中,也能达到相同的技术效果。

以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来说,在不脱离本发明所述的原理前提下还可以作出若干改进和润饰,这些改进和润饰也在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1