一种确定目标用户的方法及装置与流程

文档序号:11655213阅读:193来源:国知局
一种确定目标用户的方法及装置与流程

本发明涉及通信网络服务领域,尤其涉及一种确定目标用户的方法及装置。



背景技术:

作为移动业务的载体,移动终端是新增市场的开发、存量市场的维系、以及数据及信息业务发展的一个重要切入点。过去,运营商都喜欢移动终端打折、送高额话费补贴、移动终端0元购、送实物。在目前降本增效的背景下,这套营销思路显然不合适,既不能有效保有客户,又不能鼓励高价值客户迁移。所以,4g时代的移动终端营销政策要更加精准。因此如何有效地找出移动终端营销的目标客户,对目标客户的用机偏好进行分析,已经成为运营商亟需解决的问题。

现有的移动终端目标用户分析方法,主要是依靠业务经验,抽取用户过往的业务使用行为、业务特点、消费水平等信息判断用户是否有换机需求,以及目标的移动终端消费能力。现有的分析方法,依赖个人的分析经验和分析偏好,涉及的业务属性有限,判断方法不规范,难以达到较高的营销准确率,营销推广效果不够理想。

综上,现有的目标用户确定方法不够精准,无法满足准确营销的目的。



技术实现要素:

本发明实施例提供一种确定目标用户的方法及装置,用以解决现有技术中存在目标用户确定方法不够精准,不利于准确营销的问题。

本发明方法包括一种确定目标用户的方法,该方法包括:获取各终端的历史使用信息,所述历史使用信息包括用户使用终端的通讯信息和用户换机信息;根据预设的行为特征指标,利用聚类算法将所述用户使用终端的通讯信息进行聚类,得到每个行为特征指标对应的历史使用信息子集合;根据所述历史使用信息子集合中的用户使用终端的通讯信息,确定每个历史使用信息子集合的行为特征指标的取值;根据所述历史使用信息子集合中的用户换机信息,确定每个历史使用子集合对应的换机属性;根据所述预设的行为特征指标、所述历史使用信息子集合的行为特征指标的取值及所述每个历史使用子集合对应的换机属性建立决策树模型;利用所述决策树模型分析终端的历史使用信息,从所述终端的使用用户中确定出有换机需求的目标用户。

基于同样的发明构思,本发明实施例进一步地提供一种确定目标用户的装置,该装置包括:获取单元,用于获取各终端的历史使用信息,所述历史使用信息包括用户使用终端的通讯信息和用户换机信息;聚类单元,用于根据预设的行为特征指标,利用聚类算法将所述用户使用终端的通讯信息进行聚类,得到每个行为特征指标对应的历史使用信息子集合;确定取值单元,用于根据所述历史使用信息子集合中的用户使用终端的通讯信息,确定每个历史使用信息子集合的行为特征指标的取值;确定属性单元,用于根据所述历史使用信息子集合中的用户换机信息,确定每个历史使用子集合对应的换机属性;建立模型单元,用于根据所述预设的行为特征指标、所述历史使用信息子集合的行为特征指标的取值及所述每个历史使用子集合对应的换机属性建立决策树模型;确定目标用户单元,用于利用所述决策树模型分析终端的历史使用信息,从所述终端的使用用户中确定出有换机需求的目标用户。

本发明实施例一方面获取各终端的历史使用信息,利用预设的行为特征指标将历史使用信息聚类成与行为特征指标相关的历史使用信息子集合;另一方面,利用每个历史使用信息子集合的行为特征指标、行为特征指标的取值、换机属性建立决策树模型,这样利用建好的决策树模型分析其它用户的历史使用信息,就可以得出该用户的换机属性,找到真正有换机需求的目标用户。可见,因为利用了历史用户的历史使用信息建立决策树模型,该模型可以反复使用,且分析得到的结果准确率高,替代了现有的人工经验区分,使得目标用户确定结果更加精准,也利于各种营销策略的制定。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供一种确定目标用户的方法流程示意图;

图2为本发明实施例提供一种历史使用信息子集合量化为三维数组的示意图;

图3为本发明实施例提供一种聚类方法流程示意图;

图4为本发明实施例提供一种生成密集区域示意图;

图5为本发明实施例提供一种决策树示意图;

图6为本发明实施例提供一种确定目标用户的装置示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

参见图1所示,本发明实施例提供一种确定目标用户的方法流程示意图,具体地实现方法包括:

步骤s101,获取各终端的历史使用信息,所述历史使用信息包括用户使用终端的通讯信息和用户换机信息。

步骤s102,根据预设的行为特征指标,利用聚类算法将所述用户使用终端的通讯信息进行聚类,得到每个行为特征指标对应的历史使用信息子集合。

步骤s103,根据所述历史使用信息子集合中的用户使用终端的通讯信息,确定每个历史使用信息子集合的行为特征指标的取值。

步骤s104,根据所述历史使用信息子集合中的用户换机信息,确定每个历史使用子集合对应的换机属性。

步骤s105,根据所述预设的行为特征指标、所述历史使用信息子集合的行为特征指标的取值及所述每个历史使用子集合对应的换机属性建立决策树模型。

步骤s106,利用所述决策树模型分析终端的历史使用信息,从所述终端的使用用户中确定出有换机需求的目标用户。

在步骤s101中,从运营商平台中获取历史用户的信息,然后找到这些历史用户使用的终端的历史使用信息,终端的历史使用信息主要是指用户每月的话费账单信息和用户使用的终端类型,所谓终端类型,例如是4g手机还是3g手机,使用的手机品牌、型号、颜色等,另外还会从用户的注册信息中获取用户的性别、年龄、颜色爱好等信息。

因为历史使用信息包含的数据量庞大,且没有一定的规律性,分析起来十分复杂,因此本发明实施例利用预设的行为特征指标将原始的历史使用信息进行分类,其中预设的行为特征指标可以是用户的通话行为、短信行为、在家规律、位置变换规律、月话费金额、上网每月使用流量等指标。因为不同的指标对应的数据反映了此类用户的用机特点,所以结合不同的指标可以确定该类用户的基本用机特点。例如,用户王先生当前使用的3g手机,12月份月话费金额为120元,其中每月月租是58元,通话费用30元,月流量包月为15元,短信费用17元。基本上可以确定该用户的月话费金额很高,月租偏高、消费能力强,有一定的购买力。

所谓换机属性指的是该类用户群的换机特点,因为在建立决策树时会利用已有用户的换机特点。例如根据一般的经验,可知经常换手机的用户,当新的类型的手机面向市场销售时,这类用户会是主要购买群体,例如每年苹果手机发布时,之前使用苹果手机的用户会继续购买新的型号的苹果手机;或者是某个手机用户每个月上网流量较大,证明该用户经常使用手机上网,如果该用户当前使用的是3g手机,那么鉴于4g手机网速更快的优点,那么该类型用户基本上都会换成4g类型的手机。鉴于这些历史经验,根据历史用户中的历史使用信息反映的行为特征指标的特点,为每个用户打上是否换手机的标签,也就是换机属性,这样就可以基于历史用户建立决策树模型。

当然,在获取各终端的历史使用信息时,还需要采用抽样的方法对各终端的历史使用信息中的缺省值或异常值进行过滤,得到处理后的各终端的历史使用信息。因为历史使用信息中的缺省值或者是异常值并不能准确表达出使用用户的行为特征,例如某个月用户的话费账单为0,该值很可能是因为运营系统故障造成,故不能放在历史使用信息的集合中进行聚类。这样做的效果是可以有效地提高最终确定的目标用户的准确性。

进一步地,针对每个行为特征指标,将所述用户使用终端的通讯信息以三维数组的方式的表示;按照k-d算法对所述三维数组中的数据进行三维空间聚类,得到k个聚类,其中,每个聚类对应一个历史使用信息子集合,k为整数。

具体地,本发明实施例利用k-means算法进行历史使用信息中不同信息的聚类,k-means算法聚类的方法大概包括如下几个步骤:

步骤一、将历史使用信息存储为一个数据集d,然后给定聚类个数k和k个初始聚类中心;

步骤二、计算每个数据到聚类中心的距离,并根据距离最小将每个对象分派到最相近的聚类;

步骤三、重新计算每个聚类的均值并确定新的聚类中心;计算误差平方和准则函数j;

步骤四、输出k个聚类集合。

例如,根据性格理论学研究及抽样,将预设的行为特征指标设定为一组与性格相关的指标,把每个指标值对应的历史使用信息子集合量化为三维数组k(x,y,z),如图2所示,通过建立k-d树实现对每个用户指标进行数据组织,实现了数据相似特征的匹配。特征匹配本质上是一个通过空间距离函数在高维矢量之间进行相似性检索,并形成聚类集,其流程如下图3所示包括:

步骤201,根据性格理论学研究及抽样,为历史使用信息确定行为特征指标;

步骤202,然后得到关于每个行为特征指标的的历史使用信息子集合;

步骤203,将历史使用信息子集合量化为多维数组k(x,y,z),历史使用信息子集合中每个数据被记录在多维数组的空间立方中;

步骤204,对多维数组进行聚类,得到历史使用信息子集合中的密集区域。

这样,不同的性格参考指标对应的历史使用信息子集合就可以分别被量化为三维数组,x个性格参考指标则对应x个三维数组。

进一步地,将每个三维数据再进行分群分类,通过构建k-d树存储客户的指标数据,再通过k-d树的近邻查找算法实现数据的聚类客户分区。例如结合了七大人格模型理论、客户行为特征指标,通过抽样调查验证,确定了7类密集区域,对应到7类性格,分成的密集群如图4所示。

比如说,针对通话行为这个行为特征指标对应的历史使用信息子集合,采用上文中三维数组量化,则k(x,y,z)中x可以代表通话时长、y代表通话次数、z代表每次通话的开始时刻,那么将k(x,y,z)中的通话数据聚类后得到的7个密集群有可能包括长途通话用户群、市内通话用户群、国际通话用户群等群信息。

当将上述历史使用信息进行细分之后,就可以根据细分之后的历史使用信息子集合对应的取值、行为特征指标、换机属性建立决策树模型,例如选取某电信公司2006年客户缴费数据,选取10000个样本,经过数据清洗后,还剩下8725个样本,对这些客户的通话记录、短信行为、账单金额进行分析,利用k-means算法细分为如下5个客户群,见表一:

根据表一中的对应的行为特征指标(拥有4g手机、换机频率、月话费金额、上网包月流量、换机需求等)和每个群对应的行为特征指标的取值,换机需求建立决策树模型,如图5所示。,其中因为表一中客户群i拥有4g手机,故这类用户没有换4g手机的需求,其余的客户群则进一步地细分,客户群ii的换机频率很高,所以有换4g手机的需求,依次类推,完成决策树模型的建立,当新来了一个用户,发现该用户的历史使用信息中平均每年两部手机,则可以依据决策树模型的分析结果得知该用户是有换机需求的,将该用户确定为目标用户。

当确定了目标用户之后,需要有针对性为目标用户确定要营销的终端信息,确定终端信息的方法具体为:根据频繁项集数据挖掘算法,建立换机前的用机特征与换机后的终端信息的对应关系;根据所述目标用户的历史使用信息,确定所述目标用户使用换机前的用机特征;根据所述对应关系确定所述目标用户对应的换机后的终端信息,从而向所述目标用户推送所述目标用户对应的终端信息。

其中,所述频繁项集挖掘算法可以采用fp-growth算法或apriori算法实现。fp-growth算法是2000年提出的一种新的频繁项集挖掘算法,它脱离了apriori算法必须产生候选项集的传统方式,建立了基于fp-tree结构的不产生候选项集的思想,开辟了关联规则的新思路,属于现有技术方案,此处不赘述。

确定终端信息的方法可以通过如下事例进一步地描述,例如,根据换机前的历史使用信息,先将换机前的用户按终端价格段分成8个群体,分别为终端价格4000元以上用户群、3000-4000元用户群、2000-3000元用户群、1000-2000元用户群、500-1000元用户群、500元以下用户群、价格未知用户群,再分析各用户群换机前属性、行为特征与换机后价格类别间的对应关系。根据对应关系确定出目标用户可能会购买的终端的价格。其中对应关系的确定方式为:针对已换机用户,获取所述已换机用户换机前的历史使用信息和换机后的终端信息;根据所述已换机用户换机前的历史使用信息,确定已换机用户的换机前的用机特征;建立换机前的用机特征与换机后的终端信息的对应关系。

例如,用户a换机前的用机特征中使用的手机价格在1000-2000元之间,属于1000-2000元用户群,换机之后的手机价格仍然在1000-2000之间,可见这类用户具备这样的用机特点,故将价格在1000-2000之间的手机推销给该用户a。

同理,也可以以同样的方法计算出用户对使用的终端的操作系统偏好、屏幕大小偏好、网络制式偏好等对应关系,也就是说等于为每个用户打上了了品牌、价格、操作系统、屏幕大小、网络制式等的适配标签。这样,终端销售人员可以根据现有在售终端信息,从终端属性的不同维度来筛选满足要求的客户。根据实际情况实现在售终端与客户的精确适配,提高营销响应率。

当然上述是确定有换机需求的目标用户,若根据聚类后的用户群的行为特征发现部分用户的账单中没有长途话费较多,则对该类客户设计长途优惠的套餐,刺激客户多打长途电话。假若发现某个用户群的用户使用信息子集合反映出短信费较高,则可以向短信费高的客户推荐叠加使用短信包月套餐。

可见,本发明实施例在细分各客户群的基础上,可以有效地找出终端营销的潜在客户,进而保证终端推荐的结果。即本发明实施例采用基于k-means算法的客户性格分析细分客户群,建立客户性格标签,并结合基于决策树c5.0算法识别出终端营销的潜在客户。在识别出终端营销的潜在客户后,进一步地确定目标客户的终端适配程度,进而实现终端推荐,本发明实施例中使用apriori关联算法找出客户换机后的用机特征与客户换机前的用机特征之间的关联关系,准确预测适配的终端类型。

基于相同的技术构思,本发明实施例还提供一种确定目标用户的装置,该装置可执行上述方法实施例。本发明实施例提供的装置如图6所示,包括:获取单元401、聚类单元402、确定取值单元403、确定属性单元404、建立模型单元405、确定目标用户单元406,其中:

获取单元401,用于获取各终端的历史使用信息,所述历史使用信息包括用户使用终端的通讯信息和用户换机信息;

聚类单元402,用于根据预设的行为特征指标,利用聚类算法将所述用户使用终端的通讯信息进行聚类,得到每个行为特征指标对应的历史使用信息子集合;

确定取值单元403,用于根据所述历史使用信息子集合中的用户使用终端的通讯信息,确定每个历史使用信息子集合的行为特征指标的取值;

确定属性单元404,用于根据所述历史使用信息子集合中的用户换机信息,确定每个历史使用子集合对应的换机属性;

建立模型单元405,用于根据所述预设的行为特征指标、所述历史使用信息子集合的行为特征指标的取值及所述每个历史使用子集合对应的换机属性建立决策树模型;

确定目标用户单元406,用于利用所述决策树模型分析终端的历史使用信息,从所述终端的使用用户中确定出有换机需求的目标用户。

其中,所述获取单元401还用于:采用抽样的装置对各终端的历史使用信息中的缺省值或异常值进行过滤,得到处理后的各终端的历史使用信息。

进一步地,所述聚类单元402具体用于:针对每个行为特征指标,将所述用户使用终端的通讯信息以三维数组的方式的表示;

按照k-d算法对所述三维数组中的数据进行三维空间聚类,得到k个聚类,其中,每个聚类对应一个历史使用信息子集合,k为整数。

进一步地,还包括:确定终端信息单元407,用于根据频繁项集数据挖掘算法,建立换机前的用机特征与换机后的终端信息的对应关系;根据所述目标用户的历史使用信息,确定所述目标用户使用换机前的用机特征;根据所述对应关系确定所述目标用户对应的换机后的终端信息,从而向所述目标用户推送所述目标用户对应的终端信息。

其中,所述确定终端信息单元具体用于:针对已换机用户,获取所述已换机用户换机前的历史使用信息和换机后的终端信息;根据所述已换机用户换机前的历史使用信息,确定已换机用户的换机前的用机特征;建立换机前的用机特征与换机后的终端信息的对应关系。

本发明实施例一方面获取各终端的历史使用信息,利用预设的行为特征指标将历史使用信息聚类成与行为特征指标相关的历史使用信息子集合;另一方面,利用每个历史使用信息子集合的行为特征指标、行为特征指标的取值、换机属性建立决策树模型,这样利用建好的决策树模型分析其它用户的历史使用信息,就可以得出该用户的换机属性,找到真正有换机需求的目标用户。可见,因为利用了历史用户的历史使用信息建立决策树模型,该模型可以反复使用,且分析得到的结果准确率高,替代了现有的人工经验区分,使得目标客户确定结果更加精准,也利于各种营销策略的制定。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1