客户流失预测方法以及装置的制造方法_4

文档序号:9350460阅读:来源:国知局
规则进行匹配。如果匹配成功,则该游戏玩家会被认为是流失玩家,如果匹配不成功,则该游戏玩家会被认为为非流失玩家。
[0070]第三步:将该流失玩家的历史数据和非流失玩家的历史数据构成训练样本。
[0071]如果使用流失规则对游戏玩家的数据进行匹配的结果匹配,则将该流失结果标记为I ;如果使用流失规则对游戏玩家的数据进行匹配的结果为不匹配,则将该流失结果标记为O。将流失玩家的历史数据和标记I组成训练样本,将非流失玩家的历史数据和标记O组成训练样本。
[0072]304:使用训练样本对对应的预测模型进行训练。
[0073]使用训练样本对对应的预测模型进行训练从而使预测模型学习到先验知识。训练的样本数量可以根据需要进行设置,训练样本的数量越大,预测模型就越准确。
[0074]305:根据未知游戏玩家的现时数据以及对应的预测模型预测未知游戏玩家是否有流失倾向。
[0075]预测模型训练好后,将未知玩家的现时数据输入到对应的预测模型中。例如,可以选取未知玩家最近7天的行为信息和未知玩家的基础信息组成特征向量(特征向量的组成方向如上面所述),并将特征向量输入到对应的预测模型中,从而得到未知玩家是否有流失倾向。
[0076]306:对需求文本进行中文分词,并对中文分词后的单词进行统计以获得高频词以获得游戏玩家的需求类别。
[0077]对预判为有流失倾向的游戏玩家,客服通过电话、网络通信等方式进行采访并将游戏玩家反馈的需求记录在需求文本中,其中,每个游戏玩家反馈的需求记录在一份需求文本中。分词模块将需求文本中的汉字序列划分为一个一个的单词。对中文分词后的单词进行统计,并将出现次数超过设定阈值的单词作为高频词。其中,高频词中,一部分是能体现客户需求的单词,例如合服、开服等等,另一部分可能是不能体现客户需求的单词。将高频词中不能体现客户需求的单词去掉,则剩下的单词则代表了游戏玩家的需求类别。
[0078]307:根据需求类别的关键词对需求文本进行匹配,以获得需求类别对应的需求文本的数量。
[0079]由于不同的客服在表达同一个事物时,可能使用了不同的词语,例如,合服也可以称为合区等等。所以,在获取到代表需求类别的高频词时,可以对高频词进行扩展以获得关键词。以上述为例,可以将代表需求类别的高频词“合服”可扩展为关键词“合服”和“合区”。用扩展后的关键词“合服”或“合区”对需求文本进行匹配,如果能够击中需求文本,需求类别“合服”对应的需求文本的数量加一。对各需求类别的需求文本的数量统计完毕后,将统计结果反馈到运营部门,以供运营部门决定是否需要按照客户的需求进行处理。
[0080]308:对预测为有流失倾向的未知游戏玩家的登陆信息、充值信息、消费信息中的任意一种或者多种的组合进行跟踪。
[0081]对预判为有流失倾向的未知游戏玩家,需进一步跟踪未知游戏玩家的登陆信息、充值信息、消费信息等等,如果未知游戏玩家的登录、充值和消费情况进一步减少,可以提高这类游戏玩家的预警级别,并反馈给运营部门进行处理。
[0082]通过实施本发明实施例,能够通过计算机来完成采集客户的数据、建立预测模块、对预测模型进行训练以及根据预测模型进行预测等工作,比人工逐个进行筛选的速度快,效率高。而且,本发明对不同的客户进行了分组,针对每种客户类型的客户建立属于自己的预测模型进行预测,比起人工对所有的客户采用单一的规则进行预测来说,提高了预测的准确性。
[0083]而且,对预判为有流失倾向的游戏玩家,可以通过中文分词、统计和匹配的方法从客服反馈的需求文本中找到游戏玩家的需求类别,并统计出需求类别对应的需求文本的数量,可以使得运营部门能够清楚知道游戏玩家对各个需求类别的需求急切程度,从而决定合适的运营策略。同时,也对预判为有流失倾向的游戏玩家继续进行跟踪,减少有流失倾向的游戏玩家的流失数量。
[0084]参阅图5,图5为本发明客户流失预测装置一实施方式的结构示意图。本实施方式的客户流失预测装置500包括:分组模块510、建模模块520、识别模块530、训练模块540以及预测模块550。
[0085]分组模块510用于根据采集到的客户的历史数据对所述客户进行分组以获得多个客户类型。
[0086]建模模块520用于建立多个预测模型,其中,不同的客户类型对应不同的预测模型。
[0087]识别模块530用于通过流失规则从同一客户类型的客户中识别出流失客户和未知客户以获得对应预测模型的训练样本,其中,不同的客户类型对应不同的流失规则。
[0088]训练模块540用于使用所述训练样本对对应的预测模型进行训练。
[0089]预测模块550用于根据所述未知客户的现时数据以及对应的预测模型预测所述未知客户是否有流失倾向。
[0090]本实施方式的客户流失预测装置500与图1所述的方法一一对应,具体请参阅图1以及相关描述,此处不再重复赘述。
[0091]参阅图6,图6为本发明客户流失预测装置另一实施方式的结构示意图。本实施方式的客户流失预测装置600包括:分组模块610、建模模块620、识别模块630、训练模块640、预测模块650、分词模块660、统计模块670、匹配模块680以及跟踪模块690。
[0092]分组模块610用于根据采集到的客户的历史数据对所述客户进行分组以获得多个客户类型。
[0093]建模模块620用于建立多个预测模型,其中,不同的客户类型对应不同的预测模型。
[0094]识别模块630用于通过流失规则从同一客户类型的客户中识别出流失客户和未知客户以获得对应预测模型的训练样本,其中,不同的客户类型对应不同的流失规则。
[0095]训练模块640用于使用所述训练样本对对应的预测模型进行训练。
[0096]预测模块650用于根据所述未知客户的现时数据以及对应的预测模型预测所述未知客户是否有流失倾向。
[0097]可选地,所述客户的历史数据包括所述客户的基础信息以及所述客户的行为信息,所述客户的基础信息包括年龄、性别、注册地、等级、客户端登陆状况中的任意一种或者多种的组合,所述客户的行为信息包括登陆信息、充值信息、消费信息、事件信息中的任意一种或者多种的组合。
[0098]可选地,所述登陆信息包括统计日前i天登陆游戏大厅的次数、登陆游戏大厅的天数、登陆游戏大厅的时长、登陆游戏大厅的趋势、登陆游戏的次数、登陆游戏的天数、登陆游戏的时长、登陆游戏的趋势中的任意一种或者多种的组合;所述充值信息包括统计日前i天游戏大厅的充值的次数、游戏大厅的充值的天数、游戏大厅的充值的金额、游戏大厅的充值的趋势、游戏的充值的次数、游戏的充值的天数、游戏的充值的金额、游戏的充值的趋势中的任意一种或者多种的组合;所述消费信息包括统计日前i天游戏大厅的消费的次数、游戏大厅的消费的天数、游戏大厅的消费的金额、游戏大厅的消费的趋势、游戏的消费的次数、游戏的消费的天数、游戏的消费的金额、游戏的消费的趋势中的任意一种或者多种的组合;所述事件信息包括统计日前i天客户参与的游戏总类数量、客户参与的游戏风格占比,客户参与的游戏题材占比、过关失败次数、使用道具数、游戏风格、游戏题材中的任意一种或者多种的组合,其中,i为大于零的正整数。
[0099]可选地,所述分组模块610还用于根据采集到的客户的数据并通过聚类算法对所述客户进行分类以获得多个客户类型。
[0100]可选地,所述聚类算法为k-means聚类算法、K-Medoids聚类算法、PCA聚类算法、DBSCAN聚类算法中的任意一种。
[0101]可选地,所述预测模型为支持向量机分类器、朴素贝叶斯分类器、决策树分类器、人工神经网络中的任意一种。
[0102]可选地,所述装置600还包括:分词模块660、统计模块670以及匹配模块680,所述分词模块660用于对需求文本进行中文分词,其中,所述需求文本为客服人员对预测为有流失倾向的未知客户进行采访记录得到的反馈文本;所述统计模块670用于对中文分词后的单词进行统计得到高频词以获得客户的需求类别;所述匹配模块680用于根据所述需求类别的关键词对所述需求文本进行匹配,以获得所述需求类别对应的所述需求文本的数量,其中,所述关键词为所述需求类别对应的高频词或者高频词的同义词。
[0103]可选地,所述装置还包括跟踪模块690,所述跟踪模块690用于对预测为有流失倾向的未知客户的登陆
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1