客户流失预测方法以及装置的制造方法_3

文档序号：9350460阅读：来源：国知局

形式存储在服务器中。当需要进行游戏玩家流失预测时，可以从服务器的数据库中读取游戏玩家的历史数据。其中，服务器可以是传统的服务器，也可以是云服务器。基础信息采集单元401、登陆信息采集单元402、充值信息采集单元403、消费信息采集单元404以及事件信息采集单元405可以是客户端上的软件模块，也可以是服务器上的软件模块。
[0052]尽管不同游戏玩家的历史数据通常并不相同，但是，大部分游戏玩家可以被分为多个组，每个组内的游戏玩家的历史数据之间具有高度的相似性。只有极少部分的游戏玩家的历史数据与每个组内的游戏玩家的历史数据均不相似，这部分历史数据通常可以忽略不计。要实现将历史数据具有高度相似性的游戏玩家分到同一个组内，可以将采集到的游戏玩家的历史数据利用聚类算法对游戏玩家进行分类以获得多个游戏玩家类型，每个游戏玩家类型中的游戏玩家的历史数据具有高度相似性。
[0053]在利用聚类算法进行聚类分析前，需利用游戏玩家的历史数据构建特征向量，并将特征向量作为聚类算法的输入。特征向量的维数等于游戏玩家的基础信息的数量与游戏玩家的行为信息的数量之和。在构建特征向量时，属于数量值的可以直接使用其原数量值作为特征向量的一个元素值，也可以对其原数量值进行归一化后作为特性向量的一个元素值。属于非数量值的，则必须对其赋予其数量以作为特征向量的一个元素值。
[0054]在归一化实施过程中可采用最大-最小值归一化算法，即为元素值=(原数量值-该维元素最小值)/(该维元素最大值-该维元素最小值)。属于数量值的包括:登陆游戏大厅的次数、登陆游戏大厅的天数、登陆游戏大厅的时长、登陆游戏大厅的趋势、登陆游戏的次数、登陆游戏的天数、登陆游戏的时长、登陆游戏的趋势、游戏大厅的充值的次数、游戏大厅的充值的天数、游戏大厅的充值的金额、游戏大厅的充值的趋势、游戏的充值的次数、游戏的充值的天数、游戏的充值的金额、游戏的充值的趋势、游戏大厅的消费的次数、游戏大厅的消费的天数、游戏大厅的消费的金额、游戏大厅的消费的趋势、游戏的消费的次数、游戏的消费的天数、游戏的消费的金额、游戏的消费的趋势、游戏玩家参与的游戏总类数量、游戏玩家参与的游戏风格占比，游戏玩家参与的游戏题材占比、过关失败次数、使用道具数等等。上述的归一化算法只是其中的一种算法，此外，还可以采用对数函数转换法、反余切函数转换法等等。
[0055]对于非数量值的，例如，性别、注册地、游戏风格、游戏题材的赋值可采用如下的方法赋值。例如，对于性别，男性赋值为1，女性赋值为O。对于注册地，北京赋值为1，上海赋值为2，广州赋值为3，深圳赋值为4等等。对于游戏风格，唯美风格赋值为1，写实风格赋值为2，可爱风格赋值为3等等。对于游戏题材，历史题材赋值为1，武侠题材赋值为2，玄幻题材赋值为3，奇幻题材赋值为4等等。
[0056]在构建好特征向量后，将特征向量作为k-means聚类算法的输入，则输出的即为游戏玩家的分组的情况。如图2所示，在k-means聚类算法中，游戏玩家可以用图中的黑点来表示，游戏玩家的历史数据之间的相似性可以用黑点之间的距离来进行表示。黑点之间的距离越近，表示两个游戏玩家之间的相似度越大，黑点之间的距离越远，表示两个游戏玩家之间的相似度越小。设置合适的阈值，可以使得黑点的距离都十分接近，如图中实线圈内的黑点距离都十分接近，即实线圈可以代表不同的游戏玩家类型，实线圈内的黑点代表被分到同一游戏玩家类型的游戏玩家。其中，聚类算法除了可以为k-means聚类算法外、还可以是 Κ-Medoids 聚类算法、PCA 聚类算法、DBSCAN(Density-Based Spatial Clustering ofApplicat1ns with Noise)聚类算法等等中的任意一种。
[0057]302:建立多个预测模型，其中，不同的游戏玩家类型对应不同的预测模型。
[0058]预测模型为可以根据一定的先验知识和游戏玩家在现时的数据，预测游戏玩家是否具有流失倾向的模型。由于不同游戏玩家类型的游戏玩家通常具有不同的特点，所以，为了提高预测的准确性，在对游戏玩家进行分组后，需要为不同游戏玩家类型的游戏玩家分别建立适合自己的预测模型。同一游戏玩家类型的游戏玩家使用同一种预测模型，不同游戏玩家类型的游戏玩家使用不同的预测模型。预测模型可以为支持向量机分类器、朴素贝叶斯分类器、决策树分类器、人工神经网络等等中的任意一种。
[0059]303:通过流失规则从同一客户类型的客户中识别出流失客户和未知客户以获得对应预测模型的训练样本，其中，不同的客户类型对应不同的流失规则。
[0060]在新建立了预测模型后，由于新建立的预测模型是不具有先验知识的，所以，可以通过训练样本对新建立的预测模型进行训练，从而使预测模型学习到先验知识。获得训练样本的方法通常为:第一步，设定流失规则；第二步:通过人工或机器识别的方法将游戏玩家的历史数据与流失规则进行匹配，如果匹配成功，则该游戏玩家被认为流失玩家，剩下的为非流失玩家；第三步:将该流失玩家的历史数据和非流失玩家的历史数据构成训练样本。具体地:
[0061]第一步:设定流失规则。
[0062]由于不同游戏玩家类型的游戏玩家具有不同的特点，所以，可以为不同的游戏玩家设定不同的流失规则。对于其中一种游戏玩家类型的游戏玩家，可以通过下面的方法设定流失规则。
[0063]流失规则可以通过充值金额和/或充值天数来进行定义。具体地，流失规则可以定义为在连续的k天内，充值金额小于M，充值天数小于D。其中，k为大于O的正整数，M为大于等于O的实数，D为大于O的正整数。k，M，D的数值都可以通过枚举的方式进行设定，例如，k从O开始，以步长7进行枚举;M从O开始，以步长100进行枚举；D从O开始，以步长I进行枚举。所枚举的k，M，D的值中能够使得误判率和漏判率最小的即为最合适的值。
[0064]但是，要知道所枚举的k，M，D的值的误判率和漏判率，则需要合适的参照来进行确定。一种可行的方法为从同一种游戏玩家类型的游戏玩家的历史数据中筛选出长期不登录和不充值的游戏玩家，定义为完全流失玩家，剩下的为未完全流失玩家，例如，连续90天不登录/不充值的游戏玩家被定义为完全流失玩家，剩下的即为未完全流失玩家。这个筛选的结果可以作为误判率和漏判率的参照。
[0065]收集完全流失玩家从第一天进入游戏至不再登陆游戏的整个生命周期的充值金额和充值天数，并统计其在k天内的充值金额和充值天数。收集未完全流失玩家从第一天进入游戏至统计日的充值金额和充值天数，并同样统计其在k天内的充值金额和充值天数。统计好后，使用流失规则在连续的k天内，充值金额小于M，充值天数小于D对流失玩家和未完全流失玩家进行匹配，从而得到匹配结果。k，M，D的数值以步长进行变化时，流失规则不同，得到的匹配结果也不同。将各个流失规则的匹配结果和作为参照的筛选结果进行对比，从而得到各个流失规则的误判率和漏判率。例如，如果总共有100个游戏玩家数据，参照的筛选结果为完全流失玩家为30个，未完全流失玩家为70个，其中，第一个流失规则与完全流失玩家进行匹配时击中的人数有10个，则可以知道第一个流失规则的漏判率为(完全流失玩家的人数-击中的人数)/完全流失玩家的人数，即为2/3。而通过第一个流失规则与为未完全流失玩家进行匹配时击中的人数为5个，则第一个流失规则的误判率为击中的人数/完全流失玩家的人数，即为1/6。第二个流失规则与完全流失玩家进行匹配时击中的人数有20个，则可以知道第二个流失规则的漏判率为(完全流失玩家的人数-击中的人数)/完全流失玩家的人数，即为1/3。而通过第二个流失规则与为未完全流失玩家进行匹配时击中的人数为6个，则第二个流失规则的误判率为击中的人数/完全流失玩家的人数，即为1/5等等。
[0066]将所有流失规则的误判率和漏判率之和进行对比，并将误判率和漏判率之和最小的流失规则作为这个类型的游戏玩家的最合适的流失规则。以上述为例，第一个流失规则的漏判率为2/3，误判率为1/6，第二个流失规则的漏判率为1/3，误判率为1/5，所以，第二个流失规则比第一个流失规则更适合。
[0067]对于所有的游戏类型的游戏玩家，都可以通过类似上述的方式设定适合自己的流失规则，此处不再一一展开描述。
[0068]第二步:通过人工或机器识别的方法将游戏玩家的数据与流失规则进行匹配。
[0069]在获得各个游戏玩家类型的流失规则之后，将同一游戏玩家类型的游戏玩家的历史数据与同一游戏玩家类型的流失

完整全部详细技术资料下载

当前第3页1 2 3 4 5