1.一种用户流失的预测方法,其特征在于,所述方法包括:
利用历史的用户数据构建数据库,所述用户数据包括用户收视行为数据、客服业务域数据和业务运营支撑系统BOSS提供的业务域数据,所述业务运营支撑系统BOSS提供的业务域数据包括用户的自身属性数据,所述客服业务域数据包括用户的投诉数据,所述用户收视行为数据包括用户对频道的偏爱情况数据;
对所述历史的用户数据进行统计处理,得到处理后的用户数据;
对所述处理后的用户数据进行机器学习,得到用户流失特征模型;
利用所述用户流失特征模型对现有用户数据进行预测,得到现有用户中即将流失的用户以及现有用户即将流失的概率。
2.根据权利要求1所述的预测方法,其特征在于,所述利用历史的用户数据构建数据库,具体包括:
对历史的用户数据进行清洗、转化;
利用分布式文件系统HDFS、Spark汇编语言对所述清洗、转化后的所述用户数据进行处理和储存。
3.根据权利要求1所述的预测方法,其特征在于,所述对所述处理后的用户数据进行机器学习,具体包括:
利用R语言和spark mlib汇编语言对所述处理后的用户数据进行机器学习。
4.根据权利要求1所述的预测方法,其特征在于,所述对所述历史的用户数据进行统计处理,具体包括:
根据所述用户行为数据构建用户节目偏好矩阵;
根据所述业务运营支撑系统BOSS提供的业务域数据、客服业务域数据构建用户基本信息矩阵;
统计历史用户中的到期续费用户和流失用户,建立流失用户矩阵和保有用户矩阵;
所述用户节目偏好矩阵、用户基本信息矩阵、流失用户矩阵和保有用户矩阵为处理后的用户数据。
5.根据权利要求3所述的方法,其特征在于,所述对所述处理后的用户数据进行机器学习,具体包括:
将所述处理后的用户数据作为所述机器学习的输入,所述机器学习采用决策树算法,得到所述流失用户的特征模型和保有用户的特征模型。
6.一种用户流失的预测系统,其特征在于,
数据库构建模块,用于利用历史的用户数据构建数据库,所述用户数据包括用户收视行为数据、客服业务域数据和业务运营支撑系统BOSS提供的业务域数据,所述业务运营支撑系统BOSS提供的业务域数据包括用户的自身属性数据,所述客服业务域数据包括用户的投诉数据,所述用户收视行为数据包括用户对频道的偏爱情况数据;
统计处理模块,用于对所述历史的用户数据进行统计处理,得到处理后的用户数据;
机器学习模块,用于对所述处理后的用户数据进行机器学习,得到用户流失特征模型;
预测模块,用于利用所述用户流失特征模型对现有用户数据进行预测,得到现有用户中即将流失的用户以及现有用户即将流失的概率。
7.根据权利要求6所述的预测系统,其特征在于,所述数据库构建模块,具体包括:
清洗转化单元,用于对历史的用户数据进行清洗、转化;
处理存储单元,用于利用分布式文件系统HDFS、Spark汇编语言对所述清洗、转化后的所述用户数据进行处理和储存。
8.根据权利要求6所述的预测系统,其特征在于,所述机器学习模块,具体包括:
机器学习单元,用于利用R语言和spark mlib汇编语言对所述处理后的用户数据进行机器学习。
9.根据权利要求6所述的预测系统,其特征在于,所述统计处理模块,具体包括:
节目偏好矩阵构建单元,用于根据所述用户行为数据构建用户节目偏好矩阵;
基本信息矩阵构建单元,用于根据所述业务运营支撑系统BOSS提供的业务域数据、客服业务域数据构建用户基本信息矩阵;
用户矩阵统计单元,用于统计历史用户中的到期续费用户和流失用户,建立流失用户矩阵和保有用户矩阵;
所述用户节目偏好矩阵、用户基本信息矩阵、流失用户矩阵和保有用户矩阵为处理后的用户数据。
10.根据权利要求8所述的系统,其特征在于,所述机器学习单元,具体包括:
机器学习子单元,用于将所述处理后的用户数据作为所述机器学习的输入,所述机器学习采用决策树算法,得到所述流失用户的特征模型和保有用户的特征模型。