1.一种基于app的用户属性预测方法,其特征在于,包括:
收集包含用户app安装列表以及用户属性的用户日志,并过滤异常日志;
对用户app安装列表中基于不同用户属性的各app安装频次进行统计,计算基于不同用户属性的app安装频次的差值,获取差值超过预设阈值的app并作为分类app,依据所述分类app构建稀疏矩阵,得到特征数据;
利用所述特征数据对分类模型进行训练,得到训练好的分类模型;
获取目标用户的app安装列表,从中筛选出分类app,并将所述分类app送入所述分类模型进行预测,得到目标用户的属性。
2.根据权利要求1所述的基于app的用户属性预测方法,其特征在于,所述属性为性别、年龄或爱好。
3.根据权利要求1所述的基于app的用户属性预测方法,其特征在于,所述对用户app安装列表中基于不同用户属性的各app安装频率进行统计,计算基于不同用户属性的app安装频率的差值,获取差值超过预设阈值的app并作为分类app,包括:
对所有用户的app安装列表中的app进行分类统计,获取基于每一用户属性的各app安装频次;
计算基于不同用户属性的各app安装频次的差值;
获取所述差值超过预设阈值的app并作为分类app。
4.根据权利要求3所述的基于app的用户属性预测方法,其特征在于,所述获取所述差值超过预设阈值的app并作为分类app,包括:
将基于不同用户属性的各app安装频次的差值进行归一化,得到相差比例;
将所述相差比例超过预设阈值的app作为分类app。
5.根据权利要求4所述的基于app的用户属性预测方法,其特征在于,所述依据所述分类app构建稀疏矩阵,得到特征数据,包括:
根据分类app对应的相差比例计算分类app的权重,其中相差比例越高,权重越大,相差比例越低,权重越小;
依据所述分类app的权重构建稀疏矩阵,得到特征数据。
6.根据权利要求1所述的基于app的用户属性预测方法,其特征在于,所述利用所述特征数据对分类模型进行训练,得到训练好的分类模型,包括:
将所述特征数据进行划分,得到训练样本集和测试样本集;
利用所述训练样本集对分类模型进行训练,得到训练好的分类模型;
利用所述测试样本集对训练好的分类模型进行测试。
7.根据权利要求1所述的基于app的用户属性预测方法,其特征在于,所述收集包含用户app安装列表以及用户属性的用户日志,并过滤异常日志,包括:
收集包含用户app安装列表以及用户属性的用户日志;
按区域对所述用户日志进行划分,得到不同区域的用户日志;
对不同区域的用户日志进行过滤。
8.一种基于app的用户属性预测装置,其特征在于,包括:
收集单元,用于收集包含用户app安装列表以及用户属性的用户日志,并过滤异常日志;
特征提取单元,用于对用户app安装列表中基于不同用户属性的各app安装频次进行统计,计算基于不同用户属性的app安装频次的差值,获取差值超过预设阈值的app并作为分类app,依据所述分类app构建稀疏矩阵,得到特征数据;
模型训练单元,用于利用所述特征数据对分类模型进行训练,得到训练好的分类模型;
用户属性预测单元,用于获取目标用户的app安装列表,从中筛选出分类app,并将所述分类app送入所述分类模型进行预测,得到目标用户的属性。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于app的用户属性预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的基于app的用户属性预测方法。