一种定位推荐用户的方法及装置的制造方法_4

文档序号:8943088阅读:来源:国知局
包括: 采集视频系统中用户交易数据和用户视频观看数据; 从所述采集的用户交易数据和用户视频观看数据中提取训练用户的指定特征数据集和测试用户的指定特征数据集; 按照训练算法对训练用户的指定特征数据集中的各个指定特征进行训练以获得各个指定特征的权重值; 根据测试用户的指定特征数据集及训练获得的各个指定特征的权重值确定各个测试用户付费的概率预测数据; 根据各个测试用户付费的概率预测数据定位推荐用户。2.根据权利要求1所述的方法,其特征在于,采集视频系统用户交易数据和用户视频观看数据包括: 获取会员交易表的日志得到视频系统用户交易数据; 获取用户视频观看日志得到视频系统用户交易数据。3.根据权利要求2所述的方法,其特征在于,所述会员交易表的日志和所述用户视频观看日志包括个人计算机和无线端对应的日志。4.根据权利要求1所述的方法,其特征在于,根据测试用户的指定特征数据集及训练获得的各个指定特征的权重值确定各个测试用户付费的概率预测数据包括: 对获得各个指定特征的权重值进行排序; 根据排序结果确定指定排序范围内的关键指定特征; 根据关键指定特征的权重以及测试用户的指定特征数据集确定各个测试用户付费的概率预测数据。5.根据权利要求1所述的方法,其特征在于,根据各个测试用户付费的概率预测数据定位推荐用户包括: 在定位时间段内按照根据各个测试用户付费的概率预测数据按照推荐正确率确定推荐用户的第一阈值曲线; 在定位时间段内根据各个测试用户付费的概率预测数据按照推荐效率确定推荐用户的第二阈值曲线; 根据所述第一阈值曲线和第二阈值曲线确定推荐用户的阈值; 按照所述确定的推荐用户的阈值定位推荐用户。6.根据权利要求1所述的方法,其特征在于,所述训练用户的指定特征数据集包括正样本数据和负样本数据,所述正样本数据为指定时间点付费购买的用户的指定特征数据集,所述负样本数据为指定时间点未付费购买的用户的指定特征数据集。7.根据权利要求6所述的方法,其特征在于,所述指定时间点为正样本和负样本采集当曰。8.根据权利要求6所述的方法,其特征在于,所述负样本数据数量为正样本数据数量的三倍。9.根据权利要求6所述的方法,其特征在于,所述付费购买的用户为购买会员的用户。10.根据权利要求1-10任一项所述的方法,其特征在于,所述训练算法为L2正则逻辑回归训练算法。11.根据权利要求1-10任一项所述的方法,其特征在于,指定特征为下述特征中的一个或多个: 电影频道、电视剧频道、汽车频道、搞笑频道、动漫频道、综艺频道、时尚频道、亲子频道、游戏频道、原创频道、广告频道、音乐频道、资讯频道、体育频道、生活频道、旅游频道、科技频道、教育频道、娱乐频道、纪录片频道、其它频道、android设备、iphone设备、ipad设备、ipod设备、其它设备、会员、非会员、付费视频、免费视频、完整观看和试看。12.一种定位推荐用户的装置,其特征在于,包括: 采集模块,用于采集视频系统中用户交易数据和用户视频观看数据; 提取模块,用于从所述采集的用户交易数据和用户视频观看数据中提取训练用户的指定特征数据集和测试用户的指定特征数据集; 训练模块,用于按照训练算法对训练用户的指定特征数据集中的各个指定特征进行训练以获得各个指定特征的权重值; 确定模块,用于根据测试用户的指定特征数据集及训练获得的各个指定特征的权重值确定各个测试用户付费的概率预测数据; 定位模块,用于根据各个测试用户付费的概率预测数据定位推荐用户。13.根据权利要求12所述的装置,其特征在于,采集模块包括: 第一获取子模块,用于获取会员交易表日志得到视频系统用户交易数据; 第二获取子模块,用于获取用户视频观看日志得到视频系统用户交易数据。14.根据权利要求13所述的装置,其特征在于,所述会员交易表日志和所述用户视频观看日志包括个人计算机和无线端对应的日志。15.根据权利要求12所述的装置,其特征在于,确定模块包括: 排序子模块,用于对获得各个指定特征的权重值进行排序; 关键指定特征确定子模块,用于根据排序结果确定指定排序范围内的关键指定特征;概率预测数据确定子模块,用于根据关键指定特征的权重以及测试用户的指定特征数据集确定各个测试用户付费的概率预测数据。16.根据权利要求12所述的装置,其特征在于,定位模块包括: 第一阈值曲线确定子模块,用于在定位时间段内按照根据各个测试用户付费的概率预测数据按照推荐正确率确定推荐用户的第一阈值曲线; 第二阈值曲线确定子模块,在定位时间段内根据各个测试用户付费的概率预测数据按照推荐效率确定推荐用户的第二阈值曲线; 阈值确定子模块,根据所述第一阈值曲线和第二阈值曲线确定推荐用户的阈值; 推荐用户定位子模块,用于按照所述确定的推荐用户的阈值定位推荐用户。17.根据权利要求12所述的装置,其特征在于,所述训练用户的指定特征数据集包括正样本数据和负样本数据,所述正样本数据为指定时间点付费购买的用户的指定特征数据集,所述负样本数据为指定时间点未付费购买的用户的指定特征数据集。18.根据权利要求17所述的装置,其特征在于,所述指定时间点为正样本和负样本采集当日。19.根据权利要求17所述的装置,其特征在于,所述负样本数据数量为正样本数据数量的三倍。20.根据权利要求17所述的装置,其特征在于,所述付费购买的用户为购买会员的用户。21.根据权利要求12-20任一项所述的装置,其特征在于,所述训练算法为L2正则逻辑回归训练算法。22.根据权利要求12-20任一项所述的装置,其特征在于,指定特征为下述特征中的一个或多个: 电影频道、电视剧频道、汽车频道、搞笑频道、动漫频道、综艺频道、时尚频道、亲子频道、游戏频道、原创频道、广告频道、音乐频道、资讯频道、体育频道、生活频道、旅游频道、科技频道、教育频道、娱乐频道、纪录片频道、其它频道、android设备、iphone设备、ipad设备、ipod设备、其它设备、会员、非会员、付费视频、免费视频、完整观看和试看。
【专利摘要】本发明公开了一种定位推荐用户的方法及装置,其通过采集视频系统中用户交易数据和用户视频观看数据;从所述采集的用户交易数据和用户视频观看数据中提取训练用户的指定特征数据集和测试用户的指定特征数据集;按照训练算法对训练用户的指定特征数据集中的各个指定特征进行训练以获得各个指定特征的权重值;根据测试用户的指定特征数据集及训练获得的各个指定特征的权重值确定各个测试用户付费的概率预测数据;根据各个测试用户付费的概率预测数据定位推荐用户,本发明可以从测试集用户中更加准确的挑选出具有付费倾向的用户,即可更加精准的定位到推荐用户。
【IPC分类】G06F17/30
【公开号】CN105160008
【申请号】CN201510604634
【发明人】李添, 王晓龙, 姚键, 潘柏宇, 王冀
【申请人】合一网络技术(北京)有限公司
【公开日】2015年12月16日
【申请日】2015年9月21日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1