一种定位推荐用户的方法及装置的制造方法

文档序号:8943088阅读:208来源:国知局
一种定位推荐用户的方法及装置的制造方法
【技术领域】
[0001]本发明涉及视频技术领域,更具体的说,本发明涉及一种定位推荐用户的方法及
目.0
【背景技术】
[0002]视频(Video)泛指将一系列静态影像以电信号的方式加以捕捉、纪录、处理、储存、传送与重现的各种技术。连续的图像变化每秒超过24帧(frame)画面以上时,根据视觉暂留原理,由于人眼无法辨别单幅的静态画面,因此,连续的画面播放时看上去是平滑连续的视觉效果,而这样连续的画面叫做视频。
[0003]目前视频网站提高收益的重要方式之一就是使促使用户消费,例如向用户推送广告等,但目前的推荐系统普遍存在广撒网,低转换率的特点,如何更加准确的定位到付费倾向更高的用户是业界迫切需要解决的问题。

【发明内容】

[0004]鉴于上述问题,本申请提供了一种定位推荐用户的方法及装置,以更加精准的定位到推荐用户。
[0005]为了解决上述技术问题,本申请采用如下技术方案:
[0006]一种定位推荐用户的方法,其包括:
[0007]采集视频系统中用户交易数据和用户视频观看数据;
[0008]从所述采集的用户交易数据和用户视频观看数据中提取训练用户的指定特征数据集和测试用户的指定特征数据集;
[0009]按照训练算法对训练用户的指定特征数据集中的各个指定特征进行训练以获得各个指定特征的权重值;
[0010]根据测试用户的指定特征数据集及训练获得的各个指定特征的权重值确定各个测试用户付费的概率预测数据;
[0011]根据各个测试用户付费的概率预测数据定位推荐用户。
[0012]其中,采集视频系统用户交易数据和用户视频观看数据包括:
[0013]获取会员交易表的日志得到视频系统用户交易数据;
[0014]获取用户视频观看日志得到视频系统用户交易数据。
[0015]其中,所述会员交易表的日志和所述用户视频观看日志包括个人计算机和无线端对应的日志。
[0016]其中,根据测试用户的指定特征数据集及训练获得的各个指定特征的权重值确定各个测试用户付费的概率预测数据包括:
[0017]对获得各个指定特征的权重值进行排序;
[0018]根据排序结果确定指定排序范围内的关键指定特征;
[0019]根据关键指定特征的权重以及测试用户的指定特征数据集确定各个测试用户付费的概率预测数据。
[0020]其中,根据各个测试用户付费的概率预测数据定位推荐用户包括:
[0021]在定位时间段内按照根据各个测试用户付费的概率预测数据按照推荐正确率确定推荐用户的第一阈值曲线;
[0022]在定位时间段内根据各个测试用户付费的概率预测数据按照推荐效率确定推荐用户的第二阈值曲线;
[0023]根据所述第一阈值曲线和第二阈值曲线确定推荐用户的阈值;
[0024]按照所述确定的推荐用户的阈值定位推荐用户。
[0025]其中,所述训练用户的指定特征数据集包括正样本数据和负样本数据,所述正样本数据为指定时间点付费购买的用户的指定特征数据集,所述负样本数据为指定时间点未付费购买的用户的指定特征数据集。
[0026]其中,所述指定时间点为正样本和负样本采集当日。
[0027]其中,所述负样本数据数量为正样本数据数量的三倍。
[0028]其中,所述付费购买的用户为购买会员的用户。
[0029]其中,所述训练算法为L2正则逻辑回归训练算法。
[0030]其中,指定特征为下述特征中的一个或多个:
[0031]电影频道、电视剧频道、汽车频道、搞笑频道、动漫频道、综艺频道、时尚频道、亲子频道、游戏频道、原创频道、广告频道、音乐频道、资讯频道、体育频道、生活频道、旅游频道、科技频道、教育频道、娱乐频道、纪录片频道、其它频道、android设备、iphone设备、ipad设备、ipod设备、其它设备、会员、非会员、付费视频、免费视频、完整观看和试看。
[0032]本申请还提供一种定位推荐用户的装置,其包括:
[0033]采集模块,用于采集视频系统中用户交易数据和用户视频观看数据;
[0034]提取模块,用于从所述采集的用户交易数据和用户视频观看数据中提取训练用户的指定特征数据集和测试用户的指定特征数据集;
[0035]训练模块,用于按照训练算法对训练用户的指定特征数据集中的各个指定特征进行训练以获得各个指定特征的权重值;
[0036]确定模块,用于根据测试用户的指定特征数据集及训练获得的各个指定特征的权重值确定各个测试用户付费的概率预测数据;
[0037]定位模块,用于根据各个测试用户付费的概率预测数据定位推荐用户。
[0038]其中,采集模块包括:
[0039]第一获取子模块,用于获取会员交易表日志得到视频系统用户交易数据;
[0040]第二获取子模块,用于获取用户视频观看日志得到视频系统用户交易数据。
[0041 ] 其中,所述会员交易表日志和所述用户视频观看日志包括个人计算机和无线端对应的日志。
[0042]其中,确定模块包括:
[0043]排序子模块,用于对获得各个指定特征的权重值进行排序;
[0044]关键指定特征确定子模块,用于根据排序结果确定指定排序范围内的关键指定特征;
[0045]概率预测数据确定子模块,用于根据关键指定特征的权重以及测试用户的指定特征数据集确定各个测试用户付费的概率预测数据。
[0046]其中,定位模块包括:
[0047]第一阈值曲线确定子模块,用于在定位时间段内按照根据各个测试用户付费的概率预测数据按照推荐正确率确定推荐用户的第一阈值曲线;
[0048]第二阈值曲线确定子模块,在定位时间段内根据各个测试用户付费的概率预测数据按照推荐效率确定推荐用户的第二阈值曲线;
[0049]阈值确定子模块,根据所述第一阈值曲线和第二阈值曲线确定推荐用户的阈值;
[0050]推荐用户定位子模块,用于按照所述确定的推荐用户的阈值定位推荐用户。
[0051]其中,所述训练用户的指定特征数据集包括正样本数据和负样本数据,所述正样本数据为指定时间点付费购买的用户的指定特征数据集,所述负样本数据为指定时间点未付费购买的用户的指定特征数据集。
[0052]其中,所述指定时间点为正样本和负样本采集当日。
[0053]其中,所述负样本数据数量为正样本数据数量的三倍。
[0054]其中,所述付费购买的用户为购买会员的用户。
[0055]其中,所述训练算法为L2正则逻辑回归训练算法。
[0056]其中,指定特征为下述特征中的
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1