一种定位推荐用户的方法及装置的制造方法_3

文档序号:8943088阅读:来源:国知局
]对获得各个指定特征的权重值进行排序;
[0080]根据排序结果确定指定排序范围内的关键指定特征,例如将排序在前十的排序范围内的指定特征作为关键指定特征;
[0081]根据关键指定特征的权重以及测试用户的指定特征数据集确定各个测试用户付费的概率预测数据。
[0082]步骤S105,根据各个测试用户付费的概率预测数据定位推荐用户。
[0083]具体实现时,根据各个测试用户付费的概率预测数据即可按照概率预测数据的大小定位推荐用户,但需要达到在较低的覆盖率的条件下实现高的转换率,为此,假设正确率=预测正确人数/实际购买人数,即预测正确的付费人数与当天实际付费人数之比,效率=预测正确人数/预测购买人数,即预测正确的付费人数与预测出会购买会员的人数,本实施例中根据各个测试用户付费的概率预测数据定位推荐用户可按照下述方式定位,即:
[0084]在定位时间段内按照根据各个测试用户付费的概率预测数据按照推荐正确率确定推荐用户的第一阈值曲线;
[0085]在定位时间段内根据各个测试用户付费的概率预测数据按照推荐效率确定推荐用户的第二阈值曲线;
[0086]根据所述第一阈值曲线和第二阈值曲线确定推荐用户的阈值;
[0087]按照所述确定的推荐用户的阈值定位推荐用户。
[0088]根据上述的实施例,可以实现对更少的人群进行视频的投放,达到提高效率的特点,而进一步还可通过实际投放测试来检验预测效果,通过对每天的数据进行统计,可进一步验证或者进行调整,这里不再赘述。
[0089]请参阅图2,其为根据本发明一种定位推荐用户的装置的具体实施例组成示意图,主要包括:
[0090]采集模块1,本实施例中采集模块I主要用于采集视频系统中用户交易数据和用户视频观看数据,具体实现时,采集视频系统用户交易数据和用户视频观看数据可通过各种方式实现,作为一个具体实施例,参考图3,采集模块可包括:
[0091]第一获取子模块11,用于获取会员交易表日志得到视频系统用户交易数据;
[0092]第二获取子模块12,用于获取用户视频观看日志得到视频系统用户交易数据。
[0093]如前述,所述会员交易表日志和所述用户视频观看日志包括个人计算机和无线端对应的日志,这样获取的数据对于用户观看行为的分析更加准确。
[0094]提取模块2,本实施例中提取模块2主要用于从所述采集的用户交易数据和用户视频观看数据中提取训练用户的指定特征数据集和测试用户的指定特征数据集,具体实现时,本实施例中指定特征可以为下述特征中的一个或多个:
[0095]电影频道、电视剧频道、汽车频道、搞笑频道、动漫频道、综艺频道、时尚频道、亲子频道、游戏频道、原创频道、广告频道、音乐频道、资讯频道、体育频道、生活频道、旅游频道、科技频道、教育频道、娱乐频道、纪录片频道、其它频道、android设备、iphone设备、ipad设备、ipod设备、其它设备、会员、非会员、付费视频、免费视频、完整观看和试看。
[0096]另外,需要说明的,提取主要根据用户ID,按照指定特征分类,进而采集对应各个指定特征的用户行为频次数据,例如,确定用户ID为user 100,即可从用户视频观看日志中收集user 100的各种观看行为的数据,例如观看电影频道的频次,观看电视剧频道的频次等,进而训练用户和测试用户分别组成相应的指定数据集。
[0097]另外,为了实现训练,所述训练用户的指定特征数据集可包括正样本数据和负样本数据,所述正样本数据可为指定时间点付费购买的用户的指定特征数据集,所述负样本数据为指定时间点未付费购买的用户的指定特征数据集,一般负样本数据数量要大于正样本数据数量,例如,所述负样本数据数量为正样本数据数量的三倍或者其他比值,这里不作具体限定,另外,本实施例中对于指定时间点也不做具体的限定,例如,指定时间点可以是当天,所述付费购买的用户例如可以购买会员的用户等,实际中也可以是其他情况,这里仅是举例说明,并不做具体限定。
[0098]训练模块3,本实施例中训练模块3主要用于按照训练算法对训练用户的指定特征数据集中的各个指定特征进行训练以获得各个指定特征的权重值,如前述,本申请中可以采用各种已有的训练算法来进行训练,这里不作限定,仅举例说明,例如,训练算法可采用L2正则逻辑回归训练算法。
[0099]确定模块4,本实施例中确定模块4主要用于根据测试用户的指定特征数据集及训练获得的各个指定特征的权重值确定各个测试用户付费的概率预测数据;具体实现时,作为一个具体实施例,例如参考图4,,确定模块可包括:
[0100]排序子模块41,用于对获得各个指定特征的权重值进行排序;
[0101]关键指定特征确定子模块42,用于根据排序结果确定指定排序范围内的关键指定特征;
[0102]概率预测数据确定子模块43,用于根据关键指定特征的权重以及测试用户的指定特征数据集确定各个测试用户付费的概率预测数据。
[0103]定位模块5,本实施例中定位模块5主要用于根据各个测试用户付费的概率预测数据定位推荐用户,具体实现时,作为一个具体实施例,例如参考图5,定位模块可包括:
[0104]第一阈值曲线确定子模块51,用于在定位时间段内按照根据各个测试用户付费的概率预测数据按照推荐正确率确定推荐用户的第一阈值曲线;
[0105]第二阈值曲线确定子模块52,在定位时间段内根据各个测试用户付费的概率预测数据按照推荐效率确定推荐用户的第二阈值曲线;
[0106]阈值确定子模块53,根据所述第一阈值曲线和第二阈值曲线确定推荐用户的阈值;
[0107]推荐用户定位子模块54,用于按照所述确定的推荐用户的阈值定位推荐用户。
[0108]在上述所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0109]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0110]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。
【主权项】
1.一种定位推荐用户的方法,其特征在于,
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1