一种n+广告投放优化方法

文档序号:8457703阅读:348来源:国知局
一种n+广告投放优化方法
【技术领域】
[0001] 本发明涉及一种N+广告投放优化方法。
【背景技术】
[0002] 在广告商进行广告投放的活动中,有一类N+广告投放需求,即广告主要求投放的 目标客户在一段时间内(例如为一周)能够有效地接触该广告至少是N次(通常为3次, 由广告主根据自己的需求确定),如果在规定时间内某已经投放了该广告的目标客户达不 到该次数要求,则视为一次无效的广告投放,如果达到该次数要求则视为一次有效的投放。 除了对接触广告次数有要求外,对是否满足这样的目标客户的量也有一定要求。
[0003] 因此,对媒体广告平台而言,针对该类N+广告投放需求,如何确保对目标客户投 放出去的广告的正确率和召回率成为关键问题,高正确率就能确保资源少浪费,高召回率 则是量的保证,确保收益,在量并不充足的情况下应优先保证高召回率。

【发明内容】

[0004] 为解决现有技术中存在的上述技术问题,本发明提供一种N+广告投放优化方法, 该方法将对目标客户浏览视频的标记值(即cookie)在未来一段时间(例如一周)内出现 N次的概率做一个预测并得到预测值,设定一个概率阈值threhold,该预测值大于等于该 阈值才对该cookie进行广告投放,小于则不投放。业内对该广告投放也称作播种,不投放 则称作不播种。该方法能有效降低资源浪费,并能保证收益。
[0005] 本发明的N+广告投放优化方法的基本原理是:在线下,首先对目标客户浏览视频 的标记值(即cookie)的特征数据进行选择,选择对用户是否再回来具有表征作用而且线 上能够轻易获取的特征数据,然后使用CART分类树来建立cookie是否再回来预测模型,通 过该模型预测某cookie用户一周内是否还会再回来的概率;线上运行时,设定N值,设定概 率阈值,通过线上获得该cookie的相应特征数据预测其再回来的概率,计算该概率的N次 方结果,该结果大于等于设定概率阈值时投放广告,否则不投放。
【附图说明】
[0006] 本发明将参照附图来进一步详细说明,其中:
[0007] 图1是本发明方法流程图;
[0008] 图2是本发明方法线上、线下实现的示意图。
【具体实施方式】
[0009] 虽然将参照含有本发明的较佳实施例的附图充分描述本发明,但在此描述之前应 了解本领域的普通技术人员可修改本文中所描述的发明,同时获得本发明的技术效果。因 此,须了解以上的描述对本领域的普通技术人员而言为一广泛的揭示,且其内容不在于限 制本发明所描述的示例性实施例。
[0010] 本发明的N+广告投放优化方法中使用CART(ClassificationandRegression Trees)分类树建立预测模型。首先,对本发明使用的CART分类树等背景做一个介绍。CART 是决策树的一种,CART算法既可以用于创建分类树(ClassificationTree),也可以用于创 建回归树(RegressionTree),分类树是预测结果是离散类型值的树,回归树是预测结果为 连续型值的树。决策树算法都属于有监督一类的机器学习算法,所以模型的建立需要经过 有标签数据的训练过程,模型树建立过程中,难免会出现数据过度拟合的情况,因此树剪枝 操作往往是必须的,剪枝包括预剪枝和后剪枝,预剪枝是在建树过程中进行的,后剪枝是建 树完成后进行的。CART分类树的分支节点存储分割特征序号splnd和分割值spVal,叶子 节点存储组合值包括:是否再来label,再来概率posProb,不来概率negProb,再来概率大 于不来概率时,是否再来label为1,否则为0。再来概率由落在该叶子节点的分类标签值 为1的数量除以该叶子中所有训练数据条数得出。
[0011] 训练、剪枝和测试数据集由cookie对应的特征属性和表示是否再来的0、1标签值 组成。
[0012] CART预剪枝:CART分类树在建立过程中会进行预剪枝,分为以下三种情况:
[0013] 如果在某个分支的所有数据中,某一类(标签为0或1)的数据所在比率大于等于 某个阈值ratio_threshold时停止分支,作为叶子。该阈值作为参数传入,默认为0. 85 ; [0014] 如果在某个分支的所有数据条目数小于等于某个阈值num_threshold时停止分 支,作为叶子。该阈值作为参数传入,默认为50 ;
[0015] 如果在某个分支属性分割后的基尼不纯度Gini相较于分割前的基尼不纯度并未 降低到一定阈值gini_threshold时,停止分支,作为叶子。该阈值作为参数传入,默认为 0. 01〇
[0016] CART后剪枝:CART后剪枝是建立好模型分类树后在新的剪枝数据集上进行的,在 以下两种情况中会进行后剪枝:
[0017] 如果某分支的左(或右)子树不是叶子,而没有数据分到该左(或右)子树,那么 剪枝,该左(或右)子树变为叶子。叶子存储的值由兄弟分支的相关计算结果得出,把兄弟 分支暂当作叶子计算其label,如果兄弟分支的label为1,则该叶子存储的值为[0,0. 001, 0.999],反之,存储[1,0.999,0.001];
[0018] 如果某分支的左右子树都是叶子,而计算出该分支在不分裂时的错误率要小于分 裂后的错误率,那么剪枝,该分支变为叶子。计算所有落在该分支的数据中label为1的记 录所占比,得出相应的值作为该叶子的存储值。
[0019] 下面,以一周为例说明本发明的N+广告投放优化方法,并不以此限定。
[0020] 本发明的N+广告投放优化方法包括:
[0021] 第一步,抽取目标客户浏览视频的标记值(即cookie)特征数据,生成CART分类 树的训练、剪枝、测试数据。
[0022] 视频平台数据系统中通常有两个日志表,access表和vvlog表,分别用来记录视 频广告的播放日志和vv日志,这两个日志表里有大量有关视频、广告、用户的相关属性信 息,从这些属性里选择一部分属性信息来作为CART分类树的训练,剪枝和测试数据。选择 的属性信息必须在线上也能轻易并快速的获取,以便做预测。
[0023] 生成CART分类树的训练、剪枝、测试数据的步骤如下:
[0024] 步骤1. 1,以2014. 08. 04的数据为例,从access日志表中抽取2014. 08. 04这 一天的cookie数据,记为:accessCookieAttrs_804,该数据集包含以下属性:cookieO sessionld,视频分类,是否为长视频,视频时长,时间戳,使用cookieOsessionld而不使用 cookie是为了与vvlog中的数据--映射。
[0025] 步骤1. 2,从vvlog日志表中抽取2014. 08. 04这一天的cookie数据,记为: vvCookieAttrs_804,该数据集包含以下属性:cookieOsessionld,是否注册,vvstep史来 vv,seidcount史来session计数,sevvstep本次session计数。
[0026] 步骤1.3,统计access日志表中时间跨度为一周(即2014. 08. 05-2014. 08. 11)的 cookie出现次数,记为:cookieNum_805_811,该数据集包含以下属性:cookie,cookie出现 次数。
[0027] 步骤1. 4,整合连接上述三个步骤得到的三个数据集:accessCookieAttrs_804, vvCookieAttrs_804,cookieNum_805_811 (cookieNum_805_806),生成是否再来类属标签, 得到新的数据集,记为:train0ri
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1