在线竞价概率模型生成方法与流程

文档序号：12551691阅读：478来源：国知局

本发明属于互联网技术领域，具体涉及一种在线竞价概率模型生成方法。

背景技术：

实时竞价(RealTime Bidding，简称RTB)，是一种利用第三方技术在数以百万计的网站上针对每一个用户展示行为进行评估以及出价的竞价技术。与大量购买投放频次不同，实时竞价规避了无效的受众到达，只针对有意义的用户进行购买。它的核心是DSP平台(需求方平台)，RTB对于媒体来说，可以带来更多的广告销量、实现销售过程自动化及减低各项费用的支出。而对于广告商和代理公司来说，最直接的好处就是提高了效果与投资回报率。RTB的出现就是互联网广告从广告位时代进入人群实时竞价时代。

在线竞价的行为是一个极其复杂的问题，目前在业界和学术界尚无有效的模型。虽然在现实的实时竞价系统中，每天都有大量的数据积累，但是如何从中提炼有效的信息用于产生符合实际的模型是一个困难的问题。而在线竞价的模型对于控制广告主成本优化，并最大化广告主广告投放的效果，比如在固定预算下最大化展现、点击、到达以及转化，或者是最大化投放覆盖的人群量等不同的衡量效果都有重要的意义。

技术实现要素：

本发明是为了解决上述问题而进行的，目的在于提供一种能够产生KPI和获胜价格之间的关系，能够产生KPI的概率分布的在线竞价概率模型生成方法。

本发明提供了一种在线竞价概率模型生成方法，其特征在于，包括以下步骤：步骤1，输入竞价成功的请求记录作为样本；

步骤2，将每条所述请求记录基于预定规则得到预测的KPI，将所述样本根据所述预测的KPI分为若干个区间，统计每个区间的统计的KPI的均值、KPI的方差、获胜价格的均值和获胜价格的方差，并统计每个区间的KPI的分布和获胜价格的分布；

步骤3，采用混合beta分布拟合每个区间的样本数据得到模型分布，并得到每个区间的计算的KPI的均值和KPI的方差；

步骤4，拟合每个区间的KPI和获胜价格得到模型函数；

步骤5，将每个区间根据所述模型分布重新生成一组满足模型分布的新样本，并统计新样本的KPI的均值和方差，将新样本根据模型函数得到的获胜价格，并统计得到获胜价格的均值和方差；

步骤6，判断步骤5中新样本的KPI的均值和方差、获胜价格的均值和方差是否逼近步骤2中统计的KPI的均值、KPI的方差、获胜价格的均值和获胜价格的方差，如果逼近，则进入下一步骤，若否，则返回步骤3，并改变所述混合beta分布中beta分布的数量；

步骤7，判断步骤5中新样本的KPI的分布和获胜价格的分布是否逼近步骤2中样本中KPI的分布和获胜价格的分布，如果逼近，则模型构建完成，否则，返回步骤2，并改变样本的区间的数量。

进一步，在本发明提供的在线竞价概率模型生成方法中，还可以具有这样的特征：其中，请求记录包含自然属性、媒体属性、用户之前的点击行为、出价、成交价、点击和转化。。

进一步，在本发明提供的在线竞价概率模型生成方法中，还可以具有这样的特征：其中，KPI包含：点击成本、点击量、转化成本、转化量、CTR、CVR。

进一步，在本发明提供的在线竞价概率模型生成方法中，还可以具有这样的特征：其中，步骤2中，还需统计每个区间的样本数量，如果单个区间的样本的数量小于门限值，则需要将该区间与其它区间进行合并，并更新合并后的区间的统计的KPI的均值、KPI的方差、获胜价格的均值和获胜价格的方差,并更新合并后每个区间的KPI的分布和获胜价格的分布。

本发明的优点如下：

根据本发明所涉及的在线竞价概率模型生成方法，将历史上获胜的请求记录，根据预测的KPI分为若干个区间，对每个区间采用混合beta分布进行拟合，拟合每个区间KPI和获胜价格的函数，对模型进行校正，最终得到概率模型，通过该概率模型能够对在线竞价进行仿真和模拟，便于发现可分析问题，探索最佳业务配置，分析和模拟竞争对手的出价策略。

附图说明

图1是本发明中在线竞价概率模型生成方法的流程图；

图2是本发明中样本中的KPI分布和样本数据根据模

型分布函数生成的KPI分布对比图；

图3是本发明中样本中的获胜价格的分布和样本数据根据模型函数生成的获胜价格的分布的对比图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，以下实施例结合附图对本发明在线竞价概率模型生成方法作具体阐述。

在描述之前，对本专利涉及的专业术语进行说明：

KPI：关键绩效指标；

CTR：点击率；

CVR：点击转化率；

pdf：概率密度。

在线竞价概率模型生成方法能够生成竞价概率模型，该竞价概率模型包含KPI和获胜价格之间的关系，KPI的概率分布。

如图1所示，在本实施例中，在线竞价概率模型生成方法包含以下步骤：

步骤S1，输入竞价成功的请求记录作为样本。

一条请求记录为一个样本数据。样本中包含大量的数据。请求记录包含自然属性、媒体属性、用户之前的点击行为、出价、成交价、点击和转化。自然属性包含一次竞价(pv)的时间，媒体属性包含网页地址(url)，用户之前的点击行为为一周内用户点击过某广告多少次。

步骤S2，将每条请求记录基于预定规则得到预测的KPI，根据预测的KPI将所有的请求记录分为若干个区间，统计每个区间的统计的KPI的均值、KPI的方差、获胜价格的均值和获胜价格的方差，并统计每个区间的KPI的分布和获胜价格的分布。

KPI包含：点击成本、点击量、转化成本、转化量、CTR、或CVR。

在本实施例中，KPI以CTR为例，预测的CTR采用现有的LR(Logistic Regression)，FM(Factorization Machines)，GBDT等算法进行计算。

相同的预测的CTR下包含多个样本数据。将样本根据预测的CTR分为若干个区间，每个区间为一个数值范围的预测的CTR，统计每个区间的实际的KPI的均值、KPI的方差、获胜价格的均值和获胜价格的方差，并统计每个区间的样本数据的数量。并统计每个区间的KPI的分布和获胜价格的分布。

如果某个区间的样本数据的数量小于门限值，则将该区间与其它区间合并，然后重新统计合并后的区间的实际的KPI的均值、KPI的方差、获胜价格的均值和获胜价格的方差。并统计并后的区间的KPI的分布和获胜价格的分布。

步骤S3，采用混合beta分布拟合每个区间的样本数据得到模型分布，如图2，并得到每个区间的计算的KPI的均值和KPI的方差。

将每个区间用几个beta分布进行拟合，并根据拟合得到的混合beta分布函数计算得到每个区间的KPI的均值和KPI的方差。

步骤S4，拟合每个区间的KPI和获胜价格得到模型函数，如图3。

步骤S5，将每个区间根据步骤S3中得到的模型分布中重新生成一组满足该模型分布的新样本，并统计该新样本的KPI的均值和方差，将该新样本根据步骤S4中得到的模型函数得到的一组与该新样本相对应的获胜价格，并统计得到获胜价格的均值和方差。

步骤S6，判断步骤S5中新样本的KPI的均值和方差、获胜价格的均值和方差是否逼近步骤S2中统计的KPI的均值、KPI的方差、获胜价格的均值和获胜价格的方差，如果逼近，则进入下一步骤，若否，则返回步骤S3，并改变混合beta分布中beta分布的数量。

步骤S7，判断步骤S5中新样本的KPI的分布和获胜价格的分布是否逼近所述样本中KPI的分布和获胜价格的分布，如果逼近，则模型构建完成，否则，返回步骤S2，并改变样本的区间的数量。

图2中，横坐标代表CTR的值，纵坐标代表CTR的概率密度(pdf)，虚线表示样本中的CTR的概率分布，实线表示样本数据根据模型分布函数得到的CTR的概率分布。图3中，横坐标代表CTR的值，纵坐标代表获胜价格，连线带“。”符号的表示样本中的获胜价格分布，连线带“*”符号的表示样本数据根据模型函数得到的获胜价格分布。从图2中可以看出，两条曲线吻合度比较好，说明混合beta分布拟合的效果比较好。图3中，虽然预测的CTR在0.05-0.1之间模型函数计算的获胜价格与样本中的真实价格有点偏差，但是数据整体的趋势与样本数据相同。

采用该在线竞价概率模型，能够对仿真和模拟在线竞价过程，方便发现和分析问题。比如：某些ctr比较高，但是却不能竞价成功，那就可以调整出价策略，从而避免无谓的去获取一些高成本流量。需要调整出价策略时，可以先采用本在线竞价概率模型进行模拟，模拟结果符合预期后，再线上具体进行实施操作，在模拟期间，线上业务并不受影响。

在线竞价之前，采用本在线竞价概率模型进行反复实验，从而探索出最佳业务配置。并且可以根据本在线竞价概率模型分析和模拟竞争对手的出价策略，从而更好的制定自己的策略。

上述实施方式为本发明的优选案例，并不用来限制本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汤奇峰;潘颖吉;周强;
技术所有人：晶赞广告（上海）有限公司;
我是此专利的发明人

上一篇：一种防公路边坡滑坡装置的制作方法
上一篇：一种市政边坡防护系统的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。