一种确定资源参数的方法和设备与流程

文档序号:13332810阅读:223来源:国知局
一种确定资源参数的方法和设备与流程

本申请涉及互联网技术领域,特别涉及一种确定资源参数的方法和设备。



背景技术:

rtb(realtimebidding,实时竞价),是一种利用第三方技术在数以百万的网站上针对每一个用户展示行为进行评估以及出价的竞价技术。与大量购买投放频次不同,实时竞价规避了无效的受众到达,针对有意义的用户进行购买。它的核心是dsp(demand-sideplatform,需求方平台)。rtb对于媒体来说,可以带来更多的广告销量、实现销售过程自动化及减低各项费用的支出。而对于广告商和代理公司来说,最直接的好处就是提高了效果与投资回报率。

目前的互联网广告生态链包括广告主、dsp、广告交易平台以及互联网媒体四个主体。广告主将自己的广告需求放到dsp平台上,互联网媒体将自己的广告流量资源放到adexchange(广告交易平台),dsp通过与广告交易平台的技术对接完成竞价购买。当用户访问一个网站时,ssp(sell-sideplatform,供应方平台)向adexchange发送用户访问讯号,随后广告位的具体信息则会经过dmp(data-managementplatform,数据管理平台)的分析匹配后发送给dsp,dsp将对此进行竞价,价高者会获得这个广告展现机会,并被目标用户看到。

目前,广告交易平台根据流量特征会划分出多个通道,并对每个通道进行资源参数,通道之间相互独立。但是这种针对每个通道单独进行资源参数的方式,会出现虽然每个通道都进行资源参数,但是通道的调整指标无法达到最优。



技术实现要素:

本申请提供一种确定资源参数的方法和设备,用以解决现有技术中存在的针对每个通道单独进行资源参数的方式无法使通道的调整指标达到最优的问题。

本申请实施例提供一种确定通道资源参数的方法,该方法包括:

对通道的资源参数进行多轮调整,其中一轮调整至少一个通道的资源参数;

针对任意一轮调整,根据调整后的通道的资源参数,通过预估模型确定该轮调整对应的调整指标,其中所述预估模型是根据多个通道的评估参数对应的离线数据和多个通道的评估参数对应的实时数据确定的;

根据多轮调整对应的调整指标,从多轮调整中选择一轮调整对应的通道的资源参数作为最终的资源参数。

本申请实施例根据所有通道的每个资源参数参数的离线数据和实时数据,确定的预估模型;通过所述预估模型,根据调整后的所有通道的每个资源参数确定该轮调整对应的调整指标,根据多轮调整对应的调整指标,从多轮调整中选择一轮调整对应的通道的资源参数作为最终的资源参数。由于本申请实施例在确定资源参数时考虑到所有通道,相比针对每个通道的方式,能够使通道的调整指标达到最优。

可选的,所述根据下列方式确定所述预估模型:

根据通道的性能参数对应的离线数据确定离线模型,以及根据通道的性能参数对应实时数据确定在线模型;

根据离线模型和在线模型,确定预估模型。

可选的,所述对通道的资源参数进行多轮调整,包括:

针对任意一轮调整,选择至少一个通道作为本轮需要调整的通道;

判断当前总开销是否不大于设定的开销阈值;

如果是,则提高本轮需要调整的通道的资源参数;否则,降低本轮需要调整的通道的资源参数;

其中,当前总开销是根据当前所有通道的资源参数,通过预估模型确定的。

本申请实施例根据总开销和开销阈值的比较结果,提高或降低本轮需要调整的通道的资源参数,使得调整更准确。

可选的,所述调整指标包括点击数和开销;

所述根据调整后的通道的资源参数,通过预估模型确定该轮调整对应的调整指标之后,从多轮调整中选择一轮调整对应的通道的资源参数作为最终的资源参数之前,还包括:

若该轮调整对应的总点击数量不小于临时总点击数量,且该轮调整对应的总开销不大于设定的开销阈值;或当前确定的随机概率不大于退火概率,则将该轮调整对应的所有通道的资源参数加入备选集合中;

所述从多轮调整中选择一轮调整对应的通道的资源参数作为最终的资源参数,包括:

若调整的轮数大于设定的轮数,则从所述备选集合中选择总开销小于设定开销阈值且总点击数量最大的调整对应的每个通道的资源参数;

其中,若该轮调整为首轮调整则所述临时总点击数量为当前的总点击数量,若该轮调整为非首轮调整则所述临时总点击数量为最近一次有效调整对应的总点击数量,所述有效调整为对应的总点击数量不小于临时点击数量,且对应的总开销不大于设定的开销阈值的调整。

本申请实施例将符合条件的所有通道的每个资源参数加入备选集合中,并从所述备选集合中选择总开销小于设定开销阈值且总点击数量最大的调整对应的每个通道的资源参数,进一步保证调整指标最优。

可选的,该方法还包括:

若调整的轮数不大于设定的轮数,则返回选择至少一个通道作为本轮需要调整的通道的步骤。

本申请实施例提供的一种确定通道资源参数的设备,该方法包括:

调整模块,用于对通道的资源参数进行多轮调整,其中一轮调整至少一个通道的资源参数;

处理模块,用于针对任意一轮调整,根据调整后的通道的资源参数,通过预估模型确定该轮调整对应的调整指标,其中所述预估模型是根据多个通道的评估参数对应的离线数据和多个通道的评估参数对应的实时数据确定的;

选择模块,用于根据多轮调整对应的调整指标,从多轮调整中选择一轮调整对应的通道的资源参数作为最终的资源参数。

可选的所述处理模块还用于根据下列方式确定所述预估模型:

根据通道的性能参数对应的离线数据确定离线模型,以及根据通道的性能参数对应实时数据确定在线模型;根据离线模型和在线模型,确定预估模型。

可选的所述调整模块具体用于:

针对任意一轮调整,选择至少一个通道作为本轮需要调整的通道;判断当前总开销是否不大于设定的开销阈值;如果是,则提高本轮需要调整的通道的资源参数;否则,降低本轮需要调整的通道的资源参数;

其中,当前总开销是根据当前所有通道的资源参数,通过预估模型确定的。

可选的所述调整指标包括点击数和开销;

所述处理模块还用于:

若该轮调整对应的总点击数量不小于临时总点击数量,且该轮调整对应的总开销不大于设定的开销阈值;或当前确定的随机概率不大于退火概率,则将该轮调整对应的所有通道的资源参数加入备选集合中;

所述选择模块具体用于:

若调整的轮数大于设定的轮数,则从所述备选集合中选择总开销小于设定开销阈值且总点击数量最大的调整对应的每个通道的资源参数;

其中,若该轮调整为首轮调整则所述临时总点击数量为当前的总点击数量,若该轮调整为非首轮调整则所述临时总点击数量为最近一次有效调整对应的总点击数量,所述有效调整为对应的总点击数量不小于临时点击数量,且对应的总开销不大于设定的开销阈值的调整。

可选的,所述选择模块还用于:

若调整的轮数不大于设定的轮数,则返回选择至少一个通道作为本轮需要调整的通道的步骤。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1a为本申请实施例确定通道资源参数的方法流程示意图;

图1b为本申请实施例资源参数系统框架示意图;

图2为本申请实施例确定通道资源参数的完整方法流程示意图;

图3为本申请实施例确定通道资源参数的设备结构示意图。

具体实施方式

本申请实施例根据所有通道的每个资源参数参数的离线数据和实时数据,确定的预估模型;通过所述预估模型,根据调整后的所有通道的每个资源参数确定该轮调整对应的调整指标,根据多轮调整对应的调整指标,从多轮调整中选择一轮调整对应的通道的资源参数作为最终的资源参数。由于本申请实施例在确定资源参数时考虑到所有通道,相比针对每个通道的方式,能够使通道的调整指标达到最优。

本申请实施例的方法可以应用于广告平台中,其中根据不同的调整参数,资源参数的具体含义也不同;相应的,调整指标的含义也不相同。

比如资源参数可以是通道的资源参数;相应的,调整指标包括总收入和总投资回报率;调整指标也可以包括总点击数,即投放广告后用户点击广告的次数。

为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部份实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

如图1a所示,本申请实施例确定通道资源参数的方法包括:

步骤100、对通道的资源参数进行多轮调整,其中一轮调整至少一个通道的资源参数;

步骤101、针对任意一轮调整,根据调整后的通道的资源参数,通过预估模型确定该轮调整对应的调整指标,其中所述预估模型是根据多个通道的评估参数对应的离线数据和多个通道的评估参数对应的实时数据确定的;

步骤102、根据多轮调整对应的调整指标,从多轮调整中选择一轮调整对应的通道的资源参数作为最终的资源参数。

可选的,步骤101之后,可以将选择的每个通道的资源参数发送给资源参数引擎,通过资源参数引擎,根据选择的每个通道的资源参数调整当前通道的资源参数。

本申请实施例由于根据所有通道的每个资源参数确定预估模型,并利用预估模型进行资源参数的调整,相比每个通道单独进行资源参数的情况,能够使通道的调整指标达到最优。

本申请实施例中的通道是根据流量特征进行划分的。其中,流量特征有很多,比如用户地域、访问网页、用户性别等。

以上述用户地域、访问网页、用户性别为例进行说明。

其中,流量特征的不同组合可以分为三种粒度的通道:

单特征通道:只使用一个流量特征,放弃其余两个特征,比如只使用用户性别;

双特征通道:同时使用两个流量特征,放弃第三个特征,比如只使用用户地域与用户性别;

三特征通道:同时使用三个流量特征。

在实施中,使用的流量特征越多,通道划分的越细。可选的,在本申请实施例中,上述三种粒度使用其中一种,不混合使用不同的流量特征组合。比如:使用单特征通道,且使用的流量特征为用户性别,则放弃其他两个特征;使用双特征通道,且使用的流量特征为用户地域与用户性别,则放弃访问网页的特征。

在实施中,如果调整指标包括点击数和开销,则总点击数量为所有通道的点击数量之和,即总开销为所有通道的开销之和,即其中clicki表示通道i全天的点击数量,costi表示通道i全天的开销(这里全天只是举例说明,根据需要也可以修改为一个设定时间段,比如半天、1小时等)。

这里的开销可以是通道的花费,针对不同的应用场景这里的花费包括的内容也不相同,比如如果应用于广告平台中,则通道的花费为购买流量的花费,一般按千次展示扣费。

如果想到达到全局最优,需要满足下列公式:

其中,costi为通道i全天的开销;budget为开销阈值。即在总开销不大于设定的开销阈值时,总点击数最大。

可选的,将clicki和costi展开后,可以得到更详细的公式:

从展开的公式可以看出,需要在确定预估模型时,需要先预估pv(pageview,综合浏览量)、ctr(clickthroughrate,点击率,广告展示后有点击的概率)、bsr(bidsuccessfulrate,竞价成功率,表示在adexchange上竞价后能成功拿到广告展示机会的概率,取值范围为0%~100%)和cpm(costpermille,千次流量花费)。

其中,表示通道i下个时间段t的pv预估值;

bidi表示针对通道i的资源参数;

bsri(bidi)表示使用bidi对通道i资源参数时预估的bsr;

表示通道i下个时间段t的ctr;

cpmi(bidi)表示使用bidi对通道i资源参数时的cpm。

本申请实施例采用离线预估与实时预估相结合的方式。具体的,

根据所有通道的每个指标参数的离线数据和实时数据,确定预估模型时,可以根据所有通道的每个指标参数的离线数据确定离线模型,以及根据所有通道的每个指标参数的实时数据确定在线模型;根据离线模型和在线模型,确定预估模型。

如图1b所示,本申请实施例中,通过获取的离线数据确定离线模型,同时通过获取的实时数据确定在线模型;根据离线模型和在线模型确定预估模型。

根据预估模型和退火算法确定每个通道的资源参数,并通过资源参数引擎对每个通道的资源参数进行调整。

其中,离线模型是根据历史数据得到的模型,包括pv离线模型、ctr模型、bsr模型以及cpm模型。

实时模块是根据实时数据得到的模型,包括ctr模型、bsr模型以及cpm模型;

根据预估模型和退火算法确定每个通道的资源参数是根据目标公式以及相关的预估模型调整所有通道的资源参数,每隔固定时间重新计算一次;

资源参数引擎是获取调整后的所有通道的资源参数并与adexchange交互,产出新的实时数据(即根据调整后的所有通道的资源参数调整真实的所有通道的资源参数)。

其中,bsr模型和cpm模型对应通道,即一个通道对应一个bsr模型和一个cpm模型。也就是说,不同通道对应的bsr模型只与该通道有关系,与其他通道没有关系。比如有两个通道a和b,则通道a对应bsr模型1和cpm模型1,通道b对应bsr模型2和cpm模型2。bsr模型1和bsr模型2可能相同,也可能不同;cpm模型1和cpm模型2可能相同,也可能不同。

ctr模型对应全局,即每个通道对应同一个ctr模型。

可选的,根据所有通道的每个资源参数参数的离线数据确定离线模型,包括:

针对任意一个通道,根据所述通道在设定时长内的离线pv数据确定所述通道对应的pv模型,根据所述通道对应的离线ctr确定所述通道对应的ctr离线模型,以及根据所述通道对应的离线资源参数确定bsr离线模型和cpm离线模型;根据所述通道对应的pv离线模型、ctr离线模型、bsr离线模型和cpm离线模型确定所述通道对应的子离线模型。

下面详细介绍下每种离线模型确定方法。

1、pv离线模型:

针对每个通道单独计算一个pv离线模型,pv离线模型属于统计模型。

比如选取过去n天一个通道的pv数据,并按小时(也可以是其他单位)粒度进行切分,使用指数加权平均公式计算出该通道在一天中某小时的pv量

其中,为今天第h小时的pv预估量;

为之前第i天第h小时的pv真实值;

xi为之前第i天的权数,所有权数之和为1,通常xa>xb,ifa>b。

2、ctr离线模型:

对于ctr预估,可以采用逻辑回归模型。

逻辑回归的概率公式:

w和f分别表示模型系数(特征权重)和特征。

通过最大似然可以表示优化目标:

使用最优化方法求解w即可,常见的方法如梯度下降、牛顿法等。

在进行预估模型训练时,使用的特征包括但不限于下列中的部分或全部:

用户偏好;

用户人口属性;

网站相关信息;

广告位信息;

反馈特征。

上面涉及的数据使用的是离线数据。

3、bsr离线模型:

由于bid(资源参数)与bsr(竞价成功率)存在函数关系,即bid提高,bsr先快速提高,然后逐渐平缓。基于这个特性,一种可选的方式是采用米氏方程对每个通道的bid与bsr的关系进行拟合:

通过不断训练得到α1,在使用过程中将训练得到的α1代入,并输入bid得到bsr离线模型。

4、cpm离线模型:

由于bid与cpm(千次流量花费)存在函数关系,即bid(资源参数)提高,cpm先快速提高,然后逐渐平缓。基于这个特性,一种可选的方式是采用米氏方程对每个通道的bid与bsr的关系进行拟合:

其中,cpmmax表示通道历史上最高的cpm。

通过不断训练得到α2,在使用过程中将训练得到的α2代入,并输入bid得到cpm离线模型。

可选的,根据所有通道的每个资源参数参数的实时数据,确定在线模型,包括:

针对任意一个通道,根据所述通道对应的实时ctr确定所述通道对应的ctr在线模型,以及根据所述通道对应的实时资源参数确定bsr在线模型和cpm在线模型;

根据所述通道对应的pv离线模型、ctr在线模型、bsr在线模型和cpm在线模型确定在线模型。

下面详细介绍下每种在线模型确定方法。

1、ctr在线模型:

对于ctr预估,可以采用逻辑回归模型。

逻辑回归的概率公式:

w和f分别表示模型系数(特征权重)和特征。

通过最大似然可以表示优化目标:

使用最优化方法求解w即可,常见的方法如梯度下降、牛顿法等。

在进行预估模型训练时,使用的特征包括但不限于下列中的部分或全部:

用户偏好;

用户人口属性;

网站相关信息;

广告位信息;

反馈特征。

上面涉及的数据使用的是实时数据。

2、bsr在线模型:

由于bid(资源参数)与bsr(竞价成功率)存在函数关系,即bid提高,bsr先快速提高,然后逐渐平缓。基于这个特性,一种可选的方式是采用米氏方程对每个通道的bid与bsr的关系进行拟合:

通过不断训练得到α3,在使用过程中将训练得到的α3代入,并输入bid得到bsr在线模型。

3、cpm在线模型:

由于bid与cpm(千次流量花费)存在函数关系,即bid(资源参数)提高,cpm先快速提高,然后逐渐平缓。基于这个特性,一种可选的方式是采用米氏方程对每个通道的bid与bsr的关系进行拟合:

其中,cpmmax表示通道历史上最高的cpm。

通过不断训练得到α3,在使用过程中将训练得到的α3代入,并输入bid得到cpm在线模型。

上面描述的在建立离线模型和在线模型时,对于在线模型使用当前时间点之前短时间内(比如最近10分钟)的所有数据训练模型;对于离线模型使用一段历史时间内(比如前10天)的所有数据训练模型。

可选的,根据离线模型和在线模型确定预估模型,就是将离线模型和在线模型进行融合后使用。

具体的,根据所述ctr离线模型和所述ctr在线模型,确定所述ctr预估模型;以及根据所述bsr离线模型和所述bsr在线模型,确定所述bsr预估模型;以及根据所述cpm离线模型和所述cpm在线模型,确定所述cpm预估模型;

根据所述ctr预估模型、所述bsr预估模型和所述cpm预估模型,确定所述预估模型。

其中,可以根据下列公式确定所述ctr预估模型、所述bsr预估模型和所述cpm预估模型:

bsr预估模型=a×bsr离线模型+(1-a)bsr在线模型

ctr预估模型=b×ctr离线模型+(1-b)ctr在线模型;

cpm预估模型=z×cpm离线模型+(1-z)cpm在线模型

clicki为:

costi为:

其中,离线模型是一段时间内的历史数据计算得到的,相对而言准确性更强;在线模型是根据最新的实时数据计算得到的,相对而言更能反映通道最新的变化。x、y和z的值可以根据对实时变化的重视程度进行调整,重视程度越高,x、y和z的值越小,重视程度越低,x、y和z的值越高。x、y和z可以全部相同,也可以部分相同,也可以全不相同。

在实施中,可以一段时间对通道资源参数进行一轮资源参数迭代(一轮资源参数迭代需要对至少一个通道进行至少一轮调整,一般情况会进行多次调整,具体一轮资源参数迭代调整的轮数可以根据经验、需要等进行设置),即一段时间执行一次本申请实施例的通道资源参数过程。基于此,可以在进行一轮资源参数迭代之前确定本轮资源参数迭代使用的预估模型。

在确定预估模型后,就可以从所有通道中选择至少一个通道作为本轮需要调整的通道。

可选的,针对任意一轮调整,选择至少一个通道作为本轮需要调整的通道;

判断当前总开销是否不大于设定的开销阈值;

如果是,则提高本轮需要调整的通道的资源参数;否则,降低本轮需要调整的通道的资源参数;

其中,当前总开销是根据当前所有通道的资源参数,通过预估模型确定的。

也就是说,如果当前总开销是否不大于设定的开销阈值,说明通道的资源参数有提高的空间;如果当前总开销是否大于设定的开销阈值,说明通道的资源参数需要降低。

其中,每次提高可以按照预先设定的步长值提高(比如步长值可以是x%,即每次提价x1%)。每次降低可以按照预先设定的步长值降低(比如步长值可以是x%,即每次提价x1%)。

在进行一轮调整后,将调整后的每个通道的资源参数输入到确定的预估模型中,并得到本轮调整对应的资源参数。

以所述调整指标包括点击数和开销为例:

若该轮调整对应的总点击数量不小于临时总点击数量,且该轮调整对应的总开销不大于设定的开销阈值;或当前确定的随机概率不大于退火概率,则将该轮调整对应的所有通道的资源参数加入备选集合中。

本申请实施例的随机概率是在需要与退火概率进行比较时随机生成的。退火概率是根据经验、应用场景等由人工配置的。

这里可以先判断本轮调整对应的总点击数量不小于临时总点击数量,且该轮调整对应的总开销不大于设定的开销阈值;如果是,则不需要进行概率判断;如果不是,再进行概率判断。

也可以先判断随机概率是否不大于退火概率,如果是,则不需要进行总点击数量和总开销的判断;如果不是,则再进行总点击数量和总开销的判断。

其中,若该轮调整为首轮调整则所述临时总点击数量为当前的总点击数量,若该轮调整为非首轮调整则所述临时总点击数量为最近一次有效调整对应的总点击数量,所述有效调整为对应的总点击数量不小于临时点击数量,且对应的总开销不大于设定的开销阈值的调整。

在将所有通道的每个资源参数加入备选集合之后,需要判断调整的轮数是否大于设定的轮数,如果是,则从所述备选集合中选择总开销小于设定开销阈值且总点击数量最大的调整对应的每个通道的资源参数;

如果不是,则返回选择至少一个通道作为本轮需要调整的通道的步骤,也就是说继续一轮调整。

从所述备选集合中选择总开销小于设定开销阈值且总点击数量最大的调整对应的每个通道的资源参数,比如备选集合中对应调整1的资源参数,通道a为1000,通道b为1000;调整2的资源参数,通道a为1100,通道b为1300。

调整1对应的总开销10%和总点击数量13000;

调整2对应的总开销20%和总点击数量11000。

假设设定开销阈值为15%,则调整1总开销10%小于开销阈值为15%,选择调整1对应的通道资源参数,即通道a为1000,通道b为1000。

假设设定阈值为29%,虽然调整1和调整2的总开销都小于开销阈值,但是由于调整1对应的总点击数量大于调整2对应的总点击数量,所以选择调整1对应的资源参数,即通道a为1000,通道b为1000。

下面列举一个完整的例子对本申请的方案进行说明。

如图2所示,本申请实施例确定通道资源参数的完整方法包括:

步骤200、随机生成所有通道的资源参数。

步骤201、读取根据所有通道的每个资源参数参数的离线数据和实时数据确定的预估模型。

从上面介绍的模型可以看出,不同时间的模型是相同的,但是不同时间获取的参数值有可能不同,所以不同时间的模型得到的结果不同。

步骤202、读取当前的clickcurrent和costcurrent。

步骤203、进行参数初始化,即将costtmp=costcurrent,clicktmp=clickcurrent。

步骤204、随机选择至少一个通道。

步骤205、判断clicktmp是否不大于budget(即设定的开销阈值);如果是,则执行步骤206;否则执行步骤207。

步骤206、提高选择的通道的资源参数,并执行步骤208。

其中,提价幅度可以按照预先设定的步长值提高资源参数(比如步长值可以是x%,即每次提价x1%)。

步骤207、降低选择的通道的资源参数,并执行步骤208。

其中,降价幅度可以按照预先设定的步长值降低资源参数(比如步长值可以是x2%,即每次降价x2%)。

步骤208、将调整后的资源参数代入预估模型,得到clicknew和costnew。

步骤209、判断costnew是否不大于开销阈值,且clicknew是否不大于clicktmp;

如果是,则执行步骤211;否则,执行步骤210。

步骤210、判断随机概率是否不大于退火概率,如果是,则执行步骤211;否则,执行步骤213。

步骤211、将本轮调整后的每个通道的资源参数加入到备选集合中(即bidset)。

步骤212、进行参数更新操作,即将clicktmp=clickcurrent(这里的clickcurrent是当前的clickcurrent),costtmp=costnew(这里的costnew是在步骤208得到的)。

步骤213、对调整计数器增加计数值,比如一轮调整增加数值为1,则这里就+1。

步骤214、判断调整计数器的数值是否大于设定的轮数,如果是,则执行步骤215;否则,返回步骤204。

步骤215、从所述备选集合中选择总开销小于设定开销阈值且总点击数量最大的调整对应的每个通道的资源参数,并结束本轮调整。

步骤216、在等待设定时长后,执行步骤201。

基于同一发明构思,本申请实施例中还提供了一种确定通道资源参数的设备,由于该设备解决问题的原理与本申请实施例确定通道资源参数的方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。

如图3所示,本申请实施例确定通道资源参数的设备包括:

调整模块300,用于对通道的资源参数进行多轮调整,其中一轮调整至少一个通道的资源参数;

处理模块301,用于针对任意一轮调整,根据调整后的通道的资源参数,通过预估模型确定该轮调整对应的调整指标,其中所述预估模型是根据多个通道的评估参数对应的离线数据和多个通道的评估参数对应的实时数据确定的;

选择模块302,用于根据多轮调整对应的调整指标,从多轮调整中选择一轮调整对应的通道的资源参数作为最终的资源参数。

可选的,调整模块300可以将选择的每个通道的资源参数发送给资源参数引擎,通过资源参数引擎根据选择的每个通道的资源参数调整当前通道的资源参数。

本申请实施例由于根据所有通道的每个资源参数确定预估模型,并利用预估模型进行资源参数的调整,相比每个通道单独进行资源参数的情况,能够使通道的调整指标达到最优。

本申请实施例中的通道是根据流量特征进行划分的。其中,流量特征有很多,比如用户地域、访问网页、用户性别等。

以上述用户地域、访问网页、用户性别为例进行说明。

其中,流量特征的不同组合可以分为三种粒度的通道:

单特征通道:只使用一个流量特征,放弃其余两个特征,比如只使用用户性别;

双特征通道:同时使用两个流量特征,放弃第三个特征,比如只使用用户地域与用户性别;

三特征通道:同时使用三个流量特征。

在实施中,使用的流量特征越多,通道划分的越细。可选的,在本申请实施例中,上述三种粒度使用其中一种,不混合使用不同的流量特征组合。比如:使用单特征通道,且使用的流量特征为用户性别,则放弃其他两个特征;使用双特征通道,且使用的流量特征为用户地域与用户性别,则放弃访问网页的特征。

在实施中,如果调整指标包括点击数和开销,则总点击数量为所有通道的点击数量之和,即总开销为所有通道的开销之和,即其中clicki表示通道i全天的点击数量,costi表示通道i全天的开销(这里全天只是举例说明,根据需要也可以修改为一个设定时间段,比如半天、1小时等)。

这里的开销可以是通道的花费。

如果想到达到全局最优,需要满足下列公式:

其中,costi为通道i全天的开销;budget为开销阈值。即在总开销不大于设定的开销阈值时,总点击数最大。

可选的,将clicki和costi展开后,可以得到更详细的公式:

从展开的公式可以看出,需要在确定预估模型时,需要先预估pv(pageview,综合浏览量)、ctr(clickthroughrate,点击率,广告展示后有点击的概率)、bsr(bidsuccessfulrate,竞价成功率,表示在adexchange上竞价后能成功拿到广告展示机会的概率,取值范围为0%~100%)和cpm(costpermille,千次流量花费)。

其中,表示通道i下个时间段t的pv预估值;

bidi表示针对通道i的资源参数;

bsri(bidi)表示使用bidi对通道i资源参数时预估的bsr;

表示通道i下个时间段t的ctr;

cpmi(bidi)表示使用bidi对通道i资源参数时的cpm。

本申请实施例采用离线预估与实时预估相结合的方式。具体的,

本申请实施例采用离线预估与实时预估相结合的方式。具体的,

调整模块300根据所有通道的每个指标参数的离线数据和实时数据,确定预估模型时,可以根据所有通道的每个指标参数的离线数据确定离线模型,以及根据所有通道的每个指标参数的实时数据确定在线模型;根据离线模型和在线模型,确定预估模型。

如图1b所示,本申请实施例的资源参数系统中,通过获取的离线数据确定离线模型,同时通过获取的实时数据确定在线模型;根据离线模型和在线模型确定预估模型。

根据预估模型和退火算法确定每个通道的资源参数,并通过资源参数引擎对每个通道的资源参数进行调整。

其中,离线模型是根据离线的历史数据得到的模型,包括pv离线模型、ctr模型、bsr(bidsuccessfulrate,竞价成功率,表示在adexchange上竞价后能成功拿到广告展示机会的概率,取值范围为0%~100%)模型以及cpm模型;

实时模块是根据实时数据得到的模型,包括ctr模型、bsr模型以及cpm模型;

根据预估模型和退火算法确定每个通道的资源参数是根据目标公式以及相关的预估模型调整所有通道的资源参数,每隔固定时间重新计算一次;

资源参数引擎是获取调整后的所有通道的资源参数并与adexchange交互,产出新的实时数据(即根据调整后的所有通道的资源参数调整真实的所有通道的资源参数)。

如图1b所示,本申请实施例中,通过获取的离线数据确定离线模型,同时通过获取的实时数据确定在线模型;根据离线模型和在线模型确定预估模型。

根据预估模型和退火算法确定每个通道的资源参数,并通过资源参数引擎对每个通道的资源参数进行调整。

其中,离线模型是根据历史数据得到的模型,包括pv离线模型、ctr模型、bsr模型以及cpm模型。

实时模块是根据实时数据得到的模型,包括ctr模型、bsr模型以及cpm模型;

根据预估模型和退火算法确定每个通道的资源参数是根据目标公式以及相关的预估模型调整所有通道的资源参数,每隔固定时间重新计算一次;

资源参数引擎是获取调整后的所有通道的资源参数并与adexchange交互,产出新的实时数据(即根据调整后的所有通道的资源参数调整真实的所有通道的资源参数)。

其中,bsr模型和cpm模型对应通道,即一个通道对应一个bsr模型和一个cpm模型。也就是说,不同通道对应的bsr模型只与该通道有关系,与其他通道没有关系。比如有两个通道a和b,则通道a对应bsr模型1和cpm模型1,通道b对应bsr模型2和cpm模型2。bsr模型1和bsr模型2可能相同,也可能不同;cpm模型1和cpm模型2可能相同,也可能不同。

ctr模型对应全局,即每个通道对应同一个ctr模型。

可选的,调整模块300在根据所有通道的每个资源参数参数的离线数据确定离线模型时:

针对任意一个通道,根据所述通道在设定时长内的离线pv数据确定所述通道对应的pv模型,根据所述通道对应的离线ctr确定所述通道对应的ctr离线模型,以及根据所述通道对应的离线资源参数确定bsr离线模型和cpm离线模型;根据所述通道对应的pv离线模型、ctr离线模型、bsr离线模型和cpm离线模型确定所述通道对应的子离线模型。

具体每种离线模型的确定可以参照上述方法实施例中的介绍,在此不再赘述。

可选的,调整模块300在根据所有通道的每个资源参数参数的实时数据时:

针对任意一个通道,根据所述通道对应的实时ctr确定所述通道对应的ctr在线模型,以及根据所述通道对应的实时资源参数确定bsr在线模型和cpm在线模型;根据所述通道对应的pv离线模型、ctr在线模型、bsr在线模型和cpm在线模型确定在线模型。

具体每种在线模型的确定可以参照上述方法实施例中的介绍,在此不再赘述。

可选的,调整模块300根据离线模型和在线模型确定预估模型,就是将离线模型和在线模型进行融合后使用。

具体的,调整模块300具体的,根据所述ctr离线模型和所述ctr在线模型,确定所述ctr预估模型;以及根据所述bsr离线模型和所述bsr在线模型,确定所述bsr预估模型;以及根据所述cpm离线模型和所述cpm在线模型,确定所述cpm预估模型;根据所述ctr预估模型、所述bsr预估模型和所述cpm预估模型,确定所述预估模型。

其中,调整模块300根据下列公式确定所述ctr预估模型、所述bsr预估模型和所述cpm预估模型:

bsr预估模型=a×bsr离线模型+(1-a)bsr在线模型

ctr预估模型=b×ctr离线模型+(1-b)ctr在线模型;

cpm预估模型=z×cpm离线模型+(1-z)cpm在线模型

clicki为:

costi为:

其中,离线模型是一段时间内的历史数据计算得到的,相对而言准确性更强;在线模型是根据最新的实时数据计算得到的,相对而言更能反映通道最新的变化。x、y和z的值可以根据对实时变化的重视程度进行调整,重视程度越高,x、y和z的值越小,重视程度越低,x、y和z的值越高。x、y和z可以全部相同,也可以部分相同,也可以全不相同。

在实施中,可以一段时间对通道资源参数进行一轮资源参数迭代(一轮资源参数迭代需要对至少一个通道进行至少一轮调整,一般情况会进行多次调整,具体一轮资源参数迭代调整的轮数可以根据经验、需要等进行设置),即一段时间执行一次本申请实施例的通道资源参数过程。基于此,可以在进行一轮资源参数迭代之前确定本轮资源参数迭代使用的预估模型。

在确定预估模型后,调整模块300就可以从所有通道中选择至少一个通道作为本轮需要调整的通道。

可选的,针对任意一轮调整,调整模块300选择至少一个通道作为本轮需要调整的通道;判断当前总开销是否不大于设定的开销阈值;如果是,则提高本轮需要调整的通道的资源参数;否则,降低本轮需要调整的通道的资源参数;其中,当前总开销是根据当前所有通道的资源参数,通过预估模型确定的。

也就是说,如果当前总开销是否不大于设定的开销阈值,说明通道的资源参数有提高的空间;如果当前总开销是否大于设定的开销阈值,说明通道的资源参数需要降低。

其中,每次提高可以按照预先设定的步长值提高(比如步长值可以是x%,即每次提价x1%)。每次降低可以按照预先设定的步长值降低(比如步长值可以是x%,即每次提价x1%)。

在进行一轮调整后,处理模块301将调整后的每个通道的资源参数输入到确定的预估模型中,并得到本轮调整对应的资源参数。

以所述调整指标包括点击数和开销为例:

若该轮调整对应的总点击数量不小于临时总点击数量,且该轮调整对应的总开销不大于设定的开销阈值;或当前确定的随机概率不大于退火概率,则,则处理模块301将该轮调整对应的所有通道的资源参数加入备选集合中。

本申请实施例的随机概率是在需要与退火概率进行比较时随机生成的。退火概率是根据经验、应用场景等由人工配置的。

这里处理模块301可以先判断本轮调整对应的总点击数量不小于临时总点击数量,且该轮调整对应的总开销不大于设定的开销阈值;如果是,则不需要进行概率判断;如果不是,再进行概率判断。

处理模块301也可以先判断随机概率是否不大于退火概率,如果是,则不需要进行总点击数量和总开销的判断;如果不是,则再进行总点击数量和总开销的判断。

其中,若该轮调整为首轮调整则所述临时总点击数量为当前的总点击数量,若该轮调整为非首轮调整则所述临时总点击数量为最近一次有效调整对应的总点击数量,所述有效调整为对应的总点击数量不小于临时点击数量,且对应的总开销不大于设定的开销阈值的调整。

在将所有通道的每个资源参数加入备选集合之后,需要判断调整的轮数是否大于设定的轮数,如果是,则选择模块302从所述备选集合中选择总开销小于设定开销阈值且总点击数量最大的调整对应的每个通道的资源参数;

如果不是,则选择模块303触发所述调整模块300选择至少一个通道作为本轮需要调整的通道,也就是说继续一轮调整。

选择模块303从所述备选集合中选择总开销小于设定开销阈值且总点击数量最大的调整对应的每个通道的资源参数,比如备选集合中对应调整1的资源参数,通道a为1000,通道b为1000;调整2的资源参数,通道a为1100,通道b为1300。

调整1对应的总开销10%和总点击数量13000;

调整2对应的总开销20%和总点击数量11000。

假设设定开销阈值为15%,则调整1总开销10%小于开销阈值为15%,选择调整1对应的通道资源参数,即通道a为1000,通道b为1000。

假设设定阈值为29%,虽然调整1和调整2的总开销都小于开销阈值,但是由于调整1对应的总点击数量大于调整2对应的总点击数量,所以选择调整1对应的资源参数,即通道a为1000,通道b为1000。

以上参照示出根据本申请实施例的方法、装置(系统)和/或计算机程序产品的框图和/或流程图描述本申请。应理解,可以通过计算机程序指令来实现框图和/或流程图示图的一个块以及框图和/或流程图示图的块的组合。可以将这些计算机程序指令提供给通用计算机、专用计算机的处理器和/或其它可编程数据处理装置,以产生机器,使得经由计算机处理器和/或其它可编程数据处理装置执行的指令创建用于实现框图和/或流程图块中所指定的功能/动作的方法。

相应地,还可以用硬件和/或软件(包括固件、驻留软件、微码等)来实施本申请。更进一步地,本申请可以采取计算机可使用或计算机可读存储介质上的计算机程序产品的形式,其具有在介质中实现的计算机可使用或计算机可读程序代码,以由指令执行系统来使用或结合指令执行系统而使用。在本申请上下文中,计算机可使用或计算机可读介质可以是任意介质,其可以包含、存储、通信、传输、或传送程序,以由指令执行系统、装置或设备使用,或结合指令执行系统、装置或设备使用。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1