基于机器学习与成本模型的关键词推荐方法及系统与流程

文档序号:14217587阅读:171来源:国知局

本发明涉及网络推广领域,尤其涉及一种基于机器学习与成本模型的关键词推荐方法,还涉及一种实现所述关键词推荐方法的系统。



背景技术:

外贸直通车也称作p4p(payforperformance,按照点击付费),是全球最大b2b电子商务平台阿里巴巴企业推出的一项网络推广服务,帮助客户通过自主设置多维度关键词,实现免费展示产品信息,达到大量曝光产品从而吸引潜在买家的效果。

外贸直通车包括两种收费模式:免费推广和竞价推广(按照点击付费)。其中,竞价推广将产品置于页面显要突出位置,实现更高的产品曝光率与点击率,受到众多外贸直通车客户的青睐。同时,使用竞价推广的客户也面临着竞价跟踪困难、操作复杂、推广效益缺乏精准量化、成本控制等问题。虽然市场上已经存在大量的外贸直通车系统,试图帮助客户解决以上问题,但是绝大部分系统目前仅提供跟踪价格、竞价操作、简单的成本管理等基础功能,未能充分利用大数据和人工智能等最新研究成果,满足客户更高层次的价格趋势预测、精细成本效益管理、关键字推荐等要求。具体存在如下问题:

(1)仅能提供简单的竞价跟踪功能,未能利用大数据和人工智能研究成果,缺乏对以往历史数据的深入挖掘,从而实现准确竞价预测。

(2)仅提供竞价价格、每日推广总费用等单一成本控制手段,未能充分考虑曝光率、点击率、询盘率等影响因素,缺乏一个更优化的效益/成本估算模型。

(3)虽然简化了客户的竞价操作,但是仍然需要客户自行跟踪竞价波动,并且手动设置竞价价格。缺乏一个基于优化的效益/成本估算模型上的精准竞价策略。

(4)需要客户手工选择关键词,仅提供简单的关键字管理,如按星级排序、按价格排序等,缺少基于以往竞价波动、出价记录等大数据进行深度学习与挖掘,从而提供更准确的关键字推荐等高端功能。

现有关键词集合中,通常可供一个用户选择的关键词数量达到数百个,因此从其中选择多个关键词对用户来说是一个很大的挑战,用户只能凭直觉与主观因素进行挑选;即使挑选出合适的关键词集合,如何为每个关键词进行出价也是一个困难的事情,因为用户需要把每天推广成本分摊到已选择的关键字集合,而且可供用户参考的信息只包括最近几天的价格波动记录,无法给用户提供深度的分析与预测,帮助用户更好的进行竞价。



技术实现要素:

为解决现有技术中的问题,本发明提供一种基于机器学习与成本模型的关键词推荐方法,还提供一种实现所述关键词推荐方法的系统,在成本模型的基础上,帮助用户更好的选择最合适的关键词集合。

本发明包括如下步骤:

s1:根据价格数据库输入关键词价格数据;

s2:通过机器学习建立价格波动模型;

s3:根据关键词实时价格数据和价格波动模型预测价格波动;

s4:根据预测价格,预测成本是否超支,如果否,返回执行步骤s3,如果是,更新推荐的关键词集合。

本发明作进一步改进,在步骤s2中,所述价格波动模型为:

设定价格的控制下限和控制上限,假设某一关键词竞价价格在控制下限以下或控制上限以上时期价格保持稳定,则称其为稳定期,在控制下限和控制上限之间价格剧烈波动,则成其为波动期;

在波动期,对关键词的竞价波动参数μ和σ2进行最大似然估计,获取估计值,即其中,最大似然估计公式为:

其中,pi为取样的价格,n为样本的数量,i≤n,且为整数;

获取竞价价格p在一定时间区间的移动平均p平均,当小于一指定比率,则竞价价格处于稳定期,维持竞价价格p不变;

大于一指定比率,则竞价价格即将进入或处于价格波动期,利用正态分布公式和估计的波动参数对未来竞价价格f(p)进行价格预测,所述正态分布公式为:

本发明作进一步改进,在步骤s3中,预测价格波动后,还包括根据关键词效益/成本模型对预测价格进行优化步骤,获取预测后的优化竞价价格。

本发明作进一步改进,所述关键词效益/成本模型为:

其中,分别表示某个时间点预测的竞价价格和预测的点击量,为某个时间段[t1,t1]的预测总成本,而则为时间段[t1,t1]的预计效益总和,采用移动平均的方式获取。

本发明作进一步改进,根据关键词效益/成本模型得出竞价价格pi或者点击量hi的变化引起的效益成本变动δy,然后根据δy制定竞价策略,其中,所述效益成本变动δy的计算公式为:

其中,分别为预估的竞价价格pi或者点击量hi的变化量。

本发明作进一步改进,所述竞价策略为:

当竞价价格pi提高,甚至超过客户的最高出价时,如果δy≥0,建议客户继续提高最高竞价价格;

当竞价价格pi继续提高到某一数值时,δy<0,建议客户不再提高竞价价格;

当竞价价格pi下降时,如果δy≥0,建议客户保持最高竞价价格pi;

当竞价价格pi下降导致δy<0,建议客户以低于竞价价格pi的价格进行竞价。

本发明作进一步改进,在步骤s4中,根据关键词效益/成本模型为客户推荐最优的关键词集合,假定ω=(k1,…,kl)是一个关键词集合,l为集合中关键词的数量,则一个基于多关键词集合ω的关键词效益/成本模型yω为:

其中,c是客户指定的一个总成本,即所有关键词的点击成本之和要低于客户指定的总成本c。

本发明作进一步改进,所述最优的关键词集合的获取是通过随机初始化的梯度上升算法,从而得出一个局部最优解。

本发明作进一步改进,所述梯度上升算法的处理方法为:

s401:随机初始化一个大小为keymin的关键词集合keymin≤l;

s402:随机从剩余关键词集合里面挑选一个关键词k',计算yω∪k′,如果yω∪k′>yω,表示增加k'能够提高总效益/成本,因此ω=ω∪k';

s403:重复步骤s402,直至yω不再增加,或者或者超出设定的循环次数。

本发明还提供一种实现所述关键词推荐方法的系统,包括输入模块:用于根据价格数据库输入关键词价格数据;价格波动模型建立模块:用于通过机器学习建立价格波动模型;价格波动预测模块:用于根据关键词实时价格数据和价格波动模型预测价格波动;关键词集合推荐模块:用于根据预测价格,预测成本是否超支,通过价格波动预测模块预测价格,直至成本超支,更新推荐的关键词集合。

与现有技术相比,本发明的有益效果是:利用准确的价格预测与优化的关键词效益/成本模型,给用户推荐一个关键词集合,即提升了产品曝光率,又降低了用户的推广成本。

附图说明

图1为本发明方法流程图;

图2为某一关键词的竞价价格p的变化图;

图3为某一关键词的曝光量与点击量对比图;

图4为使用本发明前后平均点击花费对比示意图;

图5为使用本发明前后每天花费情况对比示意图;

图6为使用本发明前后推广时长对比示意图。

具体实施方式

下面结合附图和实施例对本发明做进一步详细说明。

如图1所示,本发明包括如下步骤:

s1:根据价格数据库输入关键词价格数据;

s2:通过机器学习建立价格波动模型;

s3:根据关键词实时价格数据和价格波动模型预测价格波动;

s4:根据预测价格,预测成本是否超支,如果否,返回执行步骤s3,如果是,更新推荐的关键词集合。

本例主要通过三个方面对外贸直通车中的关键词推荐优化,下面详细说明。

1、基于机器学习的竞价预测模型

在步骤s2中,采用基于机器学习的价格波动模型,也就是竞价预测模型,因为准确的竞价价格预测是影响系统模型的最核心因素。通过对已有的竞价历史数据进行分析发现,竞价价格p在一定时间区间[t1,t2]保持稳定,而在另外一个时间区间[t3,t4]有较为显著的变动,呈现出典型的正态分布特征(μ和σ分别为正态分布的均值与均方差),因此,本例将价格保持稳定的时期称为稳定期,而将价格剧烈波动时期称为波动期。

如图2所示,本例设定价格的控制下限和控制上限,在控制下限以下或控制上限以上为稳定期,在这一时期价格保持稳定,在控制下限和控制上限之间为波动期,价格剧烈波动。

本例的价格波动模型为:

在波动期,对关键词的竞价波动参数μ和σ2进行最大似然估计,获取估计值,即其中,最大似然估计公式为:

其中,pi为取样的价格,n为样本的数量,i≤n,且为整数。

首先,对竞价价格p取一个指定时间区间的移动平均,记作p平均,例如,日均价,3日均价,或者周均价。这个时间区间不宜取得过长,因为p的变动比较频繁,一般优选日均价或者3日均价。

其次,当小于一指定比率,例如:则认为竞价价格处于稳定期,此时,维持竞价价格p预期不变;

大于一指定比率,例如:则认为竞价价格即将进入或处于价格波动期,利用正态分布公式和估计的波动参数对未来竞价价格f(p)进行价格预测,所述正态分布公式为:

以图1为例,一旦价格上升超过控制下限所示价格,则预示价格将持续激烈上涨(根据正态分布规律),因此本例可以依据估计的参数对未来价格进行合理预判;一旦价格从高点回落,并低于图1中控制上限所表示的价格,则预示价格的波动期即将结束,进入稳定期。

2、关键词效益/成本模型

普通的竞价系统仅考虑最高出价及总价格(即成本),而忽略了竞价的经济效应(即效益)。本例以图3为例说明成本与效益之间的不对等情况。对于正常情况,高曝光量意味着高成本,因为外贸直通车客户需要提高竞价价格,以争取更靠前的排名;高点击量意味着更多的潜在外国商户对此关键词感兴趣并且点击了产品,因此对应着更高的购买可能性。图3中显示的最高曝光量在9/18日,同日其点击量也达到最高。其后,虽然曝光量保持下滑趋势,但是点击量却基本稳定。一个可能的解释是:虽然由于竞价价格高,超出客户的最高价格,造成客户的竞价排名下滑(或者甚至跌出排名榜),但是同时期有更多的潜在外国商户搜索并点击了产品。因此,本例可以合理的假设:如果同时期客户提高其产品的曝光率(即便已经超出其最高出价),则点击率将会得到更大的提升,从而带来更高的潜在销售收入,因此其效益/成本比率更高。

基于以上观察总结,本例提出一个优化的效益/成本模型,获取平均每单位成本带来的效益,因此,在步骤s3中,预测价格波动后,还包括根据关键词效益/成本模型对预测价格进行优化步骤,获取预测后的优化竞价价格。

所述关键词效益/成本模型为:

其中,分别表示某个时间点预测的竞价价格和预测的点击量,为某个时间段[t1,t1]的预测总成本,而则为时间段[t1,t1]的预计效益总和。注意:对于的预测,可以采取移动平均的方式,因为点击量的变动幅度要远远小于竞价价格的变动,当然,也可以采用其他方式获取。

根据关键词效益/成本模型得出竞价价格pi或者点击量hi的变化引起的效益成本变动δy,然后根据δy制定竞价策略,其中,所述效益成本变动δy的计算公式为:

其中,分别为预估的竞价价格pi或者点击量hi的变化量。

本例通过给定δy,作出如下竞价策略:

当竞价价格pi提高,甚至超过客户的最高出价时,如果δy≥0,表示每单位成本带来的效益仍然处于上升阶段,建议客户继续提高最高竞价,因为我们期望潜在增加的点击量(即效益)能够完全对冲客户成本的提高;

当竞价价格pi继续提高到某一数值时,δy<0,建议客户不再提高竞价价格,,因为效益的提升已经不能对冲成本的提高;

当竞价价格pi下降时,如果δy≥0,建议客户保持最高竞价价格pi;

当竞价价格pi下降导致δy<0,表示虽然成本下降,但是点击量下降导致的效益下降更为严重,因此建议客户以低于竞价价格pi的价格进行竞价。

3、基于效益/成本模型的多关键词推荐

现有系统仅提供简单的关键字管理,如按星级排序、按价格排序等,缺少基于以往竞价波动、出价记录等大数据进行深度学习与挖掘,因此,本例通过提供优化的关键词推荐,降低客户的总推广成本,并提升客户的推广效益。

具体地,在步骤s4中,根据关键词效益/成本模型为客户推荐最优的关键词集合,假定ω=(k1,…,kl)是一个关键词集合,l为集合中关键词的数量,则一个基于多关键词集合ω的关键词效益/成本模型yω为:

其中,c是客户指定的一个总成本,即所有关键词的点击成本之和要低于客户指定的总成本c。正常情况下,客户总是希望增加推广的关键词数量,因此指定一个最小关键词数量keymin。

优化此模型,则需要计算:显然,如果对于所有的ω计算yω,并挑选最优解是不可能。因此本例采用基于随机初始化的梯度上升算法,从而得出一个局部最优解。

所述梯度上升算法的处理方法为:

s401:随机初始化一个大小为keymin的关键词集合keymin≤l;

s402:随机从剩余关键词集合里面挑选一个关键词k',计算yω∪k′,如果yω∪k′>yω,表示增加k'能够提高总效益/成本,因此ω=ω∪k';

s403:重复步骤s402,直至yω不再增加,或者或者超出设定的循环次数。至于上述三种情况采用何种调节结束循环,具体按照客户的需求和意愿而定。

本发明还提供一种实现所述关键词推荐方法的系统,包括输入模块:用于根据价格数据库输入关键词价格数据;价格波动模型建立模块:用于通过机器学习建立价格波动模型;价格波动预测模块:用于根据关键词实时价格数据和价格波动模型预测价格波动;关键词集合推荐模块:用于根据预测价格,预测成本是否超支,通过价格波动预测模块预测价格,直至成本超支,更新推荐的关键词集合。

有益效果:

对于外贸直通车用户而言,推广成本(即竞价价格×点击数)与产品曝光率(即产品被潜在买家搜索与查看的时间长短)是最关键的两个衡量指标。推广成本越低,则可以为用户带来更好的成本控制;曝光率高,则产品能被更多的潜在买家所搜索与关注,带来更好的效益。本项目利用准确的价格预测与优化的效益/成本模型,给用户推荐一个关键词集合,即提升了产品曝光率,又降低了用户的推广成本。使用前,平均客户点击商品一次,需要广告推广费6.85元;使用后,平均客户点击商品一次,平均点击花费2.97元,降幅高达56.6%。

客户平均点击花费使用前后对比如图4所示,通过使用前与使用后对比可以看出,客户每天平均点击花费下降近40%。客户每天花费情况使用前后对比如图5所示,通过使用前与使用后对比可以看出,客户每天花费情况下降近50%。客户每天推广时长在使用前后对比如图6所示,通过使用前与使用后对比可以看出,客户使用后每天的推广时长达到近24个小时。

综上所述,本发明根据效益/成本模型,优化了多关键字推荐方法,有效的提升了用户产品的曝光量,并且降低了用户的总推广费用。

以上所述之具体实施方式为本发明的较佳实施方式,并非以此限定本发明的具体实施范围,本发明的范围包括并不限于本具体实施方式,凡依照本发明所作的等效变化均在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1