一种筛选推广关键词的方法和装置的制造方法_4

文档序号:9375598阅读:来源:国知局
据。如果投放需求是需要区分语言进行关键词投 放,那么可以按照"关键词+语言"的方式挑选样本数据,即将对应投放语言的关键词数据 挑选为样本数据。
[0144] 另外,如果建立关键词筛选模型时提取的特征中包括竞价特征,则还可以存在第 三种预处理:即将同一关键词在不同投放时间的同一竞价信息进行合并。
[0145] 然后样本标注子单元02利用推广关键词数据确定各推广关键词的R0I,根据各推 广关键词的ROI对训练样本进行标注。
[0146] 具体地,样本标注子单元02可以采用以下方式确定各推广关键词的ROI :
[0147] 第一种方式:以引入商家网站的流量为主,那么满足单位成本引入流量大于预设 的阈值的关键词即为优质推广关键词。 PV
[0148] 即ROI= K,其中PV为该关键词通过搜索引擎引入商家网站的流量,Cost为商 家为该关键词投入的成本。
[0149] 第二种方式:以引入广告收益为主,那么满足单位成本引入广告收益大于预设的 阈值的关键词即为优质推广关键词。 TY Income
[0150] 即其中Income为该关键词通过搜索引擎引入商家的广告收益, C osi Cost为商家为该关键词投入的成本。
[0151] 第三种方式:以引入成交量为主,那么满足单位成本引入成交量大于预设的阈值 的关键词即为优质推广关键词。
[0152] 即RQI=二圓,其中Volume为该关键词通过搜索引擎引入商家的成交量, Cost Cost为商家为该关键词投入的成本。
[0153] 如果推广关键词的ROI > ROIthl,则样本标注子单元02标注该推广关键词为优质 推广关键词;如果推广关键词的ROKROI th2,则样本标注子单元02标注该推广关键词为劣 质推广关键词;其中ROlthl彡R〇I th2。
[0154] 如果R0Ithl>R0Ith2,则样本标注子单元02进一步对训练样本进行以下标注:如果 推广关键词的ROI为ROI th2 < ROKROIthl的情况,则标注该推广关键词为中等推广关键词。
[0155] 特征提取子单元03负责提取训练样本中各推广关键词的特征。由于需要预测的 推广关键词可能尚未投放,因此不存在消耗数据和引入流量的效果特征,因此需要提取其 他特征。在本发明中可以提取的特征可以包括搜索引擎特征、非引入流量的效果特征和文 本特征中的至少一种,还可以包括竞价特征。
[0156] 其中搜索引擎特征可以是推广关键词在搜索引擎上的搜索量和/或热度信息,这 些特征可以通过搜索引擎的相关工具获取,例如通过google trends或google的kw tools 来获取。
[0157] 所谓非引入流量的效果特征指的是推广关键词除了在搜索引擎引入流量之外的 其他效果特征,例如在商家网站上对该推广关键词的搜索量、浏览量、点击量、成交量等等 中的至少一种。
[0158] 文本特征指的是推广关键词的文本属性体现出的特征,可以包括单词特征、语义 特征、行业特征中的至少一种。
[0159] 单词特征是指推广关键词所包括的最小切词单元、最小切词单元的数量或字符长 度中的至少一种。
[0160] 其中语义特征是指推广关键词所包含的中心词、产品词或品牌词等特征,其可以 通过自然语言处理工具进行提取。例如关键词"苹果音乐播放器",通过自然语言处理工具 提取的中心词为"播放器",产品词为"音乐播放器",品牌词为"苹果"。
[0161] 行业特征是指推广关键词所属的行业类目,关键词所属的行业类目可以通过类目 预测工具预测到。例如"苹果音乐播放器"经过类目预测工具预测为数码类目。
[0162] 竞价特征是指推广关键词在搜索引擎推广中的竞价信息,其直接影响商家的投资 成本。
[0163] 最后,模型训练子单元04利用提取的特征和标注的训练样本训练分类模型,得到 关键词筛选模型。本发明实施例中采用的分类模型可以是但不限于是:决策树、SVM分类 器、Logistic分类器。对分类模型的训练过程是现有较成熟的技术,在此不再详述。利用 提取的特征和标注的训练样本训练分类模型完成后,就得到关键词筛选模型。
[0164] 以上是对筛选模型建立单元00的结构进行的详细描述,下面继续对本装置中的 其他组成单元进行详细描述,其他组成单元负责在已建立的关键词筛选模型的基础上进行 优质推广关键词的筛选。具体如下:
[0165] 首先,关键词选取单元10选取候选推广关键词。在本发明实施例中,候选推广关 键词可以从两个来源进行获取:商家网站的搜索关键词和/或已投放推广关键词的扩展 。
[0166] 商家网站的搜索关键词是用户在商家网站进行搜索的关键词,这些关键词在一定 程度上反映了用户对商家所提供服务或商品的感兴趣程度,从这部分搜索关键词中挑选候 选推广关键词为商家带来转化效果的几率会较高。通过网站的搜索日志可以获取一段时间 内用户在商家网站内部的搜索关键词以及这些关键词在商家网站内的转化效果数据,例如 搜索关键词的搜索量,搜索关键词带来的浏览量、点击量、成交量等。在此可以通过对转化 效果数据设置阈值的方式来排除网站转化效果差的搜索关键词,将剩余的搜索关键词作为 候选推广关键词;或者通过对转化效果数据设置阈值的方式来选择网站转化效果好的搜索 关键词,将选择的搜索关键词作为候选推广关键词。
[0167] 对于已投放于搜索引擎的推广关键词,可以通过扩展词工具对已投放于搜索引 擎的推广关键词中效果较好的推广关键词进行扩展,将得到的扩展词放入候选推广关键 词。扩展词工具扩展出来的关键词主要是同义词或者翻译词,同义词很好理解,翻译词指 的是一个词语对应的常用的其他语言的表述,例如"苹果"这一品牌对应的常用翻译词为 "apple'
[0168] 然后特征提取单元20提取候选推广关键词的特征,该特征与建立关键词筛选模 型时,特征提取子单元03从训练样本中提取的特征一致。如果特征提取子单元03提取了 竞价特征,但由于候选推广关键词可能尚未投放搜索引擎,因此并不具备竞价特征,特征提 取单元20可以在最低竞价和最高竞价之间,按照预设的竞价间隔分别为候选推广关键词 构造竞价特征。
[0169] 然后关键词筛选单元30将各候选推广关键词的特征作为预先建立的关键词筛选 模型的输入数据,根据关键词筛选模型的预测结果得到优质推广关键词。进行预测的过程 实际上就是分类模型进行分类的过程,将各候选推广关键词至少分为了优质推广关键词和 劣质推广关键词,还可能会分出中等推广关键词。具体会有几种分类结果取决于在建立关 键词筛选模型过程中对训练样本进行标注时的标注结果有几种。
[0170] 更进一步地,出价建议单元40可以确定优质推广关键词的建议出价,具体包括: 将关键词筛选模型预测的优质推广关键词的竞价特征进行合并,取其中的最大竞价作为该 优质推广关键词的建议出价。如果关键词筛选模型中提取的特征不包括竞价特征,那么可 以按照运营经验或者根据该优质推广关键词的效果数据来确定建议出价。
[0171] 为了进一步优化得到的优质推广关键词,关键词过滤单元50可以将关键词筛选 单元30得到的优质推广关键词进行以下过滤处理中的至少一种 :
[0172] 将得到的优质推广关键词去除已投放于搜索引擎的推广关键词;
[0173] 根据商家网站的违禁词黑名单和/或搜索引擎违禁词黑名单,将得到的优质推广 关键词去除非法关键词。
[0174] 由以上描述可以看出,本发明提供的方法和装置具备以下优点:
[0175] 1)本发明在提取候选推广关键词的特征后,利用训练的关键词筛选模型来进行优 质推广关键词的预测,替代了传统的单纯依靠固定阈值的规则性较强的筛选方式,对于在 推广系统中尚未有效果的关键词也能够进行预测,提高了优质推广关键词筛选的准确性和 召回率,从而为商家选择投放于搜索引擎的推广关键词提供更加准确和客观的依据。
[0176] 2)在关键词筛选模型中引入了文本特征,丰富了筛选优质关键词所考虑的因素, 提高了优质推广关键词筛选的准确性。
[0177] 3)考虑到出价对推广关键词投放效果的影响,在关键词筛选模型中引入了竞价特 征,能够有效地召回因为不合理竞价而被误判的优质推广关键词,提高了优质推广关键词 筛选的准确性和召回率。
[0178] 4)能够根据关键词筛选模型中引入的竞价特征,使得到的优质推广关键词能够得 到合理的出价,减少商家的预算浪费。
[0179] 在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其 它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅 仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0180] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显 示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个 网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目 的。
[0181] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以 是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单 元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1