一种筛选推广关键词的方法和装置的制造方法_5

文档序号:9375598阅读:来源:国知局

[0182] 上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存 储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算 机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发 明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器 (Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘 等各种可以存储程序代码的介质。
[0183] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精 神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
【主权项】
1. 一种筛选推广关键词的方法,其特征在于,该方法包括: 选取候选推广关键词; 提取候选推广关键词的特征,所述特征包括:搜索引擎特征、非引入流量的效果特征和 文本特征中的至少一种; 将各候选推广关键词的特征作为预先建立的关键词筛选模型的输入数据,根据所述关 键词筛选模型的预测结果得到优质推广关键词。2. 根据权利要求1所述的方法,其特征在于,所述选取候选推广关键词包括: 利用商家网站的搜索关键词和/或已投放于搜索引擎的推广关键词的扩展词,选取候 选推广关键词。3. 根据权利要求1所述的方法,其特征在于,所述特征还包括竞价特征; 其中,在最低竞价和最高竞价之间,按照预设的竞价间隔分别构造候选推广关键词的 竞价特征。4. 根据权利要求3所述的方法,其特征在于,该方法还包括:确定优质推广关键词的建 议出价,具体包括: 将关键词筛选模型预测的优质推广关键词的竞价特征进行合并,取其中的最大竞价作 为该优质推广关键词的建议出价。5. 根据权利要求1所述的方法,其特征在于,该方法还包括:对得到的优质推广关键词 进行以下过滤处理中的至少一种: 将得到的优质推广关键词去除已投放于搜索引擎的推广关键词; 根据商家网站的违禁词黑名单和/或搜索引擎违禁词黑名单,将得到的优质推广关键 词去除非法关键词。6. 根据权利要求1至5任一权项所述的方法,其特征在于,所述关键词筛选模型的建立 包括: 利用已投放于搜索引擎的推广关键词数据作为训练样本; 利用推广关键词数据确定各推广关键词的投资收益比,根据各推广关键词的投资收益 比对训练样本进行标注; 提取训练样本中各推广关键词的特征,所述特征与提取的所述候选推广关键词的特征 一致; 利用提取的特征和标注的训练样本训练分类模型,得到所述关键词筛选模型。7. 根据权利要求6所述的方法,其特征在于,所述利用推广关键词数据确定各推广关 键词的投资收益比包括: 将推广关键词通过搜索引擎引入商家网站的流量与商家为该推广关键词投入的成本 的比值作为该推广关键词的投资收益比;或者, 将推广关键词通过搜索引擎引入商家的广告收益与商家为该推广关键词投入的成本 的比值作为该推广关键词的投资收益比;或者, 将推广关键词通过搜索引擎引入商家的成交量与商家为该推广关键词投入的成本的 比值作为该推广关键词的投资收益比。8. 根据权利要求6所述的方法,其特征在于,所述根据各推广关键词的投资收益比对 训练样本进行标注包括: 如果推广关键词的投资收益比大于或等于预设的第一阈值,则标注该推广关键词为优 质推广关键词; 如果推广关键词的投资收益比小于预设的第二阈值,则标注该推广关键词为劣质推广 关键词; 其中所述第一阈值大于或等于所述第二阈值。9. 根据权利要求8所述的方法,其特征在于,如果所述第一阈值大于所述第二阈值,则 所述根据各推广关键词的投资收益比对训练样本进行标注还包括: 如果推广关键词的投资收益比大于或等于所述第二阈值并且小于所述第一阈值,则标 注该推广关键词为中等推广关键词。10. 根据权利要求6所述的方法,其特征在于,推广关键词的搜索引擎特征包括:推广 关键词在搜索引擎上的搜索量和/或热度信息; 推广关键词的非引入流量的效果特征包括:推广关键词在商家网站上的搜索量、浏览 量、点击量和成交量中的至少一种; 推广关键词的文本特征包括:推广关键词的单词特征、语义特征和行业特征中的至少 一种; 其中所述单词特征包括推广关键词所包含的最小切词单元、最小切词单元的数量和字 符长度中的至少一种; 所述语义特征包括推广关键词所包含的中心词、产品词和品牌词中的至少一种; 所述行业特征指推广关键词所属的行业类目。11. 一种筛选推广关键词的装置,其特征在于,该装置包括: 关键词选取单元,用于选取候选推广关键词; 特征提取单元,用于提取所述候选推广关键词的特征,所述特征包括:搜索引擎特征、 非引入流量的效果特征和文本特征中的至少一种; 关键词筛选单元,用于将各候选推广关键词的特征作为预先建立的关键词筛选模型的 输入数据,根据所述关键词筛选模型的预测结果得到优质推广关键词。12. 根据权利要求11所述的装置,其特征在于,所述关键词选取单元,具体用于利用商 家网站的搜索关键词和/或已投放于搜索引擎的推广关键词的扩展词,选取候选推广关键 〇13. 根据权利要求11所述的装置,其特征在于,所述特征还包括竞价特征; 所述特征提取单元,还用于在最低竞价和最高竞价之间,按照预设的竞价间隔分别构 造候选推广关键词的竞价特征。14. 根据权利要求13所述的装置,其特征在于,该装置还包括:出价建议单元,用于确 定优质推广关键词的建议出价,具体包括:将关键词筛选模型预测的优质推广关键词的竞 价特征进行合并,取其中的最大竞价作为该优质推广关键词的建议出价。15. 根据权利要求11所述的装置,其特征在于,该装置还包括:关键词过滤单元,用于 将所述关键词筛选单元得到的优质推广关键词进行以下过滤处理中的至少一种: 将得到的优质推广关键词去除已投放于搜索引擎的推广关键词; 根据商家网站的违禁词黑名单和/或搜索引擎违禁词黑名单,将得到的优质推广关键 词去除非法关键词。16. 根据权利要求11至15任一权项所述的装置,其特征在于,该装置还包括:筛选模 型建立单元; 所述筛选模型建立单元具体包括: 样本确定子单元,用于利用已投放于搜索引擎的推广关键词数据作为训练样本; 样本标注子单元,用于利用推广关键词数据确定各推广关键词的投资收益比,根据各 推广关键词的投资收益比对训练样本进行标注; 特征提取子单元,用于提取训练样本中各推广关键词的特征,所述特征与提取的所述 候选推广关键词的特征一致; 模型训练子单元,用于利用提取的特征和标注的训练样本训练分类模型,得到所述关 键词筛选模型。17. 根据权利要求16所述的装置,其特征在于,所述样本标注子单元采用以下方式确 定各推广关键词的投资收益比: 将推广关键词通过搜索引擎引入商家网站的流量与商家为该推广关键词投入的成本 的比值作为该推广关键词的投资收益比;或者, 将推广关键词通过搜索引擎引入商家的广告收益与商家为该推广关键词投入的成本 的比值作为该推广关键词的投资收益比;或者, 将推广关键词通过搜索引擎引入商家的成交量与商家为该推广关键词投入的成本的 比值作为该推广关键词的投资收益比。18. 根据权利要求16所述的装置,其特征在于,所述样本标注子单元采用以下方式对 训练样本进行标注: 如果推广关键词的投资收益比大于或等于预设的第一阈值,则标注该推广关键词为优 质推广关键词; 如果推广关键词的投资收益比小于预设的第二阈值,则标注该推广关键词为劣质推广 关键词; 其中所述第一阈值大于或等于所述第二阈值。19. 根据权利要求18所述的装置,其特征在于,如果所述第一阈值大于所述第二阈值, 则所述样本标注子单元进一步对训练样本进行以下标注: 如果推广关键词的投资收益比大于或等于所述第二阈值并且小于所述第一阈值,则标 注该推广关键词为中等推广关键词。20. 根据权利要求16所述的装置,其特征在于,推广关键词的搜索引擎特征包括:推广 关键词在搜索引擎上的搜索量和/或热度信息; 推广关键词的非引入流量的效果特征包括:推广关键词在商家网站上的搜索量、浏览 量、点击量和成交量中的至少一种; 推广关键词的文本特征包括:推广关键词的单词特征、语义特征和行业特征中的至少 一种; 其中所述单词特征包括推广关键词所包含的最小切词单元、最小切词单元的数量和字 符长度中的至少一种; 所述语义特征包括推广关键词所包含的中心词、产品词和品牌词中的至少一种; 所述行业特征指推广关键词所属的行业类目。
【专利摘要】本发明提供了一种筛选推广关键词的方法和装置,其中方法包括:选取候选推广关键词;提取候选推广关键词的特征,所述特征包括:搜索引擎特征、非引入流量的效果特征和文本特征中的至少一种;将各候选推广关键词的特征作为预先建立的关键词筛选模型的输入数据,根据所述关键词筛选模型的预测结果得到优质推广关键词。本发明利用训练的关键词筛选模型来进行优质推广关键词的预测,替代了传统的单纯依靠固定阈值的规则性较强的筛选方式,对于在推广系统中尚未有效果的关键词也能够进行预测,提高了优质推广关键词筛选的准确性和召回率。
【IPC分类】G06F17/30
【公开号】CN105095210
【申请号】CN201410161778
【发明人】黄凯明, 吴克文, 黄鹏, 李波, 林锋
【申请人】阿里巴巴集团控股有限公司
【公开日】2015年11月25日
【申请日】2014年4月22日
【公告号】US20150302476, WO2015170191A2
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1