一种推广关键词的触发方法及装置与流程

文档序号:11155353阅读:来源:国知局

技术特征:

1.一种推广关键词的触发方法,其特征在于,所述方法包括:

获取用户输入的query;

将所述获取的query对应的输入序列输入到翻译模型,得到输出序列;

利用所述输出序列确定所述query触发的推广关键词;

其中,所述翻译模型是采用如下方式预先训练得到的:

从用户点击行为日志中获取query及其对应的被点击标题作为训练数据;

利用训练数据中的query得到输入序列,利用query对应的被点击标题得到目标序列,训练神经网络模型,得到翻译模型。

2.根据权利要求1所述的方法,其特征在于,将所述获取的query对应的输入序列输入到翻译模型包括:

对所述获取的query进行分词处理,将分词处理后得到的词语序列作为输入序列输入到翻译模型;

所述利用训练数据中的query得到输入序列包括:将训练数据中的query进行分词处理,将分词处理后得到的词语序列作为输入序列。

3.根据权利要求1所述的方法,其特征在于,所述翻译模型利用beam-search技术以及预设的推广关键词库,对所述获取的query对应的输入序列进行翻译,得到输出序列。

4.根据权利要求3所述的方法,其特征在于,所述翻译模型对所述获取的query对应的输入序列翻译得到的各输出序列满足以下条件:

输出序列的数量在beam-size以内,且各输出序列的概率大于或等于预设的概率阈值Q,且在所述推广关键词库中存在与所述输出序列一致的推广关键词或者存在以所述输出序列为前缀的推广关键词。

5.根据权利要求4所述的方法,其特征在于,所述翻译模型在对所述输入序列进行翻译的过程中,在各层均进行如下处理:

在推广关键词库中查询各层翻译得到的候选词语;

若推广关键词库中不存在以之前各层已确定的词语与该候选词语构成的序列为前缀的词语,则将该候选词语剪枝掉;

将剩余的候选词语依据概率值进行排序,将排在beam-size个之后的词语剪枝掉;

对排在beam-size个以内的词语中,概率值小于所述Q的词语剪枝掉。

6.根据权利要求1所述的方法,其特征在于,所述神经网络模型为:循环神经网络模型RNN。

7.根据权利要求1所述的方法,其特征在于,利用所述输出序列确定所述query触发的推广关键词包括:

判断推广关键词库中是否存在与所述输出序列一致的推广关键词,如果是,则将与所述输出序列一致的推广关键词作为所述query触发的推广关键词。

8.根据权利要求1至7任一权项所述的方法,其特征在于,该方法还包括:

在所述query对应的搜索结果页中包括所述query触发的推广关键词对应的推广结果。

9.一种推广关键词的触发装置,其特征在于,所述装置包括:

获取单元,用于获取用户输入的query;

翻译单元,用于将所述获取的query对应的输入序列输入到翻译模型,得到输出序列;

确定单元,用于利用所述输出序列确定所述query触发的推广关键词;

训练单元,用于采用如下方式预先训练得到所述翻译模型:

从用户点击行为日志中获取query及其对应的被点击标题作为训练数据;

利用训练数据中的query得到输入序列,利用query对应的被点击标题得到目标序列,训练神经网络模型,得到翻译模型。

10.根据权利要求9所述的装置,其特征在于,所述翻译单元将所述获取的query对应的输入序列输入到翻译模型时,具体执行:

对所述获取的query进行分词处理,将分词处理后得到的词语序列作为输入序列输入到翻译模型;

所述训练单元在利用训练数据中的query得到输入序列时,具体执行:翻译单元将训练数据中的query进行分词处理,将分词处理后得到的词语序列作为输入序列。

11.根据权利要求9所述的装置,其特征在于,所述翻译单元的翻译模型利用beam-search技术以及预设的推广关键词库,对所述获取的query对应的输入序列进行翻译,得到输出序列。

12.根据权利要求11所述的装置,其特征在于,所述翻译单元中的翻译模型对所述获取的query对应的输入序列翻译得到的各输出序列满足以下条件:

输出序列的数量在beam-size以内,且各输出序列的概率大于或等于预设的概率阈值Q,且在所述推广关键词库中存在与所述输出序列一致的推广关键词或者存在以所述输出序列为前缀的推广关键词。

13.根据权利要求12所述的装置,其特征在于,所述翻译单元中的翻译模型在对所述输入序列进行翻译的过程中,在各层均进行如下处理:

在推广关键词库中查询各层翻译得到的候选词语;

若推广关键词库中不存在以之前各层已确定的词语与该候选词语构成的序列为前缀的词语,则将该候选词语剪枝掉;

将剩余的候选词语依据概率值进行排序,将排在beam-size个之后的词语剪枝掉;

对排在beam-size个以内的词语中,概率值小于所述Q的词语剪枝掉。

14.根据权利要求9所述的装置,其特征在于,所述翻译单元中翻译模型使用的神经网络模型为:循环神经网络模型RNN。

15.根据权利要求9至14任一权项所述的装置,其特征在于,所述确定单元在利用输出序列确定所述query触发的推广关键词包括:

判断推广关键词库中是否存在与所述输出序列一致的推广关键词,如果是,则将与所述输出序列一致的推广关键词作为所述query触发的推广关键词。

16.根据权利要求9~15任一权项所述的装置,该装置还包括:

触发单元,用于在所述query对应的搜索结果页中包括所述query触发的推广关键词对应的推广结果。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1