搜索词生成方法、模型训练方法、介质、装置和设备与流程

文档序号:31701414发布日期:2022-10-01 08:26阅读:52来源:国知局
搜索词生成方法、模型训练方法、介质、装置和设备与流程

1.本公开的实施方式涉及计算机视觉领域,更具体地,本公开的实施方式涉及一种搜索词生成方法、模型训练方法、介质、装置和设备。


背景技术:

2.本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
3.当前,为了方便用户查找需求的音乐资源,音乐网站或者音乐软件中会设置搜索框,用户可以在搜索框输入关键词,搜索与关键词相关的音乐资源。
4.为了进一步提高用户的使用体验,搜索框中会有浅色底纹样式搜索词向用户推荐用户可能感兴趣的音乐资源,用户可以直接选择“搜索”选项来搜索与搜索词相关的音乐资源。因此,如何提高搜索词与用户兴趣的匹配度,是提高用户对搜索词的点击率的关键,对提高用户的使用体验有重大意义。


技术实现要素:

5.本公开提供一种搜索词生成方法、模型训练方法、介质、装置和设备,用于推荐符合用户兴趣的搜索词。
6.在本公开实施方式的第一方面中,提供了一种搜索词生成方法,包括:根据用户历史行为召回兴趣资源;所述历史行为针对多种历史资源;根据所述兴趣资源确认候选搜索词;将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值;其中,所述预测值表征预测模型预测的候选搜索词被用户点击的概率值;根据所述各个所述候选搜索词对应的预测值,对所述候选搜索词进行筛选后推荐展示。
7.在本公开的一个实施例中,所述将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值,包括:将用户历史行为对应的历史资源按照资源类型进行分类,得到各个类型下的基础特征,将各类历史资源下的基础特征分别进行拼接,得到各类历史资源的拼接特征;基于注意力机制,输入所述拼接特征,输出每类历史资源的序列特征;将所述序列特征进行拼接,得到用户历史行为特征;将所述用户历史行为特征以及所述候选搜索词特征分别进行拼接,得到多个第一合并特征;将各第一合并特征输入预测模型,得到各候选搜索词的预测值。
8.在本公开的另一个实施例中,所述方法还包括:将各第一合并特征、用户属性特征以及当前环境特征进行拼接,得到多个第二合并特征;将各第二合并特征输入预测模型,得到各候选搜索词的预测值。
9.在本公开的又一个实施例中,所述根据所述兴趣资源确认候选搜索词,包括:提取所述兴趣资源的标题信息;将所述标题信息作为候选搜索词;或者,将所述标题信息对应的用户历史搜索词作为候选搜索词;或者,将所述标题信息输入策略模板,以将所述标题信息
与各类型下资源进行匹配,获得所述策略模板输出的所述兴趣资源对应的候选搜索词。
10.在本公开的又一个实施例中,所述历史行为包括历史操作记录以及实时操作记录;所述根据用户历史行为召回兴趣资源,包括:根据用户历史操作记录,计算历史操作记录对应的历史资源的第一召回评分;根据所述第一召回评分,确定第一兴趣资源;根据用户实时操作记录,计算实时操作记录对应的历史资源的第二召回评分;根据所述第二召回评分,确定第二兴趣资源;将所述第一兴趣资源和所述第二兴趣资源按照资源类型进行分类;根据预先配置的各类型下资源间相似度,构建相似度矩阵;计算各类型下资源的召回评分与所述相似度矩阵的乘积结果,将各类型下资源的乘积结果排序靠前的预设数量个资源作为第三兴趣资源;将第一兴趣资源、第二兴趣资源以及第三兴趣资源作为兴趣资源。
11.在本公开的又一个实施例中,所述根据用户历史操作记录,计算历史操作记录对应的历史资源的第一召回评分,包括:针对历史操作记录,根据预设的资源类型的权重和操作类型的权重以及时间衰减系数,加权计算得到历史操作记录下的每个历史资源的第一召回评分。
12.在本公开的又一个实施例中,所述根据用户实时操作记录,计算实时操作记录对应的历史资源的第二召回评分,包括:针对实时操作记录,根据预设的资源类型的权重和操作类型的权重,加权计算得到实时操作记录下的每个历史资源的第二召回评分。
13.在本公开的一个实施例中,所述对所述候选搜索词进行筛选后推荐展示包括:根据所述预测值对所述候选搜索词进行排序筛选;将筛选后的候选搜索词按照预设停留时长轮播展示。
14.在本公开实施方式的第二方面中,提供一种预测模型训练方法,包括:根据用户历史行为召回样本兴趣资源;所述历史行为针对多种历史资源;根据所述样本兴趣资源确认样本搜索词;获取样本搜索词特征以及样本搜索词的操作标签;所述操作标签包括样本搜索词被点击或样本搜索词未被点击;将用户历史行为对应的历史资源的资源特征以及样本搜索词特征作为输入,将所述样本搜索词的操作标签作为标签,训练得到预测模型。
15.在本公开的一个实施例中,所述将用户历史行为对应的历史资源的资源特征以及样本搜索词特征作为输入,将所述样本搜索词的操作标签作为标签,训练得到预测模型,包括:将用户历史行为对应的历史资源按照资源类型进行分类,得到各个类型下的基础特征,将各类历史资源下的基础特征分别进行拼接,得到各类历史资源的拼接特征;基于注意力机制,输入所述拼接特征,输出每类历史资源的序列特征;将所述序列特征进行拼接,得到用户历史行为特征;将所述用户历史行为特征以及所述样本搜索词特征进行拼接,得到多个第三合并特征;将各第三合并特征作为输入,将第三合并特征对应的样本搜索词的操作标签作为标签,训练得到预测模型。
16.在本公开的另一个实施例中,所述方法还包括:将各第三合并特征、用户属性特征以及历史环境特征进行拼接,得到第四合并特征;将各第四合并特征作为输入,将第四合并特征对应的样本搜索词的操作标签作为标签,训练得到预测模型。
17.在本公开的又一个实施例中,根据所述样本兴趣资源确认样本搜索词,包括:提取所述样本兴趣资源的标题信息;将所述样本兴趣资源的标题信息作为样本搜索词;或者,将所述样本兴趣资源的标题信息对应的用户历史搜索词作为样本搜索词;或者,将所述样本兴趣资源的标题信息输入策略模板,以将所述样本兴趣资源的标题信息与各类型下资源进
行匹配,获得所述策略模板输出的所述样本兴趣资源对应的样本搜索词。
18.在本公开的又一个实施例中,所述历史行为包括历史操作记录以及实时操作记录;所述根据用户历史行为召回样本兴趣资源,包括:根据用户历史操作记录,计算历史操作记录对应的历史资源的第三召回评分;根据所述第三召回评分,确定第一样本兴趣资源;根据用户实时操作记录,计算实时操作记录对应的历史资源的第四召回评分;根据所述第四召回评分,确定第二样本兴趣资源;将所述第一样本兴趣资源和所述第二样本兴趣资源按照资源类型进行分类;根据预先配置的各类型下资源间相似度,构建相似度矩阵;计算各类型下资源的召回评分与所述相似度矩阵的乘积结果,将各类型下资源的乘积结果排序靠前的预设数量个资源作为第三样本兴趣资源;将第一样本兴趣资源、第二样本兴趣资源以及第三样本兴趣资源作为样本兴趣资源。
19.在本公开的又一个实施例中,根据用户历史操作记录,计算历史操作记录对应的历史资源的第三召回评分,包括:针对历史操作记录,根据预设的资源类型的权重和操作类型的权重以及时间衰减系数,加权计算得到历史操作记录下的每个历史资源的第三召回评分。
20.在本公开的又一个实施例中,根据用户实时操作记录,计算历史操作记录对应的历史资源的第四召回评分,包括:针对实时操作记录,根据预设的资源类型的权重和操作类型的权重,加权计算得到实时操作记录下的每个历史资源的第四召回评分。
21.在本公开实施方式的第三方面中,提供了一种计算机可读存储介质,包括:所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面中任一项所述的搜索词生成方法。
22.在本公开实施方式的第四方面中,提供了一种搜索词生成装置,包括:召回模块,用于根据用户历史行为召回兴趣资源;所述历史行为针对多种历史资源;生成模块,用于根据所述兴趣资源确认候选搜索词;预测模块,用于将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值;其中,所述预测值表征预测模型预测的候选搜索词被用户点击的概率值;展示模块,用于根据所述各个所述候选搜索词对应的预测值,对所述候选搜索词进行筛选后推荐展示。
23.在本公开的一个实施例中,所述预测模块,具体用于将用户历史行为对应的历史资源按照资源类型进行分类,得到各个类型下的基础特征,将各类历史资源下的基础特征分别进行拼接,得到各类历史资源的拼接特征;所述预测模块,具体还用于基于注意力机制,输入所述拼接特征,输出每类历史资源的序列特征;所述预测模块,具体还用于将所述序列特征进行拼接,得到用户历史行为特征;所述预测模块,具体还用于将所述用户历史行为特征以及所述候选搜索词特征分别进行拼接,得到多个第一合并特征;将各第一合并特征输入预测模型,得到各候选搜索词的预测值。
24.在本公开的另一个实施例中,所述预测模块,还用于将各第一合并特征、用户属性特征以及当前环境特征进行拼接,得到多个第二合并特征;将各第二合并特征输入预测模型,得到各候选搜索词的预测值。
25.在本公开的又一个实施例中,所述生成模块,具体用于提取所述兴趣资源的标题信息;所述生成模块,具体还用于将所述标题信息作为候选搜索词;或者,所述生成模块,具体还用于将所述标题信息对应的用户历史搜索词作为候选搜索词;或者,所述生成模块,具
体还用于将所述标题信息输入策略模板,以将所述标题信息与各类型下资源进行匹配,获得所述策略模板输出的所述兴趣资源对应的候选搜索词。
26.在本公开的又一个实施例中,所述历史行为包括历史操作记录以及实时操作记录;所述召回模块,具体用于根据用户历史操作记录,计算历史操作记录对应的历史资源的第一召回评分;根据所述第一召回评分,确定第一兴趣资源;所述召回模块,具体还用于根据用户实时操作记录,计算实时操作记录对应的历史资源的第二召回评分;根据所述第二召回评分,确定第二兴趣资源;所述召回模块,具体还用于将所述第一兴趣资源和所述第二兴趣资源按照资源类型进行分类;根据预先配置的各类型下资源间相似度,构建相似度矩阵;计算各类型下资源的召回评分与所述相似度矩阵的乘积结果,将各类型下资源的乘积结果排序靠前的预设数量个资源作为第三兴趣资源;所述召回模块,具体还用于将第一兴趣资源、第二兴趣资源以及第三兴趣资源作为兴趣资源。
27.在本公开的又一个实施例中,所述召回模块,具体用于针对历史操作记录,根据预设的资源类型的权重和操作类型的权重以及时间衰减系数,加权计算得到历史操作记录下的每个历史资源的第一召回评分。
28.在本公开的又一个实施例中,所述召回模块,具体用于针对实时操作记录,根据预设的资源类型的权重和操作类型的权重,加权计算得到实时操作记录下的每个历史资源的第二召回评分。
29.在本公开的又一个实施例中,所述展示模块,具体用于根据所述预测值对所述候选搜索词进行排序筛选;所述展示模块,具体还用于将筛选后的候选搜索词按照预设停留时长轮播展示。
30.在本公开实施方式的第五方面中,提供了一种预测模型训练装置,包括:计算模块,用于根据用户历史行为召回样本兴趣资源;所述历史行为针对多种历史资源;获取模块,用于根据所述样本兴趣资源确认样本搜索词;获取样本搜索词特征以及样本搜索词的操作标签;所述操作标签包括样本搜索词被点击或样本搜索词未被点击;训练模块,用于将用户历史行为对应的历史资源的资源特征以及样本搜索词特征作为输入,将所述样本搜索词的操作标签作为标签,训练得到预测模型。
31.在本公开的一个实施例中,所述训练模块,具体用于将用户历史行为对应的历史资源按照资源类型进行分类,得到各个类型下的基础特征,将各类历史资源下的基础特征分别进行拼接,得到各类历史资源的拼接特征;所述训练模块,具体还用于基于注意力机制,输入所述拼接特征,输出每类历史资源的序列特征;所述训练模块,具体还用于将所述序列特征进行拼接,得到用户历史行为特征;所述训练模块,具体还用于将所述用户历史行为特征以及所述样本搜索词特征进行拼接,得到多个第三合并特征;将各第三合并特征作为输入,将第三合并特征对应的样本搜索词的操作标签作为标签,训练得到预测模型。
32.在本公开的另一个实施例中,所述训练模块,还用于将各第三合并特征、用户属性特征以及历史环境特征进行拼接,得到第四合并特征;将各第四合并特征作为输入,将第四合并特征对应的样本搜索词的操作标签作为标签,训练得到预测模型。
33.在本公开的又一个实施例中,所述获取模块,具体用于提取所述样本兴趣资源的标题信息;所述获取模块,具体还用于将所述样本兴趣资源的标题信息作为样本搜索词;或者,所述获取模块,具体还用于将所述样本兴趣资源的标题信息对应的用户历史搜索词作
为样本搜索词;或者,所述获取模块,具体还用于将所述样本兴趣资源的标题信息输入策略模板,以将所述样本兴趣资源的标题信息与各类型下资源进行匹配,获得所述策略模板输出的所述样本兴趣资源对应的样本搜索词。
34.在本公开的又一个实施例中,所述历史行为包括历史操作记录以及实时操作记录;所述计算模块,具体用于根据用户历史操作记录,计算历史操作记录对应的历史资源的第三召回评分;根据所述第三召回评分,确定第一样本兴趣资源;所述计算模块,具体还用于根据用户实时操作记录,计算实时操作记录对应的历史资源的第四召回评分;根据所述第四召回评分,确定第二样本兴趣资源;所述计算模块,具体还用于将所述第一样本兴趣资源和所述第二样本兴趣资源按照资源类型进行分类;根据预先配置的各类型下资源间相似度,构建相似度矩阵;计算各类型下资源的召回评分与所述相似度矩阵的乘积结果,将各类型下资源的乘积结果排序靠前的预设数量个资源作为第三样本兴趣资源;所述计算模块,具体还用于将第一样本兴趣资源、第二样本兴趣资源以及第三样本兴趣资源作为样本兴趣资源。
35.在本公开的又一个实施例中,所述计算模块,具体用于针对历史操作记录,根据预设的资源类型的权重和操作类型的权重以及时间衰减系数,加权计算得到历史操作记录下的每个历史资源的第三召回评分。
36.在本公开的又一个实施例中,所述计算模块,具体用于针对实时操作记录,根据预设的资源类型的权重和操作类型的权重,加权计算得到实时操作记录下的每个历史资源的第四召回评分。
37.在本公开实施方式的第六方面中,提供了一种计算设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述计算设备执行如本公开实施方式的第一方面中任一项所述的搜索词生成方法。
38.根据本公开实施方式的通过预测候选搜索词会被用户点击的概率值,筛选概率值高的候选搜索词推荐给用户,从而推荐符合用户兴趣的搜索词,提升用户的使用体验。
附图说明
39.通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
40.图1示意性地示出了根据本公开实施方式的应用场景的示意图;
41.图2示意性地示出了本公开实施例提供的搜索词生成方法的流程示意图;
42.图3示意性地示出了本公开实施例提供的确定第三兴趣资源的示例图;
43.图4示意性地示出了本公开实施例提供的确认候选搜索词的示例图;
44.图5示意性地示出了本公开实施例提供的预测候选搜索词的示例图;
45.图6示意性地示出了本公开实施例提供的展示候选搜索词的流程示意图;
46.图7示意性地示出了本公开实施例提供的展示候选搜索词的示例图;
47.图8示意性地示出了本公开实施例提供的预测模型训练方法的流程示意图;
48.图9示意性地示出了本公开实施例提供的存储介质的结构示意图;
49.图10示意性地示出了本公开实施例提供的搜索词生成装置的结构示意图;
50.图11示意性地示出了本公开实施例提供的预测模型训练装置的结构示意图;
51.图12示意性地示出了本公开实施例提供的计算设备的结构示意图。
52.在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
53.下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
54.本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。本公开所涉及的数据可以为经用户授权或者经过各方充分授权的数据,对数据的采集、传播、使用等,均符合国家相关法律法规要求,本公开实施方式/实施例可以互相组合。
55.根据本公开的实施方式,提出了一种搜索词生成的方法、模型训练方法、介质、装置和设备。
56.在本文中,需要理解的是,所涉及的术语含义如下:
57.注意力机制:提取文本中的特征部分。
58.此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
59.下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。
60.发明概述
61.本发明人发现,在相关技术中,通常根据用户的历史记录,通过算法匹配到音乐资源并生成搜索词直接推荐给用户,或者将热点搜索词直接推荐给用户。该方法存在以下不足,生成搜索词未针对每个用户进行适配,不能符合每个用户的兴趣,同样的,热点搜索词是根据一段时间搜索频率高的搜索词得到的,但不能符合每个用户的兴趣。因此降低了用户对搜索词的使用率,影响用户的使用体验。
62.为了解决以上问题。本发明人通过预先建立的预测模型预测候选搜索词会被用户点击的概率值,筛选概率值高的候选搜索词推荐给用户,从而推荐符合用户兴趣的搜索词,提升用户的使用体验。
63.在介绍了本公开的基本原理之后,下面具体介绍本公开的各种非限制性实施方式。
64.应用场景总览
65.首先参考图1,图1为本公开实施方式提供的应用场景示意图。
66.如图1所示,当需要生成封面时,可参照图示流程。获取用户的历史行为,根据历史行为获取用户的兴趣资源,兴趣资源中包括用户操作过的和没操作过的音乐资源。根据兴趣资源,生成候选搜索词,并输入预测模型,输出候选搜索词的预测值,预测值越高,候选搜索词被用户点击的概率也越高。根据预测值对候选搜索词筛选,并推荐给用户。
67.示例性方法
68.下面结合图1的应用场景,参考图2-8来描述根据本公开示例性实施方式提供的搜索词生成方法。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
69.本公开的实施方式的执行主体可以为搜索词生成装置,该搜索词生成装置的实现有多种。例如,可以为程序软件,也可以为存储有相关计算机程序的介质,例如,u盘等;或者,该装置还可以为集成或安装有相关计算机程序的实体设备,例如,芯片、智能终端、电脑、服务器等。
70.参考图2,图2为本公开一实施例提供的搜索词生成方法的流程示意图。如图2所示,搜索词生成方法包括:
71.s201、根据用户历史行为召回兴趣资源;所述历史行为针对多种历史资源。
72.其中,兴趣资源包括以下任一种或组合:歌曲、歌手、专辑、歌单、视频以及播客等。可以理解,通过召回多种类型的兴趣资源而生成的搜索词,可以增加用户的选择范围。
73.s202、根据所述兴趣资源确认候选搜索词。
74.其中,得到的候选搜索词可能不符合用户的兴趣,因此暂时保留等待下一步筛选,而不是直接推荐给用户。
75.s203、将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值;其中,所述预测值表征预测模型预测的候选搜索词被用户点击的概率值。
76.其中,所述预测模型根据用户历史行为对应的历史资源的资源特征,学习用户选择点击搜索词的习惯,从而依据候选搜索词特征,预测候选搜索词符合用户兴趣的概率值,可以理解,通过预测模型,可以针对每个用户预测候选搜索词和用户兴趣的符合程度,从而为推荐搜索词提供了依据。
77.s204、根据所述各个所述候选搜索词对应的预测值,对所述候选搜索词进行筛选后推荐展示。
78.其中,筛选出预测值较高的候选搜索词推荐给用户,可以提高用户对搜索词的点击率。
79.在一个示例中,所述历史行为包括历史操作记录以及实时操作记录;s201包括:根据用户历史操作记录,计算历史操作记录对应的历史资源的第一召回评分;根据所述第一召回评分,确定第一兴趣资源;根据用户实时操作记录,计算实时操作记录对应的历史资源的第二召回评分;根据所述第二召回评分,确定第二兴趣资源;将所述第一兴趣资源和所述第二兴趣资源按照资源类型进行分类;根据预先配置的各类型下资源间相似度,构建相似度矩阵;计算各类型下资源的召回评分与所述相似度矩阵的乘积结果,将各类型下资源的乘积结果排序靠前的预设数量个资源作为第三兴趣资源;将第一兴趣资源、第二兴趣资源以及第三兴趣资源作为兴趣资源。
80.作为一种可选的实施方式,历史行为包括以下任一种或组合:播放、有效播放、红心、收藏、转发或评论。根据用户历史行为召回的第一兴趣资源和第二兴趣资源为用户操作过的资源。参考图3,图3为本公开一实施例提供的确定第三兴趣资源的示例图。构建各类型
下资源间的相似度矩阵,根据用户操作过的资源的召回评分和相似度矩阵,确定第三兴趣资源。以歌曲资源类型为例,相似度矩阵中交点部分为两个资源间的相似度,例如,歌曲a与歌曲c的相似度为0.4。计算歌曲a的召回评分和歌曲a与歌曲c的相似度的乘积,即80*0.4。再对每个用户没有操作过的资源对应的乘积分别求和,歌曲c包括两个乘积32和49,求和得到81为歌曲c的乘积结果。同理得到歌曲d的乘积结果为53,歌曲e的乘积结果为38,歌曲f的乘积结果为104,说明在用户没有操作过的歌曲中,歌曲f最符合用户的兴趣。其他资源类型的计算方法相同,将各类型下资源的乘积结果排序靠前的预设数量个资源作为第三兴趣资源。
81.举例来说,以歌曲资源为例,歌曲风格相似的歌曲、同一个歌手的不同歌曲或者歌曲节奏相似的歌曲之间的相似度较高,用户对某一首歌曲感兴趣,就会对与其相似的歌曲感兴趣。
82.基于以上实施方式,通过计算召回评分以及计算召回评分和资源间相似度的乘积结果的方式,可以准确召回用户操作过的兴趣资源和用户没有操作过的兴趣资源,从而丰富了搜索词的范围。
83.具体的,在一个示例中,根据用户历史操作记录,计算历史操作记录对应的历史资源的第一召回评分,包括:针对历史操作记录,根据预设的资源类型的权重和操作类型的权重以及时间衰减系数,加权计算得到历史操作记录下的每个历史资源的第一召回评分。
84.作为一种可选的实施方式,计算历史操作记录对应的历史资源的第一召回评分参考公式(1):
[0085][0086]
其中,resource_i代表任一资源,type为资源的类型,w
type
为资源类型的权重,action为对该资源的操作行为,w
action
为操作类型的权重,t为操作的时间戳,time为当前的时间戳,decay为时间衰减系数。
[0087]
举例来说,不同的操作行为代表用户对资源的兴趣程度,收藏行为说明用户在之后还会使用该资源,体现用户对资源的兴趣程度较高,因此设置一个较高的权重。有效播放说明用户完整播放了该资源,体现用户对资源的兴趣程度较高,因此设置一个较高的权重。随着时间的推移,用户的兴趣可能变化,越靠近当前时间的操作行为越能体现用户的兴趣,因此设置时间衰减系数来体现用户兴趣的变化。
[0088]
作为一个示例,将第一召回评分排序靠前的预设数量个历史资源作为第一兴趣资源。
[0089]
具体的,在另一个示例中,根据用户实时操作记录,计算实时操作记录对应的历史资源的第二召回评分,包括:针对实时操作记录,根据预设的资源类型的权重和操作类型的权重,加权计算得到实时操作记录下的每个历史资源的第二召回评分。
[0090]
作为一种可选的实施方式,计算实时操作记录对应的历史资源的第一召回评分参考公式(2):
[0091]
score(resource_i)=w
type
*∑
action

t
action*w
action
ꢀꢀꢀꢀꢀ
(2)
[0092]
其中,resource_i代表任一资源,type为资源的类型,w
type
为资源类型的权重,action为对该资源的操作行为,w
actuon
为操作类型的权重,t为操作的时间戳。
[0093]
举例来说,将接近当前时间的一段时间的用户操作记录作为实时操作记录,可以认为接近当前时间的一段时间内用户的兴趣不会发生变化,因此公式(2)不设置时间衰减系数。若这段时间用户没有操作记录,则不计算第二召回评分。
[0094]
作为一个示例,将第二召回评分排序靠前的预设数量个历史资源作为第二兴趣资源。
[0095]
需要说明的是,本公开不不限制公式(1)和公式(2)的具体形式,本公开不限制实时操作记录的时间范围。
[0096]
基于以上实施方式,通过设置不同资源类型的权重和操作类型的权重,可以准确计算召回评分,从而根据召回评分确定兴趣资源。通过时间衰减系数可以在计算召回评分过程引入用户兴趣变化这一因素,进一步提高计算召回评分的准确度。
[0097]
在另一个示例中,s202包括:提取所述兴趣资源的标题信息;将所述标题信息作为候选搜索词;或者,将所述标题信息对应的用户历史搜索词作为候选搜索词;或者,将所述标题信息输入策略模板,以将所述标题信息与各类型下资源进行匹配,获得所述策略模板输出的所述兴趣资源对应的候选搜索词。
[0098]
举例来说,以歌曲为例,可以直接将兴趣资源的歌曲名作为候选搜索词。以歌单为例,参考图4,图4为本公开一示例的确认候选搜索词的示例图,兴趣资源的歌单名为“一些触动内心的歌”,用户历史搜索“温暖的歌”时选择了该歌单,可以将“温暖的歌”作为该歌单的候选搜索词。以歌手为例,兴趣资源的歌手名为张三,将张三输入策略模板,与各类型下资源进行匹配,与歌曲资源匹配可以生成候选搜索词“张三又发新歌了”,与专辑资源匹配可以生成候选搜索词“张三又发新专辑了”。
[0099]
需要说明是,本公开不限制生成候选词的具体形式。
[0100]
基于以上实施方式,通过多种方式,可以生成丰富的候选搜索词。
[0101]
在又一个示例中,s203包括:将用户历史行为对应的历史资源按照资源类型进行分类,得到各个类型下的基础特征,将各类历史资源下的基础特征分别进行拼接,得到各类历史资源的拼接特征;基于注意力机制,输入所述拼接特征,输出每类历史资源的序列特征;将所述序列特征进行拼接,得到用户历史行为特征;将所述用户历史行为特征以及所述候选搜索词特征分别进行拼接,得到多个第一合并特征;将各第一合并特征输入预测模型,得到各候选搜索词的预测值。
[0102]
作为一种可选的实施方式,参考图5,图5为本公开一示例的预测候选搜索词的示例图。不同资源类型下的资源包括不同的基础特征,将同类型下的单个资源的所有基础特征拼接,得到单个资源的拼接特征,拼接特征代表单个资源的特征。基于注意力机制,输入将同资源类型下的所有拼接特征,输出该资源类型下资源的序列特征,序列特征代表单个资源类型的特征。将每个资源类型的序列特征拼接,得到用户历史行为特征,用户历史行为特征代表用户操作过的所有资源的整体特征。
[0103]
举例来说,不同资源类型下的资源包括不同的基础特征,歌曲资源的基础特征包括以下至少一种:歌曲编码、歌曲名称分词后词向量的平均值、歌曲近期点击的次数及人数、歌曲近期有效点击的次数及人数、歌曲近期收藏的次数及人数以及歌曲近期转发的次数及人数等。历史搜索词的基础特征包括以下至少一种:历史搜索词文本分词后的向量平均值,历史搜索词近期的的搜索次数及人数/点击资源次数及人数/点击率/有效播放资源
次数及人数/有效点击率。
[0104]
需要说明的是,本公开不限制基础特征的具体内容。
[0105]
基于以上实施方式,通过丰富的基础特征得到的第一合并特征进行预测,可以提高预测的准确度。
[0106]
优选的,在另一个示例中,搜索词生成方法还包括:将各第一合并特征、用户属性特征以及当前环境特征进行拼接,得到多个第二合并特征;将各第二合并特征输入预测模型,得到各候选搜索词的预测值。
[0107]
作为一种可选的实施方式,在第一合并特征的基础上,加入了用户属性特征以及当前环境特征。用户属性特征包括以下任一种或组合:用户的年龄、用户的性别、用户的省份以及用户的编号等。当前环境特征包括以下任一种或组合:当前的时间戳、当前的季节以及设备类型等。
[0108]
需要说明的是,本公开不限制第二合并特征包括的内容。
[0109]
基于以上实施方式,通过在第一合并特征的基础上,加入了用户属性特征以及当前环境特征,能够从更多维度对候选搜索词进行预测,从而提高预测值的准确度。
[0110]
在又一个示例中,s204包括:根据所述预测值对所述候选搜索词进行排序筛选;将筛选后的候选搜索词按照预设停留时长轮播展示。
[0111]
举例来说,参考图6,图6为本公开一示例的展示候选搜索词的示例图。筛选预测值排序前5的候选搜索词,按顺序分别为候选搜索词1、候选搜索词2、候选搜索词3、候选搜索词4以及候选搜索词5。预设停留时长为6秒,以6秒为间隔,按照顺序依次轮播或者随机展示候选搜索词。
[0112]
基于以上实施方式,通过轮播展示的根据预测值筛选获得的候选搜索词更加符合用户的兴趣,从而提升用户体验。
[0113]
作为一个示例,参考图7,图7为本公开一示例的展示候选搜索词的示例图。用户可以点击当前显示的候选搜索词,此时搜索框展开,显示所有的候选搜索词,用户可以在其中选择。
[0114]
基于以上实施方式,通过完整展示所有候选搜索词的方法,用户可以更快捷地从候选搜索词中进行选择,提升用户体验。
[0115]
参考图8,图8为本公开一实施例提供的预测模型训练方法的流程示意图。如图8所示,预测模型训练方法包括:
[0116]
s801、根据用户历史行为召回样本兴趣资源;所述历史行为针对多种历史资源。
[0117]
s802、根据所述样本兴趣资源确认样本搜索词;获取样本搜索词特征以及样本搜索词的操作标签;所述操作标签包括样本搜索词被点击或样本搜索词未被点击。
[0118]
s803、将用户历史行为对应的历史资源的资源特征以及样本搜索词特征作为输入,将所述样本搜索词的操作标签作为标签,训练得到预测模型。
[0119]
在一个示例中,历史行为包括历史操作记录以及实时操作记录;s801包括:根据用户历史操作记录,计算历史操作记录对应的历史资源的第三召回评分;根据所述第三召回评分,确定第一样本兴趣资源;根据用户实时操作记录,计算实时操作记录对应的历史资源的第四召回评分;根据所述第四召回评分,确定第二样本兴趣资源;将所述第一样本兴趣资源和所述第二样本兴趣资源按照资源类型进行分类;根据预先配置的各类型下资源间相似
度,构建相似度矩阵;计算各类型下资源的召回评分与所述相似度矩阵的乘积结果,将各类型下资源的乘积结果排序靠前的预设数量个资源作为第三样本兴趣资源;将第一样本兴趣资源、第二样本兴趣资源以及第三样本兴趣资源作为样本兴趣资源。
[0120]
具体的,在一个示例中,根据用户历史操作记录,计算历史操作记录对应的历史资源的第三召回评分,包括:针对历史操作记录,根据预设的资源类型的权重和操作类型的权重以及时间衰减系数,加权计算得到历史操作记录下的每个历史资源的第三召回评分。
[0121]
具体的,在另一个示例中,根据用户实时操作记录,计算实时操作记录对应的历史资源的第四召回评分,包括:针对实时操作记录,根据预设的资源类型的权重和操作类型的权重,加权计算得到实时操作记录下的每个历史资源的第四召回评分。
[0122]
在另一个示例中,s802包括:提取所述样本兴趣资源的标题信息;将所述样本兴趣资源的标题信息作为样本搜索词;或者,将所述样本兴趣资源的标题信息对应的用户历史搜索词作为样本搜索词;或者,将所述样本兴趣资源的标题信息输入策略模板,以将所述样本兴趣资源的标题信息与各类型下资源进行匹配,获得所述策略模板输出的所述样本兴趣资源对应的样本搜索词。
[0123]
在又一个示例中,s803包括:将用户历史行为对应的历史资源按照资源类型进行分类,得到各个类型下的基础特征,将各类历史资源下的基础特征分别进行拼接,得到各类历史资源的拼接特征;基于注意力机制,输入所述拼接特征,输出每类历史资源的序列特征;将所述序列特征进行拼接,得到用户历史行为特征;将所述用户历史行为特征以及所述样本搜索词特征进行拼接,得到多个第三合并特征;将各第三合并特征作为输入,将第三合并特征对应的样本搜索词的操作标签作为标签,训练得到预测模型。
[0124]
优选的,在另一个示例中,预测模型训练方法还包括:将各第三合并特征、用户属性特征以及历史环境特征进行拼接,得到第四合并特征;将各第四合并特征作为输入,将第四合并特征对应的样本搜索词的操作标签作为标签,训练得到预测模型。
[0125]
本实施例提供的搜索词生成方法,根据用户历史行为召回兴趣资源;所述历史行为针对多种历史资源;根据所述兴趣资源确认候选搜索词;将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值;其中,所述预测值表征预测模型预测的候选搜索词被用户点击的概率值;根据所述各个所述候选搜索词对应的预测值,对所述候选搜索词进行筛选后推荐展示。以上方法,通过预测模型预测候选搜索词会被用户点击的概率值,筛选概率值高的候选搜索词推荐给用户,从而推荐符合用户兴趣的搜索词,提升用户的使用体验。
[0126]
示例性介质
[0127]
在介绍了本公开示例性实施方式的方法之后,接下来,参考图9对本公开示例性实施方式的存储介质进行说明。
[0128]
参考图9所示,存储介质90中存储着根据本公开的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此。
[0129]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举
的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0130]
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。
[0131]
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备。
[0132]
示例性装置
[0133]
在介绍了本公开示例性实施方式的介质之后,接下来,参考图10对本公开示例性实施方式的搜索词生成装置进行说明,用于实现上述任一方法实施例中的方法,其实现原理和技术效果类似,在此不再赘述。
[0134]
参考图10,图10为本公开一实施例提供的搜索词生成装置的结构示意图。如图10所示,搜索词生成装置包括:
[0135]
召回模块101,用于根据用户历史行为召回兴趣资源;所述历史行为针对多种历史资源。
[0136]
生成模块102,用于根据所述兴趣资源确认候选搜索词。
[0137]
预测模块103,用于将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值;其中,所述预测值表征预测模型预测的候选搜索词被用户点击的概率值。
[0138]
展示模块104,用于根据所述各个所述候选搜索词对应的预测值,对所述候选搜索词进行筛选后推荐展示。
[0139]
在一个示例中,所述历史行为包括历史操作记录以及实时操作记录;召回模块101,具体用于根据用户历史操作记录,计算历史操作记录对应的历史资源的第一召回评分;根据所述第一召回评分,确定第一兴趣资源;召回模块101,具体还用于根据用户实时操作记录,计算实时操作记录对应的历史资源的第二召回评分;根据所述第二召回评分,确定第二兴趣资源;召回模块101,具体还用于将所述第一兴趣资源和所述第二兴趣资源按照资源类型进行分类;根据预先配置的各类型下资源间相似度,构建相似度矩阵;计算各类型下资源的召回评分与所述相似度矩阵的乘积结果,将各类型下资源的乘积结果排序靠前的预设数量个资源作为第三兴趣资源;召回模块101,具体还用于将第一兴趣资源、第二兴趣资源以及第三兴趣资源作为兴趣资源。
[0140]
具体的,在一个示例中,召回模块101,具体用于针对历史操作记录,根据预设的资源类型的权重和操作类型的权重以及时间衰减系数,加权计算得到历史操作记录下的每个历史资源的第一召回评分。
[0141]
具体的,在另一个示例中,召回模块101,具体用于针对实时操作记录,根据预设的
资源类型的权重和操作类型的权重,加权计算得到实时操作记录下的每个历史资源的第二召回评分。
[0142]
在另一个示例中,生成模块102,具体用于提取所述兴趣资源的标题信息;生成模块102,具体还用于将所述标题信息作为候选搜索词;或者,生成模块102,具体还用于将所述标题信息对应的用户历史搜索词作为候选搜索词;或者,生成模块102,具体还用于将所述标题信息输入策略模板,以将所述标题信息与各类型下资源进行匹配,获得所述策略模板输出的所述兴趣资源对应的候选搜索词。
[0143]
在又一个示例中,预测模块103,具体用于将用户历史行为对应的历史资源按照资源类型进行分类,得到各个类型下的基础特征,将各类历史资源下的基础特征分别进行拼接,得到各类历史资源的拼接特征;预测模块103,具体还用于基于注意力机制,输入所述拼接特征,输出每类历史资源的序列特征;预测模块103,具体还用于将所述序列特征进行拼接,得到用户历史行为特征;预测模块103,具体还用于将所述用户历史行为特征以及所述候选搜索词特征分别进行拼接,得到多个第一合并特征;将各第一合并特征输入预测模型,得到各候选搜索词的预测值。
[0144]
优选的,在另一个示例中,预测模块103,还用于将各第一合并特征、用户属性特征以及当前环境特征进行拼接,得到多个第二合并特征;将各第二合并特征输入预测模型,得到各候选搜索词的预测值。
[0145]
在又一个示例中,展示模块104,具体用于根据所述预测值对所述候选搜索词进行排序筛选;展示模块104,具体还用于将筛选后的候选搜索词按照预设停留时长轮播展示。
[0146]
参考图11,图11为本公开一实施例提供的预测模型训练装置的结构示意图。如图11所示,预测模型训练装置包括:
[0147]
计算模块111,用于根据用户历史行为召回样本兴趣资源;所述历史行为针对多种历史资源。
[0148]
获取模块112,用于根据所述样本兴趣资源确认样本搜索词;获取样本搜索词特征以及样本搜索词的操作标签;所述操作标签包括样本搜索词被点击或样本搜索词未被点击。
[0149]
训练模块113,用于将用户历史行为对应的历史资源的资源特征以及样本搜索词特征作为输入,将所述样本搜索词的操作标签作为标签,训练得到预测模型。
[0150]
在一个示例中,历史行为包括历史操作记录以及实时操作记录;计算模块111,具体用于根据用户历史操作记录,计算历史操作记录对应的历史资源的第三召回评分;根据所述第三召回评分,确定第一样本兴趣资源;计算模块111,具体还用于根据用户实时操作记录,计算实时操作记录对应的历史资源的第四召回评分;根据所述第四召回评分,确定第二样本兴趣资源;计算模块111,具体还用于将所述第一样本兴趣资源和所述第二样本兴趣资源按照资源类型进行分类;根据预先配置的各类型下资源间相似度,构建相似度矩阵;计算各类型下资源的召回评分与所述相似度矩阵的乘积结果,将各类型下资源的乘积结果排序靠前的预设数量个资源作为第三样本兴趣资源;计算模块111,具体还用于将第一样本兴趣资源、第二样本兴趣资源以及第三样本兴趣资源作为样本兴趣资源。
[0151]
具体的,在一个示例中,计算模块111,具体用于针对历史操作记录,根据预设的资源类型的权重和操作类型的权重以及时间衰减系数,加权计算得到历史操作记录下的每个
历史资源的第三召回评分。
[0152]
作为一个示例,将第三召回评分排序靠前的预设数量个历史资源作为第一样本兴趣资源。
[0153]
具体的,在另一个示例中,计算模块111,具体用于针对实时操作记录,根据预设的资源类型的权重和操作类型的权重,加权计算得到实时操作记录下的每个历史资源的第四召回评分。
[0154]
作为一个示例,将第四召回评分排序靠前的预设数量个历史资源作为第二兴趣资源。
[0155]
在另一个示例中,获取模块112,具体用于提取所述样本兴趣资源的标题信息;获取模块112,具体还用于将所述样本兴趣资源的标题信息作为样本搜索词;或者,获取模块112,具体还用于将所述样本兴趣资源的标题信息对应的用户历史搜索词作为样本搜索词;或者,获取模块112,具体还用于将所述样本兴趣资源的标题信息输入策略模板,以将所述样本兴趣资源的标题信息与各类型下资源进行匹配,获得所述策略模板输出的所述样本兴趣资源对应的样本搜索词。
[0156]
在又一个示例中,训练模块113,具体用于将用户历史行为对应的历史资源按照资源类型进行分类,得到各个类型下的基础特征,将各类历史资源下的基础特征分别进行拼接,得到各类历史资源的拼接特征;训练模块113,具体还用于基于注意力机制,输入所述拼接特征,输出每类历史资源的序列特征;训练模块113,具体还用于将所述序列特征进行拼接,得到用户历史行为特征;训练模块113,具体还用于将所述用户历史行为特征以及所述样本搜索词特征进行拼接,得到多个第三合并特征;将各第三合并特征作为输入,将第三合并特征对应的样本搜索词的操作标签作为标签,训练得到预测模型。
[0157]
优选的,在另一个示例中,训练模块113,还用于将各第三合并特征、用户属性特征以及历史环境特征进行拼接,得到第四合并特征;将各第四合并特征作为输入,将第四合并特征对应的样本搜索词的操作标签作为标签,训练得到预测模型。
[0158]
本实施例提供的搜索词生成装置,召回模块,用于根据用户历史行为召回兴趣资源;所述历史行为针对多种历史资源;生成模块,用于根据所述兴趣资源确认候选搜索词;预测模块,用于将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值;其中,所述预测值表征预测模型预测的候选搜索词被用户点击的概率值;展示模块,用于根据所述各个所述候选搜索词对应的预测值,对所述候选搜索词进行筛选后推荐展示。以上方法,通过预测模型预测候选搜索词会被用户点击的概率值,筛选概率值高的候选搜索词推荐给用户,从而推荐符合用户兴趣的搜索词,提升用户的使用体验。
[0159]
示例性计算设备
[0160]
在介绍了本公开示例性实施方式的方法、介质和装置之后,接下来,参考图12对本公开示例性实施方式的计算设备进行说明。
[0161]
图12显示的计算设备120仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0162]
如图12所示,计算设备120以通用计算设备的形式表现。计算设备120的组件可以包括但不限于:上述至少一个处理单元1201、上述至少一个存储单元1202,连接不同系统组
件(包括处理单元1201和存储单元1202)的总线1203。
[0163]
总线1203包括数据总线、控制总线和地址总线。
[0164]
存储单元1202可以包括易失性存储器形式的可读介质,例如随机存取存储器(ram)12021和/或高速缓存存储器12022,可以进一步包括非易失性存储器形式的可读介质,例如只读存储器(rom)12023。
[0165]
存储单元1202还可以包括具有一组(至少一个)程序模块12024的程序/实用工具12025,这样的程序模块12024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0166]
计算设备120也可以与一个或多个外部设备1204(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(i/o)接口1205进行。并且,计算设备120还可以通过网络适配器1206与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图12所示,网络适配器1206通过总线1203与计算设备120的其它模块通信。应当理解,尽管图中未示出,可以结合计算设备120使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0167]
应当注意,尽管在上文详细描述中提及了搜索词生成装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
[0168]
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
[0169]
虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1