标签生成方法、装置、电子设备、可读介质和产品与流程

文档序号：37551003发布日期：2024-04-08 14:00阅读：11来源：国知局

本公开的实施例涉及计算机，具体涉及标签生成方法、装置、电子设备、可读介质和产品。

背景技术：

1、随着计算机相关技术的发展，为了进一步提高针对用户的服务水平，在物品推荐领域，已经向着推荐精细化的方向转变。其中，用户标签刻画了用户的基本属性和偏好，因此，生成精准的用户标签是提高物品推荐精准度的关键。目前，在进行用户标签生成时，通常采用的方式为：采用统计规则的方法，确定用户对应的用户标签。

2、然而，发明人发现，当采用上述方式时，经常会存在如下技术问题：

3、统计规则的设定受人为因素影响较大，同时过于复杂的统计规则，会导致泛化能力减弱，从而影响用户标签的生成。

4、该背景技术部分中所公开的以上信息仅用于增强对本发明构思的背景的理解，并因此，其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。

技术实现思路

1、本公开的内容部分用于以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。

2、本公开的一些实施例提出了标签生成方法、装置、电子设备、可读介质和产品，来解决以上背景技术部分提到的技术问题中的一项或多项。

3、第一方面，本公开的一些实施例提供了一种标签生成方法，该方法包括：获取目标用户的用户行为关联信息、用户长期兴趣特征、用户短期兴趣特征和目标物品标签序列，其中，目标物品标签是上述目标用户在目标时间段内浏览过的物品对应的标签；对上述目标物品标签序列中的目标物品标签进行向量化处理，以生成融合后物品标签向量；基于上述用户行为关联信息、上述用户长期兴趣特征、上述用户短期兴趣特征、上述融合后物品标签向量和预先训练的用户特征向量生成模型，生成目标用户特征向量；确定上述目标用户特征向量和候选用户标签向量集合中的每个候选用户标签向量的向量相似度；确定上述目标用户对应的目标用户标签集合，其中，目标用户标签是对应的向量相似度满足筛选条件的候选用户标签向量对应的用户标签。

4、可选地，上述对上述目标物品标签序列中的目标物品标签进行向量化处理，以生成融合后物品标签向量，包括：对上述目标物品标签序列中的每个目标物品标签进行向量映射，以生成目标物品标签向量，得到目标物品标签向量集合；对上述目标物品标签向量集合中的目标物品标签向量进行向量均值化处理，以生成上述融合后物品标签向量。

5、可选地，上述对上述目标物品标签序列中的每个目标物品标签进行向量映射，以生成目标物品标签向量，包括：响应于确定上述目标物品标签的标签长度小于预设标签长度，通过预设掩码值对上述目标物品标签进行长度补齐，以生成补齐后的物品标签；对上述补齐后的物品标签进行词嵌入处理，以生成上述目标物品标签对应的目标物品标签向量。

6、可选地，上述基于上述用户行为关联信息、上述用户长期兴趣特征、上述用户短期兴趣特征、上述融合后物品标签向量和预先训练的用户特征向量生成模型，生成目标用户特征向量，包括：对上述用户行为关联信息、上述用户长期兴趣特征、上述用户短期兴趣特征和上述融合后物品标签向量进行特征拼接，以生成拼接后特征；将上述拼接后特征输入上述用户特征向量生成模型，以生成上述目标用户特征向量。

7、可选地，上述候选用户标签向量集合通过以下步骤生成：根据预先构建的用户标签筛选条件，从用户标签向量库中筛选出用户标签向量，作为候选用户标签向量，得到上述候选用户标签向量集合。

8、可选地，上述用户标签筛选条件包括：至少一个用户标签筛选子条件；以及上述根据预先构建的用户标签筛选条件，从用户标签向量库中筛选出用户标签向量，作为候选用户标签向量，得到上述候选用户标签向量集合，包括：对于上述至少一个用户标签筛选子条件中的每个用户标签筛选子条件，从上述用户标签向量库中筛选出满足上述用户标签筛选子条件的用户标签向量，得到用户标签向量组；根据得到的用户标签向量组集合和上述用户标签向量组集合中的用户标签向量组对应的融合比例，确定上述候选用户标签向量集合。

9、可选地，上述用户标签向量库中的用户标签向量通过以下步骤生成：确定待向量生成的物品标签，作为候选物品标签；对上述候选物品标签对应的物品标签标识信息进行向量映射，以生成物品标签标识向量；将上述物品标签标识向量输入预先训练的多头注意力机制模型，以生成权重调整后的物品标签标识向量；基于上述物品标签标识向量和上述权重调整后的物品标签标识向量，生成融合后的物品标签标识向量；将上述物品标签标识向量、融合后的物品标签标识向量和上述候选物品标签对应的物品标签关联信息进行特征拼接，以生成拼接后物品标签特征；将上述拼接后物品标签特征输入预先训练的物品标签特征向量生成模型，以生成物品标签特征向量，作为用户标签向量。

10、可选地，上述基于上述物品标签标识向量和上述权重调整后的物品标签标识向量，生成融合后的物品标签标识向量，包括：对上述物品标签标识向量和上述权重调整后的物品标签标识向量进行向量叠加，以生成叠加后的物品标签标识向量；对上述叠加后的物品标签标识向量进行归一化处理，以生成上述融合后的物品标签标识向量。

11、第二方面，本公开的一些实施例提供了一种标签生成装置，装置包括：获取单元，被配置成获取目标用户的用户行为关联信息、用户长期兴趣特征、用户短期兴趣特征和目标物品标签序列，其中，目标物品标签是上述目标用户在目标时间段内浏览过的物品对应的标签；向量化处理单元，被配置成对上述目标物品标签序列中的目标物品标签进行向量化处理，以生成融合后物品标签向量；生成单元，被配置成基于上述用户行为关联信息、上述用户长期兴趣特征、上述用户短期兴趣特征、上述融合后物品标签向量和预先训练的用户特征向量生成模型，生成目标用户特征向量；第一确定单元，被配置成确定上述目标用户特征向量和候选用户标签向量集合中的每个候选用户标签向量的向量相似度；第二确定单元，被配置成确定上述目标用户对应的目标用户标签集合，其中，目标用户标签是对应的向量相似度满足筛选条件的候选用户标签向量对应的用户标签。

12、可选地，上述向量化处理单元被进一步配置成：对上述目标物品标签序列中的每个目标物品标签进行向量映射，以生成目标物品标签向量，得到目标物品标签向量集合；对上述目标物品标签向量集合中的目标物品标签向量进行向量均值化处理，以生成上述融合后物品标签向量。

13、可选地，上述向量化处理单元被进一步配置成：响应于确定上述目标物品标签的标签长度小于预设标签长度，通过预设掩码值对上述目标物品标签进行长度补齐，以生成补齐后的物品标签；对上述补齐后的物品标签进行词嵌入处理，以生成上述目标物品标签对应的目标物品标签向量。

14、可选地，上述生成单元被进一步配置成：对上述用户行为关联信息、上述用户长期兴趣特征、上述用户短期兴趣特征和上述融合后物品标签向量进行特征拼接，以生成拼接后特征；将上述拼接后特征输入上述用户特征向量生成模型，以生成上述目标用户特征向量。

15、可选地，上述候选用户标签向量集合通过以下步骤生成：根据预先构建的用户标签筛选条件，从用户标签向量库中筛选出用户标签向量，作为候选用户标签向量，得到上述候选用户标签向量集合。

16、可选地，上述用户标签筛选条件包括：至少一个用户标签筛选子条件；以及上述根据预先构建的用户标签筛选条件，从用户标签向量库中筛选出用户标签向量，作为候选用户标签向量，得到上述候选用户标签向量集合，包括：对于上述至少一个用户标签筛选子条件中的每个用户标签筛选子条件，从上述用户标签向量库中筛选出满足上述用户标签筛选子条件的用户标签向量，得到用户标签向量组；根据得到的用户标签向量组集合和上述用户标签向量组集合中的用户标签向量组对应的融合比例，确定上述候选用户标签向量集合。

17、可选地，上述用户标签向量库中的用户标签向量通过以下步骤生成：确定待向量生成的物品标签，作为候选物品标签；对上述候选物品标签对应的物品标签标识信息进行向量映射，以生成物品标签标识向量；将上述物品标签标识向量输入预先训练的多头注意力机制模型，以生成权重调整后的物品标签标识向量；基于上述物品标签标识向量和上述权重调整后的物品标签标识向量，生成融合后的物品标签标识向量；将上述物品标签标识向量、融合后的物品标签标识向量和上述候选物品标签对应的物品标签关联信息进行特征拼接，以生成拼接后物品标签特征；将上述拼接后物品标签特征输入预先训练的物品标签特征向量生成模型，以生成物品标签特征向量，作为用户标签向量。

18、可选地，上述基于上述物品标签标识向量和上述权重调整后的物品标签标识向量，生成融合后的物品标签标识向量，包括：对上述物品标签标识向量和上述权重调整后的物品标签标识向量进行向量叠加，以生成叠加后的物品标签标识向量；对上述叠加后的物品标签标识向量进行归一化处理，以生成上述融合后的物品标签标识向量。

19、第三方面，本公开的一些实施例提供了一种电子设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。

20、第四方面，本公开的一些实施例提供了一种计算机可读介质，其上存储有计算机程序，其中，程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。

21、第五方面，本公开的一些实施例提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现上述第一方面任一实现方式所描述的方法。

22、本公开的上述各个实施例具有如下有益效果：通过本公开的一些实施例的标签生成方法，达到了精准地生成用户的用户标签的目的。具体来说，造成生成的用户标签不够精准的原因在于：采用统计规则的方法，确定用户对应的用户标签。由于统计规则的设定受人为因素影响较大，同时过于复杂的统计规则，会导致泛化能力减弱，从而影响用户标签的生成。基于此，本公开的一些实施例的标签生成方法，首先，获取目标用户的用户行为关联信息、用户长期兴趣特征、用户短期兴趣特征和目标物品标签序列，其中，目标物品标签是上述目标用户在目标时间段内浏览过的物品对应的标签。实际情况中，用户的用户行为和物品浏览习惯能够较为直观地反映用户的真实喜好。因此，获取用户行为关联信息、用户长期兴趣特征、用户短期兴趣特征和目标物品标签序列能够有助于生成目标用户的用户标签。接着，对上述目标物品标签序列中的目标物品标签进行向量化处理，以生成融合后物品标签向量。进一步，基于上述用户行为关联信息、上述用户长期兴趣特征、上述用户短期兴趣特征、上述融合后物品标签向量和预先训练的用户特征向量生成模型，生成目标用户特征向量。通过用户特征向量生成模型，实现了对用户行为和物品浏览习惯的特征的提取。除此之外，确定上述目标用户特征向量和候选用户标签向量集合中的每个候选用户标签向量的向量相似度。通过计算相似度的方式，以此确定用户的行为喜好与用户标签之前的关联程度。最后，确定上述目标用户对应的目标用户标签集合，其中，目标用户标签是对应的向量相似度满足筛选条件的候选用户标签向量对应的用户标签。由此，筛选出目标用户对应的多个用户标签。通过此种方式无需设置复杂的统计规则，减少了人为设定的统计规则对于用户标签生成的影响，同时，也大大提高了泛化能力。最终，达到了精准地生成用户的用户标签的目的。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李欢乐,张学文,王有文,王熙,李勇,陶通,包勇军,颜伟鹏
技术所有人：北京沃东天骏信息技术有限公司
我是此专利的发明人

上一篇：一类含环外双键、多取代甲基醚结构的化合物及其应用
上一篇：洗衣机脱水方法和相关装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。