本技术涉及计算机,特别涉及一种物品的推荐方法、装置、电子设备及计算机存储介质。
背景技术:
1、个性化推荐在移动互联网时代已经成为人们生活中的一部分,其中个性化推荐在推荐系统中起着至关重要的作用,一直是推荐系统领域研究的热点。
2、在现有推荐系统中,对用户进行个性化推荐首先进行特征工程生产特征,然后将特征输送为模型进行训练并推荐。
3、目前,特征工程选取特征并对特征进行转化,需要大量的人工经验以及时间去优化,如果没有找到有效的强特征或者转化方式,推荐时很难达到理想的结果。而且用户的喜好是多样性的,在浏览时会对不同类型的物品感兴趣。用户过去的行为只有部分对当前的物品是强相关的,而其它的行为是弱相关甚至无关的,即用户对当前的物品是否点击依赖于由历史行为中的局部,而不是全部。
4、因此,再利用以往的用户和商品的特征工程经验,不仅花费大量的时间,还可能达不到理想的效果。
技术实现思路
1、有鉴于此,本技术提供一种物品的推荐方法、装置、电子设备及计算机存储介质,不仅缩减了特征工程繁琐复杂的开发工作量,关注用户的多样性喜好,同时还提高了用户体验和个性化推荐目标的收益。
2、本技术第一方面提供了一种物品的推荐方法,包括:
3、接收用户的用户信息;
4、根据用户的用户信息获取用户在业务上的用户行为日志;
5、将用户行为日志输入至融合推荐模型中,输出得到物品推荐结果;其中,所述融合推荐模型由训练样本用户的融合向量进行训练得到的;所述训练样本用户的融合向量为根据训练样本用户的历史画像、物品画像和训练样本用户上下文行为画像进行构建得到。
6、可选的,所述融合推荐模型的构建方法,包括:
7、获取训练样本用户的历史画像、物品画像和训练样本用户上下文行为画像;
8、对训练样本用户的历史画像、物品画像和训练样本用户上下文行为画像进行预处理,得到原始特征数据;
9、根据所述原始特征数据构建得到用户行为序列;
10、利用深度学习的embedding技术,将物品和用户行为序列中的物品全部转化为对应的特征向量,并假设向量的维数为k维,得到物品的向量和用户行为序列中物品对应的向量;
11、根据物品的向量和用户行为序列中物品对应的向量,运用多种注意力机制对物品的向量和用户行为序列中物品对应的向量进行处理,生成用户行为序列多样性喜好向量;
12、将用户行为序列多样性喜好向量利用横向纵向注意力机制和纵向注意力机制进行处理,并连接目标物品向量,得到训练样本用户的融合向量;
13、将训练样本用户的融合向量输入至深度网络层进行训练,生成融合推荐模型。
14、可选的,所述获取训练样本用户的历史画像、物品画像和训练样本用户上下文行为画像,包括:
15、根据业务上的用户的历史行为日志,清洗计算出用户的历史画像和用户上下文行为画像,作为训练样本用户的历史画像和训练样本用户上下文行为画像;
16、根据物品的数据源生成物品画像。
17、可选的,所述对训练样本用户的历史画像、物品画像和训练样本用户上下文行为画像进行预处理,得到原始特征数据,包括:
18、对物品画像统一数据格式,并对属性为空的字段填充固定字段代表空,得到第一原始特征;
19、针对所述训练样本用户的历史画像,将训练样本用户在物品类别和属性的点击行为进行格式化,并过滤掉没有点击行为的用户,得到第二原始特征;
20、针对所述训练样本用户上下文行为画像,将训练样本用户上下文行为画像中的数据按照日期进行筛选,得到第三原始特征。
21、可选的,所述根据所述原始特征数据构建得到用户行为序列,包括:
22、对训练样本用户上下文行为画像中的近n日的行为进行筛选,得到所述训练样本用户的行为集合;其中,所述n为正整数;
23、将所述训练样本用户的行为集合中的点击行为标识按照时间排列,生成行为标识序列;
24、保留距离所述训练样本用户当前行为最近的m个行为标识以及行为标识对应的属性得到用户行为序列;其中,所述m为正整数。
25、可选的,所述根据物品的向量和用户行为序列中物品对应的向量,运用多种注意力机制对物品的向量和用户行为序列中物品对应的向量进行处理,生成用户行为序列多样性喜好向量,包括:
26、利用余弦相似度注意力机制学习用户行为序列中物品对目标物品的第一权重;
27、利用改进的transformer模型的self-attention的注意力机制学习用户行为序列中物品对目标物品的第二权重;
28、利用连接用户行为序列和目标物品的注意力机制学习用户行为序列中物品对目标物品的第三权重;
29、根据所述第一权重、第二权重、第三权重以及用户行为序列中物品对应的向量,生成用户行为序列多样性喜好向量。
30、可选的,所述将用户行为序列多样性喜好向量利用横向纵向注意力机制和纵向注意力机制进行处理,并连接目标物品向量,得到训练样本用户的融合向量,包括:
31、将用户行为序列多样性喜好向量利用横向注意力机制进行加权,得到第一目标向量;
32、将第一目标向量利用纵向注意力机制进行加权,得到第二目标向量;
33、将所述第二目标向量与目标物品向量进行连接,得到训练样本用户的融合向量。
34、本技术第二方面提供了一种物品的推荐装置,包括:
35、接收单元,用于接收用户的用户信息;
36、第一获取单元,用于根据用户的用户信息获取用户在业务上的用户行为日志;
37、第一输入单元,用于将用户行为日志输入至融合推荐模型中,输出得到物品推荐结果;其中,所述融合推荐模型由训练样本用户的融合向量进行训练得到的;所述训练样本用户的融合向量为根据训练样本用户的历史画像、物品画像和训练样本用户上下文行为画像进行构建得到。
38、可选的,所述融合推荐模型的构建单元,包括:
39、第二获取单元,用于获取训练样本用户的历史画像、物品画像和训练样本用户上下文行为画像;
40、预处理单元,用于对训练样本用户的历史画像、物品画像和训练样本用户上下文行为画像进行预处理,得到原始特征数据;
41、用户行为序列构建单元,用于根据所述原始特征数据构建得到用户行为序列;
42、向量转化单元,用于利用深度学习的embedding技术,将物品和用户行为序列中的物品全部转化为对应的特征向量,并假设向量的维数为k维,得到物品的向量和用户行为序列中物品对应的向量;
43、第一生成单元,用于根据物品的向量和用户行为序列中物品对应的向量,运用多种注意力机制对物品的向量和用户行为序列中物品对应的向量进行处理,生成用户行为序列多样性喜好向量;
44、融合单元,用于将用户行为序列多样性喜好向量利用横向纵向注意力机制和纵向注意力机制进行处理,并连接目标物品向量,得到训练样本用户的融合向量;
45、第二输入单元,用于将训练样本用户的融合向量输入至深度网络层进行训练,生成融合推荐模型。
46、可选的,所述第二获取单元,包括:
47、清洗单元,用于根据业务上的用户的历史行为日志,清洗计算出用户的历史画像和用户上下文行为画像,作为训练样本用户的历史画像和训练样本用户上下文行为画像;
48、第二生成单元,用于根据物品的数据源生成物品画像。
49、可选的,所述预处理单元,包括:
50、第一预处理子单元,用于对物品画像统一数据格式,并对属性为空的字段填充固定字段代表空,得到第一原始特征;
51、第二预处理子单元,用于针对所述训练样本用户的历史画像,将训练样本用户在物品类别和属性的点击行为进行格式化,并过滤掉没有点击行为的用户,得到第二原始特征;
52、第三预处理子单元,用于针对所述训练样本用户上下文行为画像,将训练样本用户上下文行为画像中的数据按照日期进行筛选,得到第三原始特征。
53、可选的,所述用户行为序列构建单元,包括:
54、筛选单元,用于对训练样本用户上下文行为画像中的近n日的行为进行筛选,得到所述训练样本用户的行为集合;其中,所述n为正整数;
55、排列单元,用于将所述训练样本用户的行为集合中的点击行为标识按照时间排列,生成行为标识序列;
56、保留单元,用于保留距离所述训练样本用户当前行为最近的m个行为标识以及行为标识对应的属性得到用户行为序列;其中,所述m为正整数。
57、可选的,所述第一生成单元,包括:
58、第一权重生成单元,用于利用余弦相似度注意力机制学习用户行为序列中物品对目标物品的第一权重;
59、第二权重生成单元,用于利用改进的transformer模型的self-attention的注意力机制学习用户行为序列中物品对目标物品的第二权重;
60、第三权重生成单元,用于利用连接用户行为序列和目标物品的注意力机制学习用户行为序列中物品对目标物品的第三权重;
61、喜好向量生成单元,用于根据所述第一权重、第二权重、第三权重以及用户行为序列中物品对应的向量,生成用户行为序列多样性喜好向量。
62、可选的,所述融合单元,包括:
63、第一加权单元,用于将用户行为序列多样性喜好向量利用横向注意力机制进行加权,得到第一目标向量;
64、第二加权单元,用于将第一目标向量利用纵向注意力机制进行加权,得到第二目标向量;
65、连接单元,用于将所述第二目标向量与目标物品向量进行连接,得到训练样本用户的融合向量。
66、本技术第三方面提供了一种电子设备,包括:
67、一个或多个处理器;
68、存储装置,其上存储有一个或多个程序;
69、当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如第一方面任意一项所述的物品的推荐方法。
70、本技术第四方面提供了一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如第一方面任意一项所述的物品的推荐方法。
71、由以上方案可知,本技术提供一种物品的推荐方法、装置、电子设备及计算机存储介质,所述物品的推荐方法包括:接收用户的用户信息后,根据用户的用户信息获取用户在业务上的用户行为日志;将用户行为日志输入至融合推荐模型中,输出得到物品推荐结果;其中,所述融合推荐模型由训练样本用户的融合向量进行训练得到的;所述训练样本用户的融合向量为通过用户画像和上下文画像筛选最近的行为序列特征,然后利用多种注意力机制生成用户行为序列多样性喜好向量,并进行横向和纵向注意力机制对特征向量进行不同角度的加权以关注用户不同阶段的多种喜好,与目标物品向量连接后输入深度网络层,进行模型的训练。本技术不仅缩减了特征工程繁琐复杂的开发工作量,关注用户的多样性喜好,同时还提高了用户体验和个性化推荐目标的收益。