物品信息推荐方法、装置和电子设备与流程

文档序号:32308948发布日期:2022-11-23 10:55阅读:49来源:国知局
物品信息推荐方法、装置和电子设备与流程

1.本公开涉及信息处理技术领域,尤其涉及一种物品信息推荐方法、装置和电子设备。


背景技术:

2.商品推荐在电商平台的应用十分广泛。商品推荐通常分为两个阶段,召回阶段根据用户特征和商品特征,从海量商品库里快速找回用户潜在感兴趣的物品;排序阶段融入更多特征,使用复杂模型,输出排序靠前的个性化推荐。
3.现有推荐模型通过增加学习目标缓解样本稀疏问题,提升模型性能。但由于多个学习目标之间相关性弱和权重分配不均的问题,经常出现负迁移现象,即部分学习目标能力上升的同时其他学习目标能力下降。
4.因此,解决推荐模型在模型训练中出现负迁移现象,进而利用模型实现更加精准的推荐是当前亟待解决的问题。


技术实现要素:

5.本公开提供一种物品信息推荐方法,用以解决现有技术中推荐模型的上下文语义理解能力较差以及模型训练中出现负迁移的缺陷,实现利用模型实现更加精准的推荐。
6.本公开提供一种物品信息推荐方法,包括:
7.获取多个待推荐物品信息;
8.将用户信息和多个所述待推荐物品信息输入多目标推荐模型,输出每个所述待推荐物品信息对应的多个目标任务的推荐分数;
9.根据所述多个目标任务的推荐分数,确定目标推荐物品信息;
10.其中,所述多目标推荐模型是根据初始多目标推荐模型的多目标联合损失值对所述初始多目标推荐模型进行优化得到,所述多目标联合损失值是根据多个目标任务损失值计算得到。
11.根据本公开提供的一种物品信息推荐方法,所述初始多目标推荐模型包括第一神经网络;
12.所述根据初始多目标推荐模型的多目标联合损失值对所述初始多目标推荐模型进行优化的步骤,包括:
13.在所述多目标联合损失值未达到预设阈值的情况下,根据预设更新率调整所述第一神经网络的参数,并继续执行得到多目标联合损失值的步骤;
14.在所述多目标联合损失值达到预设阈值的情况下,确定所述初始多目标推荐模型为所述多目标推荐模型。
15.根据本公开提供的一种物品信息推荐方法,所述多目标联合损失值是通过如下步骤得到,包括:
16.构建样本数据集,所述样本数据集的样本数据具有原始标签,所述样本数据包括
用户点击信息、用户查询信息、用户特征信息、物品特征信息和交互特征信息;
17.根据所述用户点击信息、所述用户查询信息、所述用户特征信息、所述物品特征信息和所述交互特征信息生成综合特征向量;
18.将所述综合特征向量输入所述第一神经网络,输出目标任务标签;
19.根据所述原始标签和所述目标任务标签,计算多个目标任务损失值;
20.根据所述多个目标任务损失值,计算多目标联合损失值。
21.根据本公开提供的一种物品信息推荐方法,所述构建样本数据集的步骤,包括:
22.获取满足预设条件的正样本数据,并根据第一预设条件设置所述正样本数据的原始标签,所述正样本数据包括用户点击信息、用户查询信息、用户特征信息、第一物品特征信息、第一交互特征信息;
23.根据所述正样本数据确定负样本数据,并根据所述第二预设条件设置所述负样本数据的原始标签,所述负样本数据包括所述用户点击信息、用户查询信息、用户特征信息、第二物品特征信息、第二交互特征信息;
24.根据所述正样本数据和所述负样本数据生成所述样本数据集。
25.根据本公开提供的一种物品信息推荐方法,所述负样本数据包括常规负样本数据和难负样本数据;
26.所述根据所述正样本数据确定满足第二预设条件的负样本数据,并根据所述第二预设条件设置所述负样本数据的原始标签的步骤,包括:
27.根据所述第一物品特征信息确定第一物品种类;
28.确定与所述第一物品种类一致的物品对应的常规样本第二物品特征信息和常规样本第二交互特征信息;
29.根据所述用户点击信息、所述用户查询信息、所述用户特征信息、所述常规样本第二物品信息和所述常规样本第二交互特征信息生成常规负样本数据和对应的多个;
30.根据所述第一物品特征信息的第一物品标题信息,确定与所述第一物品标题信息文字相似度达到预设阈值范围的难样本第二物品标题信息,根据所述难样本第二物品标题信息确定对应的难样本第二物品特征信息和难样本第二交互特征信息;
31.根据所述用户点击信息、所述用户查询数据、所述用户特征信息、所述难样本第二物品特征数据和所述难样本第二交互特征信息生成难负样本数据。
32.根据本公开提供的一种物品信息推荐方法,所述根据所述用户点击信息、所述用户查询信息、所述用户特征信息、所述物品特征信息和所述交互特征信息生成综合特征向量的步骤,包括:
33.对所述用户点击信息、所述用户特征信息、所述物品特征信息和所述交互特征信息进行预处理,分别得到用户点击序列特征向量、用户特征向量、物品特征向量和交互特征向量;
34.将所述用户查询信息输入预训练语言模型,输出对话特征向量;
35.拼接所述用户点击序列特征向量、用户特征向量、物品特征向量和交互特征向量和所述对话特征向量,得到综合特征向量。
36.根据本公开提供的一种物品信息推荐方法,所述预训练语言模型是通过如下步骤获得,包括:
37.对获取的会话信息进行预处理,根据预处理后的会话信息生成预训练数据集;
38.将所述处理后的预训练数据集输入初始语言模型,输出预测语义向量,并根据所述预测语义向量和所述会话信息计算语言损失值;
39.在所述语言损失值未达到预设阈值的情况下,根据所述语言损失值调整所述初始语言模型的参数,并返回重新执行所述对获取的会话信息进行预处理,根据预处理后的会话信息生成预训练数据集的步骤;
40.在所述初始语言损失值达到预设阈值的情况下,确定所述初始语言模型为所述预训练语言模型。
41.本公开还提供一种物品信息推荐装置,包括:
42.获取单元,用于获取多个待推荐物品信息;
43.评分单元,用于将用户信息和多个所述待推荐物品信息输入多目标推荐模型,输出每个所述待推荐物品信息对应的多个目标任务的推荐分数;
44.确定单元,用于根据所述多个目标任务的推荐分数,确定目标推荐物品信息;
45.其中,所述多目标推荐模型是根据初始多目标推荐模型的多目标联合损失值对所述初始多目标推荐模型进行优化得到,所述多目标联合损失值是根据多个目标任务损失值计算得到。
46.本公开还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述物品信息推荐方法的步骤。
47.本公开还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述物品信息推荐方法的步骤。
48.本公开还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述物品信息推荐方法的步骤。
49.本公开提供的物品信息推荐方法、装置和电子设备,通过初始多目标推荐模型的多目标联合损失值对初始多目标推荐模型进行优化,得到多目标推荐模型。通过多目标联合损失值表示多目标推荐模型执行多个目标任务的综合能力,根据多目标联合损失值对初始多目标推荐模型进行优化,解决了多目标推荐模型出现负迁移的现象。通过获取多个待推荐物品信息;将用户信息和多个待推荐物品信息输入多目标推荐模型,输出每个待推荐物品信息对应的多个目标任务的推荐分数;根据多个目标任务的推荐分数,确定目标推荐物品,利用多目标推荐模型实现更加精准的推荐。
附图说明
50.为了更清楚地说明本公开或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
51.图1是现有技术中商品推荐多个特征的示意图;
52.图2是现有技术中对话场景中物品推荐示例图;
53.图3是本公开提供的物品信息推荐方法的流程示意图;
54.图4是本公开提供的对初始多目标推荐模型进行优化的流程示意图;
55.图5是本公开提供的计算多目标联合损失值的流程示意图;
56.图6是本公开提供的物品信息推荐的示意图;
57.图7是本公开提供的获得预训练语言模型的流程示意图;
58.图8是本公开提供的预处理后的会话信息的示意图;
59.图9是本公开提供的初始语言模型的训练示意图;
60.图10是本公开提供的物品信息推荐装置的结构示意图;
61.图11是本公开提供的电子设备的结构示意图。
具体实施方式
62.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开实施例一部分实施例,而不是全部的实施例。基于本公开实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开实施例保护的范围。
63.商品推荐在电商平台的应用十分广泛。商品推荐通常分为两个阶段,召回阶段根据用户特征和商品特征,从海量商品库里快速找回一小部分用户潜在感兴趣的物品;排序阶段融入更多特征,如图1所示,例如是否属于用户浏览、用户咨询、客服推荐、用户点击、用户加购(用户加入购物车)、用户下单等特征,使用复杂模型,输出排序靠前的个性化推荐,如图2所示,图2为对话场景中物品推荐示例图。
64.目前的排序方案主要分为两种:
65.1、传统点击率预估模型。
66.将排序问题转化成一个0和1的二分类任务,手工提取用户、商品等特征后,使用lr、xgb等传统机器学习模型进行训练,根据输出分数进行排序。
67.2、深度点击率预估模型。
68.在传统点击率预估模型基础上,通过嵌入的方式将稀疏特征转化为低维稠密特征,通过多层全连接实现特征自动交叉组合,例如din(deep interest network)模型。
69.目前的方案中,传统点击率预估模型,结构简单拟合能力较差,同时需要耗费大量人工进行特征提取。现有深度点击率预估模型,侧重基于用户历史行为、用户画像进行推荐,语义理解能力很差,对话场景中的用户的上下文中通常包含了丰富的偏好信息,现有模型难以理解用户多样化、口语话的表述。现有推荐模型通过增加学习目标缓解样本稀疏问题,提升模型性能。但由于多个学习目标之间相关性弱和权重分配不均的问题,经常出现负迁移现象,即部分学习目标能力上升的同时其他学习目标能力下降。
70.因此,解决推荐模型在模型训练中出现负迁移现象,进而利用模型实现更加精准的推荐是当前亟待解决的问题。
71.为解决上述问题,本公开提供一种物品信息推荐方法,如图3所示,包括:
72.s31、获取多个待推荐物品信息。
73.具体地,待推荐物品信息可以包括但不限于物品的标题和属性等信息,例如物品的标题名称、物品的形状和物品的颜色等一系列信息。
74.s32、将用户信息和多个所述待推荐物品信息输入多目标推荐模型,输出每个所述待推荐物品信息对应的多个目标任务的推荐分数。
75.具体地,用户信息可以包括但不限于在对话中用户发送的内容、用于表示该用户身份或偏好的信息、用户在一定时间范围内与交互过的物品的交互信息等。
76.将用户信息和多个物品的待推荐物品信息输入多目标推荐模型,多目标推荐模型根据用户信息和待推荐物品信息输出待推荐物品信息对应的多个目标任务的推荐分数。
77.一个示例中,现有用户信息a、待推荐物品信息b和待推荐物品信息c。将a和b输入多目标推荐模型,得到b在目标任务1的推荐分数b1和在目标任务2的推荐分数b2;将a和c输入多目标推荐模型,得到c在目标任务1的推荐分数c1和在目标任务2的推荐分数c2。
78.s33、根据所述多个目标任务的推荐分数,确定目标推荐物品信息。
79.其中,所述多目标推荐模型是根据初始多目标推荐模型的多目标联合损失值对所述初始多目标推荐模型进行优化得到,所述多目标联合损失值是根据多个目标任务损失值计算得到。
80.具体地,可以根据多个目标任务的推荐分数和预设规则确定目标推荐物品信息,预设规则可以根据实际需要进行设定。
81.在上个示例中,可以设定将目标任务1中得分最高的待推荐物品信息确定为目标推荐物品信息,若b1为0.5,c1为0.3,则将b作为目标推荐物品信息。或者,在上个示例中,可以设定将目标任务1和2的综合得分最高的待推荐物品信息确定为目标推荐物品信息,若b1为0.5,b2为0.2,c1为0.4,c2为0.4,可知c1+c2》b1+b2,则将c作为目标推荐物品信息。
82.另一个示例中,对于某个用户在召回阶段召回了20个商品,则将该组20个商品信息组成一个批次输入到多目标推荐模型,得到20个商品的任务目标为“用户是否点击”的概率分数作为推荐分数,输出分数最高的前5个商品信息作为目标推荐物品信息。
83.其中,多目标联合损失值是根据多个目标任务损失值计算得到,目标任务损失值表示多目标推荐模型在目标任务的识别和分类能力,即多目标联合损失值表示多目标推荐模型在多个目标任务的综合识别和分类能力。
84.在计算多个目标任务损失值时,不同任务使用其各自样本空间中的样本。一个示例中,待推荐物品特征c属于“用户点击”,但不属于“客服推荐”,则在计算目标任务“用户点击”的损失值时不考虑待推荐物品特征c不属于“客服推荐”这一因素。
85.本公开实施例中,通过初始多目标推荐模型的多目标联合损失值对初始多目标推荐模型进行优化,得到多目标推荐模型。通过多目标联合损失值表示多目标推荐模型执行多个目标任务的综合能力,根据多目标联合损失值对初始多目标推荐模型进行优化,解决了多目标推荐模型出现负迁移的现象。通过获取多个待推荐物品信息;将用户信息和多个待推荐物品信息输入多目标推荐模型,输出每个待推荐物品信息对应的多个目标任务的推荐分数;根据多个目标任务的推荐分数,确定目标推荐物品,利用多目标推荐模型实现更加精准的推荐。
86.根据本公开提供的物品信息推荐方法,所述初始多目标推荐模型包括第一神经网络;
87.所述根据初始多目标推荐模型的多目标联合损失值对所述初始多目标推荐模型进行优化的步骤,如图4所示,包括:
88.s41、在所述多目标联合损失值未达到预设阈值的情况下,根据预设更新率调整所述第一神经网络的参数,并继续执行得到多目标联合损失值的步骤。
89.具体地,一个优选的示例中,第一神经网络为mmoe模型。
90.一个示例中,可以通过公式1计算调整在不同目标任务之间的第一神经网络的权重(即参数)。
[0091][0092]
其中,ω
k,0
表示第一神经网络的初始权重,t表示轮次,表示t轮次的更新率,表示第一神经网络在t轮次的权重。
[0093]
在多目标联合损失值为达到预设阈值的情况下根据预设更新率调整第一神经网络的参数,之后重新计算多目标联合损失值。
[0094]
s42、在所述多目标联合损失值达到预设阈值的情况下,确定所述初始多目标推荐模型为所述多目标推荐模型。
[0095]
本公开实施例中,在多目标联合损失值未达到预设阈值的情况下,根据预设更新率调整所述第一神经网络的参数,实现第一神经网络的自适应动态调节,以便于得到具有良好性能的多目标推荐模型。
[0096]
根据本公开提供的物品信息推荐方法,所述多目标联合损失值是通过如下步骤得到,如图5所示,包括:
[0097]
s51、构建样本数据集。
[0098]
其中,所述样本数据集的样本数据具有原始标签,所述样本数据包括用户点击信息、用户查询信息、用户特征信息、物品特征信息和交互特征信息。
[0099]
具体地,样本数据集由样本数据构成,每个样本数据具有原始标签,一个示例中,原始标签可以表示客服是否推荐、客户是否点击、客户是否加入购物车或者客户是否下单等,可以根据实际需要进行设定。每个样本数据由用户点击信息、用户查询信息、用户特征信息、物品特征信息和交互特征信息,共5项组成。
[0100]
用户点击信息用于表示用户在一定时期内的偏好。用户查询信息可以包括一个对话中用户发送的对话内容,可以包括但不限于文字和图片等内容。用户特征信息可以包括但不限于表示该用户身份或用户具有的资产的信息。物品特征信息可以包括但不限于一个物品的完整的标题名称或标题名称中的部分字段,以及该物品的具有的属性,例如物品的颜色、形状、材质和重量等信息。交互特征信息表示用户和该物品之间的交互信息。
[0101]
s52、根据所述用户点击信息、所述用户查询信息、所述用户特征信息、所述物品特征信息和所述交互特征信息生成综合特征向量。
[0102]
s53、将所述综合特征向量输入所述第一神经网络,输出目标任务标签。
[0103]
具体地,一个优选的示例中,第一神经网络为mmoe模型,将综合特征向量输入mmoe模型,利用mmoe模型的多个专家单元进行特征交叉学习,不同目标任务的gating networks可以学习到不同的组合experts的模式,捕捉不同目标任务的相关性和区别,mmoe输出的目标任务标签可以包括客服是否推荐,客户是否点击,客户是否加入购物车和客户是否下单。
[0104]
s54、根据所述原始标签和所述目标任务标签,计算多个目标任务损失值。
[0105]
s55、根据所述多个目标任务损失值,计算多目标联合损失值。
[0106]
具体地,一个示例中,目标任务损失值可以通过公式2计算得到,多目标联合损失值可以通过公式3计算得到:
[0107][0108]
l=∑lnꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0109]
其中,ln表示第n个目标任务损失值,i表示第i个样本;表示第i个样本与第n个目标任务的关系,属于则等于1,不属于则等于0;为交叉熵损失,其中y

为第i个样本对应的第n个目标任务的目标任务标签,y为第i个样本对应的第n个目标任务的原始标签。
[0110]
l表示多目标联合损失值,将n个目标任务的目标任务损失值ln相加,得到最终的多目标联合损失值l。
[0111]
本公开实施例中,构建样本数据集,根据样本数据生成综合特征向量,将综合特征向量输入第一神经网络,输出目标任务标签,根据目标任务标签和样本数据的原始标签计算多个目标任务的目标任务损失值,根据多个目标任务损失值计算多目标联合损失值。通过多个表示目标任务识别的目标任务损失值计算多目标联合损失值,计算得到的多目标联合损失值表示多目标推荐模型执行多个目标任务的综合能力,根据多目标联合损失值对初始多目标推荐模型进行优化,解决了多目标推荐模型出现负迁移的现象。
[0112]
根据本公开提供的物品信息推荐方法,步骤s51包括:
[0113]
s511、获取满足预设条件的正样本数据,并根据第一预设条件设置所述正样本数据的原始标签。
[0114]
其中,所述正样本数据包括用户点击信息、用户查询信息、用户特征信息、第一物品特征信息、第一交互特征信息。
[0115]
具体地,可以根据预设条件获取正样本数据,一个示例中,预设条件为“用户点击”,可以根据线上日志中的用户点击的数据确定相关的用户点击信息、用户查询信息、用户特征信息、第一物品特征信息和第一交互特征信息,并根据这些信息生成具有原始标签为“用户点击”的正样本数据。
[0116]
s512、根据所述正样本数据确定负样本数据,并设置所述负样本数据的原始标签。
[0117]
其中,所述负样本数据包括所述用户点击信息、用户查询信息、用户特征信息、第二物品特征信息、第二交互特征信息。
[0118]
具体地,一个示例中,可以针对1个“用户点击”数据,构建50个“用户未点击”数据。可以根据正样本数据确定满足预设条件的第二物品特征信息和第二交互特征数据。预设条件可以根据实际需要进行设定,一个示例中,预设条件可以为与第一物品特征信息表示的物品标题具有预设相似度,另一个示例中,预设条件也可以为与第一物品特征信息表示的物品属于同一品类。根据用户点击信息、用户查询信息、用户特征信息、第二物品特征信息和第二交互特征信息,生成原始标签为“用户未点击”的负样本数据。
[0119]
s513、根据所述正样本数据和所述负样本数据生成所述样本数据集。
[0120]
本公开实施例中,确定正样本数据之后,根据正样本数据确定负样本数据,方便后
续根据正样本数据和负样本数据以及对应的原始标签计算多个目标任务损失值,原始标签充分利用用户隐式反馈,实现参数共享减少模型训练中的过拟合。
[0121]
根据本公开提供的物品信息推荐方法,所述负样本数据包括常规负样本数据和难负样本数据;
[0122]
步骤s512包括:
[0123]
s5121、根据所述第一物品特征信息确定第一物品种类。
[0124]
s5122、确定与所述第一物品种类一致的物品对应的常规样本第二物品特征信息和常规样本第二交互特征信息。
[0125]
具体地,可以根据正样本数据的第一物品特征信息确定对应的物品的种类为第一物品种类,在除第一物品特征信息对应的物品的其他物品中,确定同为第一物品种类的物品的第二物品特征信息。一个示例中,可以在属于第一物品种类的其他物品中按照物品的销量进行排序,取排序靠前的物品对应的物品特征数据作为常规样本第二物品特征信息。可以根据实际需要设置常规样本第二交互特征信息,例如可以根据第一交互特征信息设定第二交互特征信息,一个示例中,第一交互特征信息表示“用户下单”,则可以生成表示“用户未下单”的第二交互特征信息。
[0126]
s5123、根据所述用户点击信息、所述用户查询信息、所述用户特征信息、所述常规样本第二物品信息和所述常规样本第二交互特征信息生成常规负样本数据和对应的原始标签。
[0127]
具体地,一个示例中,在生成常规负样本数据之后,可以根据第二交互特征信息确定对应的原始标签,假设第二交互特征信息表示“用户下单”,则可以确定常规负样本数据的原始标签为“用户下单”。
[0128]
s5124、根据所述第一物品特征信息的第一物品标题信息,确定与所述第一物品标题信息文字相似度达到预设阈值范围的难样本第二物品标题信息,根据所述难样本第二物品标题信息确定对应的难样本第二物品特征信息和难样本第二交互特征信息。
[0129]
具体地,可以根据第一物品信息确定对应的第一物品标题信息,之后计算其他物品的物品标题与第一物品标题信息对应的物品标题的文字相似度,在文字相似度达到预设阈值范围时,将这一个物品的物品标题信息作为难样本第二物品标题信息。根据难样本第二物品标题信息确定对应的难样本第二物品特征信息。可以根据实际需要设置常规样本第二交互特征信息,例如可以根据第一交互特征信息设定第二交互特征信息,一个示例中,第一交互特征信息表示“用户下单”,则可以生成表示“用户未下单”的第二交互特征信息。
[0130]
一个示例中,文字相似度可以采用但不限于jacard相似度、simhash相似度或cdssm相似度等。预设阈值范围可以根据实际需要进行设定,一个示例中,预设阈值范围可以设定为0.3-0.5。
[0131]
s5125、根据所述用户点击信息、所述用户查询数据、所述用户特征信息、所述难样本第二物品特征数据和所述难样本第二交互特征信息生成难负样本数据和对应的原始标签。
[0132]
具体地,一个示例中,在生成难负样本数据之后,可以根据第二交互特征信息确定对应的原始标签,假设第二交互特征信息表示“用户未下单”,则可以确定常规负样本数据的原始标签为“用户未下单”。
[0133]
本公开实施例中,负样本数据包括常规负样本数据和难负样本数据,根据同一物品种类的其他物品的多个信息生成常规负样本数据,方便模型进行快速学习。根据与第一物品标题信息文字相似度达到预设阈值范围的对应的其他物品生成难负样本数据,增加了学习难度,使得模型在训练时可以具有更好的识别和分类能力。
[0134]
根据本公开提供的物品信息推荐方法,步骤s52包括:
[0135]
s521、对所述用户点击信息、所述用户特征信息、所述物品特征信息和所述交互特征信息进行预处理,分别得到用户点击序列特征向量、用户特征向量、物品特征向量和交互特征向量。
[0136]
具体地,预处理可以根据实际需要进行操作或者不执行操作,包括但不限于提取特征、离散和池化等操作。
[0137]
s522、将预处理的所述用户查询信息输入预训练语言模型,输出对话特征向量。
[0138]
s523、拼接所述用户点击序列特征向量、所述用户特征向量、所述物品特征向量、所述交互特征向量和所述对话特征向量,得到综合特征向量。
[0139]
具体地,一个示例中,如图6所示,对用户点击信息在预设时间段内点击的数据顺序以及点击的数据内容进行embedding(嵌入)+multi head attention(多注意力集中)+mean polling(平均池化)等预处理的操作,得到加权后的用户点击序列特征。对用户特征信息和物品特征信息进行离散,得到用户特征向量和物品特征向量。将交互特征信息直接作为交互特征向量。对用户查询信息进行预处理,拼接该用户最近多个轮次的查询信息和候选推荐物品的标题,得到预处理的用户查询信息,输入预训练bert模型,即预训练语言模型,将输出的向量作为对话特征向量。将用户点击序列特征向量、用户特征向量、物品特征向量、交互特征向量和对话特征向量进行拼接,得到综合特征向量。将综合特征向量输入mmoe模型,即第一神经网络,输出4个目标任务的标签,分别为目标任务1客服是否推荐、目标任务2客户是否点击、目标任务3客户是否加入购物车和目标任务4客户是否下单。
[0140]
本公开实施例中,对用户点击信息、用户特征信息、物品特征信息和交互特征信息进行预处理,分别得到用户点击序列特征向量、用户特征向量、物品特征向量和交互特征向量。将预处理的用户查询信息输入预训练语言模型,输出对话特征向量。拼接用户点击序列特征向量、用户特征向量、物品特征向量和交互特征向量和对话特征向量,得到综合特征向量。减少了输入第一神经网络模型的向量数量,方便第一神经网络模型进行识别,得到目标任务标签。
[0141]
根据本公开提供的物品信息推荐方法,如图7所示,所述预训练语言模型是通过如下步骤获得,包括:
[0142]
s71、对获取的会话信息进行预处理,根据预处理后的会话信息生成预训练数据集。
[0143]
具体地,可以预先获取会话信息,对会话信息进行预处理,预处理包括但不限于生成指定格式、生成标签、链接转换、图片文本变换等。
[0144]
一个示例中,如图8所示,可以将图中的会话信息中的对话,处理成“[客服话术][sep][客户话术][sep][客服话术]
…”
的多轮对话格式的话术向量,[sep]表示分隔符;可以为话术叠加标签向量,区分不同说话的人,叠加位置向量,表征文本的相对位置。
[0145]
另一个示例中,增强对话内容和商品标题之间的文本相关性学习,同时减小预训
练语言模型在应用时对物品信息理解的误差。预处理还包括将会话信息中对话涉及的物品链接替换为物品标题,并添加物品的标签向量。例如,原始文本为“https://item.123.com/1234.html”,处理后的文本为“品牌名1.5匹新能效变频冷暖自清洁壁挂式卧室空调挂机(型号a红色)以旧换新”。
[0146]
s72、将所述处理后的预训练数据集输入初始语言模型,输出预测语义向量,并根据所述预测语义向量和所述会话信息计算语言损失值。
[0147]
具体地,一个示例中,如图9所示,为使预训练语言模型可以利用对话上下文预测的文本,具有有双向语言模型的语义理解能力,初始语言模型可以为初始bert(bidirectional encoder representations from transformers)模型,bert为一种双向transformer的编码器。将处理后的预训练数据集输入初始bert模型,初始bert模型对处理后的预训练数据集的随机选择输入文本15%的词,用[mask]掩码代替,进行编码和平均池化,预测掩码替换的文本,输出预测语义向量,并根据预测语义向量和会话信息计算语言损失值。
[0148]
s73、在所述语言损失值未达到预设阈值的情况下,根据所述语言损失值调整所述初始语言模型的参数,并返回重新执行所述对获取的会话信息进行预处理,根据预处理后的会话信息生成预训练数据集的步骤。
[0149]
s74、在所述初始语言损失值达到预设阈值的情况下,确定所述初始语言模型为所述预训练语言模型。
[0150]
本公开实施例中,对获取的会话信息进行预处理,可以增强会话信息的文本的相关性学习,根据预处理后的会话信息生成预训练数据集,将所述处理后的预训练数据集输入初始语言模型,输出预测语义向量,并根据所述预测语义向量和所述会话信息计算语言损失值,根据语言损失值调整初始语言模型,最终得到预训练语言模型,使预训练语言模型具有更好的语义理解能力。
[0151]
下面对本公开实施例提供的物品信息推荐装置进行描述,下文描述的物品信息推荐装置与上文描述的物品信息推荐方法可相互对应参照。
[0152]
本公开还提供了一种物品信息推荐装置,如图10所示,包括:
[0153]
获取单元101,用于获取多个待推荐物品信息;
[0154]
评分单元102,用于将用户信息和多个所述待推荐物品信息输入多目标推荐模型,输出每个所述待推荐物品信息对应的多个目标任务的推荐分数;
[0155]
确定单元103,用于根据所述多个目标任务的推荐分数,确定目标推荐物品信息;
[0156]
其中,所述多目标推荐模型是根据初始多目标推荐模型的多目标联合损失值对所述初始多目标推荐模型进行优化得到,所述多目标联合损失值是根据多个目标任务损失值计算得到。
[0157]
本公开实施例中,通过初始多目标推荐模型的多目标联合损失值对初始多目标推荐模型进行优化,得到多目标推荐模型。通过多目标联合损失值表示多目标推荐模型执行多个目标任务的综合能力,根据多目标联合损失值对初始多目标推荐模型进行优化,解决了多目标推荐模型出现负迁移的现象。通过获取多个待推荐物品信息;将用户信息和多个待推荐物品信息输入多目标推荐模型,输出每个待推荐物品信息对应的多个目标任务的推荐分数;根据多个目标任务的推荐分数,确定目标推荐物品,利用多目标推荐模型实现更加
精准的推荐。
[0158]
根据本公开提供的物品信息推荐装置,所述初始多目标推荐模型包括第一神经网络;
[0159]
所述根据初始多目标推荐模型的多目标联合损失值对所述初始多目标推荐模型进行优化的步骤,包括:
[0160]
在所述多目标联合损失值未达到预设阈值的情况下,根据预设更新率调整所述第一神经网络的参数,并继续执行得到多目标联合损失值的步骤;
[0161]
在所述多目标联合损失值达到预设阈值的情况下,确定所述初始多目标推荐模型为所述多目标推荐模型。
[0162]
根据本公开提供的物品信息推荐装置,所述多目标联合损失值是通过如下步骤得到,包括:
[0163]
构建样本数据集,所述样本数据集的样本数据具有原始标签,所述样本数据包括用户点击信息、用户查询信息、用户特征信息、物品特征信息和交互特征信息;
[0164]
根据所述用户点击信息、所述用户查询信息、所述用户特征信息、所述物品特征信息和所述交互特征信息生成综合特征向量;
[0165]
将所述综合特征向量输入所述第一神经网络,输出目标任务标签;
[0166]
根据所述原始标签和所述目标任务标签,计算多个目标任务损失值;
[0167]
根据所述多个目标任务损失值,计算多目标联合损失值。
[0168]
根据本公开提供的物品信息推荐装置,所述构建样本数据集的步骤,包括:
[0169]
获取满足预设条件的正样本数据,并根据第一预设条件设置所述正样本数据的原始标签,所述正样本数据包括用户点击信息、用户查询信息、用户特征信息、第一物品特征信息、第一交互特征信息;
[0170]
根据所述正样本数据确定负样本数据,并设置所述负样本数据的原始标签,所述负样本数据包括所述用户点击信息、用户查询信息、用户特征信息、第二物品特征信息、第二交互特征信息;
[0171]
根据所述正样本数据和所述负样本数据生成所述样本数据集。
[0172]
根据本公开提供的物品信息推荐装置,所述负样本数据包括常规负样本数据和难负样本数据;
[0173]
所述根据所述正样本数据确定满足第二预设条件的负样本数据,并设置所述负样本数据的原始标签的步骤,包括:
[0174]
根据所述第一物品特征信息确定第一物品种类;
[0175]
确定与所述第一物品种类一致的物品对应的常规样本第二物品特征信息和常规样本第二交互特征信息;
[0176]
根据所述用户点击信息、所述用户查询信息、所述用户特征信息、所述常规样本第二物品信息和所述常规样本第二交互特征信息生成常规负样本数据和对应的原始标签;
[0177]
根据所述第一物品特征信息的第一物品标题信息,确定与所述第一物品标题信息文字相似度达到预设阈值范围的难样本第二物品标题信息,根据所述难样本第二物品标题信息确定对应的难样本第二物品特征信息和难样本第二交互特征信息;
[0178]
根据所述用户点击信息、所述用户查询数据、所述用户特征信息、所述难样本第二
物品特征数据和所述难样本第二交互特征信息生成难负样本数据。
[0179]
根据本公开提供的物品信息推荐装置,所述根据所述用户点击信息、所述用户查询信息、所述用户特征信息、所述物品特征信息和所述交互特征信息生成综合特征向量的步骤,包括:
[0180]
对所述用户点击信息、所述用户特征信息、所述物品特征信息和所述交互特征信息进行预处理,分别得到用户点击序列特征向量、用户特征向量、物品特征向量和交互特征向量;
[0181]
将预处理的所述用户查询信息输入预训练语言模型,输出对话特征向量;
[0182]
拼接所述用户点击序列特征向量、用户特征向量、物品特征向量和交互特征向量和所述对话特征向量,得到综合特征向量。
[0183]
根据本公开提供的物品信息推荐装置,所述预训练语言模型是通过如下步骤获得,包括:
[0184]
对获取的会话信息进行预处理,根据预处理后的会话信息生成预训练数据集;
[0185]
将所述处理后的预训练数据集输入初始语言模型,输出预测语义向量,并根据所述预测语义向量和所述会话信息计算语言损失值;
[0186]
在所述语言损失值未达到预设阈值的情况下,根据所述语言损失值调整所述初始语言模型的参数,并返回重新执行所述对获取的会话信息进行预处理,根据预处理后的会话信息生成预训练数据集的步骤;
[0187]
在所述初始语言损失值达到预设阈值的情况下,确定所述初始语言模型为所述预训练语言模型。
[0188]
图11示例了一种电子设备的实体结构示意图,如图11所示,该电子设备可以包括:处理器(processor)1110、通信接口(communications interface)1120、存储器(memory)1130和通信总线1140,其中,处理器1110,通信接口1120,存储器1130通过通信总线1140完成相互间的通信。处理器1110可以调用存储器1130中的逻辑指令,以执行物品信息推荐方法,该方法包括:获取多个待推荐物品信息;将用户信息和多个所述待推荐物品信息输入多目标推荐模型,输出每个所述待推荐物品信息对应的多个目标任务的推荐分数;根据所述多个目标任务的推荐分数,确定目标推荐物品信息;其中,所述多目标推荐模型是根据初始多目标推荐模型的多目标联合损失值对所述初始多目标推荐模型进行优化得到,所述多目标联合损失值是根据多个目标任务损失值计算得到。
[0189]
此外,上述的存储器1130中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0190]
另一方面,本公开还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述计算
机程序指令被计算机执行时,计算机能够执行上述各方法所提供的物品信息推荐方法,该方法包括:获取多个待推荐物品信息;将用户信息和多个所述待推荐物品信息输入多目标推荐模型,输出每个所述待推荐物品信息对应的多个目标任务的推荐分数;根据所述多个目标任务的推荐分数,确定目标推荐物品信息;其中,所述多目标推荐模型是根据初始多目标推荐模型的多目标联合损失值对所述初始多目标推荐模型进行优化得到,所述多目标联合损失值是根据多个目标任务损失值计算得到。
[0191]
又一方面,本公开还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的物品信息推荐方法,该方法包括:获取多个待推荐物品信息;将用户信息和多个所述待推荐物品信息输入多目标推荐模型,输出每个所述待推荐物品信息对应的多个目标任务的推荐分数;根据所述多个目标任务的推荐分数,确定目标推荐物品信息;其中,所述多目标推荐模型是根据初始多目标推荐模型的多目标联合损失值对所述初始多目标推荐模型进行优化得到,所述多目标联合损失值是根据多个目标任务损失值计算得到。
[0192]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0193]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0194]
最后应说明的是:以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1