预测模型的训练方法、信息预测方法、服务器及存储介质与流程

文档序号：31145543发布日期：2022-08-16 23:29阅读：101来源：国知局

1.本技术实施例涉及信息处理技术领域，尤其涉及一种预测模型的训练方法、信息预测方法、预测模型的训练装置、信息预测装置、服务器以及存储介质。

背景技术：

2.随着信息技术的飞速发展，新闻、视频等多种信息媒介充斥着人们的生活。人们能够获取的信息和各种信息的生产者时时刻刻面对着信息过载，信息有效分配获取的问题。因此推荐系统应运而生。推荐系统是在用户与信息交互的基础上，通过信息召回，粗排，精排等步骤，从丰富的信息池中筛选出用户当前比较喜欢的内容。为了使推荐效果更加个性化，推荐系统的结构越来越复杂，数据和数据之间，数据和模型之间以及模型多目标之间的冲突越来越明显。尤其多目标传统训练的时候，每个目标都会用自己的数据独立建模，并且训练过程中，在有些领域，多目标之间其实是有紧密的依赖关系，甚至彼此影响。因此，多目标预测模型中如何训练预测模型，对预测结果准确性十分重要。

技术实现要素：

3.本技术实施例提供一种预测模型的训练方法、信息预测方法、预测模型的训练装置、信息预测装置、服务器以及存储介质。
4.本技术实施例第一方面提供的预测模型的训练方法，包括：
5.输入样本用户的用户特征信息至所述预测模型的共享嵌入层网络，所述用户特征信息至少包括用户进行点击操作的操作信息；
6.基于第一网络在所述共享嵌入层网络中提取所述用户特征信息中的第一特征信息，及基于所述第一特征信息，训练所述第一网络，输出用户点击率向量，其中所述第一特征信息为所述用户特征信息中与所述用户进行点击操作有关的特征信息；
7.基于第二网络在所述共享嵌入层网络中提取所述用户特征信息中的第二特征信息，及基于所述第二特征信息，训练所述第二网络，输出用户转化率向量，其中所述第二特征信息为所述用户特征信息中与所述用户进行点击转化有关的特征信息；
8.基于自适应权重网络，在所述共享嵌入层网络中提取所述用户特征信息中的所述第一特征信息及所述第二特征信息，训练所述自适应权重网络，输出与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重；
9.基于所述用户转化率向量，经所述第二向量权重加权，得到加权后的用户转化率向量；
10.基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络。
11.在一个实施例中，所述训练方法还包括：
12.基于所述用户点击率向量，经所述第一向量权重加权，得到加权后的用户点击率向量；
13.基于所述加权后的用户点击率向量及所述加权后的用户转化率向量，拟合得到点击转化率；
14.基于所述点击转化率，构建点击转化损失函数；
15.基于所述转化损失函数及所述点击转化损失函数，构建第一损失函数；
16.所述基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络，包括：基于所述第一损失函数作为所述目标优化函数，训练所述第二网络。
17.在一个实施例中，所述训练方法还包括：
18.基于所述加权后的用户点击率向量，构建点击损失函数；
19.基于所述点击损失函数及所述点击转化损失函数，构建第二损失函数；
20.基于所述第二损失函数作为所述目标优化函数，训练所述第一网络。
21.在一个实施例中，训练方法还包括：
22.基于所述点击损失函数、所述转化损失函数及所述点击转化损失函数，构建第三损失函数；
23.基于所述第三损失函数，作为所述目标优化函数，训练所述自适应权重网络。
24.在一个实施例中，所述训练方法还包括：
25.预先确定出所述样本用户对应点击操作的点击标签、所述样本用户对应转化的转化标签及所述样本用户对应点击转化的点击转化标签；
26.所述基于所述加权后的用户点击率向量，构建点击损失函数，包括：基于所述加权后的用户点击率向量及所述样本用户对应点击操作的点击标签，构建所述点击损失函数；
27.所述基于所述点击转化率，构建点击转化损失函数，包括：基于所述点击转化率及所述样本用户对应点击转化的点击转化标签，构建所述点击转化损失函数；
28.所述方法还包括：基于所述加权后的用户转化率向量及所述样本用户对应转化的转化标签，构建所述转化损失函数。
29.在一个实施例中，所述方法还包括：
30.根据所述点击标签对应的张量，确定出与所述点击损失函数对应的第一自适应权重；
31.根据所述转化标签对应的张量，确定出与所述转化损失函数对应的第二自适应权重；
32.根据所述点击转化标签对应的张量，确定出与所述点击转化损失函数对应的第三自适应权重；
33.所述基于所述点击损失函数及所述点击转化损失函数，构建第二损失函数，包括：
34.对所述点击损失函数进行第一自适应权重加权；
35.对点击转化损失函数进行第三自适应权重加权；
36.基于所述第一自适应权重加权后的点击损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第二损失函数；
37.所述基于所述转化损失函数及所述点击转化损失函数，构建第一损失函数，包
括：
38.对所述转化损失函数进行第二自适应权重加权；
39.基于所述第二自适应权重加权后的转化损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第一损失函数；
40.所述基于所述点击损失函数、所述转化损失函数及所述点击转化损失函数，构建第三损失函数，包括：
41.基于所述第一自适应权重加权后的点击损失函数、所述第二自适应权重加权后的转化损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第三损失函数。
42.本技术实施例第二方面提供的一种信息预测方法，包括：
43.获取待预测的用户的用户特征信息，所述用户特征信息至少包括用户进行点击操作的操作信息；
44.输入所述用户特征信息至上述第一方面实施例所述的预测模型；
45.基于所述预测模型中的第一网络，预测所述用户的点击率；
46.基于所述预测模型中的第二网络，预测所述用户点击操作的转化率，其中，所述第二网络由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练得到。
47.本技术实施例第三方面提供的一种信息预测模型，包括：
48.共享嵌入层网络，用于输入样本用户的用户特征信息，其中所述用户特征信息至少包括用户进行点击操作的操作信息；
49.第一网络，与所述共享嵌入层网络连接，用于在所述共享嵌入层网络中提取所述用户特征信息中的第一特征信息，及基于所述第一特征信息，训练输出用户点击率向量，其中所述第一特征信息为所述用户特征信息中与所述用户进行点击操作有关的特征信息；
50.第二网络，与所述共享嵌入层网络连接，用于在所述共享嵌入层网络中提取所述用户特征信息中的第二特征信息，及基于所述第二特征信息，训练输出用户转化率向量，其中所述第二特征信息为所述用户特征信息中与所述用户进行点击转化有关的特征信息；
51.自适应权重网络，与所述共享嵌入层网络连接，用于在所述共享嵌入层网络中提取所述用户特征信息中的所述第一特征信息及所述第二特征信息，训练输出与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重；其中，所述第二向量权重用于对所述第二网络输出的用户转化率向量加权，构建用于优化所述第二网络的转化损失函数；所述第一向量权重用于对所述第一网络输出的用户点击率向量加权，构建用于优化所述第一网络的点击损失函数；及
52.所述第一网络输出的用户点击率向量进行所述第一向量权重加权和所述第二网络输出的用户转化率向量进行所述第二向量权重加权，构建用于优化所述自适应权重网络的点击转化损失函数。
53.本技术实施例第四方面提供的一种预测模型的训练装置，包括：
54.第一处理单元，用于输入样本用户的用户特征信息至所述预测模型的共享嵌入
层网络，所述用户特征信息至少包括用户进行点击操作的操作信息；
55.第二处理单元，用于基于第一网络在所述共享嵌入层网络中提取所述用户特征信息中的第一特征信息，及基于所述第一特征信息，训练所述第一网络，输出用户点击率向量，其中所述第一特征信息为所述用户特征信息中与所述用户进行点击操作有关的特征信息；
56.第三处理单元，用于基于第二网络在所述共享嵌入层网络中提取所述用户特征信息中的第二特征信息，及基于所述第二特征信息，训练所述第二网络，输出用户转化率向量，其中所述第二特征信息为所述用户特征信息中与所述用户进行点击转化有关的特征信息；
57.第四处理单元，用于基于自适应权重网络，在所述共享嵌入层网络中提取所述用户特征信息中的所述第一特征信息及所述第二特征信息，训练所述自适应权重网络，输出与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重；
58.第五处理单元，用于基于所述用户转化率向量，经所述第二向量权重加权，得到加权后的用户转化率向量；
59.第六处理单元，用于基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络。
60.在一个实施例中，所述第五处理单元，用于
61.基于所述用户点击率向量，经所述第一向量权重加权，得到加权后的用户点击率向量；
62.基于所述加权后的用户点击率向量及所述加权后的用户转化率向量，拟合得到点击转化率；
63.基于所述点击转化率，构建点击转化损失函数；
64.基于所述转化损失函数及所述点击转化损失函数，构建第一损失函数；
65.所述第六处理单元，用于
66.基于所述第一损失函数作为所述目标优化函数，训练所述第二网络。
67.在一个实施例中，所述第五处理单元，用于
68.基于所述加权后的用户点击率向量，构建点击损失函数；
69.基于所述点击损失函数及所述点击转化损失函数，构建第二损失函数；
70.所述第六处理单元，用于
71.基于所述第二损失函数作为所述目标优化函数，训练所述第一网络。
72.在一个实施例中，所述第五处理单元，用于
73.基于所述点击损失函数、所述转化损失函数及所述点击转化损失函数，构建第三损失函数；
74.所述第六处理单元，用于
75.基于所述第三损失函数，作为所述目标优化函数，训练所述自适应权重网络。
76.在一个实施例中，所述第五处理单元，用于
77.预先确定出所述样本用户对应点击操作的点击标签、所述样本用户对应转化的转化标签及所述样本用户对应点击转化的点击转化标签；
78.基于所述加权后的用户点击率向量及所述样本用户对应点击操作的点击标签，
构建所述点击损失函数；
79.基于所述点击转化率及所述样本用户对应点击转化的点击转化标签，构建所述点击转化损失函数；
80.基于所述加权后的用户转化率向量及所述样本用户对应转化的转化标签，构建所述转化损失函数。
81.在一个实施例中，所述第五处理单元，用于
82.根据所述点击标签对应的张量，确定出与所述点击损失函数对应的第一自适应权重；
83.根据所述转化标签对应的张量，确定出与所述转化损失函数对应的第二自适应权重；
84.根据所述点击转化标签对应的张量，确定出与所述点击转化损失函数对应的第三自适应权重；
85.对所述点击损失函数进行第一自适应权重加权；
86.对点击转化损失函数进行第三自适应权重加权；
87.基于所述第一自适应权重加权后的点击损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第二损失函数；
88.对所述转化损失函数进行第二自适应权重加权；
89.基于所述第二自适应权重加权后的转化损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第一损失函数；
90.基于所述第一自适应权重加权后的点击损失函数、所述第二自适应权重加权后的转化损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第三损失函数。
91.本技术实施例第五方面提供的一种信息预测装置，包括：
92.第一处理单元，用于获取待预测的用户的用户特征信息，所述用户特征信息至少包括用户进行点击操作的操作信息；
93.第二处理单元，用于输入所述用户特征信息至上述第一方面实施例所述的预测模型；
94.第三处理单元，用于基于所述预测模型中的第一网络，预测所述用户的点击率；
95.第四处理单元，用于基于所述预测模型中的第二网络，预测所述用户点击操作的转化率，其中，所述第二网络由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练得到。
96.本技术实施例第六方面提供的一种服务器，包括：处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，所述处理器用于运行所述计算机程序时，执行上述第一方面和第二方面实施例所述方法的步骤。
97.本技术实施例第七方面提供的一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述第一方面和第二方面实施例所述方法的步骤。
98.本技术实施例的预测模型的训练方法，包括：输入样本用户的用户特征信息至所述预测模型的共享嵌入层网络，所述用户特征信息至少包括用户进行点击操作的操作信
息；基于第一网络在所述共享嵌入层网络中提取所述用户特征信息中的第一特征信息，及基于所述第一特征信息，训练所述第一网络，输出用户点击率向量，其中所述第一特征信息为所述用户特征信息中与所述用户进行点击操作有关的特征信息；基于第二网络在所述共享嵌入层网络中提取所述用户特征信息中的第二特征信息，及基于所述第二特征信息，训练所述第二网络，输出用户转化率向量，其中所述第二特征信息为所述用户特征信息中与所述用户进行点击转化有关的特征信息；基于自适应权重网络，在所述共享嵌入层网络中提取所述用户特征信息中的所述第一特征信息及所述第二特征信息，训练所述自适应权重网络，输出与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重；基于所述用户转化率向量，经所述第二向量权重加权，得到加权后的用户转化率向量；基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络。本技术中在进行多目标训练时，在预测模型中采用自适应权重网络自适应提取用户特征信息中的与所述用户进行点击操作有关的第一特征信息及与所述用户进行点击转化有关的第二特征信息，训练输出与第二特征信息对应的第二向量权重。通过自适应权重网络自适应训练得到的第二向量权重能够用于调整样本数据中用户点击操作及未点击操作对应的样本数据对用户点击操作后转换率预测的影响，来减少训练样本数据与实际预测数据由于数据分布不同造成的对转换率预测时存在的数据选择偏差。然后通过用户转化率向量，经所述第二向量权重加权，得到加权后的用户转化率向量；基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络。如此，通过结合已经减少了训练样本数据与实际预测数据由于数据分布不同造成的对转换率预测时存在的数据选择偏差获得的转化损失函数来作为目标优化函数，训练所述第二网络，有利于提高第二网络的训练质量，提高通过训练的第二网络对实际预测数据进行预测时的准确度。
附图说明
99.图1是根据一示例性实施例示出的推荐转化时的样本集合示意图；
100.图2是根据一示例性实施例示出的预测模型的训练方法流程图；
101.图3是根据一示例性实施例示出的预测模型的结构示意图；
102.图4是根据一示例性实施例示出的预测模型的训练装置的结构示意图；
103.图5是根据一示例性实施例示出的信息预测装置结构示意图；
104.图6是根据一示例性实施例示出的终端结构示意图。
具体实施方式
105.以下结合说明书附图及具体实施例对本发明的技术方案做进一步的详细阐述。
106.随着信息技术的飞速发展，新闻、视频等多种信息媒介充斥着人们的生活。人们能够获取的信息和各种信息的生产者时时刻刻面对着信息过载，信息有效分配获取的问题。因此推荐系统应运而生。推荐系统是在用户与信息交互的基础上，通过信息召回，粗排，精排等步骤，从丰富的信息池中筛选出用户当前比较喜欢的内容。为了使推荐效果更加个性化，推荐系统的结构越来越复杂，数据和数据之间，数据和模型之间以及模型多目标之间的冲突越来越明显。
107.多目标传统训练的时候，每个目标都会用自己的数据独立建模，并且训练过程中，目标预测还有损失计算都是固定的权重，甚至在有些领域，多目标之间其实是有紧密的依赖关系，如广告领域的ctr点击率和cvr转换率目标。
108.传统的多目标方式处理ctr cvr会导致两个问题：1)数据选择偏差问题，图 1是根据一示例性实施例示出的推荐转化时的样本集合示意图。如图1所示，推理空间内包含有显示样本。显示样本中包含有点击样本和转化样本。训练空间内对点击样本和转化样本进行训练。多目标训练的时候ctr训练样本和预测样本都是impression显示集合，所以样本偏差影响较小。但cvr训练就会有偏差，因为转化是“有可能”在点击之后发生的，当独立建模的时候，cvr模型只是用点击数据作为训练集，其中点击未转化为负样本，点击后转化为正样本。但是训练好的cvr模型实际使用时，则是对整个空间的样本进行预估，即impression 空间中进行预估。训练数据与实际要预测的数据来自不同分布，这一定程度上违背了机器学习中独立同分布的假设。2)不同目标都是独立硬计算，包括目标输出和损失loss的计算。例如，损失函数的计算是经过预测值与实际值的偏差，再将结果直接求和，这个偏差在多目标训练的过程中会凸显出来。
109.针对数据选择偏差问题，经常采用在传统的多目标训练过程中，添加样本采样的方式，例如针对cvr任务除了使用点击后的样本，还会选择曝光-未点击的采样作为负样本，这种采样的方式虽然补充样本空间，但是还是存在偏差，不能自适应调节。
110.本技术提供一种预测模型的训练方法。图2是根据一示例性实施例示出的预测模型的训练方法流程图。如图2所示，预测模型的训练方法，包括：
111.步骤10、输入样本用户的用户特征信息至所述预测模型的共享嵌入层网络，所述用户特征信息至少包括用户进行点击操作的操作信息；
112.步骤11、基于第一网络在所述共享嵌入层网络中提取所述用户特征信息中的第一特征信息，及基于所述第一特征信息，训练所述第一网络，输出用户点击率向量，其中所述第一特征信息为所述用户特征信息中与所述用户进行点击操作有关的特征信息；
113.步骤12、基于第二网络在所述共享嵌入层网络中提取所述用户特征信息中的第二特征信息，及基于所述第二特征信息，训练所述第二网络，输出用户转化率向量，其中所述第二特征信息为所述用户特征信息中与所述用户进行点击转化有关的特征信息；
114.步骤13、基于自适应权重网络，在所述共享嵌入层网络中提取所述用户特征信息中的所述第一特征信息及所述第二特征信息，训练所述自适应权重网络，输出与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重；
115.步骤14、基于所述用户转化率向量，经所述第二向量权重加权，得到加权后的用户转化率向量；
116.步骤15、基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络。
117.在示例性实施例中，图3是根据一示例性实施例示出的预测模型的结构示意图。如图3所示，输入预测模型的样本用户的用户特征信息至少包括用户特征、用户点击操作对应的项目特征及与项目相关的其他特征，包括生成要素特征等。用户特征包括用户年龄、性别、工作等。用户点击操作对应的项目特征包括文字、视频等用来承载广告信息的特征等。与项目相关的生成要素特征包括发布广告的位置、方式、时间等。
118.在示例性实施例中，针对多目标训练的独立硬计算问题，比如mmoe (modeling task relationships in multi-task learning with multi-gatemixture-of-experts，多任务学习模型)等框架，本技术中自适应权重网络会根据样本，第一特征信息及所述第二特征信息生成ctr、cvr的模型权重表示，即与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重。将模型的输出结果进行调整，其中生成ctr、cvr权重的特征并不是根据人工经验选择的，而是根据自适应权重网络中的feature select gate特征选择门自动选择。每个目标有自己个性化的特征筛选，并且随着训练而自适应改变特征的比重。权重网络筛选完特征后，会经过一个低阶+全链接的网络进行训练，相比于全连接网络会考虑特征的低阶表示，最终权重和目标结合生成与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重。此时cvr的模型即第二网络训练因为自适应权重网络也可以学习到展示空间的样本分布，并且在预测的时候，cvr的预测使用的是第二向量权重调节后的cvr 第二网络模型，因为考虑了ctr的部分影响，更符合cvr实际偏差，因此解决了数据偏差的问题。
119.本技术实施例的预测模型的训练方法，包括：输入样本用户的用户特征信息至所述预测模型的共享嵌入层网络，所述用户特征信息至少包括用户进行点击操作的操作信息；基于第一网络在所述共享嵌入层网络中提取所述用户特征信息中的第一特征信息，及基于所述第一特征信息，训练所述第一网络，输出用户点击率向量，其中所述第一特征信息为所述用户特征信息中与所述用户进行点击操作有关的特征信息；基于第二网络在所述共享嵌入层网络中提取所述用户特征信息中的第二特征信息，及基于所述第二特征信息，训练所述第二网络，输出用户转化率向量，其中所述第二特征信息为所述用户特征信息中与所述用户进行点击转化有关的特征信息；基于自适应权重网络，在所述共享嵌入层网络中提取所述用户特征信息中的所述第一特征信息及所述第二特征信息，训练所述自适应权重网络，输出与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重；基于所述用户转化率向量，经所述第二向量权重加权，得到加权后的用户转化率向量weight_pcvr；基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络。本技术中在进行多目标训练时，在预测模型中采用自适应权重网络自适应提取用户特征信息中的与所述用户进行点击操作有关的第一特征信息及与所述用户进行点击转化有关的第二特征信息，训练输出与第二特征信息对应的第二向量权重。通过自适应权重网络自适应训练得到的第二向量权重能够用于调整样本数据中用户点击操作及未点击操作对应的样本数据对用户点击操作后转换率预测的影响，来减少训练样本数据与实际预测数据由于数据分布不同造成的对转换率预测时存在的数据选择偏差。然后通过用户转化率向量，经所述第二向量权重加权，得到加权后的用户转化率向量；基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络。如此，通过结合已经减少了训练样本数据与实际预测数据由于数据分布不同造成的对转换率预测时存在的数据选择偏差获得的转化损失函数来作为目标优化函数，训练所述第二网络，有利于提高第二网络的训练质量，提高通过训练的第二网络对实际预测数据进行预测时的准确度。
120.在示例性实施例中，如图3所示，针对上述三种网络结构，在训练的时候，底层特征通过特征转化，生成统一的共享特征。ctr模型第一网络训练的时候，从中选取ctr的第
一特征信息进行模型训练，产生pctr用户点击率结果。
121.cvr第二网络从share embedding共享嵌入层网络中选取cvr的第二特征信息进行网络训练，产生pcvr用户转化率结果。
122.自适应权重网络从share embedding共享嵌入层网络中经过ctr or cvrfeature selected gate分别筛选出不同目标所需要的特征，相较于人工选择更自适应，通过一个低级+全连接的网络训练生成两个k维度的向量，分别与ctr第一网络和cvr第二网络的k维度向量进行计算，产生出加权后的用户点击率向量和加权后的用户转化率向量，自适应权重网络不仅仅利用了全连接的高级表示，还融合了特征的低阶表示。
123.在一个实施例中，所述训练方法还包括：
124.基于所述用户点击率向量，经所述第一向量权重加权，得到加权后的用户点击率向量；
125.基于所述加权后的用户点击率向量及所述加权后的用户转化率向量，拟合得到点击转化率；
126.基于所述点击转化率，构建点击转化损失函数；
127.基于所述转化损失函数及所述点击转化损失函数，构建第一损失函数；
128.所述基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络，包括：基于所述第一损失函数作为所述目标优化函数，训练所述第二网络。
129.在示例性实施例中，在训练第二网络时，作为第二网络的目标优化函数可以是转化损失函数，也可以是基于转化损失函数及所述点击转化损失函数构建得到的第一损失函数。
130.在确定第一损失函数时，可以是点击转化损失函数累加转化损失函数得到第一损失函数。点击转化损失函数可以通过点击转化率与对应的点击转化标签得到。
131.点击转化率可通过经第一向量权重加权后的用户点击率向量weight_pctr及经第二向量权重加权后的用户转化率向量weight_pcvr，在融合网络中通过网络拟合输出点击转化率。例如，在融合网络中，经第一向量权重加权后的用户点击率向量weight_pctr及经第二向量权重加权后的用户转化率向量weight_pcvr，进行非线性变换，输出点击转化率。
132.在一个实施例中，所述训练方法还包括：
133.基于所述加权后的用户点击率向量，构建点击损失函数；
134.基于所述点击损失函数及所述点击转化损失函数，构建第二损失函数；
135.基于所述第二损失函数作为所述目标优化函数，训练所述第一网络。
136.在示例性实施例中，构建点击损失函数时，可通过第一向量权重加权后的用户点击率向量与用户点击率对应的点击标签，构建点击损失函数。点击损失函数与所述点击转化损失函数累加，得到第二损失函数。将第二损失函数作为所述目标优化函数，训练所述第一网络。由于第一向量权重为自适应权重网络训练得到，使得通过加权后的用户点击率向量构建的点击损失函数，能够更好的优化第一网络。
137.在一个实施例中，训练方法还包括：
138.基于所述点击损失函数、所述转化损失函数及所述点击转化损失函数，构建第三
损失函数；
139.基于所述第三损失函数，作为所述目标优化函数，训练所述自适应权重网络。
140.在示例性实施例中，在训练自适应权重网络时，可将第三损失函数作为目标优化函数，来优化自适应权重网络。第三损失函数可通过累加点击损失函数、所述转化损失函数及所述点击转化损失函数得到。
141.在示例性实施例中，所述训练方法还包括：
142.预先确定出所述样本用户对应点击操作的点击标签、所述样本用户对应转化的转化标签及所述样本用户对应点击转化的点击转化标签；
143.所述基于所述加权后的用户点击率向量，构建点击损失函数，包括：基于所述加权后的用户点击率向量及所述样本用户对应点击操作的点击标签，构建所述点击损失函数；
144.所述基于所述点击转化率，构建点击转化损失函数，包括：基于所述点击转化率及所述样本用户对应点击转化的点击转化标签，构建所述点击转化损失函数；
145.所述方法还包括：基于所述加权后的用户转化率向量及所述样本用户对应转化的转化标签，构建所述转化损失函数。
146.在一个实施例中，所述方法还包括：
147.根据所述点击标签对应的张量，确定出与所述点击损失函数对应的第一自适应权重；
148.根据所述转化标签对应的张量，确定出与所述转化损失函数对应的第二自适应权重；
149.根据所述点击转化标签对应的张量，确定出与所述点击转化损失函数对应的第三自适应权重；
150.所述基于所述点击损失函数及所述点击转化损失函数，构建第二损失函数，包括：
151.对所述点击损失函数进行第一自适应权重加权；
152.对点击转化损失函数进行第三自适应权重加权；
153.基于所述第一自适应权重加权后的点击损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第二损失函数；
154.在示例性实施例中，基于所述第一自适应权重加权后的点击损失函数累加所述基于第三自适应权重加权后的点击转化损失函数，得到第二损失函数。
155.所述基于所述转化损失函数及所述点击转化损失函数，构建第一损失函数，包括：
156.对所述转化损失函数进行第二自适应权重加权；
157.基于所述第二自适应权重加权后的转化损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第一损失函数；
158.在示例性实施例中，基于所述第二自适应权重加权后的转化损失函数累加第三自适应权重加权后的点击转化损失函数，得到所述第一损失函数。
159.所述基于所述点击损失函数、所述转化损失函数及所述点击转化损失函数，构建第三损失函数，包括：
160.基于所述第一自适应权重加权后的点击损失函数、所述第二自适应权重加权后的转化损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第三损失函数。
161.在示例性实施例中，基于所述第一自适应权重加权后的点击损失函数、基于所述第二自适应权重加权后的转化损失函数与基于所述第三自适应权重加权后的点击转化损失函数，这三者累加得到第三损失函数。
162.在示例性实施例中，最终反向传播的模型损失由三部分组成：
163.total loss＝ctr loss*ctr trainable loss weight+cvr loss*cvr trainable loss weight +ctcvr loss*ctcvr trainable loss weight；其中，total loss为最终的损失函数，ctrloss为点击损失函数，cvr loss为转化损失函数，ctcvr loss为点击转化损失函数， ctr trainable loss weight为第一自适应权重，cvr trainable loss weight为第二自适应权重，ctcvr trainable loss weight为第三自适应权重。
164.其中：ctr trainable loss weight和cvr trainable loss weight和ctcvr trainable lossweight分别是三个可训练的loss权重。loss权重是独立，可训练的，例如可通过如下方式k*exp(-weight[label])，计算得到loss的权重，其中weight[label]会根据label标签选择ctr or cvr or ctcvr的对应tensor张量。在示例性实施例中也可以直接选择ctr or cvr or ctcvr的对应tensor张量作为loss权重。例如，tensor1 作为ctr trainable loss weight，tensor2作为cvr trainable loss weight，tensor3作为 ctcvr trainable loss weight等。也可以确定tensor后，经过k*exp(-weight[label]) 计算，得到对应的loss权重，此时tensor为weight[label]中的一个变量。此时 k*exp(-weight[label])等于loss的权重。例如，选择ctr对应tensor1张量，输入 tensor1至k*exp(-weight[label])，输出得到ctr trainable loss weight。
[0165]
本技术中转化损失函数不仅学习到了整个空间的数据分布，还将ctr模型的影响添加到cvr的预测。
[0166]
此外，优化模型还对不同目标的损失loss也都会乘以一个可训练的权重，传统的多目标权重都是针对目标的输出进行调整，loss都是简单的求和后进行反向传播。本方法除此之外，会单独在loss上乘以一个trainable loss weight。它不同于上一部分的目标权重，loss权重是不依赖特征的可训练tensor,反向传播的时候会进行更新。自适应调节多目标的loss损失，结合模型的输出权重，恰好解决了多目标独立硬计算的问题。
[0167]
针对传统多目标模型的数据偏差以及目标独立硬耦合的问题，本技术提出了一种基于自适应权重优化的多目标训练框架，消除了数据的偏差，同时目标之间通过自适应目标权重，自适应loss权重得到更好的训练。
[0168]
本技术实施例第二方面提供的一种信息预测方法，包括：
[0169]
获取待预测的用户的用户特征信息，所述用户特征信息至少包括用户进行点击操作的操作信息；
[0170]
输入所述用户特征信息至上述第一方面实施例所述的预测模型；
[0171]
基于所述预测模型中的第一网络，预测所述用户的点击率；
[0172]
基于所述预测模型中的第二网络，预测所述用户点击操作的转化率，其中，所述第二网络由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，
训练得到。
[0173]
本技术实施例第三方面提供的一种信息预测模型，如图3所示，包括：
[0174]
共享嵌入层网络，用于输入样本用户的用户特征信息，其中所述用户特征信息至少包括用户进行点击操作的操作信息；
[0175]
第一网络，与所述共享嵌入层网络连接，用于在所述共享嵌入层网络中提取所述用户特征信息中的第一特征信息，及基于所述第一特征信息，训练输出用户点击率向量，其中所述第一特征信息为所述用户特征信息中与所述用户进行点击操作有关的特征信息；
[0176]
第二网络，与所述共享嵌入层网络连接，用于在所述共享嵌入层网络中提取所述用户特征信息中的第二特征信息，及基于所述第二特征信息，训练输出用户转化率向量，其中所述第二特征信息为所述用户特征信息中与所述用户进行点击转化有关的特征信息；
[0177]
自适应权重网络，与所述共享嵌入层网络连接，用于在所述共享嵌入层网络中提取所述用户特征信息中的所述第一特征信息及所述第二特征信息，训练输出与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重；其中，所述第二向量权重用于对所述第二网络输出的用户转化率向量加权，构建用于优化所述第二网络的转化损失函数；所述第一向量权重用于对所述第一网络输出的用户点击率向量加权，构建用于优化所述第一网络的点击损失函数；及
[0178]
所述第一网络输出的用户点击率向量进行所述第一向量权重加权和所述第二网络输出的用户转化率向量进行所述第二向量权重加权，构建用于优化所述自适应权重网络的点击转化损失函数。
[0179]
在示例性实施例中，如图3所示，输入预测模型的样本用户的用户特征信息至少包括用户特征、用户点击操作对应的项目特征及与项目相关的其他特征，包括生成要素特征等。用户特征包括用户年龄、性别、工作等。用户点击操作对应的项目特征包括文字、视频等用来承载广告信息的特征等。与项目相关的生成要素特征包括发布广告的位置、方式、时间等。
[0180]
在示例性实施例中，针对多目标训练的独立硬计算问题，比如mmoe (modeling task relationships in multi-task learning with multi-gatemixture-of-experts，多任务学习模型)等框架，本技术中自适应权重网络会根据样本，第一特征信息及所述第二特征信息生成ctr、cvr的模型权重表示，即与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重。将模型的输出结果进行调整，其中生成ctr、cvr权重的特征并不是根据人工经验选择的，而是根据自适应权重网络中的feature select gate特征选择门自动选择。每个目标有自己个性化的特征筛选，并且随着训练而自适应改变特征的比重。权重网络筛选完特征后，会经过一个低阶+全链接的网络进行训练，相比于全连接网络会考虑特征的低阶表示，最终权重和目标结合生成与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重。此时cvr的模型即第二网络训练因为自适应权重网络也可以学习到展示空间的样本分布，并且在预测的时候，cvr的预测使用的是第二向量权重调节后的cvr 第二网络模型，因为考虑了ctr的部分影响，更符合cvr实际偏差，因此解决了数据偏差的问题。
[0181]
本技术实施例的信息预测模型用于：输入样本用户的用户特征信息至所述预测模型的共享嵌入层网络，所述用户特征信息至少包括用户进行点击操作的操作信息；基于第一网络在所述共享嵌入层网络中提取所述用户特征信息中的第一特征信息，及基于所述第一特征信息，训练所述第一网络，输出用户点击率向量，其中所述第一特征信息为所述用户特征信息中与所述用户进行点击操作有关的特征信息；基于第二网络在所述共享嵌入层网络中提取所述用户特征信息中的第二特征信息，及基于所述第二特征信息，训练所述第二网络，输出用户转化率向量，其中所述第二特征信息为所述用户特征信息中与所述用户进行点击转化有关的特征信息；基于自适应权重网络，在所述共享嵌入层网络中提取所述用户特征信息中的所述第一特征信息及所述第二特征信息，训练所述自适应权重网络，输出与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权重；基于所述用户转化率向量，经所述第二向量权重加权，得到加权后的用户转化率向量weight_pcvr；基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络。本技术中在进行多目标训练时，在预测模型中采用自适应权重网络自适应提取用户特征信息中的与所述用户进行点击操作有关的第一特征信息及与所述用户进行点击转化有关的第二特征信息，训练输出与第二特征信息对应的第二向量权重。通过自适应权重网络自适应训练得到的第二向量权重能够用于调整样本数据中用户点击操作及未点击操作对应的样本数据对用户点击操作后转换率预测的影响，来减少训练样本数据与实际预测数据由于数据分布不同造成的对转换率预测时存在的数据选择偏差。然后通过用户转化率向量，经所述第二向量权重加权，得到加权后的用户转化率向量；基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络。如此，通过结合已经减少了训练样本数据与实际预测数据由于数据分布不同造成的对转换率预测时存在的数据选择偏差获得的转化损失函数来作为目标优化函数，训练所述第二网络，有利于提高第二网络的训练质量，提高通过训练的第二网络对实际预测数据进行预测时的准确度。
[0182]
本技术实施例第四方面提供的一种预测模型的训练装置。图4是根据一示例性实施例示出的预测模型的训练装置的结构示意图。如图4所示，包括：
[0183]
第一处理单元41，用于输入样本用户的用户特征信息至所述预测模型的共享嵌入层网络，所述用户特征信息至少包括用户进行点击操作的操作信息；
[0184]
第二处理单元42，用于基于第一网络在所述共享嵌入层网络中提取所述用户特征信息中的第一特征信息，及基于所述第一特征信息，训练所述第一网络，输出用户点击率向量，其中所述第一特征信息为所述用户特征信息中与所述用户进行点击操作有关的特征信息；
[0185]
第三处理单元43，用于基于第二网络在所述共享嵌入层网络中提取所述用户特征信息中的第二特征信息，及基于所述第二特征信息，训练所述第二网络，输出用户转化率向量，其中所述第二特征信息为所述用户特征信息中与所述用户进行点击转化有关的特征信息；
[0186]
第四处理单元44，用于基于自适应权重网络，在所述共享嵌入层网络中提取所述用户特征信息中的所述第一特征信息及所述第二特征信息，训练所述自适应权重网络，输出与所述第一特征信息对应的第一向量权重及与所述第二特征信息对应的第二向量权
整样本数据中用户点击操作及未点击操作对应的样本数据对用户点击操作后转换率预测的影响，来减少训练样本数据与实际预测数据由于数据分布不同造成的对转换率预测时存在的数据选择偏差。然后通过用户转化率向量，经所述第二向量权重加权，得到加权后的用户转化率向量；基于由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练所述第二网络。如此，通过结合已经减少了训练样本数据与实际预测数据由于数据分布不同造成的对转换率预测时存在的数据选择偏差获得的转化损失函数来作为目标优化函数，训练所述第二网络，有利于提高第二网络的训练质量，提高通过训练的第二网络对实际预测数据进行预测时的准确度。
[0192]
在一个实施例中，所述第五处理单元，用于
[0193]
基于所述用户点击率向量，经所述第一向量权重加权，得到加权后的用户点击率向量；
[0194]
基于所述加权后的用户点击率向量及所述加权后的用户转化率向量，拟合得到点击转化率；
[0195]
基于所述点击转化率，构建点击转化损失函数；
[0196]
基于所述转化损失函数及所述点击转化损失函数，构建第一损失函数；
[0197]
所述第六处理单元，用于
[0198]
基于所述第一损失函数作为所述目标优化函数，训练所述第二网络。
[0199]
在一个实施例中，所述第五处理单元，用于
[0200]
基于所述加权后的用户点击率向量，构建点击损失函数；
[0201]
基于所述点击损失函数及所述点击转化损失函数，构建第二损失函数；
[0202]
所述第六处理单元，用于
[0203]
基于所述第二损失函数作为所述目标优化函数，训练所述第一网络。
[0204]
在一个实施例中，所述第五处理单元，用于
[0205]
基于所述点击损失函数、所述转化损失函数及所述点击转化损失函数，构建第三损失函数；
[0206]
所述第六处理单元，用于
[0207]
基于所述第三损失函数，作为所述目标优化函数，训练所述自适应权重网络。在示例性实施例中，在训练自适应权重网络时，可将第三损失函数作为目标优化函数，来优化自适应权重网络。第三损失函数可通过累加点击损失函数、所述转化损失函数及所述点击转化损失函数得到。
[0208]
在示例性实施例中，所述第五处理单元，用于
[0209]
预先确定出所述样本用户对应点击操作的点击标签、所述样本用户对应转化的转化标签及所述样本用户对应点击转化的点击转化标签；
[0210]
基于所述加权后的用户点击率向量及所述样本用户对应点击操作的点击标签，构建所述点击损失函数；
[0211]
基于所述点击转化率及所述样本用户对应点击转化的点击转化标签，构建所述点击转化损失函数；
[0212]
基于所述加权后的用户转化率向量及所述样本用户对应转化的转化标签，构建所述转化损失函数。
[0213]
在示例性实施例中，所述第五处理单元，用于
[0214]
根据所述点击标签对应的张量，确定出与所述点击损失函数对应的第一自适应权重；
[0215]
根据所述转化标签对应的张量，确定出与所述转化损失函数对应的第二自适应权重；
[0216]
根据所述点击转化标签对应的张量，确定出与所述点击转化损失函数对应的第三自适应权重；
[0217]
对所述点击损失函数进行第一自适应权重加权；
[0218]
对点击转化损失函数进行第三自适应权重加权；
[0219]
基于所述第一自适应权重加权后的点击损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第二损失函数；
[0220]
对所述转化损失函数进行第二自适应权重加权；
[0221]
基于所述第二自适应权重加权后的转化损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第一损失函数；
[0222]
基于所述第一自适应权重加权后的点击损失函数、所述第二自适应权重加权后的转化损失函数、所述第三自适应权重加权后的点击转化损失函数，构建所述第三损失函数。
[0223]
本技术实施例第五方面提供的一种信息预测装置。图5是根据一示例性实施例示出的信息预测装置结构示意图。如图5所示，包括：
[0224]
第一处理单元51，用于获取待预测的用户的用户特征信息，所述用户特征信息至少包括用户进行点击操作的操作信息；
[0225]
第二处理单元52，用于输入所述用户特征信息至上述第一方面实施例所述的预测模型；
[0226]
第三处理单元53，用于基于所述预测模型中的第一网络，预测所述用户的点击率；
[0227]
第四处理单元54，用于基于所述预测模型中的第二网络，预测所述用户点击操作的转化率，其中，所述第二网络由所述加权后的用户转化率向量构建得到的转化损失函数，作为目标优化函数，训练得到。
[0228]
本技术实施例第六方面提供的一种服务器，包括：处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，所述处理器用于运行所述计算机程序时，执行上述第一方面和第二方面实施例所述方法的步骤。
[0229]
本技术实施例第七方面提供的一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述第一方面和第二方面实施例所述方法的步骤。
[0230]
本技术还提供一种服务器。图6是根据一示例性实施例示出的服务器结构示意图。如图6所示，本技术实施例提供的服务器，包括：处理器530和用于存储能够在处理器上运行的计算机程序的存储器520，其中，所述处理器530 用于运行所述计算机程序时，执行上述各实施例提供所述方法的步骤。
[0231]
本技术还提供一种计算机可读存储介质。本技术实施例提供的计算机可读存储
介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各实施例提供所述方法的步骤。
[0232]
在本技术所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。
[0233]
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
[0234]
另外，在本发明各实施例中的各功能单元可以全部集成在一个处理模块中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。
[0235]
在一些情况下，上述任一两个技术特征不冲突的情况下，可以组合成新的方法技术方案。
[0236]
在一些情况下，上述任一两个技术特征不冲突的情况下，可以组合成新的设备技术方案。
[0237]
本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0238]
以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘文哲金长虎
技术所有人：北京快乐茄信息技术有限公司
我是此专利的发明人

上一篇：用于预防和治疗EB病毒感染及相关疾病的表位肽及抗体
上一篇：一种基坑变形监测装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。