一种基于元学习和领域自适应的多场景推荐方法

文档序号：37014337发布日期：2024-02-09 13:04阅读：20来源：国知局

本发明涉及数据处理，特别是指一种基于元学习和领域自适应的多场景推荐方法。

背景技术：

1、在推荐算法场景中，丰富的小场景给推荐系统带来了更高的复杂性和挑战性。为了更好地满足用户的个性化需求和提高推荐准确性，我们需要寻找一种有效的解决方案来处理这些小场景。

2、传统的推荐算法通常采用单独训练模型的方式，即针对每个小场景分别训练一个模型。然而，这种方法存在一些明显的缺点。首先，由于每个场景的数据量相对较小，模型的学习能力受到限制，无法充分挖掘数据的潜在特征。其次，维护多个模型需要耗费大量的人力资源和机器资源，增加了系统的开销和复杂性。另一种方法是多个小场景联合训练一个模型，通过共享模型参数来提高模型的泛化能力。然而，这种方法存在一个局限性。一旦某个场景的样本占据主导地位，模型会更加关注这个场景的特征，而忽略其他小场景的个性化表征。这会对推荐系统的性能产生负面影响，尤其是对于那些长尾场景的用户。

技术实现思路

1、本发明要解决的技术问题是提供一种基于元学习和领域自适应的多场景推荐方法，可以有效地处理推荐业务中的丰富小场景，提高推荐系统的性能和用户满意度，可以减小模型的学习难度，还可以更好地捕捉每个小场景的个性化特征，从而为用户提供更精准的推荐服务。

2、为解决上述技术问题，本发明的技术方案如下：

3、一种基于元学习和领域自适应的多场景推荐方法，所述方法包括：

4、收集和整理已完成的任务，作为元知识的基础；

5、使用已有的或采样得到的训练任务的支撑集训练模型，并通过计算模型在查询集上的损失来更新元知识；

6、利用学习到的元知识，在meta-testing的任务的支撑集上训练模型，并在查询集上预测结果。

7、进一步的，利用学习到的元知识，在meta-testing的任务的支撑集上训练模型，包括：

8、对于第d个领域，将训练数据集分为两部分：支持集和查询集

9、用参数θ评估模型fθ(·)的排序评分，θd是领域定制模型的参数，通过元学习方法，在领域d上通过以下公式更新θd：超参数α是元训练的步长，是支持集上的损失，包括领域自适应损失和预测损失，表示为：

10、

11、

12、其中，表示在预测和标签y上计算损失，表示源领域数据和目标领域数据之间的距离；超参数λ表示领域适应的强烈程度；在用更新后的模型参数θd计算目标之后，元优化会更新模型参数θ：

13、

14、其中，β表示学习率，表示使用参数θd在查询集上的预测损失。

15、进一步的，收集和整理已完成的任务，作为元知识的基础，包括：

16、将数据定义为{xd，xc，y}，用nd表示域的数量；

17、其中，表示域标识符和域特定特征；是所有域共有的特征集，表示所有域的标签空间，多领域模型的目标是学习一个评分函数来为所有领域的评分分数进行排序。

18、进一步的，使用已有的或采样得到的训练任务的支撑集训练模型之前，还包括：

19、将数值特征转换为类别类型；

20、使用独热编码将每个类别转换为一个向量；

21、通过线性变换将向量转换为固定的维度，得到公共特征的嵌入表示。

22、进一步的，领域特定特征嵌入部分处理在特定领域中存在的特征，具体包括：

23、根据领域特定的特征字典对特征进行编码，将编码后的二进制向量通过非线性变换进行转化，以生成嵌入表示。

24、进一步的，将公共特征的嵌入向量ec组成如下：

25、

26、其中，nc是公共特征的数量，wi是每个公共特征的权重，领域特定特征的嵌入ed的计算公式为：

27、

28、其中，ec和ed被用作模型中不同结构的输入。

29、进一步的，根据公共特征的嵌入向量ec以及领域特定特征的嵌入向量ed，以mmoe模块输出的特征表示的公式如下：

30、

31、其中，ne是专家网络的数量，gate[i]是第i个专家网络的门单元值，门单元评估了每个专家网络对特定任务的重要性得分，门单元定义为：

32、gate(ed)＝softmax(wded),

33、其中，wd是专家网络的门单元的学习参数。

34、本发明的上述方案至少包括以下有益效果：

35、本发明的上述方案，可以有效地处理推荐业务中的丰富小场景，提高推荐系统的性能和用户满意度，可以减小模型的学习难度，还可以更好地捕捉每个小场景的个性化特征，从而为用户提供更精准的推荐服务。

技术特征：

1.一种基于元学习和领域自适应的多场景推荐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于元学习和领域自适应的多场景推荐方法，其特征在于，利用学习到的元知识，在meta-testing的任务的支撑集上训练模型，包括：

3.根据权利要求2所述的基于元学习和领域自适应的多场景推荐方法，其特征在于，收集和整理已完成的任务，作为元知识的基础，包括：

4.根据权利要求3所述的基于元学习和领域自适应的多场景推荐方法，其特征在于，使用已有的或采样得到的训练任务的支撑集训练模型之前，还包括：

5.根据权利要求4所述的基于元学习和领域自适应的多场景推荐方法，其特征在于，领域特定特征嵌入部分处理在特定领域中存在的特征，具体包括：

6.根据权利要求5所述的基于元学习和领域自适应的多场景推荐方法，其特征在于，对于公共特征，将公共特征的嵌入向量ec组成如下：

7.根据权利要求6所述的基于元学习和领域自适应的多场景推荐方法，其特征在于，根据公共特征的嵌入向量ec以及领域特定特征的嵌入向量ed，以mmoe模块输出的特征表示的公式如下：

技术总结
本发明提供一种基于元学习和领域自适应的多场景推荐方法，涉及数据处理技术领域，所述方法包括：收集和整理已完成的任务，作为元知识的基础；使用已有的或采样得到的训练任务的支撑集训练模型，并通过计算模型在查询集上的损失来更新元知识；利用学习到的元知识，在Meta‑Testing的任务的支撑集上训练模型，并在查询集上预测结果。本发明可以有效地处理推荐业务中的丰富小场景，提高推荐系统的性能和用户满意度，可以减小模型的学习难度，还可以更好地捕捉每个小场景的个性化特征，从而为用户提供更精准的推荐服务。

技术研发人员：夏子翰,梁克维
受保护的技术使用者：浙江大学
技术研发日：
技术公布日：2024/2/8

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：夏子翰,梁克维
技术所有人：浙江大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。