推荐信息预测方法、装置以及电子设备与流程

文档序号：37352083发布日期：2024-03-18 18:33阅读：11来源：国知局

本申请涉及计算机，更具体地，涉及一种推荐信息预测方法、装置以及电子设备。

背景技术：

1、随着科技的进步，人们日常生活日益丰富多元，每时每刻都会做出不同的行为，并伴随着各类数据。这些数据可以包含并体现着用户的个性、偏好、倾向等。在相关方式中，可以通过这些数据和多分类模型预测用户感兴趣的推荐信息。但相关方式中，还存在预测的推荐信息不准确的问题。

技术实现思路

1、鉴于上述问题，本申请提出了一种推荐信息预测方法、装置以及电子设备，以实现改善上述问题。

2、第一方面，本申请提供了一种推荐信息预测方法，所述方法包括：获取用户信息，所述用户信息包括用户画像信息、多个候选推荐信息和当前参考信息，所述多个候选推荐信息对应有标签，且所述多个候选推荐信息基于用户历史行为得到；基于所述用户画像信息、所述候选推荐信息和所述当前参考信息，得到提示词；将所述提示词输入大语言模型，得到所述用户信息对应的预测标签；将所述预测标签与所述多个候选推荐信息各自对应的标签匹配，若匹配成功，将匹配成功的标签对应的候选推荐信息作为所述用户信息对应的目标推荐信息。

3、第二方面，本申请提供了一种推荐信息预测装置，所述装置包括：用户信息获取单元，用于获取用户信息，所述用户信息包括用户画像信息、多个候选推荐信息和当前参考信息，所述多个候选推荐信息对应有标签，且所述多个候选推荐信息基于用户历史行为得到；提示词获取单元，用于基于所述用户画像信息、所述候选推荐信息和所述当前参考信息，得到提示词；目标推荐信息获取单元，用于将所述提示词输入大语言模型，得到所述用户信息对应的预测标签；将所述预测标签与所述多个候选推荐信息各自对应的标签匹配，若匹配成功，将匹配成功的标签对应的候选推荐信息作为所述用户信息对应的目标推荐信息。

4、第三方面，本申请提供了一种电子设备，包括一个或多个处理器以及存储器；一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行上述的方法。

5、第四方面，本申请提供的一种计算机可读存储介质，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码运行时执行上述的方法。

6、本申请提供的一种推荐信息预测方法、装置、电子设备以及存储介质，在获取包括用户画像信息、多个候选推荐信息和当前参考信息的用户信息后，基于所述用户画像信息、所述候选推荐信息和所述当前参考信息，得到提示词；将所述提示词输入大语言模型，得到所述用户信息对应的预测标签；将所述预测标签与所述多个候选推荐信息各自对应的标签匹配，若匹配成功，将匹配成功的标签对应的候选推荐信息作为所述用户信息对应的目标推荐信息。通过上述方式使得，可以基于用户画像信息、多个候选推荐信息和当前参考信息，得到提示词，并将提示词输入大语言模型，得到预测标签，再判断预测标签是否与候选推荐信息匹配，基于匹配结果得到对应的目标推荐信息，从而实现将目标推荐信息限定在多个候选推荐信息或者除了多个候选推荐信息以外的一个推荐信息中，从而降低了模型的预测难度，并且候选推荐信息与用户历史行为相关，从而为模型预测提供了更符合用户习惯的信息，进而提高了模型预测的准确性并得到更准确的目标推荐信息。

技术特征：

1.一种推荐信息预测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述预设映射关系表征预测标签与预设推荐信息相匹配，所述若匹配失败，基于预设映射关系，得到所述目标推荐信息，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于所述用户画像信息、所述候选推荐信息和所述当前参考信息，得到提示词，包括：

5.根据权利要求1所述的方法，其特征在于，所述用户信息还包括补充候选推荐信息，所述补充候选推荐信息对应有标签，所述基于所述用户画像信息、所述多个候选推荐信息和所述当前参考信息，得到提示词，包括：

6.根据权利要求1-5任一所述的方法，其特征在于，所述若匹配失败，基于预设映射关系，得到所述目标推荐信息之后，还包括：

7.根据权利要求1-5任一所述的方法，其特征在于，所述多个候选推荐信息基于所述用户历史行为和预设召回策略得到。

8.根据权利要求1-5任一所述的方法，其特征在于，所述获取用户信息之前，还包括：

9.根据权利要求8所述的方法，其特征在于，所述基于所述训练数据集对待训练大语言模型进行训练，得到所述大语言模型，包括：

10.根据权利要求9所述的方法，其特征在于，所述训练子集包括多个样本序列、所述多个样本序列各自对应的真实标签、用户画像信息、候选推荐信息，所述在当前轮次训练过程中，基于当前轮次对应的训练子集和损失函数对当前轮次对应的待训练大语言模型进行训练，得到当前轮次对应的大语言模型，包括：

11.根据权利要求10所述的方法，其特征在于，所述基于所述多个样本序列各自对应的预测标签、真实标签和所述损失函数，对所述当前轮次对应的待训练大语言模型进行训练，得到所述当前轮次对应的大语言模型，包括：

12.根据权利要求11所述的方法，其特征在于，每个所述样本序列包含多个样本，所述多个样本各自对应有预测标签和真实标签，每个所述样本的真实标签表征对应样本序列中的下一样本，所述基于所述多个样本序列各自对应的预测标签和真实标签，得到第一损失函数，包括：

13.根据权利要求10所述的方法，其特征在于，每个所述样本序列包含多个样本，所述多个样本各自对应有预测标签和真实标签，每个所述样本的真实标签表征对应样本序列中的下一样本，所述当前轮次训练过程包含多个样本序列训练过程，所述在所述当前轮次训练过程中，将所述多个样本序列各自对应的提示词输入所述当前轮次对应的待训练大语言模型，得到所述多个样本序列各自对应的预测标签，包括：

14.一种推荐信息预测装置，其特征在于，所述装置包括：

15.一种电子设备，其特征在于，包括一个或多个处理器以及存储器；

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码运行时执行权利要求1-13任一所述的方法。

技术总结
本申请实施例公开了一种推荐信息预测方法、装置以及电子设备。所述方法包括：获取用户信息；基于用户画像信息、候选推荐信息和当前参考信息，得到提示词；将提示词输入大语言模型，得到用户信息对应的预测标签；将预测标签与多个候选推荐信息各自对应的标签匹配，若匹配成功，将匹配成功的标签对应的候选推荐信息作为用户信息对应的目标推荐信息。通过上述方式使得，可以在得到预测标签后，判断预测标签是否与候选推荐信息匹配，基于匹配结果得到对应的目标推荐信息，从而实现将目标推荐信息限定在多个候选推荐信息或者除了多个候选推荐信息以外的一个推荐信息中，从而降低了模型的预测难度，以便于得到更准确的目标推荐信息。

技术研发人员：袁裕清,宋超,林鹏
受保护的技术使用者：OPPO广东移动通信有限公司
技术研发日：
技术公布日：2024/3/17

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：袁裕清,宋超,林鹏
技术所有人：OPPO广东移动通信有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。