一种处理推送信息的方法和装置与流程

文档序号:35671561发布日期:2023-10-07 20:26阅读:18来源:国知局
一种处理推送信息的方法和装置与流程

本发明涉及人工智能,尤其涉及一种处理推送信息的方法和装置。


背景技术:

1、在互联网应用的多种场景中,需要为用户端发送针对推荐对象比如实体物品、虚拟物品、新闻、视频等的推送信息,以达到对推荐对象的推广或者传播的效果。

2、目前,往往通过模型比如文本处理模型构建针对推荐对象的推送信息,现有的模型通常是针对单一的推荐对象构建推送信息,无法挖掘多个推荐对象之间的关联性,因此也无法在推送信息中包含多个物品之间的关联信息,导致发送给用户端的推送信息的推荐信息量较低的问题。


技术实现思路

1、有鉴于此,本发明实施例提供一种处理推送信息的方法和装置,能够基于待推荐对象的原始对象信息,利用预设的信息生成模型输出对应于多个待推荐对象的推送信息,推送信息包含了多个原始对象信息之间的关联信息,并将推送信息发送给用户端;本发明的实施例通过挖掘待推荐对象之间的关联性并生成包含关联信息的推送信息,提高了发送给用户端的推送信息的推荐信息量,提高了用户体验。

2、为实现上述目的,根据本发明实施例的一个方面,提供了一种处理推送信息的方法,其特征在于,包括:确定多个待推荐对象的原始对象信息;将多个所述原始对象信息,输入预设的信息生成模型;其中,所述预设的信息生成模型通过预设网络模型结合预设损失函数确定出,所述预设网络模型由多个对象样本信息之间的关联信息训练,所述预设损失函数用于评估训练的所述预设网络模型;利用多个所述原始对象信息和所述预设的信息生成模型,生成对应于多个所述原始对象信息的推送信息;其中,所述推送信息包含多个所述原始对象信息之间的关联信息,以将所述推送信息发送给用户端。

3、可选地,所述预设网络模型包括训练出的编码器和训练出的解码器;所述生成对应于多个所述原始对象信息的推送信息,包括:将所述多个原始对象信息输入所述训练出的编码器,生成第一隐层序列;利用所述训练出的解码器、所述第一隐层序列以及针对至少一种所述待推荐对象的预设参考推送信息,生成第二隐层序列;结合所述第一隐层序列以及所述第二隐层序列,计算推送信息的解码概率;基于计算出的所述解码概率,确定出对应于多个所述原始对象信息的推送信息。

4、可选地,所述训练出的解码器设置有预设初始向量;所述预设初始向量为结合所述原始对象信息包含的图像信息以及描述信息所构建出的;所述生成第二隐层序列,包括:利用所述训练出的解码器、所述训练出的解码器包含的所述预设初始向量,结合所述第一隐层序列以及针对至少一种所述待推荐对象的预设参考推送信息,生成第二隐层序列。

5、可选地,所述处理推送信息的方法,还包括:获取所述原始对象信息包含的描述信息以及图像信息;分别利用所述描述信息和所述图像信息为所述原始对象信息转换出文本向量和图像向量;利用平均池化模型对所述图像向量执行降维操作;根据所述原始对象信息包含的描述信息以及图像信息,确定指示文本和图像的影响程度的权重值;利用所述权重值、所述文本向量以及降维后的图像向量,构建出设置于所述解码器内的预设初始向量。

6、可选地,所述处理推送信息的方法,进一步包括:所述预设损失函数通过强化学习损失函数和极大似然函数进行线性叠加得到;其中,所述强化学习损失函数包含针对每一个训练周期得到的训练结果包含的关联信息的关联奖励函数;在训练所述预设的推荐模型的过程中,利用所述强化学习损失函数包含的关联奖励函数以及所述极大似然函数,评估训练的所述预设网络模型针对多个所述对象样本信息输出每一个训练周期得到的训练结果。

7、可选地,所述处理推送信息的方法,进一步包括:所述强化学习损失函数包含所述关联奖励函数以及预设奖励损失函数;利用关联奖励函数确定每一个所述训练结果中包含的关联信息与初始关联信息构建出的奖励系数;其中,所述关联信息通过模型解码贪心搜索算法和/或模型后验概率采样算法从每一个所述训练周期的训练结果中确定出;所述评估训练的所述预设网络模型针对多个所述对象样本信息输出每一个训练周期得到的训练结果,包括:结合所述奖励系数以及所述预设奖励损失函数,评估训练的所述预设网络模型针对多个所述对象样本信息输出每一个训练周期得到的训练结果。

8、可选地,所述处理推送信息的方法,进一步包括:针对通过模型解码贪心搜索算法或模型后验概率采样算法确定出每一个所述训练周期的训练结果包含的关联信息的情况下,所述利用关联奖励函数确定每一个所述训练结果中包含的关联信息与初始关联信息构建出的奖励系数,包括:利用关联奖励函数确定每一个所述训练周期的训练结果包含的关联信息的数量与所述初始关联信息的数量之间的比值为每一个所述训练周期的奖励系数。

9、可选地,所述处理推送信息的方法,进一步包括:在通过模型解码贪心搜索算法和模型后验概率采样算法确定出每一个所述训练周期的训练结果包含的关联信息的情况下,所述利用关联奖励函数确定每一个所述训练结果中包含的关联信息与初始关联信息构建出的奖励系数,包括:利用关联奖励函数计算所述模型解码贪心搜索算法确定出每一个所述训练周期的关联信息与所述模型后验概率采样算法确定出每一个所述训练周期的关联信息之间的差别信息;确定每一个所述训练周期的差别信息的数量与所述初始关联信息的数量之间的比值为每一个所述训练周期的奖励系数。

10、为实现上述目的,根据本发明实施例的第二方面,提供了一种处理推送信息的装置,其特征在于,包括:确定信息模块、获取模型模块和推送信息模块;其中,

11、所述确定信息模块,用于确定多个待推荐对象的原始对象信息;

12、所述获取模型模块,用于将多个所述原始对象信息,输入预设的信息生成模型;其中,所述预设的信息生成模型通过预设网络模型结合预设损失函数确定出,所述预设网络模型由多个对象样本信息之间的关联信息训练,所述预设损失函数用于评估训练的所述预设网络模型;

13、所述推送信息模块,用于利用多个所述原始对象信息和所述预设的信息生成模型,生成对应于多个所述原始对象信息的推送信息;其中,所述推送信息包含多个所述原始对象信息之间的关联信息,以将所述推送信息发送给用户端。

14、可选地,所述处理推送信息的装置包含的所述预设网络模型包括训练出的编码器和训练出的解码器;所述生成对应于多个所述原始对象信息的推送信息,包括:将所述多个原始对象信息输入所述训练出的编码器,生成第一隐层序列;利用所述训练出的解码器、所述第一隐层序列以及针对至少一种所述待推荐对象的预设参考推送信息,生成第二隐层序列;结合所述第一隐层序列以及所述第二隐层序列,计算推送信息的解码概率;基于计算出的所述解码概率,确定出对应于多个所述原始对象信息的推送信息。

15、可选地,所述处理推送信息的装置包含的所述训练出的解码器设置有预设初始向量;所述预设初始向量为结合所述原始对象信息包含的图像信息以及描述信息所构建出的;所述生成第二隐层序列,包括:利用所述训练出的解码器、所述训练出的解码器包含的所述预设初始向量,结合所述第一隐层序列以及针对至少一种所述待推荐对象的预设参考推送信息,生成第二隐层序列。

16、可选地,所述处理推送信息的装置,还用于获取所述原始对象信息包含的描述信息以及图像信息;分别利用所述描述信息和所述图像信息为所述原始对象信息转换出文本向量和图像向量;利用平均池化模型对所述图像向量执行降维操作;根据所述原始对象信息包含的描述信息以及图像信息,确定指示文本和图像的影响程度的权重值;利用所述权重值、所述文本向量以及降维后的图像向量,构建出设置于所述解码器内的预设初始向量。

17、可选地,所述处理推送信息的装置,进一步用于所述预设损失函数通过强化学习损失函数和极大似然函数进行线性叠加得到;其中,所述强化学习损失函数包含针对每一个训练周期得到的训练结果包含的关联信息的关联奖励函数;在训练所述预设的推荐模型的过程中,利用所述强化学习损失函数包含的关联奖励函数以及所述极大似然函数,评估训练的所述预设网络模型针对多个所述对象样本信息输出每一个训练周期得到的训练结果。

18、可选地,所述处理推送信息的装置,进一步包括所述强化学习损失函数包含所述关联奖励函数以及预设奖励损失函数;利用关联奖励函数确定每一个所述训练结果中包含的关联信息与初始关联信息构建出的奖励系数;其中,所述关联信息通过模型解码贪心搜索算法和/或模型后验概率采样算法从每一个所述训练周期的训练结果中确定出;所述评估训练的所述预设网络模型针对多个所述对象样本信息输出每一个训练周期得到的训练结果,包括:结合所述奖励系数以及所述预设奖励损失函数,评估训练的所述预设网络模型针对多个所述对象样本信息输出每一个训练周期得到的训练结果。

19、可选地,所述处理推送信息的装置,进一步用于针对通过模型解码贪心搜索算法或模型后验概率采样算法确定出每一个所述训练周期的训练结果包含的关联信息的情况下,所述利用关联奖励函数确定每一个所述训练结果中包含的关联信息与初始关联信息构建出的奖励系数,包括:利用关联奖励函数确定每一个所述训练周期的训练结果包含的关联信息的数量与所述初始关联信息的数量之间的比值为每一个所述训练周期的奖励系数。

20、可选地,所述处理推送信息的装置,进一步用于在通过模型解码贪心搜索算法和模型后验概率采样算法确定出每一个所述训练周期的训练结果包含的关联信息的情况下,所述利用关联奖励函数确定每一个所述训练结果中包含的关联信息与初始关联信息构建出的奖励系数,包括:利用关联奖励函数计算所述模型解码贪心搜索算法确定出每一个所述训练周期的关联信息与所述模型后验概率采样算法确定出每一个所述训练周期的关联信息之间的差别信息;确定每一个所述训练周期的差别信息的数量与所述初始关联信息的数量之间的比值为每一个所述训练周期的奖励系数。

21、为实现上述目的,根据本发明实施例的第三方面,提供了一种处理推送信息的电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述处理推送信息的方法中任一所述的方法。

22、为实现上述目的,根据本发明实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如上述处理推送信息的方法中任一所述的方法。

23、上述发明中的一个实施例具有如下优点或有益效果:能够基于待推荐对象的原始对象信息,利用预设的信息生成模型输出对应于多个待推荐对象的推送信息,推送信息包含了多个原始对象信息之间的关联信息,并将推送信息发送给用户端;本发明的实施例通过挖掘待推荐对象之间的关联性并生成包含关联信息的推送信息,提高了发送给用户端的推送信息的推荐信息量,提高了用户体验。

24、上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1