推荐模型训练方法、歌单推荐方法、装置、介质及设备与流程

文档序号:36202087发布日期:2023-11-30 03:32阅读:35来源:国知局
推荐模型训练方法与流程

本公开的实施方式涉及计算机,更具体地,本公开的实施方式涉及推荐模型训练方法、歌单推荐方法、装置、存储介质及电子设备。


背景技术:

1、本部分旨在为权利要求中陈述的本公开的实施方式提供背景或上下文,此处的描述不因为包括在本部分中就承认是现有技术。

2、歌单是歌曲的集合,可以根据歌曲的歌词、歌手、编曲风格、发行时间等因素对歌曲进行划分获得。在音乐平台中,可以由用户基于歌曲偏好、播放场景等自身需求创建歌单,也可以通过算法对不同因素的歌曲进行归类、聚合等,进而获得对应的歌单。在此基础上,可以基于用户对歌曲、歌单的历史点击、播放、收藏等行为,对用户进行个性化歌单推荐。

3、但是,在目前向用户针对性推荐歌单时,推荐结果的准确性、转化率等还有待进一步提高。


技术实现思路

1、在本上下文中,本公开的实施方式期望提供一种推荐模型训练方法、歌单推荐方法、装置、存储介质及电子设备。

2、根据本公开实施方式的第一方面,提供一种推荐模型训练方法,该方法可以包括:对样本用户采集第一歌单评分特征,第一歌单评分特征包括样本用户的第一用户行为特征、第一用户属性特征;构建样本用户对应的样本歌单;将第一歌单评分特征、样本歌单输入推荐模型,以通过推荐模型确定第一用户行为特征、第一用户属性特征分别与每一样本歌单的匹配分,并对各样本歌单的匹配分分别进行融合,获得推荐模型输出的样本歌单对应的第一目标匹配分;基于第一目标匹配分对推荐模型进行参数更新,直至推荐模型符合收敛条件。

3、可选地,第一用户行为特征包括用户长期行为特征、用户短期行为特征,对样本用户采集第一歌单评分特征,包括:根据样本用户在第一时间段内交互的第一对象,获得用户长期行为特征;根据样本用户在第二时间段内交互的第一对象,获得用户短期行为特征,第一时间段长于第二时间段,第一对象包括样本用户交互的歌曲、歌单中的至少一种。

4、可选地,对样本用户采集第一歌单评分特征,还包括:根据样本用户在第三时间段内与第一对象的交互总次数,获得样本用户对应的第一用户属性特征。

5、可选地,样本歌单包括正样本与负样本,构建样本用户对应的样本歌单包括:确定样本用户在第四时间段内与第二对象的交互次数,第二对象包括样本用户交互的歌单;在交互次数大于或等于分类阈值的情况下,确定第二对象为正样本;在交互次数小于分类阈值的情况下,确定第二对象为负样本。

6、可选地,推荐模型包括动态权要网络、行为特征匹配网络、属性特征匹配网络,将第一歌单评分特征、样本歌单输入推荐模型,以通过推荐模型确定第一用户行为特征、第一用户属性特征分别与每一样本歌单的匹配分,并对各样本歌单的匹配分进行融合,获得推荐模型输出的样本歌单对应的第一目标匹配分,包括:将第一歌单评分特征、样本歌单输入推荐模型,以通过推荐模型的动态权重网络确定第一用户行为特征、第一用户属性特征分别对应的融合权重,行为特征匹配网络确定第一用户行为特征与每一样本歌单分别对应的匹配分,属性特征匹配网络确定第一用户属性特征与每一样本歌单分别对应的匹配分,再基于融合权重对各样本歌单对应的匹配分进行加权融合,获得推荐模型输出的样本歌单对应的第一目标匹配分。

7、可选地,第一用户行为特征包括用户长期行为特征、用户短期行为特征,行为特征匹配网络包括长期行为特征匹配网络、短期行为特征匹配网络,行为特征匹配网络确定第一用户行为特征对样本歌单的匹配分,包括:长期行为特征匹配网络通过transformer结构对用户长期行为特征进行信息提取,再通过多层感知器分别融合每一样本歌单,获得用户长期行为特征分别与各样本歌单对应的匹配分;短期行为特征匹配网络通过self-attention结构对用户短期行为特征进行信息提取,再通过多层感知器分别融合每一样本歌单,获得用户短期行为特征分别与各样本歌单对应的匹配分。

8、根据本公开实施方式的第二方面,提供一种歌单推荐方法,该方法可以包括:对目标用户采集第二歌单评分特征,并获得目标用户对应的至少一个候选歌单,第二歌单评分特征包括第二用户行为特征、第二用户属性特征;将第二歌单评分特征、候选歌单输入推荐模型,以通过推荐模型确定第二用户行为特征、第二用户属性特征分别对每一候选歌单的匹配分,并对各候选歌单的匹配分分别进行融合,获得推荐模型输出的候选歌单对应的第二目标匹配分,推荐模型通过前述第一方面所述的方法训练获得;根据第二目标匹配分对目标用户进行候选歌单的推荐。

9、可选地,获得目标用户对应的至少一个候选歌单,包括:

10、基于第三对象通过协同过滤从第四对象中获取至少一个候选歌单,第三对象包括目标用户交互的歌曲、歌单中的至少一种,第四对象包括目标用户未交互的歌单。

11、根据本公开实施方式的第四方面,提供一种推荐模型训练装置,该装置可以包括:第一特征采集模块,用于对样本用户采集第一歌单评分特征,第一歌单评分特征包括样本用户的第一用户行为特征、第一用户属性特征;样本歌单构建模块,用于构建样本用户对应的样本歌单;推荐模型训练模块,用于将第一歌单评分特征、样本歌单输入推荐模型,以通过推荐模型确定第一用户行为特征、第一用户属性特征分别与每一样本歌单的匹配分,并对各样本歌单的匹配分分别进行融合,获得推荐模型输出的样本歌单对应的第一目标匹配分;推荐模型训练模块,还用于基于第一目标匹配分对推荐模型进行参数更新,直至推荐模型符合收敛条件。

12、可选地,第一特征采集模块,包括:长期特征采集子模块,用于根据样本用户在第一时间段内交互的第一对象,获得用户长期行为特征;短期特征采集子模块,用于根据样本用户在第二时间段内交互的第一对象,获得用户短期行为特征,第一时间段长于第二时间段,第一对象包括样本用户交互的歌曲、歌单中的至少一种。

13、可选地,第一特征采集模块,还包括:属性特征采集子模块,用于根据样本用户在第三时间段内与第一对象的交互总次数,获得样本用户对应的第一用户属性特征。

14、可选地,样本歌单包括正样本与负样本,样本歌单构建模块,包括:样本信息确定子模块,用于确定样本用户在第四时间段内与第二对象的交互次数,第二对象包括样本用户交互的歌单;样本标记子模块,用于在交互次数大于或等于分类阈值的情况下,确定第二对象为正样本;样本标记子模块,还用于在交互次数小于分类阈值的情况下,确定第二对象为负样本。

15、可选地,推荐模型包括动态权要网络、行为特征匹配网络、属性特征匹配网络,推荐模型训练模块,具体用于将第一歌单评分特征、样本歌单输入推荐模型,以通过推荐模型的动态权重网络确定第一用户行为特征、第一用户属性特征分别对应的融合权重,行为特征匹配网络确定第一用户行为特征与每一样本歌单分别对应的匹配分,属性特征匹配网络确定第一用户属性特征与每一样本歌单分别对应的匹配分,再基于融合权重对各样本歌单对应的匹配分进行加权融合,获得推荐模型输出的样本歌单对应的第一目标匹配分。

16、可选地,第一用户行为特征包括用户长期行为特征、用户短期行为特征,推荐模型训练模块,具体用于长期行为特征匹配网络通过transformer结构对用户长期行为特征进行信息提取,再通过多层感知器分别融合每一样本歌单,获得用户长期行为特征分别与各样本歌单对应的匹配分;以及,短期行为特征匹配网络通过self-attention结构对用户短期行为特征进行信息提取,再通过多层感知器分别融合每一样本歌单,获得用户短期行为特征分别与各样本歌单对应的匹配分。

17、根据本公开实施方式的第五方面,提供一种歌单推荐装置,该装置可以包括:第二特征采集模块,用于对目标用户采集第二歌单评分特征,并获得目标用户对应的至少一个候选歌单,第二歌单评分特征包括第二用户行为特征、第二用户属性特征;推荐模型预测模块,用于将第二歌单评分特征、候选歌单输入推荐模型,以通过推荐模型确定第二用户行为特征、第二用户属性特征分别对每一候选歌单的匹配分,并对各候选歌单的匹配分分别进行融合,获得推荐模型输出的候选歌单对应的第二目标匹配分,推荐模型通过前述第三方面所述的装置训练获得;候选歌单推荐模块,用于根据第二目标匹配分对目标用户进行候选歌单的推荐。

18、可选地,第二特征采集模块,具体用于基于第三对象通过协同过滤从第四对象中获取至少一个候选歌单,第三对象包括目标用户交互的歌曲、歌单中的至少一种,第四对象包括目标用户未交互的歌单。

19、根据本公开实施方式的第六方面,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述如第一方面的推荐模型训练方法,或第二方面的歌单推荐方法。

20、根据本公开实施方式的第七方面,提供一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述如第一方面的推荐模型训练方法,或第二方面的歌单推荐方法。

21、根据本公开实施方式的推荐模型训练方法,可以对样本用户采集第一歌单评分特征,以及构建样本用户对应的样本歌单,其中,第一歌单评分特征包括样本用户的第一用户行为特征、第一用户属性特征;再将第一歌单评分特征、第一用户属性特征输入推荐模型,推荐模型可以分别独立地确定每一样本歌单与第一用户行为特征的匹配分,以及每一样本歌单与第一用户属性特征的匹配分,再融合各样本歌单所对应的匹配分,得到样本歌单的目标匹配分,进而根据目标匹配分对推荐模型进行参数更新。该方法中在推荐模型训练中提取了偏向表征样本用户动态变化信息的行为特征,以及偏向表征样本用户静态固有信息的属性特征,并且在分别独立地确定不同特征与样本歌单的匹配分后进一步融合,使得目标匹配分能够分别完整保留并融合不同类型特征所表征的信息,保证推荐模型充分学习,提高预测准确性;同时,在模型训练过程中既学习了用户侧的歌单评分特征,也学习了非用户侧的样本歌单,从而能够结合用户侧、非用户侧的特征进行歌单推荐,提高了推荐模型对不同歌单推荐场景适应性、准确性,也保证了模型性能的稳定性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1