一种基于收听上下文的音乐推荐方法_2

文档序号:9839621阅读:来源:国知局
目标用户,而v是数据库中的另外一个用户;
[0046] 鲁Mu是用户u所收听的音乐集合,而Μ v是用户v所收听的音乐条目集合;
[0047] # :?是用户u的全局兴趣向量,而涔是用户v的全局兴趣向量;
[0048] ·(々;;,戶;)是%和巧的余弦相似度;
[0049] · λ和Θ是权重系数,一般均取值为1。
[0050] 计算目标用户u对音乐m的兴趣,计算公式如下:
[0051]
其中,
[0052] #u是目标用户;
[0053] 鲁Uu,k是与u最相似的k个用户的集合;
[0054] · Um是收听过音乐m的用户集合;
[0055] 鲁冗是用户u的收听上下文兴趣向量,而ιΓ2ν是音乐m的细粒度特征向量;
[0056] · cos(冗,C2'')是J5:和$&的余弦相似度;
[0057] · ω和>9是权重系数,一般均取值为1。
[0058] 利用上步中得到的结果对所有音乐进行排序,把前Ν个推荐给当前用户。
[0059] 下面结合附图作进一步详细说明:
[0060] 图1展示了推荐系统的架构。该推荐系统分为两个主要模块:预处理模块和预测 模块。预处理模块中,首先获取用户的所有收听记录(收听序列),并根据每条记录的收听 时间和播放设备进行分组,得到子序列,其中收听时间比较接近并且播放设备一样的记录 会被分到同一个子序列,而收听时间间隔较大或者播放设备不一致的记录会被分到不同子 序列;再利用神经语言模型(Skip-gram)从用户的完整收听序列和子序列中分别提取音乐 的粗粒度和细粒度特征向量,最后每首音乐都有两个特征向量。在预测模块中,首先从目标 用户的完整收听记录(收听序列)和子序列中获取用户的全局兴趣和收听上下文兴趣;然 后根据用户的全局兴趣和收听上下文兴趣给用户推荐推荐适合其当前收听上下文的音乐。
[0061] 图2展示了用户偏好预测的详细步骤。首先获取用户的完整收听记录(收听序列) 以及近期收听序列,并分别从中提取用户的全局兴趣和收听上下文兴趣,然后利用用户的 全局兴趣和完整收听序列,计算目标用户和其他用户的相似度,用户相似度计算公式为:
[0062] ?
[0063] 其中u是目标用户,v是数据库中的另外一个用户,Mu是用户u所收听的音乐集合, Mv是用户v所收听的音乐条目集合,焉是用户u的全局兴趣向量,巧是用户v的全局兴趣 向量,C〇S(j^^)是]5〗和瓦:的余弦相似度,λ和Θ是权重系数,一般均取值为1 ;最后计算 目标用户在当前收听上下文的情况下对相似用户的音乐的偏好程度并排序,并把前Ν首推 荐给目标用户:
[0064]
[0065] 其中u是目标用户,Uu,k是与u最相似的k个用户的集合,Um是收听过音乐m 的用户集合,if是用户11的收听上下文兴趣向量,而^^2'' .是音乐!11的细粒度特征向量, 是露和的余弦相似度,ω和沒是权重系数,一般均取值为1。
[0066] 以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对 于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行 若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
【主权项】
1. 一种基于收听上下文的音乐推荐方法,其特征在于,包括以下步骤: S1基于神经语言模型的音乐特征的提取; S2用户收听上下文的提取和建模; S3基于用户收听上下文的音乐推荐。2. 根据权利要求1所述的基于收听上下文的音乐推荐方法,其特征在于,步骤S1包 括: S10获取用户的完整音乐收听序列,序列中每条收听记录包括音乐ID、播放时间、播放 设备; S11根据播放时间和播放设备,对每个用户的完整音乐收听序列进行分组,得到一系列 子序列,其中,在完整音乐收听序列中的播放时间接近并且播放设备相同的收听记录会被 分到同一个子序列中; S12利用神经语言模型处理所有用户的完整音乐收听序列,得到每首音乐的粗粒度的 特征向量,利用神经语言模型处理所有用户的子序列,得到每首音乐的细粒度的特征向量, 其中,具有相似收听上下文的音乐具有相似的特征向量。3. 根据权利要求2所述的基于收听上下文的音乐推荐方法,其特征在于,步骤S12中, 根据对效率和准确度的要求指定特征向量的维度,以得到推荐结果更准确的高维度特征向 量,或者计算效率更高的低维度特征向量。4. 根据权利要求2或3所述的基于收听上下文的音乐推荐方法,其特征在于,步骤S2 包括: S20把用户的完整音乐收听序列中的所有音乐的粗粒度特征向量进行平均,得到用户 的全局兴趣向量; S21把用户的最近的音乐收听子序列中的所有音乐的细粒度特征向量进行平均,得到 用户的收听上下文兴趣向量。5. 根据权利要求4所述的基于收听上下文的音乐推荐方法,其特征在于,步骤S3包 括: S30根据用户的全局兴趣向量和完整音乐收听序列计算用户之间的相似度,其计算公 式为其中,u表示目标用户,v表示数据库中的另外一个用户; Mu表示用户u所收听的音乐集合,Μ v表示用户v所收听的音乐集合; ]^表示用户u的全局兴趣向量,]^表示用户ν的全局兴趣向量; COS(式,式)是$和式的余弦相似度;λ和Θ是权重系数; S31计算目标用户u对音乐m的兴趣,计算公式如下:其中,U表示目标用户; Uu,k表示与u最相似的k个用户的集合,U m表示收听过音乐m的用户集合; 戶:;表示用户u的收听上下文兴趣向量,交:2"表示音乐m的细粒度特征向量; 是贫和%^的余弦相似度;ω和沒是权重系数; S32利用步骤S31中的计算结果对所有音乐进行排序,把前Ν个推荐给目标用户u。
【专利摘要】本发明提供了一种在音乐推荐中结合用户收听上下文提高音乐推荐效果的方法,主要是利用神经语言模型从用户的音乐收听序列中提取音乐的特征向量,再从用户的完整收听序列和最近收听子序列中提取用户的全局兴趣和收听上下文兴趣,最后在推荐的时候综合考虑用户的全局兴趣和当前收听上下文兴趣,从而能够让推荐的音乐符合用户的实时需求和偏好。
【IPC分类】G06F17/30
【公开号】CN105608105
【申请号】CN201510726112
【发明人】邓水光, 王东京, 周劲松, 李莹, 吴健, 尹建伟, 吴朝晖
【申请人】浙江大学
【公开日】2016年5月25日
【申请日】2015年10月30日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1