基于上下文预过滤的实时音乐推荐方法

文档序号:6512924阅读:445来源:国知局
基于上下文预过滤的实时音乐推荐方法
【专利摘要】基于上下文预过滤的实时音乐推荐方法,依据用户的历史数据,针对每个在线活跃用户进行以下操作:首先,提取所有用户的历史数据(如用户听音乐的时间、场所和天气等),构建“用户-音乐-上下文”三元数据模型,并针对每个用户建立由音乐和上下文组成的个人记录集合;其次,构造用户K近邻的当前上下文相似记录集合,从而将三元数据模型转化为用户和音乐组成的二元模型;最后,采用基于模糊聚类的协同过滤算法预测用户对不同音乐的偏爱程度。本发明的优点在于:充分考虑上下文信息,推荐更符合用户偏好、当前心情和周围环境的音乐。
【专利说明】基于上下文预过滤的实时音乐推荐方法
【技术领域】
[0001]本发明涉及音乐推荐系统的【技术领域】,特别是基于上下文预过滤的实时音乐推荐系统的算法。
【背景技术】
[0002]20世纪90年代以来,随着互联网技术的飞速发展,人们在获取丰富信息的同吋,也浸于信息泥潭而难以高效地搜集自身所需的信息,从而引发“信息过载”问题。目前,通用搜索引擎(如谷歌、百度)是最流行的获取信息的工具,但正因为它们的通用性,这类搜索引擎不能很好地满足不同背景、不同时间、不同目标的使用者的个性化信息需求,从而无法真正地解决“信息过载”难题。于是,学术界和企业界都提出“个性化服务”的概念,来为不同特征不同需求的用户提供不同的信息内容。推荐系统作为个性化服务研究的重要领域,通过挖掘用户和服务项目之间的ニ元关系,用户之间的组群关系,以及服务项目之间的相似关系等,帮助用户从海量数据中发现其可能感兴趣的项目(如音乐、家政服务和在线商品等),并生成个性化推荐结果以满足个性化需求。
[0003]目前,随着电子商务、移动计算和物联网等应用领域的进ー步发展,将上下文感知计算应用于这些领域的推荐服务以提高用户体验和系统性能,成为学术界和エ业界关注的热点之一。在传统推荐系统中,“用户ー项目”之间的关联关系是主要的研究対象,而下文环境(如时间、位置、情緒、网络条件和最近几次选择的项目等等)往往被忽略。然而,对很多实际应用而言,单纯的“用户-项目”ニ元关系无法提供高效的推荐服务。例如,用户A只有在“外地出差”时才想要被推荐ー些周边的餐馆、商场等,而平时在熟悉的家乡时这些信息都属于严重多余;用户B在“失落沮丧”时更愿意被推荐ー些治愈系的疗伤歌曲;用户C喜欢在“早上”而不是“中午”被推荐NBA体育新闻。上下文感知推荐系统将上下文信息引入推荐系统,进ー步提高了推荐效率和用户体验,兼具“个性化”和“普适计算”两方面的优越性,具有重要的研究意义和实用价值。

【发明内容】

[0004]为了帮助用户解決“信息过载”问题,在海量音乐中精选出符合用户风格和当前情绪的音乐,本发明提出了一种基于上下文预过滤的实时音乐推荐方法,该方法包括以下步骤:
[0005]I)提取所有用户的历史数据,构建“用户-音乐-上下文”三元数据模型,并针对每个用户u建立由音乐和上下文组成的个人记录集合Pu ;
[0006]2)对每个当前活跃用户Ua,根据其个人记录集合利用余弦相关性评估历史记
录中的上下文与当前上下文c的相似度,构造出K近邻的当前上下文相似记录集合S(C);
[0007]3)利用S(C)将“用户-音乐-上下文”三元数据模型转换成“用户-音乐”ニ元数据模型;
[0008]4)采用基于模糊集划分的协同过滤算法,预测每个当前活跃用户Ua对所有音乐的评分。
[0009]进ー步,步骤I)中所述的用户历史数据、三元数据模型和个人记录集合Pu,具体是:
[0010]I)每条用户历史数据记录包含用户编号、音乐编号、上下文信息和评分,根据所有的用户历史数据记录可以构建“用户-音乐-上下文”三元数据模型;
[0011]2)针对每个用户U,建立由音乐和上下文组成的个人记录集合Pu,该集合的每条记录包含音乐编号、上下文信息和评分。
[0012]进一歩,步骤2)中所述K近邻相似记录集合S (C),具体是:
[0013]I)利用余弦相关性公式计算用户Ua当前上下文c与其个人记录集合中任一上下文X的相似度:
【权利要求】
1.基于上下文预过滤的实时音乐推荐方法,该方法的特征在于获取用户使用音乐服务的历史数据后,针对当前在线活跃用户进行以下操作: I)提取所有用户的历史数据,构建“用户-音乐-上下文”三元数据模型,并针对每个用户U建立的音乐和上下文组成的个人记录集合Pu ;2)对每个当前活跃用户Ua,根据其个人记录集合~*利用余弦相关性评估历史记录中的上下文与当前上下文c的相似度,构造出K近邻的当前上下文相似记录集合S(C); 3)利用S(C)将“用户-音乐-上下文”三元数据模型转换成“用户-音乐”二元数据模型;4)采用基于模糊集划分的协同过滤算法,预测每个当前活跃用户Ua对所有音乐的评分。
2.如权利要求1所述的基于上下文预过滤的实时音乐推荐方法,其特征在于:步骤I)中所述的用户历史数据、三元数据模型和个人记录集合Pu,具体是: 1)每条用户历史数据记录包含用户编号、音乐编号、上下文信息和评分,根据所有的用户历史数据记录可以构建“用户-音乐-上下文”三元数据模型; 2)针对每个用户U,建立由音乐和上下文组成的个人记录集合Pu,该集合的每条记录包含音乐编号、上下文信息和评分。
3.如权利要求2所述的基`于上下文预过滤的实时音乐推荐方法,其特征在于:步骤2)中所述K近邻相似记录集合S (c),具体是:` 1)利用余弦相关性公式计算用户Ua当前上下文c与其个人记录集合K、中任一上下文X的相似度:
4.如权利要求3所述的基于上下文预过滤的实时音乐推荐方法,其特征在于:步骤3)中所述利用S(C)将三元“用户-音乐-上下文”模型转化成二元“用户-音乐”模型,具体是: 1)在每个用户Ua的K近邻相似记录集合S(C)中,如果不同上下文中对同一音乐服务存在不同的偏好值,则仅保留其上下文与目标用户当前上下文c相似度最大的那条偏好记录; 2)将所有用户的相似上下文记录集合S(C)合并起来,删除每条记录的上下文数据项,构成集合M,这样M中的每条记录仅包含用户、音乐和评分三个数据项; 3)根据集合M,构造二元“用户-音乐”模型的数据矩阵D,其中矩阵的行表示用户,列表示音乐,矩阵元素Dy表示用户i对音乐j的评分。
5.如权利要求4所述的基于上下文预过滤的实时音乐推荐方法,其特征在于:步骤4)中所述的对二元“用户-音乐”模型采用的基于模糊集划分的协同过滤算法,具体是: I)数据矩阵D的每一行代表ー个用户对所有音乐的评分(未评分的记为0),看成ー个用户的属性,用经典模糊C均值聚类算法把用户聚成k类,其中simk(i,j)是第k类用户i和用户j的相似度; 2)预测第k类用户i对未评分音乐d的评分Pi,d,计算公式如下:
【文档编号】G06F17/30GK103559197SQ201310438728
【公开日】2014年2月5日 申请日期:2013年9月23日 优先权日:2013年9月23日
【发明者】卜佳俊, 王学庆, 李平, 陈纯, 何占盈, 王灿, 吴晓凡 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1