一种发送歌单标识的方法和装置与流程

文档序号:12666568阅读:222来源:国知局
一种发送歌单标识的方法和装置与流程

本发明涉及计算机技术领域,特别涉及一种发送歌单标识的方法和装置。



背景技术:

随着计算机技术的发展,手机、计算机等终端得到了广泛的应用,相应的终端上的应用程序的种类越来越多、功能越来越丰富。歌曲播放类应用程序即是一种很常用的应用程序。

用户可以通过歌曲播放类应用程序播放歌曲。目前,歌曲播放类应用程序往往会提供一些歌单,其中,歌单中包含多首歌曲。用户想要通过歌曲播放类应用程序播放歌曲时,可以在歌曲播放类应用程序提供的歌单列表中,可以根据歌单的标签、标题、简介等信息,选择自己喜欢听的歌单,然后,可以点击播放按钮,触发终端播放所选歌单中的歌曲。

在实现本发明的过程中,发明人发现现有技术至少存在以下问题:

基于上述处理方式,用户每次想要选择某个歌单时,均需要在歌曲播放类应用程序提供的歌单列表中选择自己喜欢听的歌单,往往歌单列表中的歌单数量比较多,从而,导致选择歌单的效率较低。



技术实现要素:

为了解决现有技术中选择歌单的效率较低的问题,本发明实施例提供了一种发送歌单标识的方法和装置。所述技术方案如下:

第一方面,提供了一种发送歌单标识的方法,所述方法包括:

在预先存储的每两首歌曲对应的行为相似度列表中,获取第一歌单包含的每首歌曲与第二歌单包含的每首歌曲的行为相似度;

根据所述第一歌单包含的每首歌曲与所述第二歌单包含的每首歌曲的行为相似度,计算所述第一歌单和所述第二歌单的行为相似度;

根据所述第一歌单和所述第二歌单的行为相似度,确定所述第一歌单和所述第二歌单的匹配度数值,并将所述第一歌单的歌单标识、所述第二歌单的歌单标识、所述匹配度数值,对应存储到每两个歌单与匹配度数值的对应关系中;

当接收到终端发送的对应目标歌单的歌单获取请求时,根据所述每两个歌单与匹配度数值的对应关系,确定与所述目标歌单的匹配度数值最大的预设数目个歌单,向所述终端发送所述预设数目个歌单的歌单标识。

可选的,所述方法还包括:

获取所述第一歌单的介绍信息和所述第二歌单的介绍信息;

根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单和所述第二歌单的内容相似度;

所述根据所述第一歌单和所述第二歌单的行为相似度,确定所述第一歌单和所述第二歌单的匹配度数值,包括:

根据所述第一歌单和所述第二歌单的行为相似度和内容相似度,确定所述第一歌单和所述第二歌单的匹配度数值。

可选的,所述介绍信息包括标题文本信息和/或简介文本信息;

所述根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单和所述第二歌单的内容相似度,包括:

分别对所述第一歌单的介绍信息和所述第二歌单的介绍信息进行分词处理,得到所述第一歌单的词语集合和所述第二歌单的词语集合;

确定每个预设词语分别在所述第一歌单的词语集合中的出现次数和在所述第二歌单的词语集合中的出现次数,并根据预先存储的所有歌单对应的词语集合,确定所述每个预设词语对应的逆向文件频率;

根据所述每个预设词语在所述第一歌单的词语集合中的出现次数和所述每个预设词语对应的逆向文件频率,确定所述第一歌单对应的文本向量,根据所述每个预设词语在所述第二歌单的词语集合中的出现次数和所述每个预设词语对应的逆向文件频率,确定所述第二歌单对应的文本向量;

计算所述第一歌单对应的文本向量和所述第二歌单对应的文本向量的余弦相似度,得到所述第一歌单和所述第二歌单的内容相似度。

可选的,所述介绍信息包括标签信息;

所述根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单和所述第二歌单的内容相似度,包括:

分别根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单对应的标签向量和所述第二歌单对应的标签向量;

计算所述第一歌单对应的标签向量和所述第二歌单对应的标签向量的余弦相似度,得到所述第一歌单和所述第二歌单的内容相似度。

可选的,所述根据所述第一歌单和所述第二歌单的行为相似度和内容相似度,确定所述第一歌单和所述第二歌单的匹配度数值,包括:

根据预先存储的行为相似度和内容相似度分别对应的权重、以及所述第一歌单和所述第二歌单的行为相似度和内容相似度,确定所述第一歌单和所述第二歌单的匹配度数值。

可选的,所述根据所述每两个歌单与匹配度数值的对应关系,确定与所述目标歌单的匹配度数值最大的预设数目个歌单,包括:

根据预先存储的每个歌单对应的标签信息,确定标签信息与所述目标歌单的标签信息相匹配的歌单集合;

根据所述每两个歌单与匹配度数值的对应关系,在所述歌单集合中,选取与所述目标歌单的匹配度数值最大的预设数目个歌单。

第二方面,提供了一种发送歌单标识的装置,所述装置包括:

第一获取模块,用于在预先存储的每两首歌曲对应的行为相似度列表中,获取第一歌单包含的每首歌曲与第二歌单包含的每首歌曲的行为相似度;

计算模块,用于根据所述第一歌单包含的每首歌曲与所述第二歌单包含的每首歌曲的行为相似度,计算所述第一歌单和所述第二歌单的行为相似度;

存储模块,用于根据所述第一歌单和所述第二歌单的行为相似度,确定所述第一歌单和所述第二歌单的匹配度数值,并将所述第一歌单的歌单标识、所述第二歌单的歌单标识、所述匹配度数值,对应存储到每两个歌单与匹配度数值的对应关系中;

发送模块,用于当接收到终端发送的对应目标歌单的歌单获取请求时,根据所述每两个歌单与匹配度数值的对应关系,确定与所述目标歌单的匹配度数值最大的预设数目个歌单,向所述终端发送所述预设数目个歌单的歌单标识。

可选的,所述装置还包括:

第二获取模块,用于获取所述第一歌单的介绍信息和所述第二歌单的介绍信息;

确定模块,用于根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单和所述第二歌单的内容相似度;

所述存储模块,用于:

根据所述第一歌单和所述第二歌单的行为相似度和内容相似度,确定所述第一歌单和所述第二歌单的匹配度数值。

可选的,所述介绍信息包括标题文本信息和/或简介文本信息;

所述确定模块,用于:

分别对所述第一歌单的介绍信息和所述第二歌单的介绍信息进行分词处理,得到所述第一歌单的词语集合和所述第二歌单的词语集合;

确定每个预设词语分别在所述第一歌单的词语集合中的出现次数和在所述第二歌单的词语集合中的出现次数,并根据预先存储的所有歌单对应的词语集合,确定所述每个预设词语对应的逆向文件频率;

根据所述每个预设词语在所述第一歌单的词语集合中的出现次数和所述每个预设词语对应的逆向文件频率,确定所述第一歌单对应的文本向量,根据所述每个预设词语在所述第二歌单的词语集合中的出现次数和所述每个预设词语对应的逆向文件频率,确定所述第二歌单对应的文本向量;

计算所述第一歌单对应的文本向量和所述第二歌单对应的文本向量的余弦相似度,得到所述第一歌单和所述第二歌单的内容相似度。

可选的,所述介绍信息包括标签信息;

所述确定模块,用于:

分别根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单对应的标签向量和所述第二歌单对应的标签向量;

计算所述第一歌单对应的标签向量和所述第二歌单对应的标签向量的余弦相似度,得到所述第一歌单和所述第二歌单的内容相似度。

可选的,所述存储模块,用于:

根据预先存储的行为相似度和内容相似度分别对应的权重、以及所述第一歌单和所述第二歌单的行为相似度和内容相似度,确定所述第一歌单和所述第二歌单的匹配度数值。

可选的,所述发送模块,用于:

根据预先存储的每个歌单对应的标签信息,确定标签信息与所述目标歌单的标签信息相匹配的歌单集合;

根据所述每两个歌单与匹配度数值的对应关系,在所述歌单集合中,选取与所述目标歌单的匹配度数值最大的预设数目个歌单。

本发明实施例提供的技术方案带来的有益效果是:

本发明实施例中,服务器可以根据用户行为(比如过去一段时间内的播放、下载和收藏记录)预先计算两两歌曲的行为相似度,进而,服务器可以根据两两歌曲的行为相似度,计算第一歌单和第二歌单的行为相似度;根据第一歌单和第二歌单的行为相似度,确定第一歌单和第二歌单的匹配度数值,并将第一歌单的歌单标识、第二歌单的歌单标识、匹配度数值,对应存储到每两个歌单与匹配度数值的对应关系中。每当接收到终端发送的对应目标歌单的歌单获取请求时,根据每两个歌单与匹配度数值的对应关系,确定与目标歌单的匹配度数值最大的预设数目个歌单,进而,可以向终端发送预设数目个歌单的歌单标识。这样,用户可以在服务器推送的预设数目个歌单标识中,选择自己喜欢听的歌单,无需在所有歌单中选择,从而,可以提高选择歌单的效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种发送歌单标识的方法流程图;

图2是本发明实施例提供的一种系统框架示意图;

图3是本发明实施例提供的一种发送歌单标识的装置结构示意图;

图4是本发明实施例提供的一种发送歌单标识的装置结构示意图;

图5是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

本发明实施例提供了一种发送歌单标识的方法,该方法的执行主体为服务器,其中,该服务器可以是歌曲播放类应用程序的后台服务器。该服务器中可以设置有处理器、收发器和存储器,处理器可以用于计算每两个歌单的匹配度数值,以及确定与目标歌单相匹配的歌单列表的相关处理,收发器可以用于接收和发送数据,存储器可以用于存储下述处理过程中需要和产生的数据。

下面将结合具体实施方式,对图1所示的处理流程进行详细的说明,内容可以如下:

步骤101,在预先存储的每两首歌曲对应的行为相似度列表中,获取第一歌单包含的每首歌曲与第二歌单包含的每首歌曲的行为相似度。

其中,每两首歌曲的行为相似度可以是根据用户行为计算出的歌曲相似度。

在实施中,服务器中可以预先存储有检测周期,每到预设的检测周期,服务器可以获取预先存储的每个账户标识在预设历史时段内对每首歌曲的行为数据,其中,行为数据可以包括用户的播放、下载、收藏记录数据,然后,对于每个账户标识,服务器可以根据该账户标识对每首歌曲的行为数据,对每首歌曲进行打分,得到该账户标识对每首歌曲的评分,其中,服务器可以将每个账户标识对每首歌曲的评分以二维矩阵的形式存储(其中,账户标识的数量即是二维矩阵的行数,歌曲的数量即是二维矩阵的列数),二维矩阵中的每个位置的数值表示该行的账户标识对该列的歌曲的评分,例如,位置(p,q)的数值表示账户标识p对歌曲q的评分。得到二维矩阵后,服务器可以采用矩阵分解算法,得到二维矩阵对应的每个账户标识的账户向量和每首歌曲的歌曲特征向量。得到每首歌曲的歌曲特征向量后,可以计算两两歌曲的特征向量的余弦相似度cosin,即得到的余弦相似度即是这两首歌曲对应的行为相似度,其中,可以按照公式(1)计算歌曲x和歌曲y的余弦相似度cosin(x,y),其中,表示歌曲x的歌曲特征向量,表示歌曲y的歌曲特征向量,表示的模长,表示的模长。得到所有两两歌曲的行为相似度后,可以将其存储。

对于每个检测周期,得到每两首歌曲的行为相似度后,服务器可以计算预先存储的每两个歌单的匹配度数值。下面以计算第一歌单和第二歌单的匹配度数值为例,详细表述每两个歌单的匹配度数值的计算方法:

服务器可以确定第一歌单和第二歌单分别包含的歌曲,进而,可以在预先存储的每两首歌曲对应的行为相似度列表中,获取第一歌单包含的每首歌曲与第二歌单包含的每首歌曲的行为相似度,也就是说,对于第一歌单包含的每首歌曲,服务器可以获取该歌曲与第二歌单包含的各歌曲的行为相似度,得到多个行为相似度。

步骤102,根据第一歌单包含的每首歌曲与第二歌单包含的每首歌曲的行为相似度,计算第一歌单和第二歌单的行为相似度。

在实施中,服务器得到第一歌单包含的每首歌曲与第二歌单包含的每首歌曲的行为相似度后,可以计算第一歌单包含的每首歌曲与第二歌单包含的每首歌曲的行为相似度的平均相似度,并可以将得到的平均相似度作为第一歌单和第二歌单的行为相似度。具体的,服务器可以按照公式(2)计算多个行为相似度的平均相似度,即可以按照公式(2)计算第一歌单和第二歌单的行为相似度S2。

其中,S1i,j表示歌曲i和歌曲j的行为相似度,n为第一歌单包含的歌曲的数量,m为第二歌单包含的歌曲的数量。

步骤103,根据第一歌单和第二歌单的行为相似度,确定第一歌单和第二歌单的匹配度数值,并将第一歌单的歌单标识、第二歌单的歌单标识、匹配度数值,对应存储到每两个歌单与匹配度数值的对应关系中。

在实施中,服务器中可以预先存储有每两个歌曲的歌曲标识与匹配度数值的对应关系,每当确定出两个歌单的匹配度数值时,可以将其对应添加到对应关系中。具体的,服务器确定出第一歌单和第二歌单的行为相似度后,可以根据行为相似度确定第一歌单和第二歌单的匹配度数值,进而,可以将第一歌单的歌单标识、第二歌单的歌单标识、匹配度数值,对应存储到每两个歌单与匹配度数值的对应关系中。

可选的,服务器还可以根据歌单的介绍信息,确定两者的内容相似度,相应的,处理过程可以如下:获取第一歌单的介绍信息和第二歌单的介绍信息;根据第一歌单的介绍信息和第二歌单的介绍信息,确定第一歌单和第二歌单的内容相似度。相应的,步骤103的处理过程可以如下:根据第一歌单和第二歌单的行为相似度和内容相似度,确定第一歌单和第二歌单的匹配度数值。

其中,介绍信息可以是用于介绍歌单特点的文本信息。

在实施中,每个歌单往往都会对应有介绍信息(比如标题、简介等),服务器还可以分别获取第一歌单和第二歌单的介绍信息,进而,服务器可以根据第一歌单的介绍信息和第二歌单的介绍信息,计算第一歌单和第二歌单的内容相似度,其中,具体确定方法将在后续详细描述。得到第一歌单和第二歌单的行为相似度和内容相似度后,可以根据第一歌单和第二歌单的行为相似度和内容相似度,确定第一歌单和第二歌单的匹配度数值。

可选的,服务器可以通过计算行为相似度和内容相似度的加权和,来确定匹配度数值,相应的,步骤103的处理过程可以如下:根据预先存储的行为相似度和内容相似度分别对应的权重、以及第一歌单和第二歌单的行为相似度和内容相似度,确定第一歌单和第二歌单的匹配度数值。

在实施中,服务器中可以预先存储有行为相似度和内容相似度分别对应的权重,以便确定出每两个歌单的内容相似度和行为相似度后,计算这两个歌单的匹配度数值。服务器确定出第一歌单和第二歌单的行为相似度和内容相似度后,可以基于预先存储的行为相似度和内容相似度分别对应的权重,计算第一歌单和第二歌单的匹配度数值,例如,内容相似度的权重为a,行为相似度的权重为1-a,第一歌单和第二歌单的内容相似度为content,第一歌单和第二歌单的行为相似度为behavior,则第一歌单和第二歌单的匹配度数值可以为a*content+(1-a)*behavior。另外,当前检测周期服务器向终端推荐歌单后,服务器可以统计向所有终端推荐的歌单的点击率(或播放率)等信息,进而,根据统计的点击率等信息,调整内容相似度的权重和行为相似度的权重,直到确定出合适的调整内容相似度的权重和行为相似度的权重,使得点击率达到预设阈值。

可选的,当介绍信息包括标题文本信息和/或简介文本信息时,上述确定第一歌单和第二歌单的内容相似度的处理过程可以如下:分别对第一歌单的介绍信息和第二歌单的介绍信息进行分词处理,得到第一歌单的词语集合和第二歌单的词语集合;确定每个预设词语分别在第一歌单的词语集合中的出现次数和在第二歌单的词语集合中的出现次数,并根据预先存储的所有歌单对应的词语集合,确定每个预设词语对应的逆向文件频率;根据每个预设词语在第一歌单的词语集合中的出现次数和每个预设词语对应的逆向文件频率,确定第一歌单对应的文本向量,根据每个预设词语在第二歌单的词语集合中的出现次数和每个预设词语对应的逆向文件频率,确定第二歌单对应的文本向量;计算第一歌单对应的文本向量和第二歌单对应的文本向量的余弦相似度,得到第一歌单和所述第二歌单的内容相似度。

在实施中,服务器可以获取第一歌单的标题和/或简介信息后,可以对其进行分词处理,得到第一歌单的词语集合和第二歌单的词语集合。然后,服务器可以通过计算TFIDF(Term Frequency-Inverse Document Frequency,词频-逆向文件频率),来计算第一歌单的文本向量和第二歌单的文本向量。具体的,服务器中可以预先定义有词语矩阵,其中,词语矩阵的每一行表示某个歌单对应的文本向量,文本向量的每一维的数值表示该维对应的预设词语在该歌单的TFIDF,文本向量的维数即是预设词语的个数,即是词语矩阵的列数,词语矩阵的行数即是歌单的数目。例如,第一歌单的文本向量的第一维的数值表示第一维的预设词语(词语1)在第一歌单的TFIDF,第二歌单的文本向量的第一维的数值表示第一维的预设词语(词语1)在第二歌单的TFIDF。词语矩阵的每个数值可以根据每个歌单的词语集合确定,具体的,第一歌单和第二歌单的文本向量的确定方法可以如下:对于第一歌单,得到第一歌单的词语集合后,可以统计每一维的预设词语在第一歌单的词语集合中的出现次数,并可以计算每个预设词语的出现次数的总和,进而,可以计算每个预设词语对应的出现次数与出现次数的总和的比值,此时,即确定出了每个预设词语对应的TF。确定出预设词语的TF后,还可以计算每个预设词语的IDF,具体的,对于每个预设词语(即对于词语矩阵的每一列),服务器可以统计出现次数不为零的歌单数目,进而,可以计算总歌单数目(即词语矩阵的行数)与出现次数不为零的歌单数目的数目比值,然后对数目比值求对数,得到该预设词语的IDF。对于第一歌单,得到每个预设词语对应的TF和IDF后,可以将TF与IDF相乘,得到第一歌单的文本向量。对于第二歌单,得到第二歌单的词语集合后,可以统计每一维的预设词语在第二歌单的词语集合中的出现次数,并可以计算每个预设词语的出现次数的总和,进而,可以计算每个预设词语对应的出现次数与出现次数的总和的比值,此时,即确定出了每个预设词语对应的TF,然后,将每个预设词语对应的TF与上述确定出的每个词语对应的IDF相乘,得到第二歌单的文本向量。

确定出第一歌单的文本向量和第二歌单的文本向量后,可以按照公式(1)计算第一歌单的文本向量和第二歌单的文本向量的余弦相似度,并可以将得到的余弦相似度确定为第一歌单和第二歌单对应的内容相似度(此种情况下,内容相似度也可以称为本文相似度)。

可选的,当介绍信息为标签信息时,上述确定第一歌单和第二歌单的内容相似度的处理过程可以如下:分别根据第一歌单的介绍信息和第二歌单的介绍信息,确定第一歌单对应的标签向量和第二歌单对应的标签向量;计算第一歌单对应的标签向量和第二歌单对应的标签向量的余弦相似度,得到第一歌单和第二歌单的内容相似度。

在实施中,每个歌单往往还对应有标签信息,其中,标签信息可以是歌单对应的标签名称(比如,某歌单的标签信息为流行、国语、民谣、摇滚等)。服务器中还可以预先定义有标签向量,其中,标签向量的每一维的数值为0或1,0表示该歌单的标签信息不包含该维对应的预设标签(比如民谣),1表示该歌单的标签信息包含该维对应的预设标签。标签向量的维数即是预设标签的个数。例如,第一歌单的标签向量的第一维的数值表示第一歌单的标签信息是否包含第一维的预设标签(比如民谣),第二歌单的标签向量的第一维的数值表示第二歌单的标签信息是否包含第一维的预设标签(比如民谣)。由此,服务器获取到第一歌单的标签信息和第二歌单的标签信息后,可以判断第一歌单的标签信息和第二歌单的标签信息包含了哪些预设标签,不包含哪些预设标签,进而,可以得到第一歌单的标签向量和第二歌单的标签向量。得到第一歌单对应的标签向量和第二歌单对应的标签向量后,可以按照公式(1)计算第一歌单对应的标签向量和第二歌单对应的标签向量的余弦相似度,得到第一歌单和第二歌单的内容相似度(此种情况下,内容相似度也可以称为标签相似度)。

另外,本方案中的介绍信息可以同时包括标题文本信息和/或简介文本信息,和标签信息,此种情况下,服务器可以分别按照上述方式计算第一歌曲和第二歌曲的文本相似度和标签相似度,进而,可以根据预先存储的行为相似度、文本相似度和标签相似度分别对应的权重、以及所述第一歌单和所述第二歌单的行为相似度、文本相似度和标签相似度,确定第一歌单和第二歌单的匹配度数值。

步骤104,当接收到终端发送的对应目标歌单的歌单获取请求时,根据每两个歌单与匹配度数值的对应关系,确定与目标歌单的匹配度数值最大的预设数目个歌单,向终端发送预设数目个歌单的歌单标识。

在实施中,用户选择某一歌单后,可以通过歌曲播放类应用程序播放该歌单中的歌曲,当终端检测到终端对目标歌单的播放指令时,或者当终端检测到终端对应目标歌单的相似歌单获取指令时,可以向服务器发送对应目标歌单的歌单获取请求,服务器接收到终端发送的对应目标歌单的歌单获取请求时,可以在预先存储的每两个歌单的歌曲标识与匹配度数值的对应关系中,选取包含目标歌单的对应关系项,并对选取的各对应关系项中的匹配度数值进行排序,可以按照由大到小的顺序,对各对应关系项中的匹配度数值进行排序,此种情况下,服务器可以获取排序靠前的预设数目个歌单,也可以按照由小到大的顺序,对各对应关系项中的匹配度数值进行排序,此种情况下,服务器可以获取排序靠后的预设数目个歌单。确定出预设数目个歌单后,可以向终端发送预设数目个歌单的歌单标识,终端可以接收预设数目个歌单的歌单标识,并可以对其进行显示,用户可以在显示的各歌单标识中,选择其中自己喜欢听的歌单,其中,系统框架图如图2所示。

可选的,服务器还可以确定目标歌单对应的歌单集合,进而,在歌单集合中选择与目标歌单的匹配度数值最大的预设数目个歌单,相应的,步骤104的处理过程可以如下:根据预先存储的每个歌单对应的标签信息,确定标签信息与目标歌单的标签信息相匹配的歌单集合;根据每两个歌单与匹配度数值的对应关系,在歌单集合中,选取与目标歌单的匹配度数值最大的预设数目个歌单。

在实施中,当接收到终端发送的对应目标歌单的歌单获取请求时,服务器可以在所有歌单中,选取标签信息与目标歌单的标签信息有相同标签的歌单集合,进而,可以在每两个歌单的歌曲标识与匹配度数值的对应关系中,确定歌单集合中的歌单与目标歌单的匹配度数值。服务器可以根据歌单集合中的歌单与目标歌单的匹配度数值,从中选取与目标歌单的匹配度数值最大的预设数目个歌单。此外,在确定歌单集合时,服务器还可以在所有歌单中,选取标签信息与目标歌单的标签信息除预设大众标签(比如流行、国语等区分作用小的标签)之外有相同标签的歌单集合。例如,目标歌单的标签信息包含标签1、标签2和标签3,则标签信息只要包含其中一个标签的歌单均是歌单集合中的歌单,即歌单集合中的歌单的标签信息至少包含标签1、标签2、标签3中的一个。

另外,如果确定出的歌单集合中的歌单数量小于预设数目,则服务器可以再在歌单集合外的歌单中,选取匹配度数值最大的剩余数量的歌单。例如,预设数目为10个,歌单集合中有7个歌单,则此种情况下,服务器可以获取歌单集合中的7个歌单外,还可以在歌单集合外的歌单中,选择3个歌单,其中,这3个歌单与目标歌单的匹配度数值是在歌单集合外的歌单中最大的。

本发明实施例中,服务器可以根据用户行为(比如过去一段时间内的播放、下载和收藏记录)预先计算两两歌曲的行为相似度,进而,服务器可以根据两两歌曲的行为相似度,计算第一歌单和第二歌单的行为相似度;根据第一歌单和第二歌单的行为相似度,确定第一歌单和第二歌单的匹配度数值,并将第一歌单的歌单标识、第二歌单的歌单标识、匹配度数值,对应存储到每两个歌单与匹配度数值的对应关系中。每当接收到终端发送的对应目标歌单的歌单获取请求时,根据每两个歌单与匹配度数值的对应关系,确定与目标歌单的匹配度数值最大的预设数目个歌单,进而,可以向终端发送预设数目个歌单的歌单标识。这样,用户可以在服务器推送的预设数目个歌单标识中,选择自己喜欢听的歌单,无需在所有歌单中选择,从而,可以提高选择歌单的效率。

基于相同的技术构思,本发明实施例还提供了一种发送歌单标识的装置,如图3所示,该装置包括:

第一获取模块310,用于在预先存储的每两首歌曲对应的行为相似度列表中,获取第一歌单包含的每首歌曲与第二歌单包含的每首歌曲的行为相似度;

计算模块320,用于根据所述第一歌单包含的每首歌曲与所述第二歌单包含的每首歌曲的行为相似度,计算所述第一歌单和所述第二歌单的行为相似度;

存储模块330,用于根据所述第一歌单和所述第二歌单的行为相似度,确定所述第一歌单和所述第二歌单的匹配度数值,并将所述第一歌单的歌单标识、所述第二歌单的歌单标识、所述匹配度数值,对应存储到每两个歌单与匹配度数值的对应关系中;

发送模块340,用于当接收到终端发送的对应目标歌单的歌单获取请求时,根据所述每两个歌单与匹配度数值的对应关系,确定与所述目标歌单的匹配度数值最大的预设数目个歌单,向所述终端发送所述预设数目个歌单的歌单标识。

可选的,如图4所示,所述装置还包括:

第二获取模块350,用于获取所述第一歌单的介绍信息和所述第二歌单的介绍信息;

确定模块360,用于根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单和所述第二歌单的内容相似度;

所述存储模块330,用于:

根据所述第一歌单和所述第二歌单的行为相似度和内容相似度,确定所述第一歌单和所述第二歌单的匹配度数值。

可选的,所述介绍信息包括标题文本信息和/或简介文本信息;

所述确定模块360,用于:

分别对所述第一歌单的介绍信息和所述第二歌单的介绍信息进行分词处理,得到所述第一歌单的词语集合和所述第二歌单的词语集合;

确定每个预设词语分别在所述第一歌单的词语集合中的出现次数和在所述第二歌单的词语集合中的出现次数,并根据预先存储的所有歌单对应的词语集合,确定所述每个预设词语对应的逆向文件频率;

根据所述每个预设词语在所述第一歌单的词语集合中的出现次数和所述每个预设词语对应的逆向文件频率,确定所述第一歌单对应的文本向量,根据所述每个预设词语在所述第二歌单的词语集合中的出现次数和所述每个预设词语对应的逆向文件频率,确定所述第二歌单对应的文本向量;

计算所述第一歌单对应的文本向量和所述第二歌单对应的文本向量的余弦相似度,得到所述第一歌单和所述第二歌单的内容相似度。

可选的,所述介绍信息包括标签信息;

所述确定模块360,用于:

分别根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单对应的标签向量和所述第二歌单对应的标签向量;

计算所述第一歌单对应的标签向量和所述第二歌单对应的标签向量的余弦相似度,得到所述第一歌单和所述第二歌单的内容相似度。

可选的,所述存储模块330,用于:

根据预先存储的行为相似度和内容相似度分别对应的权重、以及所述第一歌单和所述第二歌单的行为相似度和内容相似度,确定所述第一歌单和所述第二歌单的匹配度数值。

可选的,所述发送模块340,用于:

根据预先存储的每个歌单对应的标签信息,确定标签信息与所述目标歌单的标签信息相匹配的歌单集合;

根据所述每两个歌单与匹配度数值的对应关系,在所述歌单集合中,选取与所述目标歌单的匹配度数值最大的预设数目个歌单。

本发明实施例中,服务器可以根据用户行为(比如过去一段时间内的播放、下载和收藏记录)预先计算两两歌曲的行为相似度,进而,服务器可以根据两两歌曲的行为相似度,计算第一歌单和第二歌单的行为相似度;根据第一歌单和第二歌单的行为相似度,确定第一歌单和第二歌单的匹配度数值,并将第一歌单的歌单标识、第二歌单的歌单标识、匹配度数值,对应存储到每两个歌单与匹配度数值的对应关系中。每当接收到终端发送的对应目标歌单的歌单获取请求时,根据每两个歌单与匹配度数值的对应关系,确定与目标歌单的匹配度数值最大的预设数目个歌单,进而,可以向终端发送预设数目个歌单的歌单标识。这样,用户可以在服务器推送的预设数目个歌单标识中,选择自己喜欢听的歌单,无需在所有歌单中选择,从而,可以提高选择歌单的效率。

需要说明的是:上述实施例提供的发送歌单标识的装置在发送歌单标识时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的发送歌单标识的装置与发送歌单标识的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

图5是本发明实施例提供的服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。

服务器1900可以包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

在预先存储的每两首歌曲对应的行为相似度列表中,获取第一歌单包含的每首歌曲与第二歌单包含的每首歌曲的行为相似度;

根据所述第一歌单包含的每首歌曲与所述第二歌单包含的每首歌曲的行为相似度,计算所述第一歌单和所述第二歌单的行为相似度;

根据所述第一歌单和所述第二歌单的行为相似度,确定所述第一歌单和所述第二歌单的匹配度数值,并将所述第一歌单的歌单标识、所述第二歌单的歌单标识、所述匹配度数值,对应存储到每两个歌单与匹配度数值的对应关系中;

当接收到终端发送的对应目标歌单的歌单获取请求时,根据所述每两个歌单与匹配度数值的对应关系,确定与所述目标歌单的匹配度数值最大的预设数目个歌单,向所述终端发送所述预设数目个歌单的歌单标识。

可选的,所述方法还包括:

获取所述第一歌单的介绍信息和所述第二歌单的介绍信息;

根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单和所述第二歌单的内容相似度;

所述根据所述第一歌单和所述第二歌单的行为相似度,确定所述第一歌单和所述第二歌单的匹配度数值,包括:

根据所述第一歌单和所述第二歌单的行为相似度和内容相似度,确定所述第一歌单和所述第二歌单的匹配度数值。

可选的,所述介绍信息包括标题文本信息和/或简介文本信息;

所述根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单和所述第二歌单的内容相似度,包括:

分别对所述第一歌单的介绍信息和所述第二歌单的介绍信息进行分词处理,得到所述第一歌单的词语集合和所述第二歌单的词语集合;

确定每个预设词语分别在所述第一歌单的词语集合中的出现次数和在所述第二歌单的词语集合中的出现次数,并根据预先存储的所有歌单对应的词语集合,确定所述每个预设词语对应的逆向文件频率;

根据所述每个预设词语在所述第一歌单的词语集合中的出现次数和所述每个预设词语对应的逆向文件频率,确定所述第一歌单对应的文本向量,根据所述每个预设词语在所述第二歌单的词语集合中的出现次数和所述每个预设词语对应的逆向文件频率,确定所述第二歌单对应的文本向量;

计算所述第一歌单对应的文本向量和所述第二歌单对应的文本向量的余弦相似度,得到所述第一歌单和所述第二歌单的内容相似度。

可选的,所述介绍信息包括标签信息;

所述根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单和所述第二歌单的内容相似度,包括:

分别根据所述第一歌单的介绍信息和所述第二歌单的介绍信息,确定所述第一歌单对应的标签向量和所述第二歌单对应的标签向量;

计算所述第一歌单对应的标签向量和所述第二歌单对应的标签向量的余弦相似度,得到所述第一歌单和所述第二歌单的内容相似度。

可选的,所述根据所述第一歌单和所述第二歌单的行为相似度和内容相似度,确定所述第一歌单和所述第二歌单的匹配度数值,包括:

根据预先存储的行为相似度和内容相似度分别对应的权重、以及所述第一歌单和所述第二歌单的行为相似度和内容相似度,确定所述第一歌单和所述第二歌单的匹配度数值。

可选的,所述根据所述每两个歌单与匹配度数值的对应关系,确定与所述目标歌单的匹配度数值最大的预设数目个歌单,包括:

根据预先存储的每个歌单对应的标签信息,确定标签信息与所述目标歌单的标签信息相匹配的歌单集合;

根据所述每两个歌单与匹配度数值的对应关系,在所述歌单集合中,选取与所述目标歌单的匹配度数值最大的预设数目个歌单。

本发明实施例中,服务器可以根据用户行为(比如过去一段时间内的播放、下载和收藏记录)预先计算两两歌曲的行为相似度,进而,服务器可以根据两两歌曲的行为相似度,计算第一歌单和第二歌单的行为相似度;根据第一歌单和第二歌单的行为相似度,确定第一歌单和第二歌单的匹配度数值,并将第一歌单的歌单标识、第二歌单的歌单标识、匹配度数值,对应存储到每两个歌单与匹配度数值的对应关系中。每当接收到终端发送的对应目标歌单的歌单获取请求时,根据每两个歌单与匹配度数值的对应关系,确定与目标歌单的匹配度数值最大的预设数目个歌单,进而,可以向终端发送预设数目个歌单的歌单标识。这样,用户可以在服务器推送的预设数目个歌单标识中,选择自己喜欢听的歌单,无需在所有歌单中选择,从而,可以提高选择歌单的效率。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1