推荐信息处理方法、装置、设备及介质与流程

文档序号:15272219发布日期:2018-08-28 22:34阅读:137来源:国知局

本发明涉及数据处理领域,具体而言,涉及一种推荐信息处理方法、装置、设备及介质。



背景技术:

互联网时代使用音乐流媒体收听成为主流,用户在流媒体上主要通过各平台的内容推荐服务、歌曲分类目录、电台以及搜索功能发现音乐。其中内容推荐服务借助用户产生的大量收听数据,分析哪些内容相似,提供查看、收听“相似”的功能;也基于用户的历史听歌行为,预测用户对每个内容的喜欢程度,用列表的形式为用户进行个性化的内容推荐。

从音乐艺术家出发探索音乐的角度,与本发明最为接近的实现方案是discovr以及music-map,这两个应用都可以通过搜索艺术家,生成一个互动地图,地图中显示被搜索的艺术家以及与其相似的艺术家。地图支持拖拽,可以通过点击相似艺术家显示二级相似关系,从而引导用户发现新的音乐。

发明人在研究过程中发现相关技术存在下列缺陷:

主流音乐平台的推荐服务属于被动发现,严重依赖于用户历史行为,容易越推越相似,好像被圈在一个小圈子里,很难跳出,不利于发现新内容。

discovr和music-map呈现给用户的艺术家地图会随着中心艺术家的变化而动态生成,不包含中心艺术家与其相似艺术家之外的艺术家,如图1所示;而且不支持缩放,无法让用户对地图有全局意识;因此,用户根据discovr和music-map呈现的艺术家地图探索新的艺术家时,难以直观了解该中心艺术家的多个相似艺术家之间的特点和区别,增大了用户选择相似艺术家的随机性和盲目性,同样不利于用户发现新的内容。

综上所述,针对相关技术中的音乐探索方式在指引用户发现新的音乐/音乐艺术家时,无法提供直观的参考信息供用户参考的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明提供了一种推荐信息处理方法、装置、设备及介质,以至少解决相关技术中的音乐探索方式在指引用户发现新的音乐/音乐艺术家时,无法提供直观的参考信息供用户参考的问题。

第一方面,本发明实施例提供了一种推荐信息处理方法,包括:

从推荐信息中提取特征向量,并根据所述特征向量对所述推荐信息进行层次聚类,得到所述推荐信息的层次聚类结果;

采用加权维诺图算法,按照所述层次聚类结果的分类数量,并以每个分类中所述推荐信息的数目作为权重,生成所述推荐信息的层次化地图;

接收用户查找与所述层次化地图中的特定推荐信息相似的相似推荐信息的操作;

在所述层次化地图中突出展示所述相似推荐信息。

第二方面,本发明实施例提供了一种推荐信息处理装置,所述装置包括:

聚类模块,用于从推荐信息中提取特征向量,并根据所述特征向量对所述推荐信息进行层次聚类,得到所述推荐信息的层次聚类结果;

生成模块,用于采用加权维诺图算法,按照所述层次聚类结果的分类数量,并以每个分类中所述推荐信息的数目作为权重,生成所述推荐信息的层次化地图;

接收模块,用于接收用户查找与所述层次化地图中的特定推荐信息相似的相似推荐信息的操作;

展示模块,用于在所述层次化地图中突出展示所述相似推荐信息。

第三方面,本发明实施例提供了一种推荐信息处理设备,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现第一方面所述的方法。

第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当所述计算机程序指令被处理器执行时实现第一方面所述的方法。

通过本发明实施例提供的推荐信息处理方法、装置、设备及介质,采用从推荐信息中提取特征向量,并根据特征向量对推荐信息进行层次聚类,得到推荐信息的层次聚类结果;采用加权维诺图算法,按照层次聚类结果的分类数量,并以每个分类中推荐信息的数目作为权重,生成推荐信息的层次化地图;接收用户查找与层次化地图中的特定推荐信息相似的相似推荐信息的操作;在层次化地图中突出展示相似推荐信息的方式,将推荐信息聚类展示在层次化地图中,并且在层次化地图中突出展示相似推荐信息,使得层次化地图中的其他推荐信息能够提供用户有关相似推荐信息的参考。将上述方案应用到音乐/音乐艺术家信息推荐中,解决了相关技术中的音乐探索方式在指引用户发现新的音乐/音乐艺术家时,无法提供直观的参考信息供用户参考的问题,从而起到了为用户探索音乐/音乐艺术家提供了直观的参考信息的技术效果。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据相关技术的艺术家地图的示意图;

图2是根据本发明实施例的推荐信息处理方法的流程图;

图3是根据本发明优选实施例的层次化地图生成过程的流程图;

图4是根据本发明实施例的推荐信息处理装置的结构示意图;

图5是根据本发明实施例的推荐信息处理设备的硬件结构示意图;

图6是根据本发明优选实施例的层次化地图的示意图;

图7是根据本发明优选实施例的在层次化地图上展示相似推荐信息的示意图。

具体实施方式

下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

在本实施例中提供了一种推荐信息处理方法,图2是根据本发明实施例的推荐信息处理方法的流程图,如图2所示,该流程包括如下步骤:

步骤s201,从推荐信息中提取特征向量,并根据特征向量对推荐信息进行层次聚类,得到推荐信息的层次聚类结果;

步骤s202,采用加权维诺图算法,按照层次聚类结果的分类数量,并以每个分类中推荐信息的数目作为权重,生成推荐信息的层次化地图;

步骤s203,接收用户查找与层次化地图中的特定推荐信息相似的相似推荐信息的操作;

步骤s204,在层次化地图中突出展示相似推荐信息。

通过上述步骤,可以将所有已知的某类推荐信息(例如歌手、演员、作者;或者音乐、电影、电视剧、书籍中的一类)分层聚类并展示在层次化地图中,在用户查找层次化地图中的某一特定推荐信息相似推荐信息时(例如在层次化地图中选择特定推荐信息,并点击提供给该特定推荐信息的“查找相似推荐信息”功能的按钮),在层次化地图中突出展示这些相似推荐信息。

由于在层次化地图中根据分层聚类结果将全部的推荐信息加入到了层次化地图中,因此在突出展示相似推荐信息时,与相似推荐信息邻近的推荐信息也将会展示出来,这些邻近的推荐信息则可以为相似推荐信息提供参考。例如,与特定推荐信息相似的多个相似推荐信息中,具有特点1的相似推荐信息和具有特点2的相似推荐信息展示在层次化地图的不同位置,并且,在具有特点1的相似推荐信息邻近区域内,也都是具有特点1的其他推荐信息;在具有特点2的相似推荐信息邻近区域也,都是具有特点2的其他推荐信息。用户在选择相似推荐信息时,邻近区域的其他推荐信息为用户提供了参考,用户根据邻近区域的推荐信息就能够了解这一区域的大致特点,从而指引用户选择感兴趣的推荐信息。

可见,通过上述步骤,应用到音乐/音乐艺术家信息推荐中,解决了相关技术中的音乐探索方式在指引用户发现新的音乐/音乐艺术家时,无法提供直观的参考信息供用户参考的问题,从而起到了为用户探索音乐/音乐艺术家提供了直观的参考信息的技术效果。

可选地,在将推荐信息展示到层次化地图中之后,由于层次化地图很有可能超出设备的显示范围。因此,在将相似推荐信息突出展示在层次化地图中之后,超出设备的显示范围的相似推荐信息将不容易被用户发现。为了解决上述问题,在层次化地图中突出展示相似推荐信息时,还可以在层次化地图中绘制特定推荐信息与相似推荐信息之间的高亮连线。高亮连线能够指引用户去寻找所有的相似推荐信息,避免相似推荐信息被用户忽视。

另外,在采用层次化地图突出展示相似推荐信息的同时,还可以额外地采用列表的形式将全部相似推荐信息进行展示;用户在列表中选择某一个相似推荐信息时,该相似推荐信息在层次化地图中的位置将自动跳转到设备的显示范围之内,以供用户了解该相似推荐信息在层次化地图中的位置,并了解该相似推荐信息邻近的推荐信息的分布情况。

生成层次化地图的方式可以采用现有技术中的任意已知的层次化地图生成方式。可选地,在本实施例中,采用加权维诺图算法,按照层次聚类结果的分类数量,并以每个分类中推荐信息的数目作为权重,生成推荐信息的层次化地图包括:

步骤s202-1,选定起始坐标,并采用加权维诺图算法,按照层次聚类结果的上层分类数量,以每个上层分类中推荐信息的数目作为权重,计算上层分类的坐标和边界;

步骤s202-2,将上层分类的坐标作为中心坐标,采用加权维诺图算法,按照层次聚类结果的上层分类中下一层分类的数量,以上层分类中每个下一层分类中所述推荐信息的数目作为权重,计算上层分类中每个下一层分类的坐标和边界;

步骤s202-3,在分层的层数超过两层的情况下,则重复上述计算过程,直至计算出底层分类的坐标和边界;需要说明的是,如果分层为两层,则上层分类的下一层分类即为底层分类。

步骤s202-4,在底层分类的边界内随机生成底层分类中全部推荐信息的坐标,并执行维诺图算法,以使底层分类中的全部推荐信息的坐标均匀分布在底层分类的边界内。

可选地,上述的层次化地图为可缩放矢量图形格式的地图;采用可缩放矢量图形格式,能够根据用户的操作对地图进行缩放。层次化地图中展示推荐信息时,优先展示热门推荐信息(包括图标和文字信息),而隐藏相对冷门的推荐信息,以避免设备的显示区域内显示的推荐信息过多影响用户识别。其中的热门推荐信息是指关注度/点播数/喜欢数大于某一预定阈值的推荐信息。上述的预定阈值根据层次化地图缩放的程度不同而变化,以保持设备的显示区域内的推荐信息数量在合适的水平。

可选地,上述的推荐信息包括但不限于以下之一:歌手、演员、作者、音乐、电影、电视剧、书籍。

下面以艺术家(例如歌手、演员等)为例,对本实施例采用的层次化地图生成过程进行描述和说明。

参考图3,层次化地图生成过程包括:

数据准备

对用户的收听记录进行处理,通过协同过滤的方式得到曲库中艺术家的向量特征表达,并根据收听次数将艺术家分为热门艺术家与非热门艺术家两大类。

对热门艺术家进行层次聚类,每层聚类使用的聚类方法为谱聚类,谱聚类所使用的相似度矩阵为热门艺术家特征向量的余弦相似度矩阵。谱聚类中通过迭代设定类数目,为保证聚类结果内部相似度的最小类数目。在所有聚类均不可再分隔后,将聚类结果根据类中的艺术家数目分为大类与小类两组,当小类与大类的相似度超过某阈值时,合并该小类到大类中,从而提高聚类的准确度。

根据热门艺术家的聚类结果以及向量特征得到每个类的向量特征,对冷门艺术家进行分类,得到所有艺术家的聚类结果以及不同类别的层级关系。

地图生成

首先计算顶层大类的互余弦相似度矩阵,进而得到拉普拉斯矩阵,对拉普拉斯矩阵进行多维尺度缩放实现降维,得到顶层大类的二维起始坐标。由于每个大类中所包含的艺术家数目不同,所以将每个大类中的艺术家数目占总数的比例设为权重,通过加权维诺图算法对坐标进行调整,以保证艺术家分布的均匀性。将顶层坐标作为中心坐标,重复这一过程至底层,得到每个类别的中心坐标。基于改良版维诺图算法得到每个类别的区域边界,在边界内随机生成艺术家坐标。对所有艺术家坐标进行重叠去重后,重新执行改良版维诺图算法,得到最终的艺术家坐标以及类边界坐标,存储至数据库,并根据坐标、边界渲染并展示层次化地图。层次化地图如图6所示。

可选地,在层次化地图中显示艺术家时,层次化地图的页面的交互使用d3.js(一种javascript库,全称为:data-drivendocuments,数据驱动文档)以实现地图的拖拽,缩放。当屏幕位置改变时,根据当前屏幕位置与数据坐标计算出屏幕位置内应显示的艺术家坐标,区域边界,并与当前的文档对象模型进行对比。如果二者相同则忽略,否则清除屏幕外部的数据,并将新数据加入文档对象模型中,动态生成可缩放矢量图形(scalablevectorgraphics,简称为svg)文件显示地图数据。在艺术家显示过程中实用了实时去重算法,在显示空间不足时,优先显示热门的艺术家,冷门的艺术家需要通过缩放地图才可以显示。

可选地,参考图7,当点击相似艺术家时,首先读取相似艺术家列表以及其所对应的坐标,随后会根据其坐标分布计算自动缩放比例,使得在至少显示三个艺术家的基础上尽可能的多显示艺术家,并在源艺术家的坐标位置与相似艺术家坐标位置之间生成抛物线连接,从而完成相似艺术家探索。

用户使用音乐艺术家的层次化地图的一个使用场景是:用户可以看到哪些艺术家是一组,艺术家与艺术家之间的远近关系。点击一个艺术家名字,地图上会弹出该艺术家的详情页,在上面可以看到艺术家的信息、作品和相似内容,用户在上面可以完成收听,也可从该艺术家出发,探索更多相似艺术家的作品。

在本实施例中还提供了一种推荐信息处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”或者“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图4是根据本发明实施例的推荐信息处理装置的结构框图,如图4所示,该装置包括:

聚类模块41,用于从推荐信息中提取特征向量,并根据所述特征向量对所述推荐信息进行层次聚类,得到所述推荐信息的层次聚类结果;

生成模块42,用于采用加权维诺图算法,按照所述层次聚类结果的分类数量,并以每个分类中所述推荐信息的数目作为权重,生成所述推荐信息的层次化地图;

接收模块43,用于接收用户查找与所述层次化地图中的特定推荐信息相似的相似推荐信息的操作;

展示模块44,用于在所述层次化地图中突出展示所述相似推荐信息。

可选地,展示模块44还用于:在所述层次化地图中绘制所述特定推荐信息与所述相似推荐信息之间的高亮连线。

可选地,生成模块42采用加权维诺图算法,按照所述层次聚类结果的分类数量,并以每个分类中所述推荐信息的数目作为权重,生成所述推荐信息的层次化地图包括:

选定起始坐标,并采用加权维诺图算法,按照所述层次聚类结果的上层分类数量,以每个上层分类中所述推荐信息的数目作为权重,计算所述上层分类的坐标和边界;

将所述上层分类的坐标作为中心坐标,采用加权维诺图算法,按照所述层次聚类结果的所述上层分类中下一层分类的数量,以所述上层分类中每个下一层分类的数目作为权重,计算所述上层分类中每个下一层分类的坐标和边界;重复上述计算过程,直至计算出底层分类的坐标和边界;

在所述底层分类的边界内随机生成所述底层分类中全部推荐信息的坐标,并执行维诺图算法,以使所述底层分类中的全部推荐信息的坐标均匀分布在所述底层分类的边界内。

可选地,所述层次化地图为可缩放矢量图形格式的地图。

可选地,所述推荐信息包括但不限于以下之一:歌手、演员、作者、音乐、电影、电视剧、书籍。

需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述模块分别位于多个处理器中。

另外,结合图2描述的本发明实施例的推荐信息处理方法可以由推荐信息处理设备来实现。图5示出了本发明实施例提供的推荐信息处理设备的硬件结构示意图。

推荐信息处理设备可以包括处理器51以及存储有计算机程序指令的存储器52。

具体地,上述处理器51可以包括中央处理器(cpu),或者特定集成电路(applicationspecificintegratedcircuit,asic),或者可以被配置成实施本发明实施例的一个或多个集成电路。

存储器52可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器52可包括硬盘驱动器(harddiskdrive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universalserialbus,usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器52可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器52可在数据处理装置的内部或外部。在特定实施例中,存储器52是非易失性固态存储器。在特定实施例中,存储器52包括只读存储器(rom)。在合适的情况下,该rom可以是掩模编程的rom、可编程rom(prom)、可擦除prom(eprom)、电可擦除prom(eeprom)、电可改写rom(earom)或闪存或者两个或更多个以上这些的组合。

处理器51通过读取并执行存储器52中存储的计算机程序指令,以实现上述实施例中的任意一种推荐信息处理方法。

在一个示例中,推荐信息处理设备还可包括通信接口53和总线50。其中,如图5所示,处理器51、存储器52、通信接口53通过总线50连接并完成相互间的通信。

通信接口53,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。

总线50包括硬件、软件或两者,将推荐信息处理设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线50可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。

该推荐信息处理设备可以基于获取到的数据,执行本发明实施例中的推荐信息处理方法,从而实现结合图2描述的推荐信息处理方法。

另外,结合上述实施例中的推荐信息处理方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种推荐信息处理方法。

综上所述,通过本发明实施例,将艺术家的相似关系数据以地图方式呈现,支持在地图上缩放浏览、选择在地图上查看艺术家信息、查看相似艺术家、收听艺术家音乐作品等操作。在艺术家地图上,用户可以直观感受到全世界有多少艺术家、艺术家的分组关系是什么、艺术家的远近关系是什么、我喜欢的艺术家在哪里、以及与这个艺术家相似的艺术家又在哪里。地图不仅直观展现了音乐世界的全貌,还便于用户了解自己涉猎的音乐在全部音乐世界中所处的位置,提升用户探索地图的自由度,增大了操作空间,进一步利于用户去探索发现更多未知艺术家的音乐。

此外,层次化地图通过类似领土层级关系的方式展现艺术家流派的树状关系,让用户可以从更宏观的角度去发现艺术家或者艺术家的音乐。

需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。

以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(asic)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、rom、闪存、可擦除rom(erom)、软盘、cd-rom、光盘、硬盘、光纤介质、射频(rf)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1