一种主播相似度的计算方法、装置、设备和存储介质与流程

文档序号:16889597发布日期:2019-02-15 22:56阅读:181来源:国知局
一种主播相似度的计算方法、装置、设备和存储介质与流程

本发明实施例涉及神经网络技术,尤其涉及一种主播相似度的计算方法、装置、设备和存储介质。



背景技术:

随着互联网技术及智能移动终端设备的发展,各种互联网产品给人们的工作、生活带来了很多便利与娱乐,近年来,各类用于视频直播的直播平台层出不穷,视频直播给人们带来更实时的社交体验。直播平台依靠大量、优秀的主播用户及观众用户而保持竞争优势。

在直播平台中,每天有大量的主播开播。对于观众用户来讲,找到自己喜欢的主播往往需要花费较多的时间,观众用户需要尝试观看和积累对主播的认知。通常,用户对于自己较喜欢的主播会进行订阅或者观众,继而主播在开播的时候就能收到相应的通知。

为了帮助用户更快更精准地找到自己喜欢的主播,直播平台往往会开发各种个性化推荐系统,给用户推荐个性化的主播列表,方便用户找到自己喜欢的主播,继而对平台提升运营指标起到较好的帮助作用。在个性化推荐中,根据用户协同计算的结果获得应该向用户推荐的主播,使用协同计算需要采集用户数据,因为用户数据可能是稀疏的,当用户数据稀疏时,采用协同计算的方式获得的结果代表性低,导致推荐结果的准确性也低。



技术实现要素:

本发明提供一种主播相似度的计算方法、装置、设备和存储介质,解决了当用户数据稀疏时,如何准确推荐用户相似度较高的主播的问题。

第一方面,本发明实施例提供了一种主播相似度的计算方法,包括:

获取多个主播订阅列表,每个主播订阅列表具有用户订阅的主播信息;

根据所述主播订阅列表,将所述主播信息转换为主播向量;

根据所述主播向量计算所述主播信息之间的相似度。

第二方面,本发明实施例还提供了一种主播相似度的计算装置,包括:

订阅列表获取模块,用于获取多个主播订阅列表,每个主播订阅列表具有用户订阅的主播信息;

主播向量转化模块,用于根据所述主播订阅列表,将所述主播信息转换为主播向量;

相似度计算模块,用于根据所述主播向量计算所述主播信息之间的相似度。

第三方面,本发明实施例还提供了一种电子设备,包括:

一个或多个处理器;

存储器,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如任一实施例所述的主播相似度的计算方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如任一实施例所述的主播相似度的计算方法。

本发明通过获取多个主播订阅列表,并将主播列表中包含的主播信息转化为主播向量,通过主播向量计算主播之间的相似度。解决了当用户数据稀疏时,如何准确推荐用户相似度较高的主播的问题。用户方面,实现通过根据用户订阅或者关注的主播,找到与他们订阅(关注)的主播相似的主播进行推荐,减少了用户找到自己喜欢主播的时间,提升用户的观看时长和在平台的留存度的有益效果。平台方面,相比于通过主播的关注度和活跃度进行推送的方式,本发明可以实现个性化的推送方式,提高中小主播的曝光率,时间全方位的主播推送,为中小主播实现合理分流。

附图说明

图1为本发明实施例一提供的一种主播相似度的计算方法的流程图;

图2为本发明实施例二提供的一种主播相似度的计算方法的流程图;

图3是本发明实施例三提供的一种主播相似度的计算装置的结构图;

图4为本发明实施例四提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种主播相似度的计算方法的流程图。本实施例中的技术方案,可选的是适用于通过用户关注的主播列表计算主播相似度的场景。但可以理解的是,本技术方案也可以适用于其他应用场景中,只要存在需要通过词向量来计算词与词之间相似度的问题即可。该方法由一种主播相似度的计算装置来执行,该装置可以由软件和/或软件的方式实现,通常配置于电子设备中,典型的是设置在处理器中。可以设置在客户端也可以设置在服务器端。参考图1,该方法包括:

s101、获取多个主播订阅列表。

其中,主播订阅列表是指观众用户在使用直播平台过程中,订阅(关注)主播而形成的列表。一个观众用户对应于一个主播订阅列表,一个主播订阅列表包括观众用户订阅的主播信息。主播信息至少包括主播身份标识号,主播身份标识号(主播id)与主播一一对应。

具体的,主播相似度的计算装置获取多个观众用户订阅主播过程中产生的主播订阅列表,并获得多个主播订阅列表中的主播信息。

s102、根据所述主播订阅列表,将所述主播信息转换为主播向量。

其中,主播向量属于词向量,词向量是来自词汇表的单词或短语被映射到实数的向量。它涉及从每个单词一维的空间到具有更低维度的连续向量空间的数学嵌入。将主播信息转换为主播向量的方法包括:神经网络、单词共生矩阵的降维、概率模型、可解释的知识库方法等。

具体的,主播相似度的计算装置根据多个包括用户订阅的主播信息的主播订阅列表,将主播信息映射为主播向量。

s103、根据所述主播向量计算所述主播信息之间的相似度。

其中,相似度是用于判断主播向量之间的相似性高低的数据。一般通过求向量余弦值的方式来判断两个向量之间的相似度。两个向量之间的夹角越小则说明两个向量越相似。

具体的,主播相似度的计算装置将主播信息映射为主播向量,通过计算主播向量之间的夹角获得主播向量之间的相似度,进而获得主播(以主播信息表现)之间的相似度。

本发明实施例通过获取多个主播订阅列表,并将主播列表中包含的主播信息转化为主播向量,通过主播向量计算主播之间的相似度。解决了当用户数据稀疏时,如何准确推荐用户相似度较高的主播的问题。用户方面,实现通过根据用户订阅或者关注的主播,找到与他们订阅(关注)的主播相似的主播进行推荐,减少了用户找到自己喜欢主播的时间,提升用户的观看时长和在平台的留存度的有益效果。平台方面,相比于通过主播的关注度和活跃度进行推送的方式,本发明可以实现个性化的推送方式,提高中小主播的曝光率,时间全方位的主播推送,为中小主播实现合理分流。

实施例二

图2为本发明实施例二提供的一种主播相似度的计算方法的流程图。本实施例是在实施例一的基础上进行的细化,主要描述了将主播信息转化为主播向量的具体方法和获得主播信息之间的相似度后的后续行为。

参考图2,本实施例具体包括如下步骤:

s201、获取用户订阅的主播信息。

具体的,主播相似度的计算装置获取观众用户在观看直播过程中,订阅(关注)的主播的主播信息。

s202、按照订阅的时间顺序将所述主播信息生成主播订阅列表。

具体的,主播相似度的计算装置按照观众用户订阅主播的时间顺序对主播信息进行排序,生成按时间顺序排列的主播订阅列表。对多个观众用户重复上述操作,获得多个主播订阅列表。

s203、将所述主播订阅列表作为句子、所述主播信息作为词,输入至预置的词向量模型中,输出代表所述主播信息的主播向量。

其中,词向量模型是指可以按照关联程度,将主播信息映射为向量的模型,主播信息在主播订阅列表中越相关,则经过词向量模型映射的主播向量的夹角越小。

具体的,预置的词向量模型可以为word2vec模型。其中,word2vec,是为一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。训练完成之后,word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络之隐藏层。

word2vec模型有两种实现方式:词袋模型(bag-of-wordsmodel)方式和skip-gram模型方式。表一为按照时间顺序生成的一个主播订阅列表,下面结合表一内容对word2vec模型的两种实现方式进行描述。

表一

其中,词袋模型(bag-of-wordsmodel)的训练输入是某一个特征词的上下文相关的词对应的词向量,而输出就是这特定的一个词的词向量。是在自然语言处理和信息检索(ir)下被简化的表达模型。此模型下,像是句子或是文件这样的文字可以用一个袋子装着这些词的方式表现,这种表现方式不考虑文法以及词的顺序。词袋模型被广泛应用在文件分类,词出现的频率可以用来当作训练分类器的特征。即在同一主播订阅列表中,选取与指定的主播信息相邻的其他主播信息输入至所述word2vec模型,输出代表所述指定的主播信息的主播向量。如将表一中序号为001、002、004和005的主播id输入至所述word2vec模型,输出序号为003的主播id对应的主播向量。

其中,skip-gram模型输入是特定的一个词的词向量,而输出是特定词对应的上下文词向量。即:在同一主播订阅列表中,选取一个主播信息输入至所述word2vec模型,输出代表所述主播信息相邻的其他主播信息的主播向量。如将表一中序号为004的主播id输入至所述word2vec模型,输出序号为002、003、005和006的主播id对应的主播向量。

s204、计算所述主播向量之间的余弦值,作为所述主播信息之间的相似度。

其中,余弦值也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量;向量,是多维空间中有方向的线段,如果两个向量的方向一致,即夹角接近零,那么这两个向量就相近。当两个词向量的夹角余弦等于1时,表示这两个词向量完全重复;当两个词向量的夹角的余弦值接近于1时,表示这两个词向量相似;两个词向量的夹角的余弦越小,表示两个词向量的相似度越低。计算主播向量之间的余弦值是指通过使用欧几里得点积公式,计算两个主播向量之间的夹角。

具体的,主播相似度的计算装置通过计算两个向量的夹角余弦值来评估他们的相似度。

s205、当检测到客户端触发指定操作时,根据所述相似度从所述主播信息中选择目标主播信息。

其中,指定操作是指预先设定的操作,如用户点击主播推荐或进行其他产生推荐行为的操作。

具体的,主播相似度的计算装置检测到客户端发起主播推荐的操作时,主播相似度的计算装置根据该用户端的观众用户的主播订阅列表,输出主播向量,并查找该主播向量对应的主播信息。

s206、将所述目标主播信息推送至所述客户端。

具体的,主播相似度的计算装置将查找到的主播向量对应的主播信息推送给发起主播推荐的客户端,作为该客户端观众用户的推荐主播。

本发明实施例通过获取多个主播订阅列表,并将主播列表中包含的主播信息转化为主播向量,通过主播向量计算主播之间的相似度。解决了当用户数据稀疏时,如何准确推荐用户相似度较高的主播的问题。用户方面,本实施例还描述了将主播信息转化为主播向量的具体方法和获得主播信息之间的相似度后的后续行为。解决了构建向量模型和实现相似主播推送的具体解决办法。实现通过根据用户订阅或者关注的主播,找到与他们订阅(关注)的主播相似的主播进行推荐,减少了用户找到自己喜欢主播的时间,提升用户的观看时长和在平台的留存度的有益效果。平台方面,相比于通过主播的关注度和活跃度进行推送的方式,本发明可以实现个性化的推送方式,提高中小主播的曝光率,时间全方位的主播推送,为中小主播实现合理分流。

实施例三

图3是本发明实施例三提供的一种主播相似度的计算装置的结构图。该装置包括:订阅列表获取模块31、主播向量转化模块32和相似度计算模块33。其中:

订阅列表获取模块31,用于获取多个主播订阅列表,每个主播订阅列表具有用户订阅的主播信息;

主播向量转化模块32,用于根据所述主播订阅列表,将所述主播信息转换为主播向量;

相似度计算模块33,用于根据所述主播向量计算所述主播信息之间的相似度。

本发明实施例通过获取多个主播订阅列表,并将主播列表中包含的主播信息转化为主播向量,通过主播向量计算主播之间的相似度。解决了当用户数据稀疏时,如何准确推荐用户相似度较高的主播的问题。用户方面,实现通过根据用户订阅或者关注的主播,找到与他们订阅(关注)的主播相似的主播进行推荐,减少了用户找到自己喜欢主播的时间,提升用户的观看时长和在平台的留存度的有益效果。平台方面,相比于通过主播的关注度和活跃度进行推送的方式,本发明可以实现个性化的推送方式,提高中小主播的曝光率,时间全方位的主播推送,为中小主播实现合理分流。

在上述实施例的基础上,还包括:

主播匹配模块,用于当检测到客户端触发指定操作时,根据所述相似度从所述主播信息中选择目标主播信息;

主播推送模块,用于将所述目标主播信息推送至所述客户端。

在上述实施例的基础上,订阅列表获取模块还用于:

获取用户订阅的主播信息;

按照订阅的时间顺序将所述主播信息生成主播订阅列表。

在上述实施例的基础上,所述主播向量转化模块还用于:

将所述主播订阅列表作为句子、所述主播信息作为词,输入至预置的词向量模型中,输出代表所述主播信息的主播向量。

在上述实施例的基础上,所述预置的词向量模型为word2vec模型。

在上述实施例的基础上,将所述主播订阅列表作为句子、所述主播信息作为词,输入至预置的词向量模型中,输出代表所述主播信息的主播向量,包括:

在同一主播订阅列表中,选取一个主播信息输入至所述word2vec模型,输出代表所述主播信息相邻的其他主播信息的主播向量。

在上述实施例的基础上,将所述主播订阅列表作为句子、所述主播信息作为词,输入至预置的词向量模型中,输出代表所述主播信息的主播向量,包括:

在同一主播订阅列表中,选取与指定的主播信息相邻的其他主播信息输入至所述word2vec模型,输出代表所述指定的主播信息的主播向量。。

在上述实施例的基础上,相似度计算模块还用于:

计算所述主播向量之间的余弦值,作为所述主播信息之间的相似度。

本实施例提供的一种主播相似度的计算装置可用于执行上述任一实施例提供的主播相似度的计算方法,具有相应的功能和有益效果。

实施例四

图4为本发明实施例四提供的一种电子设备的结构示意图。如图4所示,该电子设备包括处理器40、存储器41、通信模块42、输入装置43和输出装置44;电子设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;电子设备中的处理器40、存储器41、通信模块42、输入装置43和输出装置44可以通过总线或其他方式连接,图4中以通过总线连接为例。

存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本实施例中的一种主播相似度的计算方法对应的模块(例如,一种主播相似度的计算装置中的订阅列表获取模块31、主播向量转化模块32和相似度计算模块33。其中)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的一种主播相似度的计算方法。

存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

通信模块42,用于与显示屏建立连接,并实现与显示屏的数据交互。输入装置43可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。

本实施例提供的一种电子设备,可执行本发明任一实施例提供的主播相似度的计算方法,具体相应的功能和有益效果。

实施例五

本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种主播相似度的计算方法,该方法包括:

获取多个主播订阅列表,每个主播订阅列表具有用户订阅的主播信息;

根据所述主播订阅列表,将所述主播信息转换为主播向量;

根据所述主播向量计算所述主播信息之间的相似度。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任一实施例所提供的主播相似度的计算方法中的相关操作。

通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机电子设备(可以是个人计算机,服务器,或者网络电子设备等)执行本发明各个实施例所述的方法。

值得注意的是,上述主播相似度的计算装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1