一种多媒体资源召回方法、装置、设备及存储介质与流程

文档序号:29207027发布日期:2022-03-12 01:53阅读:93来源:国知局
一种多媒体资源召回方法、装置、设备及存储介质与流程

1.本公开涉及计算机技术领域,尤其涉及一种多媒体资源召回方法、装置、设备及存储介质。


背景技术:

2.随着计算机技术的发展,用户可以基于终端搜索并浏览与搜索词相关的多媒体资源。比如,用户触发终端向服务器发送包括搜索词的搜索请求,服务器向终端返回基于该搜索请求搜索得到的与搜索词相关的多媒体资源,终端接收并展示该多媒体资源。
3.相关技术中,在搜索一些音频、视频类的多媒体资源时,通常需要用户为各个多媒体资源标注各自的文本信息(比如标题、简介、话题标签等)。服务器在解析终端的搜索请求得到搜索词之后,按照搜索词检索的方式检索各个多媒体资源的文本信息。如果终端发送的搜索词能够命中某一多媒体资源的文本信息,那么服务器向终端返回该多媒体资源。
4.在上述过程中,由于文本信息是用户进行人工标注的,因此,当用户为多媒体资源标注不相关的文本信息时,可能导致服务器在进行多媒体资源搜索时的准确性较差,进而导致用户的搜索体验较差。


技术实现要素:

5.本公开提供一种多媒体资源召回方法、装置、设备及存储介质,可以提高服务器在进行多媒体资源搜索时的准确性,进而丰富了用户的搜索体验。
6.本公开实施例的技术方案如下:
7.根据本公开实施例的第一方面,提供一种多媒体资源召回方法,该方法可以应用于电子设备。该方法可以包括:
8.获取搜索词以及多个多媒体资源;多个多媒体资源包括直播类型的多媒体资源
9.确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征;
10.基于多媒体资源对应的发布账户对多个多媒体资源向量特征进行划分,得到各个发布账户对应的多媒体向量特征集合;
11.对多媒体向量特征集合进行聚类,得到发布账户对应的至少一个多媒体类别向量特征;一个多媒体类别向量特征用于表示一个账户已发布的多媒体资源的类别;
12.从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征,并建立搜索词与目标向量特征对应的目标发布账户之间的对应关系;对应关系用于基于搜索词召回目标发布账户发布的多媒体资源。
13.可选的,建立搜索词与目标向量特征对应的目标发布账户之间的对应关系,包括:
14.获取与搜索词对应的发布账户集合,发布账户集合包括各个目标向量特征对应的目标发布账户;
15.以搜索词为索引标识,建立搜索词与发布账户集合的对应关系。
16.可选的,从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征,包括:
17.获取搜索词向量特征与每个多媒体类别向量特征之间的距离,以得到多个距离;
18.从多个距离中选取满足预设条件的距离,并将满足预设条件的距离对应的多媒体类别向量特征确定为与搜索词向量特征相似的目标向量特征;预设条件包括:距离小于距离阈值或者距离的排序在预设排序之前的至少一个。
19.可选的,确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征,包括:
20.获取多个多媒体资源中的每个多媒体资源的资源信息;资源信息用于表示每个多媒体资源基于搜素词进行搜索的搜索业务信息;
21.基于每个多媒体资源的资源信息,确定与多个多媒体资源一一对应的多个待选指数;待选指数用于构建无向图结构;无向图结构包括:与搜索词对应的搜索词节点,以及与多个多媒体资源一一对应的多个多媒体资源节点;
22.从多个待选指数中,选取大于指数阈值的多个目标指数,并确定与多个目标指数一一对应的多个待选多媒体资源;
23.将搜索词节点与多个待选多媒体资源对应的多个多媒体资源节点之间通过无向边连接,以得到无向图结构;
24.对无向图结构中的节点进行图神经网络训练,以得到搜索词向量特征,以及多个多媒体资源向量特征。
25.可选的,一个多媒体资源的资源信息包括:点击次数、搜索展示次数、播放时长大于第一阈值的次数、播放次数和播放时长;基于每个多媒体资源的资源信息,确定与多个多媒体资源一一对应的多个待选指数,包括:
26.针对于每个多媒体资源的资源信息,均执行以下操作,以得到与多个多媒体资源一一对应的多个待选指数:
27.将点击次数与搜索展示次数之间的比值,确定为点击通过率;将播放时长大于第一阈值的次数与播放次数之间的比值,确定为播放率;基于点击通过率、播放率和播放时长,确定与一个多媒体资源对应的待选指数。
28.可选的,对无向图结构中的节点进行图神经网络训练,以得到搜索词向量特征,以及多个多媒体资源向量特征,包括:
29.获取与搜索词节点通过无向边连接的第一相邻节点;
30.获取与多个多媒体资源节点中的每个多媒体资源节点通过无向边连接的第二相邻节点;
31.根据搜索词节点、第一相邻节点、每个多媒体资源节点和第二相邻节点,对无向图结构中的节点执行图神经网络训练,直到无向图结构训练至收敛状态,以得到搜索词向量特征,以及多个多媒体资源向量特征。
32.根据本公开实施例的第二方面,提供一种多媒体资源召回方法,该方法可以应用于电子设备。该方法可以包括:
33.接收包括目标搜索词的搜索请求;
34.响应于搜索请求,从预先建立好的搜索词与发布账户的对应关系中,确定与目标
搜索词对应的至少一个发布账户,其中,在建立对应关系时,从发布账户对应的至少一个多媒体类别向量特征中,获取与搜索词的搜索词向量特征相似的目标向量特征,并建立搜索词与目标向量特征对应的目标发布账户之间的对应关系;
35.发送至少一个发布账户发布的多媒体资源。
36.根据本公开实施例的第三方面,提供一种多媒体资源召回装置,该装置可以应用于电子设备,包括:获取单元和处理单元;
37.获取单元,用于获取搜索词以及多个多媒体资源;多个多媒体资源包括直播类型的多媒体资源
38.处理单元,用于确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征;
39.处理单元,还用于基于多媒体资源对应的发布账户对多个多媒体资源向量特征进行划分,得到各个发布账户对应的多媒体向量特征集合;
40.处理单元,还用于对多媒体向量特征集合进行聚类,得到发布账户对应的至少一个多媒体类别向量特征;一个多媒体类别向量特征用于表示一个账户已发布的多媒体资源的类别;
41.处理单元,还用于从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征,并建立搜索词与目标向量特征对应的目标发布账户之间的对应关系;对应关系用于基于搜索词召回目标发布账户发布的多媒体资源。
42.可选的,处理单元,具体用于:
43.获取与搜索词对应的发布账户集合,发布账户集合包括各个目标向量特征对应的目标发布账户;
44.以搜索词为索引标识,建立搜索词与发布账户集合的对应关系。
45.可选的,处理单元,具体用于:
46.获取搜索词向量特征与每个多媒体类别向量特征之间的距离,以得到多个距离;
47.从多个距离中选取满足预设条件的距离,并将满足预设条件的距离对应的多媒体类别向量特征确定为与搜索词向量特征相似的目标向量特征;预设条件包括:距离小于距离阈值或者距离的排序在预设排序之前的至少一个。
48.可选的,处理单元,具体用于:
49.获取多个多媒体资源中的每个多媒体资源的资源信息;资源信息用于表示每个多媒体资源基于搜素词进行搜索的搜索业务信息;
50.基于每个多媒体资源的资源信息,确定与多个多媒体资源一一对应的多个待选指数;待选指数用于构建无向图结构;无向图结构包括:与搜索词对应的搜索词节点,以及与多个多媒体资源一一对应的多个多媒体资源节点;
51.从多个待选指数中,选取大于指数阈值的多个目标指数,并确定与多个目标指数一一对应的多个待选多媒体资源;
52.将搜索词节点与多个待选多媒体资源对应的多个多媒体资源节点之间通过无向边连接,以得到无向图结构;
53.对无向图结构中的节点进行图神经网络训练,以得到搜索词向量特征,以及多个多媒体资源向量特征。
54.可选的,一个多媒体资源的资源信息包括:点击次数、搜索展示次数、播放时长大于第一阈值的次数、播放次数和播放时长;处理单元,具体用于:
55.针对于每个多媒体资源的资源信息,均执行以下操作,以得到与多个多媒体资源一一对应的多个待选指数:
56.将点击次数与搜索展示次数之间的比值,确定为点击通过率;将播放时长大于第一阈值的次数与播放次数之间的比值,确定为播放率;基于点击通过率、播放率和播放时长,确定与一个多媒体资源对应的待选指数。
57.可选的,处理单元,具体用于:
58.获取与搜索词节点通过无向边连接的第一相邻节点;
59.获取与多个多媒体资源节点中的每个多媒体资源节点通过无向边连接的第二相邻节点;
60.根据搜索词节点、第一相邻节点、每个多媒体资源节点和第二相邻节点,对无向图结构中的节点执行图神经网络训练,直到无向图结构训练至收敛状态,以得到搜索词向量特征,以及多个多媒体资源向量特征。
61.根据本公开实施例的第四方面,提供一种多媒体资源召回装置,该装置可以应用于电子设备,包括:包括:接收单元、处理单元和发送单元;
62.接收单元,用于接收包括目标搜索词的搜索请求;
63.处理单元,用于响应于搜索请求,从预先建立好的搜索词与发布账户的对应关系中,确定与目标搜索词对应的至少一个发布账户,其中,在建立对应关系时,从发布账户对应的至少一个多媒体类别向量特征中,获取与搜索词的搜索词向量特征相似的目标向量特征,并建立搜索词与目标向量特征对应的目标发布账户之间的对应关系;
64.发送单元,用于发送至少一个发布账户发布的多媒体资源。
65.根据本公开实施例的第五方面,提供一种电子设备,可以包括:处理器和用于存储处理器可执行指令的存储器;其中,处理器被配置为执行所述指令,以实现上述第一方面或第二方面中任一种可选地多媒体资源召回方法。
66.根据本公开实施例的第六方面,提供一种计算机可读存储介质,计算机可读存储介质上存储有指令,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述第一方面或第二方面中任一种可选地多媒体资源召回方法。
67.根据本公开实施例的第七方面,提供一种计算机程序产品,该计算机程序产品包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行如第一方面或第二方面中任一种可选地实现方式所述的多媒体资源召回方法。
68.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
69.本公开的实施例提供的技术方案至少带来以下有益效果:
70.基于上述任一方面,本公开中,在获取搜索词以及多个多媒体资源后,可以确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征,并基于多媒体资源对应的发布账户对多个多媒体资源向量特征进行划分,得到各个发布账户对应的多媒体向量特征集合。接着,可以对多媒体向量特征集合进行聚类,得到发布账户对应的至少一个多媒体类别向量特征(一个多媒体类别向量特征用于表示一个账户已
发布的多媒体资源的类别),并从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征,并建立搜索词与目标向量特征对应的目标发布账户之间的对应关系。由于对应关系用于基于搜索词召回目标发布账户发布的多媒体资源,因此,本公开可以基于搜索词准确的召回目标发布账户发布的多媒体资源,解决了现有技术在进行多媒体资源搜索时的准确性较差的技术问题,提高了多媒体资源搜索时的准确性,进而丰富了用户的搜索体验。
附图说明
71.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
72.图1示出了本公开实施例提供的一种多媒体资源召回方法的流程示意图;
73.图2a示出了本公开实施例提供的又一种多媒体资源召回方法的流程示意图;
74.图2b示出了本公开实施例提供的又一种多媒体资源召回方法的流程示意图;
75.图3示出了本公开实施例提供的又一种多媒体资源召回方法的流程示意图;
76.图4示出了本公开实施例提供的又一种多媒体资源召回方法的流程示意图;
77.图5示出了本公开实施例提供的又一种多媒体资源召回方法的流程示意图;
78.图6示出了本公开实施例提供的又一种多媒体资源召回方法的流程示意图;
79.图7a示出了本公开实施例提供的一种多媒体资源召回装置的结构示意图;
80.图7b示出了本公开实施例提供的又一种多媒体资源召回装置的结构示意图;
81.图8示出了本公开实施例提供的一种终端的结构示意图;
82.图9示出了本公开实施例提供的一种服务器的结构示意图。
具体实施方式
83.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
84.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
85.还应当理解的是,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素和/或组件的存在或添加。
86.本公开所涉及的数据可以为经用户授权或者经过各方充分授权的数据。
87.如背景技术中所描述,在搜索一些音频、视频类的多媒体资源时,通常需要用户为各个多媒体资源标注各自的文本信息(比如标题、简介、话题标签等)。服务器在解析终端的搜索请求得到搜索词之后,按照搜索词检索的方式检索各个多媒体资源的文本信息。如果终端发送的搜索词能够命中某一多媒体资源的文本信息,那么服务器向终端返回该多媒体资源。
88.在上述过程中,由于文本信息是用户进行人工标注的,因此,当用户为多媒体资源标注不相关的文本信息时,可能导致服务器在进行多媒体资源搜索时的准确性较差,进而导致用户的搜索体验较差。
89.基于此,本公开实施例提供一种多媒体资源召回方法,在获取搜索词以及多个多媒体资源后,可以确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征,并基于多媒体资源对应的发布账户对多个多媒体资源向量特征进行划分,得到各个发布账户对应的多媒体向量特征集合。接着,可以对多媒体向量特征集合进行聚类,得到发布账户对应的至少一个多媒体类别向量特征(一个多媒体类别向量特征用于表示一个账户已发布的多媒体资源的类别),并从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征,并建立搜索词与目标向量特征对应的目标发布账户之间的对应关系。由于对应关系用于基于搜索词召回目标发布账户发布的多媒体资源,因此,本公开可以基于搜索词准确的召回目标发布账户发布的多媒体资源,解决了现有技术在进行多媒体资源搜索时的准确性较差的技术问题,提高了多媒体资源搜索时的准确性,进而丰富了用户的搜索体验。
90.以下对本公开实施例提供的多媒体资源召回方法进行示例性说明:
91.本公开提供的多媒体资源召回方法可以应用于电子设备。
92.一些实施例中,电子设备可以是服务器,也可以是终端,还可以是其他用于进行多媒体资源召回的电子设备,本公开对此不作限定。
93.其中,服务器可以是单独的一个服务器,或者,也可以是由多个服务器构成的服务器集群。部分实施方式中,服务器集群还可以是分布式集群。本公开对服务器的具体实现方式也不作限制。
94.终端可以是手机、平板电脑、桌面型、膝上型、手持计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本,以及蜂窝电话、个人数字助理(personal digital assistant,pda)、增强现实(augmented reality,ar)\虚拟现实(virtual reality,vr)设备等可以安装并使用内容社区应用(如快手)的设备,本公开对该电子设备的具体形态不作特殊限制。其可以与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互。
95.下面结合附图对本技术实施例提供的多媒体资源召回方法进行详细介绍。
96.如图1所示,当多媒体资源召回方法应用于电子设备时,该多媒体资源召回方法可以包括:
97.s101、电子设备获取搜索词以及多个多媒体资源。
98.其中,多个多媒体资源包括直播类型的多媒体资源。
99.具体的,在搜索一些直播类型的多媒体资源时,通常需要用户为各个多媒体资源标注各自的文本信息(比如标题、简介、话题标签等)。因此,电子设备在获取到搜索词后,可以按照搜索词检索的方式检索各个多媒体资源的文本信息,并将搜索词能够命中的多个文本信息对应的多个多媒体资源确定为与搜索词相关的多个多媒体资源。
100.示例性的,搜索词为篮球。则电子设备在获取“篮球”搜索词,还可以基于“篮球”搜索词,获取多个篮球相关的直播类型的视频资源。
101.其中,直播类型的多媒体资源可以是当前正在直播的指标资源,也可以是历史时
间段内,通过直播形成的多媒体资源(即直播回放的多媒体资源)。
102.s102、电子设备确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征。
103.具体的,在获取搜索词以及多个多媒体资源后,由于电子设备需要确定与搜索词最相关的多媒体资源,因此,电子设备可以确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征,以使得后续根据搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征,确定与搜索词向量特征相似的目标向量特征。
104.可选的,电子设备确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征,可以通过向量特征提取算法,确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征;也可以通过无向图结构以及图神经网络,确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征;还可以通过其他方式,确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征,本公开对此不作限定。
105.s103、电子设备基于多媒体资源对应的发布账户对多个多媒体资源向量特征进行划分,得到各个发布账户对应的多媒体向量特征集合。
106.具体的,在确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征后,电子设备可以基于多媒体资源对应的发布账户对多个多媒体资源向量特征进行划分,得到各个发布账户对应的多媒体向量特征集合。
107.示例性的,发布账户a发布了3个多媒体资源,发布账户b发布了5个多媒体资源。在这种情况下,可以将发布账户a发布的3个多媒体资源的多媒体向量特征,确定为发布账户a对应的多媒体向量特征集合。将发布账户b发布的5个多媒体资源的多媒体向量特征,确定为发布账户b对应的多媒体向量特征集合。
108.s104、电子设备对多媒体向量特征集合进行聚类,得到发布账户对应的至少一个多媒体类别向量特征。
109.具体的,在基于多媒体资源对应的发布账户对多个多媒体资源向量特征进行划分,得到各个发布账户对应的多媒体向量特征集合后,可以对多媒体向量特征集合进行聚类,得到发布账户对应的至少一个多媒体类别向量特征。
110.其中,一个多媒体类别向量特征用于表示一个账户已发布的多媒体资源的类别。
111.可选的,电子设备对多媒体向量特征集合进行聚类时,可以按照预设的类别数量,对多媒体向量特征集合进行聚类。
112.可选的,电子设备对多媒体向量特征集合进行聚类时,可以基于k最邻近分类算法(k-nearest neighbor,knn),对多媒体向量特征集合进行聚类;也可以基于k均值聚类算法(k-means clustering algorithm),对多媒体向量特征集合进行聚类;还可以通过聚类算法,对多媒体向量特征集合进行聚类,本公开对此不作限定。
113.示例性的,电子设备获取到了发布账户a发布的30个多媒体资源对应的多媒体向量特征集合。其中,15个为“体育类”的多媒体资源对应的多媒体向量特征,15个为“音乐类”的多媒体资源对应的多媒体向量特征。在这种情况下,电子设备基于k最邻近分类算法,对
30个多媒体资源对应的多媒体向量特征集合进行聚类,得到发布账户a对应的2个多媒体类别向量特征:“体育类”的多媒体类别向量特征和“音乐类”多媒体类别向量特征。
114.s105、电子设备从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征,并建立搜索词与目标向量特征对应的目标发布账户之间的对应关系。
115.具体的,在得到发布账户对应的至少一个多媒体类别向量特征后,电子设备可以从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征,并建立搜索词与目标向量特征对应的目标发布账户之间的对应关系。
116.其中,对应关系用于基于搜索词召回目标发布账户发布的多媒体资源。
117.结合上述示例,预设搜索词为“篮球”。电子设备对30个多媒体资源对应的多媒体向量特征集合进行聚类,得到发布账户a对应的2个多媒体类别向量特征:“体育类”的多媒体类别向量特征和“音乐类”多媒体类别向量特征后,电子设备可以确定“篮球”搜索词的搜索词向量特征与上述2个多媒体类别向量特征中的“体育类”的多媒体类别向量特征相似。其中,“体育类”的多媒体类别向量特征包括“篮球比赛”的多媒体资源对应的多媒体类别向量特征。
118.在这种情况下,电子设备可以从“体育类”的多媒体类别向量特征中,确定与搜索词“篮球”的搜索词向量特征相似的目标向量特征为:“篮球比赛”的多媒体资源对应的多媒体类别向量特征,并建立搜索词“篮球”与“篮球比赛”的多媒体资源对应的多媒体类别向量特征对应的目标发布账户之间的对应关系。
119.后续,当观看用户搜索“篮球”的搜索词时,可以召回发布“篮球比赛”的多媒体资源的发布账户发布的多媒体资源。
120.上述实施例提供的技术方案至少带来以下有益效果:由s101-s105可知,在获取搜索词以及多个多媒体资源后,可以确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征,并基于多媒体资源对应的发布账户对多个多媒体资源向量特征进行划分,得到各个发布账户对应的多媒体向量特征集合。接着,可以对多媒体向量特征集合进行聚类,得到发布账户对应的至少一个多媒体类别向量特征(一个多媒体类别向量特征用于表示一个账户已发布的多媒体资源的类别),并从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征,并建立搜索词与目标向量特征对应的目标发布账户之间的对应关系。由于对应关系用于基于搜索词召回目标发布账户发布的多媒体资源,因此,本公开可以基于搜索词准确的召回目标发布账户发布的多媒体资源,解决了现有技术在进行多媒体资源搜索时的准确性较差的技术问题,提高了多媒体资源搜索时的准确性,进而丰富了用户的搜索体验。
121.在一种实施例中,如图2a所示,上述s105中,电子设备建立搜索词与目标向量特征对应的目标发布账户之间的对应关系的方法具体包括:
122.s201、电子设备获取与搜索词对应的发布账户集合。
123.具体的,电子设备建立搜索词与目标向量特征对应的目标发布账户之间的对应关系时,可以获取与搜索词对应的发布账户集合。
124.其中,发布账户集合包括各个目标向量特征对应的目标发布账户。
125.s202、电子设备以搜索词为索引标识,建立搜索词与发布账户集合的对应关系。
126.具体的,在获取与搜索词对应的发布账户集合后,电子设备以搜索词为索引标识,
建立搜索词与发布账户集合的对应关系。
127.可选的,该对应关系可以是倒排索引。
128.上述实施例提供的技术方案至少带来以下有益效果:由s201-s202可知,电子设备建立搜索词与目标向量特征对应的目标发布账户之间的对应关系时,可以获取与搜索词对应的发布账户集合,并以搜索词为索引标识,建立搜索词与发布账户集合的对应关系,给出了一种建立搜索词与目标向量特征对应的目标发布账户之间的对应关系的具体实现方式。由于对应关系用于基于搜索词召回目标发布账户发布的多媒体资源,因此,电子设备可以基于搜索词准确的召回目标发布账户发布的多媒体资源,解决了现有技术在进行多媒体资源搜索时的准确性较差的技术问题,提高了多媒体资源搜索时的准确性,进而丰富了用户的搜索体验。
129.在一种实施例中,如图2b所示,上述s105中,电子设备从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征的方法具体包括:
130.s203、电子设备获取搜索词向量特征与每个多媒体类别向量特征之间的距离,以得到多个距离。
131.具体的,电子设备从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征时,可以获取搜索词向量特征与每个多媒体类别向量特征之间的距离,以得到多个距离。
132.可选的,电子设备获取搜索词向量特征与每个多媒体类别向量特征之间的距离时,可以基于距离计算法,获取搜索词向量特征与每个多媒体类别向量特征之间的距离。
133.可选的,距离计算法可以是cos距离法、欧氏距离法等。
134.s204、电子设备从多个距离中选取满足预设条件的距离,并将满足预设条件的距离对应的多媒体类别向量特征确定为与搜索词向量特征相似的目标向量特征。
135.具体的,在获取搜索词向量特征与每个多媒体类别向量特征之间的距离,以得到多个距离后,电子设备从多个距离中选取满足预设条件的距离,并将满足预设条件的距离对应的多媒体类别向量特征确定为与搜索词向量特征相似的目标向量特征。
136.其中,预设条件包括:距离小于距离阈值或者距离的排序在预设排序之前的至少一个。
137.上述实施例提供的技术方案至少带来以下有益效果:由s203-s204可知,电子设备从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征时,可以获取搜索词向量特征与每个多媒体类别向量特征之间的距离,以得到多个距离。并从多个距离中选取满足预设条件的距离,并将满足预设条件的距离对应的多媒体类别向量特征确定为与搜索词向量特征相似的目标向量特征,给出了一种确定与搜索词向量特征相似的目标向量特征的具体实现方式,以使得后续建立搜索词与目标向量特征对应的目标发布账户之间的对应关系。由于对应关系用于基于搜索词召回目标发布账户发布的多媒体资源,因此,电子设备可以基于搜索词准确的召回目标发布账户发布的多媒体资源,解决了现有技术在进行多媒体资源搜索时的准确性较差的技术问题,提高了多媒体资源搜索时的准确性,进而丰富了用户的搜索体验。
138.在一种实施例中,结合图1,如图3所示,上述s102中,电子设备确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征的方法具
体包括:
139.s301、电子设备获取多个多媒体资源中的每个多媒体资源的资源信息。
140.具体的,电子设备确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征时,可以获取多个多媒体资源中的每个多媒体资源的资源信息。
141.其中,资源信息用于表示每个多媒体资源基于搜素词进行搜索的搜索业务信息。一个多媒体资源的资源信息包括:点击次数、搜索展示次数、播放时长大于第一阈值的次数、播放次数和播放时长。
142.示例性的,在搜索“篮球”搜索词时,可以获取到与“篮球”搜索词对应的多个多媒体资源。在这种情况下,电子设备可以获取的每个多媒体资源的点击次数、搜索展示次数、播放时长大于第一阈值的次数、播放次数和播放时长等资源信息。
143.s302、电子设备基于每个多媒体资源的资源信息,确定与多个多媒体资源一一对应的多个待选指数。
144.具体的,在获取多个多媒体资源中的每个多媒体资源的资源信息后,电子设备可以基于每个多媒体资源的资源信息,确定与多个多媒体资源一一对应的多个待选指数。
145.其中,待选指数用于表示每个多媒体资源的重要程度。通过确定待选指数可以选择重要程度较高的多媒体资源,以构建无向图结构,进而确定多媒体资源向量特征。
146.s303、电子设备从多个待选指数中,选取大于指数阈值的多个目标指数,并确定与多个目标指数一一对应的多个待选多媒体资源。
147.具体的,在基于每个多媒体资源的资源信息,确定与多个多媒体资源一一对应的多个待选指数后,电子设备可以从多个待选指数中,选取大于指数阈值的多个目标指数,并确定与多个目标指数一一对应的多个待选多媒体资源。
148.s304、电子设备将搜索词节点与多个待选多媒体资源对应的多个多媒体资源节点之间通过无向边连接,以得到无向图结构。
149.具体的,在从多个待选指数中,选取大于指数阈值的多个目标指数,并确定与多个目标指数一一对应的多个待选多媒体资源后,电子设备可以将搜索词节点与多个待选多媒体资源对应的多个多媒体资源节点之间通过无向边连接,以得到无向图结构。
150.无向图结构是数据结构的一种,无向图的边是没方向的,即两个相连的顶点可以互相抵达。通过构建无向图结构,可以训练得到搜索词向量特征,以及多个多媒体资源向量特征。
151.在一种实施例中,无向图结构包括:与搜索词对应的搜索词节点,以及与多个多媒体资源一一对应的多个多媒体资源节点。其中,搜索词节点与部分多媒体资源节点之间存在无向边。无向边可以基于部分多媒体资源节点对应的多媒体资源的资源信息确定。
152.s305、电子设备对无向图结构中的节点进行图神经网络训练,以得到搜索词向量特征,以及多个多媒体资源向量特征。
153.具体的,在得到无向图结构后,电子设备可以对无向图结构中的节点进行图神经网络(graph neural network,gnn)训练,以得到搜索词向量特征,以及多个多媒体资源向量特征。
154.图神经网络是一种直接作用于图结构上的神经网络。本公开中,电子设备可以利
用图神经网络对无向图结构中的节点进行训练,从而得到搜索词向量特征,以及多个多媒体资源向量特征。
155.上述实施例提供的技术方案至少带来以下有益效果:由s301-s305可知,电子设备确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征时,可以获取多个多媒体资源中的每个多媒体资源的资源信息,并基于每个多媒体资源的资源信息,确定与多个多媒体资源一一对应的多个待选指数。接着,电子设备从多个待选指数中,选取大于指数阈值的多个目标指数,并确定与多个目标指数一一对应的多个待选多媒体资源,并将搜索词节点与多个待选多媒体资源对应的多个多媒体资源节点之间通过无向边连接,以得到无向图结构。后续,电子设备对无向图结构中的节点进行图神经网络训练,以得到搜索词向量特征,以及多个多媒体资源向量特征。
156.这样一来,通过无向图结构和图神经网络训练,电子设备可以提高确定搜索词向量特征与多媒体资源向量特征的准确性,解决了现有技术导致在进行多媒体资源搜索时的准确性较差的技术问题,提高了多媒体资源搜索时的准确性,进而丰富了用户的搜索体验。
157.在一种实施例中,一个多媒体资源的资源信息包括:点击次数、搜索展示次数、播放时长大于第一阈值的次数、播放次数和播放时长。结合图3,如图4所示,上述s302中,电子设备基于每个多媒体资源的资源信息,确定与多个多媒体资源一一对应的多个待选指数的方法具体包括:
158.s401、电子设备针对于每个多媒体资源的资源信息,均执行目标操作,以得到与多个多媒体资源一一对应的多个待选指数。
159.其中,目标操作为:将点击次数与搜索展示次数之间的比值,确定为点击通过率;将播放时长大于第一阈值的次数与播放次数之间的比值,确定为播放率;基于点击通过率、播放率和播放时长,确定与一个多媒体资源对应的待选指数。
160.其中,点击次数、搜索展示次数、播放时长大于第一阈值的次数、播放次数、播放时长和一个多媒体资源对应的待选指数满足下述公式:
161.final score=(click/show)*(long play/play)*log(play time)。
162.其中,final score为与一个多媒体资源对应的待选指数,click为点击次数,show为搜索展示次数、long play为播放时长大于第一阈值的次数,play为播放次数,play time为播放时长。
163.需要说明的是,本公开中涉及到的各种阈值(例如第一阈值,指数阈值等)可以是相同的数值,也可以是不同的数值,本公开对此不作限定。
164.上述实施例提供的技术方案至少带来以下有益效果:由s401可知,电子设备基于每个多媒体资源的资源信息,确定与多个多媒体资源一一对应的多个待选指数,可以针对于每个多媒体资源的资源信息,均执行目标操作,以得到与多个多媒体资源一一对应的多个待选指数,给出了一种确定与多个多媒体资源一一对应的多个待选指数的具体实现方式,以使得后续电子设备可以从多个待选指数中,选取大于指数阈值的多个目标指数,并确定与多个目标指数一一对应的多个待选多媒体资源,并建立无向图结构,进而通过无向图结构,提高确定搜索词向量特征与多媒体资源向量特征的准确性,解决了现有技术导致在进行多媒体资源搜索时的准确性较差的技术问题,提高了多媒体资源搜索时的准确性,进而丰富了用户的搜索体验。
165.在一种实施例中,结合图3,如图5所示,上述s305中,电子设备对无向图结构中的节点进行图神经网络训练,以得到搜索词向量特征,以及多个多媒体资源向量特征的方法具体包括:
166.s501、电子设备获取与搜索词节点通过无向边连接的第一相邻节点。
167.具体的,电子设备对无向图结构中的节点进行图神经网络训练,以得到搜索词向量特征,以及多个多媒体资源向量特征时,可以获取与搜索词节点通过无向边连接的第一相邻节点。
168.第一相邻节点为通过无向边与搜索词节点连接的多媒体资源节点。
169.s502、电子设备获取与多个多媒体资源节点中的每个多媒体资源节点通过无向边连接的第二相邻节点。
170.具体的,电子设备对无向图结构中的节点进行图神经网络训练,以得到搜索词向量特征,以及多个多媒体资源向量特征时,还可以获取与多个多媒体资源节点中的每个多媒体资源节点通过无向边连接的第二相邻节点。
171.第二相邻节点为通过无向边与每个多媒体资源节点连接的搜索词节点。
172.s503、电子设备根据搜索词节点、第一相邻节点、每个多媒体资源节点和第二相邻节点,对无向图结构中的节点执行图神经网络训练,直到无向图结构训练至收敛状态,以得到搜索词向量特征,以及多个多媒体资源向量特征。
173.具体的,在获取与搜索词节点通过无向边连接的第一相邻节点,以及与多个多媒体资源节点中的每个多媒体资源节点通过无向边连接的第二相邻节点后,电子设备根据搜索词节点、第一相邻节点、每个多媒体资源节点和第二相邻节点,对无向图结构中的节点执行图神经网络训练,直到无向图结构训练至收敛状态,以得到搜索词向量特征,以及多个多媒体资源向量特征。
174.其中,搜索词节点、第一相邻节点、每个多媒体资源节点和第二相邻节点、搜索词向量特征、多个多媒体资源向量特征满足下述公式:
[0175][0176][0177]
其中,eu为搜索词向量特征,ei为第i个多媒体资源向量特征,nu为第一相邻节点,ni为第二相邻节点,k为第k次迭代次数。
[0178]
通过上述公式推导可知,搜索词向量特征eu和第i个多媒体资源向量特征ei满足下述公式:
[0179][0180][0181]
其中,k为预设迭代次数。
[0182]
上述实施例提供的技术方案至少带来以下有益效果:由s501-s503可知,电子设备
对无向图结构中的节点进行图神经网络训练,以得到搜索词向量特征,以及多个多媒体资源向量特征时,可以获取与搜索词节点通过无向边连接的第一相邻节点,以及与多个多媒体资源节点中的每个多媒体资源节点通过无向边连接的第二相邻节点。后续,电子设备根据搜索词节点、第一相邻节点、每个多媒体资源节点和第二相邻节点,对无向图结构中的节点执行图神经网络训练,直到无向图结构训练至收敛状态,以得到搜索词向量特征,以及多个多媒体资源向量特征。给出了一种通过图神经网络进行训练得到搜索词向量特征与多媒体资源的向量特征的具体实现方式。电子设备可以通过图神经网络训练,提高确定搜索词向量特征与多媒体资源向量特征的准确性,解决了现有技术导致在进行多媒体资源搜索时的准确性较差的技术问题,提高了多媒体资源搜索时的准确性,进而丰富了用户的搜索体验。
[0183]
本公开还提供了一种多媒体资源召回方法,如图6所示,该多媒体资源召回方法包括:
[0184]
s601、电子设备接收包括目标搜索词的搜索请求。
[0185]
具体的,用户在想要浏览自己感兴趣的多媒体资源时,可以基于终端执行搜索操作,搜索自己感兴趣的多媒体资源。在这种情况下,终端响应于用户执行的搜索操作,向电子设备发送包括目标搜索词的搜索请求。相应的,电子设备接收包括目标搜索词的搜索请求。
[0186]
s602、电子设备响应于搜索请求,从预先建立好的搜索词与发布账户的对应关系中,确定与目标搜索词对应的至少一个发布账户。
[0187]
具体的,在接收包括目标搜索词的搜索请求后,电子设备响应于搜索请求,从预先建立好的搜索词与发布账户的对应关系中,确定与目标搜索词对应的至少一个发布账户。
[0188]
其中,在建立对应关系时,电子设备可以从发布账户对应的至少一个多媒体类别向量特征中,获取与搜索词的搜索词向量特征相似的目标向量特征,并建立搜索词与目标向量特征对应的目标发布账户之间的对应关系。
[0189]
s603、电子设备发送至少一个发布账户发布的多媒体资源。
[0190]
具体的,从预先建立好的搜索词与发布账户的对应关系中,确定与目标搜索词对应的至少一个发布账户后,电子设备发送至少一个发布账户发布的多媒体资源。
[0191]
上述实施例提供的技术方案至少带来以下有益效果:由s601-s603可知,在接收包括目标搜索词的搜索请求后,电子设备响应于搜索请求,从预先建立好的搜索词与发布账户的对应关系中,确定与目标搜索词对应的至少一个发布账户,并发送至少一个发布账户发布的多媒体资源。由于搜索词与目标向量特征对应的目标发布账户之间的对应关系,是电子设备从发布账户对应的至少一个多媒体类别向量特征中,获取与搜索词的搜索词向量特征相似的目标向量特征后建立的,因此,本公开可以基于目标搜索词准确的召回目标发布账户发布的多媒体资源,解决了现有技术在进行多媒体资源搜索时的准确性较差的技术问题,提高了多媒体资源搜索时的准确性,进而丰富了用户的搜索体验。
[0192]
可以理解的,在实际实施时,本公开实施例所述的终端/服务器可以包含有用于实现前述对应多媒体资源召回方法的一个或多个硬件结构和/或软件模块,这些执行硬件结构和/或软件模块可以构成一个电子设备。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的算法步骤,本公开能够以硬件或硬件和计算机软件的结合
形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
[0193]
基于这样的理解,本公开实施例还对应提供一种多媒体资源召回装置,可以应用于电子设备。图7a示出了本公开实施例提供的多媒体资源召回装置的结构示意图。如图7a所示,该多媒体资源召回装置可以包括:获取单元701和处理单元702;
[0194]
获取单元701,用于获取搜索词以及多个多媒体资源;多个多媒体资源包括直播类型的多媒体资源
[0195]
处理单元702,用于确定与搜索词对应的搜索词向量特征,以及与多个多媒体资源一一对应的多个多媒体资源向量特征;
[0196]
处理单元702,还用于基于多媒体资源对应的发布账户对多个多媒体资源向量特征进行划分,得到各个发布账户对应的多媒体向量特征集合;
[0197]
处理单元702,还用于对多媒体向量特征集合进行聚类,得到发布账户对应的至少一个多媒体类别向量特征;一个多媒体类别向量特征用于表示一个账户已发布的多媒体资源的类别;
[0198]
处理单元702,还用于从至少一个多媒体类别向量特征中,确定与搜索词向量特征相似的目标向量特征,并建立搜索词与目标向量特征对应的目标发布账户之间的对应关系;对应关系用于基于搜索词召回目标发布账户发布的多媒体资源。
[0199]
可选的,处理单元702,具体用于:
[0200]
获取与搜索词对应的发布账户集合,发布账户集合包括各个目标向量特征对应的目标发布账户;
[0201]
以搜索词为索引标识,建立搜索词与发布账户集合的对应关系。
[0202]
可选的,处理单元702,具体用于:
[0203]
获取搜索词向量特征与每个多媒体类别向量特征之间的距离,以得到多个距离;
[0204]
从多个距离中选取满足预设条件的距离,并将满足预设条件的距离对应的多媒体类别向量特征确定为与搜索词向量特征相似的目标向量特征;预设条件包括:距离小于距离阈值或者距离的排序在预设排序之前的至少一个。
[0205]
可选的,处理单元702,具体用于:
[0206]
获取多个多媒体资源中的每个多媒体资源的资源信息;资源信息用于表示每个多媒体资源基于搜素词进行搜索的搜索业务信息;
[0207]
基于每个多媒体资源的资源信息,确定与多个多媒体资源一一对应的多个待选指数;待选指数用于构建无向图结构;无向图结构包括:与搜索词对应的搜索词节点,以及与多个多媒体资源一一对应的多个多媒体资源节点;
[0208]
从多个待选指数中,选取大于指数阈值的多个目标指数,并确定与多个目标指数一一对应的多个待选多媒体资源;
[0209]
将搜索词节点与多个待选多媒体资源对应的多个多媒体资源节点之间通过无向边连接,以得到无向图结构;
[0210]
对无向图结构中的节点进行图神经网络训练,以得到搜索词向量特征,以及多个多媒体资源向量特征。
area networks,wlan)等。作为一个示例,
[0228]
存储器63可以是只读存储器(read-only memory,rom)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,ram)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理单元相连接。存储器也可以和处理单元集成在一起。
[0229]
其中,存储器63用于存储执行本公开方案的应用程序代码,并由处理器61来控制执行。处理器61用于执行存储器63中存储的应用程序代码,从而实现本公开方法中的功能。
[0230]
在具体实现中,作为一种实施例,处理器61可以包括一个或多个cpu,例如图8中的cpu0和cpu1。
[0231]
在具体实现中,作为一种实施例,终端可以包括多个处理器,例如图8中的处理器61和处理器65。这些处理器中的每一个可以是一个单核(single-cpu)处理器,也可以是一个多核(multi-cpu)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
[0232]
在具体实现中,作为一种实施例,终端还可以包括输入设备66和输出设备67。输入设备66和输出设备67通信,可以以多种方式接受用户的输入。例如,输入设备66可以是鼠标、键盘、触摸屏设备或传感设备等。输出设备67和处理器61通信,可以以多种方式来显示信息。例如,输出设备61可以是液晶显示器(liquid crystal display,lcd),发光二级管(light emitting diode,led)显示设备等。
[0233]
本领域技术人员可以理解,图8中示出的结构并不构成对终端的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
[0234]
本公开实施例还提供一种服务器。图9示出了本公开实施例提供的服务器的结构示意图。该服务器可以是多媒体资源召回装置。该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器71和一个或一个以上的存储器72。其中,存储器72中存储有至少一条指令,至少一条指令由处理器71加载并执行以实现上述各个方法实施例提供的多媒体资源召回方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
[0235]
本公开还提供了一种包括指令的计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述计算机可读存储介质中的指令由计算机设备的处理器执行时,使得计算机能够执行上述所示实施例提供的多媒体资源召回方法。例如,计算机可读存储介质可以为包括指令的存储器63,上述指令可由终端的处理器61执行以完成上述方法。又例如,计算机可读存储介质可以为包括指令的存储器72,上述指令可由服务器的处理器71执行以完成上述方法。可选地,计算机可读存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是rom、ram、cd-rom、磁带、软盘和光数据存储设备
等。
[0236]
本公开还提供了一种计算机程序产品,该计算机程序产品包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行上述图1-图6任一附图所示的多媒体资源召回方法。
[0237]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
[0238]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1