资源处理方法、装置、设备及存储介质与流程

文档序号:30002133发布日期:2022-05-11 14:51阅读:91来源:国知局
资源处理方法、装置、设备及存储介质与流程

1.本公开涉及计算机技术领域,尤其涉及一种资源处理方法、装置、设备及存储介质。


背景技术:

2.搜索多样性和用户需求是矛盾的两个需求,无法同时满足。例如,对于“传奇”这个搜索词,有的用户希望展示“传奇歌曲”,另一些用户希望展示“传奇游戏”,在满足一类用户需求的同时,必然会导致另一类用户的需求受到抑制。
3.相关技术中,采用分类网络来对媒体资源进行分类处理,以试图兼顾搜索多样性和用户需求。然而,该分类网络的训练过程依赖于人工标记的样本,不仅增加训练成本,而且更新速度较慢。此外,人工定义的类别数量有限,覆盖率较低。


技术实现要素:

4.本公开提供一种资源处理方法、装置、设备及存储介质,以至少解决相关技术中依赖于人工标记的样本,更新速度慢以及覆盖率低等至少一种问题。本公开的技术方案如下:
5.根据本公开实施例的第一方面,提供一种资源处理方法,包括:
6.获取搜索字符和所述搜索字符对应的多个媒体资源;
7.利用特征提取网络对所述搜索字符和多个所述媒体资源进行编码处理,分别获得搜索特征和多个资源特征;
8.基于所述搜索特征和多个所述资源特征,对所述搜索字符和多个所述媒体资源进行聚类,获得多个聚类集;
9.基于每个所述聚类集对应的聚类特征与所述搜索字符对应的搜索特征,确定多个所述媒体资源对应的排列顺序;
10.其中,所述特征提取网络是基于搜索关系图和初始特征提取网络训练得到,所述搜索关系图包括搜索样本字符对应的搜索节点、搜索样本结果对应的资源节点、以及连接边,所述连接边表征被连接的搜索节点与资源节点之间匹配指标数据大于等于预设匹配指标数据阈值。
11.在一可选实施方式中,所述基于每个所述聚类集对应的聚类特征与所述搜索字符对应的搜索特征,确定多个所述媒体资源对应的排列顺序包括:
12.确定每个聚类集对应的聚类特征,与所述搜索字符对应的搜索特征之间的第一相似度;
13.基于第一相似度结果,确定多个所述媒体资源对应的排列顺序。
14.在一可选实施方式中,所述基于第一相似度结果,确定多个所述媒体资源对应的排列顺序包括:
15.基于第一相似度结果,确定多个所述聚类集对应的且用于指示集合间的第一级顺序;
16.基于每个聚类集中各媒体资源对应的资源特征与所述搜索特征,对每个聚类集中的各媒体资源进行排序处理,获得用于指示集合内的第二级顺序;
17.基于所述第一级顺序和所述第二级顺序,确定多个所述媒体资源对应的排列顺序。
18.在一可选实施方式中,所述基于每个所述聚类集中各媒体资源对应的资源特征与所述搜索特征,对每个聚类集中的各媒体资源进行排序处理,获得用于指示集合内的第二级顺序包括:
19.确定每个所述聚类集中各媒体资源对应的资源特征与所述搜索特征之间的第二相似度;
20.获取每个所述聚类集中各媒体资源对应的历史反馈数据;
21.基于每个所述聚类集中各媒体资源对应的第二相似度和所述历史反馈数据,确定用于指示集合内的第二级顺序。
22.在一可选实施方式中,所述基于每个所述聚类集中各媒体资源对应的第二相似度和所述历史反馈数据,确定用于指示集合内的第二级顺序包括:
23.获取所述第二相似度和所述历史反馈数据对应的权重参数;
24.基于所述权重参数,对每个所述聚类集中各媒体资源对应的第二相似度和所述历史反馈数据进行加权运算处理,获得所述每个所述聚类集中各媒体资源对应的质量数据;
25.基于所述质量数据的大小,对每个聚类集中各媒体资源进行排序处理,获得用于指示集合内的第二级顺序。
26.在一可选实施方式中,所述方法还包括:
27.按照多个所述媒体资源对应的排列顺序,展示多个所述媒体资源。
28.在一可选实施方式中,在所述排列顺序包括第一级排列顺序和第二级排列顺序的情况下,所述按照多个所述媒体资源对应的排列顺序,展示多个所述媒体资源包括:
29.按照所述第一级排列顺序,展示多个聚类集对应的目标媒体资源;
30.响应于对任一聚类集中目标媒体资源的触发操作,按照所述第二级排列顺序,展示被触发的聚类集中预设数量的媒体资源。
31.根据本公开实施例的第二方面,提供一种资源处理装置,包括:
32.获取模块,被配置为执行获取搜索字符和所述搜索字符对应的多个媒体资源;
33.编码模块,被配置为执行利用特征提取网络对所述搜索字符和多个所述媒体资源进行编码处理,分别获得搜索特征和多个资源特征;
34.聚类模块,被配置为执行基于所述搜索特征和多个所述资源特征,对所述搜索字符和多个所述媒体资源进行聚类,获得多个聚类集;
35.顺序确定模块,被配置为执行基于每个所述聚类集对应的聚类特征与所述搜索字符对应的搜索特征,确定多个所述媒体资源对应的排列顺序;
36.其中,所述特征提取网络是基于搜索关系图和初始特征提取网络训练得到,所述搜索关系图包括搜索样本字符对应的搜索节点、搜索样本结果对应的资源节点、以及连接边,所述连接边表征被连接的搜索节点与资源节点之间匹配指标数据大于等于预设匹配指标数据阈值。
37.在一可选实施方式中,所述顺序确定模块包括:
38.相似度确定子模块,被配置为执行确定每个聚类集对应的聚类特征,与所述搜索字符对应的搜索特征之间的第一相似度;
39.顺序确定子模块,被配置为执行基于第一相似度结果,确定多个所述媒体资源对应的排列顺序。
40.在一可选实施方式中,所述顺序确定子模块包括:
41.第一确定单元,被配置为执行基于第一相似度结果,确定多个所述聚类集对应的且用于指示集合间的第一级顺序;
42.第二确定单元,被配置为执行基于每个聚类集中各媒体资源对应的资源特征与所述搜索特征,对每个聚类集中的各媒体资源进行排序处理,获得用于指示集合内的第二级顺序;
43.顺序确定单元,被配置为执行基于所述第一级顺序和所述第二级顺序,确定多个所述媒体资源对应的排列顺序。
44.在一可选实施方式中,所第二确定单元包括:
45.相似度确定子单元,被配置为执行确定每个所述聚类集中各媒体资源对应的资源特征与所述搜索特征之间的第二相似度;
46.获取子单元,被配置为执行获取每个所述聚类集中各媒体资源对应的历史反馈数据;
47.顺序确定子单元,被配置为执行基于每个所述聚类集中各媒体资源对应的第二相似度和所述历史反馈数据,确定用于指示集合内的第二级顺序。
48.在一可选实施方式中,所述顺序确定子单元,具体被配置为执行:
49.获取所述第二相似度和所述历史反馈数据对应的权重参数;
50.基于所述权重参数,对每个所述聚类集中各媒体资源对应的第二相似度和所述历史反馈数据进行加权运算处理,获得所述每个所述聚类集中各媒体资源对应的质量数据;
51.基于所述质量数据的大小,对每个聚类集中各媒体资源进行排序处理,获得用于指示集合内的第二级顺序。
52.在一可选实施方式中,所述装置还包括:
53.展示模块,被配置为执行按照多个所述媒体资源对应的排列顺序,展示多个所述媒体资源。
54.在一可选实施方式中,在所述排列顺序包括第一级排列顺序和第二级排列顺序的情况下,所述展示模块包括:
55.第一展示子模块,被配置为执行按照所述第一级排列顺序,展示多个聚类集对应的目标媒体资源;
56.第二展示子模块,被配置为执行响应于对任一聚类集中目标媒体资源的触发操作,按照所述第二级排列顺序,展示被触发的聚类集中预设数量的媒体资源。
57.根据本公开实施例的第三方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述中任一实施方式所述的资源处理方法。
58.根据本公开实施例的第四方面,提供一种电子设备,包括:
59.处理器;
60.用于存储所述处理器可执行指令的存储器;
61.其中,所述处理器被配置为执行所述指令,以实现如上述任一实施方式所述的资源处理方法。
62.根据本公开实施例的第五方面,提供一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述任一种实施方式中提供的资源处理方法。
63.本公开的实施例提供的技术方案至少带来以下有益效果:
64.本公开实施例通过获取搜索字符和搜索字符对应的多个媒体资源;利用特征提取网络对所述搜索字符和多个所述媒体资源进行编码处理,分别获得搜索特征和多个资源特征;基于搜索特征和多个所述资源特征,对所述搜索字符和多个所述媒体资源进行聚类,获得多个聚类集;基于每个聚类集对应的聚类特征与搜索字符对应的搜索特征,确定多个媒体资源对应的排列顺序;其中,该特征提取网络是基于搜索关系图和初始特征提取网络训练得到,搜索关系图包括搜索样本字符对应的搜索节点、搜索样本结果对应的资源节点、以及连接边,连接边表征被连接的搜索节点与资源节点之间匹配指标数据大于等于预设匹配指标数据阈值。如此,通过基于预设匹配指标数据阈值来构建搜索关系图,并利用该建搜索关系图来训练特征提取网络以得到搜索特征和资源特征,由于确定的资源特征包含了不同的搜索下的用户实际需求的满意资源,因此所构建的资源特征能够更好的表达不同的满意资源信息。此外,通过聚类的方式将资源特征和搜索特征一起聚成不同的类,表示不同的类别,整个过程为无监督学习,能够很好的表示不同用户的需求,降低了人工标记的样本量,也提高资源处理更新速度,提高资源处理的覆盖率。
65.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
66.此处的附图被并入说明书中并构成本公开的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
67.图1是根据一示例性实施例示出的一种应用资源处理方法的系统的架构图。
68.图2是根据一示例性实施例示出的一种资源处理方法的流程图。
69.图3是根据一示例性实施例示出的一种资源处理方法的流程图。
70.图4是根据一示例性实施例示出的一种资源处理方法的流程图。
71.图5是根据一示例性实施例示出的一种资源处理方法的流程图。
72.图6是根据一示例性实施例示出的一种资源处理方法的流程图。
73.图7是根据一示例性实施例示出的一种资源处理装置框图。
74.图8是根据一示例性实施例示出的另一种资源处理装置框图。
75.图9是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
76.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
77.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
78.图1是根据一示例性实施例示出的一种应用资源处理方法的系统的架构图,参见图1,该架构图可以包括终端10和服务器20。
79.其中,终端10可以是但不限于为智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能可穿戴设备、数字助理、增强现实设备、虚拟现实设备等设备。
80.服务器20可以为终端设备提供后台服务。仅作为示例,服务器20可以是但不限于为独立的服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间服务、域名服务、安全服务、以及大数据和人工智能平台等基础云计算服务的云服务器等中一种或多种。该终端10与服务器20之间可以通过有线或无线通信方式进行直接或间接地连接,本公开实施例在此不作限制。
81.需要说明的是,本公开实施例提供的视频搜索方法并不限于服务器单独执行实现,还可以由视频搜索装置来执行,该视频搜索装置可以是硬件形式或软件形式集成在终端或服务器等电子设备中,也可以由终端单独执行实现,或者可以由终端和服务器协同执行实现,本公开实施例在此不作限制。
82.当然,本公开实施例提供的方法并不限用于图1所示的实施环境中,还可以用于其它可能的实施环境,本公开实施例并不进行限制。对于图1所示的硬件环境的各个设备所能实现的功能将在后续的方法实施例中一并进行描述,在此先不过多赘述。
83.图2是根据一示例性实施例示出的一种资源处理方法的流程图。如图2所示,资源处理方法可以应用于电子设备,以该电子设备为上述实施环境示意图中服务器20为例进行说明,包括以下步骤。
84.在步骤s201中,获取搜索字符和搜索字符对应的多个媒体资源。
85.可选地,用户可以在终端上输入搜索字符,该搜索字符用于反映用户的视频搜索需求,该搜索字符可以是输入搜索词、经文本转换后的搜索词等形式,之后根据该搜索字符可以生成媒体资源搜索指令,并将生成的媒体资源搜索指令发送至服务器。服务器响应于接收到的该媒体资源搜索指令,可以从本地媒体库或其他设备(例比如云端、终端或者其他服务器等)中,粗筛一些与媒体资源搜索指令对应的媒体资源作为候选资源。
86.可选地,该候选资源可包括但不限于短视频、长视频、文档、音频中至少一种。其中,短视频即为短片视频,一般是指在互联网新媒体上传播时长在五分钟以内的视频。
87.在步骤s203中,利用特征提取网络对搜索字符和多个媒体资源进行编码处理,分别获得搜索特征和多个资源特征。
88.其中,特征提取网络是基于搜索关系图和初始特征提取网络训练得到,该搜索关系图包括搜索样本字符对应的搜索节点、搜索样本结果对应的资源节点、以及连接边,该连接边表征被连接的搜索节点与资源节点之间匹配指标数据大于等于预设匹配指标数据阈
值。
89.这里,以媒体资源为视频资源为例,对于搜索关系图进行具体说明,该搜索关系图可以是搜索-视频(query-photo)的二部图结构,该二部图结构是多对多的关系。在构建该搜索关系图之前,可以先统计(query,photo)搜索对所对应的反馈数据,并基于反馈数据确定搜索对中搜索字符和媒体资源之间的匹配指标数据。
90.其中,该反馈数据包括长播数据(也即播放时长大于一定阈值)、点赞数据、关注数据、播放数据、转发数据、评论数据、踩数据中至少一种。可选地,这些反馈数据可以通过历史操作记录中计数得到。
91.仅作为示例,以反馈数据包括长播数据(也即播放时长大于一定阈值)、点赞数据、关注数据、播放数据为例进行说明,匹配指标数据x(qi,pj)可以表示为:
92.x(qi,pj)=(a*long_play+b*like+c*follow)/(a*play)
93.其中,qi表示第i个搜索词,pj表示第j个视频,long_play表示针对该qi对应的视频pj的长播放总数,like针对该qi对应的视频pj的点赞总数,follow表示针对该qi对应的视频pj的关注总数,play表示针对该qi对应的视频pj的播放总数,a、b、c均为超参,i和j为正整数。
94.在确定了每个搜索qi,所对应的搜索视频的匹配指标数据为x(qi,pj)之后,将x(qi,pj)与预设匹配指标数据阈值(th)进行比较。若比较结果为x(qi,pj)》=th,则认为该搜索qi与对应的视频pj建立之间的匹配符合用户需求,将搜索qi对应的搜索节点和视频pj对应的资源节点之间建立无向连接边。否则,认为该搜索qi与对应的视频pj建立之间的匹配不符合用户需求,将搜索qi对应的搜索节点和视频pj对应的资源节点之间不建立连接边。依次类推,直至遍历完训练集中所有搜索字符和媒体资源,以构建搜索关系图。
95.在构建了搜索关系图之后,可以基于该搜索关系图对初始特征提取网络进行迭代训练,仅作为示例,该初始特征提取网络可以为图神经网络。
96.在训练过程中,搜索特征eu和资源特征ei的表达式分别可以表示为:
[0097][0098][0099]
其中,k表示迭代次数,nu表示在搜索关系图上某一搜索节点的邻接节点,也即该搜索节点下符合用户需求的资源节点;|nu|为该搜索节点下符合用户需求的各资源节点的计数;ni表示在搜索关系图上某一资源节点的邻接节点,也即该资源节点上存在符合用户需求的搜索节点;|ni|为在该资源节点上存在符合用户需求的各搜索节点的计数。
[0100]
经过k次迭代训练,最终获得搜索特征eu和资源特征ei的表达式可以表示为:
[0101][0102]
其中,αk=1/(k+1);k表示迭代次数,k为总迭代次数。其中,k的具体数值可根据相邻两次迭代训练对应的搜索特征和资源特征的差异小于等于预设迭代阈值来确定。
[0103]
通过上述训练获得训练完成的特征提取网络之后,将搜索字符和多个媒体资源输入该特征提取网络,利用该特征提取网络进行编码处理,分别获得搜索特征eq和多个资源特征ep。搜索特征eq和多个资源特征ep分别可以为嵌入(embedding)特征表示。
[0104]
在步骤s205中,基于搜索特征和多个所述资源特征,对搜索字符和多个媒体资源进行聚类,获得多个聚类集。
[0105]
可选地,可以采用聚类策略,对搜索特征和多个所述资源特征一起进行聚类,获得多个聚类集。也即,每个聚类集中既包括至少一个资源特征,也包括搜索特征。每个聚类集包括一个资源类别,不同聚类集所属资源类别是不同。
[0106]
需要说明的是,虽然每个聚类集中包含了搜索(query)的信息,但是依然认为聚类后的类别是和搜索(query)是相互独立的。例如,在传奇游戏消费比较多的聚类集中,搜索词“传奇”与传奇游戏的视频聚合在一类,但是并不能代表,搜索词“传奇”与传奇歌曲无关。从而,在搜索召回阶段,将聚合视频的类别作为特征,将所有属于相同类别的视频聚合在一块。
[0107]
在步骤s207中,基于每个聚类集对应的聚类特征与搜索字符对应的搜索特征,确定多个媒体资源对应的排列顺序。
[0108]
其中,聚类特征用于表征聚合集中各集合元素的整体内容信息。示例性的,该聚类特征可以是每个聚类集中各搜索字符对应的搜索特征和媒体资源对应的资源特征的均值。
[0109]
具体地,假设存在j1,j2,

,jn共n个聚类集,其中n为整数,计算每个聚类集中各搜索特征和资源特征的平均embedding,并作为该聚合集对应的聚类特征。接着,基于每个聚类集对应的聚类特征分别与搜索字符对应的搜索特征来确定多个媒体资源的排列顺序。
[0110]
在一可选实施方式中,如图3所示,所述基于每个所述聚类集对应的聚类特征与所述搜索字符对应的搜索特征,确定多个所述媒体资源对应的排列顺序包括:
[0111]
在步骤s301中,确定每个聚类集对应的聚类特征,与搜索字符对应的搜索特征之间的第一相似度;
[0112]
在步骤s303中,基于第一相似度结果,确定多个所述媒体资源对应的排列顺序。
[0113]
可选地,获取了每个聚类集对应的聚类特征之后,可以确定每个聚类集对应的聚类特征,与搜索字符对应的搜索特征之间的第一相似度,该第一相似度可以为欧式距离、马氏距离等至少一种。接着,基于第一相似度结果的大小顺序,确定多个所述媒体资源对应的排列顺序。该媒体资源对应的排列先后顺序与第一相似度结果成正相关,也即第一相似度结果越大,排列顺序越靠前,反之,排序顺序越靠后。
[0114]
上述实施例,通过每个聚类集对应的聚类特征,与搜索字符对应的搜索特征之间的第一相似度,确定多个所述媒体资源对应的排列顺序,基于该排列顺序可以相应的搜索排列结果,或者确定媒体资源的推荐优先级,将更符合搜索需求的资源提供给用户,提高了资源处理效率和资源处理效果。
[0115]
在一可选实施方式中,所述基于第一相似度结果,确定多个所述媒体资源对应的排列顺序包括:
[0116]
在步骤s3031中,基于第一相似度结果,确定多个聚类集对应的且用于指示集合间的第一级顺序;
[0117]
在步骤s3033中,基于每个聚类集中各媒体资源对应的资源特征与搜索特征,对每
个聚类集中的各媒体资源进行排序处理,获得用于指示集合内的第二级顺序;
[0118]
在步骤s3035中,基于第一级顺序和第二级顺序,确定多个媒体资源对应的排列顺序。
[0119]
可选地,第一级顺序用于指示集合间的顺序,也即多个聚类集之间的排序。假设存在j1,j2,

,jn共n个聚类集,计算每个聚类集的平均embedding,作为该聚合集对应的聚类特征,分别与query embedding计算相似度,根据相似度降序排列,获得该第一级顺序。
[0120]
第二级顺序用于指示集合内的顺序,也即每个聚类集内部的媒体资源排序。该第二级顺序可以通过每个聚类集中各媒体资源对应的资源特征与所述搜索特征进行确定。
[0121]
示例性的,可以根据第一级顺序,将各聚类集作为一个整体进行排序,然后根据第二级顺序,对每个聚类集中各媒体资源进行再次排序,最终确定多个媒体资源的排列顺序。例如多个媒体的排列顺序可以表示为{(j2:c1,cm,...),...(ji:d3,dn,...),...},其中,ji是指不同聚合集,cm和dn分别是不同聚合集中对应的不同媒体资源,i、m和n均为正整数。
[0122]
上述实施例根据用于指示集合间的第一级顺序和用于指示集合内的第二级顺序实现资源的多级顺序排布,可以实现媒体资源的梯度展示。
[0123]
在一可选实施方式中,如图4所示,所述基于每个聚类集中各媒体资源对应的资源特征与搜索特征,对每个聚类集中的各媒体资源进行排序处理,获得用于指示集合内的第二级顺序包括:
[0124]
在步骤s401中,确定每个聚类集中各媒体资源对应的资源特征与搜索特征之间的第二相似度;
[0125]
在步骤s403中,获取每个聚类集中各媒体资源对应的历史反馈数据;
[0126]
在步骤s405中,基于每个聚类集中各媒体资源对应的第二相似度和历史反馈数据,确定用于指示集合内的第二级顺序。
[0127]
上述实施例,通过结合每个聚类集中各媒体资源对应的第二相似度和历史反馈数据,来确定用于指示集合内的第二级顺序,确保排序靠前的媒体资源更符合用户需求,提高资源处理效果和用户粘度。
[0128]
在一可选实施方式中,如图5所示,所述获取每个聚类集中各媒体资源对应的历史反馈数据包括:
[0129]
在步骤s501中,获取第一反馈指标数据和第二反馈指标数据。
[0130]
其中,第一反馈指标数据用于表征对媒体资源的吸引程度,第二反馈指标数据用于表征对媒体资源的满意程度;
[0131]
在步骤s503中,基于第一反馈指标数据和第二反馈指标数据,确定历史反馈数据。
[0132]
相应的,所述基于每个所述聚类集中各媒体资源对应的第二相似度和所述历史反馈数据,确定用于指示集合内的第二级顺序包括:
[0133]
在步骤s505中,获取第二相似度和所述历史反馈数据对应的权重参数;
[0134]
在步骤s507中,基于权重参数,对每个聚类集中各媒体资源对应的第二相似度和历史反馈数据进行加权运算处理,获得每个所述聚类集中各媒体资源对应的质量数据;
[0135]
在步骤s509中,基于质量数据的大小,对每个聚类集中各媒体资源进行排序处理,获得用于指示集合内的第二级顺序。
[0136]
可选地,第二级顺序可以根据第二相似度和历史反馈数据来确定。该历史反馈数
据用于反映用户对该媒体资源的后验消费情况。第二相似度rel可以为query embedding和phot o embedding的内积,历史反馈数据con可以包括第一反馈指标数据和第二反馈指标数据,所述第一反馈指标数据用于表征对媒体资源的吸引程度,所述第二反馈指标数据用于表征对媒体资源的满意程度。第一反馈指标数据ctr可以为点击率和曝光率的比值,第二反馈指标数据可以是长播数据(也即播放时长大于一定阈值)、点赞数据、关注数据、播放数据的加权和值。历史反馈数据con可以是第一反馈指标数据和第二反馈指标数据的乘积,示例性的,质量数据(例如final_score)可以是第二相似度和历史反馈数据进行加权和值,例如final_score=x*rel+y*con,其中x、y为权重参数,最后根据final_score的分值进行降序排序,获得用于指示集合内的第二级顺序。
[0137]
本公开实施例通过获取搜索字符和搜索字符对应的多个媒体资源;利用特征提取网络对所述搜索字符和多个所述媒体资源进行编码处理,分别获得搜索特征和多个资源特征;基于搜索特征和多个所述资源特征,对所述搜索字符和多个所述媒体资源进行聚类,获得多个聚类集;基于每个聚类集对应的聚类特征与搜索字符对应的搜索特征之间的第一相似度,确定多个媒体资源对应的排列顺序;其中,该特征提取网络是基于搜索关系图和初始特征提取网络训练得到,搜索关系图包括搜索样本字符对应的搜索节点、搜索样本结果对应的资源节点、以及连接边,连接边表征被连接的搜索节点与资源节点之间匹配指标数据大于等于预设匹配指标数据阈值。如此,通过基于预设匹配指标数据阈值来构建搜索关系图,并利用该建搜索关系图来训练特征提取网络以得到搜索特征和资源特征,由于确定的资源特征包含了不同的搜索下的用户实际需求的满意资源,因此所构建的资源特征能够更好的表达不同的满意资源信息。此外,通过聚类的方式将资源特征和搜索特征一起聚成不同的类,表示不同的类别,整个过程为无监督学习,能够很好的表示不同用户的需求,降低了人工标记的样本量,也提高资源处理更新速度,提高资源处理的覆盖率。
[0138]
在一可选实施方式中,如图6所示,所述方法还包括:
[0139]
在步骤s209中,按照多个媒体资源对应的排列顺序,展示多个媒体资源。
[0140]
可选地,可以按照多媒体资源对应的第一级顺序进行排序,展示多个媒体资源,或者也结合第一级排序顺序和第二级排列顺序进行排序展示。
[0141]
示例性的,若多个媒体的排列顺序表示为{(j2:c1,cm,...),...(ji:d3,dn,...),...},其中,ji是指不同聚合集,cm和dn分别是不同聚合集中对应的不同媒体资源,i、m和n均为正整数。则可以从每个聚类集中按照第二级排列顺序筛选出若干媒体资源。
[0142]
作为一实施例,可以从每个聚类集中筛选相同数量的媒体资源进行展示。具体地,若每个聚类集中筛选2个媒体资源,按照第一级排列顺序和第二级排序顺序进行展示,例如展示结果可以为{c1,cm,d3,dn,...}。又或者,可以将同一聚类集的媒体资源放在一起进行展示,例如展示结果可以为{(c1,cm),(d3,dn),...},从而根据不同聚类实现了差异化展示。
[0143]
作为另一实施例,可以从每个聚类集中筛选不同数量的媒体资源进行展示,例如若第一级顺序靠前的聚类集所对应的媒体资源数量可以越多,相反,则对应的媒体资源数量可以越少。具体地,对于每个搜索页,排序最靠前的聚类集可以展示3个媒体资源,排序第二的聚类集可以展示2个媒体资源,其他排序的聚类集展示1个媒体资源。例如,展示结果可以为{c1,cm,cn,d3,dn,...}。又或者,可以将同一聚类集的媒体资源放在一起进行展示,例如展示结果可以为{(c1,cm,cn),(d3,dn),...},从而根据不同聚类实现了差异化展示。
[0144]
上述实施例,通过按照多个媒体资源对应的排列顺序,展示多个媒体资源,可以实现在有限的展示位置进行针对性媒体资源展示,使得展示结果能够满足不同用户的需求,提高资源处理效果。
[0145]
在一可选实施方式中,在所述排列顺序包括第一级排列顺序和第二级排列顺序的情况下,所述按照多个所述媒体资源对应的排列顺序,展示多个所述媒体资源;
[0146]
在步骤s2091中,按照第一级排列顺序,展示多个聚类集对应的目标媒体资源;
[0147]
在步骤s2093中,响应于对任一聚类集中目标媒体资源的触发操作,按照第二级排列顺序,展示被触发的聚类集中预设数量的媒体资源。
[0148]
上述实施例,通过将对相似媒体资源进行聚类,在有限的展示位置媒体资源,展示多样性的内容,当用户点击感兴趣的内容后,展示聚合的相似资源,兼顾效率和公平,满足不同用户的需求,提高用户粘度。
[0149]
图7是根据一示例性实施例示出的一种资源处理装置框图。参照图7,该装置应用于电子设备,包括:
[0150]
获取模块710,被配置为执行获取搜索字符和所述搜索字符对应的多个媒体资源;
[0151]
编码模块720,被配置为执行利用特征提取网络对所述搜索字符和多个所述媒体资源进行编码处理,分别获得搜索特征和多个资源特征;
[0152]
聚类模块730,被配置为执行基于所述搜索特征和多个所述资源特征,对所述搜索字符和多个所述媒体资源进行聚类,获得多个聚类集;
[0153]
顺序确定模块740,被配置为执行基于每个所述聚类集对应的聚类特征与所述搜索字符对应的搜索特征,确定多个所述媒体资源对应的排列顺序;
[0154]
其中,所述特征提取网络是基于搜索关系图和初始特征提取网络训练得到,所述搜索关系图包括搜索样本字符对应的搜索节点、搜索样本结果对应的资源节点、以及连接边,所述连接边表征被连接的搜索节点与资源节点之间匹配指标数据大于等于预设匹配指标数据阈值。
[0155]
在一可选实施方式中,所述顺序确定模块包括:
[0156]
相似度确定子模块,被配置为执行确定每个聚类集对应的聚类特征,与所述搜索字符对应的搜索特征之间的第一相似度;
[0157]
顺序确定子模块,被配置为执行基于第一相似度结果,确定多个所述媒体资源对应的排列顺序。
[0158]
在一可选实施方式中,所述顺序确定子模块包括:
[0159]
第一确定单元,被配置为执行基于第一相似度结果,确定多个所述聚类集对应的且用于指示集合间的第一级顺序;
[0160]
第二确定单元,被配置为执行基于每个聚类集中各媒体资源对应的资源特征与所述搜索特征,对每个聚类集中的各媒体资源进行排序处理,获得用于指示集合内的第二级顺序;
[0161]
顺序确定单元,被配置为执行基于所述第一级顺序和所述第二级顺序,确定多个所述媒体资源对应的排列顺序。
[0162]
在一可选实施方式中,所第二确定单元包括:
[0163]
相似度确定子单元,被配置为执行确定每个所述聚类集中各媒体资源对应的资源
特征与所述搜索特征之间的第二相似度;
[0164]
获取子单元,被配置为执行获取每个所述聚类集中各媒体资源对应的历史反馈数据;
[0165]
顺序确定子单元,被配置为执行基于每个所述聚类集中各媒体资源对应的第二相似度和所述历史反馈数据,确定用于指示集合内的第二级顺序。
[0166]
在一可选实施方式中,所述顺序确定子单元,具体被配置为执行:
[0167]
获取所述第二相似度和所述历史反馈数据对应的权重参数;
[0168]
基于所述权重参数,对每个所述聚类集中各媒体资源对应的第二相似度和所述历史反馈数据进行加权运算处理,获得所述每个所述聚类集中各媒体资源对应的质量数据;
[0169]
基于所述质量数据的大小,对每个聚类集中各媒体资源进行排序处理,获得用于指示集合内的第二级顺序。
[0170]
在一可选实施方式中,如图8所示,所述装置还包括:
[0171]
展示模块750,被配置为执行按照多个所述媒体资源对应的排列顺序,展示多个所述媒体资源。
[0172]
在一可选实施方式中,在所述排列顺序包括第一级排列顺序和第二级排列顺序的情况下,所述展示模块包括:
[0173]
第一展示子模块,被配置为执行按照所述第一级排列顺序,展示多个聚类集对应的目标媒体资源;
[0174]
第二展示子模块,被配置为执行响应于对任一聚类集中目标媒体资源的触发操作,按照所述第二级排列顺序,展示被触发的聚类集中预设数量的媒体资源。
[0175]
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0176]
图9是根据一示例性实施例示出的一种电子设备的框图。参照图9,电子设备包括处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行存储器上所存放的指令时,实现上述实施例中任一资源处理方法的步骤。
[0177]
该电子设备可以终端、服务器或者类似的运算装置,以该电子设备是服务器为例,图9是根据一示例性实施例示出的一种用于推荐内容确定或推荐的电子设备的框图,该电子设备1000可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,cpu)1010(处理器1010可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器1030,一个或一个以上存储应用程序1023或数据1022的存储介质1020(例如一个或一个以上海量存储设备)。其中,存储器1030和存储介质1020可以是短暂存储或持久存储。存储在存储介质1020的程序可以包括一个或一个以上模块,每个模块可以包括对电子设备中的一系列指令操作。更进一步地,中央处理器1010可以设置为与存储介质1020通信,在电子设备1000上执行存储介质1020中的一系列指令操作。
[0178]
电子设备1000还可以包括一个或一个以上电源1060,一个或一个以上有线或无线网络接口1050,一个或一个以上输入输出接口1040,和/或,一个或一个以上操作系统1021,例如windows server,mac os x,unix,linux,freebsd等等。
[0179]
输入输出接口1040可以用于经由一个网络接收或者发送数据。上述的网络具体实
例可包括电子设备1000的通信供应商提供的无线网络。在一个实例中,输入输出接口1040包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个示例性实施例中,输入输出接口1040可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
[0180]
本领域普通技术人员可以理解,图9所示的结构仅为示意,其并不对上述电子设备的结构造成限定。例如,电子设备1000还可包括比图9中所示更多或者更少的组件,或者具有与图9所示不同的配置。
[0181]
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器,上述指令可由电子设备1000的处理器执行以完成上述方法。可选地,计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0182]
在示例性实施例中,还提供了一种计算机存储介质,当计算机存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一种实施方式中提供的方法的步骤。
[0183]
在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品包括计算机程序/指令,该所述计算机程序/指令被处理器执行时实现上述任一种实施方式中提供的方法。可选地,该计算机程序存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该电子设备执行上述任一种实施方式中提供的方法。
[0184]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0185]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
[0186]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1