多媒体资源推荐方法、装置、电子设备及存储介质与流程

文档序号：28082678发布日期：2021-12-18 01:34阅读：99来源：国知局

1.本公开涉及人工智能技术领域，尤其涉及一种多媒体资源推荐方法、装置、电子设备及存储介质。

背景技术：

2.随着互联网技术的发展，大量网络平台也在不断的升级，除了可以发布一些图文信息之外，也可以供个人用户随时分享日常的短视频等，而如何精准的捕捉用户的兴趣是大量推荐系统遇到的挑战。
3.相关技术中，往往直接将包括很长一段时间内的用户大量历史行为记录的行为序列作为学习用户兴趣偏好的神经网络的输入数据，但将大量历史历史行为记录混合在一起，往往无法学习的细粒度特征，无法有效学习到用户的兴趣偏好，造成推荐系统中推荐精准性和效果差的问题。

技术实现要素：

4.本公开提供一种多媒体资源推荐方法、装置、电子设备及存储介质，以至少解决相关技术中无法有效表征用户真实兴趣，进而造成推荐系统中推荐精准性和效果差的问题。本公开的技术方案如下：
5.根据本公开实施例的第一方面，提供一种多媒体资源推荐方法，包括：
6.响应于目标对象的多媒体资源获取请求，获取所述目标对象的历史行为序列信息和待推荐的至少一个多媒体资源的第一资源标识信息，所述历史行为序列信息包括所述目标对象在预设时间段内行为过的多个多媒体资源的第二资源标识信息和多个所述多媒体资源对应的第一数量个时序标识信息，所述时序标识信息为基于多个所述多媒体资源对应的行为时间所在预设分布时间段确定的标识；
7.将所述历史行为序列信息和所述第一资源标识信息输入兴趣识别网络进行兴趣识别，得到所述目标对象对所述至少一个多媒体资源的目标兴趣指标；
8.基于所述目标兴趣指标，将所述至少一个多媒体资源中的目标多媒体资源推荐给所述目标对象。
9.可选的，所述兴趣识别网络包括编码网络、所述第一数量个基础胶囊网络、第二数量个兴趣胶囊网络、特征融合网络和兴趣感知网络，所述第二数量为预设的资源类型对应的数量；
10.所述将所述历史行为序列信息和所述第一资源标识信息输入兴趣识别网络进行兴趣识别，得到所述目标对象对所述至少一个多媒体资源的目标兴趣指标包括：
11.基于所述编码网络对所述历史行为序列信息进行编码处理，得到行为编码信息，所述行为编码信息包括所述第二资源标识信息对应的资源编码特征信息和所述第一数量个时序标识信息对应的第一数量个时序编码特征信息；
12.根据所述第一数量个时序编码特征信息确定所述第一数量个基础胶囊网络中基
础胶囊特征信息；
13.基于每个基础胶囊网络相对于所述第二数量个兴趣胶囊网络的传输权重，将所述基础胶囊特征信息传输给所述第二数量个兴趣胶囊网络进行兴趣识别，得到所述第二数量个兴趣胶囊网络对应的初始兴趣特征信息；
14.将所述第二数量个兴趣胶囊网络对应的初始兴趣特征信息和所述第一资源标识信息对应的资源特征信息输入所述特征融合网络进行特征融合，得到目标兴趣特征信息；
15.将所述资源编码特征信息、所述目标兴趣特征信息和所述第一资源标识信息对应的资源特征信息输入所述兴趣感知网络进行兴趣感知处理，得到所述目标兴趣指标。
16.可选的，所述编码网络包括：特征提取网络、位置编码网络和至少一个按序连接的子编码网络，任一子编码网络包括自注意力网络和前馈神经网络，所述基于所述编码网络对所述历史行为序列信息进行编码处理，得到行为编码信息包括：
17.基于所述特征提取网络提取所述历史行为序列信息的行为特征信息；
18.基于所述位置编码网络对所述行为特征信息进行位置编码处理，得到目标行为特征信息；
19.遍历所述至少一个按序连接的子编码网络，在遍历到任一子编码网络的情况下，将当前行为特征信息输入当前遍历到的子编码网络中的自注意力网络进行自注意力学习，得到当前初始编码信息；
20.将所述当前初始编码信息输入所述当前遍历到的子编码网络中的前馈神经网络进行非线性处理，得到当前编码行为信息；
21.将遍历结束时的当前编码行为信息作为所述行为编码信息；
22.其中，所述至少一个按序连接的子编码网络中第一个子编码网络的当前行为特征信息为所述目标行为特征信息，所述至少一个按序连接的子编码网络中非第一个子编码网络的当前行为序列信息为前一个子编码网络输出的当前编码行为信息。
23.可选的，所述方法还包括：
24.生成目标掩码信息，所述目标掩码信息包括第一掩码信息、第二掩码信息、第三掩码信息和第四掩码信息，所述第一掩码信息表征与所述第一数量个时序标识信息对应的所述第一数量个行为序列片段间的关联关系；所述第二掩码信息表征多个所述多媒体资源中任一多媒体资源的第二资源标识信息与预设范围内的多媒体资源的第二资源标识信息间的关联关系；所述第三掩码信息表征所述第一数量个行为序列片段对多个所述多媒体资源的关联信息；所述第四掩码信息表征多个所述多媒体资源对所述第一数量个行为序列片段的关联信息；
25.所述将当前行为特征信息输入当前遍历到的子编码网络中的自注意力网络进行自注意力学习，得到当前初始编码信息包括：
26.将当前行为特征信息和所述目标掩码信息输入当前遍历到的子编码网络中的自注意力网络进行自注意力学习，得到所述当前初始编码信息。
27.可选的，所述方法还包括：
28.将目标资源编码特征信息、所述目标兴趣特征信息和所述第一资源标识信息输入所述兴趣感知网络进行兴趣感知处理，得到所述目标兴趣指标；
29.其中，所述目标资源编码特征信息为多个所述多媒体资源对应的资源编码特征信
息中对应的行为时间和当前时间的时间差满足预设条件的资源编码特征信息。
30.可选的，所述特征融合网络为包括权重学习层和加权处理层的注意力学习网络，所述将所述第二数量个兴趣胶囊网络对应的初始兴趣特征信息和所述第一资源标识信息对应的资源特征信息输入所述特征融合网络进行特征融合，得到目标兴趣特征信息包括：
31.将所述第二数量个兴趣胶囊网络对应的初始兴趣特征信息和所述第一资源标识信息输入所述权重学习层进行权重学习，得到兴趣权重信息，所述兴趣权重信息表征所述第二数量个兴趣胶囊网络对应的初始兴趣特征信息对所述目标对象的兴趣的影响程度；
32.将所述兴趣权重信息和所述初始兴趣特征信息输入所述加权处理层进行加权处理，得到所述目标兴趣特征信息。
33.可选的，所述方法还包括：
34.获取样本对象的样本行为序列信息、至少一个样本多媒体资源的第三资源标识信息和标注兴趣指标，所述样本行为序列信息包括所述样本对象在预设样本时间段内行为过的多个历史多媒体资源的第四资源标识信息和基于多个所述历史多媒体资源对应的行为时间确定的，与多个所述历史媒体资源对应的所述第一数量个样本时序标识信息；
35.确定多个所述历史多媒体资源对应的多个资源类型；
36.确定每一资源类型对应资源标识信息在所述样本行为序列信息中的样本出现概率；
37.将所述历史行为序列信息和所述第三资源标识信息输入待训练兴趣识别网络进行兴趣识别，得到所述样本对象对所述至少一个样本多媒体资源的预测兴趣指标和多个所述资源类型对应预测出现概率；
38.基于所述预测兴趣指标、所述预测出现概率、所述样本出现概率和所述标注兴趣指标，确定目标兴趣损失；
39.基于所述目标兴趣损失训练所述待训练兴趣识别网络，得到所述兴趣识别网络。
40.可选的，所述基于所述预测兴趣指标、所述预测出现概率、所述样本出现概率和所述标注兴趣指标，确定目标兴趣损失包括：
41.根据所述预测兴趣指标和所述标注兴趣指标，确定初始兴趣损失信息；
42.根据所述预测出现概率和所述样本出现概率，确定兴趣引导损失信息；
43.基于所述初始兴趣损失信息和所述兴趣引导损失信息，确所述目标兴趣损失。
44.根据本公开实施例的第二方面，提供一种多媒体资源推荐装置，包括：
45.第一信息获取模块，被配置为执行响应于目标对象的多媒体资源获取请求，获取所述目标对象的历史行为序列信息和待推荐的至少一个多媒体资源的第一资源标识信息，所述历史行为序列信息包括所述目标对象在预设时间段内行为过的多个多媒体资源的第二资源标识信息和多个所述多媒体资源对应的第一数量个时序标识信息，所述时序标识信息为基于多个所述多媒体资源对应的行为时间所在预设分布时间段确定的标识；
46.第一兴趣识别模块，被配置为执行将所述历史行为序列信息和所述第一资源标识信息输入兴趣识别网络进行兴趣识别，得到所述目标对象对所述至少一个多媒体资源的目标兴趣指标；
47.多媒体资源推荐模块，被配置为执行基于所述目标兴趣指标，将所述至少一个多媒体资源中的目标多媒体资源推荐给所述目标对象。
48.可选的，所述兴趣识别网络包括编码网络、所述第一数量个基础胶囊网络、第二数量个兴趣胶囊网络、特征融合网络和兴趣感知网络，所述第二数量为预设的资源类型对应的数量；
49.所述第一兴趣识别模块包括：
50.编码处理单元，被配置为执行基于所述编码网络对所述历史行为序列信息进行编码处理，得到行为编码信息，所述行为编码信息包括所述第二资源标识信息对应的资源编码特征信息和所述第一数量个时序标识信息对应的第一数量个时序编码特征信息；
51.基础胶囊特征信息确定单元，被配置为执行根据所述第一数量个时序编码特征信息确定所述第一数量个基础胶囊网络中基础胶囊特征信息；
52.兴趣识别单元，被配置为执行基于每个基础胶囊网络相对于所述第二数量个兴趣胶囊网络的传输权重，将所述基础胶囊特征信息传输给所述第二数量个兴趣胶囊网络进行兴趣识别，得到所述第二数量个兴趣胶囊网络对应的初始兴趣特征信息；
53.特征融合单元，被配置为执行将所述第二数量个兴趣胶囊网络对应的初始兴趣特征信息和所述第一资源标识信息对应的资源特征信息输入所述特征融合网络进行特征融合，得到目标兴趣特征信息；
54.第一兴趣感知处理单元，被配置为执行将所述资源编码特征信息、所述目标兴趣特征信息和所述第一资源标识信息对应的资源特征信息输入所述兴趣感知网络进行兴趣感知处理，得到所述目标兴趣指标。
55.可选的，所述编码网络包括：特征提取网络、位置编码网络和至少一个按序连接的子编码网络，任一子编码网络包括自注意力网络和前馈神经网络，所述编码处理单元包括：
56.行为特征信息提取单元，被配置为执行基于所述特征提取网络提取所述历史行为序列信息的行为特征信息；
57.位置编码处理单元，被配置为执行基于所述位置编码网络对所述行为特征信息进行位置编码处理，得到目标行为特征信息；
58.遍历单元，被配置为执行遍历所述至少一个按序连接的子编码网络；
59.自注意力学习单元，被配置为执行在遍历到任一子编码网络的情况下，将当前行为特征信息输入当前遍历到的子编码网络中的自注意力网络进行自注意力学习，得到当前初始编码信息；
60.非线性处理单元，被配置为执行将所述当前初始编码信息输入所述当前遍历到的子编码网络中的前馈神经网络进行非线性处理，得到当前编码行为信息；
61.行为编码信息确定单元，被配置为执将遍历结束时的当前编码行为信息作为所述行为编码信息；
62.其中，所述至少一个按序连接的子编码网络中第一个子编码网络的当前行为特征信息为所述目标行为特征信息，所述至少一个按序连接的子编码网络中非第一个子编码网络的当前行为序列信息为前一个子编码网络输出的当前编码行为信息。
63.可选的，所述装置还包括：
64.目标掩码信息生成模块，被配置为执行生成目标掩码信息，所述目标掩码信息包括第一掩码信息、第二掩码信息、第三掩码信息和第四掩码信息，所述第一掩码信息表征与所述第一数量个时序标识信息对应的所述第一数量个行为序列片段间的关联关系；所述第
二掩码信息表征多个所述多媒体资源中任一多媒体资源的第二资源标识信息与预设范围内的多媒体资源的第二资源标识信息间的关联关系；所述第三掩码信息表征所述第一数量个行为序列片段对多个所述多媒体资源的关联信息；所述第四掩码信息表征多个所述多媒体资源对所述第一数量个行为序列片段的关联信息；
65.所述自注意力学习模块还被配置为执行将当前行为特征信息和所述目标掩码信息输入当前遍历到的子编码网络中的自注意力网络进行自注意力学习，得到所述当前初始编码信息。
66.可选的，所述装置还包括：
67.第二兴趣感知处理单元，被配置为执行将目标资源编码特征信息、所述目标兴趣特征信息和所述第一资源标识信息输入所述兴趣感知网络进行兴趣感知处理，得到所述目标兴趣指标；
68.其中，所述目标资源编码特征信息为多个所述多媒体资源对应的资源编码特征信息中对应的行为时间和当前时间的时间差满足预设条件的资源编码特征信息。
69.可选的，所述特征融合网络为包括权重学习层和加权处理层的注意力学习网络，所述特征融合单元包括：
70.权重学习单元，被配置为执行将所述第二数量个兴趣胶囊网络对应的初始兴趣特征信息和所述第一资源标识信息输入所述权重学习层进行权重学习，得到兴趣权重信息，所述兴趣权重信息表征所述第二数量个兴趣胶囊网络对应的初始兴趣特征信息对所述目标对象的兴趣的影响程度；
71.加权处理单元，被配置为执行将所述兴趣权重信息和所述初始兴趣特征信息输入所述加权处理层进行加权处理，得到所述目标兴趣特征信息。
72.可选的，所述装置还包括：
73.第二信息获取模块，被配置为执行获取样本对象的样本行为序列信息、至少一个样本多媒体资源的第三资源标识信息和标注兴趣指标，所述样本行为序列信息包括所述样本对象在预设样本时间段内行为过的多个历史多媒体资源的第四资源标识信息和基于多个所述历史多媒体资源对应的行为时间确定的，与多个所述历史媒体资源对应的所述第一数量个样本时序标识信息；
74.资源类型确定模块，被配置为执行确定多个所述历史多媒体资源对应的多个资源类型；
75.样本出现概率确定模块，被配置为执行确定每一资源类型对应资源标识信息在所述样本行为序列信息中的样本出现概率；
76.第二兴趣识别模块，被配置为执行将所述历史行为序列信息和所述第三资源标识信息输入待训练兴趣识别网络进行兴趣识别，得到所述样本对象对所述至少一个样本多媒体资源的预测兴趣指标和多个所述资源类型对应预测出现概率；
77.目标兴趣损失确定模块，被配置为执行基于所述预测兴趣指标、所述预测出现概率、所述样本出现概率和所述标注兴趣指标，目标兴趣损失；
78.兴趣识别网络训练模块，被配置为执行基于所述目标兴趣损失训练所述待训练兴趣识别网络，得到所述兴趣识别网络。
79.可选的，所述目标兴趣损失确定模块包括：
80.初始兴趣损失信息确定单元，被配置为执行根据所述预测兴趣指标和所述标注兴趣指标，确定初始兴趣损失信息；
81.兴趣引导损失信息确定单元，被配置为执行根据所述预测出现概率和所述样本出现概率，确定兴趣引导损失信息；
82.目标兴趣损失确定单元，被配置为执行基于所述初始兴趣损失信息和所述兴趣引导损失信息，确所述目标兴趣损失。
83.根据本公开实施例的第三方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如上述第一方面中任一项所述的方法。
84.根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行本公开实施例的第一方面中任一所述方法。
85.根据本公开实施例的第五方面，提供一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行本公开实施例的第一方面中任一所述方法。
86.本公开的实施例提供的技术方案至少带来以下有益效果：
87.在多媒体资源推荐过程中，在包括目标对象在预设时间段内行为过的多个多媒体资源的第二资源标识信息的历史行为序列中，还引入了基于多个多媒体资源对应的行为时间所在预设分布时间段确定的第一数量个时序标识信息，可以在进行兴趣识别过程中，全面掌握行为数据，同时结合时序标识信息学习到不同时间段内的兴趣喜好和更多的细粒度特征，可以有效表征用户真实兴趣，提高兴趣识别效率和识别精准性，进而大大提升推荐系统中信息推荐精准性和推荐效果。
88.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
89.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。
90.图1是根据一示例性实施例示出的一种应用环境的示意图；
91.图2是根据一示例性实施例示出的一种多媒体资源推荐方法的流程图；
92.图3是根据一示例性实施例示出的一种将历史行为序列信息和第一资源标识信息输入兴趣识别网络进行兴趣识别，得到目标对象对至少一个多媒体资源的目标兴趣指标的流程图；
93.图4是根据一示例性实施例示出的一种基于编码网络对历史行为序列信息进行编码处理，得到行为编码信息的流程图；
94.图5是根据一示例性实施例示出的一种目标掩码信息的示意图；
95.图6是根据一示例性实施例示出的另一种将历史行为序列信息和第一资源标识信息输入兴趣识别网络进行兴趣识别，得到目标对象对至少一个多媒体资源的目标兴趣指标的流程图；
96.图7是根据一示例性实施例示出的一种预先训练兴趣识别网络的流程图；
97.图8是根据一示例性实施例示出的一种基于预测兴趣指标、预测出现概率、样本出现概率和标注兴趣指标，确定目标兴趣损失的流程图；
98.图9是根据一示例性实施例示出的一种兴趣识别网络的示意图；
99.图10是根据一示例性实施例示出的一种多媒体资源推荐装置框图；
100.图11是根据一示例性实施例示出的一种用于多媒体资源推荐的电子设备的框图；
101.图12是根据一示例性实施例示出的一种用于多媒体资源推荐的电子设备的框图。
具体实施方式
102.为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。
103.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
104.需要说明的是，本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。
105.请参阅图1，图1是根据一示例性实施例示出的一种应用环境的示意图，如图1所示，该应用环境可以包括服务器100和终端200。
106.在一个可选的实施例中，服务器100可以用于训练兴趣识别网络。具体的，服务器100可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
107.在一个可选的实施例中，终端200可以结合服务器100训练出的兴趣识别网络，进行多媒体资源推荐处理。具体的，终端200可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality，ar)/虚拟现实(virtual reality，vr)设备、智能可穿戴设备等类型的电子设备。可选的，电子设备上运行的操作系统可以包括但不限于安卓系统、ios系统、linux、windows等。
108.此外，需要说明的是，图1所示的仅仅是本公开提供的一种应用环境，在实际应用中，还可以包括其他应用环境，例如多媒体资源推荐处理，也可以在服务器100上实现。
109.本说明书实施例中，上述服务器100以及终端200可以通过有线或无线通信方式进行直接或间接地连接，本公开在此不做限制。
110.图2是根据一示例性实施例示出的一种多媒体资源推荐方法的流程图，如图1所示，该多媒体资源推荐方法用于终端、服务器电子设备中，包括以下步骤。
111.在步骤s201中，响应于目标对象的多媒体资源获取请求，获取目标对象的历史行为序列信息和待推荐的至少一个多媒体资源的第一资源标识信息。
112.在一个可选的实施例中，目标对象为用户，也可以为用户在推荐系统中的用户账号。在实际应用中，用户可以基于相应的终端主动触发多媒体资源获取请求，也可以由推荐系统在目标对象进入系统后主动触发目标对象的多媒体资源获取请求。
113.在一个具体的实施例中，上述历史行为序列信息包括目标对象在预设时间段内行为过的多个多媒体资源的第二资源标识信息和多个多媒体资源对应的第一数量个时序标识信息，时序标识信息可以为基于多个所述多媒体资源对应的行为时间所在预设分布时间段确定的标识。
114.在一个具体的实施例中，多媒体资源的资源标识信息可以为用于区分不同多媒体资源的标识信息。相应的，第一资源标识信息可以包括待推荐的至少一个多媒体资源的资源标识信息，第二资源标识信息可以包括上述多个多媒体资源的资源标识信息。具体的，待推荐的至少一个多媒体资源可以为推荐系统中的待推荐的多媒体资源。可选的，多媒体资源可以包括文本、图像等静态资源，也可以包括短视频等动态资源。
115.在一个具体的实施例中，目标对象行为过的多个多媒体资源可以为在预设时间段内目标对象执行过预设操作的多媒体资源。上述预设操作可以包括但不限于浏览、点击、转化(例如基于多媒体资源购买了相关产品，或基于多媒体资源下载了相关应用等)等。具体的，预设时间段可以为预先设置的历史行为序列信息的采集周期，例如预设时间段为当前时间之前的半个月，相应的，历史行为序列信息可以包括目标对象在当前时间之前的半个月内执行过预设操作的多媒体资源的资源标识信息。
116.在一个具体的实施例中，第一数量个时序标识信息可以用于从时序的维度对目标对象在预设时间段内的行为分布进行表征。上述多个多媒体资源对应的行为时间可以为目标对象分别对每个多媒体资源执行预设操作的时间信息。在一个具体的实施例中，可以确定预设单位划分时间；根据预设单位划分时间将所述预设时间段划分为第一数量个预设分布时间段；生成所述第一数量个预设分布时间段的标识；将每个多媒体资源对应的行为时间所在预设分布时间段的标识作为该多媒体资源对应的时序标识信息。
117.在一个具体的实施例中，预设单位划分时间可以结合实际应用需求预先设置，例如每天的0点至24点，相应的，假设上述预设时间段为当前时间之前的15天，相应的，可以将预设时间段划分为15(第一数量)个0点至24点(预设分布时间段)，具体的实施例中，假设按照时间由先到后，为15个预设分布时间段生成各自的标识为：g1、g2、g3...g15。相应的，可以将每个多媒体资源对应的行为时间所在预设分布时间段的标识作为该多媒体资源对应的时序标识信息，具体的，若任意两个或两个以上的多媒体资源对应的行为时间在同一天(即在同一预设分布时间段)，即该两个或两个以上的多媒体资源对应的时序标识信息相同。
118.在步骤s203中，将历史行为序列信息和第一资源标识信息输入兴趣识别网络进行兴趣识别，得到目标对象对至少一个多媒体资源的目标兴趣指标；
119.在一个具体的实施例中，目标兴趣指标可以表征目标对象对至少一个多媒体资源执行预测操作的概率。
120.在一个可选的实施例中，上述兴趣识别网络可以包括编码网络、第一数量个基础胶囊网络、第二数量个兴趣胶囊网络、特征融合网络和兴趣感知网络。
121.在实际应用中，往往会预先按照推荐系统中多媒体资源的资源特点，为每一多媒
体资源标注相应的资源类型，在一个具体的实施例中，每一多媒体资源对应的资源类型可以包括一种或多种(至少两种)资源类型。在一个具体的实施例中，资源类型可以包括但不限于体育类、美食类、游戏类、旅游类等。可选的，上述第二数量可以为预设的资源类型对应的数量；预设的资源类型可以为推荐系统中多媒体资源的资源类型。相应的，第二数量个兴趣胶囊网络分别对应第二数量个资源类型中的一个资源类型。
122.可选的，如图3所示，上述将历史行为序列信息和第一资源标识信息输入兴趣识别网络进行兴趣识别，得到目标对象对至少一个多媒体资源的目标兴趣指标可以包括以下步骤：
123.在步骤s2031中，基于编码网络对历史行为序列信息进行编码处理，得到行为编码信息。
124.在一个具体的实施例中，上述行为编码信息可以包括第二资源标识信息对应的资源编码特征信息和第一数量个时序标识信息对应的第一数量个时序编码特征信息；
125.在一个可选的实施例中，上述编码网络可以包括：特征提取网络、位置编码网络和至少一个按序连接的子编码网络，具体的，任一子编码网络包括自注意力网络和前馈神经网络，相应的，如图4所示，上述基于编码网络对历史行为序列信息进行编码处理，得到行为编码信息可以包括下述步骤：
126.在步骤s401中，基于特征提取网络提取历史行为序列信息的行为特征信息；
127.在步骤s403中，基于位置编码网络对行为特征信息进行位置编码处理，得到目标行为特征信息；
128.在步骤s405中，遍历至少一个按序连接的子编码网络，在遍历到任一子编码网络的情况下，将当前行为特征信息输入当前遍历到的子编码网络中的自注意力网络进行自注意力学习，得到当前初始编码信息；
129.在步骤s407中，将当前初始编码信息输入当前遍历到的子编码网络中的前馈神经网络进行非线性处理，得到当前编码行为信息；
130.在步骤s409中，将遍历结束时的当前编码行为信息作为行为编码信息。
131.在一个具体的实施例中，目标对象行为过的多个多媒体资源往往按照对应的行为时间先后按序排列，上述位置编码处理过程中，可以在行为特征信息中加入能够表征多媒体资源在多个多媒体资源中排序位置的特征信息，进而便于后续学习到多媒体资源间的相关关联。
132.在一个具体的实施例中，上述至少一个按序连接的子编码网络中第一个子编码网络的当前行为特征信息为目标行为特征信息，至少一个按序连接的子编码网络中非第一个子编码网络的当前行为序列信息为前一个子编码网络输出的当前编码行为信息。
133.上述实施例中，通过在编码网络设置至少一个子编码网络，且不断将前一个子编码网络的输出的当前编码行为信息作为当前的子编码网络的输入，可以更好的学习到历史行为序列中的行为特征信息，进而提升对用户的兴趣喜好的表征精准性。
134.在一个可选的实施例中，上述方法还可以包括：
135.生成目标掩码信息。
136.在实际应用中，由于网络的输入存在不定长的情况，往往会通过对输入结合0进行填充处理，填充到指定的输入大小，进一步的，为了屏蔽这些为了填充引入的0，在自注意力
学习过程中，可以引入掩码信息。本说明书实施例中，在引入掩码信息过程中，除了结合需要屏蔽的填充信息进行掩码信息的设置，还可以结合以下四个维度来进行目标掩码信息的设置：1、多媒体资源间的相关关注维度；2、行为序列片段间的相关关注维度；3、行为序列片段关注对应的多媒体资源的维度；4、多媒体资源关注对应的行为序列片段的维度。
137.相应的，上述目标掩码信息包括第一掩码信息、第二掩码信息、第三掩码信息和第四掩码信息，所述第一掩码信息表征与所述第一数量个时序标识信息对应的所述第一数量个行为序列片段间的关联关系；所述第二掩码信息表征多个所述多媒体资源中任一多媒体资源的第二资源标识信息与预设范围内的多媒体资源的第二资源标识信息间的关联关系；所述第三掩码信息表征所述第一数量个行为序列片段对多个所述多媒体资源的关联信息；所述第四掩码信息表征多个所述多媒体资源对所述第一数量个行为序列片段的关联信息。
138.在一个具体的实施例中，每一时序标识信息对应的一个行为序列片段，该行为序列片段可以为与上述目标对象行为过的多个多媒体资源中该时序标识信息对应的多媒体资源的资源标识信息。相应的，行为序列片段间的关联关系可以为在学习行为序列片段的特征信息过程中，行为序列片段间会相互关注。
139.在一个具体的实施例中，预设范围可以为结合多个按序排列的第二资源标识信息间间隔的资源标识信息数量，在一个具体的实施例中，以预设范围为2为例，与某一多媒体资源的第二资源标识信息与预设范围内的多媒体资源的第二资源标识信息间的关联关系可以为学习多媒体资源的第二资源标识信息的特征信息过程中，该多媒体资源的第二资源标识信息与前后各相邻两个的多媒体资源的第二资源标识信息间会相互关注。
140.在一个具体的实施例中，任一行为序列片段对应目标对象行为过的多个多媒体资源中部分多媒体资源，相应的，行为序列片段对多媒体资源的关联信息可以为在学习行为序列片段的特征信息过程中，会关注对应的部分多媒体资源；多个所述多媒体资源对所述第一数量个行为序列片段的关联信息可以为在学习部分多媒体资源的资源标识信息的特征信息过程中，会关注对应的行为序列片段。
141.在一个可选的实施例中，如图5所示，图5是根据一示例性实施例示出的一种目标掩码信息的示意图，假设上述多个多媒体资源包括i1、i2...i7；第一数量个时序标识信息包括g1、g2、g3，第一掩码信息为m
g2g
，第二掩码信息为m
l2l
，第三掩码信息为m
g2l
，第四掩码信息为m
l2g
白色部分对应的掩码信息为0，表征相应的信息间没有关注关系；黑色部分对应的掩码信息为1，表征相应的信息间有关注关系。
142.相应的，上述将当前行为特征信息输入当前遍历到的子编码网络中的自注意力网络进行自注意力学习，得到当前初始编码信息可以包括：
143.将当前行为特征信息和目标掩码信息输入当前遍历到的子编码网络中的自注意力网络进行自注意力学习，得到当前初始编码信息。
144.上述实施例中，在自注意力学习过程中，引入了目标掩码信息，可以将目标对象的行为序列中行为的多媒体资源间的相关关注限制在预设范围内，进而大大提升处理效率；还可以通过时序标识信息对应行为序列片段间的相关关注连接整个行为序列，弥补了局部范围限制带来的信息损失；同时且还可以实现行为序列片段与其对应的多媒体资源的资源标识信息间进行相互关注，可以在提升处理效率的基础上，大大提升学习到的兴趣喜好的精准性。
145.在步骤s2033中，根据第一数量个时序编码特征信息确定第一数量个基础胶囊网络中基础胶囊特征信息。
146.在一个具体的实施例中，可以将第一数量个时序编码特征信息分别作为第一数量个基础胶囊网络中的胶囊特征信息。在一个具体的实施例中，假设第一数量为10，且10个时序编码特征信息包括第1个时序编码特征信息、第2个时序编码特征信息...第10个时序编码特征信息；10个基础胶囊网络包括第1个基础胶囊网络、第2个基础胶囊网络...第10个基础胶囊网络，可选的，可以将第1个时序编码特征信息作为第1个基础胶囊网络中的胶囊特征信息；将第2个时序编码特征信息作为第2个基础胶囊网络中的胶囊特征信息，依此类推。
147.在步骤s2035中，基于每个基础胶囊网络相对于第二数量个兴趣胶囊网络的传输权重，将基础胶囊特征信息传输给第二数量个兴趣胶囊网络进行兴趣识别，得到第二数量个兴趣胶囊网络对应的初始兴趣特征信息。
148.在一个具体的实施例中，传输权重可以表征每个基础胶囊网络中胶囊特征信息传输给每个兴趣胶囊网络的比重信息。在一个具体的实施例中，任一兴趣胶囊网络对应的初始兴趣特征信息可以为该的兴趣胶囊网络中胶囊特征信息，具体的，某一兴趣胶囊网络中的胶囊特征信息可以为目标对象在该兴趣胶囊网络对应的资源类型上的兴趣表征信息。
149.在步骤s2037中，将第二数量个兴趣胶囊网络对应的初始兴趣特征信息和第一资源标识信息对应的资源特征信息输入特征融合网络进行特征融合，得到目标兴趣特征信息。
150.在一个具体的实施例中，特征融合网络可以用于融合第二数量个兴趣胶囊网络对应的初始兴趣特征信息和第一资源标识信息对应的资源特征信息，可选的，特征融合网络可以但不但不限于最大池化网络、注意力网络、平均池化网络等。
151.在一个具体的实施例中，以上述特征融合网络可以为包括权重学习层和加权处理层的注意力网络为例，可选的，上述将第二数量个兴趣胶囊网络对应的初始兴趣特征信息和第一资源标识信息对应的资源特征信息输入特征融合网络进行特征融合，得到目标兴趣特征信息可以包括：
152.将第二数量个兴趣胶囊网络对应的初始兴趣特征信息和第一资源标识信息输入权重学习层进行权重学习，得到兴趣权重信息；将兴趣权重信息和初始兴趣特征信息输入加权处理层进行加权处理，得到目标兴趣特征信息。
153.在一个具体的实施例中，上述兴趣权重信息可以表征第二数量个兴趣胶囊网络对应的初始兴趣特征信息对目标对象的兴趣的影响程度。
154.在一个具体的实施例中，在权重学习层进行权重学习可以结合下述公式实现：
[0155][0156]
其中，α
z
表示第z个兴趣胶囊网络对应的初始兴趣特征信息对目标对象的兴趣的影响程度，c为第二数量(兴趣胶囊网络的数量)，i表示某一待推荐的多媒体资源的资源标识信息，p
z
表示第z个兴趣胶囊网络中的胶囊特征信息，att为注意力函数，exp为以自然常数e为底的指数函数。
[0157]
在一个具体的实施例中，在加权处理层进行加权处理可以结合下述公式实现：
[0158][0159]
其中，u表示目标兴趣特征信息。
[0160]
上述实施例中，在得到目标对象在不同资源类型上对应的兴趣表征信息，结合注意力网络进行不同资源类型对应的兴趣胶囊网络中胶囊特征信息对目标对象的兴趣的影响程度的学习，可以大大提升对目标对象兴趣特征表征的精准性。
[0161]
在步骤s2039中，将资源编码特征信息、目标兴趣特征信息和第一资源标识信息对应的资源特征信息输入兴趣感知网络进行兴趣感知处理，得到目标兴趣指标。
[0162]
在一个可选的实施例中，可以将上述资源编码特征信息、目标兴趣特征信息和第一资源标识信息输入兴趣感知网络进行兴趣感知处理，以得到目标兴趣指标。具体的，兴趣感知网络可以用于结合资源编码特征信息、目标兴趣特征信息和第一资源标识信息进行目标对象的兴趣感知。可选的，上述兴趣感知网络可以为多层感知器(multilayer perceptron，mlp)和激活层。
[0163]
上述实施例中，历史行为序列中，还引入了基于多个多媒体资源对应的行为时间所在预设分布时间段确定的第一数量个时序标识信息，可以在编码过程中，将包括目标对象在预设时间段内行为过的多个多媒体资源的第二资源标识信息的历史行为序列划分为多个行为序列片段，进而可以在学习到整体行为喜好的基础上，学习到不同时间段内的行为喜好；并结合不同时间段内的行为喜好可以将兴趣胶囊网络与不同兴趣喜好对应的资源类型相对应，提升识别出的目标兴趣指标在不同资源类型上的精确表示，提高解释性，进而提升特征融合后用于进行兴趣感知的目标兴趣特征信息，对目标对象兴趣喜好刻画的精准性。
[0164]
在一个可选的实施例中，如图6所示，上述方法还可以包括以下步骤：
[0165]
在步骤s20311中，将目标资源编码特征信息、目标兴趣特征信息和第一资源标识信息输入兴趣感知网络进行兴趣感知处理，得到目标兴趣指标；
[0166]
在一个具体的实施例中，上述目标资源编码特征信息可以为多个多媒体资源对应的资源编码特征信息中对应的行为时间和当前时间的时间差满足预设条件的资源编码特征信息。可选的，为了更好的预测目标对象当前的兴趣喜好，可以在兴趣感知处理过程中，结合目标对象最近一段时间的资源编码特征信息。可选的，时间差满足预设条件的资源编码特征信息可以为时间差小于等于预设时间阈值的资源编码特征信息。
[0167]
上述实施例中，在进行兴趣感知处理时，结合时间差满足预设条件的目标资源编码特征信息，可以更好表征目标对象当前的兴趣喜好，进而更好提升推荐的精准性。
[0168]
在一个可选的实施例中，上述方法还包括：预先训练兴趣识别网络的步骤，具体的，如图7所示，预先训练兴趣识别网络的步骤可以包括：
[0169]
在步骤s701中，获取样本对象的样本行为序列信息、至少一个样本多媒体资源的第三资源标识信息和标注兴趣指标。
[0170]
在一个具体的实施例中，上述样本行为序列信息可以包括样本对象在预设样本时间段内行为过的多个历史多媒体资源的第四资源标识信息和基于多个历史多媒体资源对应的行为时间确定的，与多个历史媒体资源对应的第一数量个样本时序标识信息。具体的，
标注兴趣指标可以表征样本对象对至少一个样本多媒体资源执行预设操作的概率，具体的，标注兴趣指标可以为1或0，具体的，样本对象对某一样本多媒体资源执行预设操作，对应的标注兴趣指标可以为1；反之，样本对象对某一样本多媒体资源未执行预设操作，对应的标注兴趣指标可以为0。
[0171]
在一个具体的实施例中，预设样本时间段对应的时长与预设时间段对应的时长相同，具体的，基于多个历史多媒体资源对应的行为时间确定，与多个历史媒体资源对应的第一数量个样本时序标识信息的具体细化步骤，可以参见上述基于多个多媒体资源对应的行为时间确定的，与多个媒体资源对应的第一数量个时序标识信息的具体细化，在此不再赘述。
[0172]
在步骤s703中，确定多个历史多媒体资源对应的多个资源类型；
[0173]
在实际应用中，推荐系统中每一多媒体资源往往预先标注相应的资源类型，相应的，可以从推荐系统中获取每个历史多媒体资源对应的多个资源类型。
[0174]
在步骤s705中，确定每一资源类型对应资源标识信息在样本行为序列信息中的样本出现概率。
[0175]
在步骤s707中，将历史行为序列信息和第三资源标识信息输入待训练兴趣识别网络进行兴趣识别，得到样本对象对至少一个样本多媒体资源的预测兴趣指标和多个资源类型对应预测出现概率。
[0176]
在一个具体的实施例中，将历史行为序列信息和第三资源标识信息输入待训练兴趣识别网络进行兴趣识别，得到样本对象对至少一个样本多媒体资源的预测兴趣指标的具体细化步骤可以参见上述将历史行为序列信息和第一资源标识信息输入兴趣识别网络进行兴趣识别，得到目标对象对至少一个多媒体资源的目标兴趣指标的具体细化步骤。
[0177]
在一个可选的实施例中，任一资源类型对应预测出现概率可以为该资源类型对应的待训练兴趣胶囊网络中胶囊特征信息的大小，可选的，在训练过程中，可以确定兴趣胶囊网络中胶囊特征信息的大小，该大小被约束在0
‑
1之间，可以表征样本对象对该兴趣胶囊网络对应的资源类型的感兴趣概率。相应的，上述预测出现概率可以结合训练过程中兴趣胶囊网络中胶囊特征信息的大小确定。
[0178]
在步骤s709中，基于预测兴趣指标、预测出现概率、样本出现概率和标注兴趣指标，确定目标兴趣损失；
[0179]
在一个可选的实施例中，如图8所示，上述基于预测兴趣指标、预测出现概率、样本出现概率和标注兴趣指标，确定目标兴趣损失可以包括以下步骤：
[0180]
在步骤s7091中，根据预测兴趣指标和标注兴趣指标，确定初始兴趣损失信息；
[0181]
在步骤s7093中，根据预测出现概率和样本出现概率，确定兴趣引导损失信息；
[0182]
在步骤s7095中，基于初始兴趣损失信息和兴趣引导损失信息，确目标兴趣损失。
[0183]
在一个具体的实施例中，根据预测兴趣指标和标注兴趣指标，确定初始兴趣损失信息可以包括基于预设损失函数，确定预测兴趣指标和标注兴趣指标间的初始兴趣损失信息。具体的，该初始兴趣损失信息可以表征预测兴趣指标和标注兴趣指标间的差异。
[0184]
在一个具体的实施例中，根据预测出现概率和样本出现概率，确定兴趣引导损失信息可以包括基于预设损失函数，确定预测出现概率和样本出现概率间的兴趣引导损失信息。具体的，该兴趣引导损失信息可以表征预测出现概率和样本出现概率间的差异。
[0185]
在一个具体的实施例中，预设损失函数可以包括但不限于交叉熵损失函数、均方误差损失函数、逻辑损失函数、指数损失函数等。
[0186]
在一个可选的实施例中，可以将初始兴趣损失信息和兴趣引导损失信息相加，得到上述目标兴趣损失。可选的，也可以结合实际应用需求，预先设置兴趣引导损失信息对应的权重信息，相应的，兴趣引导损失信息乘以相应的权重后，与初始兴趣损失信息相加，得到目标兴趣损失。
[0187]
上述实施例中，在兴趣识别网络训练过程中，引入了样本对象对相应的资源类型的感兴趣概率差异的兴趣引导损失信息，可以更好的反映预测的兴趣识别网络对对象兴趣表征的精准性。
[0188]
在步骤s711中，基于目标兴趣损失训练待训练兴趣识别网络，得到兴趣识别网络。
[0189]
上述基于目标兴趣损失训练待训练兴趣识别网络，得到兴趣识别网络可以包括：在目标兴趣损失未满足预设条件的情况下，基于目标兴趣损失调整待训练兴趣识别网络的网络参数；基于调整网络参数后的待训练兴趣识别网络重复上述步骤s707和s709，至目标兴趣损失满足预设条件的情况下，将满足预设条件时对应的待训练兴趣识别网络作为兴趣识别网络。
[0190]
在一个具体的实施例中，目标兴趣损失满足预设条件可以为目标兴趣损失小于等于指定阈值，或前后两次训练过程中对应的目标兴趣损失间的差值小于一定阈值。本说明书实施例中，指定阈值和一定阈值可以为结合实际训练需求进行设置。
[0191]
上述实施例中，在兴趣识别网络训练过程中，在包括样本对象在预设时间段内行为过的多个历史多媒体资源的第四资源标识信息的历史行为序列中，还引入了基于多个历史多媒体资源对应的行为时间所在预设分布时间段确定的第一数量个样本时序标识信息，可以保证兴趣识别网络训练过程中，全面学习到样本对象的行为数据，同时结合样本时序标识信息学习到不同时间段内的兴趣喜好表征，有效提高兴趣识别网络的识别精准性，进而大大提升后续推荐系统中信息推荐精准性和推荐效果。
[0192]
在一个具体的实施例中，如图9所示，在上述兴趣识别网络可以包括编码网络、m(第一数量)个基础胶囊网络、c(第二数量)个兴趣胶囊网络、特征融合网络和兴趣感知网络。其中，g1、g2...gm历史行为序列信息中的第一数量个时序标识信息；i1、i2...in可以为历史行为序列信息中的多个多媒体资源的第二资源标识信息。相应的，基于编码网络的编码处理，可以得到第一数量个时序编码特征信息：g1、g2...gm和第二资源标识信息对应的资源编码特征信息：i1、i2...in。进一步的，可以将m个时序编码特征信息分别作为m个基础胶囊网络中的胶囊特征信息，接着，基于每个基础胶囊网络相对于c个兴趣胶囊网络的传输权重，将相应的基础胶囊特征信息传输给c个兴趣胶囊网络进行兴趣识别，得到c个兴趣胶囊网络对应的初始兴趣特征信息。另外，由于在训练过程中，结合多个历史多媒体资源对应的资源类型ci1、ci2、ci3...cin中每一资源类型对应资源标识信息在样本行为序列信息中的样本出现概率进行了兴趣引导，在基于每个基础胶囊网络相对于c个兴趣胶囊网络的传输权重，将相应的基础胶囊特征信息传输给c个兴趣胶囊网络进行兴趣识别过程中，可以精准的学习到c个兴趣胶囊网络各自对应的资源类型上的兴趣表征信息；然后，将c个兴趣胶囊网络对应的初始兴趣特征信息和第一资源标识信息对应的资源特征信息输入特征融合网络进行特征融合，得到目标兴趣特征信息；最后，将资源编码特征信息(i1、i2...in)、目
标兴趣特征信息和所述第一资源标识信息对应的资源特征信息(it可以为待推荐的至少一个多媒体资源中第t个多媒体资源的资源标识信息对应的资源特征信息)输入兴趣感知网络进行兴趣感知处理，可以得到目标兴趣指标。
[0193]
在步骤s205中，基于目标兴趣指标，将至少一个多媒体资源中的目标多媒体资源推荐给目标对象。
[0194]
在一个具体的实施例中，基于目标兴趣指标，将至少一个多媒体资源中的目标多媒体资源推荐给目标对象可以包括根据目标兴趣指标从至少一个多媒体资源中确定目标多媒体资源；将目标多媒体资源推荐给目标对象。
[0195]
在一个可选的实施例中，可以预先结合信息推荐精准性需求设置一个置信度阈值(一般的置信度阈值越高，推荐的信息越精准)，相应的，当目标兴趣指标对应的数值大于等于该置信度阈值的多媒体资源可以作为目标多媒体资源。可选的，也可以结合目标兴趣指标对应的数值大小进行降序排序，相应的，可以选取前预设数量个多媒体资源作为目标多媒体资源。
[0196]
由以上本说明书实施例提供的技术方案可见，本说明书实施例中，在多媒体资源推荐过程中，在包括目标对象在预设时间段内行为过的多个多媒体资源的第二资源标识信息的历史行为序列中，还引入了基于多个多媒体资源对应的行为时间所在预设分布时间段确定的第一数量个时序标识信息，可以在进行兴趣识别过程中，全面掌握行为数据，同时结合时序标识信息学习到不同时间段内的兴趣喜好和更多的细粒度特征，可以有效表征用户真实兴趣，提高兴趣识别效率和识别精准性，进而大大提升推荐系统中信息推荐精准性和推荐效果。
[0197]
图10是根据一示例性实施例示出的一种多媒体资源推荐装置框图。参照图10，该装置包括：
[0198]
第一信息获取模块1010，被配置为执行响应于目标对象的多媒体资源获取请求，获取目标对象的历史行为序列信息和待推荐的至少一个多媒体资源的第一资源标识信息，历史行为序列信息包括目标对象在预设时间段内行为过的多个多媒体资源的第二资源标识信息和多个多媒体资源对应的第一数量个时序标识信息，时序标识信息为基于多个多媒体资源对应的行为时间所在预设分布时间段确定的标识；
[0199]
第一兴趣识别模块1020，被配置为执行将历史行为序列信息和第一资源标识信息输入兴趣识别网络进行兴趣识别，得到目标对象对至少一个多媒体资源的目标兴趣指标；
[0200]
多媒体资源推荐模块1030，被配置为执行基于目标兴趣指标，将至少一个多媒体资源中的目标多媒体资源推荐给目标对象。
[0201]
可选的，兴趣识别网络包括编码网络、第一数量个基础胶囊网络、第二数量个兴趣胶囊网络、特征融合网络和兴趣感知网络，第二数量为预设的资源类型对应的数量；
[0202]
第一兴趣识别模块1020包括：
[0203]
编码处理单元，被配置为执行基于编码网络对历史行为序列信息进行编码处理，得到行为编码信息，行为编码信息包括第二资源标识信息对应的资源编码特征信息和第一数量个时序标识信息对应的第一数量个时序编码特征信息；
[0204]
基础胶囊特征信息确定单元，被配置为执行根据第一数量个时序编码特征信息确定第一数量个基础胶囊网络中基础胶囊特征信息；
[0205]
兴趣识别单元，被配置为执行基于每个基础胶囊网络相对于第二数量个兴趣胶囊网络的传输权重，将基础胶囊特征信息传输给第二数量个兴趣胶囊网络进行兴趣识别，得到第二数量个兴趣胶囊网络对应的初始兴趣特征信息；
[0206]
特征融合单元，被配置为执行将第二数量个兴趣胶囊网络对应的初始兴趣特征信息和第一资源标识信息对应的资源特征信息输入特征融合网络进行特征融合，得到目标兴趣特征信息；
[0207]
第一兴趣感知处理单元，被配置为执行将资源编码特征信息、目标兴趣特征信息和第一资源标识信息对应的资源特征信息输入兴趣感知网络进行兴趣感知处理，得到目标兴趣指标。
[0208]
可选的，编码网络包括：特征提取网络、位置编码网络和至少一个按序连接的子编码网络，任一子编码网络包括自注意力网络和前馈神经网络，编码处理单元包括：
[0209]
行为特征信息提取单元，被配置为执行基于特征提取网络提取历史行为序列信息的行为特征信息；
[0210]
位置编码处理单元，被配置为执行基于位置编码网络对行为特征信息进行位置编码处理，得到目标行为特征信息；
[0211]
遍历单元，被配置为执行遍历至少一个按序连接的子编码网络；
[0212]
自注意力学习单元，被配置为执行在遍历到任一子编码网络的情况下，将当前行为特征信息输入当前遍历到的子编码网络中的自注意力网络进行自注意力学习，得到当前初始编码信息；
[0213]
非线性处理单元，被配置为执行将当前初始编码信息输入当前遍历到的子编码网络中的前馈神经网络进行非线性处理，得到当前编码行为信息；
[0214]
行为编码信息确定单元，被配置为执将遍历结束时的当前编码行为信息作为行为编码信息；
[0215]
其中，至少一个按序连接的子编码网络中第一个子编码网络的当前行为特征信息为目标行为特征信息，至少一个按序连接的子编码网络中非第一个子编码网络的当前行为序列信息为前一个子编码网络输出的当前编码行为信息。
[0216]
可选的，上述装置还包括：
[0217]
目标掩码信息生成模块，被配置为执行生成目标掩码信息，目标掩码信息包括第一掩码信息、第二掩码信息、第三掩码信息和第四掩码信息，所述第一掩码信息表征与所述第一数量个时序标识信息对应的所述第一数量个行为序列片段间的关联关系；所述第二掩码信息表征多个所述多媒体资源中任一多媒体资源的第二资源标识信息与预设范围内的多媒体资源的第二资源标识信息间的关联关系；所述第三掩码信息表征所述第一数量个行为序列片段对多个所述多媒体资源的关联信息；所述第四掩码信息表征多个所述多媒体资源对所述第一数量个行为序列片段的关联信息；
[0218]
自注意力学习模块还被配置为执行将当前行为特征信息和目标掩码信息输入当前遍历到的子编码网络中的自注意力网络进行自注意力学习，得到当前初始编码信息。
[0219]
可选的，上述装置还包括：
[0220]
第二兴趣感知处理单元，被配置为执行将目标资源编码特征信息、目标兴趣特征信息和第一资源标识信息输入兴趣感知网络进行兴趣感知处理，得到目标兴趣指标；
[0221]
其中，目标资源编码特征信息为多个多媒体资源对应的资源编码特征信息中对应的行为时间和当前时间的时间差满足预设条件的资源编码特征信息。
[0222]
可选的，特征融合网络为包括权重学习层和加权处理层的注意力学习网络，特征融合单元包括：
[0223]
权重学习单元，被配置为执行将第二数量个兴趣胶囊网络对应的初始兴趣特征信息和第一资源标识信息输入权重学习层进行权重学习，得到兴趣权重信息，兴趣权重信息表征第二数量个兴趣胶囊网络对应的初始兴趣特征信息对目标对象的兴趣的影响程度；
[0224]
加权处理单元，被配置为执行将兴趣权重信息和初始兴趣特征信息输入加权处理层进行加权处理，得到目标兴趣特征信息。
[0225]
可选的，上述装置还包括：
[0226]
第二信息获取模块，被配置为执行获取样本对象的样本行为序列信息、至少一个样本多媒体资源的第三资源标识信息和标注兴趣指标，样本行为序列信息包括样本对象在预设样本时间段内行为过的多个历史多媒体资源的第四资源标识信息和基于多个历史多媒体资源对应的行为时间确定的，与多个历史媒体资源对应的第一数量个样本时序标识信息；
[0227]
资源类型确定模块，被配置为执行确定多个历史多媒体资源对应的多个资源类型；
[0228]
样本出现概率确定模块，被配置为执行确定每一资源类型对应资源标识信息在样本行为序列信息中的样本出现概率；
[0229]
第二兴趣识别模块，被配置为执行将历史行为序列信息和第三资源标识信息输入待训练兴趣识别网络进行兴趣识别，得到样本对象对至少一个样本多媒体资源的预测兴趣指标和多个资源类型对应预测出现概率；
[0230]
目标兴趣损失确定模块，被配置为执行基于预测兴趣指标、预测出现概率、样本出现概率和标注兴趣指标，目标兴趣损失；
[0231]
兴趣识别网络训练模块，被配置为执行基于目标兴趣损失训练待训练兴趣识别网络，得到兴趣识别网络。
[0232]
可选的，目标兴趣损失确定模块包括：
[0233]
初始兴趣损失信息确定单元，被配置为执行根据预测兴趣指标和标注兴趣指标，确定初始兴趣损失信息；
[0234]
兴趣引导损失信息确定单元，被配置为执行根据预测出现概率和样本出现概率，确定兴趣引导损失信息；
[0235]
目标兴趣损失确定单元，被配置为执行基于初始兴趣损失信息和兴趣引导损失信息，确目标兴趣损失。
[0236]
关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0237]
图11是根据一示例性实施例示出的一种用于多媒体资源推荐的电子设备的框图，该电子设备可以是终端，其内部结构图可以如图11所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介
质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多媒体资源推荐方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该电子设备的输入装置可以是显示屏上覆盖的触摸层，也可以是电子设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。
[0238]
图12是根据一示例性实施例示出的一种用于多媒体资源推荐的电子设备的框图，该电子设备可以是服务器，其内部结构图可以如图12所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多媒体资源推荐方法。
[0239]
本领域技术人员可以理解，图11或图12中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0240]
在示例性实施例中，还提供了一种电子设备，包括：处理器；用于存储该处理器可执行指令的存储器；其中，该处理器被配置为执行该指令，以实现如本公开实施例中的多媒体资源推荐方法。
[0241]
在示例性实施例中，还提供了一种计算机可读存储介质，当该存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行本公开实施例中的多媒体资源推荐方法。
[0242]
在示例性实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行本公开实施例中的多媒体资源推荐方法。
[0243]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0244]
本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的
权利要求指出。
[0245]
应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵鑫;王辉;冯翔;毛景树;王珵;江鹏
技术所有人：北京达佳互联信息技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。