模型训练方法、多样性评分确定方法、介质、装置及设备与流程

文档序号：30437614发布日期：2022-06-17 20:53阅读：111来源：国知局

1.本公开的实施方式涉及计算机技术领域，更具体地，本公开的实施方式涉及模型训练方法、多样性评分确定方法、介质、装置及设备。

背景技术：

2.本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
3.随着大数据技术的发展，可基于海量数据分析用户的行为偏好。
4.目前，与音视频相关的应用程序在分析用户偏好时，通常在经用户授权后，基于用户以往的历史浏览记录，分析用户偏好。然而，当用户习惯性浏览或播放某一风格的音视频时，为该用户推荐的都是这种风格的音视频，忽视了该用户更喜欢其他不同风格的音视频的可能性，导致个性化内容推荐不能满足用户对音视频的多样性需求。

技术实现要素：

5.本公开提供一种模型训练方法、多样性评分确定方法、介质、装置及设备，以实现对用户与媒体对象交互的多样性的分析。
6.在本公开实施方式的第一方面中，提供了一种模型训练方法，包括：确定训练数据，训练数据包括多个用户特征向量和用户特征向量对应的多样性评分标签，用户特征向量是根据用户与媒体对象在多个特征维度下的交互数据得到；根据训练数据，对目标模型进行训练，得到训练好的目标模型，目标模型用于对用户的多样性评分进行预测。
7.在本公开实施方式的第二方面中，提供了一种多样性评分确定方法，包括：确定目标用户的用户特征向量，其中，用户特征向量是根据目标用户与媒体对象在多个特征维度下的交互数据得到；通过目标模型对用户特征向量进行处理，得到目标用户对应的多样性预测评分；向目标用户展示多样性预测评分。
8.在本公开实施方式的第三方面，提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，当处理器执行计算机执行指令时，实现如第一方面提供的模型训练方法，和/或，实现如第二方面提供的多样性评分确定方法。
9.在本公开实施方式的第四方面中，提供了一种模型训练装置，包括：确定单元，用于确定训练数据，训练数据包括多个用户特征向量和用户特征向量对应的多样性评分标签，用户特征向量是根据用户与媒体对象在多个特征维度下的交互数据得到；训练单元，用于根据训练数据，对目标模型进行训练，得到训练好的目标模型，目标模型用于对用户的多样性评分进行预测。
10.在本公开实施方式的第五方面中，提供了一种多样性评分确定装置，包括：确定单元，用于确定目标用户的用户特征向量，其中，用户特征向量是根据目标用户与媒体对象在多个特征维度下的交互数据得到；处理单元，用于通过目标模型对用户特征向量进行处理，得到目标用户对应的多样性预测评分；显示单元，用于向目标用户展示多样性预测评分。
11.在本公开实施方式的第六方面中，提供了一种计算设备，包括：至少一个处理器和存储器；存储器存储计算机执行指令；至少一个处理器执行存储器存储的计算机执行指令，使得至少一个处理器执行如第一方面提供的模型训练方法，和/或，使得至少一个处理器执行如第二方面提供的多样性评分确定方法。
12.在本公开实施方式中，基于训练数据，训练用于预测用户的多样性评分的目标模型，其中，训练数据包括用户特征与用户特征对应的多样性评分标签，用户特征是基于用户与媒体对象在多个特征维度下的交互数据的。从而，利用模型训练的思想，提供了一种对用户与媒体对象交互的多样性进行量化分析的方式，不仅实现对用户多样性的分析，而且确保了分析的准确性，通过用户的多样性预测评分，有利于用户更清晰地了解自身与媒体对象交互的多样性，也有利于为用户提供更准确的数据推荐，提高用户体验。
附图说明
13.通过参考附图阅读下文的详细描述，本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本公开的若干实施方式，其中：
14.图1示意性地示出了根据本公开实施方式提供的应用场景示意图；
15.图2示意性地示出了根据本公开一实施例提供的模型训练方法的流程示意图；
16.图3示意性地示出了根据本公开另一实施例提供的模型训练方法的流程示意图；
17.图4示意性地示出了根据本公开一实施例提供的目标模型的一次训练过程的流程示意图；
18.图5示意性地示出了根据本公开一实施例提供的目标模型的结构示意图；
19.图6示意性地示出了根据本公开一实施例提供的多样性评分确定方法的流程示意图；
20.图7a示意性地示出了根据本公开又一实施例提供的多样性评分确定方法的流程示意图；
21.图7b示意性地示出了根据本公开又一实施例提供的目标模型的结构示意图；
22.图8示意性地示出了根据本公开一实施例提供的存储介质的结构示意图；
23.图9示意性地示出了根据本公开一实施例提供的模型训练装置的结构示意图；
24.图10示意性地示出了根据本公开一实施例提供的多样性评分确定装置的结构示意图；
25.图11示意性地示出了根据本公开一实施例提供的计算设备的结构示意图。
26.在附图中，相同或对应的标号表示相同或对应的部分。
具体实施方式
27.下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开，而并非以任何方式限制本公开的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。
28.本领域技术人员知道，本公开的实施方式可以实现为一种系统、装置、设备、方法
或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。
29.根据本公开的实施方式，提出了一种多样性评分确定方法、介质、装置和计算设备。
30.在本文中，需要理解的是，所涉及的术语以及术语的含义如下：
31.(1)媒体对象：可以是单一媒体对象也可以是多媒体对象。
32.其中，单一媒体对象是指媒体形式单一(如文本、或者声音、或者图像)的对象，比如不带字幕和封面的音乐；多媒体对象是指包含多种媒体形式(如文本、声音、图像中的至少两种媒体形式)的对象；对象是指可以与用户进行互动的客体，例如，用户可以播放、下载的音乐、视频等。
33.(2)行为多样性：用户与媒体对象的交互(或互动)上的多样性，也可以理解为用户交互的多媒体对象的多样性。例如，用户播放多种风格的音乐这一多样性行为，是用户与音乐交互的多样性，即用户交互的音乐的多样性。
34.(3)用户与媒体对象的交互：是指用户在与媒体对象相关的应用程序上与媒体对象的交互行为。其中，可选的，用户与媒体对象的交互包括点击、浏览、播放、收藏、评论、下载、上传、分享中的至少一种。
35.(4)用户特征向量：与用户相关的且通过向量形式表示的特征数据。
36.(5)特征工程方法：对数据进行一种或多种数据处理(如标准化、归一化、数值化)以使其符合模型输入要求的方法。
37.(6)多层感知机(multi-layer perceptron，mlp)：包含至少一个隐藏层的人工神经网络(artificial neural network，ann)。
38.此外，附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。
39.下面参考本公开的若干代表性实施方式，详细阐释本公开的原理和精神。
40.发明概述
41.本发明人发现，在与音乐、视频等数据资源相关的应用程序，通常分析用户对这些数据资源的风格、内容的偏好，而忽视了用户的行为多样性。
42.不同用户的行为多样性可能不同，同一用户在不同时间阶段的行为多样性也可能不同。例如，一些用户喜欢一直听某一种风格的音乐，而另一些用户喜欢听多种风格的音乐；用户在一个时间段喜欢听一种风格的音乐，而在另一时间段喜欢听多种风格的音乐。可见，用户的行为多样性可以用于为用户建立更完善的用户画像，用于提高为用户推荐数据资源的准确性，例如，为行为更具多样性的用户推荐更多新出的音乐、更多不同风格的音乐。
43.所以，有必要对用户的行为多样性进行分析。
44.出于对用户的行为多样性进行分析的想法，本公开的实施方式中，基于包括用户特征向量和用户特征向量对应的多样性评分标签，训练能够对预测用户的多样性评分的目标模型，基于该目标模型，不仅实现了对用户的行为多样性分析，确保了行为多样性分析的准确性，更是将用户的行为多样性量化为多样性评分，通过多样性评分来准确、清楚地反映用户的行为多样性。
45.在介绍了本公开的基本原理之后，下面具体介绍本公开的各种非限制性实施方式。
46.应用场景总览
47.本公开实施方式适用于的场景包括模型训练场景和/或多样性评分场景。
48.首先参考图1，图1示意性地示出了根据本公开实施方式提供的应用场景示意图，该应用场景涉及的设备包括服务器101。
49.应用场景为模型训练场景时：服务器101上存储有预先采集的训练数据且部署有待训练的模型，可在服务器101上基于训练数据训练模型。
50.应用场景为多样性评分场景时：服务器101上存储有待进行多样性评分的用户的相关数据且部署有训练后的模型，可在服务器101上基于用户的相关数据和训练后的模型，预测到该用户的多样性评分。
51.可选的，应用场景涉及的设备还包括终端102，服务器101与终端102可通过网络进行通信。此时，服务器101可为与媒体对象相关的应用程序的产品服务器，终端102可为部署有该应用程序的客户端。
52.其中，用户可在终端102上打开与媒体对象相关的应用程序，与媒体对象进行交互，例如，在应用程序上听歌。经用户授权的情况下，终端102可记录用户与媒体对象的交互，并将记录的数据发送至服务器101，以用于模型训练和/或用于用户的行为多样性的分析。
53.示例性方法
54.下面结合图1的应用场景，参考图2-图7来描述根据本公开示例性实施方式提供的模型训练方法和多样性评分确定方法。需要注意的是，上述应用场景仅是为了便于理解本公开的精神和原理而示出，本公开的实施方式在此方面不受任何限制。相反，本公开的实施方式可以应用于适用的任何场景。
55.需要说明的是，本公开的实施方式可应用于电子设备，电子设备可以为终端或者服务器，即可在终端或者服务器上执行本公开示例性实施方式提供的模型训练方法和/或多样性评分确定方法。
56.其中，终端可以是个人数字处理(personal digital assistant，简称pda)设备、具有无线通信功能的手持设备(例如智能手机、平板电脑)、计算设备(例如个人电脑(personal computer，简称pc))、车载设备、可穿戴设备(例如智能手表、智能手环)、智能家居设备(例如智能显示设备)等。
57.其中，服务器可以是整体式服务器或是跨多计算机或计算机数据中心的分散式服务器。服务器还可以是各种类别的，例如但不限于，网络服务器，应用服务器，或数据库服务器，或代理服务器。
58.可选的，服务器可以包括硬件，软件，或用于执行服务器所支持或实现的合适功能的内嵌逻辑组件或两个或多个此类组件的组合。例如，服务器例如刀片服务器、云端服务器等，或者可以是由多台服务器组成的服务器群组，可以包括上述类别的服务器中的一种或多种等等。
59.需要说明的是，根据本公开示例性实施方式提供的模型训练方法和根据本公开示例性实施方式提供的模型训练方法和多样性评分确定方法，可以在相同设备上执行，也可
以在不同设备上执行。
60.可选的，本公开的实施方式中，媒体对象为音频和/或视频。
61.参考图2，图2示意性地示出了根据本公开一实施例提供的模型训练方法的流程示意图。如图2所示，模型训练方法包括：
62.s201、确定训练数据，训练数据包括多个用户特征向量和用户特征向量对应的多样性评分标签，用户特征向量是根据用户与媒体对象在多个特征维度下的交互数据得到的。
63.其中，在训练数据中，一个用户特征向量对应一个用户，用户特征向量对应的多样性评分标签为用户的多样性评分标签，用户的多样性评分标签为用户真实、实际或者理想的多样性评分。以与音乐相关的应用程序为例，用户可为该应用程序所构建的音乐社区内的用户。
64.其中，用户与媒体对象在多个特征维度下的交互数据，可包括过去时间内用户交互的媒体对象在多个特征维度下的特征。例如，用户与音乐在多个语种、风格等多个特征维度下的交互数据，包括用户播放、收藏、评论的音乐的风格为摇滚、语种为中文等。因此，用户与媒体对象在多个特征维度下的交互数据，可以反映用户交互的媒体对象在多个特征维度下的多样性，所以，基于交互数据得到的用户特征向量可反映用户的行为多样性。
65.在用户授权的情况下，可从用户的历史行为数据中，获取得到用户与媒体对象在多个特征维度下的交互数据。其中，用户的历史行为数据可以包括用户所交互的媒体对象的描述文本和/或用户的日志文件中。在用户的历史行为数据中，可记载着用户与媒体对象的交互、媒体对象在多个特征维度下的取值，还可记载着用户id和/或用户交互的媒体对象的id。
66.可选的，多个特征维度包括如下至少两种：语种、风格、发布时间、作者、所属作品集、所涉及的创作设备。
67.可选的，媒体对象为音乐时，多个特征维度可包括如下至少两种：语种、风格、发布年代、作者、专辑、伴奏乐器。
68.因此，作为示例的，从用户的音乐访问日志中，可提取出如下交互数据：用户播放、收藏、评论的音乐的风格；用户播放、收藏，评论的音乐的发布年份；用户播放、收藏，评论的音乐的作者；用户播放、收藏，评论的音乐的专辑；用户播放、收藏，评论的音乐的伴奏乐器。
69.本实施例中，可获取预先制作好的训练数据。或者，可获取用户与媒体对象在多个特征维度下的交互数据，基于这些交互数据，得到用户特征向量，接着，根据用户特征向量和用户的多样性评分标签，得到训练数据。
70.s202、根据训练数据，对目标模型进行训练，得到训练好的目标模型，目标模型用于对用户的多样性评分进行预测。
71.其中，用户的多样性评分反映用户的行为多样性的程度。例如，用户的多样性评分越大，则用户的行为多样性的程度越高。
72.本实施例中，在训练数据中，将用户特征向量作为目标模型的输入数据，将用户特征向量对应的多样性评分标签作为目标模型的标签数据，对目标模型进行有监督训练，使得目标模型预测的多样性评分接近用户特征向量对应的多样性评分标签，提高目标模型的多样性评分预测的准确性。
73.本公开实施例中，基于用户与媒体对象在多个特征维度的交互数据得到用户特征向量，基于用户特征向量和用户特征向量对应的多样性评分标签的训练数据，训练目标模型，基于训练后的目标模型实现对用户的行为多样性的量化分析，并确保了用户的多样性分析的准确性。
74.参考图3，图3示意性地示出了根据本公开又一实施例提供的模型训练方法的流程示意图。如图3所示，模型训练方法包括：
75.s301、利用特征工程方法，对用户与媒体对象在多个特征维度下的交互数据进行特征处理，得到各个特征维度下的特征向量。
76.其中，一个用户可对应多个特征向量。在用户的多个特征向量中，包括该用户在各个特征维度下的特征向量，用户在各个特征维度下的特征向量为用户所交互的媒体对象在各个特征维度上的分布特征，用于反映用户所交互的媒体对象在各个特征维度上的分布情况。
77.可选的，在多个特征维度包括语种、风格、发布时间、作者、所属作品集、所涉及的创作设备中至少两种的情况下，特征向量包括如下至少两种：用户交互的媒体对象分别在语种、风格、发布年代、作者、所属作品集、所涉及的创作设备中的至少两个特征维度下的特征向量。
78.本实施例中，用户与媒体对象在多个特征维度下的交互数据可能存在数据形式不统一的问题，不一定符合目标模型的输入要求，比如，交互数据中包括过去时间内用户播放音乐a1的风格为摇滚且语种为中文、用户播放音乐a2的风格为轻音乐且语种为中文，无法直接将摇滚、轻音乐、中文输入至目标模型中。因此，可采用特征工程方法，对用户与媒体对象在多个特征维度下的交互数据进行特征处理，得到用户在各个特征维度对应的特征向量。
79.可选的，用户在一个特征维度对应的特征向量可为多个。
80.可选的，针对各特征维度，可基于多个时间段内用户与媒体对象在特征维度下的交互数据，得到用户在该特征维度下的多个特征向量，其中，在该特征维度下，每个时间段内的交互数据用于得到一个特征向量。
81.可选的，s301的一种可能的实现方式包括：根据多个特征维度与特征工程方法的预设对应关系，针对各特征维度，采用与特征维度对应的特征工程方法，对用户与媒体对象在该特征维度下的交互数据进行特征处理，得到用户在该特征维度下的特征向量。从而，通过设置特征维度与特征工程方法的对应关系，有针对性地为用户与媒体对象在各个特征维度下的交互数据提供合适的特征工程方法，提高特征处理效果。
82.可选的，特征工程方法可包括如下至少一种：对连续型数据进行特征处理的特征工程方法、对离散型数据进行特征处理的特征工程方法。从而，在对交互数据进行特征处理的过程中，充分考虑到交互数据中可能包含连续型数据和/或离散型数据，有针对性地为连续型数据、离散型数据提供专门的特征工程方法，提高特征处理效果。
83.可选的，多个特征维度与特征工程方法的预设对应关系可包括如下至少一种：特征维度与对连续型数据进行特征处理的特征工程方法的对应关系、特征维度与对离散型数据进行特征处理的特征工程方法的对应关系。为了简洁描述，后续将与对连续型数据进行特征处理的特征工程方法对应的特征维度称为第一特征维度，将与对离散型数据进行特征
处理的特征工程方法对应的特征维度称为第二特征维度。其中，第一特征维度与第二特征维度为不同的特征维度。从而，通过预先设置特征维度对应的特征工程方法的方式，为特征维度下的交互数据有针对性地提供合适的特征工程方法，提高特征处理效果。
84.基于本可选方式，s301的一种可能的实现方式包括：基于用户与媒体对象在第一特征维度下的交互数据，得到用户在第一特征维度下的数值向量；采用对连续型数据进行特征处理的特征工程方法，对用户在第一特征维度下的数值向量进行特征处理，得到用户在第一特征维度下的特征向量；和/或，采用对离散型数据进行特征处理的特征工程方法，对用户与媒体对象在第二特征维度下的交互数据进行特征处理，得到用户在第二特征维度下的特征向量。
85.本实现方式中，第一特征维度下的数值向量的向量维度为第一特征维度下的特征数量，其中，在数值向量中，各个向量维度与第一特征维度下的各个特征一一对应，如数值向量的第一个向量维度对应第一特征维度下的第一个特征。在数值向量中，向量维度处的元素表示用户与该向量维度所对应的特征下的媒体对象的交互次数。因此，可基于用户与媒体对象在第一特征维度下的交互数据，得到用户与第一特征维度下各个特征下的媒体对象的交互次数，基于交互次数，确定用户在第一特征维度下的数值向量。
86.作为示例的，第一特征维度为语种，音乐有中文、英文等共11个语种(即在语种这一特征维度下特征数量为11)，因此，可确定第一特征维度对应的数值向量的向量维度为11。在数值向量中，中文、英文等多个语种分别对应一个向量维度，在中文对应的向量维度处的元素表示用户播放、收藏、评论语种为中文的音乐的次数，在英文对应的向量维度处的元素表示用户播放、收藏、评论语种为英文的音乐的次数。所以，可以从用户与音乐在语种这一特征维度下的交互数据中，统计得到用户与中文、英文等多个语种下的音乐的交互次数，基于交互次数和向量维度，得到用户在语种下的数值向量。
87.在得到数值向量后，采用对连续型数据进行特征处理的特征工程方法，对该数值向量进行如标准化、归一化、数值化的特征处理。
88.可选的，在多个特征维度中，如果特征维度下的交互数据为连续型数据，则可确定该特征维度为第一特征维度，例如，用户与某一语种下的音乐的交互次数为连续性数据；如果该特征维度下的交互数据为离散型数据，则可确定该特征维度为第二特征维度，例如用户所听过的音乐的作者。
89.可选的，在多个特征维度包括语种、风格、发布时间、作者、所属作品集、所涉及的创作设备的情况下，第一特征维度包括语种、风格、发布时间，第二特征维度包括作者、所属作品集、所涉及的创作设备。
90.可选的，对连续型数据进行特征处理的特征工程方法可包括逻辑回归(softmax)方法，和/或，对离散型数据进行特征处理的特征工程方法包括独热(one-hot)编码和/或多热(multi-hot)编码，以利用softmax方法、one-hot编码和/或multi-hot编码，提高特征处理效果。其中，softmax方法是一种将数值向量进行标准化的方法，可以将一个由任意数值组成的原向量转化为与维度相同且元素为0～1之间的新向量，新向量中的元素以代表原向量中每一维的概率分布。one-hot编码和multi-hot编码都可以将离散型数据转换为相应的数值向量。
91.可选的，在连续型数据进行特征处理的特征工程方法包括softmax方法的情况下，
可采用softmax方法对用户在第一特征维度下的数值向量进行处理，得到用户在第一特征维度下的特征向量。
92.可选的，采用softmax方法进行特征处理的公式可表示为：
[0093][0094]
其中，z表示用户在第一特征维度下的数值向量，zj为z的第j个元素，即用户与在第一特征维度下的特征为第一特征维度下的第j个特征的媒体对象的交互次数，k1表示z的向量维度和第一特征维度下的特征数量。最终，由每维的处理结果σ(z)j组合得到用户在第一特征维度下的特征向量σ。
[0095]
以第一特征维度为语种为例，假设共11个语种，如中文、英文等，则k1为11，假设zj对应中文，则zj表示用户交互语种为中文的音乐的次数。
[0096]
可选的，在对离散型数据进行特征处理的特征工程方法包括one-hot编码的情况下，可采用one-hot编码，对用户与媒体对象在第二特征维度下的交互数据进行特征处理，得到用户在第二特征维度下的特征向量。
[0097]
本可选方式中，可确定第二特征维度下每个特征分别对应的表示向量，其中，表示向量的向量维度为第二特征维度下的特征数量，表示向量的各个向量维度与第二特征维度下的各个特征一一对应，在特征对应的表示向量中，该特征所对应的向量维度处的元素为1，其他向量维度处的元素为0。在用户与媒体对象在第二特征维度下的交互数据中，若用户交互过特征下的媒体对象，则确定用户在第二特征维度下的特征向量包括该特征对应的表示向量。
[0098]
可选的，采用one-hot编码进行特征处理的公式可表示为：
[0099][0100]
其中，fj表示第二特征维度下第j个特征对应的表示向量，k2为表示向量的维度和第二特征维度下的特征数量，在fj中，k＝j时，vk＝1，其它元素为0。如果用户交互的媒体对象包括在第二特征维度下的特征为第二特征维度下的第j个特征，则用户在第二特征维度下的特征向量包括fj。
[0101]
以第二特征维度为作者这一特征维度为例，例如共2万个作者，则第二特征维度下每个作者对应的表示向量为2万维的one-hot向量，如果用户听过k3个作者的音乐，则用户在第二特征维度下的特征向量包括该k3个作者分别对应的表示向量，该特征向量为k3×
2万大小的矩阵。
[0102]
可选的，在对离散型数据进行特征处理的特征工程方法包括multi-hot编码的情况下，可采用multi-hot编码，对用户与媒体对象在第二特征维度下的交互数据进行特征处理，得到用户在第二特征维度下的特征向量。
[0103]
本可选方式中，multi-hot编码是在one-hot编码的基础上进行降维的方法。在multi-hot编码的过程中，可先通过one-hot编码，得到用户在第二特征维度下的特征向量，此时用户在第二特征维度下的特征向量包括第二特征维度下多个特征对应的表示向量，将这些表示向量进行按行按位进行求和，得到一个合并向量，确定用户在第二特征维度下的特征向量为该合并向量。
[0104]
可选的，采用multi-hot编码进行特征处理的公式可表示为：
[0105]
其中，k4为用户u交互过的媒体对象在第二特征维度下的特征数量(如用户u所听歌的所有音乐的风格数量)，表示k4个特征(用户u交互过的媒体对象在第二特征维度下的特征)中第i个特征的表示向量(表示向量通过one-hot编码得到，可参照上述内容，不再赘述)。fu表示经过multi-hot编码后得到的用户u在第二特征维度下的特征向量。
[0106]
作为示例的，以媒体对象为音乐、用户与媒体对象的交互为听歌为例，采用特征工程方法进行的特征处理，可参照表1：
[0107]
[0108][0109]
例如，可参照上表设置多个特征维度与特征工程方法的对应关系。
[0110]
可选的，在对用户与媒体对象在多个特征维度下的交互数据进行特征处理之前，还可对交互数据进行数据清洗，以剔除交互数据中的异常数据。
[0111]
本可选方式中，可根据用户与媒体对象在多个特征维度下的交互数据，确定用户对应的统计数据，根据用户对应的统计数据，对用户与媒体对象在多个特征维度下的交互数据进行数据清洗。在数据清洗过程中，针对各用户，如果用户对应的统计数据符合预设的删除条件，则可将该用户与媒体对象在多个特征维度下的交互数据从所有交互数据中删除。
[0112]
本可选方式中，统计数据可包括如下至少一种：用户在预设时间段内的播放媒体对象的数量、用户在预设时间段内的播放媒体对象的时长、用户在预设时间段内的交互行为的次数。其中，用户在预设时间段内的播放媒体对象的数量是指用户在预设时间段内播放媒体对象的总数量，用户在预设时间段内的播放媒体对象的时长是指用户在预设时间段内播放媒体对象的总时长，用户在预设时间段内的交互行为的次数是指用户在预设时间段内与媒体对象进行交互的总次数。可以将用户标识作为索引，从交互数据中得到统计数据。
[0113]
本可选方式中，预设条件可包括如下至少一种：用户在预设时间段内的播放媒体对象的数量大于数量阈值；用户在预设时间段内的播放媒体对象的时长大于第一时长阈值；用户在预设时间段内的播放媒体对象的时长大于第二时长阈值且用户在预设时间段内的交互行为的次数小于次数阈值。若用户对应的统计数据满足上述预设条件中的任一条，则说明该用户与媒体对象在多个特征维度下的交互数据的置信度不高，会影响多样性分析的准确性。
[0114]
s302、根据特征向量，得到用户特征向量。
[0115]
本实施例中，在得到用户在多个特征维度下的特征向量后，可结合用户在多个特征维度下的特征向量，确定对应的用户特征向量，如此得到多个用户特征向量。例如，对用户在多个特征维度下的特征向量进行向量运算，比如向量相加、相乘，得到用户特征向量。又如可以将用户在各个特征维度下的特征向量进行拼接，得到用户特征向量。
[0116]
s303、根据用户特征向量和用户对应的多样性评分标签，确定训练数据。
[0117]
本实施例中，针对各用户，获取用户对应的多样性评分标签，确定用户对应的用户特征向量所对应的多样性评分标签为该用户对应的多样性评分标签，完成对用户特征向量的数据标注。基于多个用户特征向量和用户特征向量对应的多样性评分标签，得到训练数据。例如，用户特征向量xu对应的多样性评分标签为yu，如此，最终得到的训练数据可以表示为(x，y)＝{[xu，yu]}，u＝1～u，u表示用户总数，即样本总数。
[0118]
其中，可预先采集用户对应的多样性评分标签，例如，通过人工打分的方式，得到
用户对应的多样性评分标签。
[0119]
作为示例的，以多样性评分标签为听歌多样性评分为例，可由行业专家人工为待评价的用户给出对应的听歌多样性评分，听歌多样性评分的范围为[0，100]。首先，可在数据清洗完成的交互数据中随机选出2000个用户的交互数据，即2000个样本。将这2000个样本随机分发给100个音乐专家，每人分发100个样本，每位专家给这100个样本分别给出一个听歌多样性评分。假设这2000个样本中每个样本都会收到5个专家评分，为去除专家打分时的误差，针对每个样本，可在所有专家评分中，去除一个最高分和一个最低分后，保留3个专家评分，将该3个专家评分的平均值确定为该用户的听歌多样性评分。最终，2000个样本的听歌多样性评分可以组成标签向量y。
[0120]
s304、根据训练数据，对目标模型进行训练，得到训练好的目标模型。
[0121]
其中，s304的实现原理和技术效果可参照前述实施例，不再赘述。
[0122]
本公开实施例中，利用特征工程方法，对用户与媒体对象在多个特征维度下的交互数据进行特征处理，得到特征向量，基于特征向量，得到用户特征向量。根据用户特征向量和用户特征向量对应的多样性评分标签，得到训练数据，从而使得训练数据能够被目标模型更好地处理，提高目标模型用于多样性分析的准确性和效率。
[0123]
参考图4，图4示意性地示出了根据本公开一实施例提供的目标模型的一次训练过程的流程示意图。如图4所示，目标模型的一次训练过程包括：
[0124]
s401、将训练数据中的用户特征向量输入目标模型，得到用户特征向量对应的多样性预测评分。
[0125]
本实施例中，在每次训练中，可以从训练数据中选择预设数量个用户特征向量以及该预设数量个用户特征向量对应的多样性评分标签，以基于该预设数量个用户特征向量以及该预设数量个用户特征向量对应的多样性评分标签，完成对目标模型的一次训练。其中，预设数量大于或等于1。
[0126]
本实施例中，在一次训练中，将从训练数据中选择的用户特征向量输入至目标模型，得到目标模型的输出数据。其中，目标模型的输出数据可以为用户特征向量对应的多样性预测评分；或者，目标模型的输出数据也可以为0～1之间的浮点数值，再将该浮点数值乘以固定值得到用户特征向量对应的多样性预测评分，例如，如果多样性预测评分为十分制，则该固定值可为10，如果多样性预测评分为百分制，则该固定值可为100。
[0127]
可选的，在训练数据中，一个用户特征向量包括各个特征维度下的特征向量，将用户特征向量输入至目标模型，相当于用户特征向量中包含的各个特征维度下的特征向量输入至目标模型，得到用户特征向量对应的多样性预测评分。
[0128]
s402、根据用户特征向量对应的多样性预测评分、用户特征向量对应的多样性评分标签和损失函数，调整目标模型的模型参数。
[0129]
本实施例中，在一次训练中，可根据用户特征向量对应的多样性预测评分与用户特征向量对应的多样性评分标签之间的差异，确定损失函数的函数值。根据损失函数的函数值，对目标模型的模型参数进行调整。
[0130]
一种可选的模型结构中，目标模型为神经网络模型，其模型结构可采用mlp。
[0131]
参考图5，图5示意性地示出了根据本公开一实施例提供的目标模型的结构示意图，如图5所示，目标模型为采用一个隐藏层的mlp。在图5中，目标模型包括输入层、隐藏层
和输出层，其中，输入层包括n个节点，隐藏层包括m个节点，输出层包括1个节点。其中，每个节点代表一个神经元，代表特征的数量，因此，输入层中节点的数量n等于用户特征向量的向量维度。在目标模型中，隐藏层中每个节点的输出可经过一个激活函数变换后输入至输出层进行处理。最终，可由输出层的节点输出一个0～1之间的浮点数值。
[0132]
可选的，基于图5所示的模型结构，目标模型可表示为：
[0133]
h＝σ(xw1+b1)，o＝σ(hw2+b2)
[0134]
其中，x表示输入至目标模型中的用户特征向量(即前述实施例中的xu)，h表示采用激活函数σ对隐藏层的输出数据进行处理后得到的数据，o表示目标模型的输出数据(即采用激活函数σ对输出层的输出数据进行处理后得到的数据)，w1、w2表示目标模型的模型参数中的权重参数，b1、b2表示目标模型的模型参数中的偏置参数。
[0135]
进一步的，在目标模型中，激活函数采用非线性激活函数。
[0136]
进一步的，非线性激活函数为sigmod激活函数。其中，sigmod激活函数的函数值的取值范围为0～1，其公式可表示为：
[0137][0138]
其中，x表示激活函数的输入数据，如前述公式中的xw1b1、hw2+b2。
[0139]
另一种可选的模型结构，目标模型为人工神经网络(artificial neural network，简称ann)，目标模型包括嵌入层、特征交叉层和多层感知机层(后续简称mlp层)，此时，s401的一种可能的实现方式包括：在嵌入层中，对各个特征维度下的特征向量进行嵌入化处理，得到各个特征维度下的嵌入向量；在特征交叉层中，采用注意力机制对各个特征维度下的嵌入向量进行组合交叉处理，得到混合向量；将混合向量输入至mlp层中，得到用户特征向量对应的多样性预测评分。从而，在目标模型中能够学习到不同特征维度下的特征向量之间的关联，提高目标模型的特征学习能力，进而提高目标模型进行多样性评分预测的准确性。
[0140]
其中，本可选的模型结构可以看做是上一可选的模型结构的细化：嵌入层相当于输入层的结构细化，特征交叉层相当于隐藏层的结构细化，mlp层相当于输出层的结构细化。通过这些结构细化，提高目标模型的特征提取效果，进而提高多样性评分预测准确性。
[0141]
其中，本可选方式中的具体过程可以参照后续实施例提供的多样性评分确定方法中利用目标模型对目标用户的用户特征向量进行处理的过程，再次不再赘述。
[0142]
需要说明的是，模型训练方法中目标模型可以与多样性评分确定方法中的目标模型相同，也可以不同。此外，目标模型还可以采用其他神经网络模型结构，在此不一一描述。
[0143]
可选的，目标模型的优化算法可采用反向传播(back propagation，bp)算法，即利用bp算法对模型参数进行调整，以提高模型训练效果。
[0144]
在一种可能的实现方式中，如图4所示，s402包括：
[0145]
s4021、根据用户特征向量对应的多样性预测评分、用户特征向量对应的多样性预测评分标签和损失函数，确定损失函数在模型参数上的导数。
[0146]
本实现方式中，确定用户特征向量对应的多样性预测评分与用户特征向量对应的多样性评分标签之间的差异，基于该差异确定损失函数的函数值。再基于确定损失函数的函数值在模型参数上的导数。
[0147]
可选的，损失函数可表示为：
[0148][0149]
其中，l为损失函数的函数值，y表示用户特征向量对应的多样性评分标签，通过激活函数将多样性评分标签转换为0～1之间的浮点数值，之后再在损失函数中确定转换后的多样性评分标签与目标模型的输出数据o(即多样性预测评分)的差值，最后根据该差值计算得到l。
[0150]
可选的，在确定损失函数在模型参数上的导数时，可先计算损失函数在目标模型的多个网络层的输出数据上的导数，其中，多个网络层包括隐藏层和输出层；根据损失函数在目标模型的多个网络层的输出数据上的导数，确定损失函数在目标模型的模型参数上的导数。
[0151]
进一步的，基于图5所示的模型结构，上述导数计算过程可表示为：
[0152]
(1)计算损失函数在输出层的输出数据z2上的导数：
[0153][0154]
其中，δ2为损失函数在输出层的输出数据z2上的导数。
[0155]
(2)计算损失函数在隐藏层的输出数据z1上的导数：
[0156][0157]
其中，t表示转置，δ1为损失函数在隐藏层的输出数据z1上的导数。
[0158]
(3)根据损失函数在z1、z2上的导数，计算损失函数在目标模型的各层网络的模型参数上的导数：
[0159][0160][0161][0162][0163]
其中，分别表示损失函数在权重参数w2、偏置参数b2、权重参数w1、偏置参数b1上的导数。
[0164]
s4022、根据损失函数在模型参数上的导数，调整模型参数。
[0165]
本实施例中，针对各模型参数，基于损失函数在该模型参数上的导数，对该模型参数进行更新，例如，在模型参数上加上或者减去该导数，得到更新后的模型参数。最终，得到一次训练结束后的模型参数。
[0166]
可选的，在一次训练中可以采用多个用户特征向量，即采用多个样本，将各个用户特征向量分别输入目标模型进行处理，经过损失函数和上述求导之后，在各个用户特征向量下可分别得到损失函数在各个模型参数上的导数，即各个用户特征向量对应的导数。因此，在调整模型参数的过程中，针对各模型参数，可基于一次训练中损失函数在该模型参数
下的所有导数之和的均值，对该模型参数进行调整。
[0167]
可选的，模型参数的调整公式可表示为：
[0168][0169][0170][0171][0172]
其中，s表示一次训练中用户特征向量的总数，η为预设参数。
[0173]
可选的，对目标模型进行多次训练，直至目标模型的训练满足如下至少一种条件：训练次数大于次数阈值、损失函数的函数值小于损失阈值。
[0174]
本公开实施例中，基于用户特征向量、用户特征向量对应的多样性评分标签和损失函数，训练目标模型，提高目标模型的训练效果，进而提高目标模型的多样性分析的准确性。
[0175]
后续，提供目标模型应用于多样性评分的多个实施例。
[0176]
参考图6，图6示意性地示出了根据本公开一实施例提供的多样性评分确定方法的流程示意图。如图6所示，多样性评分确定方法包括：
[0177]
s601、确定目标用户的用户特征向量，其中，用户特征向量是根据目标用户与媒体对象在多个特征维度下的交互数据得到。
[0178]
其中，目标用户与媒体对象在多个特征维度下的交互数据，可包括过去时间内目标用户交互的媒体对象在多个特征维度下的特征。例如，目标用户与音乐在多个语种、风格等多个特征维度下的交互数据。
[0179]
其中，特征维度可参照前述实施例的描述，不再赘述。
[0180]
在经目标用户授权的情况下，可从目标用户的历史行为数据中，获取得到目标用户与媒体对象在多个特征维度下的交互数据。其中，目标用户的历史行为数据可以包括目标用户所交互的媒体对象的描述文本和/或目标用户的日志文件中。在目标用户的历史行为数据中，可记载着目标用户与媒体对象的交互、媒体对象在多个特征维度下的取值，还可记载着目标用户id和/或目标用户交互的媒体对象的id。
[0181]
本实施例中，可从数据库中获取目标用户的用户特征向量；或者，可以从数据库中获取用户与媒体对象在多个特征维度下的交互数据，基于这些交互数据，获得目标用户的用户特征向量。
[0182]
可选的，每隔预设时间段，确定目标用户的用户特征向量。从而，周期性地对目标用户的行为多样性进行分析，以提高行为多样性分析的准确性。
[0183]
可选的，在接收到对目标用户的行为多样性进行分析的请求的情况下，确定目标用户的用户特征向量。从而，满足用户对行为多样性进行分析的需求，为用户提供更好的服务体验。
[0184]
s602、通过目标模型对目标用户的用户特征向量进行处理，得到目标用户对应的多样性预测评分。
[0185]
其中，目标模型是根据前述任一实施例提供的模型训练方法训练得到的，具体可
参照前述实施例，在此不再赘述。此外，也可以采用其他模型训练方法训练得到目标模型。
[0186]
本实施例中，可将目标用户的用户特征向量输入至目标模型中，由目标模型基于目标用户的用户特征向量对目标用户的行为多样性进行分析，得到经目标模型预测得到的目标用户的行为多样性评分，为间接描述，在此，将经经目标模型预测得到的行为多样性评分称为行为多样性预测评分。
[0187]
其中，目标用户的多样性评分反映目标用户的行为多样性的程度。例如，目标用户的多样性评分越大，则目标用户的行为多样性的程度越高。
[0188]
s603、向目标用户展示多样性预测评分。
[0189]
本实施例中，可通过向目标用户推送提醒消息的方式，向目标用户展示多样性预测评分，例如向目标用户发送“某某用户，经评估分析您的音乐多样性得分为
……”
的提醒消息；和/或，可通过在显示屏幕上显示目标用户的多样性预测评分的方式，向目标用户展示该多样性预测评分。
[0190]
本实施例中，如果当前设备为服务器，则服务器可将目标用户的多样性预测评分发送至目标用户的终端上进行展示；如果当前设备为终端，则终端可在自身的显示屏幕上显示多样性评分。
[0191]
可选的，响应于目标用户的用户中心页面的访问请求，在用户中心页面向目标用户展示多样性预测评分，从而便于用户在个人中心查看到自己的多样性预测评分，提高多样性预测评分查看的便捷性，为用户提供更好的体验。
[0192]
可选的，通过预设图案、文字、音频中的一种或多种结合的方式，向目标用户展示多样性预测评分。例如，向用户展示音乐多样性徽章。
[0193]
可选的，可基于多样性评分与多样性等级的对应关系，确定目标用户的多样性预测评分对应的多样性等级，向目标用户展示该多样性等级。例如，向目标用户展示目标用户达成了与多样性相关的某某成就。
[0194]
可选的，多样性预测评分还可用于向目标用户推荐与媒体对象相关的数据资源。例如，媒体对象为音乐时，可根据目标用户的多样性预测评分向目标用户推荐更多的音乐资源，比如，在目标用户的多样性预测评分较高的情况下，可向目标用户推荐更多的新发布的音乐。
[0195]
本公开实施例中，基于目标用户的用户特征向量和预先训练好的目标模型，对目标用户的行为多样性进行分析，得到目标用户的多样性预测评分，并向目标用户展示多样性预测评分。从而，实现对用户与媒体对象互动的行为多样性的量化分析，并提高了行为多样性分析的准确性，通过用户的多样性预测评分，有利于用户更清晰地了解自身与媒体对象交互的多样性。
[0196]
参考图7a，图7a示意性地示出了根据本公开又一实施例提供的多样性评分确定方法的流程示意图。如图7a所示，多样性评分确定方法包括：
[0197]
s701、利用特征工程方法，对目标用户与媒体对象在多个特征维度的交互数据进行特征处理，得到各个特征维度下的特征向量。
[0198]
本实施例中各个特征维度下的特征向量即目标用户在各个特征维度下的特征向量。
[0199]
可选的，在多个特征维度包括语种、风格、发布时间、作者、所属作品集、所涉及的
创作设备中至少两种的情况下，特征向量包括如下至少两种：目标用户交互的媒体对象分别在语种、风格、发布年代、作者、所属作品集、所涉及的创作设备中的至少两个特征维度下的特征向量。
[0200]
本实施例中，可采用特征工程方法，对目标用户与媒体对象在多个特征维度下的交互数据进行特征处理，得到目标用户在各个特征维度对应的特征向量。
[0201]
可选的，目标用户在一个特征维度对应的特征向量可为多个。
[0202]
可选的，针对各特征维度，可基于多个时间段内目标用户与媒体对象在特征维度下的交互数据，得到目标用户在该特征维度下的多个特征向量，其中，在该特征维度下，每个时间段内的交互数据用于得到一个特征向量。
[0203]
可选的，s701的一种可能的实现方式包括：根据多个特征维度与特征工程方法的预设对应关系，针对各特征维度，采用与特征维度对应的特征工程方法，对目标用户与媒体对象在特征维度下的交互数据进行特征处理，得到目标用户在特征维度下的特征向量。从而，通过设置特征维度与特征工程方法的对应关系，有针对性地为目标用户与媒体对象在各个特征维度下的交互数据提供合适的特征工程方法，提高特征处理效果。
[0204]
可选的，特征工程方法包括如下至少一种：对连续型数据进行特征处理的特征工程方法、对离散型数据进行特征处理的特征工程方法。从而，在对交互数据进行特征处理的过程中，充分考虑到交互数据中可能包含连续型数据和/或离散型数据，有针对性地为连续型数据、离散型数据提供专门的特征工程方法，提高特征处理效果。
[0205]
可选的，多个特征维度与特征工程方法的预设对应关系可包括如下至少一种：第一特征维度与对数值型数据进行特征处理的特征工程方法的对应关系、第二特征维度与对离散型的非数值型数据进行特征处理的特征工程方法的对应关系。其中，第一特征维度和第二特征维度可参照前述实施例的描述。
[0206]
基于本可选方式，s701的又一种可能的实现方式包括：基于目标用户与媒体对象在第一特征维度下的交互数据，得到目标用户在第一特征维度下的数值向量；采用对连续性型数据进行特征处理的特征工程方法，对目标用户在第一特征维度下的数值向量进行特征处理，得到目标用户在第一特征维度下的特征向量；和/或，采用对离散型数据进行特征处理的特征工程方法，对目标用户与媒体对象在第二特征维度下的交互数据进行特征处理，得到目标用户在第二特征维度下的特征向量。
[0207]
其中，本实现方式可以参照前述实施例提供的在训练过程中对用户与媒体对象在第一特征维度下的交互数据、用户与媒体对象在第二特征维度下的交互数据进行处理，得到相应的特征向量的过程，在此不再赘述。
[0208]
可选的，对连续型数据进行特征处理的特征工程方法可包括逻辑回归(softmax)方法，和/或，对离散型数据进行特征处理的特征工程方法包括独热(one-hot)编码和/或多热(multi-hot)编码，以提高特征处理效果。其中，具体处理过程可参照前述实施例提供的在训练过程中采用softmax方法、one-hot编码和/或multi-hot编码对用户与媒体对象在多个特征维度下的交互数据进行处理的操作，在此不再赘述。
[0209]
可选的，在对目标用户与媒体对象在多个特征维度下的交互数据进行特征处理之前，还可对目标用户与媒体对象在多个特征维度下的交互数据进行数据清洗，以剔除交互数据中的异常数据。
[0210]
本可选方式中，可根据目标用户与媒体对象在多个特征维度下的交互数据，确定目标用户对应的统计数据，根据目标用户对应的统计数据，对目标用户与媒体对象在多个特征维度下的交互数据进行数据清洗。在数据清洗过程中，如果目标用户对应的统计数据符合预设的删除条件，则可将目标用户与媒体对象在多个特征维度下的交互数据从所有交互数据中删除，再重新采集目标用户与媒体对象在多个特征维度下的交互数据。
[0211]
本可选方式中，统计数据可包括如下至少一种：目标用户在预设时间段内的播放媒体对象的数量、目标用户在预设时间段内的播放媒体对象的时长、目标用户在预设时间段内的交互行为的次数。其中，目标用户在预设时间段内的播放媒体对象的数量是指目标用户在预设时间段内播放媒体对象的总数量，目标用户在预设时间段内的播放媒体对象的时长是指目标用户在预设时间段内播放媒体对象的总时长，目标用户在预设时间段内的交互行为的次数是指目标用户在预设时间段内与媒体对象进行交互的总次数。
[0212]
本可选方式中，预设条件可包括如下至少一种：目标用户在预设时间段内的播放媒体对象的数量大于数量阈值；目标用户在预设时间段内的播放媒体对象的时长大于第一时长阈值；目标用户在预设时间段内的播放媒体对象的时长大于第二时长阈值且用户在预设时间段内的交互行为的次数小于次数阈值。若目标用户对应的统计数据满足上述预设条件中的任一条，则说明目标用户与媒体对象在多个特征维度下的交互数据的置信度不高，会影响多样性分析的准确性，所以需要删除该交互数据。
[0213]
s702、根据特征向量，得到目标用户的用户特征向量。
[0214]
本实施例中，在得到目标用户在多个特征维度下的特征向量后，可结合目标用户在多个特征维度下的特征向量，确定目标用户的用户特征向量。例如，对目标用户在多个特征维度下的特征向量进行向量运算，比如向量相加、相乘，得到目标用户的用户特征向量。又如将目标用户在各个特征维度下的特征向量进行拼接，得到目标用户的用户特征向量。
[0215]
s703、通过目标模型对目标用户的用户特征向量进行处理，得到目标用户对应的多样性预测评分。
[0216]
本实施例中，将从目标用户的用户特征向量输入至目标模型，得到目标模型的输出数据。其中，目标模型的输出数据可以为目标用户的多样性预测评分；或者，目标模型的输出数据也可以为0～1之间的浮点数值，再将该浮点数值乘以固定值得到目标用户的多样性预测评分。
[0217]
可选的，目标用户的用户特征向量包括目标用户在各个特征维度下的特征向量。此时，将各个特征维度下的特征向量输入至目标模型，得到目标用户对应的多样性预测评分。
[0218]
一种可选的模型结构中，目标模型为神经网络模型，其模型结构可采用mlp，具体可以参照图5和前述实施例提供的模型训练方法，在此不进行赘述。
[0219]
又一种可选的模型结构中，目标模型为ann，如图7b所示，目标模型包含嵌入层(embedding layer)、特征交叉层和mlp层，嵌入层、特征交叉层和mlp层依次连接。从而，一方面，通过嵌入层提高输入至特征交叉层中的数据的质量；另一方面，充分考虑到用户与媒体对象在不同特征维度下的交互数据彼此有着千丝万缕的联系，比如，通常听歌多样性程度较高的用户会去尝试听不同风格、不同语种、不同年代的音乐，通过特征交叉层关注不同特征维度下的特征向量之间的关系和对彼此的影响，以提高多样性预测评分的准确性。
[0220]
其中，本可选的模型结构可以看做是上一可选的模型结构(即mlp)的细化：嵌入层相当于输入层的细化结构，特征交叉层相当于隐藏层的细化结构，mlp层相当于输出层的细化结构。通过这些结构细化，提高目标模型的特征提取效果，进而提高目标模型的多样性评分预测的准确性。
[0221]
此时，s703的一种可能的实现方式包括：
[0222]
s7031、在嵌入层中，对各个特征维度下的特征向量进行嵌入化处理，得到各个特征维度下的嵌入向量。
[0223]
本实现方式中，可将各个特征维度下的特征向量输入至嵌入层中，在嵌入层中对各个特征维度下的特征向量进行嵌入化处理(即进行嵌入编码)，得到各个特征维度下的嵌入向量，以通过嵌入化处理提高数据质量，进而提高后续的特征提取效果。
[0224]
其中，一个特征维度可对应一个或多个嵌入向量。
[0225]
可选的，在本实现方式中，针对各特征维度，通过特征维度对应的参数向量，对特征维度下的特征向量进行矩阵变换，得到特征维度下的嵌入向量。不同的特征维度下的嵌入向量的维数相同。从而，考虑到不同特征维度下的特征向量的维数可能不同，通过矩阵变换的方式进行维数统一，以提高后续的特征提取效果。
[0226]
其中，参数向量可为浮点数矩阵。
[0227]
在本可选方式中，进一步的，考虑到同一特征维度下的特征向量具有相同或者相似的语义，比如，在语种这一维度下的特征向量都是反映用户所交互媒体对象的语种情况，而且同一特征维度下的特征向量的维度相同，所以，不同的特征维度对应不同的参数向量，同一特征维度对应相同的参数向量。一方面既可以减少参数数量，另一方面也可以更好地从特征向量中准确学习到语义特征，提高目标模型的泛化能力。
[0228]
进一步的，嵌入化处理的公式可表示为：fi＝xiwi。其中，xi表示第i个特征向量，wi表示第i个特征向量对应的参数向量，fi表示基于对第i个特征向量得到的嵌入向量。
[0229]
如图7b所示，语种、风格、作者、歌曲年代、专辑、伴奏乐器这6个特征维度下分别有2个特征向量(如表1所示)，总共有12个特征向量，将这12个特征向量输入至嵌入层中。假设xi的维数为m，wi为m行128列的矩阵，则经过嵌入层的处理后，得到的12个嵌入向量都是128维。假设，语种下的特征向量的为11维、歌曲年代下的特征向量是51维，经过上述的嵌入化处理后，都转换为128维的嵌入向量。
[0230]
s7032、在特征交叉层中，采用注意力机制对各个特征维度下的嵌入向量进行组合交叉处理，得到混合向量。
[0231]
本实现方式中，将各个特征维度下的嵌入向量输入至特征交叉层中，在特征交叉层中对不同嵌入向量进行交叉组合，利用注意力机制学习嵌入向量进行交叉组合的特征和权重，通过学习到的特征和权重来调整各个嵌入向量，实现对多个嵌入向量的混合，得到特征较差层输出的混合向量。其中，通过学习到的特征和权重来调整各个嵌入向量为注意力机制的权重和特征学习过程(比如通过交叉组合学习到各个嵌入向量的查询向量v、键向量k和值向量q，再通过这些向量对嵌入向量进行加权)，在此不做限制。
[0232]
可选的，特征交叉层包括多个注意力头，即特征嵌入层采用的注意力机制为多头注意力(multi-head attention)机制，其中，各个注意力头均包括第一残差块和第二残差块。如图7b所示(其中，在图7b中，以1个注意力头为例)，第一残差块包括多头注意力网络和
归一化层，第二残差块包括前向网络和归一化网络。基于此，s7032包括：针对各注意力头，通过第一残差块中的多头注意力网络和归一化网络对各个特征维度下的嵌入向量进行特征处理，得到第一残差块的输出向量；针对各注意力头，通过第二残差块中的前向网络和归一化网络对第一残差块的输出向量进行特征处理，得到第二残差块的输出向量；根据各个注意力头中第二残差块的输出向量，得到混合向量。
[0233]
本可选方式中，在第一残差块中，可将各个特征维度下的嵌入向量(例如12个嵌入向量)输入至第一残差块的多头注意力网络中，在多头注意力网络中利用多头注意力机制学习各个特征维度下的嵌入向量进行交叉组合的特征和权重，得到多头注意力网络的输出向量，其中，一个嵌入向量可对应多头注意力网络的一个输出向量。接着，对将多头注意力网络的输出向量和各个特征维度下的嵌入向量进行融合处理，将融合后的向量输入至第一残差块中的归一化网络中，进行归一化处理，得到第一残差块的输出向量。
[0234]
其中，在对将多头注意力网络的输出向量和各个特征维度下的嵌入向量进行融合处理的过程中，由于多头注意力网络的输出向量与各个特征维度下的嵌入向量的维数相同，比如，多头注意力网络的12个输出向量可构成12*128维的矩阵，6个特征维度中每个特征维度下有12个嵌入向量，该12个嵌入向量可构成12*128维的矩阵，所以，可将多头注意力网络的输出向量与各个特征维度下的嵌入向量进行矩阵的按位相加求和或者求平均，以提高融合处理效果。
[0235]
本可选方式中，在第二残差块中，可将第一残差块的输出向量输入至前向网络中，得到前向网络的输出向量，将前向网络的输出向量与第一残差块的输出向量进行融合处理，并将融合后的向量输入至第二残差块中的归一化网络中，进行归一化处理，得到第二残差块的输出向量。其中，前向网络即前馈神经网络(feedforward)。
[0236]
其中，前向网络的输出向量的维数与第一残差块的输出向量的维数相同，可通过将前向网络的输出向量与第一残差块的输出向量进行矩阵的按位相加求和或者求平均的方式，实现对前向网络的输出向量与第一残差块的输出向量的融合处理。
[0237]
本可选方式中，在得到各个注意力头中第二残差块的输出向量后，可通过将各个注意力头中第二残差块的输出向量进行融合处理，得到混合向量。从而，基于多个注意力头进行不同特征维度下的特征向量的交叉混合，再结合多个注意力头的输出，得到最终的混合向量，有效地提高目标模型的特征提取能力，进而提高多样性预测的准确性。
[0238]
进一步的，由于各个注意力头中第二残差块的输出向量的维度一致，可对各个注意力头中第二残差块的输出向量进行矩阵的按位求和或者按位求平均，得到混合向量。比如，一共有8个注意力头，得到来自第二残差块的8个输出向量，该输出向量的维度为12*128维的矩阵，将这8个矩阵进行按位求和或者按位求平均，最终得到一个12*128维的矩阵。
[0239]
s7033、将混合向量输入至mlp层中，得到目标用户对应的多样性预测评分。
[0240]
其中，mlp层用于在特征交叉层的基础上进行多样性打分。
[0241]
本实现方式中，将混合向量输入至mlp层中，通过mlp中多个网络层对混合向量的特征处理，得到目标用户对应的多样性预测评分。
[0242]
可选的，如图7b所示，mlp包括至少一个全连接层和输出层。基于此，在将混合向量输入至mlp层之后，可对混合向量进行矩阵重塑(reshape)，即改变混合向量的维数。将重塑后的混合向量输入至全连接层中，得到最后一个全链接层中神经元节点的输出数据，将该
输出数据输入至输出层，在输出层中可通过非线性激活函数对该输出数据进行处理，得到一个0～1之间的浮点数，该浮点数即目标模型的输出数据，基于该浮点数据可最终得到目标用户的多样性预测评分。
[0243]
其中，输出层中的非线性激活函数可为sigmoid函数。
[0244]
需要说明的是，本实施例中网络层之间的连接关系可以是直接连接也可以是间接连接，比如嵌入层与特征交叉层直接连接，或者嵌入层和特征交叉层之间连接有其他网络层。
[0245]
s704、向目标用户展示多样性预测评分。
[0246]
其中，s704的实现原理和技术效果可参照前述实施例，不再赘述。
[0247]
本公开实施例中，采用特征工程方法对目标用户与媒体对象在多个特征维度下的交互数据进行处理，得到目标用户在各个特征维度下的特征向量，基于目标用户在各个特征维度下的特征向量，得到目标用户的用户特征向量，最终基于用户特征向量和目标模型，分析得到目标用户的多样性预测评分。从而，提高了对目标用户与媒体对象的交互数据的处理效果，进而提高了基于目标模型分析得到的多样性预测评分的准确性。
[0248]
示例性介质
[0249]
在介绍了本公开示例性实施方式的方法之后，接下来，参考图8对本公开示例性实施方式的存储介质进行说明。
[0250]
参考图8所示，描述了根据本公开的实施方式的用于实现上述方法的程序产品80，其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此。处理器执行本公开的程序产品时，实现如前述任一实施例提供的模型训练方法，和/或实现如前述任一实施例提供的多样性评分确定方法。
[0251]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0252]
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。
[0253]
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等，还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(lan)或广域网(wan)，连接到用户计算设备。
[0254]
示例性装置
[0255]
在介绍了本公开示例性实施方式的介质之后，接下来，参考图9-图10对本公开示
例性实施方式的模型训练装置、多样性评分确定装置进行说明，其中，模型训练装置用于实现上述任一方法实施例提供的模型训练方法，多样性评分确定装置用于实现上述任一方法实施例提供的多样性评分确定方法，其实现原理和技术效果类似，在此不再赘述。
[0256]
参考图9，图9为本公开一实施例提供的模型训练装置的结构示意图。如图9所示，模型训练装置包括：
[0257]
确定单元901，用于确定训练数据，训练数据包括多个用户特征向量和用户特征向量对应的多样性评分标签，用户特征向量是根据用户与媒体对象在多个特征维度下的交互数据得到；
[0258]
训练单元902，用于根据训练数据，对目标模型进行训练，得到训练好的目标模型，目标模型用于对用户的多样性评分进行预测。
[0259]
在本公开的一个实施例中，用户特征向量是根据用户与媒体对象在多个特征维度下的交互数据得到，包括：利用特征工程方法，对交互数据进行特征处理，得到各个特征维度下的特征向量，其中，特征工程方法包括如下至少一种：对连续型数据进行特征处理的特征工程方法、对离散型数据进行特征处理的特征工程方法；根据各个特征维度下的特征向量，得到用户特征向量。
[0260]
在本公开的又一个实施例中，利用特征工程方法，对交互数据进行特征处理，得到各个特征维度下的特征向量，包括：根据多个特征维度与特征工程方法的预设对应关系，针对各特征维度，采用与特征维度对应的特征工程方法，对特征维度下的交互数据进行特征处理，得到特征维度下的特征向量。
[0261]
在本公开的又一个实施例中，利用特征工程方法，对交互数据进行特征处理，得到各个特征维度下的特征向量之前，还包括：根据交互数据，确定用户对应的统计数据，统计数据包括如下至少一种：用户在预设时间段内的播放媒体对象的数量、用户在预设时间段内的播放媒体对象的时长、用户在预设时间段内的交互行为的次数；根据统计数据，对交互数据进行数据清洗。
[0262]
在本公开的又一个实施例中，用户特征向量包括各个特征维度下的特征向量，目标模型的训练过程包括：将各个特征维度下的特征向量输入目标模型，得到用户特征向量对应的多样性预测评分；根据多样性预测评分、多样性评分标签和损失函数，调整目标模型的模型参数。
[0263]
在本公开的又一个实施例中，目标模型包含嵌入层、特征交叉层和多层感知机，将各个特征维度下的特征向量输入目标模型，得到用户特征向量对应的多样性预测评分，包括：在嵌入层中，对各个特征维度下的特征向量进行嵌入化处理，得到各个特征维度下的嵌入向量；在特征交叉层中，采用注意力机制对各个特征维度下的嵌入向量进行组合交叉处理，得到混合向量；将混合向量输入至多层感知机层中，得到用户特征向量对应的多样性预测评分。
[0264]
在本公开的又一个实施例中，根据多样性预测评分、多样性评分标签和损失函数，调整目标模型的模型参数，包括：根据多样性预测评分、多样性预测评分标签和损失函数，确定损失函数在目标模型的各层模型参数上的导数；根据导数，调整模型参数。
[0265]
参考图10，图10为本公开一实施例提供的多样性评分确定装置的结构示意图。如图10所示，多样性评分确定装置包括：
[0266]
确定单元1001，用于确定目标用户的用户特征向量，其中，用户特征向量是根据目标用户与媒体对象在多个特征维度下的交互数据得到；
[0267]
处理单元1002，用于通过目标模型对用户特征向量进行处理，得到目标用户对应的多样性预测评分；
[0268]
显示单元1003，用于向目标用户展示多样性预测评分
[0269]
在本公开的一个实施例中，用户特征向量是根据目标用户与媒体对象在多个特征维度下的交互数据得到，包括：利用特征工程方法，对交互数据进行特征处理，得到各个特征维度下的特征向量，其中，特征工程方法包括如下至少一种：对连续型数据进行特征处理的特征工程方法、对离散型数据进行特征处理的特征工程方法；根据各个特征维度下的特征向量，得到用户特征向量。
[0270]
在本公开的又一个实施例中，利用特征工程方法，对交互数据进行特征处理，得到各个特征维度下的特征向量，包括：根据多个特征维度与特征工程方法的预设对应关系，针对各特征维度，采用与特征维度对应的特征工程方法，对特征维度下的交互数据进行特征处理，得到特征维度下的特征向量。
[0271]
在本公开的又一个实施例中，利用特征工程方法，对交互数据进行特征处理，得到各个特征维度下的特征向量之前，还包括：根据交互数据，确定目标用户对应的统计数据，统计数据包括如下至少一种：目标用户在预设时间段内的播放媒体对象的数量、目标用户在预设时间段内的播放媒体对象的时长、目标用户在预设时间段内的交互行为的次数；根据统计数据，对交互数据进行数据清洗。
[0272]
在本公开的又一个实施例中，用户特征向量包括各个特征维度下的特征向量，目标模型包含嵌入层、特征交叉层和多层感知机，处理单元具体用于：在嵌入层中，对各个特征维度下的特征向量进行嵌入化处理，得到各个特征维度下的嵌入向量；在特征交叉层中，采用注意力机制对各个特征维度下的嵌入向量进行组合交叉处理，得到混合向量；将混合向量输入至多层感知机层中，得到目标用户对应的多样性预测评分。
[0273]
在本公开的又一个实施例中，处理单元具体用于：针对各特征维度，通过特征维度对应的参数向量，对特征维度下的特征向量进行矩阵变换，得到特征维度下的嵌入向量；其中，不同的特征维度对应不同的参数向量，不同的特征维度下的嵌入向量的维度相同。
[0274]
在本公开的又一个实施例中，特征交叉层包括多个注意力头，各个注意力头均包括第一残差块和第二残差块，第一残差块包括多头自注意力网络和归一化网络，第二残差块包括前向网络和归一化网络，处理单元具体用于：针对各注意力头，通过第一残差块中的多头注意力网络和归一化网络对各个特征维度下的嵌入向量进行特征处理，得到第一残差块的输出向量；针对各注意力头，通过第二残差块中的前向网络和归一化网络对第一残差块的输出向量进行特征处理，得到第二残差块的输出向量；根据各个注意力头中第二残差块的输出向量，得到混合向量。
[0275]
在本公开的又一个实施例中，处理单元具体用于：在第一残差块中，将各个特征维度下的嵌入向量输入至多头注意力网络，得到多头注意力网络的输出向量；对多头注意力网络的输出向量和各个特征维度下的嵌入向量进行融合处理，并将融合后的向量输入至第一残差块中的归一化网络中，得到第一残差块的输出向量。
[0276]
在本公开的又一个实施例中，处理单元具体用于：在第二残差块中，将第一残差块
的输出向量输入至前向网络中，得到前向网络的输出向量；将前向网络的输出向量与第一残差块的输出向量进行融合处理，并将融合后的向量输入至第二残差块中的归一化网络中，得到第二残差块的输出向量。
[0277]
在本公开的又一个实施例中，处理单元具体用于：对各个注意力头中第二残差块的输出向量进行矩阵的按位求和或者按位求平均，得到混合向量。
[0278]
示例性计算设备
[0279]
在介绍了本公开示例性实施方式的方法、介质和装置之后，接下来，参考图11对本公开示例性实施方式的计算设备进行说明。
[0280]
图11显示的计算设备110仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。
[0281]
如图11所示，计算设备110以通用计算设备的形式表现。计算设备110的组件可以包括但不限于：上述至少一个处理单元1101、上述至少一个存储单元1102，连接不同系统组件(包括处理单元1101和存储单元1102)的总线1103。其中，至少一个存储单元1102存储计算机执行指令，至少一个处理器1101执行至少一个存储器11102存储的计算机执行指令，使得至少一个处理器1101执行如前述任一实施例提供的模型训练方法，和/或，使得至少一个处理器1101执行如前述任一实施例提供的多样性评分确定方法。
[0282]
总线1103包括数据总线、控制总线和地址总线。
[0283]
存储单元1102可以包括易失性存储器形式的可读介质，例如随机存取存储器(ram)11021和/或高速缓存存储器11022，可以进一步包括非易失性存储器形式的可读介质，例如只读存储器(rom)11023。
[0284]
存储单元1102还可以包括具有一组(至少一个)程序模块11024的程序/实用工具11025，这样的程序模块11024包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0285]
计算设备110也可以与一个或多个外部设备1104(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(i/o)接口1105进行。并且，计算设备110还可以通过网络适配器1106与一个或者多个网络(例如局域网(lan)，广域网(wan)和/或公共网络，例如因特网)通信。如图11所示，网络适配器406通过总线1103与计算设备110的其它模块通信。应当理解，尽管图中未示出，可以结合计算设备110使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0286]
应当注意，尽管在上文详细描述中提及了模型训练装置、多样性评分确定装置的若干单元/模块或子单元/模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之，上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
[0287]
此外，尽管在附图中以特定顺序描述了本公开方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。
[0288]
虽然已经参考若干具体实施方式描述了本公开的精神和原理，但是应该理解，本公开并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李双江肖强李勇
技术所有人：杭州网易云音乐科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。