一种媒体流推送方法、装置、设备及存储介质与流程

文档序号：29302949发布日期：2022-03-19 10:54阅读：114来源：国知局

1)层级节点用于记录第n层级媒体流对应的媒体流类别的媒体流分类特征；若所述数据结构中的第n层级节点用于记录媒体流分类特征，则第(n-1)层级节点记录的媒体流分类特征为第n层级媒体流分类特征的聚合特征，n为大于1的自然数。
17.在一种可能的实现方式中，所述逐层基于所述对象特征与各层级节点的媒体流分类特征的相似度，确定与所述目标对象匹配的媒体流分类特征的步骤，包括：
18.基于所述对象特征的向量与当前层级的所述媒体流分类特征的向量，确定所述相似度，其中，所述相似度用于表征所述目标对象对各媒体流类别执行目标操作的概率估计信息；
19.基于所述相似度，从当前层级的媒体流分类特征中，确定出与所述目标对象匹配的所述媒体流分类特征。
20.在一种可能的实现方式中，所述基于媒体库中媒体流特征，对所述媒体流进行聚类，得到多个媒体流类别的步骤，包括：
21.对媒体流库中的所述媒体流特征的向量进行聚类，得到多个媒体流类别。
22.在一种可能的实现方式中，所述基于所述目标媒体流类别中预先存储的各媒体流特征，确定出与所述目标对象匹配的目标媒体流的步骤，包括：
23.基于目标媒体流类别中各媒体流特征与对象特征，确定所述目标对象与媒体流的相似度；
24.基于目标对象与媒体流的相似度，从所述目标媒体流类别中筛选出所述目标媒体流。
25.在一种可能的实现方式中，所述基于目标对象与媒体流的相似度，从所述目标媒体流类别中筛选出所述目标媒体流，包括：
26.从所述目标媒体流类别中，筛选出所述目标对象与媒体流的相似度大于相似度阈值的媒体流。
27.在一种可能的实现方式中，所述获取触发媒体流推送请求的目标对象的对象特征的步骤，包括：
28.从所述媒体流推送请求中提取所述目标对象的特征信息；或
29.从所述媒体流推送请求中提取所述目标对象的对象标识信息，并利用对象标识信息和对象特征的预设映射关系，获取提取的对象标识信息映射的对象特征。
30.在一种可能的实现方式中，所述从所述媒体流推送请求中提取所述目标对象的对象标识信息，并利用对象标识信息和对象特征的预设映射关系，获取提取的对象标识信息映射的对象特征时，所述预设映射关系是通过如下方式创建的：
31.获取所述目标对象的对象标识信息和所述目标对象的对象特征；
32.将所述对象标识信息和所述对象特征创建为一个匹配关系并存储，得到所述预设映射关系。
33.在一种可能的实现方式中，所述对象特征是通过双塔模型的对象塔获得的，所述双塔模型包括对象塔和目标塔，所述媒体流特征和所述媒体流分类特征是通过所述目标塔生成的。
34.本公开第二方面，提供一种媒体流推送装置，包括：
35.特征获取单元，被配置为执行获取触发媒体流推送请求的目标对象的对象特征；
以及
36.第一推送单元，被配置为执行基于预先生成的各媒体流分类特征与所述对象特征的相似度，从预先存储的各媒体流类别中确定出目标媒体流类别，其中，媒体库中的媒体流被存储为不同的媒体流类别，不同的媒体流类别用不同的所述媒体流分类特征来表示；
37.第二推送单元，被配置为执行基于所述目标媒体流类别中预先存储的各媒体流特征，确定出与所述目标对象匹配的目标媒体流；
38.第三推送单元，被配置为执行向所述目标对象推送所述目标媒体流。
39.在一种可能的实现方式中，所述各媒体流分类特征基于层级关系存储，所述第一推送单元具体被配置为执行：
40.逐层基于所述对象特征与各层级节点的媒体流分类特征的相似度，确定与所述目标对象匹配的媒体流分类特征；
41.在匹配出的所述媒体流分类特征为记录媒体流分类特征的最低层级的情况下，从该媒体流分类特征表示的媒体流类别中，确定出所述目标媒体流类别。
42.在一种可能的实现方式中，所述第一推送单元还被配置为执行：
43.确定与所述目标对象匹配的媒体流分类特征基于媒体库中媒体流特征，对所述媒体流进行聚类，得到多个媒体流类别；
44.基于具有多个层级关系的数据结构，记录所述多个媒体流类别和媒体流分类特征，
45.其中，所述数据结构中包括多个层级，每个层级包括至少一个层级节点，
46.若所述数据结构中的第n层级的层级节点用于记录媒体流的媒体流特征，则第(n-1)层级节点用于记录第n层级媒体流对应的媒体流类别的媒体流分类特征；若所述数据结构中的第n层级节点用于记录媒体流分类特征，则第(n-1)层级节点记录的媒体流分类特征为第n层级媒体流分类特征的聚合特征，n为大于1的自然数。
47.在一种可能的实现方式中，所述第一推送单元具体被配置为执行：
48.基于所述对象特征的向量与当前层级的所述媒体流分类特征的向量，确定所述相似度，其中，所述相似度用于表征所述目标对象对各媒体流类别执行目标操作的概率估计信息；
49.基于所述相似度，从当前层级的媒体流分类特征中，确定出与所述目标对象匹配的所述媒体流分类特征。
50.在一种可能的实现方式中，所述第一推送单元具体被配置为执行：
51.对媒体流库中的所述媒体流特征的向量进行聚类，得到多个媒体流类别。
52.在一种可能的实现方式中，所述第二推送单元具体被配置为执行：
53.基于目标媒体流类别中各媒体流特征与对象特征，确定所述目标对象与媒体流的相似度；
54.基于目标对象与媒体流的相似度，从所述目标媒体流类别中筛选出所述目标媒体流。
55.在一种可能的实现方式中，所述第二推送单元具体被配置为执行：
56.从所述目标媒体流类别中，筛选出所述目标对象与媒体流的相似度大于相似度阈值的媒体流。
57.在一种可能的实现方式中，所述特征获取单元具体被配置为执行：
58.从所述媒体流推送请求中提取所述目标对象的特征信息；或
59.从所述媒体流推送请求中提取所述目标对象的对象标识信息，并利用对象标识信息和对象特征的预设映射关系，获取提取的对象标识信息映射的对象特征。
60.在一种可能的实现方式中，所述特征获取单元具体被配置为执行从所述媒体流推送请求中提取所述目标对象的对象标识信息，并利用对象标识信息和对象特征的预设映射关系，获取提取的对象标识信息映射的对象特征时，所述预设映射关系是通过如下方式创建的：
61.获取所述目标对象的对象标识信息和所述目标对象的对象特征；
62.将所述对象标识信息和所述对象特征创建为一个匹配关系并存储，得到所述预设映射关系。
63.在一种可能的实现方式中，所述对象特征是通过双塔模型的对象塔获得的，所述双塔模型包括对象塔和目标塔，所述媒体流特征和所述媒体流分类特征是通过所述目标塔生成的。
64.本公开第三方面，提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现第一方面及一种可能的实施方式中任一所述的方法。
65.本公开第四方面，提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行如第一方面及一种可能的实施方式中任一所述的方法。
66.本公开的方案至少带来以下的有益效果：
67.本公开实施例中首先根据目标对象的对象特征和媒体流分类特征的相似度，从预先生成的媒体流分类特征中确定目标媒体流类别，进而将目标媒体流类别中与目标对象匹配的目标媒体流推送给目标对象，该推送过程中不必针对每个媒体流计算其对应媒体流特征，也不用计算各个媒体流类别的媒体流分类特征，减少了计算复杂度，明显减少了向目标对象推荐媒体流的时长，提升推荐效率。
附图说明
68.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。
69.图1为本公开示例性实施例提供的媒体流推送的流程示意图；
70.图2为本公开示例性实施例提供的一个多个层级关系的数据结构的结构示意图；
71.图3为本公开示例性实施例提供的一种确定出目标媒体流类别的过程示意图；
72.图4为本公开示例性实施例提供的一种通过双塔模型获取媒体流特征的向量和对象特征的向量的示意图；
73.图5为本公开示例性实施例提供的一种通过双塔模型获取媒体流特征的向量和对象特征的向量的示意图；
74.图6为本公开示例性实施例提供的一种通过双塔模型获取媒体流特征的向量和对象特征的向量的示意图；
75.图7为本公开示例性实施例提供的一种向目标对象推送视频流的原理示意图；
76.图8为本公开示例性实施例提供的一种媒体流推送装置的结构示意图；
77.图9为本公开示例性实施例提供的一种电子设备的结构示意图。
具体实施方式
78.为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。
79.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
80.为了便于本领域技术人员更好地理解本公开的技术方案，下面对本公开涉及的技术名词进行说明。
81.媒体流：媒体流是通过网络传输的媒体数据，媒体数据可以包括视频、音频、图像等内容中的一个或多个或其它内容；通过网络传输的媒体数据可以是在传输时实时播放的媒体数据，也可以是下载之后再进行播放的媒体数据。媒体流可以是直播媒体流，也可以是点播媒体流。直播媒体流比如可以是直播视频流、直播音频流。点播媒体流比如可以是点播视频流或点播音频流等。直播视频流包括实时广播视频、现场演唱会视频、实时监控视频、会议视频、游戏直播视频或远程教学视频等，直播音频流包括音乐会音频等。
82.对象：可以是人或智能设备等能进行交互的主体，本公开实施例中的对象与用户为相同的描述。
83.近邻检索：又称位置算符检索，用于规定命中的检索词在记录中的间隔距离，最近邻检索就是根据数据的相似性，从数据库中寻找与目标数据最相似的项目，而这种相似性通常会被量化到空间上数据之间的距离，可以认为数据在空间中的距离越近，则数据之间的相似性越高；当需要查找离目标数据最近的前k个数据项时，就是k最近邻检索(k-nn)。
84.双塔模型：在模型中将一个神经网络改为两个独立的神经网络，并在模型的上层将两个神经网络连接，从而实现对大规模数据处理的需求。
85.下面对本公开的设计思想进行说明。
86.相关技术中常通过深度学习技术在向用户推送媒体流时，具体地，通过深度神经网络计算与用户相关的特征，且通过深度神经网络计算各候选媒体流的特征，通过邻近检索技术从候选媒体流的集合中筛选出一些候选媒体流，进而将用户特征和筛选出的候选媒体流的媒体流特征进行匹配，从大量的候选媒体流中确定向用户推送的媒体流，其中候选媒体流数据量大时，计算各候选媒体流的媒体流特征耗时长且效率低。
87.另一方面，临近检索技术中通过欧氏距离衡量的是空间各点的绝对距离，跟空间各店所在的位置坐标直接相关；通过余弦距离衡量的是空间向量的夹角，更加体空间各点在方向上的差异，而不是位置，同时，近邻检索的计算都是近似检索，为了保证一定的性能，损失了计算精度；基于此，近些年出现了基于树搜索的深度推荐模型(tree-based deep model，tdm)，tdm模型中通过用户特征和媒体流特征之间的相似度匹配作k-最近邻推荐，并基于二叉树的结构进行媒体流的检索，但是tdm模型处理过程耗时较长，处理器cpu环境中
需要耗时150ms以上，在候选媒体流数量大时，无法满足性能需求。巨量的数据中，无法满足性能需求。
88.综上目前在向用户推荐媒体流的过程中计算复杂度高且耗时长，进而导致推荐媒体流的效率低。
89.鉴于此，本公开设计一种媒体流推送方法、装置、设备及存储介质，用以提升媒体流推荐的效率，考虑到在向目标对象推送媒体流时，各媒体流的媒体流特征的计算复杂度高，进而导致推荐媒体流的耗时长，因此考虑可以预先生成各媒体流的媒体流特征并存储，以及预先生成各媒体流类别的媒体流分类特征并存储，在向目标对象推送媒体流时，可以基于预先生成的媒体流分类特征和媒体流特征向目标对象推送媒体流；具体地，获取触发媒体流推送请求的目标对象的对象特征；以及基于预先生成的各媒体流分类特征与上述对象特征的相似度，从预先存储的各媒体流类别中确定出目标媒体流类别；基于目标媒体流类别中预先存储的各媒体流特征，确定出与目标对象匹配的目标媒体流，并向目标对象推送目标媒体流，其中媒体库中的媒体流被存储为不同的媒体流类别，不同的媒体流类别用不同的媒体流分类特征来表示目标操作。
90.进一步地，考虑到为减少确定出目标媒体流类别的计算复杂度和耗时，各媒体流分类特征可以但不局限于基于层级关系存储，进而向目标对象推送媒体流的过程中在确定出目标媒体流类别时，可以逐层基于上述对象特征与各层级节点的媒体流分类特征的相似度，确定与目标对象匹配的媒体流分类特征；在匹配出的上述媒体流分类特征为记录媒体流分类特征的最低层级的情况下，从该媒体流分类特征表示的媒体流类别中，确定出目标媒体流类别；上述过程中基于各媒体流类别之间的关联关系，将媒体流分类特征以层级关系存储，能够减少搜索的层数以及减少对象特征与各层次节点的匹配次数，进而减少确定出目标媒体流类别的计算复杂度和耗时。
91.更进一步地，为了减少获取对象特征、媒体流特征和媒体流分类特征的耗时，本公开实施例中还可以通过双塔模型中的对象塔获取目标对象的对象特征，通过双塔模型中的目标塔获取媒体流特征和媒体流类别特征，上述双塔模型包括对象塔和目标塔。
92.以下结合附图对本公开的方案进行详细说明：
93.请参见图1，提供一种媒体流推送方法，具体包括如下步骤：
94.步骤s101，获取触发媒体流推送请求的目标对象的对象特征。
95.具体地，为了提升获取对象特征的效率，可以直接从媒体流推送请求中提取目标对象的对象特征考虑到在推送媒体流的过程中才提取目标对象的特征信息会增加计算复杂度和耗时，因此本公开实施例还可以基于应用平台的对象数据，预先获取各对象的对象特征并存储，进而在进行媒体流推送时，可以直接获取目标对象的对象特征，进而减少计算复杂度；上述应用平台可以是特定媒体流的应用平台，如短视频服务平台、音乐服务平台等。
96.考虑到提取到的对象特征可能是离散的数据，不便于处理，因此为了提升处理效率，本公开实施例中可以通过利用预设算法对提取的对象特征进行向量化，得到对象特征的向量，利用对象特征的向量进行媒体流的推送过程，其中若目标对象的对象特征是预先获取并存储的，则可以直接将预先获取的对象特征转化为对象特征的向量进行存储；其中在利用预设算法对上述对象特征进行向量化时，可以将获取的对象的多个特征信息进行拼
接后，利用神经网络对拼接后的特征信息进行向量化，得到对象特征的向量，上述神经网络可以但不局限于为卷积神经网络、全连接网络等。
97.应当说明的是，本公开实施例中提供的对象特征的向量只是一种为便于处理对象特征而转化的数据，本领域的技术人员可以根据实际需求，灵活地将获取的对象特征转化为其它便于进行处理的数据形式。
98.步骤s102，基于预先生成的各媒体流分类特征与上述对象特征的相似度，从预先存储的各媒体流类别中确定出目标媒体流类别，其中，媒体库中的媒体流被存储为不同的媒体流类别，不同的媒体流类别用不同的媒体流分类特征来表示。
99.具体地，为了减少确定出目标媒体流类别的计算复杂度和耗时，本公开实施例中可以基于层级关系存储各媒体流分类特征；进而在步骤s102中可以基于各媒体流分类特征存储的层级关系，逐层基于上述对象特征与各层级节点的媒体流类别的相似度，确定与目标对象匹配的媒体流分类特征；在匹配出的媒体流分类特征为记录媒体流分类特征的最低层级的情况下，从该媒体流分类特征表示的媒体流类别中，确定出目标媒体流类别；其中若最低层级匹配出的媒体流分类特征为一个时，将该媒体流分类特征表示的媒体流类别确定为目标媒体流类别；若最低层级匹配出的媒体流分类特征为多个时，可以从多个媒体流分类特征表示的媒体流类别中，确定出部分媒体流类别或者全部媒体流类别为目标媒体流类别。上述过程中基于各媒体流类别之间的关联关系，将媒体流分类特征以层级关系存储，能够减少搜索的层数以及减少对象特征与各层次节点的匹配次数，进而减少确定出目标媒体流类别的计算复杂度和耗时。
100.考虑到预先生成的媒体流分类特征可能是离散的数据，不便于处理，因此为了降低数据处理的复杂度以提升处理效率，本公开实施例中可以通过利用预设算法对提取的媒体流分类特征进行向量化，得到媒体流分类的向量并存储。
101.进一步，为了提升数据处理效率，本公开实施例中，可以基于对象特征的向量与当前层级的媒体流分类特征的向量，确定对象特征与各层级节点的媒体流分类特征的第一相似度，进而基于第一相似度，从当前层级的媒体流分类特征中，确定出与目标对象匹配的媒体流分类特征；其中第一相似度用于表征目标对象对各媒体流类别执行目标操作的第一概率估计信息。
102.更进一步，为了提升确定出的与目标对象匹配的媒体流分类特征的准确度，以提升筛选出的目标媒体流被目标对象喜爱的程度，本公开实施例中，可以从当前层级的媒体流分类特征中，筛选出第一相似度大于第一相似度阈值的媒体流分类特征，如可以但不局限于从当前层级的媒体流分类特征中，筛选出第一相似度最高的k1个媒体流分类特征，为目标对象匹配的媒体流分类特征等。
103.步骤s103，基于上述目标媒体流类别中预先存储的各媒体流特征，确定出与目标对象匹配的目标媒体流。
104.为了提升确定出与目标对象匹配的目标媒体流的效率，本公开实施例中可以基于媒体流特征和对象特征的相似程度，确定出与目标对象匹配的媒体流；具体地，可以基于目标媒体流类别中各媒体流特征与对象特征，确定上述目标对象与媒体流的第二相似度；基于目标对象与媒体流的第二相似度，从上述目标媒体流类别中筛选出上述目标媒体流。
105.为了提升筛选出的目标媒体流被目标对象喜爱的程度，本公开实施例中，可以从
目标媒体流类别中，筛选出目标对象与媒体流的第二相似度大于第二相似度阈值的媒体流；如可以但不局限于目标媒体流类别中，筛选出第二相似度最高的k2个媒体流为目标媒体流等；其中k2可以与上述k1相同，也可以不同。
106.进一步地，为降低对媒体流特征处理的数据复杂度，本公开实施例中可以通过向量的形式表示获取的媒体流特征，即可以预先对获取的各媒体流特征进行向量化处理，得到对应的媒体流特征的向量。
107.为了提升确定目标媒体流的效率，本公开实施例中以对象特征的向量表示对象特征，以媒体流特征的向量表示媒体流特征，在步骤s103中，则可以但不局限于将上述对象特征的向量与目标媒体流类别中各媒体流特征的向量的点积，确定为目标对象和各媒体流的相似度参数；并利用预设激活函数对上述相似度参数进行转换，得到上述目标对象和各媒体流的第二相似度，上述第二相似度表示目标对象对对应的媒体流进行目标操作的第而概率估计信息；进而筛选出第二概率信息最高的k2个媒体流为目标媒体流。
108.步骤s104，向目标对象推送上述目标媒体流。
109.考虑到提升目标对象对推送的目标媒体流的好感度，可以将目标媒体流排序后推送给目标对象如可以将排序后的目标媒体流一次性推送给目标对象，也可以按照排序后的目标媒体流的排列顺序，每次向目标对象推送一个或多个媒体流。
110.作为一种实施例，本公开实施例中目标对象的对象特征可以但不局限于包括对象行为特征、对象环境特征、对象自然和社会属性特征。
111.对象行为特征可以包括对象触发媒体流推送请求使用的终端的设备型号、对象观看媒体流的地理位置、对象触发媒体推送请求使用的目标应用、上述目标应用的应用版本、对象所属地理位置的天气信息等中的一个或多个特征信息。
112.对象行为特征包括对象的历史行为特征，可以但不局限于包括历史设定时段中对象的如一个或多个特征信息：
113.浏览媒体流的数量、时长等特征信息；
114.针对媒体流转移电子资源的特征信息，上述电子资源可以是电子货币或电子礼物等；
115.与媒体流进行交互的特征信息，如对象为媒体流点赞的特征信息；
116.关注发布媒体流的账户的特征信息；
117.向其它对象分享媒体流的特征信息。
118.本公开实施例中媒体流特征可以但不局限于包括媒体流环境特征和媒体流自然特征中的一个或组合；上述媒体流环境特征可以包括媒体流标签、媒体流时长、媒体流的清晰度、媒体流的播放信息中的一个或多个；上述媒体流自然特征可以包括媒体流的标识信息、制作媒体流的对象的标识信息等。
119.作为一种实施例，针对媒体流类别而言，目标操作可以但不局限于包括击媒体流类别中的媒体流、播放媒体流类别中的媒体流、下载媒体流类别中的媒体流、分享媒体流类别中的媒体流、编辑媒体流类别中的媒体流等操作；针对媒体流而言，目标操作可以但不局限于包括点击媒体流、播放媒体流、下载媒体流、分享媒体流、编辑媒体流等，且目标操作可以根据媒体流的具体内容设定；如媒体流为视频流时，上述目标操作可以是点击媒体流、下载媒体流、为媒体流点赞、分享媒体流等；媒体流为音频流时，目标操作可以是播放音频流；
媒体流为图片时，目标操作可以是查看图片、下载图片、编辑图片等，本领域的技术人员可以根据实际需求设置上述目标操作。
120.作为一种实施例，本公开实施例中具体可以通过如下方式预先获取对象特征并存储：获取各对象的对象标识信息和对象特征；将各对象的对象标识信息和对应的对象特征创建为一个匹配关系并存储，得到各对象的预设映射关系中；具体地，还可以利用预设算法对上述对象特征进行向量化，得到对象特征的向量；将各对象的对象标识信息和对象特征的向量创建为一个匹配关系并存储，得到各对象的预设映射关系，其中，本公开实施例中的目标对象为上述各对象中的一个。
121.进而在步骤s101中基于上述预设映射关系，在推送媒体流的过程中可以通过如下方式获取目标对象的对象特征：从媒体流推送请求中提取目标对象的对象标识信息，并利用对象标识信息和对象特征的预设映射关系，确定提取的对象标识信息映射的对象特征，上述对象标识信息可以但不局限于为目标对象的账户信息。
122.作为一种实施例，在步骤s102之前，可以基于层级关系存储各媒体流分类特征，以便在步骤s102中能快速确定出目标媒体流类别，以下对基于层级关系存储各媒体流分类特征的过程进行详细说明：
123.可以基于媒体库中媒体流特征，对媒体流进行聚类，得到多个媒体流类别；进而基于具有多个层级关系的数据结构，记录上述多个媒体流类别和媒体流分类特征，其中：
124.上述数据结构中包括多个层级，每个层级包括至少一个层级节点，若上述数据结构中的第n层级的层级节点用于记录媒体流的媒体流特征，则第(n-1)层级节点用于记录第n层级媒体流对应的媒体流类别的媒体流分类特征；若上述数据结构中的第n层级节点用于记录媒体流分类特征，则第(n-1)层级节点记录的媒体流分类特征为第n层级媒体流分类特征的聚合特征，n为大于1的自然数。
125.其中为了提升处理的效率，在对媒体流进行聚类时，可以但不局限于对媒体流库中的上述媒体流特征的向量进行聚类，得到多个媒体流类别。
126.作为一种实施例，上述多个层级关系的数据结构可以为多叉树，该多叉树的最底层的层级节点用于存储媒体流特征，该多叉树的倒数第2个层级至最顶层的层级节点用于存储媒体流分类特征，其中该多叉树中的层级节点中存储媒体流特征的向量或媒体流类别的向量，以下对该多叉树的构建过程进行说明：
127.对包含用于推送的各媒体流的媒体流集合进行遍历，对各媒体流特征进行向量化得到对应的媒体流特征的向量，进而对得到的媒体流特征的向量通过递归的方式做keans聚类，根据聚类结果构建多叉树。
128.上述keans聚类的具体过程如下：
129.将获取的各媒体流特征的向量作为多叉树的最底层的叶子节点(即最底层的层级节点)；
130.对叶子节点的各媒体流特征的向量聚类为多个媒体流类别，得到叶子节点对应的多个父节点(即多叉树的最底层的上一层的层级节点，又称非叶子节点)，该父节点与媒体流类别媒体流分类特征的向量一一对应，并根据叶子节点的聚类结果连通上述叶子节点和对应的父节点；
131.从多叉树的最底层的上一层开始，进行多次聚类操作，在每次聚类操作时，将当前
层的节点对应的媒体分类特征的向量聚类为多个媒体流类别，得到当前层的节点对应的上一层的父节点，并根据当前层的节点的聚类结果连通当前层的节点和对应的父节点，直至上一层的每个父节点的子节点的数量小于子节点数量阈值，其中上一层的父节点与聚类得到的媒体流类别的媒体流分类特征的向量一一对应；且每个父节点的子节点的数量可以相同或不同。
132.对上述子节点数量阈值不做限定，本领域的技术人员可根据实际需求设置。
133.请参见图2，此处给出一个根据上述聚类过程构建的多叉树的抽象示意图，其中最底层的叶子节点对应各媒体流的媒体流特征的向量，非叶子节点对应媒体流类别的媒体流分类特征的向量，顶点表示选择媒体流的搜索入口；由于待推送的媒体流数量巨大，图1中用省略号表示未展示的非叶子节点及叶子节点，仅连接一个节点的连边的另一边的连接情况未示意出。
134.进一步，在上述步骤s102中可以基于上述多叉树确定出目标媒体类别和目标媒体流，可参见图3，具体可以包括如下步骤：
135.步骤s301，按照多叉树从最高层到最底层的顺序，利用对象特征的向量对当前层的非叶子节点对应的媒体流分类特征的向量进行加权处理，并根据加权处理结果从当前层的非叶子节点中确定出部分非叶子节点，若确定出的非叶子节点不包括目标非叶子节点，则利用对象特征的向量对确定出的非叶子节点的子节点对应的媒体流分类的向量进行加权处理，直至选取的非叶子节点包括目标非叶子节点。
136.其中上述目标非叶子节点的子节点为叶子节点，即目标非叶子节点为多叉树底层的上一层中的非叶子节点。
137.作为一种实施例，该步骤s301中可以获取对象特征的向量与当前层的各非叶子节点对应的媒体流分类特征的向量的点积；
138.利用预设激活函数对上述点积进行转换，得到目标对象对各非叶子节点对应的媒体流类别进行目标操作的第一概率估计值(即上述第一概率估计信息)；
139.根据第一概率估计值，从当前层的各非叶子节点中确定出部分非叶子节点，如选择第一概率估计值最高的前k1个非叶子节点，k1为正整数且本领域的技术人员可根据实际需求设置k1的值。
140.步骤s302，将确定出的目标非叶子节点对应的媒体流分类特征的向量对应的媒体流类别，确定为目标媒体流类别。
141.步骤s303，从目标媒体流类别中的媒体流，确定出与目标对象匹配的目标媒体流。
142.作为一种实施例，在本公开实施例中可以将上述具有多个层级关系的数据结构(如上述多叉树)和双塔模型结合，实现上述步骤s101至步骤s104，即在上述步骤s101至步骤s104中，可以通过双塔模型的对象塔获取对象特征，通过双塔模型的目标塔获取预先存储的各媒体流特征以及各媒体流分类特征。
143.在预先存储媒体流特征和对象特征的过程中，可以使用双塔模型的目标塔获取各媒体流的媒体流特征，以及各媒体流类别的媒体流分类特征，基于各媒体流特征和各媒体流分类特征构建上述具有多个层级关系的数据结构，且可以使用双塔模型的对象塔获取各对象的对象特征并存储。
144.在向目标对象推送媒体流时，使用目标塔且基于构建的具有多个层级关系的数据
结构，获取预先存储的各媒体流特征以及各媒体流分类特征，使用对象塔根据对象标识信息和对象特征的预设映射关系，获取目标对象的对象标识信息映射的对象特征。
145.以下对预先存储媒体流特征和对象特征的过程中，利用双塔模型获取媒体流特征的向量和对象特征的向量的具体过程进行说明：
146.例如，请参见图4，是本公开实施例提供的一种双塔模型的结构示意图。如图4所示，整个模型分为两侧(每一侧即对应一个塔)。左侧的塔代表的是对象的模型，称为对象塔，其最下层是对象的特征信息(如对象行为特征、对象环境特征、对象自然和社会属性特征)，经过embedding层(向量层)之后每个特征信息变为一个向量，并可将所有的特征向量拼接在一起，然后可通过3层(还可以为其他结构)的全连接网络将上述对象的所有特征信息转化为一个向量，即经过第一层转化为一个512维的向量u1，经过第二层转化为一个256维的向量u2，经过第3层转化为一个128维的对象特征的向量u3。右侧的塔则代表的是媒体流的特征信息，可称为目标塔，最下层是媒体流的特征(如媒体流环境特征和媒体流自然特征等)，同样，上述媒体流的特征也会经过一系列转化为一向量，即经过第一层转化为一个512维的向量p1，经过第二层转化为一个256维的向量p2，经过第3层转化为一个128维的媒体流特征的向量p3。进而可通过对象特征的向量u3和媒体流特征的向量p3计算内积，利用激活函数对内积进行处理，得到的值即为上述对象对上述媒体流进行目标操作的第二概率估计值，第而概率估计值越大表示媒体流的推荐度越高，以基于该第二概率估计值确定向对象推送的媒体流。
147.应当说明的是，图4的过程仅示意出获取媒体流特征的向量和对象特征的向量的过程，获取媒体流分类特征的向量的过程于获取媒体流特征的向量的过程相似，此处不再重复叙述。
148.以下对在向目标对象推送媒体流时，利用目标塔且基于构建的多叉树，获取媒体流分类特征的向量，使用对象塔获取目标对象的对象特征的向量的过程进行详细说明，主要包括如下两种情况：
149.情况1：预先存储了各媒体流的媒体流特征的向量以及目标对象的对象特征的向量。
150.请参见图5，左侧的塔代表的是对象的对象塔，利用对象标识信息和对象特征的向量的预设映射关系，确定目标对象的对象标识信息映射的对象特征的向量u3；右侧的塔为代表的是媒体流的特征信息的目标塔，目标塔通过检索多叉树，从与预先存储的各媒体流特征的向量中选取媒体流特征的向量p3。进而可通过对象特征的向量u3和媒体流特征的向量p3计算内积，利用激活函数对内积进行处理，得到的值即为目标对象对选取的媒体流特征的向量对应的媒体流进行目标操作的第二概率估计值。
151.其中，目标塔还用于在选取媒体流特征的向量p3的过程中，基于多叉树从预先存储的媒体流分类特征的向量中确定出部分媒体流分类特征的向量，进而通过对象特征的向量u3和媒体流分类特征的向量计算内积，利用激活函数对内积进行处理，得到的值即为目标对象对确定的媒体流分类特征的向量对应的媒体流类别进行目标操作的第一概率估计值。
152.情况2：预先存储了各媒体流的媒体流特征的向量，但未预先存储目标对象的对象特征的向量。
153.请参见图6，左侧的塔代表的是对象的对象塔，其最下层是对象的特征信息(如对象行为特征、对象环境特征、对象自然和社会属性特征)，经过embedding层(向量层)之后每个特征信息变为一个向量，并可将所有的特征向量拼接在一起，然后可通过3层的全连接网络将对象的所有特征信息转化为一个向量，即经过第一层转化为一个512维的向量u1，经过第二层转化为一个256维的向量u2，经过第3层转化为一个128维的对象特征的向量u3；右侧的塔为代表的是媒体流的特征信息的目标塔，目标塔通过检索多叉树，从与预先存储的各媒体流特征的向量中选取媒体流特征的向量p3。进而可通过对象特征的向量u3和媒体流特征的向量p3计算内积，利用激活函数对内积进行处理，得到的值即为目标对象对选取的媒体流特征的向量对应的媒体流进行目标操作的第二概率估计值。
154.其中，目标塔还用于在选取媒体流特征的向量p3的过程中，基于多叉树从预先存储的媒体流分类特征的向量中确定媒体流分类特征的向量，进而通过对象特征的向量u3和媒体流分类特征的向量计算内积，利用激活函数对内积进行处理，得到的值即为目标对象对确定出的媒体流分类特征的向量对应的媒体流类别进行目标操作的第一概率估计值。
155.本公开实施例的如下内容提供一个推荐媒体流的具体示例。
156.该示例中以视频流作为媒体流，针对媒体流的目标操作为对视频流的点击操作为例进行说明，且通过双塔模型和上述多叉树的存储结构融合的方式向目标对象推送视频流，可参见图7，具体包括如下三个部分：
157.第一部分：预先存储各媒体流的媒体流特征的向量以及各对象的对象特征的向量。
158.视频流特征包括视频流环境特征(如视频流标签、视频流时长、视频流的清晰度、视频流的播放信息)以及视频流自然特征(如视频流的标识信息、制作视频流的对象的标识信息)；各对象的特征信息可参见上述内容，此处不再重复叙述。
159.首先通过kafka日志抽取各对象的特征信息以及各视频流的视频流特征的向量，进而进行模型训练，在模型训练中通过图4所示的双塔模型中的目标塔对各视频流的视频流特征进行处理，得到对应的视频流特征的向量并存储，通过双塔模型中的对象塔对各对象的对象特征进行处理得到对应的对象特征的向量，具体处理过程可参见上述内容，此处不再重复叙述。
160.第二部分：基于获得的各视频流的视频流特征的向量，构建推荐时用于搜索的多叉树。
161.具体地，在通过目标塔获取各视频流的视频流特征的向量后，将获取的各视频流特征的向量作为多叉树的底层的叶子节点；
162.对叶子节点的各视频流特征的向量聚类为多个视频流类别，得到叶子节点对应的多个父节点，上述父节点与视频流类别的视频流分类特征的向量一一对应，并根据叶子节点的聚类结果连通叶子节点和对应的父节点；
163.从多叉树的底层的上一层开始，进行多次聚类操作，在每次聚类操作时，将当前层的节点对应的视频分类特征的向量聚类为多个视频流类别，得到当前层的节点对应的上一层的父节点，并根据当前层的节点的聚类结果连通当前层的节点和对应的父节点，直至上一层的每个父节点对应的视频流类别包含的视频流的数量小于子节点数量阈值，其中上一层的父节点与聚类得到的视频流类别的视频流分类特征的向量一一对应；且每个父节点的
子节点的数量可以相同或不同。
164.其中在对多叉树当前层的节点(叶子节点或非叶子节点)进行聚类时，可以将聚类后的每个视频流类别的中心点，作为当前层的上一层的节点(即将聚类后的每个视频流类别的中心点作为当前层的节点对应的父节点)。
165.第三部分：基于双塔模型和预先构建的多叉树，向目标对象推送视频流。
166.具体地，请参见图5和图7，在线服务接收到媒体流推送请求后，从媒体流推送请求中提取目标对象的对象标识信息，并通过双塔模型中的对象塔，利用对象标识信息和对象特征的向量的预设映射关系，确定目标对象的对象标识信息映射的对象特征的向量u3；通过双塔模型的目标塔检索多叉树，按照多叉树从最高层到最底层的顺序，逐层检索多叉树，选取部分视频流分类特征的向量，进而确定选取的视频流分类特征的向量对应的视频流类别中的视频流，选取确定的视频流的媒体流特征的向量p3。进而可通过对象特征的向量u3和选取的各媒体流特征的向量p3计算内积，利用激活函数对内积进行处理，得到目标对象对选取的各媒体流特征的向量对应的媒体流进行目标操作的第二概率估计值；进而获取第二概率估计值最大的k2个媒体流特征的向量对应的视频流，将获取的向目标对象推送上述k2个媒体流。
167.本公开实施例中首先根据目标对象的对象特征和媒体流分类特征的相似度，从预先生成的媒体流分类特征中确定目标媒体流类别，进而将目标媒体流类别中与目标对象匹配的目标媒体流推送给目标对象，该推送推荐过程中不必针对每个视频流计算其对应的媒体流特征，也不用计算各个媒体流类别的媒体流分类特征，减少了计算复杂度，明显减少了向目标对象推荐媒体流的时长，提升推荐效率；另一方面通过双塔模型和具有多个层级关系的数据结构结合的方式，进一步减少了计算量，减少了向目标对象推送媒体流的耗时；且经过试验表明，上述将双塔模型和多具有多个层级关系的数据结构的方式进行媒体流推荐时，推送效率提高在10倍左右。
168.如图8所示，基于相同的发明构思，本公开实施例还提供一种媒体流推送装置800，该装置包括：
169.特征获取单元801，被配置为执行获取触发媒体流推送请求的目标对象的对象特征；以及
170.第一推送单元802，被配置为执行基于预先生成的各媒体流分类特征与上述对象特征的相似度，从预先存储的各媒体流类别中确定出目标媒体流类别，其中，媒体库中的媒体流被存储为不同的媒体流类别，不同的媒体流类别用不同的上述媒体流分类特征来表示；
171.第二推送单元803，被配置为执行基于上述目标媒体流类别中预先存储的各媒体流特征，确定出与上述目标对象匹配的目标媒体流；
172.第三推送单元804，被配置为执行向上述目标对象推送上述目标媒体流。
173.作为一种实施例，上述各媒体流分类特征基于层级关系存储，上述第一推送单元802具体被配置为执行：
174.逐层基于上述对象特征与各层级节点的媒体流分类特征的相似度，确定与上述目标对象匹配的媒体流分类特征；
175.在匹配出的上述媒体流分类特征为记录媒体流分类特征的最低层级的情况下，从
该媒体流分类特征表示的媒体流类别中，确定出上述目标媒体流类别。
176.作为一种实施例，第一推送单元802还被配置为执行：
177.确定与上述目标对象匹配的媒体流分类特征基于媒体库中媒体流特征，对上述媒体流进行聚类，得到多个媒体流类别；
178.基于具有多个层级关系的数据结构，记录上述多个媒体流类别和媒体流分类特征，
179.其中，上述数据结构中包括多个层级，每个层级包括至少一个层级节点，
180.若上述数据结构中的第n层级的层级节点用于记录媒体流的媒体流特征，则第(n-1)层级节点用于记录第n层级媒体流对应的媒体流类别的媒体流分类特征；若上述数据结构中的第n层级节点用于记录媒体流分类特征，则第(n-1)层级节点记录的媒体流分类特征为第n层级媒体流分类特征的聚合特征，n为大于1的自然数。
181.作为一种实施例，第一推送单元802具体被配置为执行：
182.基于上述对象特征的向量与当前层级的上述媒体流分类特征的向量，确定上述相似度，其中，上述相似度用于表征上述目标对象对各媒体流类别执行目标操作的概率估计信息；
183.基于上述相似度，从当前层级的媒体流分类特征中，确定出与上述目标对象匹配的上述媒体流分类特征。
184.作为一种实施例，第一推送单元802具体被配置为执行：
185.对媒体流库中的上述媒体流特征的向量进行聚类，得到多个媒体流类别。
186.作为一种实施例，第二推送单元803具体被配置为执行：
187.基于目标媒体流类别中各媒体流特征与对象特征，确定上述目标对象与媒体流的相似度；
188.基于目标对象与媒体流的相似度，从上述目标媒体流类别中筛选出上述目标媒体流。
189.作为一种实施例，第二推送单元803具体被配置为执行：
190.从上述目标媒体流类别中，筛选出上述目标对象与媒体流的相似度大于相似度阈值的媒体流。
191.作为一种实施例，特征获取单元801具体被配置为执行：
192.从上述媒体流推送请求中提取上述目标对象的特征信息；或
193.从上述媒体流推送请求中提取上述目标对象的对象标识信息，并利用对象标识信息和对象特征的预设映射关系，获取提取的对象标识信息映射的对象特征。
194.作为一种实施例，特征获取单元801具体被配置为执行从上述媒体流推送请求中提取上述目标对象的对象标识信息，并利用对象标识信息和对象特征的预设映射关系，获取提取的对象标识信息映射的对象特征时，上述预设映射关系是通过如下方式创建的：
195.获取上述目标对象的对象标识信息和上述目标对象的对象特征；
196.将上述对象标识信息和上述对象特征创建为一个匹配关系并存储，得到上述预设映射关系。
197.作为一种实施例，上述对象特征是通过双塔模型的对象塔获得的，上述双塔模型包括对象塔和目标塔，上述媒体流特征和上述媒体流分类特征是通过上述目标塔生成的。
198.如图9所示，本公开提供一种电子设备900，包括处理器901、用于存储上述处理器可执行指令的存储器902；
199.其中，上述处理器被配置为执行上述任意一种媒体流推送方法。
200.在示例性实施例中，还提供了一种包括指令的存储介质，例如包括指令的存储器，上述指令可由上述电子设备的处理器执行以完成上述方法。可选地，存储介质可以是非临时性计算机可读存储介质，例如，上述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
201.本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
202.应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈国章
技术所有人：北京达佳互联信息技术有限公司
我是此专利的发明人

上一篇：电动车辆的空调装置以及电动车辆的空调系统的制作方法
上一篇：盘装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。