媒介信息处理方法、装置、电子设备及存储介质与流程

文档序号：31135046发布日期：2022-08-13 10:46阅读：87来源：国知局

1.本公开涉及数据处理技术领域，尤其涉及媒介信息处理方法、装置、电子设备、存储介质及计算机程序。

背景技术：

2.在媒介信息投放展示之前，需要经过定向、召回和排序等处理操作，以确定出用于投放展示的目标媒介信息。在此过程中，排序阶段是需要根据预设的模型对召回的媒介信息数据流进行排序筛选的过程。其中，排序又可以分为粗排序和精排序两个阶段。
3.目前的媒介信息排序方法中，粗排序阶段包含两个预设的排序模型，两个排序模型会按照不同的维度，分别对召回的媒介信息数据流进行排序，得到对应两个不同维度的媒介信息序列，进而，在每一媒介信息序列中确定出固定数量的候选媒介信息，以使精排序可以在粗排序得到的候选媒介信息中确定出唯一的目标媒介信息，并将目标媒介信息推荐给账户。
4.然而，目前的媒介信息排序方法中，粗排序中的两个排序模型是按照不同的维度排序得到的媒介信息序列。不同的维度对于不同账户的来说重要程度不同，因此，若各账户均按照统一的数量阈值来获取两个媒介信息序列中的候选媒介信息，则造成媒介信息投放不具有针对性，进而导致确定出的目标媒介信息的准确性较低。

技术实现要素：

5.本公开提供一种媒介信息处理方法、装置、电子设备、存储介质及计算机程序，以至少解决相关技术中确定出的目标媒介信息的准确性较低的问题。本公开的技术方案如下：
6.根据本公开实施例的第一方面，提供一种媒介信息处理方法，包括：
7.获取目标账户的账户特征；
8.根据所述账户特征以及预先训练的概率预测模型，得到概率预测结果；所述概率预测结果反映目标排序模型对应的候选媒介信息成为目标媒介信息的概率；
9.根据所述概率预测结果以及预设的媒介数量计算算法，确定各排序模型对应的媒介信息筛选数量；所述各排序模型中包括所述目标排序模型；
10.根据各排序模型对应的媒介信息筛选数量，在各所述排序模型排序后的媒介信息序列中，获取所述候选媒介信息；所述候选媒介信息用于确定所述目标账户对应的目标媒介信息。
11.在一个实施例中，所述获取目标账户的账户特征，包括：
12.获取目标账户的账户画像特征和上下文特征；
13.将所述账户画像特征和所述上下文特征进行特征拼接，得到融合特征，并对所述融合特征进行编码处理，得到编码处理后的账户特征。
14.在一个实施例中，所述根据所述概率预测结果以及预设的媒介数量计算算法，确
定各排序模型对应的媒介信息筛选数量，包括：
15.获取预设的候选媒介信息总数量；
16.将所述候选媒介信息总数量作为约束条件，并根据所述概率预测结果和预设目标规划算法，构建目标函数；所述目标函数中包含各所述排序模型对应的媒介信息筛选参数；
17.通过所述目标函数以及所述约束条件，确定所述目标函数中包含的各所述排序模型对应的媒介信息筛选参数的参数值；所述参数值为各所述排序模型对应的媒介信息筛选数量。
18.在一个实施例中，所述方法还包括：
19.获取目标账户的样本账户特征和训练样本，所述训练样本中包含样本目标媒介信息、以及所述样本目标媒介信息对应的排序模型的模型标记；
20.根据所述样本账户特征和所述训练样本，对初始概率预测模型进行模型训练，得到训练完成的概率预测模型。
21.在一个实施例中，所述获取训练样本，包括：
22.获取媒介信息流；所述媒介信息流中包含多个媒介信息集合；
23.将每一所述媒介信息集合输入排序模型，得到每一所述排序模型对应的候选媒介信息，并对所述候选媒介信息添加模型标记，所述模型标记表征所述候选媒介信息对应的排序模型；
24.根据预设的价值预估模型和所述候选媒介信息，确定各所述候选媒介信息中的样本目标媒介信息，并根据所述样本目标媒介信息以及所述样本目标媒介信息的所述模型标记，确定训练样本。
25.在一个实施例中，所述训练样本包括正样本和负样本；所述根据所述样本目标媒介信息以及所述样本目标媒介信息的所述模型标记，确定训练样本，包括：
26.若所述样本目标媒介信息携带第一模型标记，则将所述样本目标媒介信息确定为正样本数据；
27.若所述样本目标媒介信息携带第二模型标记，则将所述样本目标媒介信息确定为负样本数据。
28.根据本公开实施例的第二方面，提供一种媒介信息处理装置，包括：
29.获取单元，被配置为执行获取目标账户的账户特征；
30.处理单元，被配置为执行根据所述账户特征以及预先训练的概率预测模型，得到概率预测结果；所述概率预测结果反映目标排序模型对应的候选媒介信息成为目标媒介信息的概率；
31.确定单元，被配置为执行根据所述概率预测结果以及预设的媒介数量计算算法，确定各排序模型对应的媒介信息筛选数量；所述各排序模型中包括所述目标排序模型；
32.筛选单元，被配置为执行根据各排序模型对应的媒介信息筛选数量，在各所述排序模型排序后的媒介信息序列中，获取所述媒介信息筛选数量的候选媒介信息；所述候选媒介信息用于确定所述目标账户对应的目标媒介信息。
33.在一个实施例中，所述获取单元包括：
34.获取子单元，被配置为执行获取目标账户的账户画像特征和上下文特征；
35.编码处理单元，被配置为执行将所述账户画像特征和所述上下文特征进行特征拼
接，得到融合特征，并对所述融合特征进行编码处理，得到编码处理后的账户特征。
36.在一个实施例中，所述确定单元包括：
37.获取子单元，被配置为执行获取预设的候选媒介信息总数量；
38.构建子单元，被配置为执行将所述候选媒介信息总数量作为约束条件，并根据所述概率预测结果和预设目标规划算法，构建目标函数；所述目标函数中包含各所述排序模型对应的媒介信息筛选参数；
39.计算单元，被配置为执行通过所述目标函数以及所述约束条件，确定目标函数中包含的各所述排序模型对应的媒介信息筛选参数的参数值；所述参数值为各所述排序模型对应的媒介信息筛选数量。
40.在一个实施例中，所述媒介信息处理装置还包括：
41.样本获取单元，被配置为执行获取目标账户的样本账户特征和训练样本，所述训练样本中包含样本目标媒介信息、以及所述样本目标媒介信息对应的排序模型的模型标记；
42.训练单元，被配置为执行根据所述样本账户特征和所述训练样本，对初始概率预测模型进行模型训练，得到训练完成的概率预测模型。
43.在一个实施例中，所述样本获取单元，包括：
44.数据获取子单元，被配置为执行获取媒介信息流；所述媒介信息流中包含多个媒介信息集合；
45.样本处理子单元，被配置为执行将每一所述媒介信息集合输入排序模型，得到每一所述排序模型对应的候选媒介信息，并对所述候选媒介信息添加模型标记，所述模型标记表征所述候选媒介信息对应的排序模型；
46.训练样本确定子单元，被配置为执行根据预设的价值预估模型和所述候选媒介信息，确定各所述候选媒介信息中的样本目标媒介信息，并根据所述样本目标媒介信息以及所述样本目标媒介信息的所述模型标记，确定训练样本。
47.在一个实施例中，所述训练样本确定子单元，包括：
48.第一确定子单元，被配置为执行若所述样本目标媒介信息携带第一模型标记，则将所述样本目标媒介信息确定为正样本数据；
49.第二确定子单元，被配置为执行若所述样本目标媒介信息携带第二模型标记，则将所述样本目标媒介信息确定为负样本数据。
50.第三方面，提供一种服务器，所述服务器包括：
51.处理器；
52.用于存储所述处理器可执行指令的存储器；
53.其中，所述处理器被配置为执行所述指令，以实现上述第一方面或者第二方面所述的目标对象展示方法。
54.根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行上述第一方面或者第二方面中任一项所述的目标对象展示方法。
55.根据本公开实施例的第五方面，提供一种计算机程序产品，所述指令被电子设备的处理器执行时，使得所述电子设备能够执行上述第一方面或者第二方面中任一项所述的
目标对象展示方法。
56.本公开的实施例提供的技术方案至少带来以下有益效果：
57.计算机设备获取目标账户的账户特征；根据所述账户特征以及预先训练的概率预测模型，得到概率预测结果；所述概率预测结果反映目标排序模型对应的候选媒介信息成为目标媒介信息的概率；根据所述概率预测结果以及预设的媒介数量计算算法，确定各排序模型对应的媒介信息筛选数量；根据各排序模型对应的媒介信息筛选数量，在各所述排序模型排序后的媒介信息序列中，获取所述候选媒介信息；所述候选媒介信息用于确定所述目标账户对应的目标媒介信息。采用本方法，通过目标账户的账户特征以及概率预测模型，进行模型运算，得到用于表征目标对象特征偏好的概率预测结果，然后基于该概率预测结果来确定排序模型的媒介信息筛选数量，使得每次目标媒介信息的确定过程中各排序模型对应的媒介信息筛选数量是根据目标账户的账户特征进行动态变化的，提高了确定目标媒介信息的准确性较低。。
58.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
59.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。
60.图1是根据一示例性实施例示出的一种媒介信息处理方法的流程图。
61.图2是根据一示例性实施例示出的一种获取目标账户的账户特征步骤的流程图。
62.图3是根据一示例性实施例示出的一种确定各排序模型的媒介信息筛选数量流程图。
63.图4是根据一示例性实施例示出的一种概率预测模型训练方法的流程图。
64.图5是根据一示例性实施例示出的一种确定训练样本方法的流程图。
65.图6是根据一示例性实施例示出的一种划分正负样本方法的流程图。
66.图7是根据一示例性实施例示出的一种媒介信息处理装置的框图。
67.图8是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
68.为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。
69.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
70.还需要说明的是，本公开所涉及的账户信息(包括但不限于账户设备信息、账户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等)，均为经账户授权或者经
过各方充分授权的信息和数据。
71.图1是根据一示例性实施例示出的一种媒介信息处理方法的流程图，如图1所示，该媒介信息处理方法可以应用于服务端，具体包括以下步骤。
72.在步骤s110中，获取目标账户的账户特征。
73.在实施中，账户可以通过客户端浏览页面信息，在浏览过程中，账户会触发相应的页面浏览操作，然后，客户端生成对应的浏览请求传输至用于媒介信息推荐的服务端(简称为服务端)，进而，服务端响应于该浏览请求，获取该浏览请求中携带的流量数据。服务端可以在该流量信息中，提取目标账户(即目标账户)的账户特征。其中，流量数据中包含客户端与服务端之间的全部通信数据，例如，浏览请求数据等；流量数据中提取出的账户特征可以反映目标账户(即目标对象)的特征偏好，并且，账户特征可以但不限于包含账户画像特征(user特征)、账户上下文特征(context特征)等，本公开实施例不做限定。
74.在步骤s120中，根据账户特征以及预先训练的概率预测模型，得到概率预测结果。
75.其中，概率预测结果反映目标排序模型对应的候选媒介信息成为目标媒介信息的概率。目标媒介信息的确定过程需要经过定向、召回、粗排和精排四个过程。在粗排阶段，服务端预设两个排序模型，可称为第一排序模型和第二排序模型，这两个排序模型按照不同的维度(也称为特征维度)对媒介信息流中的各媒介信息进行排序，得到两个媒介信息序列。例如，第一排序模型排序的维度为媒介信息的价值高低，因此，第一排序模型又可以称为价值排序模型，第二排序模型排序的维度为媒介信息的转化率高低，因此，第二排序模型又可以称为转化率排序模型，这样，服务端可以分别在两个媒介信息序列中获取候选媒介信息，然后，在精排阶段，在候选媒介信息中确定目标媒介信息，该目标媒介信息用于推荐给目标账户。即，确定出的目标媒介信息可能来自于第一排序模型对应的候选媒介信息，也可能来自于第二排序模型对应的候选媒介信息。
76.在实施中，服务端存储有预先训练的概率预测模型。该概率预测模型的输出结果(即概率预测结果)用于表征目标媒介信息来自于目标排序模型对应的候选媒介信息的概率。可选的，目标排序模型可以是第一排序模型，也可以是第二排序模型，本公开实施例不做限定。
77.具体地，该概率预测模型由当前账户的样本数据进行训练得到，已经学习了当前账户的特征偏好。例如，该概率预测模型以重排阶段的第一排序模型作为目标排序模型，可以输出第一排序模型对应的概率预测结果。进而，在模型应用过程中，服务端将目标账户的账户特征输入至该预先训练好的概率预测模型中，经过该概率预测模型的运算处理，可以确定第一排序模型对应的概率预测结果，该概率预测结果可以表示目标媒介信息来自于第一排序模型对应的候选媒介信息的概率。可选的，本公开实施例中的媒介信息可以为广告等用于传播的信息，本公开实施例不做限定。
78.在步骤s130中，根据概率预测结果以及预设的媒介数量计算算法，确定各排序模型对应的媒介信息筛选数量。
79.在实施中，在得到目标排序模型对应的概率预测结果之后，服务端可以根据该概率预测结果、两个排序模型筛选的候选媒介信息的总量以及预设的媒介数量计算算法，构建媒介数量计算模型(或称为媒介数量的目标函数)。其中，在该媒介数量计算模型中包含各排序模型对应的媒介信息筛选参数，该媒介信息筛选参数的参数值即为媒介信息筛选数
量。进而，服务端可以对该媒介数量计算模型进行求解，得到各排序模型对应的媒介信息筛选数量。
80.在步骤s140中，根据各排序模型对应的媒介信息筛选数量，在各排序模型排序后的媒介信息序列中，获取媒介信息筛选数量的候选媒介信息。
81.其中，候选媒介信息用于确定目标账户对应的目标媒介信息。
82.在实施中，针对每个排序模型，服务端根据该排序模型对应的媒介信息筛选数量，在该排序模型输出的排序后的媒介信息序列中，获取媒介信息筛选数量的候选媒介信息，以进一步地使得服务端可以在候选媒介信息中确定出最终的目标媒介信息，并将该目标媒介信息推送给目标账户。
83.上述媒介信息处理方法中，服务端获取目标账户的账户特征。然后，将账户特征输入至预先训练的概率预测模型中，得到概率预测结果。其中，概率预测结果反映目标排序模型筛选出的媒介信息成为目标媒介信息的概率。然后，服务端根据概率预测结果以及预设的媒介数量计算算法，确定各排序模型对应的媒介信息筛选数量。根据媒介信息筛选数量，在各排序模型排序后的媒介信息序列中，获取候选媒介信息。其中，候选媒介信息用于确定目标账户的目标媒介信息。采用本方法，通过目标账户的账户特征以及概率预测模型，进行模型运算，得到用于表征目标对象特征偏好的概率预测结果，然后基于该概率预测结果来确定排序模型的媒介信息筛选数量，使得每次目标媒介信息的确定过程中各排序模型对应的媒介信息筛选数量是根据目标账户的账户特征进行动态变化的，提高了确定目标媒介信息的准确性较低。
84.在一示例性实施例中，如图2所示，在步骤s110中，具体可以通过以下步骤实现：
85.在步骤s111中，获取目标账户的账户画像特征和上下文特征。
86.在实施中，服务端可以获取与目标账户的客户端之间传输的全部流量数据，然后，服务端可以基于预设的特征提取算法，从该流量数据中提取得到目标账户的画像特征(u8er特征)和上下文特征(context特征)。其中，账户画像特征可以但不限于包括目标账户的年龄、性别、地理位置、点击过的历史媒介信息等。上下文特征是目标账户的客户端携带的特征，上下文特征可以但不限于包括目标账户发送请求的时间、目标账户的移动终端品牌、操作系统、移动终端型号、当前网络状态(例如，是4g、5g，还是wifi等)。
87.在步骤s112中，将账户画像特征和上下文特征进行特征拼接，得到融合特征，并对融合特征进行编码处理，得到编码处理后的账户特征。
88.在实施中，服务端将该账户画像特征和上下文特征输入至概率预测模型中，由概率预测模型对账户画像特征和上下文特征进行处理，即将账户画像特征和上下文特征进行特征拼接，得到拼接后的融合特征。然后，将该拼接后的融合特征传输至概率预测模型中的embedding层(也称为嵌入层)，由embedding层对融合特征进行编码处理，得到编码处理后的账户特征。
89.本实施例中，通过对目标账户的流量数据进行特征提取，以及特征拼接，得到用于模型处理的账户特征，进而，概率预测模型可以对该账户特征进行运算处理，输出概率预测结果。
90.在一示例性实施例中，如图3所示，在步骤s130中，具体可以通过以下步骤实现：
91.在步骤s131中，获取预设的候选媒介信息总数量。
92.在实施中，由于精排阶段对应的媒介信息推荐模型的数据处理量是有限的。因此在服务端中预先存储有对应粗排阶段的候选媒介信息的候选媒介信息总数量，该候选媒介信息总数量可以根据精排阶段对应的媒介信息推荐模型的数据处理能力确定。进而，在进行媒介信息处理过程中，服务端可以获取预设的候选媒介信息总数量(也记为k)以作为数量约束条件。
93.在步骤s132中，将候选媒介信息总数量作为约束条件，并根据概率预测结果和预设目标规划算法，构建目标函数。
94.其中，目标函数中包含各排序模型对应的媒介信息筛选参数。
95.在实施中，由于精排阶段所需的候选媒介信息的数量是固定的，因此，在一种实现方式中，可以将该数量作为候选媒介信息总数量，然后，以候选媒介信息总数量作为粗排阶段各排序模型对应的候选媒介信息数量的约束条件，即，quotaa+quotab＝k。其中，quotaa表示粗排阶段中的第一排序模型对应的媒介信息筛选参数，该媒介信息筛选参数的参数值表征第一排序模型对应的媒介信息筛选数量；quotab表示第二排序模型对应的媒介信息筛选参数，该媒介信息筛选参数的参数值即表征第二排序模型对应的媒介信息筛选数量。
96.在确定出约束条件之后，服务端可以根据概率预测结果和预设的目标规划算法，构建目标函数。其中，目标函数中包含第一排序模型对应的媒介信息筛选参数和第二排序模型对应的媒介信息筛选参数。
97.具体地，概率预测结果反映的是目标排序模型对应的候选媒介信息成为目标媒介信息的概率，可记为p，若目标排序模型为第一排序模型，则p即为第一排序模型对应的候选媒介信息成为目标媒介信息的概率。因此，第一排序模型对应的媒介信息筛选数量可以表示为quotaa＝k*p,其中，k表示候选媒介信息总数量，第二排序模型对应的媒介信息筛选数量可以表示为k-k*p。进而，服务端以第一排序模型对应的媒介信息筛选参数、第二排序模型对应的媒介信息筛选参数以及预设的目标规划算法，构建目标函数。其中，目标规划算法可以有多种，本公开实施例以目标规划算法为拉格朗日算法为例进行说明，其他算法与之类似，不再赘述。
98.目标函数包括第一排序模型对应的媒介信息筛选参数，以及该媒介信息筛选参数对应的指数系数α、第二排序模型对应的媒介信息筛选参数以及该媒介信息筛选参数对应的指数系数为β。其中，指数系数α和指数系数β为已知量，例如，服务端可以通过执行：max\\\sum_i^n{quotaa}^{\alpha}+{quotab}^{\beta}\newline st\newline的程序，来实现对目标函数的构建。
99.在步骤s133中，通过目标函数以及约束条件，确定目标函数中包含的各排序模型对应的媒介信息筛选参数的参数值。
100.其中，媒介信息筛选参数的参数值即表征各排序模型对应的媒介信息筛选数量。
101.在实施中，服务端在约束条件的约束下，进行该目标函数的求解计算。其中，目标函数的解即为第一排序模型对应的媒介信息筛选参数的参数值(即媒介信息筛选数量)和第二排序模型对应的媒介信息筛选参数的参数值(即媒介信息筛选数量)。
102.在本实施例中，通过目标对象的账户特征，得到表征账户特征偏好的目标排序模型的概率预测结果，然后，基于该概率预测结果、预设的目标规划算法以及各排序模型对应的媒介信息筛选数量，构建目标函数。通过求解目标函数，来实现对目标账户的候选媒介信
息筛选数量确定，提高了确定候选媒介信息的准确性，进而，提高了确定目标媒介信息的准确性。
103.在一示例性实施例中，如图4所示，本公开实施例还公开一种概率预测模型的训练方法，该方法还包括：
104.在步骤s410中，获取账户特征和训练样本。
105.其中，训练样本中包含样本目标媒介信息、以及样本目标媒介信息对应的模型标记。
106.在实施中，服务端中预先存储有该目标账户对应的账户特征以及训练样本。其中，训练样本可以由样本目标媒介信息组成，该样本目标媒介信息可以是在目标账户的历史媒介信息处理过程中确定出的。其中，为了表明最终确定出的样本目标媒介信息的来源，服务端可以在粗排阶段为不同排序模型的媒介信息序列中确定的候选媒介信息添加对应的模型标记，这样，以使精排阶段，在各候选媒介信息中确定出的样本目标媒介信息也携带对应的模型标记。
107.具体地，针对目标账户的账户特征，服务端可以获取目标账户的客户端与服务端之间全部的流量数据。然后，在该流量数据中，服务端可以随机抽取部分流量数据，并根据预设的特征提取算法，在这部分流量数据中提取得到账户特征。另外，针对服务端获取目标账户的训练样本的处理过程，本公开实施例后续会详细阐述，在此不再赘述。
108.在步骤s420中，根据账户特征和训练样本，对初始概率预测模型进行模型训练，得到训练完成的概率预测模型。
109.在实施中，服务端中预设有概率预测模型(也可以称为初始概率预测模型)，服务端将账户特征和训练样本输入至该概率预测模型，得到概率预测结果，然后，服务端计算该概率预测结果与有监督式学习的验证组结果(训练样本中包含的各目标媒介信息对应的目标排序模型)之间的损失值，当该概率预测模型的输出结果(即概率预测结果)对应的损失值满足预设的损失条件时，服务端停止对该概率预测模型的训练，得到训练完成的概率预测模型。
110.其中，该概率预测模型可以但不限于为dnn(deep neural networks，深度神经网络)模型，本公开实施例以dnn模型为例进行说明。其中，dnn模型包含输入层、隐藏层和输出层。隐含层还可以包含有多层。本公开实施例不做限定。然后，服务端根据获取到的账户特征和训练样本，对初始概率预测模型进行模型训练，经过初始概率预测模型中的多个隐藏层(例如，[512,128，2]这三个数据处理维度的隐藏层)对账户特征和训练样本的运算处理，以及初始概率预测模型的输出层中的relu激活函数的激活，得到目标排序模型对应的概率预测结果。在得到该概率预测结果之后，服务端根据样本目标媒介信息携带的模型标记所表征的排序模型，对输出结果(即概率预测结果)进行验证，计算该初始概率预测模型的输出结果与真实值(即模型标记所表征的排序模型的类别)的损失函数，然后，基于损失函数(例如，损失函数可以为交叉熵损失函数)的损失值与预设损失阈值的大小关系，服务端可以确定是否对初始概率预测模型进行参数调整。若损失值大于预设损失阈值(即表征损失值不满足预设的损失条件)，则对初始概率预测模型的参数进行调整，然后，继续执行初始概率预测模型计算得到概率预测结果的过程，直至该初始概率预测模型的损失小于等于预设损失阈值(即表征损失值满足预设的损失条件)时，确定该初始概率预测模型训练完成。
[0111]
本实施例中，通过预先构建的训练样本以及提取到的目标账户的样本账户特征，对初始的概率预测模型，进行有监督式的深度神经网络模型的训练，提高了概率预测模型输出结果的准确性和稳定性，以使在模型应用过程中，基于训练后的概率预测模型可以得到稳定的、准确的概率预测结果。
[0112]
在一示例性实施例中，如图5所示，在步骤s410中，获取训练样本步骤的具体实现过程如下：
[0113]
在步骤s411中，获取媒介信息流。
[0114]
其中，媒介信息流中包含多个媒介信息集合。
[0115]
在实施中，服务端在媒介信息数据库中获取历史的媒介信息流，该历史的媒介信息流中可以包含多个媒介信息集合，服务端可以在每一媒介信息集合确定出一个目标媒介信息。
[0116]
在步骤s412中，将每一媒介信息集合输入排序模型，得到每一排序模型对应的候选媒介信息，并对候选媒介信息添加模型标记。
[0117]
其中，模型标记表征候选媒介信息对应的排序模型。
[0118]
在实施中，将每一媒介信息集合经过定向、召回处理后，进入媒介信息的粗排阶段，服务端将定向和召回处理后的媒介信息集合输入粗排阶段的两个排序模型中，两个排序模型分别按照不同的维度，对媒介信息集合中的媒介信息进行排序，得到不同的媒介信息序列。然后，根据不同排序模型对应的媒介信息筛选数量阈值，在这两个媒介信息序列中，得到每一排序模型对应数量的候选媒介信息。另外，服务端还可以分别针对每一候选媒介信息的排序模型来源，为该候选媒介信息添加模型标记。例如，第一排序模型对应模型标记a，第二排序模型对应模型标记b，进而，在第一排序模型排序后的媒介信息序列中，筛选得到的100条媒介信息均添加模型标记a，在第二排序模型排序后的媒介信息序列中，筛选得到的200条媒介信息均添加模型标记b。
[0119]
在步骤s413中，根据预设的价值预估模型和候选媒介信息，确定各候选媒介信息中的样本目标媒介信息，并根据样本目标媒介信息以及样本目标媒介信息的模型标记，确定训练样本。
[0120]
在实施中，服务端得到粗排确定出的候选媒介信息，可以将候选媒介信息输入至价值预估模型，得到样本目标媒介信息。服务器可以进一步获取该样本目标媒介信息携带的模型标记，然后根据样本目标媒介信息以及该样本目标媒介信息携带的模型标记确定为训练样本。
[0121]
本实施例中，服务端根据重排阶段的排序模型得到候选媒介信息，然后，对候选媒介信息添加模型标记，进一步在候选媒介信息中确定出的样本目标媒介信息就携带模型标记，该模型标记用于表征样本目标媒介信息来自于哪一排序模型对应的候选媒介信息，因此，由该样本目标媒介信息构建的训练样本，实现了样本目标媒介信息的标记，可以用于完成有监督式模型训练。
[0122]
在一示例性实施例中，如图6所示，训练样本包括正样本和负样本。步骤s413的具体处理过程包括：
[0123]
在步骤s610中，若样本目标媒介信息携带第一模型标记，则将样本目标媒介信息确定为正样本数据。
[0124]
在实施中，若样本目标媒介信息携带第一模型标记，则服务端将该样本目标媒介信息划归为正样本数据，然后，基于多个媒介信息集合中确定出的划归为正样本数据的样本目标媒介信息，组成正样本。
[0125]
在步骤s620中，若样本目标媒介信息携带第二模型标记，则将样本目标媒介信息确定为负样本数据。
[0126]
在实施中，若样本目标媒介信息携带第二模型标记，则服务端将该样本目标媒介信息划归为负样本数据，然后，基于多个媒介信息集合中确定出的划归为负样本数据的样本目标媒介信息，组成负样本。
[0127]
本实施例中，通过训练样本中样本目标媒介信息携带的模型标记，对训练样本进行划分，得到包含第一模型标记的样本目标媒介信息的正样本和包含第二模型标记的样本目标媒介信息的负样本，实现了有监督式神经网络模型的训练样本的构建。
[0128]
应该理解的是，虽然图1-图6的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-图6中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0129]
可以理解的是，本说明书中上述方法的各个实施例之间相同/相似的部分可互相参见，每个实施例重点说明的是与其他实施例的不同之处，相关之处参见其他方法实施例的说明即可。
[0130]
图7是根据一示例性实施例示出的一种媒介信息处理装置框图。参照图，该装置700包括获取单元702，处理单元704、确定单元706和筛选单元708。
[0131]
获取单元702，被配置为执行获取目标账户的账户特征；
[0132]
处理单元704，被配置为执行根据所述账户特征以及预先训练的概率预测模型，得到概率预测结果；所述概率预测结果反映目标排序模型对应的候选媒介信息成为目标媒介信息的概率；
[0133]
确定单元706，被配置为执行根据所述概率预测结果以及预设的媒介数量计算算法，确定各排序模型对应的媒介信息筛选数量；
[0134]
筛选单元708，被配置为执行根据各排序模型对应的媒介信息筛选数量，在各所述排序模型排序后的媒介信息序列中，获取所述媒介信息筛选数量的候选媒介信息；所述候选媒介信息用于确定所述目标账户对应的目标媒介信息。
[0135]
本实施例中，采用该媒介信息处理装置，通过目标账户的账户特征以及概率预测模型，进行模型运算，得到用于表征目标对象特征偏好的概率预测结果，然后基于该概率预测结果来确定排序模型的媒介信息筛选数量，使得每次目标媒介信息的确定过程中各排序模型对应的媒介信息筛选数量是根据目标账户的账户特征进行动态变化的，提高了确定目标媒介信息的准确性较低。
[0136]
在一示例性实施例中，所述获取单元702包括：
[0137]
获取子单元，被配置为执行获取目标账户的账户画像特征和上下文特征；
[0138]
编码处理单元，被配置为执行将所述账户画像特征和所述上下文特征进行特征拼接，得到融合特征，并对所述融合特征进行编码处理，得到编码处理后的账户特征。
[0139]
在一示例性实施例中，所述确定单元706包括：
[0140]
获取子单元，被配置为执行获取预设的候选媒介信息总数量；
[0141]
构建子单元，被配置为执行将所述候选媒介信息总数量作为约束条件，并根据所述概率预测结果和预设目标规划算法，构建目标函数；所述目标函数中包含各所述排序模型对应的媒介信息筛选参数；
[0142]
计算单元，被配置为执行通过所述目标函数以及所述约束条件，确定目标函数中包含的各所述排序模型对应的媒介信息筛选参数的参数值；所述参数值为各所述排序模型对应的媒介信息筛选数量。
[0143]
在一示例性实施例中，所述媒介信息处理装置700还包括：
[0144]
样本获取单元，被配置为执行获取目标账户的样本账户特征和训练样本，所述训练样本中包含样本目标媒介信息、以及所述样本目标媒介信息对应的排序模型的模型标记；
[0145]
训练单元，被配置为执行根据所述样本账户特征和所述训练样本，对初始概率预测模型进行模型训练，得到训练完成的概率预测模型。
[0146]
在一示例性实施例中，所述样本获取单元，包括：
[0147]
数据获取子单元，被配置为执行获取媒介信息流；所述媒介信息流中包含多个媒介信息集合；
[0148]
样本处理子单元，被配置为执行将每一所述媒介信息集合输入排序模型，得到每一所述排序模型对应的候选媒介信息，并对所述候选媒介信息添加模型标记，所述模型标记表征所述候选媒介信息对应的排序模型；
[0149]
训练样本确定子单元，被配置为执行根据预设的价值预估模型和所述候选媒介信息，确定各所述候选媒介信息中的样本目标媒介信息，并根据所述样本目标媒介信息以及所述样本目标媒介信息的所述模型标记，确定训练样本。
[0150]
在一示例性实施例中，所述训练样本确定子单元，包括：
[0151]
第一确定子单元，被配置为执行若所述样本目标媒介信息携带第一模型标记，则将所述样本目标媒介信息确定为正样本数据；
[0152]
第二确定子单元，被配置为执行若所述样本目标媒介信息携带第二模型标记，则将所述样本目标媒介信息确定为负样本数据。
[0153]
关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0154]
在示例性实施例中，还提供一种计算机程序产品，所述计算机程序产品中包括指令，上述指令可由电子设备800的处理器820执行以完成上述方法。
[0155]
图8是根据一示例性实施例示出的一种用于媒介信息处理的电子设备800的框图。例如，电子设备800可以为服务器。参照图8，电子设备800包括处理组件820，其进一步包括一个或多个处理器，以及由存储器822所代表的存储器资源，用于存储可由处理组件820的执行的指令，例如应用程序。存储器822中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件820被配置为执行指令，以执行上述方法。
[0156]
电子设备800还可以包括：电源组件824被配置为执行电子设备800的电源管理，有线或无线网络接口826被配置为将电子设备800连接到网络，和输入输出(i/o)接口828。电子设备800可以操作基于存储在存储器822的操作系统，例如window8 8erver，mac o8 x，unix，linux，freeb8d或类似。
[0157]
在示例性实施例中，还提供了一种包括指令的计算机可读存储介质，例如包括指令的存储器822，上述指令可由电子设备800的处理器执行以完成上述方法。存储介质可以是计算机可读存储介质，例如，所述计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0158]
在示例性实施例中，还提供一种计算机程序产品，所述计算机程序产品中包括指令，上述指令可由电子设备800的处理器执行以完成上述方法。
[0159]
需要说明的，上述的装置、电子设备、计算机可读存储介质、计算机程序产品等根据方法实施例的描述还可以包括其他的实施方式，具体的实现方式可以参照相关方法实施例的描述，在此不作一一赘述。
[0160]
本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。
[0161]
应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：肖严
技术所有人：北京达佳互联信息技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。