点击率预估模型训练方法、点击率预估方法及电子设备与流程

文档序号:32484247发布日期:2022-12-10 00:26阅读:107来源:国知局
点击率预估模型训练方法、点击率预估方法及电子设备与流程

1.本发明涉及深度学习领域,具体涉及一种点击率预估模型训练方法、点击率预估方法及电子设备。


背景技术:

2.随着信息时代的到来,通过广告进行商品销售的模式被广泛应用,其中,对如何预估广告点击率,从而根据用户的特征属性,预测用户点击商品的概率,更好的获得更高的广告点击率,增加商品的曝光度尤为重视。
3.目前,进行广告点击率预估方法主要包括基于深度学习的预估方法。基于深度学习的广告点击率预估方法,主要通过将离散特征转化为连续的特征向量,并将其简单的拼接起来,进行的非结构化特征组合,输入到一个深度神经网络结构中,忽视了各种特征之间的结构特性,导致广告点击率预估精度不高。


技术实现要素:

4.有鉴于此,本发明实施例提供了一种点击率预估模型训练方法,旨在解决现有技术导致广告点击率预估精度不高的问题。
5.根据第一方面,本发明实施例提供了一种点击率预估模型训练方法,包括:
6.获取训练数据集;
7.将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,并对初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征;
8.对目标特征进行识别,输出点击率预估结果,基于点击率预估结果以及预设损失函数,计算损失值,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型。
9.本技术实施例提供的点击率预估模型训练方法,获取训练数据集,将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,保证了生成的初始特征的准确性。然后,对初始特征进行扩展和压缩处理,使得可以基于初始特征生出更丰富的特征,保证了特征的全面性。然后,基于扩展和压缩后的特征,生成目标特征,保证了生成的目标特征的准确性。对目标特征进行识别,输出点击率预估结果,保证了输出的点击率预估结果的准确性。然后,基于点击率预估结果以及预设损失函数,计算损失值,保证了计算得到的损失值的准确性。然后,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型,保证了生成的点击率预估模型的准确性,进而可以保证基于点击率预估模型得到点击率结果的准确性。
10.结合第一方面,在第一方面第一实施方式中,对初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征,包括:
11.使用两种不同线性的方式对初始特征进行扩展和压缩处理,生成备用特征;
12.对备用特征和初始特征进行多次交互迭代处理,生成多个交互特征;
13.基于各个交互特征之间的关系,生成目标特征。
14.本技术实施例提供的点击率预估模型训练方法,使用两种不同线性的方式对初始特征进行扩展和压缩处理,生成备用特征,保证了生成的备用特征的准确性以及多样性。然后,对备用特征和初始特征进行多次交互迭代处理,生成多个交互特征,保证了生成的多个交互特征的准确性。基于各个交互特征之间的关系,生成目标特征,保证了生成的目标特征的准确性,进而可以保证训练得到的点击率预估模型的准确性。
15.结合第一方面第一实施方式,在第一方面第二实施方式中,使用两种不同线性的方式对初始特征进行扩展和压缩处理,生成备用特征,包括:
16.使用内积的线性方式对初始特征进行扩展处理,生成第一候选特征;
17.使用哈达玛乘积的线性方式,对第一候选特征进行压缩处理,生成第二候选特征;
18.对第二候选特征进行分析,生成备用特征。
19.本技术实施例提供的点击率预估模型训练方法,使用内积的线性方式对初始特征进行扩展处理,生成第一候选特征,保证了生成的第一候选特征的准确性以及多样性。使用哈达玛乘积的线性方式,对第一候选特征进行压缩处理,生成第二候选特征,保证了生成的第二候选特征的准确性。对第二候选特征进行分析,生成备用特征,保证了生成的备用特征的准确性。
20.结合第一方面第二实施方式,在第一方面第三实施方式中,对第二候选特征进行分析,生成备用特征,包括:
21.基于初始特征与第一候选特征之间的关系,计算第二候选特征对应的域权重;
22.利用域权重乘以第二候选特征,生成备用特征。
23.本技术实施例提供的点击率预估模型训练方法,基于初始特征与第一候选特征之间的关系,计算第二候选特征对应的域权重,保证了计算得到的第二候选特征对应的域权重的准确性。然后,利用域权重乘以第二候选特征,生成备用特征,保证了生成的备用特征的准确性。
24.结合第一方面第一实施方式,在第一方面第四实施方式中,基于各个交互特征之间的关系,生成目标特征,包括:
25.获取各个交互特征对应的权重信息以及偏值;
26.将各个交互特征乘以对应的权重信息并加上对应的偏值之后,进行融合处理,生成目标特征。
27.本技术实施例提供的点击率预估模型训练方法,获取各个交互特征对应的权重信息以及偏值,然后,将各个交互特征乘以对应的权重信息并加上对应的偏值之后,进行融合处理,生成目标特征,保证了生成的目标特征的准确性。
28.结合第一方面,在第一方面第五实施方式中,对训练数据集进行特征提取,生成初始特征,包括:
29.对训练数据集进行特征提取,利用独热编码将训练数据集中高维稀疏的原始数据压缩为低维稠密的初始特征。
30.本技术实施例提供的点击率预估模型训练方法,对训练数据集进行特征提取,利用独热编码将训练数据集中高维稀疏的原始数据压缩为低维稠密的初始特征,保证了生成的初始特征的准确性。
31.结合第一方面,在第一方面第六实施方式中,获取训练数据集,包括:
32.获取原始数据,原始数据包括用户属性、广告属性、用户的过往历史点击记录、上下文的环境特征以及点击率结果;
33.对原始数据进行识别,并填补原始数据中的空值和异常值,生成候选数据;
34.对候选数据中的文字信息进行编码转化,生成候选数据对应的目标数据;
35.基于目标数据,生成训练数据集。
36.本技术实施例提供的点击率预估模型训练方法,获取原始数据,然后对原始数据进行识别,并填补原始数据中的空值和异常值,生成候选数据,保证了生成的候选数据的准确性。然后,对候选数据中的文字信息进行编码转化,生成候选数据对应的目标数据,保证了生成的目标数据的准确性,然后,基于目标数据,生成训练数据集,保证了生成的训练数据集的准确性。
37.根据第二方面,本发明实施例提供了一种点击率预估方法,包括:
38.获取待预估数据,待预估数据包括用户属性、广告属性、用户的过往历史点击记录以及上下文的环境特征;
39.将待预估数据输入至点击率预估模型,输出待预估数据对应的点击率结果,点击率预估模型根据第一方面或者第一方面的任意一种实施方式中的点击率预估模型训练方法得到。
40.本技术实施例提供的点击率预估方法,获取待预估数据,然后将待预估数据输入至点击率预估模型,输出待预估数据对应的点击率结果,保证了输出的点击率结果的准确性。
41.根据第三方面,本发明实施例提供了一种点击率预估模型训练装置,包括:
42.第一获取模块,用于获取训练数据集;
43.特征提取模块,用于将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,并对初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征;
44.更新模块,用于对目标特征进行识别,输出点击率预估结果,基于点击率预估结果以及预设损失函数,计算损失值,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型。
45.本技术实施例提供的点击率预估模型训练装置,获取训练数据集,将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,保证了生成的初始特征的准确性。然后,对初始特征进行扩展和压缩处理,使得可以基于初始特征生出更丰富的特征,保证了特征的全面性。然后,基于扩展和压缩后的特征,生成目标特征,保证了生成的目标特征的准确性。对目标特征进行识别,输出点击率预估结果,保证了输出的点击率预估结果的准确性。然后,基于点击率预估结果以及预设损失函数,计算损失值,保证了计算得到的损失值的准确性。然后,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型,保证了生成的点击率预估模型的准确性,进而可以保证基于点击率预估模型得到点击率结果的准确性。
46.根据第四方面,本发明实施例提供了一种点击率预估装置,包括:
47.第二获取模块,用于获取待预估数据,待预估数据包括用户属性、广告属性、用户的过往历史点击记录以及上下文的环境特征;
48.输出模块,用于将待预估数据输入至点击率预估模型,输出待预估数据对应的点击率结果,点击率预估模型根据第一方面或者第一方面的任意一种实施方式中的点击率预估模型训练方法得到。
49.本技术实施例提供的点击率预估装置,获取待预估数据,然后将待预估数据输入至点击率预估模型,输出待预估数据对应的点击率结果,保证了输出的点击率结果的准确性。
50.根据第五方面,本发明实施例提供了一种电子设备,包括存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中的点击率预估模型训练方法以及第二方面的任意一种实施方式中的点击率预估方法。
51.根据第六方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储计算机指令,计算机指令用于使计算机执行第一方面或者第一方面的任意一种实施方式中的点击率预估模型训练方法以及第二方面的任意一种实施方式中的点击率预估方法。
附图说明
52.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
53.图1是应用本发明实施例提供的点击率预估模型训练方法的流程图;
54.图2是应用本发明另一实施例提供的点击率预估模型训练方法的流程图;
55.图3是应用本发明另一实施例提供的特征嵌入网络的结构示意图;
56.图4是应用本发明另一实施例提供的双线性特征交互注意力网络的结构示意图;
57.图5是应用本发明另一实施例提供的初始点击率预估网络的结构示意图;
58.图6是应用本发明另一实施例提供的点击率预估模型训练方法的流程图;
59.图7是应用本发明另一实施例提供的点击率预估方法的流程图;
60.图8是应用本发明另一实施例提供的对比结果所示图;
61.图9是应用本发明实施例提供的点击率预估模型训练装置的功能模块图;
62.图10是应用本发明实施例提供的点击率预估装置的功能模块图;
63.图11是应用本发明实施例提供的电子设备的硬件结构示意图。
具体实施方式
64.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
65.需要说明的是,本技术实施例提供的点击率预估模型训练方法,其执行主体可以是点击率预估模型训练装置,该点击率预估模型训练装置可以通过软件、硬件或者软硬件
结合的方式实现成为计算机设备的部分或者全部,其中,该计算机设备可以是服务器或者终端,其中,本技术实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本技术实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备以及智能机器人等其他智能硬件设备。下述方法实施例中,均以执行主体是电子设备为例来进行说明。
66.在本技术一个实施例中,如图1所示,提供了一种点击率预估模型训练方法,以该方法应用于电子设备为例进行说明,包括以下步骤:
67.s11、获取训练数据集。
68.其中,训练数据集中包括用于训练的数据以及训练数据对应的真实的点击率结果,其中,用于训练的数据中可以包括用户属性、广告属性、用户的过往历史点击记录、上下文的环境特征等数据。
69.在一种可选的实施方式中,电子设备可以接收用户输入的训练数据集,也可以接收其他设备发送的训练数据集。
70.在另一种可选的实施方式中,电子设备还可以获取原始数据,对原始数据进行数据预处理,生成训练数据集。
71.关于该步骤将在下文进行详细介绍。
72.s12、将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,并对初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征。
73.具体地,电子设备在获取到训练数据集之后,可以将训练数据集输入至初始点击率预估网络中,然后初始点击率预估网络中的特征提取网络对训练数据集进行特征提取,生成初始特征。然后,初始点击率预估网络对生成的初始特征先进行扩展处理,使得生成更加丰富的特征。为了保证生成的特征的准确性,电子设备对扩展后的特征进行压缩处理。然后,基于扩展和压缩后的特征,生成目标特征。
74.关于该步骤将在下文进行详细介绍。
75.s13、对目标特征进行识别,输出点击率预估结果,基于点击率预估结果以及预设损失函数,计算损失值,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型。
76.具体地,电子设备在基于初始点击率预估网络生成目标特征之后,初始点击率预估网络对目标特征进行识别,输出点击率预估结果。然后,初始点击率预估网络基于预设损失函数计算点击率预估结果和真实的点击率结果之间的损失值。然后基于计算得到的损失值对初始点击率预估网络进行更新,生成点击率预估模型。
77.示例性的,在本技术一种可选的实施方式中,电子设备可以采用交叉熵损失函数作为点击率预估模型的目标函数,如公式(1)所示:
[0078][0079]
其中n表示训练样本的数量;yi表示第i个训练实例的真实的点击率结果;表示第i个训练实例的点击率预估结果。
[0080]
本技术实施例提供的点击率预估模型训练方法,获取训练数据集,将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,保证了生成的初始特征的准确性。然后,对初始特征进行扩展和压缩处理,使得可以基于初始特征生出更丰富的特征,保证了特征的全面性。然后,基于扩展和压缩后的特征,生成目标特征,保证了生成的目标特征的准确性。对目标特征进行识别,输出点击率预估结果,保证了输出的点击率预估结果的准确性。然后,基于点击率预估结果以及预设损失函数,计算损失值,保证了计算得到的损失值的准确性。然后,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型,保证了生成的点击率预估模型的准确性,进而可以保证基于点击率预估模型得到点击率结果的准确性。
[0081]
在本技术一个实施例中,如图2所示,提供了一种点击率预估模型训练方法,以该方法应用于电子设备为例进行说明,包括以下步骤:
[0082]
s21、获取训练数据集。
[0083]
关于该步骤请参加图1对s11的介绍。
[0084]
s22、将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,并对初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征。
[0085]
在本技术一种可选的实施方式中,上述s22中的“对训练数据集进行特征提取,生成初始特征”,可以包括如下步骤:
[0086]
s221、对训练数据集进行特征提取,利用独热编码将训练数据集中高维稀疏的原始数据压缩为低维稠密的初始特征。
[0087]
在本技术一种可选的实施例中,初始点击率预估网络中的特征提取网络可以是特征嵌入网络,也可以是其他特征提取网络。特征提取网络对训练数据集进行特征提取,利用独热编码将训练数据集中高维稀疏的原始数据压缩为低维稠密的初始特征。
[0088]
示例性的,如图3所示,当初始点击率预估网络中的特征提取网络为特征嵌入网络时,特征嵌入网络可以使用独热编码将高维稀疏的原始数据压缩为低维稠密的特征向量,得到嵌入向量e,计算方法如公式(2)和公式(3)所示:
[0089][0090]
其中,xm表示第m个域的输入数据;m表示域的大小;xi表示第i个输入实例。
[0091]ei
=[e1,e2,e3,...,e
p
,...,em]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0092]
其中,ei表示第i个嵌入实例,e
p
∈rd表示第p个域的嵌入向量,d表示嵌入层的维度。
[0093]
在本技术一种可选的实施方式中,上述s22中的“对初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征”,可以包括如下步骤:
[0094]
s222、使用两种不同线性的方式对初始特征进行扩展和压缩处理,生成备用特征。
[0095]
具体地,初始点击率预估网络中可以包括双线性特征交互注意力网络,双线性特征交互注意力网络可以使用两种不同线性的方式对初始特征进行扩展和压缩处理,基于初始特征生出更丰富的备用特征。
[0096]
在本技术一种可选的实施方式中,上述s222“使用两种不同线性的方式对初始特征进行扩展和压缩处理,生成备用特征”,可以包括如下步骤:
[0097]
(1)使用内积的线性方式对初始特征进行扩展处理,生成第一候选特征。
[0098]
(2)使用哈达玛乘积的线性方式,对第一候选特征进行压缩处理,生成第二候选特征。
[0099]
(3)对第二候选特征进行分析,生成备用特征。
[0100]
具体地,初始点击率预估网络中的双线性特征交互注意力网络可以使用内积的线性方式对初始特征进行扩展处理,生成第一候选特征。
[0101]
示例性的,如图4所示,为双线性特征交互注意力网络的结构示意图。双线性特征交互注意力网络可以通过公式(4)使用内积的线性方式对特征进行扩展操作,形成中间结果的第一候选特征。
[0102][0103]
其中,表示扩展后的第一候选特征,δ是一个可调节的参数,表示扩展的维度;表示第n次迭代的输入特征向量,当n=1时,表示第n次迭代的输入特征向量,当n=1时,表示权重矩阵和偏值。
[0104]
电子设备在生成第一候选特征之后,为了保证生成的备用特征的准确性,电子设备需要基于双线性特征交互注意力网络使用哈达玛乘积的线性方式,对第一候选特征进行压缩处理,生成第二候选特征。
[0105]
示例性的,双线性特征交互注意力网络可以通过公式(5)使用哈达玛乘积的线性方式,对第一候选特征进行压缩处理,生成第二候选特征。
[0106][0107]
其中,表示扩展后的第一候选特征;υ,表示第n次迭代的权重矩阵和偏值,γ∈rm×
δd
表示压缩后的第二候选特征。
[0108]
在本技术一种可选的实施方式中,在生成第二候选特征之后,电子设备可以将第二候选特征作为备用特征。
[0109]
在本技术一种可选的实施方式中,上述步骤(3)“对第二候选特征进行分析,生成备用特征”,可以包括如下步骤:
[0110]
(31)基于初始特征与第一候选特征之间的关系,计算第二候选特征对应的域权重;
[0111]
(32)利用域权重乘以第二候选特征,生成备用特征。
[0112]
具体地,双线性特征交互注意力网络中的注意力网络可以基于初始特征与第一候选特征之间的关系,计算第二候选特征对应的域权重。
[0113]
示例性的,注意力网络可以利用如下公式(6)基于初始特征与第一候选特征之间的关系,计算第二候选特征对应的域权重。
[0114]
[0115]
其中,表示第n次迭代的输入特征向量,当n=1时,也就是初始特征;表示扩展后的第一候选特征。
[0116]
在计算得到第二候选特征对应的域权重之后,电子设备可以基于注意力网络利用域权重乘以第二候选特征,生成备用特征。
[0117]
示例性的,电子设备可以基于注意力网络利用公式(7),生成备用特征。
[0118]
c=a

γ
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0119]
其中,c∈rm×d表示备用特征,γ∈rm×
δd
表示压缩后的第二候选特征。

表示哈达玛乘积,如输入向量a=[a1,a2,a3]和b=[b1,b2,b3],计算结果a

b=[a1b1,a2b2,a3b3]。
[0120]
s223、对备用特征和初始特征进行多次交互迭代处理,生成多个交互特征。
[0121]
具体地,电子设备在生成备用特征之后,对备用特征和初始特征进行多次交互迭代处理,生成多个交互特征,其计算方式如下所示。
[0122][0123]
其中,表示第n次迭代的最终输出特征向量;wn和bn表示权重矩阵和偏值;σ表示线性激活函数。
[0124]
s224、基于各个交互特征之间的关系,生成目标特征。
[0125]
在本技术一种可选的实施方式中,上述s224“基于各个交互特征之间的关系,生成目标特征”,可以包括如下步骤:
[0126]
(1)获取各个交互特征对应的权重信息以及偏值。
[0127]
(2)将各个交互特征乘以对应的权重信息并加上对应的偏值之后,进行融合处理,生成目标特征。
[0128]
具体地,初始点击率预估网络中可以包括聚合网络,电子设备在生成多个交互特征之后,聚合网络可以随机生成各个交互特征对应的权重信息以及偏值,然后将各个交互特征乘以对应的权重信息并加上对应的偏值之后,进行融合处理,生成目标特征。
[0129]
然后,初始点击率预估网络对目标特征进行识别,输出点击率预估结果。然后,初始点击率预估网络基于预设损失函数计算点击率预估结果和真实的点击率结果之间的损失值。然后基于计算得到的损失值可以对各个交互特征对应的权重信息以及偏值进行调整,并对初始点击率预估网络进行更新,生成点击率预估模型。
[0130]
示例性的,电子设备将不同迭代阶段得到的交互特征向量输入到聚合网络,进行融合操作,并得到输出结果ω,具体的计算方式如公式(9)所示。
[0131][0132]
其中,σ表示线性激活函数,α和β表示不同尺度中的权重矩阵和偏值;ω∈rm表示聚合网络的目标。
[0133]
对目标特征进行识别,输出点击率预估结果的计算过程如公式(10)所示:
[0134][0135]
其中,ω用于表示聚合网络的目标特征;m表示特征域的数量;sigmoid表示一种非
线性激活函数,ε和η表示不同尺度中的权重矩阵和偏值。
[0136]
s23、对目标特征进行识别,输出点击率预估结果,基于点击率预估结果以及预设损失函数,计算损失值,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型。
[0137]
关于该步骤请参见图2对s13的介绍,在此不进行赘述。
[0138]
为了更好地介绍本技术实施例提供的初始点击率预估网络。示例性的,如图5所示,为初始点击率预估网络的结构示意图。初始点击率预估网络包括特征嵌入网络、双线性特征交互注意力网络以及聚合网络。首先,在特征嵌入网络中,将经过预处理的高维稀疏数据压缩到低维稠密的特征空间,转化为特征向量,加速后续模型的训练优化;然后,通过双线性特征交互注意力网络利用不同线性的扩展和伸缩操作构建精妙的双线性特征交互模块,同时引入注意力机制调节双线性特征的权重,更加细致的学习不同方面的交互特征;最后,融合网络聚合双线性特征交互注意力网络不同阶段的输出结果,转换得到最终的预测结果。
[0139]
在本技术一种可选的实施方式中,训练参数嵌入维度设为16,batch的大小设为1024,迭代次数设为4,伸缩比例设为6,epoch大小设为5,学习率设为0.001。
[0140]
本技术实施例提供的点击率预估模型训练方法,对训练数据集进行特征提取,利用独热编码将训练数据集中高维稀疏的原始数据压缩为低维稠密的初始特征,保证了生成的初始特征的准确性。
[0141]
然后,使用内积的线性方式对初始特征进行扩展处理,生成第一候选特征,保证了生成的第一候选特征的准确性以及多样性。使用哈达玛乘积的线性方式,对第一候选特征进行压缩处理,生成第二候选特征,保证了生成的第二候选特征的准确性。基于初始特征与第一候选特征之间的关系,计算第二候选特征对应的域权重,保证了计算得到的第二候选特征对应的域权重的准确性。然后,利用域权重乘以第二候选特征,生成备用特征,保证了生成的备用特征的准确性以及多样性。
[0142]
然后,对备用特征和初始特征进行多次交互迭代处理,生成多个交互特征,保证了生成的多个交互特征的准确性。获取各个交互特征对应的权重信息以及偏值,然后,将各个交互特征乘以对应的权重信息并加上对应的偏值之后,进行融合处理,生成目标特征,保证了生成的目标特征的准确性,进而可以保证训练得到的点击率预估模型的准确性。
[0143]
在本技术一个实施例中,如图6所示,提供了一种点击率预估模型训练方法,以该方法应用于电子设备为例进行说明,包括以下步骤:
[0144]
s31、获取训练数据集。
[0145]
在本技术一种可选的实施方式中,上述s31“获取训练数据集”,可以包括如下步骤:
[0146]
s311、获取原始数据。
[0147]
其中,原始数据包括用户属性、广告属性、用户的过往历史点击记录、上下文的环境特征以及点击率结果。其中,用户属性可以用户的年龄、性别、点击时间,点击次数,点击设备id等信息,广告属性可以包括广告类型、
[0148]
具体地,电子设备可以从大数据存储系统中获取营销广告对应的用户属性、广告属性、用户的过往历史点击记录、上下文的环境特征以及点击率结果,汇总整理形成用户的
广告点击序列。
[0149]
s312、对原始数据进行识别,并填补原始数据中的空值和异常值,生成候选数据。
[0150]
具体地,电子设备对对原始数据进行识别,并填补原始数据中的空值和异常值,生成候选数据。
[0151]
示例性的,电子设备可以将初步整理的广告点击序列中异常数据,用0值替换,空值用-1填补。
[0152]
s313、对候选数据中的文字信息进行编码转化,生成候选数据对应的目标数据。
[0153]
具体地,电子设备可以将候选数据中描述实例属性的类别特征使用one-hot编码进行0/1映射,方便数据输入模型进行训练,从而生成候选数据对应的目标数据。
[0154]
s314、基于目标数据,生成训练数据集。
[0155]
具体地,电子设备将目标数据随机筛选70%作为训练数据集,剩下的30%按照1:1的比例等分为验证集和测试集。
[0156]
s32、将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,并对初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征。
[0157]
关于该步骤请参见图2对s22的介绍,在此不进行赘述。
[0158]
s33、对目标特征进行识别,输出点击率预估结果,基于点击率预估结果以及预设损失函数,计算损失值,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型。
[0159]
关于该步骤请参见图2对s23的介绍,在此不进行赘述。
[0160]
本技术实施例提供的点击率预估模型训练方法,获取原始数据,然后对原始数据进行识别,并填补原始数据中的空值和异常值,生成候选数据,保证了生成的候选数据的准确性。然后,对候选数据中的文字信息进行编码转化,生成候选数据对应的目标数据,保证了生成的目标数据的准确性,然后,基于目标数据,生成训练数据集,保证了生成的训练数据集的准确性。
[0161]
为了更好地说明本技术实施例提供地点击率预估模型训练方法,本技术实施例提供了一种点击率预估方法。需要说明的是,本技术实施例提供的点击率预估方法,其执行主体可以是点击率预估装置,该点击率预估装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部,其中,该计算机设备可以是服务器或者终端,其中,本技术实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本技术实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备以及智能机器人等其他智能硬件设备。下述方法实施例中,均以执行主体是电子设备为例来进行说明。
[0162]
在本技术一个实施例中,如图7所示,提供了一种点击率预估模型训练方法,以该方法应用于电子设备为例进行说明,包括以下步骤:
[0163]
s41、获取待预估数据。
[0164]
其中,待预估数据包括用户属性、广告属性、用户的过往历史点击记录以及上下文的环境特征。
[0165]
具体地,电子设备可以基于数据采集设备,获取待预估数据,也可以接收其他设备发送的待预估数据或者接收用户输入的待预估数据。
[0166]
本技术实施例获取待预估数据的方式不做具体限定。
[0167]
s42、将待预估数据输入至点击率预估模型,输出待预估数据对应的点击率结果。
[0168]
其中,点击率预估模型根据上述实施方式提供的点击率预估模型训练方法得到。
[0169]
具体地,电子设备在获取到待预估数据之后,可以将待预估数据输入至点击率预估模型,输出待预估数据对应的点击率结果。
[0170]
为了有效的判断本发明所提出的点击率预估方法的卓越性能,采用产业界广泛使用的logloss和auc来评价模型的预测效果,其中logloss值越低、auc的值越高表明模型的性能越优越。在实施例上将本发明提出的方法和其他已有的方法进行了预测性能的对比,如图8所示的对比结果所示,本发明所提出的方法能够比对照方法产生更高的预测性能
[0171]
本技术实施例提供的点击率预估方法,获取待预估数据,然后将待预估数据输入至点击率预估模型,输出待预估数据对应的点击率结果,保证了输出的点击率结果的准确性。
[0172]
应该理解的是,虽然图1、图2、图6以及图7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1、图2、图6以及图7中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0173]
如图9所示,本实施例提供一种点击率预估模型训练装置,包括:
[0174]
第一获取模块51,用于获取训练数据集;
[0175]
特征提取模块52,用于将训练数据集输入至初始点击率预估网络中,对训练数据集进行特征提取,生成初始特征,并对初始特征进行扩展和压缩处理,基于扩展和压缩后的特征,生成目标特征;
[0176]
更新模块53,用于对目标特征进行识别,输出点击率预估结果,基于点击率预估结果以及预设损失函数,计算损失值,基于损失值对初始点击率预估网络进行更新,生成点击率预估模型。
[0177]
在本技术一个实施例中,上述特征提取模块52,具体用于使用两种不同线性的方式对所述初始特征进行扩展和压缩处理,生成备用特征;对所述备用特征和所述初始特征进行多次交互迭代处理,生成多个交互特征;基于各个所述交互特征之间的关系,生成所述目标特征。
[0178]
在本技术一个实施例中,上述特征提取模块52,具体用于使用内积的线性方式对所述初始特征进行扩展处理,生成第一候选特征;使用哈达玛乘积的线性方式,对所述第一候选特征进行压缩处理,生成第二候选特征;对所述第二候选特征进行分析,生成所述备用特征。
[0179]
在本技术一个实施例中,上述特征提取模块52,具体用于基于所述初始特征与所述第一候选特征之间的关系,计算所述第二候选特征对应的域权重;利用所述域权重乘以所述第二候选特征,生成所述备用特征。
[0180]
在本技术一个实施例中,上述特征提取模块52,具体用于获取各个所述交互特征
对应的权重信息以及偏值;将各个所述交互特征乘以对应的权重信息并加上对应的偏值之后,进行融合处理,生成所述目标特征。
[0181]
在本技术一个实施例中,上述特征提取模块52,具体用于对所述训练数据集进行特征提取,利用独热编码将所述训练数据集中高维稀疏的原始数据压缩为低维稠密的所述初始特征。
[0182]
在本技术一个实施例中,上述第一获取模块51,具体用于获取原始数据,所述原始数据包括用户属性、广告属性、用户的过往历史点击记录、上下文的环境特征以及点击率结果;对所述原始数据进行识别,并填补所述原始数据中的空值和异常值,生成候选数据;对所述候选数据中的文字信息进行编码转化,生成所述候选数据对应的目标数据;基于所述目标数据,生成所述训练数据集。
[0183]
如图10所示,本实施例提供一种点击率预估装置,包括:
[0184]
第二获取模块61,用于获取待预估数据,待预估数据包括用户属性、广告属性、用户的过往历史点击记录以及上下文的环境特征;
[0185]
输出模块62,用于将待预估数据输入至点击率预估模型,输出待预估数据对应的点击率结果,点击率预估模型根据第一方面或者第一方面的任意一种实施方式中的点击率预估模型训练方法得到。
[0186]
关于点击率预估模型训练装置以及点击率预估装置的具体限定以及有益效果可以参见上文中对于点击率预估模型训练方法以及点击率预估方法的限定,在此不再赘述。上述点击率预估模型训练装置以及点击率预估装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于电子设备中的处理器中,也可以以软件形式存储于电子设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0187]
本发明实施例还提供一种电子设备,具有上述图9所示的点击率预估模型训练装置以及图10所示的点击率预估装置。
[0188]
如图11所示,图11是本发明可选实施例提供的一种电子设备的结构示意图,如图11所示,该电子设备可以包括:至少一个处理器71,例如cpu(central processing unit,中央处理器),至少一个通信接口73,存储器74,至少一个通信总线72。其中,通信总线72用于实现这些组件之间的连接通信。其中,通信接口73可以包括显示屏(display)、键盘(keyboard),可选通信接口73还可以包括标准的有线接口、无线接口。存储器74可以是高速ram存储器(random access memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器74可选的还可以是至少一个位于远离前述处理器71的存储装置。其中处理器71可以结合图9以及图10所描述的装置,存储器74中存储应用程序,且处理器71调用存储器74中存储的程序代码,以用于执行上述任一方法步骤。
[0189]
其中,通信总线72可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。通信总线72可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0190]
其中,存储器74可以包括易失性存储器(英文:volatile memory),例如随机存取
存储器(英文:random-access memory,缩写:ram);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard disk drive,缩写:hdd)或固态硬盘(英文:solid-state drive,缩写:ssd);存储器74还可以包括上述种类的存储器的组合。
[0191]
其中,处理器71可以是中央处理器(英文:central processing unit,缩写:cpu),网络处理器(英文:network processor,缩写:np)或者cpu和np的组合。
[0192]
其中,处理器71还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:asic),可编程逻辑器件(英文:programmable logic device,缩写:pld)或其组合。上述pld可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:cpld),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:fpga),通用阵列逻辑(英文:generic array logic,缩写:gal)或其任意组合。
[0193]
可选地,存储器74还用于存储程序指令。处理器71可以调用程序指令,实现如本技术图1、图2以及图6实施例中所示的点击率预估模型训练方法以及图7实施例中所示的点击率预估方法。
[0194]
本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的点击率预估模型训练方法以及点击率预估方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)、随机存储记忆体(random access memory,ram)、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固态硬盘(solid-state drive,ssd)等;所述存储介质还可以包括上述种类的存储器的组合。
[0195]
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1