本说明书一个或多个实施例涉及计算机软件,尤其涉及一种特征评估方法、装置、电子设备及计算机可读存储介质。
背景技术:
1、在相关技术中,预估模型是指至少根据用户的行为、兴趣和上下文信息,预估与用户适配的相关对象(如商品或者广告)等,进而设备可以向用户推荐该对象。例如,预估模型用于根据用户的行为、兴趣和上下文信息,以及商品或者广告的一些属性特征,计算出用户对相关对象(如商品、广告等)会点击的概率,或者收藏、购买等转化行为的概率,进而设备可以根据计算出的概率向用户推荐该对象。
2、优化预估模型的其中一种方式是在模型中引入新的特征。通过引入新的特征,可以更准确地描述用户和对象之间的关系,从而提升模型的预估效果。在引入新的特征的过程中,有必要对特征进行评估,以实现特征的合理选择。
技术实现思路
1、有鉴于此,本说明书一个或多个实施例提供一种特征评估方法、装置、电子设备及计算机可读存储介质。
2、为实现上述目的,本说明书一个或多个实施例提供技术方案如下:
3、根据本说明书一个或多个实施例的第一方面,提出了一种特征评估方法,包括:
4、获取输入至预估模型的与目标用户对应的历史特征、以及所述目标用户针对所述预估模型基于所述历史特征为所述目标用户预估的目标对象的反馈结果;
5、从用户行为数据库中获取所述目标用户在目标时刻之前产生的用户行为数据,并基于获取到的用户行为数据构建与所述目标用户相关的多个候选用户特征;其中,所述目标时刻为所述预估模型基于所述历史特征为所述目标用户预估目标对象的时刻;
6、根据所述历史特征、所述反馈结果以及所述多个候选用户特征构建训练样本;
7、基于所述训练样本对所述预估模型进行优化训练,并基于所述优化训练的训练结果对所述多个候选用户特征进行特征评估,以及基于特征评估的结果从所述多个候选用户特征中确定用于所述预估模型的用户特征。
8、可选的,还包括:
9、将从所述多个候选用户特征中确定出的用于所述预估模型的用户特征,发布至与所述预估模型对应的在线特征库。
10、可选的,所述从用户行为数据库中获取所述目标用户在目标时刻之前产生的用户行为数据,并基于获取到的用户行为数据构建与所述目标用户相关的多个候选用户特征,包括:
11、获取基于结构化查询语言构建的查询语句;所述查询语言包括用户自定义函数标识和输入参数,所述输入参数包括所述目标用户的用户标识和所述目标时刻;
12、向所述用户行为数据库提交所述查询语句,以使得所述用户行为数据库执行所述查询语句中的所述用户自定义函数标识指示的用户自定义函数,根据所述输入参数读取所述目标用户在目标时刻之前产生的用户行为数据,并基于读取到的用户行为数据构建与所述目标用户相关的多个候选用户特征,以及输出所述与所述目标用户相关的多个候选用户特征。
13、可选的,所述用户行为数据库包括在线数据库。
14、可选的,所述用户行为数据包括在所述目标时刻之前的预设时长内,所述目标用户在客户端中进行的操作行为以及操作对象。
15、可选的,目标用户在客户端中的所有操作行为以及操作对象记录在所述目标用户的用户日志中;
16、在所述从用户行为数据库中获取所述目标用户在目标时刻之前产生的用户行为数据之前,还包括:
17、获取候选用户特征的配置信息;所述候选用户特征的配置信息指示了构建所述候选用户特征所需的用户行为数据;
18、基于候选用户特征的配置信息,从所述目标用户的用户日志中获取用户行为数据,并将获取到的所述用户行为数据存储在所述用户行为数据库中。
19、可选的,所述获取输入所述预估模型的目标用户的历史特征、以及所述目标用户针对所述预估模型基于所述历史特征为所述用户预估的目标对象的反馈结果,包括:
20、从所述预估模型的模型日志中获取输入所述预估模型的目标用户的历史特征、以及所述目标用户针对所述预估模型基于所述历史特征为所述用户预估的目标对象的反馈结果;或者,
21、从所述预估模型的模型日志中获取输入所述预估模型的目标用户的历史特征,以及从所述目标用户的用户日志中获取所述目标用户针对所述预估模型基于所述历史特征为所述用户预估的目标对象的反馈结果;其中,所述目标用户的用户日志记录了目标用户在客户端中的所有操作行为以及操作对象。
22、可选的,所述根据所述历史特征、所述反馈结果以及所述多个候选用户特征构建训练样本,包括:
23、将所述多个候选用户特征中的各个候选用户特征进行组合,得到至少一种组合结果;
24、基于每种组合结果、所述历史特征以及所述反馈结果构建与每种组合结果对应的训练样本;
25、所述基于所述训练样本对所述预估模型进行优化训练,包括:
26、将每种组合结果对应的训练样本输入至待训练的预估模型中,以由所述预估模型基于所述组合结果和历史特征生成预测结果,以最小化所述预测结果和所述反馈结果之间的误差为优化目标,对所述预估模型进行训练,得到每种组合结果对应的优化后的预估模型。
27、可选的,所述基于所述优化训练的训练结果对所述多个候选用户特征进行特征评估,包括:
28、计算每种组合结果对应的优化后的预估模型的与优化目标相关的性能指标;
29、根据各个优化后的预估模型的所述与优化目标相关的性能指标,对所述优化后的预估模型对应的组合结果中的候选用户特征进行评估。
30、可选的,所述预估模型包括广告预估模型,所述广告预估模型用于预估用户对待推荐的广告的点击率和/或转化率。
31、根据本说明书一个或多个实施例的第二方面,提出了一种特征评估装置,包括:
32、第一获取模块,用于获取输入至预估模型的与目标用户对应的历史特征、以及所述目标用户针对所述预估模型基于所述历史特征为所述目标用户预估的目标对象的反馈结果;
33、第二获取模块,应用于从用户行为数据库中获取所述目标用户在目标时刻之前产生的用户行为数据,并基于获取到的用户行为数据构建与所述目标用户相关的多个候选用户特征;其中,所述目标时刻为所述预估模型基于所述历史特征为所述目标用户预估目标对象的时刻;
34、训练样本构建模块,用于根据所述历史特征、所述反馈结果以及所述多个候选用户构建训练样本;
35、特征评估模块,用于基于所述训练样本对所述预估模型进行优化训练,并基于所述优化训练的训练结果对所述多个候选用户特征进行特征评估,以及基于所述特征评估的结果从所述多个候选用户特征中确定用于所述预估模型的用户特征。
36、根据本公开实施例的第三方面,提供一种电子设备,包括:
37、处理器;
38、用于存储处理器可执行指令的存储器;
39、其中,所述处理器执行所述可执行指令时,用于实现第一方面所述的方法。
40、根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。
41、本公开的实施例提供的技术方案可以包括以下有益效果:
42、本公开实施例中,由于在预估模型中引入新的候选用户特征进行特征评估时,可以基于用户行为数据库中的用户行为数据来实时的构建候选用户特征,而不再需要将引入的多个候选用户特征事先发布至在线特征库,因此可以避免事先将引入的多个候选用户特征发布至与预估模型对应的在线特征库,而针对部署预估模型的线上系统造成干扰,导致给线上系统带来资源不足的问题,从而有利于提升预估模型的性能。
43、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。