对象识别方法、装置、电子设备及存储介质与流程

文档序号:35998156发布日期:2023-11-16 10:31阅读:31来源:国知局
对象识别方法、装置、电子设备及存储介质与流程

本技术涉及计算机,公开了一种对象识别方法、装置、电子设备及存储介质。


背景技术:

1、在产品运营过程中,为了提高产品的推广效益,通常需要识别出对产品感兴趣的对象作为推广对象,并针对各推广对象进行产品宣传。

2、目前,推广对象的识别方法主要分为两类:

3、一、基于预设数据规则识别推广对象。

4、具体的,可以基于经验设置识别推广对象的数据规则,并利用设置的数据规则,从海量对象中识别出对推广产品感兴趣的推广对象。然而,基于经验设置的数据规则,不仅设置的数量有限,而且还无法捕捉各数据规则间相互关联的高维特征信息,最重要的是,还无法确定每个数据规则的最优参数,从而导致无法准确的识别出推广对象,进而降低了推广效益。

5、例如,基于手机购买的业务经验,设置“年纪为20-30岁、消费水平为高”为数据规则,基于该数据规则,将“年纪为20-30岁、消费水平为高”的对象,识别为购买新手机的推广对象。然而,对于喜欢玩游戏的对象来说,对手机的配置要求较高,往往也是购买新手机的推广对象,并且,随着手机的普及,十几岁的中学生也可以使用手机,手机的最广对象逐渐低龄化,因此,上述设置的数据规则,无法准确的识别出购买新手机的推广对象。

6、二、基于非深度学习的数据挖掘方法识别推广对象。

7、具体的,可以基于非深度学习算法构建识别模型,并利用识别模型,预测当前对象属于不同标签的概率,并根据预测概率,识别出推广对象。然而,在实际应用过程中,待识别对象的特征较为复杂,传统的特征表征方法和非深度学习模型难以表征,一旦特征表征不准确,将会直接影响推广对象识别的准确率。

8、有鉴于此,需要设计一种新的用于推广产品的对象识别模型,以克服上述缺陷。


技术实现思路

1、本技术实施例提供了一种对象识别方法、装置、电子设备及存储介质,用于提高识别对推广产品感兴趣的对象的准确性。

2、一方面,本技术实施例提供了一种对象识别方法,包括:

3、获取训练样本集合,其中,所述训练样本集合包含初始标注对象子集和未标注对象子集,每个初始标注对象设置有表征是否对推广产品感兴趣的标签;

4、基于所述训练样本集合中每个对象在设定历史时间范围内关联的属性特征和业务特征,分别获得相应对象的原始推广特征;

5、基于各个对象的原始推广特征,为各未标注对象标注标签,并基于标注好的各未标注对象和所述初始标注对象子集,获得目标标注对象集;

6、基于各目标标注对象的原始推广特征,以及随机生成的表征所述各目标标注对象分布的整体潜在表示,对待训练的对象识别模型进行至少一次迭代训练,得到用于挖掘对推广产品感兴趣对象的目标对象识别模型。

7、另一方面,本技术实施例提供一种对象识别装置,包括:

8、样本获取模块,用于获取训练样本集合,所述训练样本集合包含初始标注对象子集和未标注对象子集,其中,每个初始标注对象设置有表征是否对推广产品感兴趣的标签;

9、特征提取模块,用于基于所述训练样本集合中每个对象在设定历史时间范围内关联的属性特征和业务特征,分别获得相应对象的原始推广特征;

10、标注模块,用于基于各个对象的原始推广特征,为各未标注对象标注标签,并基于标注好的各未标注对象和所述初始标注对象子集,获得目标标注对象集;

11、训练模块,用于基于各目标标注对象的原始推广特征,以及随机生成的表征所述各目标标注对象分布的整体潜在表示,对待训练的对象识别模型进行至少一次迭代训练,得到用于挖掘对推广产品感兴趣对象的目标对象识别模型。

12、可选的,所述特征提取模块具体用于:

13、针对所述训练样本集合中的每个对象,执行以下操作:

14、获取所述对象在设定历史时间范围内的非隐私行为数据,并基于所述非隐私行为数据,确定所述对象关联的属性特征;

15、获取所述对象在设定历史时间范围内对推广产品产生的业务类型,并基于所述业务类型,确定所述对象关联的业务特征;

16、对所述对象关联的属性特征和业务特征进行预处理,得到所述对象的原始推广特征。

17、可选的,所述标注模块具体用于:

18、隐藏所述初始标注对象子集中部分初始标注对象的标签,并基于标签隐藏后的部分初始标注对象,初始化所述初始标注对象子集和所述未标注对象子集;

19、基于初始化后各初始标注对象和各未标注对象的原始推广特征,训练第一分类器,并基于所述第一分类器,为所述各未标注对象标注标签;

20、基于所述各未标注对象的标签,确定所述未标注对象子集包含的可靠负例对象子集和可靠正例对象子集;

21、基于可靠负例对象子集、可靠正例对象子集和所述初始标注对象子集,获得所述目标标注对象集。

22、可选的,所述标注模块具体用于:

23、针对所述未标注对象子集中的每个未标注对象,执行以下操作:

24、基于所述第一分类器,确定所述未标注对象为对推广产品感兴趣的正例对象的第一后验概率;

25、当所述第一后验概率小于概率阈值时,为所述未标注对象标记对推广产品不感兴趣的负例对象的标签,其中,所述概率阈值是基于标签隐藏后的所述部分初始标注对象中属于正例对象的参考后验概率确定的。

26、可选的,所述标注模块具体用于:

27、将各可靠负例对象、各可靠正例对象和各初始标注对象的原始推广特征,输入至所述第一分类器,通过至少一轮迭代使所述未标注对象子集为空,得到目标标注对象集,其中,每一轮迭代执行以下操作:

28、隐藏所述各可靠正例对象的标签,将所述可靠正例对象子集作为新的未标注对象子集;

29、基于所述各可靠负例对象和所述各初始标注对象的原始推广特征,重新训练第一分类器,基于重新训练后的第一分类器,确定各未标注对象所属对象类别的第二后验概率,并基于各第二后验概率,为相应的未标注对象标注标签;

30、基于所述各未标注对象的第二后验概率和标签,更新所述可靠负例对象子集、所述可靠正例对象子集以及所述未标注对象子集。

31、可选的,所述标注模块具体用于:

32、对所述各第二后验概率进行排序,按照所述各未标注对象标注的标签,将前f个未标注对象存入所述可靠负例对象子集或所述可靠正例对象子集中,其中,f为大于等于1的整数;

33、从所述未标注对象子集中剔除前f个未标注对象。

34、可选的,所述训练模块针对每一次迭代训练,执行以下具体操作:

35、基于各原始推广特征和所述整体潜在表示,通过多次特征映射,分别获得相应目标对象的第一潜在表示、重构推广特征、第二潜在表示和相似推广特征;

36、对各原始推广特征、各第一潜在表示、各重构推广特征、各第二潜在表示和各相似推广特征进行多次对抗学习,得到所述各目标标注对象的目标概率分布;

37、基于所述目标概率分布,确定所述各目标标注对象对推广产品感兴趣的预测概率;

38、基于各特征映射子损失值以及各对抗学习子损失值,确定目标损失值,并基于所述目标损失值,调整所述待训练的对象识别模型的参数。

39、可选的,所述训练模块具体用于:

40、对所述各目标标注对象的原始推广特征进行特征映射,获得相应目标标注对象的第一潜在表示,并对各第一潜在表示进行特征映射,获得相应目标标注对象的重构推广特征;

41、对随机生成的整体潜在表示进行采样,获得相应目标标注对象的第二潜在表示,并对各第二潜在表示进行特征映射,生成相应目标标注对象的相似推广特征。

42、可选的,所述训练模块具体用于:

43、对所述各原始推广特征、所述各第一潜在表示、所述各第二潜在表示和所述各相似推广特征进行第一对抗学习,获得所述原始推广特征和所述第一潜在表示融合后的第一相似概率分布;

44、对所述各原始推广特征、所述各重构推广特征进行第二对抗学习,获得所述原始推广特征融合后的第二相似概率分布;

45、对所述各第一潜在表示和所述各第二潜在表示进行第三对抗学习,获得所述第一潜在表示的第三相似概率分布;

46、基于所述第一相似概率分布、所述第二相似概率分布和所述第三相似概率分布,确定目标概率分布。

47、可选的,所述训练模块具体用于:

48、将每个目标标注对象的原始推广特征和第一潜在表示进行融合,获得第一融合向量,以及将每个目标标注对象的第二潜在表示和相似推广特征进行融合,获得第二融合向量;

49、对每个目标标注对象的第一融合向量和第二融合向量,进行第一对抗学习;

50、所述对各原始推广特征、各重构推广特征进行第二对抗学习,包括:

51、将每个目标标注对象的原始推广特征和重构推广特征进行融合,获得第三融合向量,以及将每个目标标注对象的原始推广特征进行融合,获得第四融合向量;

52、对每个目标标注对象的第三融合向量和第四融合向量,进行第二对抗学习。

53、可选的,所述特征映射子损失值是根据所述原始推广特征映射为所述第一潜在表示、所述第一潜在表示映射为所述重构推广特征、以及所述第二潜在表示映射为所述相似推广特征联合确定的;

54、可选的,所述训练模块具体用于:

55、分别确定所述第一对抗学习、所述第二对抗学习和所述第三对抗学习的对抗学习子损失值;

56、基于所述各特征映射子损失值中的最小值和所述各对抗学习子损失值中的最大值,确定目标损失值。

57、可选的,所述样本获取模块具体用于:

58、从预设对象数据库中获取没有标签的多个对象,得到未标注对象子集;

59、基于预设规则,从所述预设对象数据库中召回带有标签的多个候选对象,并对各候选对象进行业务逻辑验证,得到候选对象集;

60、获取每个候选对象的异常检测指标数据,并基于各异常检测指标数据的分布状态,从所述候选对象集中剔除异常候选对象,得到初始标注对象子集。

61、可选的,所述属性特征包括对象基础属性、产品基础属性、网络连接属性中的至少一项,其中,

62、所述对象基础属性包括对象性别、对象年龄、对象爱好中的至少一个;

63、所述产品基础属性包括产品名称、产品版本、产品安装的软件管家、软件管家开启的服务功能中的至少一个;

64、所述网络连接属性包括设定历史时间范围内网络连接的次数、网络类型中的至少一个。

65、可选的,所述业务特征包括对推广产品的媒体资源的曝光率、点击率、浏览率和转化率中的至少一项。

66、可选的,所述识别装置还包括识别推荐模块,用于:

67、获取目标推广产品的媒体资源;

68、获取所述目标推广产品所在的投放平台上的待识别对象集,并提取各待识别对象的原始推广特征;

69、采用训练好的目标对象识别模型,基于所述各待识别对象的原始推广特征,确定所述各待识别对象对所述目标推广产品感兴趣的概率;

70、基于所述各待识别对象的概率,识别出所述待识别对象集中的至少一个目标推广对象;

71、将所述媒体资源推送给所述至少一个目标推广对象。

72、另一方面,本技术实施例提供了一种电子设备,包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,实现上述对象识别方法的步骤。

73、另一方面,本技术实施例提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令被计算机设备执行时实现上述对象识别方法的步骤。

74、另一方面,本技术实施例提供一种计算机程序产品,包含计算机程序,所述计算机程序被计算机设备执行时实现上述对象识别方法的步骤。

75、本技术实施例的有益效果如下:

76、本技术实施例提供一种对象识别方法、装置、电子设备及存储介质,通过提取训练样本集合中每个对象在设定历史时间范围内关联的属性特征和业务特征,获得相应对象的原始推广特征,并基于各对象的原始推广特征,为训练样本集合包含的未标注对象子集中的各未标注对象标注标签,丰富了训练样本集合中的初始标注对象子集,解决了由于标注样本数量不足导致的召回率偏低的问题,且减少了样本标注所需的人力物力;基于标注好的各未标注对象以及初始标注对象子集,获得目标标注对象集,由于标注的标签能够表征是否对推广产品感兴趣,这样,利用带有标签的各目标标注对象的原始推广特征,以及随机生成的表征所述各目标标注对象分布的整体潜在表示,对待训练的对象识别模型进行至少一次迭代训练,可以获得用于挖掘对推广产品感兴趣对象的目标对象识别模型。训练过程中,由于整体潜在表示相对于原始推广特征,维度更低、有用信息更多,在对象较多或是否感兴趣的对象比例不平衡的情况下,提高了推广特征的提取质量,从而提高了识别对推广产品感兴趣的对象的准确性。

77、本技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1