本申请涉及数据处理,尤其涉及一种基于资源类目的数据处理方法、装置、设备及介质。
背景技术:
1、目前,在业务推荐场景中,业务模型可以预测某个业务资源(例如,商品 c1)的关联业务资源(例如,商品 c2),从而确定业务对象(例如,用户u1)所感兴趣的商品,例如,用户u1点击过商品c1,则可以将商品c1所关联的商品c2作为用户u1所感兴趣的商品,并推荐给用户u1。
2、然而,发明人在实践中发现,在进行关联商品推荐的业务场景下,业务模型虽然可以学习到商品(例如,商品 c1)与商品(例如,商品c2)之间的商品关联关系。但是,由于目前,不同业务场景下的商品数量和商品样式繁多,若确保业务模型针对关联商品的预测准确度,就需要将大量商品以及所对应的关联商品作为用于直接输入业务模型的训练样本,以通过大量的训练样本对业务模型进行迭代训练,使得迭代训练后的业务模型可以预测足够多的商品的关联商品,显然,大量的训练样本无疑会在模型训练过程中增加模型训练的工作量。因此,如何在模型训练中,减少训练样本的数据量、以及如何高效且准确地得到一个用于进行确定关联商品的业务模型成为一个待解决的问题。
技术实现思路
1、本申请实施例提供了一种基于资源类目的数据处理方法、装置、设备及介质,可以在模型训练中,减少训练样本的数据量。
2、本申请实施例一方面提供了一种基于资源类目的数据处理方法,方法包括:
3、基于业务对象在业务时间段内所触发的业务资源,确定业务对象的业务行为数据,基于业务行为数据中所携带的业务资源,确定与业务时间段相关联的资源类目;资源类目包括第一资源类目和第二资源类目;
4、在业务对象中,统计与第一资源类目相关联的第一业务对象的第一对象数量,统计与第二资源类目相关联的第二业务对象的第二对象数量,并统计与第一资源类目和第二资源类目均关联的第三业务对象的第三对象数量;
5、基于第一对象数量、第二对象数量和第三对象数量,确定第一资源类目与第二资源类目之间的资源类目相关度;
6、若资源类目相关度指示第二资源类目为第一资源类目的关联类目,则将第一资源类目和第二资源类目作为用于训练初始业务模型的训练样本类目对;
7、将训练样本类目对中的第一资源类目输入初始业务模型,由初始业务模型预测第一资源类目的关联类目,将预测到的第一资源类目的关联类目作为第一资源类目的样本预测关联资源类目;
8、基于样本预测关联资源类目和训练样本类目对中的第二资源类目对初始业务模型进行迭代训练,得到目标业务模型。
9、本申请实施例一方面提供了一种基于资源类目的数据处理装置,装置包括:
10、资源类目处理模块,用于基于业务对象在业务时间段内所触发的业务资源,确定业务对象的业务行为数据,基于业务行为数据中所携带的业务资源,确定与业务时间段相关联的资源类目;资源类目包括第一资源类目和第二资源类目;
11、对象数量确定模块,用于在业务对象中,统计与第一资源类目相关联的第一业务对象的第一对象数量,统计与第二资源类目相关联的第二业务对象的第二对象数量,并统计与第一资源类目和第二资源类目均关联的第三业务对象的第三对象数量;
12、相关度确定模块,用于基于第一对象数量、第二对象数量和第三对象数量,确定第一资源类目与第二资源类目之间的资源类目相关度;
13、资源类目处理模块,还用于若资源类目相关度指示第二资源类目为第一资源类目的关联类目,则将第一资源类目和第二资源类目作为用于训练初始业务模型的训练样本类目对;
14、模型处理模块,用于将训练样本类目对中的第一资源类目输入初始业务模型,由初始业务模型预测第一资源类目的关联类目,将预测到的第一资源类目的关联类目作为第一资源类目的样本预测关联资源类目;
15、模型处理模块,还用于基于样本预测关联资源类目和训练样本类目对中的第二资源类目对初始业务模型进行迭代训练,得到目标业务模型。
16、本申请实施例一方面提供了一种计算机设备,包括存储器和处理器,存储器与处理器相连,存储器用于存储计算机程序,处理器用于调用计算机程序,以使得该计算机设备执行本申请实施例中上述一方面提供的方法。
17、本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序适于由处理器加载并执行,以使得具有处理器的计算机设备执行本申请实施例中上述一方面提供的方法。
18、根据本申请的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序由处理器执行时实现本申请实施例中上述任一方面提供的方法。
19、在本申请实施例中,可以基于业务对象在业务时间段内所触发的业务资源(如商品),确定业务对象的业务行为数据,并基于业务行为数据中所携带的业务资源,确定与业务时间段相关联的资源类目(如第一资源类目和第二资源类目),此时,可以统计与第一资源类目相关联的第一业务对象的第一对象数量、与第二资源类目相关联的第二业务对象的第二对象数量,统计与第一资源类目和第二资源类目均关联的第三业务对象的第三对象数量,从而可以确定出第一资源类目和第二资源类目的资源类目相关度,也就是说,可以通过业务对象的业务行为数据确定资源类目之间的相关度,在资源类目相关度指示第二资源类目为第一资源类目的关联类目时,即第一资源类目和第二资源类目存在类目关联时,通过第一资源类目和第二资源类目训练初始业务模型,使得训练得到的目标业务模型具备预测关联资源类目的能力(可以理解,关联资源类目下的业务资源彼此关联,由此可以通过目标业务模型实现关联业务资源的确定)。这样可以将用于训练初始业务模型的训练样本从以业务资源为粒度调整为以业务资源所属的资源类目为粒度,由于一个资源类目可以包括多种业务资源,资源类目的数量远远小于业务资源的数量,因此在以资源类目为粒度作为训练样本时,可以大大减少与关联商品相关联的模型在训练时所需构建的训练样本的数据量以及模型训练的工作量,这样可以高效且准确地得到一个用于进行确定关联资源类目的业务模型,进而可以基于该关联资源类目确定准确的关联资源。
1.一种基于资源类目的数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述在所述业务对象中,统计与所述第一资源类目相关联的第一业务对象的第一对象数量,包括:
3.根据权利要求2所述的方法,其特征在于,所述第一业务对象包括l1个第一参考业务对象;l1为正整数;
4.根据权利要求1所述的方法,其特征在于,所述统计与所述第二资源类目相关联的第二业务对象的第二对象数量,包括:
5.根据权利要求1所述的方法,其特征在于,所述业务行为数据包括所述第一业务对象的第一业务行为数据以及所述第二业务对象的第二业务行为数据;所述第一业务行为数据是指所携带的业务资源属于所述第一资源类目的业务行为数据;所述第二业务行为数据是指所携带的业务资源属于所述第二资源类目的业务行为数据;
6.根据权利要求5所述的方法,其特征在于,所述第三业务对象包括q个过渡业务对象;q为正整数;
7.根据权利要求6所述的方法,其特征在于,所述基于所述过渡业务对象q的第一业务行为数据以及所述过渡业务对象q的第二业务行为数据,确定所述过渡业务对象q在所述第一资源类目和所述第二资源类目下的对象数量,包括:
8.根据权利要求7所述的方法,其特征在于,所述基于所述k1个第一过渡数据组和所述k2个第二过渡数据组,确定所述过渡业务对象q在所述第一资源类目和所述第二资源类目下的对象数量,包括:
9.根据权利要求1所述的方法,其特征在于,所述基于所述第一对象数量、所述第二对象数量和所述第三对象数量,确定所述第一资源类目与所述第二资源类目之间的资源类目相关度,包括:
10.根据权利要求1所述的方法,其特征在于,所述基于所述第一对象数量、所述第二对象数量和所述第三对象数量,确定所述第一资源类目与所述第二资源类目之间的资源类目相关度,包括:
11.根据权利要求1所述的方法,其特征在于,所述业务对象对所述业务资源的触发行为包括第一触发行为和第二触发行为;所述第一对象数量包括:与所述第一触发行为相关联的第一过渡对象数量、与所述第二触发行为相关联的第二过渡对象数量;所述第二对象数量包括:与所述第一触发行为相关联的第三过渡对象数量、与所述第二触发行为相关联的第四过渡对象数量;所述第三对象数量包括:与所述第一触发行为相关联的第五过渡对象数量、与所述第二触发行为相关联的第六过渡对象数量;
12.根据权利要求1所述的方法,其特征在于,所述资源类目相关度用于确定所述第二资源类目对于所述第一资源类目的类目关联等级;
13.根据权利要求1所述的方法,其特征在于,所述基于所述样本预测关联资源类目和所述训练样本类目对中的第二资源类目对所述初始业务模型进行迭代训练,得到目标业务模型,包括:
14.根据权利要求1所述的方法,其特征在于,所述方法还包括:
15.根据权利要求14所述的方法,其特征在于,所述将所述目标资源类目输入所述目标业务模型,由所述目标业务模型预测所述目标资源类目的关联类目,将预测到的所述目标资源类目的关联类目作为所述目标资源类目的目标预测关联资源类目,包括:
16.一种基于资源类目的数据处理装置,其特征在于,所述装置包括:
17.一种计算机设备,其特征在于,包括存储器和处理器;
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1-15任一项所述的方法。
19.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现权利要求1-15任一项所述的方法。