一种数据处理方法及装置、存储介质与流程

文档序号:29561087发布日期:2022-04-09 00:48阅读:90来源:国知局
一种数据处理方法及装置、存储介质与流程

1.本技术涉及计算机技术领域,尤其涉及一种数据处理方法及装置、存储介质。


背景技术:

2.由于商品库中的规模较大,因此为了满足实时向顾客推荐商品的需求,目前,通常是使用推荐系统根据用户的属性信息,从商品库中筛选与用户相关的商品,然后推荐给用户,但是现有的推荐系统在模型训练的过程中,由于样本的单一性问题会导致训练后的推荐系统的准确度低。


技术实现要素:

3.本技术实施例提供一种数据处理方法及装置、存储介质,能够提高推荐时的准确度。
4.本技术的技术方案是这样实现的:
5.第一方面,本技术实施例提供一种数据处理方法,所述方法包括:
6.从历史日志数据中提取对象属性信息、所述对象属性信息对应的历史行为数据和历史显示数据;并从历史推荐信息库中获取所述对象属性信息对应的历史推荐数据;所述历史推荐数据包括所述历史显示数据;
7.从所述历史推荐数据中查找与所述历史显示数据相同的第一历史推荐数据;并根据所述历史显示数据、所述历史行为数据和所述第一历史推荐数据,得到第二历史推荐数据;
8.利用所述第二历史推荐数据和第三历史推荐数据训练预设推荐模型,得到训练后的预设推荐模型;所述第三历史推荐数据为所述历史推荐数据中除所述第一历史推荐数据外的历史推荐数据;
9.在接收到第一身份属性信息的情况下,基于所述训练后的预设推荐模型确定所述第一身份属性信息对应的推荐数据。
10.在上述数据处理方法中,所述根据所述历史显示数据、所述历史行为数据和所述第一历史推荐数据,得到第二历史推荐数据,包括:
11.将所述历史显示数据和所述第一历史推荐数据进行数据拼接,得到推荐显示数据;
12.根据所述历史行为数据将所述推荐显示数据划分为推荐显示点击数据和推荐显示未点击数据;并将所述推荐显示点击数据和所述推荐显示未点击数据确定为所述第二历史推荐数据;
13.相应的,所述第三历史推荐数据为推荐未显示数据,所述利用所述第二历史推荐数据和第三历史推荐数据训练预设推荐模型,得到训练后的预设推荐模型,包括:
14.利用所述推荐显示点击数据、所述推荐显示未点击数据和所述推荐未显示数据训练预设推荐模型,得到训练后的预设推荐模型。
15.在上述数据处理方法中,所述利用所述推荐显示点击数据、所述推荐显示未点击数据和所述推荐未显示数据训练预设推荐模型,包括:
16.依次将所述推荐显示点击数据、所述推荐显示未点击数据和所述推荐未显示数据中的每条数据输入预设推荐模型中,得到所述每条数据对应的预测推荐显示点击率、预测推荐显示未点击率和预测推荐未显示率;
17.基于所述预测推荐显示点击率、所述预测推荐显示未点击率和所述预测推荐未显示率训练预设推荐模型。
18.在上述数据处理方法中,所述基于所述训练后的预设推荐模型确定所述第一身份属性信息对应的推荐数据,包括:
19.从目标数据库中查找所述第一身份属性信息对应的待推荐数据;
20.将所述待推荐数据输入所述训练后的预设推荐模型中,得到所述待推荐数据对应的推荐显示点击率、推荐显示未点击率和推荐未显示率;
21.根据所述推荐显示点击率、所述推荐显示未点击率和所述推荐未显示率从所述待推荐数据中确定所述第一身份属性信息对应的推荐数据。
22.在上述数据处理方法中,所述根据所述推荐显示点击率、所述推荐显示未点击率和所述推荐未显示率从所述待推荐数据中确定所述第一身份属性信息对应的推荐数据,包括:
23.根据所述推荐显示点击率、所述推荐显示未点击率和所述推荐未显示率确定所述待推荐数据的推荐指数;
24.按照所述待推荐指数从高到低的顺序,对所述待推荐数据进行排序,得到排序后的待推荐数据;
25.从所述排序后的待推荐数据中选择预设数量的待推荐数据,并将所述预设个数的待推荐数据确定为所述第一身份属性信息对应的推荐数据。
26.第二方面,本技术实施例提供一种数据处理装置,所述装置包括:
27.获取单元,用于从历史日志数据中提取对象属性信息、所述对象属性信息对应的历史行为数据和历史显示数据;并从历史推荐信息库中获取所述对象属性信息对应的历史推荐数据;所述历史推荐数据包括所述历史显示数据;
28.查找单元,用于从所述历史推荐数据中查找与所述历史显示数据相同的第一历史推荐数据;并根据所述历史显示数据、所述历史行为数据和所述第一历史推荐数据,得到第二历史推荐数据;
29.模型训练单元,用于利用所述第二历史推荐数据和第三历史推荐数据训练预设推荐模型,得到训练后的预设推荐模型;所述第三历史推荐数据为所述历史推荐数据中除所述第一历史推荐数据外的历史推荐数据;
30.确定单元,用于在接收到第一身份属性信息的情况下,基于所述训练后的预设推荐模型确定所述第一身份属性信息对应的推荐数据。
31.在上述数据处理装置中,所述装置还包括:输入单元;
32.所述查找单元,还用于从目标数据库中查找所述第一身份属性信息对应的待推荐数据;
33.所述输入单元,用于将所述待推荐数据输入所述训练后的预设推荐模型中,得到
所述待推荐数据对应的推荐显示点击率、推荐显示未点击率和推荐未显示率;
34.所述确定单元,还用于根据所述推荐显示点击率、所述推荐显示未点击率和所述推荐未显示率从所述待推荐数据中确定所述第一身份属性信息对应的推荐数据。
35.在上述数据处理装置中,所述装置还包括:排序单元;
36.所述确定单元,还用于根据所述推荐显示点击率、所述推荐显示未点击率和所述推荐未显示率确定所述待推荐数据的推荐指数;
37.所述排序单元,用于按照所述待推荐指数从高到低的顺序,对所述待推荐数据进行排序,得到排序后的待推荐数据;
38.所述确定单元,还用于从所述排序后的待推荐数据中选择预设数量的待推荐数据,并将所述预设个数的待推荐数据确定为所述第一身份属性信息对应的推荐数据。
39.第三方面,本技术实施例提供一种数据处理设备,其特征在于,所述设备包括:处理器、存储器及通信总线;所述处理器执行存储器存储的运行程序时实现如上述任一项所述的数据处理方法。
40.第四方面,本技术实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如上述任一项所述的数据处理方法。
41.本技术实施例提供了一种数据处理方法及装置、存储介质,该方法包括:从历史日志数据中提取对象属性信息、对象属性信息对应的历史行为数据和历史显示数据;并从历史推荐信息库中获取对象属性信息对应的历史推荐数据;历史推荐数据包括历史显示数据;从历史推荐数据中查找与历史显示数据相同的第一历史推荐数据;并根据历史显示数据、历史行为数据和第一历史推荐数据,得到第二历史推荐数据;利用第二历史推荐数据和第三历史推荐数据训练预设推荐模型,得到训练后的预设推荐模型;第三历史推荐数据为历史推荐数据中除第一历史推荐数据外的历史推荐数据;在接收到第一身份属性信息的情况下,基于训练后的预设推荐模型确定第一身份属性信息对应的推荐数据;采用上述实现方案,通过对历史日志数据和历史推荐数据进行数据提取和数据拼接,得到第二历史推荐数据和第三历史推荐数据,进而使用第二历史推荐数据和第三历史推荐数据对预设推荐模型进行训练,通过本技术的技术方案,由于在对预设推荐模型进行训练时使用了多种维度的样本数据,不仅仅至考虑单一类型的样本数据,能够提高对预设推荐模型进行训练时的准确度,进而提高使用训练后的预设推荐模型进行预测时的准确度。
附图说明
42.图1为本技术实施例提供的一种示例性的推荐装置示意图;
43.图2为本技术实施例提供的一种数据处理方法流程图;
44.图3为本技术实施例提供的一种示例性的数据处理装置示意图;
45.图4为本技术实施例提供的一种数据处理装置的组成结构示意图;
46.图5为本技术实施例提供的一种数据处理设备的组成结构示意图。
具体实施方式
47.应当理解,此处描述的具体实施例仅仅用以解释本技术。并不用于限定本技术。
48.本技术是基于一种推荐装置进行的改进,图1为本技术实施例给出的一种示例性
的推荐装置示意图,如图1所示,推荐装置包括召回模块、粗排序模块和精排序模块三个模块。
49.召回模块,用于利用不同的召回方法从商品库中查找出与用户相关的商品,并将召回结果返回给粗排序。
50.粗排序模块,用于使用训练好的粗排序点击率预测模型对得到的召回结果进行点击率预测,并根据预测结果对召回结果进行排序后,将排名在前预设个数的商品返回至精排序模块,例如,将排名在前100名的商品返回至精排序模块。
51.精排序模块,和粗排序模块的方法相同,用于从前预设个数的商品中挑选出最终的推荐商品,并将其显示在显示界面上供用户操作。
52.但是在现有的推荐装置中,由于在对粗排序点击率预测模型进行训练时仅仅采用显示在用户显示界面的历史显示数据进行训练,造成了样本选择偏差的问题,进而导致粗排序点击率预测模型的预测结果准确率较低。
53.基于上述技术问题,本技术提出了一种数据处理方法,能够解决现有的推荐装置中的样本偏差问题,进而提高推荐时的准确率。
54.本技术实施例提供一种数据处理方法,应用于数据处理装置,图2为本技术实施例提供的一种数据处理方法流程图,如图2所示,数据处理方法可以包括:
55.s101、从历史日志数据中提取对象属性信息、对象属性信息对应的历史行为数据和历史显示数据;并从历史推荐信息库中获取对象属性信息对应的历史推荐数据。
56.本技术实施例提出的数据处理方法可以应用在向用户进行商品推荐的场景下。
57.在本技术实施例中,数据处理装置从历史日志数据中提取对象属性信息、对象属性信息对应的历史行为数据和历史显示数据;并从历史推荐信息库中获取对象属性信息对应的历史推荐数据。
58.参考图3,图3为本技术实施例提出的一种示例性的数据处理装置示意图,其中,数据处理装置相比较与图1而言,在召回模块和粗排序模块之间增加了召回日志模块,并且在粗排序模块中增加了排序策略,需要说明的是,召回日志模块用于从召回模块中获取历史推荐数据,并生成历史显示数据和历史行为数据,之后对历史推荐数据、历史显示数据和历史行为数据进行数据处理,以生成用于对预设推荐模型进行训练的训练样本,排序策略用于使用训练后的预设推荐模型进行数据推荐过程中,对待推荐数据进行排序以从中筛选出推荐数据的过程。
59.具体的,召回日志模块是由日志生成模块、日志收集模块、日志解析模块和训练数据生成模块组成的,其中,日志生成模块用于从历史日志数据中获取对象属性信息、历史行为数据和历史显示数据;日志收集模块用于从历史推荐信息库中获取对象属性信息对应的历史推荐数据。
60.需要说明的是,对象属性信息可以是用户的属性信息,例如用户身份标识号(identity document,id)、用户年龄和用户所在地等,具体的对象属性信息根据实际情况确定,本技术实施例在此不做限定。
61.需要说明的是,历史行为数据可以是用户(对象)的历史行为数据,例如用户的历史浏览数据、历史查询数据、历史加购数据、历史购买数据和历史评论等,具体的历史行为数据根据实际情况确定,本技术实施例在此不做限定。
62.需要说明的是,历史显示数据可以是历史显示在用户的显示界面上的数据,例如,用户a打开某购物app之后,某购物app的显示界面上对用户a显示的商品数据,即为历史显示数据,具体的历史显示数据根据实际情况确定,本技术实施例在此不做限定。
63.需要说明的是,历史显示数据中包括商品数据,例如商品对应的编号、商品所属的品类和商品价格等数据,具体的商品数据根据实际情况确定,本技术实施例在此不做限定。
64.在本技术实施例中,历史推荐信息库中的历史推荐数据是通过图2中的召回模块生成的,召回可以理解为根据用户的行为、画像等信息从物料库检索出和用户相关的,召回的方法可以有多种,例如“基于地域召回”和“基于年龄召回”两种,通过两种召回方法分别对目标数据库中的商品进行打分,最后将两种方法得到的分数进行融合,得到最终的分数,此时,分数大于预设数值的商品则为历史推荐数据;具体的预设数值和召回方法根据实际情况确定,本技术实施例在此不做限定。
65.需要说明的是,历史推荐数据中包括历史显示数据。具体的,历史推荐数据中历史显示在显示界面上的推荐数据即为历史显示数据。
66.s102、从历史推荐数据中查找与历史显示数据相同的第一历史推荐数据;并根据历史显示数据、历史行为数据和第一历史推荐数据,得到第二历史推荐数据。
67.在本技术实施例中,数据处理装置在得到历史推荐数据之后,从历史推荐数据中查找与历史显示数据相同的第一历史推荐数据;并根据历史显示数据、历史行为数据和第一历史推荐数据,得到第二历史推荐数据。
68.需要说明的是,图3召回日志模块中的日志解析模块用于根据历史显示数据、历史行为数据和第一历史推荐数据,得到第二历史推荐数据。
69.需要说明的是,第二历史推荐数据是由推荐显示点击数据和推荐显示未点击数据组成的。
70.具体的,将历史显示数据和第一历史推荐数据进行数据拼接,得到推荐显示数据;根据历史行为数据将推荐显示数据划分为推荐显示点击数据和推荐显示未点击数据;并将推荐显示点击数据和推荐显示未点击数据确定为第二历史推荐数据。
71.需要说明的是,通过将历史显示数据和第一历史推荐数据进行数据拼接可以得到推荐显示数据,然后通过历史行为数据获取到推荐显示数据中有哪些数据被点击过,由此将推荐显示数据划分为推荐显示点击数据和推荐显示未点击数据。
72.可以理解的是,通过根据历史行为数据将推荐显示数据划分为推荐显示点击数据和推荐显示未点击数据,然后利用推荐显示点击数据和推荐显示未点击数据训练预设推荐模型,由于增加了训练时的数据类型,进而提高了模型训练的准确性。
73.s103、利用第二历史推荐数据和第三历史推荐数据训练预设推荐模型,得到训练后的预设推荐模型。
74.在本技术实施例中,数据处理装置在得到第二历史推荐数据之后,利用第二历史推荐数据和第三历史推荐数据训练预设推荐模型,得到训练后的预设推荐模型。
75.在本技术实施例中,数据处理设备在得到第二历史推荐数据(推荐显示点击数据和推荐显示未点击数据)之后,需要先从历史推荐数据中获取第三历史推荐数据(推荐未显示数据)。
76.在本技术实施例中,第三历史推荐数据为历史推荐数据中除第一历史推荐数据外
的历史推荐数据;
77.需要说明的是,由于历史推荐数据中有一部分历史推荐数据作为历史显示数据被显示,剩下的另一部分历史推荐数据则为未被显示的历史推荐数据,即推荐未显示数据。
78.在本技术实施例中,数据处理设备在得到推荐显示点击数据、推荐显示未点击数据和推荐未显示数据之后,利用推荐显示点击数据、推荐显示未点击数据和推荐未显示数据训练预设推荐模型,得到训练后的预设推荐模型。
79.需要说明的是,预设推荐模型可以使点击率预测(click through rate,ctr)模型,具体的预设推荐模型根据实际情况确定,本技术实施例在此不做限定。
80.具体的,依次将推荐显示点击数据、推荐显示未点击数据和推荐未显示数据中的每条数据输入预设推荐模型中,得到每条数据对应的预测推荐显示点击率、预测推荐显示未点击率和预测推荐未显示率;基于预测推荐显示点击率、预测推荐显示未点击率和预测推荐未显示率训练预设推荐模型。
81.需要说明的是,对于这三类训练数据,本技术实施例在训练预设推荐模型的过程中选择的是使用交叉熵损失函数来进行训练的,在实际应用中还可以使用其他损失函数进行模型训练,本技术实施例在此不做限定。
82.需要说明的是,将数据输入预设推荐模型中,得到的输出结果为三个值,示例性的,输出结果可以为(预测推荐显示点击率50%、预测推荐显示未点击率30%和预测推荐未显示率20%),并且三个值相加的结果恒为1。
83.在本技术实施例中,利用推荐显示点击数据、推荐显示未点击数据和推荐未显示数据训练预设推荐模型之前,还可以从推荐显示点击数据、推荐显示未点击数据和推荐未显示数据选择预设比例的第一推荐显示点击数据、第一推荐显示未点击数据和第一推荐未显示数据训练预设推荐模型。
84.在本技术实施例中,通过图3中召回日志模块的日志解析模块得到推荐显示点击数据、推荐显示未点击数据和推荐未显示数据,此时可能数据的条数比例不均,也会影响最终的模型训练结果,因此,需要通过图3中召回日志模块的训练数据生成模块从推荐显示点击数据、推荐显示未点击数据和推荐未显示数据中提取预设比例的数据来对预设推荐模型进行训练,例如,假设此时得到了100条的推荐显示点击数据,200条的推荐显示未点击数据和300条的推荐未显示数据,并且预设比例设定为1:1:1,此时,则需要分别从200条的推荐显示未点击数据和300条的推荐未显示数据选择100条数据出来,和100条的推荐显示点击数据一起作为样本训练预设推荐模型;具体的预设比例根据实际情况确定,本技术实施例在此不做限定。
85.需要说明的是,图3召回日志模块中的训练数据生成模块用于将日志生成模块得到的对象属性信息进行特征提取,利用提取的属性特征来训练预设推荐模型,进而提高训练后预设推荐模型预测的准确度。
86.可以理解的是,由于在训练预设推荐模型时,不仅获取第二历史推荐数据(推荐显示点击数据和推荐显示未点击数据),还从历史推荐数据中获取第三历史推荐数据(推荐未显示数据),然后将获取到的三类数据输入预设推荐模型中进行训练,能够利用多种维度的数据对预设推荐模型进行全面的训练,从而使得预设推荐模型的预测率提高。
87.s104、在接收到第一身份属性信息的情况下,基于训练后的预设推荐模型确定第
一身份属性信息对应的推荐数据。
88.在本技术实施例中,数据处理装置在对预设推荐模型训练完成之后,在接收到第一身份属性信息的情况下,基于训练后的预设推荐模型确定第一身份属性信息对应的推荐数据。
89.需要说明的是,第一身份属性信息为用户登陆数据处理装置时所需的信息,例如账号信息或者手机号码等,数据处理装置可以是部署应用软件的装置。
90.需要说明的是,图3的粗排序模块用于使用训练后的预设推荐模型确定第一身份属性信息对应的推荐数据。
91.具体的,在接收到第一身份属性信息的情况下,从目标数据库中查找第一身份属性信息对应的待推荐数据;将待推荐数据输入训练后的预设推荐模型中,得到待推荐数据对应的推荐显示点击率、推荐显示未点击率和推荐未显示率;根据推荐显示点击率、推荐显示未点击率和推荐未显示率从待推荐数据中确定第一身份属性信息对应的推荐数据。
92.需要说明的是,目标数据库为图3中的商品库,根据第一身份属性信息从目标数据库中查找和第一身份属性信息相关的商品,作为待推荐数据。
93.需要说明的是,在得到待推荐数据之后,依次将待推荐数据中的每条数据输入训练好的预设推荐模型中,得到每条数据对应的输出结果,即推荐显示点击率、推荐显示未点击率和推荐未显示率,最终根据输出结果从待推荐数据中确定出推荐数据后输入至如图3所示的精排序模块中,最终将结果显示在显示界面上。
94.需要说明的是,图3粗排序模块中的排序策略用于对待推荐数据进行排序,进而从排序后的待推荐数据中确定出推荐数据。
95.具体的,根据推荐显示点击率、推荐显示未点击率和推荐未显示率确定待推荐数据的推荐指数;按照待推荐指数从高到低的顺序,对待推荐数据进行排序,得到排序后的待推荐数据;从排序后的待推荐数据中选择预设数量的待推荐数据,并将预设个数的待推荐数据确定为第一身份属性信息对应的推荐数据。
96.在本技术实施例中,将推荐显示点击率记为p1,将推荐显示未点击率记为p2,将推荐未显示率记为p3,并且在计算推荐指数之前,还需要先计算推荐显示率p4为p1+p2,然后通过如下公式得到推荐指数:
97.s=p
1t1
×
p
4t2
(1)
98.在上式(1)中,t1是为p1配置的第一参数,t2是为p4配置的第二参数。
99.需要说明的是,由于推荐未显示率p3在实际情况中被认为不具备被点击的可能性,因此,可将p3值高于预设阈值的待推荐数据进行后置,之后,针对p3值低于预设阈值的待推荐数据,按照公式(1)的方法计算推荐指数并根据推荐指数对p3值低于预设阈值的待推荐数据进行在前排序。
100.需要说明的是,还可直接利用p1和p2对待推荐数据进行推荐指数的计算,具体的是否使用p3可以根据实际情况进行选择,本技术实施例在此不做限定。示例性的,假设此时有a、b、c、d和e五个待推荐商品,并且他们的推荐指数依次为5、4、7、8和3,按照推荐指数对a、b、c、d和e进行排序后得到的排序结果为d、c、a、b和e,需要从中选择分数在前4位的商品作为推荐商品,此时推荐商品则为d、c、a和b;具体的预设个数根据实际情况确定,本技术实施例在此不做限定。
101.可以理解的是,由于预设推荐模型是通过推荐显示点击数据、推荐显示未点击数据和推荐未显示数据三种不同类型的数据进行训练的,因此,能够提高利用预设推荐模型对第一身份属性信息进行推荐时的准确度,进而提高用户的点击率。
102.本技术实施例提供了一种数据处理方法,该方法包括:从历史日志数据中提取对象属性信息、对象属性信息对应的历史行为数据和历史显示数据;并从历史推荐信息库中获取对象属性信息对应的历史推荐数据;历史推荐数据包括历史显示数据;从历史推荐数据中查找与历史显示数据相同的第一历史推荐数据;并根据历史显示数据、历史行为数据和第一历史推荐数据,得到第二历史推荐数据;利用第二历史推荐数据和第三历史推荐数据训练预设推荐模型,得到训练后的预设推荐模型;第三历史推荐数据为历史推荐数据中除第一历史推荐数据外的历史推荐数据;在接收到第一身份属性信息的情况下,基于训练后的预设推荐模型确定第一身份属性信息对应的推荐数据;采用上述实现方案,通过对历史日志数据和历史推荐数据进行数据提取和数据拼接,得到多种类型的样本数据,进而使用多种类型的样本数据对预设推荐模型进行训练能够使得使用训练后的模型进行预测时的准确度提高,进而提高进行推荐时的准确度。
103.基于上述实施例,在本技术的另一实施例中,提供了一种数据处理装置1,图4为本技术提供的一种数据处理装置的组成结构示意图,如图4所示,该数据处理装置1包括:
104.获取单元10,用于从历史日志数据中提取对象属性信息、所述对象属性信息对应的历史行为数据和历史显示数据;并从历史推荐信息库中获取所述对象属性信息对应的历史推荐数据;所述历史推荐数据包括所述历史显示数据;
105.查找单元11,用于从所述历史推荐数据中查找与所述历史显示数据相同的第一历史推荐数据;并根据所述历史显示数据、所述历史行为数据和所述第一历史推荐数据,得到第二历史推荐数据;
106.模型训练单元12,用于利用所述第二历史推荐数据和第三历史推荐数据训练预设推荐模型,得到训练后的预设推荐模型;所述第三历史推荐数据为所述历史推荐数据中除所述第一历史推荐数据外的历史推荐数据;
107.确定单元13,用于在接收到第一身份属性信息的情况下,基于所述训练后的预设推荐模型确定所述第一身份属性信息对应的推荐数据。
108.可选的,数据处理装置1还包括:数据处理单元;
109.所述数据处理单元,用于将所述历史显示数据和所述第一历史推荐数据进行数据拼接,得到推荐显示数据;
110.所述数据处理单元,还用于根据所述历史行为数据将所述推荐显示数据划分为推荐显示点击数据和推荐显示未点击数据;并将所述推荐显示点击数据和所述推荐显示未点击数据确定为所述第二历史推荐数据;
111.所述模型训练单元12,还用于利用所述推荐显示点击数据、所述推荐显示未点击数据和所述推荐未显示数据训练预设推荐模型,得到训练后的预设推荐模型。
112.可选的,数据处理装置1还包括:输入单元;
113.所述输入单元,用于依次将所述推荐显示点击数据、所述推荐显示未点击数据和所述推荐未显示数据中的每条数据输入预设推荐模型中,得到所述每条数据对应的预测推荐显示点击率、预测推荐显示未点击率和预测推荐未显示率;
114.所述模型训练单元12,还用于基于所述预测推荐显示点击率、所述预测推荐显示未点击率和所述预测推荐未显示率训练预设推荐模型。
115.可选的,所述查找单元11,还用于从目标数据库中查找所述第一身份属性信息对应的待推荐数据;
116.所述输入单元,还用于将所述待推荐数据输入所述训练后的预设推荐模型中,得到所述待推荐数据对应的推荐显示点击率、推荐显示未点击率和推荐未显示率;
117.所述确定单元13,还用于根据所述推荐显示点击率、所述推荐显示未点击率和所述推荐未显示率从所述待推荐数据中确定所述第一身份属性信息对应的推荐数据。
118.可选的,数据处理装置1还包括:排序单元;
119.所述确定单元13,还用于根据所述推荐显示点击率、所述推荐显示未点击率和所述推荐未显示率确定所述待推荐数据的推荐指数;
120.所述排序单元,用于按照所述待推荐指数从高到低的顺序,对所述待推荐数据进行排序,得到排序后的待推荐数据;
121.所述确定单元13,还用于从所述排序后的待推荐数据中选择预设数量的待推荐数据,并将所述预设个数的待推荐数据确定为所述第一身份属性信息对应的推荐数据。
122.本技术实施例提供了一种数据处理装置,该装置包括:从历史日志数据中提取对象属性信息、对象属性信息对应的历史行为数据和历史显示数据;并从历史推荐信息库中获取对象属性信息对应的历史推荐数据;历史推荐数据包括历史显示数据;从历史推荐数据中查找与历史显示数据相同的第一历史推荐数据;并根据历史显示数据、历史行为数据和第一历史推荐数据,得到第二历史推荐数据;利用第二历史推荐数据和第三历史推荐数据训练预设推荐模型,得到训练后的预设推荐模型;第三历史推荐数据为历史推荐数据中除第一历史推荐数据外的历史推荐数据;在接收到第一身份属性信息的情况下,基于训练后的预设推荐模型确定第一身份属性信息对应的推荐数据;采用上述实现方案,通过对历史日志数据和历史推荐数据进行数据提取和数据拼接,得到多种类型的样本数据,进而使用多种类型的样本数据对预设推荐模型进行训练能够使得使用训练后的模型进行预测时的准确度提高,进而提高进行推荐时的准确度。
123.图5为本技术实施例提供的一种数据处理设备的组成结构示意图,在实际应用中,基于上述实施例的同一公开构思下,如图5所示,本实施例的数据处理设备2包括:处理器20、存储器21及通信总线22。
124.在具体的实施例的过程中,上述获取单元10、查找单元11、模型训练单元12、确定单元13、数据处理单元、输入单元和排序单元可由位于数据处理设备2上的处理器20实现,上述处理器20可以为特定用途集成电路(asic,application specific integrated circuit)、数字信号处理器(dsp,digital signal processor)、数字信号处理图像处理装置(dspd,digital signal processing device)、可编程逻辑图像处理装置(pld,programmable logic device)、现场可编程门阵列(fpga,field programmable gate array)、cpu、控制器、微控制器、微处理器中的至少一种。可以理解地,对于不同的数据处理设备,用于实现上述处理器功能的电子器件还可以为其它,本实施例不作具体限定。
125.在本技术实施例中,上述通信总线22用于实现处理器20和存储器21之间的连接通信;上述处理器20执行存储器21中存储的运行程序时实现如下的数据处理方法:
126.从历史日志数据中提取对象属性信息、所述对象属性信息对应的历史行为数据和历史显示数据;并从历史推荐信息库中获取所述对象属性信息对应的历史推荐数据;所述历史推荐数据包括所述历史显示数据;
127.从所述历史推荐数据中查找与所述历史显示数据相同的第一历史推荐数据;并根据所述历史显示数据、所述历史行为数据和所述第一历史推荐数据,得到第二历史推荐数据;
128.利用所述第二历史推荐数据和第三历史推荐数据训练预设推荐模型,得到训练后的预设推荐模型;所述第三历史推荐数据为所述历史推荐数据中除所述第一历史推荐数据外的历史推荐数据;
129.在接收到第一身份属性信息的情况下,基于所述训练后的预设推荐模型确定所述第一身份属性信息对应的推荐数据。
130.可选的,所述处理器20还用于将所述历史显示数据和所述第一历史推荐数据进行数据拼接,得到推荐显示数据;根据所述历史行为数据将所述推荐显示数据划分为推荐显示点击数据和推荐显示未点击数据;并将所述推荐显示点击数据和所述推荐显示未点击数据确定为所述第二历史推荐数据;相应的,所述第三历史推荐数据为推荐未显示数据,所述利用所述第二历史推荐数据和第三历史推荐数据训练预设推荐模型,得到训练后的预设推荐模型,包括:利用所述推荐显示点击数据、所述推荐显示未点击数据和所述推荐未显示数据训练预设推荐模型,得到训练后的预设推荐模型。
131.可选的,所述处理器20还用于依次将所述推荐显示点击数据、所述推荐显示未点击数据和所述推荐未显示数据中的每条数据输入预设推荐模型中,得到所述每条数据对应的预测推荐显示点击率、预测推荐显示未点击率和预测推荐未显示率;基于所述预测推荐显示点击率、所述预测推荐显示未点击率和所述预测推荐未显示率训练预设推荐模型。
132.可选的,所述处理器20还用于从目标数据库中查找所述第一身份属性信息对应的待推荐数据;将所述待推荐数据输入所述训练后的预设推荐模型中,得到所述待推荐数据对应的推荐显示点击率、推荐显示未点击率和推荐未显示率;根据所述推荐显示点击率、所述推荐显示未点击率和所述推荐未显示率从所述待推荐数据中确定所述第一身份属性信息对应的推荐数据。
133.可选的,所述处理器20还用于根据所述推荐显示点击率、所述推荐显示未点击率和所述推荐未显示率确定所述待推荐数据的推荐指数;按照所述待推荐指数从高到低的顺序,对所述待推荐数据进行排序,得到排序后的待推荐数据;从所述排序后的待推荐数据中选择预设数量的待推荐数据,并将所述预设个数的待推荐数据确定为所述第一身份属性信息对应的推荐数据。
134.本技术实施例提供一种存储介质,其上存储有计算机程序,上述计算机可读存储介质存储有一个或者多个程序,上述一个或者多个程序可被一个或者多个处理器执行,应用于数据处理装置中,该计算机程序实现如上述的数据处理方法。
135.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该
要素的过程、方法、物品或者装置中还存在另外的相同要素。
136.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台图像显示设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本公开各个实施例所述的数据处理方法。
137.以上所述,仅为本技术的较佳实施例而已,并非用于限定本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1