
1.本公开涉及数据处理技术领域,尤其涉及人工智能、智能搜索、深度学习技术领域。
背景技术:2.在电商交易中,复购是一个很重要的概念,用户重复购买得越多,代表用户对电商平台的认可度越高,电商平台的商业价值贡献率越高,电商平台的用户粘性也越高。
技术实现要素:3.本公开提供了一种预测模型的训练、商品推荐方法、装置、电子设备及介质。
4.根据本公开的第一方面,提供了一种预测模型的训练方法,所述方法包括:
5.确定每个最低层级类目的样本用户;
6.提取每个样本用户复购对应的类目的复购行为特征,所述样本用户对应的类目包括所述样本用户复购对应的最低层级类目和所述最低层级类目的上级类目;
7.基于每个样本用户的复购行为特征训练预测模型。
8.在一些实施例中,所述确定每个最低层级类目的样本用户的步骤,包括:
9.确定第一指定时刻之后的第一预设时长内购买商品的用户作为备选用户;
10.确定第二指定时刻之后的第二预设时长内购买每个最低层级类目的备选用户为该最低层级类目的正样本用户,并确定所述第二指定时刻之后的第二预设时长内未购买每个最低层级类目的备选用户为该最低层级类目的负样本用户,所述第二指定时刻在所述第一指定时刻之后,且所述第二指定时刻与所述第一指定时刻之间的时长为第三预设时长。
11.在一些实施例中,所述确定所述第二指定时刻之后的第二预设时长内未购买每个最低层级类目的备选用户为该最低层级类目的负样本用户的步骤,包括:
12.针对每个最低层级类目,确定所述第二指定时刻之后的第二预设时长内未购买任何最低层级类目的备选用户为该最低层级类目的第一负样本用户,并确定所述第二指定时刻之后的第二预设时长内未购买该最低层级类目且购买其他最低层级类目的备选用户为该最低层级类目的第二负样本用户。
13.在一些实施例中,所述基于每个样本用户的复购行为特征训练预测模型的步骤,包括:
14.按照多种比例组合正样本用户、第一负样本用户和第二负样本用户,得到多个样本用户集;
15.利用每个样本用户集中用户的复购行为特征,分别训练预测模型;
16.从训练得到的多个预测模型中,选择损失最小的预测模型作为预测复购概率的预测模型。
17.在一些实施例中,所述复购行为特征包括:用户在最低层级类目的近期行为特征和在最低层级类目的上级类目的近期行为特征。
18.在一些实施例中,所述近期行为特征包括:在第三指定时刻之前的第四预设时长内多个预设时间尺度的点击量、浏览量、收藏量和评论量中的一个或多个。
19.在一些实施例中,所述复购行为特征还包括以下至少一个维度特征:最低层级类目的复购属性特征,用户在最低层级类目的已购时间特征,最低层级类目的类目特征。
20.在一些实施例中,所述复购属性特征包括用户层复购指标、下单层复购指标和综合复购指标中的一个或多个;
21.所述已购时间特征包括在第三指定时刻之前的第四预设时长内首次购买最低层级类目下商品的时刻距第三指定时刻的时长、最后一次购买最低层级类目下商品的时刻距第三指定时刻的时长、购买最低层级类目下商品的平均时间间隔、购买最低层级类目下商品的次数中的一个或多个;
22.所述类目特征包括最低层级类目下的商品数量、商品价格均值、在多个预设时间尺度内的点击率和转化率的一个或多个。
23.在一些实施例中,所述用户层复购指标为最低层级类目的复购用户数量占全部购买用户数量的比例;
24.所述下单层复购指标为最低层级类目的复购次数占全部购买次数的比例;
25.所述综合复购指标为所述用户层复购指标和下单层复购指标的乘积值,或,所述综合复购指标为最低层级类目的多个复购指标的加权求平均值。
26.根据本公开的第二方面,提供了一种商品推荐方法,包括:
27.确定当前时刻之前的第五预设时长内被购买的目标商品和购买所述目标商品的目标用户;
28.响应于所述目标商品所属的目标最低层级类目为复购类目,提取所述目标用户复购所述目标最低层级类目的目标复购行为特征;
29.将所述目标复购行为特征输入训练得到的预测模型,获得所述目标用户的第一复购概率;
30.基于所述第一复购概率,向所述目标用户推荐所述目标最低层级类目下的商品。
31.在一些实施例中,所述复购类目通过以下步骤确定:
32.根据每个最低层级类目的复购指标,确定每个最低层级类目的第二复购概率;
33.根据每个最低层级类目的第二复购概率,确定复购类目。
34.在一些实施例中,所述复购指标的数量为多个;
35.所述根据每个最低层级类目的复购指标,确定每个最低层级类目的第二复购概率的步骤,包括:
36.对每个最低层级类目的多个复购指标进行乘积处理,得到每个最低层级类目的第二复购概率;或,
37.对每个最低层级类目的多个复购指标进行加权求平均,得到每个最低层级类目的第二复购概率。
38.在一些实施例中,所述复购指标包括用户层复购指标和下单层复购指标中的一种或多种。
39.在一些实施例中,所述用户层复购指标为最低层级类目的复购用户数量占全部购买用户数量的比例;
40.所述下单层复购指标为最低层级类目的复购次数占全部购买次数的比例。
41.在一些实施例中,所述根据每个最低层级类目的第二复购概率,确定复购类目的步骤,包括:
42.将第二复购概率最高的预设数量个最低层级类目作为复购类目;或
43.将第二复购概率大于预设概率的最低层级类目作为复购类目。
44.在一些实施例中,所述预设数量通过以下步骤确定:
45.统计最低层级类目的总数量;将预设比例的总数量作为预设数量。
46.在一些实施例中,所述基于所述第一复购概率,向所述目标用户推荐所述目标最低层级类目下的商品的步骤,包括:
47.响应于所述目标最低层级类目的第一复购概率大于预设阈值,为所述目标用户建立所述目标最低层级类目的召回通路;
48.将所述召回通路融入推荐系统,所述推荐系统用于向所述目标用户推荐所述目标最低层级类目下的商品。
49.根据本公开的第三方面,还提供了一种预测模型的训练装置,所述装置包括:
50.第一确定模块,用于确定每个最低层级类目的样本用户;
51.第一提取模块,用于提取每个样本用户复购对应的类目的复购行为特征,所述样本用户对应的类目包括所述样本用户复购对应的最低层级类目和所述最低层级类目的上级类目;
52.训练模块,用于基于每个样本用户的复购行为特征训练预测模型。
53.在一些实施例中,所述第一确定模块包括:
54.第一确定子模块,用于确定第一指定时刻之后的第一预设时长内购买商品的用户作为备选用户;
55.第二确定子模块,用于确定第二指定时刻之后的第二预设时长内购买每个最低层级类目的备选用户为该最低层级类目的正样本用户,并确定所述第二指定时刻之后的第二预设时长内未购买每个最低层级类目的备选用户为该最低层级类目的负样本用户,所述第二指定时刻在所述第一指定时刻之后,且所述第二指定时刻与所述第一指定时刻之间的时长为第三预设时长。
56.在一些实施例中,所述第二确定子模块具体用于:
57.针对每个最低层级类目,确定所述第二指定时刻之后的第二预设时长内未购买任何最低层级类目的备选用户为该最低层级类目的第一负样本用户,并确定所述第二指定时刻之后的第二预设时长内未购买该最低层级类目且购买其他最低层级类目的备选用户为该最低层级类目的第二负样本用户。
58.在一些实施例中,所述训练模块具体用于:
59.按照多种比例组合正样本用户、第一负样本用户和第二负样本用户,得到多个样本用户集;
60.利用每个样本用户集中用户的复购行为特征,分别训练预测模型;
61.从训练得到的多个预测模型中,选择损失最小的预测模型作为预测复购概率的预测模型。
62.在一些实施例中,所述复购行为特征包括:用户在最低层级类目的近期行为特征
和在最低层级类目的上级类目的近期行为特征。
63.在一些实施例中,所述近期行为特征包括:在第三指定时刻之前的第四预设时长内多个预设时间尺度的点击量、浏览量、收藏量和评论量中的一个或多个。
64.在一些实施例中,所述复购行为特征还包括以下至少一个维度特征:最低层级类目的复购属性特征,用户在最低层级类目的已购时间特征,最低层级类目的类目特征。
65.在一些实施例中,所述复购属性特征包括用户层复购指标、下单层复购指标和综合复购指标中的一个或多个;
66.所述已购时间特征包括在第三指定时刻之前的第四预设时长内首次购买最低层级类目下商品的时刻距第三指定时刻的时长、最后一次购买最低层级类目下商品的时刻距第三指定时刻的时长、购买最低层级类目下商品的平均时间间隔、购买最低层级类目下商品的次数中的一个或多个;
67.所述类目特征包括最低层级类目下的商品数量、商品价格均值、在多个预设时间尺度内的点击率和转化率的一个或多个。
68.在一些实施例中,所述用户层复购指标为最低层级类目的复购用户数量占全部购买用户数量的比例;
69.所述下单层复购指标为最低层级类目的复购次数占全部购买次数的比例;
70.所述综合复购指标为所述用户层复购指标和下单层复购指标的乘积值,或,所述综合复购指标为最低层级类目的多个复购指标的加权求平均值。
71.根据本公开的第四方面,还提供了一种商品推荐装置,包括:
72.第二确定模块,用于确定当前时刻之前的第五预设时长内被购买的目标商品和购买所述目标商品的目标用户;
73.第二提取模块,用于响应于所述目标商品所属的目标最低层级类目为复购类目,提取所述目标用户复购所述目标最低层级类目的目标复购行为特征;
74.输入模块,用于将所述目标复购行为特征输入训练得到的预测模型,获得所述目标用户的第一复购概率;
75.推荐模块,用于基于所述第一复购概率,向所述目标用户推荐所述目标最低层级类目下的商品。
76.在一些实施例中,所述装置还包括第三确定模块,用于确定所述复购类目,包括:
77.第三确定子模块,用于根据每个最低层级类目的复购指标,确定每个最低层级类目的第二复购概率;
78.第四确定子模块,用于根据每个最低层级类目的第二复购概率,确定复购类目。
79.在一些实施例中,所述复购指标的数量为多个;
80.所述第三确定子模块具体用于:
81.对每个最低层级类目的多个复购指标进行乘积处理,得到每个最低层级类目的第二复购概率;或,
82.对每个最低层级类目的多个复购指标进行加权求平均,得到每个最低层级类目的第二复购概率。
83.在一些实施例中,所述复购指标包括用户层复购指标和下单层复购指标中的一种或多种。
84.在一些实施例中,所述用户层复购指标为最低层级类目的复购次数占全部购买次数的比例;
85.所述下单层复购指标为最低层级类目的复购次数占全部购买次数的比例。
86.在一些实施例中,所述第四确定子模块具体用于:
87.将第二复购概率最高的预设数量个最低层级类目作为复购类目;或
88.将第二复购概率大于预设概率的最低层级类目作为复购类别。
89.在一些实施例中,所述第四确定子模块还用于:
90.统计最低层级类目的总数量;将预设比例的总数量作为预设数量。
91.在一些实施例中,所述推荐模块具体用于:
92.响应于所述目标最低层级类目的第一复购概率大于预设阈值,为所述目标用户建立所述目标最低层级类目的召回通路;
93.将所述召回通路融入推荐系统,所述推荐系统用于向所述目标用户推荐所述目标最低层级类目下的商品。
94.根据本公开的第五方面,还提供了一种电子设备,包括:
95.至少一个处理器;以及
96.与所述至少一个处理器通信连接的存储器;其中,
97.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面提供的任一所述的方法,或执行上述第二方面提供的任一所述的方法。
98.根据本公开的第六方面,还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述第一方面提供的任一所述的方法,或执行上述第二方面提供的任一所述的方法。
99.根据本公开的第七方面,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述第一方面提供的任一所述的方法,或执行上述第二方面提供的任一所述的方法。
100.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
101.附图用于更好地理解本方案,不构成对本公开的限定。其中:
102.图1为本公开实施例提供的预测模型的训练方法的第一种流程示意图;
103.图2为本公开实施例提供的一种商品类目的分类体系示意图;
104.图3为本公开实施例提供的预测模型的训练方法的第二种流程示意图;
105.图4为本公开实施例提供的正负样本用户选定示意图;
106.图5为本公开实施例提供的预测模型的训练方法的第三种流程示意图;
107.图6为本公开实施例提供的预测模型的训练方法的第四种流程示意图;
108.图7为本公开实施例提供的预测模型的训练方法的一个实例的示意图;
109.图8为本公开实施例提供的商品推荐方法的第一种流程示意图;
110.图9为本公开实施例提供的复购类目确定方法的一种流程示意图;
111.图10为本公开实施例提供的商品推荐方法的第二种流程示意图;
112.图11为本公开实施例提供的预测模型的训练装置的一种结构示意图;
113.图12为本公开实施例提供的商品推荐装置的一种结构示意图;
114.图13为用于实现本公开实施例提供的预测模型的训练方法或商品推荐方法的电子设备的框图;
115.图14为本公开实施例提供的电子设备的一种结构示意图。
具体实施方式
116.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
117.复购表示用户对某个商品或服务的重复购买。在电商交易中,复购是一个很重要的概念,用户重复购买得越多,代表用户对电商平台的认可度越高,电商平台的商业价值贡献率越高,电商平台的用户粘性也越高。现有的商品推荐场景中,商品推荐的方法主要包括以下两种:
118.方法一,使用统计学方案挖掘复购类目和复购时间。具体的,基于大量用户历史购买的商品或者商品所属的类目等历史购行为,构建用户复购的概率函数,利用该概率函数,推断用户对每个类目的购买概率;基于历史用户对于商品的复购间隔时间分布,构建每个类目的复购时间概率;将用户对类目的复购概率和复购时间概率相乘,得到用户对每个类目的综合复购概率;为用户召回复购概率大的类目下的商品。
119.该方法简单易懂,但该方法依据群体在类目上的复购行为和复购时间,没有考虑单个用户的近期行为,在解决复购问题时候,召回率较高,准确率不足。
120.方法二,使用模型预测用户对类目下商品的复购概率。具体地,构建基于机器学习的预测模型;从单个用户的历史购买行为中提取每个类目对应的复购特征,并将提取的复购特征输入预测模型,得到该单个用户对每个类目的复购概率;为该单个用户召回复购概率大的类目下的商品。
121.该方法中,通过挖掘用户的近期行为特征、类目的复购行为、购买时间预测用户复购概率,准确率较高。但当一个用户对已购类目无任何近期行为时候,预测模型无法准确预测复购概率,预测模型的召回率明显不足。例如,某个用户大约每两个月都会在电商平台购买卫生纸,但是最近两个月用户在电商平台无任何卫生纸的点击浏览行为,也无家庭清洁类目下的点击浏览行为,此时,预测模型不会为用户推荐卫生纸或家庭清洁类目下的商品,但其实该用户很可能有卫生纸的购买需求。
122.为了提高商品的召回率和准确率,本公开实施例提供了一种预测模型的训练方法、复购类目确定方法和商品推荐方法。为便于描述,以下以电子设备为执行主体进行说明,对此不进行限定。本公开实施例中,执行预测模型的训练方法的电子设备和执行商品推荐方法的设备可以相同,也可以不同。本公开实施例中,预测模型为机器学习模型,如极端梯度增强(extreme gradient boosting,xgboost)模型和深度神经网络(deep neural networks,dnn)模型等。
123.如图1所示,本公开实施例提供了一种预测模型的训练方法,包括如下步骤:
124.步骤s11,确定每个最低层级类目的样本用户;
125.步骤s12,提取每个样本用户复购对应的类目的复购行为特征,样本用户对应的类目包括样本用户复购对应的最低层级类目和最低层级类目的上级类目;
126.步骤s13,基于每个样本用户的复购行为特征训练预测模型。
127.本公开实施例提供的预测模型的训练方法中,电子设备提取每个样本用户复购最低层级类目的复购行为特征,并提取每个样本用户复购最低层级类目的上级类目的复购行为特征,综合最低层级类目和上级类目的复购行为特征,训练预测复购概率的预测模型。这扩宽了复购行为特征的维度,增大了训练预测模型的单个用户的复购行为数据,进而利用更大的单个用户的复购行为数据训练得到预测模型能够更为准确的预测复购概率,基于准确预测的复购概率,在提高商品推荐的准确率的同时,提高了商品的召回率。
128.上述步骤s11中,最低层级类目为商品所属的最小类目。本公开实施例中,商品总体可以按照所选定的分类标志,分成若干层级类目,并排列成一个有层次、逐级展开的分类体系。例如,如图2所示类目示意图,商品总体分为四级类目,一级类目为总类目,总类目包括日用品、食品、服装、家具、家用电器、五金电料等多个二级类目;以日用品类目为例,日用品类目包括清洁、美容、保护等多个三级类目;以清洁类目为例,清洁类目包括洗衣、洗面、洗发、洗餐具等多个四级类目。图2中,带
“‑”
的矩形框表示相应类目包括的下级类目或商品已展开,如图2中的总类目,带“+”的矩形框表示相应类目包括的下级类目或商品未展开,如图2中的食品类目和洗衣类目等。以图2为例,若洗衣类目上不再包括下级类目,而是包括多个商品,则洗衣类目即为最低层级类目。
129.本公开实施例中,在训练预测模型时,电子设备确定每个最低层级类目的样本用户,所确定的样本用户包括正样本用户和负样本用户。一个最低层级类目的正样本用户可以为购买过该最低层级类目包括的商品的用户,一个最低层级类目的负样本用户可以为未购买过该最低层级类目包括的商品的用户。
130.上述步骤s12中,最低层级类目的上级类目为层级高于该最低层级类目且包含该最低层级类目的类目,最低层级类目的上级类目可以为一个或多个。如图2所示,洗衣类目的上级类目包括三级类目中的清洁类目、二级类目中的日用品类目、以及一级类目中的总类目等。复购对应的类目表示复购对应的类目下包括的某个或多个商品。
131.针对每个最低层级类目,电子设备提取每个样本用户复购该最低层级类目的复购行为特征,以及复购该最低层级类目的每个上级类目的复购行为特征。
132.本公开实施例中,复购行为特征可以包括:用户在最低层级类目的近期行为特征和在最低层级类目的上级类目的近期行为特征。其中,近期行为特征可以包括:在第三指定时刻之前的第四预设时长内多个预设时间尺度的点击量、浏览量、收藏量和评论量中的一个或多个。
133.第三指定时刻可以根据实际需求进行设定,例如,第三指定时刻可以为训练预测模型时的当前时刻,也可以为训练预测模型之前的一个历史时刻,对此不进行限定。第四预设时长可以根据实际需求进行设定,例如,第四预设时长可以为6个月、1年或2年等。预设时间尺度可以根据实际需求进行设定,例如,预设时间尺度可以为1天、7天、1个月、3个月、6个月和12个月等。
134.以图2所示的洗衣类目为例,第三指定时刻为当前时刻,第四预设时长为1年,预设时间尺度可以包括7天、1个月、3个月、6个月和12个月,近期行为特征包括点击量、浏览量、收藏量和评论。电子设备可以从当前时刻之前的1年内,分别提取样本用户在洗衣类目的7天、1个月、3个月、6个月和12个月内的点击量、浏览量、收藏量和评论量,提取样本用户在清洁类目(即洗衣类目的上一级类目)的7天、1个月、3个月、6个月和12个月内的点击量、浏览量、收藏量和评论量,提取样本用户在日用品类目(即洗衣类目的上二级类目、清洁类目的上一级类目)的7天、1个月、3个月、6个月和12个月内的点击量、浏览量、收藏量和评论量,提取样本用户在总类目(即洗衣类目的上三级类目、清洁类目的上二级类目、日用品类目的上一级类目)的7天、1个月、3个月、6个月和12个月内的点击量、浏览量、收藏量和评论量。
135.本公开实施例中,电子设备提取用户在最低层级类目的多个预设时间尺度的近期行为特征,并提取用户在最低层级类目的相关类目的多个预设时间尺度的近期行为特征,进而可以利用用户在最低层级类目以及相关类目的近期行为特征,训练预测模型。这样,即使用户在最低层级类目的近期行为特征较少,也可以借助于用户在相关类目的近期行为特征,增大预测模型的训练数据,进而提高预测模型预测复购概率的准确率。
136.此外,本公开实施例中,将近期行为特征细分为多个预设时间尺度下的特征,这进一步增加了特征的数据量,进而进一步提高了预测模型预测复购概率的准确率。
137.在一些实施例中,复购行为特征还可以包括以下至少一个维度特征:最低层级类目的复购属性特征,用户在最低层级类目的已购时间特征,最低层级类目的类目特征。
138.1)复购属性特征可以包括:用户层复购指标、下单层复购指标和综合复购指标中的一个或多个。
139.a,用户层复购指标可以为最低层级类目的复购用户数量占全部购买用户数量的比例。一个最低层级类目的用户层复购指标可以采用如下公式(1)表示:
140.p
repeat-uv
=u1/u
2 (1)
141.公式(1)中,p
repeat-uv
表示最低层级类目的用户层复购指标,也可以理解为针对最低层级类目的用户层复购概率,u1表示最低层级类目的复购用户数量,即购买该最低层级类目下的商品的次数大于等于2次的用户数量,u2表示最低层级类目的全部购买用户数量,即购买最低层级类目下的商品的总用户数量。
142.例如,最低层级类目1包括商品a、b、c。用户1购买了1次商品a,购买了1次商品b;用户2购买了1次商品a;用户3购买了1次商品a,购买了1次商品b,购买了3次商品c。此时,最低层级类目1的复购用户包括用户1和用户3,即u1=2,最低层级类目1的全部购买用户包括用户1、用2和用户3,即u2=3,此时,最低层级类目1的用户层复购指标p
repeat-uv
=2/3。
143.本公开实施例中,用户层复购指标可以采用其他形式表示,例如,用户层复购指标可以为最低层级类目的复购用户数量占所有最低层级类目的全部购买用户数量的比例,对此不进行限定,只要是从用户角度确定用户层复购指标即可。
144.b,下单层复购指标可以为最低层级类目的复购次数占全部购买次数的比例。一个最低层级类目的下单层复购指标可以采用如下公式(2)表示:
145.p
repeat-pv
=c1/c2ꢀꢀ
(2)
146.公式(2)中,p
repeat-pv
表示最低层级类目的下单层复购指标,也可以理解为针对最低层级类目的下单层复购概率,c1表示最低层级类目的复购次数,即针对最低层级类目下
的商品的非首次下单次数,c2表示最低层级类目的全部购买次数,即针对最低层级类目下的商品的总下单次数。
147.例如,最低层级类目1包括商品a、b、c。用户1购买了1次商品a,购买了1次商品b;用户2购买了1次商品a;用户3购买了1次商品a,购买了1次商品b,购买了3次商品c。此时,最低层级类目1的复购次数包括用户1的1次复购和用户3的2次复购,即c1=1+2=3,最低层级类目1的全部购买次数包括用户1的2次复购、用2的1次复购和用户3的3次复购,即c2=2+1+3=6,此时,最低层级类目1的下单层复购指标p
repeat-pv
=3/6。
148.本公开实施例中,下单层复购指标可以采用其他形式表示,例如,下单层复购指标可以为最低层级类目的复购次数占所有最低层级类目的全部购买次数的比例,对此不进行限定,只要是从下单角度确定下单层复购指标即可。
149.c,综合复购指标为综合用户层复购指标和下单层复购指标所得到得到的一个复购指标。
150.本公开实施例中,综合复购指标可以为用户层复购指标和下单层复购指标的乘积值。此时,综合复购指标可以采用如下公式(3)表示:
151.p
repeat
=p
repeat-uv
*p
repeat-pv
ꢀꢀ
(3)
152.公式(3)中,p
repeat
表示最低层级类目的综合复购指标,p
repeat-uv
表示最低层级类目的用户层复购指标,p
repeat-pv
表示最低层级类目的下单层复购指标。
153.综合复购指标还可以为最低层级类目的多个复购指标的加权求平均值。此时综合复购指标可以采用如下公式(4)表示:
154.p
repeat
=(w1p
repeat-uv
+w2p
repeat-pv
)/(w1+w2) (4)
155.公式(3)中,p
repeat
表示最低层级类目的综合复购指标,p
repeat-uv
表示最低层级类目的用户层复购指标,p
repeat-pv
表示最低层级类目的下单层复购指标,w1表示的p
repeat-uv
的权重,w2表示的p
repeat-pv
的权重。
156.本公开实施例中,从多种角度确定复购属性特征,提高了复购属性特征的多样性,进而提高了基于复购属性特征训练得到的预测模型的准确性。
157.2)已购时间特征可以包括:在第三指定时刻之前的第四预设时长内首次购买最低层级类目下商品的时刻距第三指定时刻的时长、最后一次购买最低层级类目下商品的时刻距第三指定时刻的时长、购买最低层级类目下商品的平均时间间隔、购买最低层级类目下商品的次数中的一个或多个。
158.已购时间特征是在第三指定时刻之前的第四预设时长内进行统计得到的特征。
159.例如,针对每个样本用户和每个最低层级类目,电子设备提取在第三指定时刻之前的第四预设时长内该样本用户首次购买该最低层级类目下商品的时刻距第三指定时刻的时长、最后一次购买该最低层级类目下商品的时刻距第三指定时刻的时长、购买该最低层级类目下商品的平均时间间隔、购买该最低层级类目下商品的次数等已购时间特征。
160.本公开实施例中,训练预测模型的复购行为特征增加了时间因素,即已购时间特征,这进一步提高了复购属性特征的多样性,进而提高了基于复购属性特征训练得到的预测模型的准确性。
161.3)类目特征包括最低层级类目下的商品数量、商品价格均值、在多个预设时间尺度内的点击率和转化率的一个或多个。
162.其中,点击率为最低层级类目下的商品的点击次数和最低层级类目下的商品查看次数的比值,转化率为最低层级类目下的商品的购买次数和最低层级类目下的商品查看次数的比值。
163.本公开实施例中,训练预测模型的复购行为特征增加了类目本身的特征,这进一步提高了复购属性特征的多样性,进而提高了基于复购属性特征训练得到的预测模型的准确性。
164.本公开实施例中,电子设备通过4个维度的特征来描述复购行为,即近期行为特征、最低层级类目的复购属性特征,用户在最低层级类目的已购时间特征,最低层级类目的类目特征,使得训练预测模型的特征更加适合于复购场景,提高了基于复购属性特征训练得到的预测模型的准确性。
165.上述步骤s13中,电子设备将上述每个样本用户的复购行为特征输入预测模型,对预测模型进行训练。
166.例如,样本用户分为正样本用户和负样本用户。电子设备将每个样本用户的复购行为特征输入预测模型,预测模型输出每个样本用户的复购概率,调整预测模型的参数,重新将每个样本用户的复购行为特征输入预测模型,进行迭代训练,使得正样本用户的复购概率接近于1,负样本用户的复购概率接近于0。如此迭代训练,直至达到训练结束条件。
167.在一些实施例中,如图3所示,本公开实施例还提供了一种预测模型的训练方法,可以包括如下步骤:
168.步骤s31,确定第一指定时刻之后的第一预设时长内购买商品的用户作为备选用户。
169.本公开实施例中,第一指定时刻可以为任一历史时刻。第一预设时长可以根据实际需求进行设定。例如,第一预设时长可以为1天、2天或7天等。
170.电子设备在训练预测模型时,电子设备选定第一指定时刻,将第一指定时刻之后的第一预设时长内购买商品的用户作为备选用户。例如图4所示的正负样本用户选定示意图,图4中,时间点1为第一指定时刻,第一预设时长为7天,电子设备将在时间点1之后7天内购买商品的用户作为备选用户,即图4中时间期限1内下单的用户为备选用户。备选用户的数量可以为一个或多个。
171.步骤s32,确定第二指定时刻之后的第二预设时长内购买每个最低层级类目的备选用户为该最低层级类目的正样本用户,并确定第二指定时刻之后的第二预设时长内未购买每个最低层级类目的备选用户为该最低层级类目的负样本用户,第二指定时刻在第一指定时刻之后,且第二指定时刻与第一指定时刻之间的时长为第三预设时长。
172.本公开实施例中,电子设备在确定第一指定时刻之后,确定第二指定时刻。第二指定时刻可以为第一指定时刻之后的历史时刻,且第二指定时刻与第一指定时刻之间的时长为第三预设时长。第二预设时长可以根据实际需求进行设定。例如,第二预设时长可以为1个月、6个月或1年等。第三预设时长根据实际需求进行设定。例如,第三预设时长可以为1天、7天或14天等。
173.针对每个最低层级类目和每个备选用户,若该备选用户在第二指定时刻之后的第二预设时长内购买了该最低层级类目下的商品,则该备选用户为该最低层级类目的正样本用户;否则,该备选用户为该最低层级类目的负样本用户。
174.仍以图4为例进行说明,图4中,第三预设时长为14天,即时间点2为第二指定时刻,第二预设时长为1年;对于最低层级类目1,电子设备将在时间点2之后1年内购买了最低层级类目1下的商品的用户作为正样本用户,即图4中时间期限2内下单最低层级类目1下的商品的用户为最低层级类目1的正样本用户;将在时间点2之后1年内未购买最低层级类目1下的商品的用户作为最低层级类目1的负样本用户,即图4中时间期限2内未下单最低层级类目1下的商品的用户为最低层级类目1的负样本用户。
175.步骤s33,提取每个样本用户复购对应的类目的复购行为特征,样本用户对应的类目包括样本用户复购对应的最低层级类目和最低层级类目的上级类目。与上述步骤s12相同。
176.步骤s34,基于每个样本用户的复购行为特征训练预测模型。与上述步骤s13相同。
177.应用本公开实施例提供的技术方案,电子设备基于不同时间段内用户购买行为,将用户分为正样本用户和负样本用户,保证了样本的多样性;利用多样的正样本用户和负样本用户训练预测模型,提高了预测模型的准确率。
178.在一些实施例中,如图5所示,本公开实施例还提供了一种预测模型的训练方法,可以包括如下步骤:
179.步骤s51,确定第一指定时刻之后的第一预设时长内购买商品的用户作为备选用户。与上述步骤s31相同。
180.步骤s52,确定第二指定时刻之后的第二预设时长内购买每个最低层级类目的备选用户为该最低层级类目的正样本用户。与上述步骤s32中确定正样本用户的步骤相同。
181.步骤s53,针对每个最低层级类目,确定第二指定时刻之后的第二预设时长内未购买任何最低层级类目的备选用户为该最低层级类目的第一负样本用户,并确定第二指定时刻之后的第二预设时长内未购买该最低层级类目且购买其他最低层级类目的备选用户为该最低层级类目的第二负样本用户。
182.仍以图4为例进行说明。图4中,第三预设时长为14天,即时间点2为第二指定时刻,第二预设时长为1年;对于最低层级类目1,电子设备确定在时间点2之后的1年内未购买任何最低层级类目的用户为最低层级类目1的第一负样本用户,即图4中时间期限2内未下单任何最低层级类目下的商品的用户为最低层级类目1的第一负样本用户;确定在时间点2之后的1年内未购买最低层级类目1,但是购买了其他最低层级类目的用户为最低层级类目1的第二负样本用户,即图4中时间期限2内未下单最低层级类目1下的商品,但下单其他最低层级类目下的商品的用户为最低层级类目1的第二负样本用户。
183.本公开实施例不限定步骤s52和s53的执行顺序。
184.步骤s54,提取每个样本用户复购对应的类目的复购行为特征,样本用户对应的类目包括样本用户复购对应的最低层级类目和最低层级类目的上级类目。与上述步骤s12相同。
185.步骤s55,基于每个样本用户的复购行为特征训练预测模型。与上述步骤s13相同。
186.应用本公开实施例提供的技术方案,电子设备细化了负样本用户,进一步丰富了样本的多样性,进而进一步提高了预测模型的准确率。
187.此外,在针对每个最低层级类目,确定负样本用户时,电子设备根据备选用户在未购买该最低层级类目下的商品的情况下,是否也未购买其他最低层级类目的商品,将负样
本用户分为第一负样本用户和第二负样本用户,对于负样本用户进行更为细致的划分,将细致划分后的负样本用户的复购行为特征输入预测模型,以训练预测模型,可以提升预测模型的区分度,进而提高预测模型的准确率。
188.在一些实施例中,如图6所示,本公开实施例还提供了一种预测模型的训练方法,可以包括如下步骤:
189.步骤s61,确定第一指定时刻之后的第一预设时长内购买商品的用户作为备选用户。与上述步骤s31相同。
190.步骤s62,确定第二指定时刻之后的第二预设时长内购买每个最低层级类目的备选用户为该最低层级类目的正样本用户。与上述步骤s32中确定正样本用户的步骤相同。
191.步骤s63,针对每个最低层级类目,确定第二指定时刻之后的第二预设时长内未购买任何最低层级类目的备选用户为该最低层级类目的第一负样本用户,并确定第二指定时刻之后的第二预设时长内未购买该最低层级类目且购买其他最低层级类目的备选用户为该最低层级类目的第二负样本用户。与上述步骤s53中确定负样本用户的步骤相同。
192.步骤s64,提取每个样本用户复购对应的类目的复购行为特征,样本用户对应的类目包括样本用户复购对应的最低层级类目和最低层级类目的上级类目。与上述步骤s12相同。
193.步骤s65,按照多种比例组合正样本用户、第一负样本用户和第二负样本用户,得到多个样本用户集。
194.本公开实施例中,样本用户的组合比例可以根据实际需求进行设定。例如,正样本用户、第一负样本用户和第二负样本用户的组合比例可以为5:4:1、5:3:2、5:2:3或5:1:4等,如图7所示的样本用户的组合比例,图7所示的样本用户区域中,带右倾斜填充的矩形框表示正样本用户,带网格填充的矩形框表示第一负样本用户,带竖线填充的矩形框表示第二负样本用户。
195.电子设备在获得正样本用户、第一负样本用户和第二负样本用户之后,按照多种比例组合正样本用户、第一负样本用户和第二负样本用户,得到多个样本用户集,如图7所示,得到4个样本用户集,即样本用户集a-d。
196.步骤s66,利用每个样本用户集中用户的复购行为特征,分别训练预测模型。
197.针对每个样本用户集,电子设备将该样本用户集中每个用户的复购行为特征输入预测模型,对预测模型进行训练。电子设备利用多个样本用户集,训练得到多个预测模型,如图7所示,电子设备利用4个样本用户集训练得到4个预测模型。
198.步骤s67,从训练得到的多个预测模型中,选择损失最小的预测模型作为预测复购概率的预测模型。
199.对于训练得到的预测模型,其损失越小,准确率越高,召回率也越高。因此,电子设备在训练得到的多个预测模型后,从训练得到的多个预测模型中,选择损失最小的预测模型,将所选择的预测模型作为后续预测复购概率的预测模型。
200.本公开实施例中,预测模型的损失可以采用roc曲线与坐标轴形成的面积(areaunderroc,auc)来衡量。例如,当auc越接近1.0,预测模型的损失越小,预测模型的准确率越高;当auc越接近0.5,预测模型的损失越大,预测模型的准确率越低。此时,电子设备可以选择auc最大的预测模型作为后续预测复购概率的预测模型,如图7所示。本公开实施
例中,预测模型的损失还可以采用其他参数进行衡量,对此不进行限定。
201.应用本公开实施例提供的技术方案,电子设备按照多种比例组合正样本用户、第一负样本用户和第二负样本用户,进而得到多个样本用户集,利用样本用户集中的特征,分别对预测模型进行训练,以选取准确率最高的预测模型,用于复购概率预测以及复购商品推荐,提高了商品推荐的准确率和召回率。
202.基于上述训练得到的预测模型,本公开实施例还提供的一种商品推荐方法,参见图8,图8为本公开实施例提供的商品推荐方法的第一种流程示意图,包括如下步骤:
203.步骤s81,确定当前时刻之前的第五预设时长内被购买的目标商品和购买目标商品的目标用户;
204.步骤s82,响应于目标商品所属的目标最低层级类目为复购类目,提取目标用户复购目标最低层级类目的目标复购行为特征;
205.步骤s83,将目标复购行为特征输入训练得到的预测模型,获得目标用户的第一复购概率;
206.步骤s84,基于第一复购概率,向目标用户推荐目标最低层级类目下的商品。
207.本公开实施例提供的技术方案中,电子设备在当前时刻之前的第五预设时长内被购买的目标商品所属的目标最低层级类目为复购类目的情况下,再利用预测模型,向目标用户推荐商品,提高了商品推荐的准确率和召回率。此外,在利用预测模型,向目标用户推荐商品时,电子设备提取目标用户复购目标最低层级类目的目标复购行为特征,该目标复购行为特征综合了最低层级类目和上级类目的复购行为特征,扩宽了复购行为特征的维度,提高了预测模型预测复购概率的准确率,进一步提高了商品推荐的准确率和召回率。
208.在上述步骤s81中,第五预设时长可以根据实际需求进行设定。例如,第五预设时长可以为7天、14天或1个月等。当前时刻为进行商品推荐的时刻。
209.电子设备可以根据各个用户的购买记录,确定当前时刻之前的第五预设时长内被购买的商品作为目标商品,确定当前时刻之前的第五预设时长内购买目标商品的用户作为目标用户。目标用户的数量可以为一个或多个。
210.在上述步骤s82中,复购类目为复购概率较大的最低层级类目,复购类目的数量可以为一个或多个。为便于描述,本公开实施例中,将目标商品所属的最低层级类目简称为目标最低层级类目。
211.电子设备在确定目标商品后,可以判断目标最低层级类目是否为复购类目;若目标最低层级类目为复购类目,则电子设备提取目标用户复购目标最低层级类目的复购行为特征,即目标复购行为特征;若目标最低层级类目为复购类目,则电子设备可以不做任何处理,以解决电子设备的计算资源。
212.这里,目标复购行为特征的具体含义和用途,可以参见步骤s12部分的相关描述,此处不再赘述。
213.在上述步骤s83中,预测模型的训练过程可参见上述图1-7部分的相关描述。电子设备在提取到目标复购行为特征后,将目标复购行为特征输入预测模型,预测模型对目标复购行为特征进行处理后,输出目标用户复购目标最低层级类目下商品的概率,即目标用户的第一复购概率。进而基于第一复购概率,电子设备执行步骤s84,向目标用户推荐目标最低层级类目下的商品。
214.在一些实施例中,如图9所示,本公开实施例还提供了一种复购类目确定方法,可以包括以下步骤:
215.步骤s91,根据每个最低层级类目的复购指标,确定每个最低层级类目的第二复购概率。
216.本公开实施例中,复购指标可以包括用户层复购指标和下单层复购指标中的一种或多种。其中,用户层复购指标可以为最低层级类目的复购用户数量占全部购买用户数量的比例;下单层复购指标可以为最低层级类目的复购次数占全部购买次数的比例。具体的用户层复购指标和下单层复购指标还可以采用其他形式表示,具体可参见步骤s12部分的相关描述,此处不再赘述。
217.电子设备获取每个最低层级类目的复购指标;针对每个最低层级类目,电子设备确定该最低层级类目的复购概率,即第二复购概率。本公开实施例中,第二复购概率即为上述综合复购指标。这种情况下,第二复购概率可以为用户层复购指标和下单层复购指标的乘积值,或,为最低层级类目的多个复购指标的加权求平均值,也就是,上述步骤s91可以采用如下两种方式中的任一种方式实现:
218.方式一,对每个最低层级类目的多个复购指标进行乘积处理,得到每个最低层级类目的第二复购概率。
219.方式二,对每个最低层级类目的多个复购指标进行加权求平均,得到每个最低层级类目的第二复购概率。
220.步骤s92,根据每个最低层级类目的第二复购概率,确定复购类目。
221.在获得每个最低层级类目的第二复购概率后,电子设备根据每个最低层级类目的第二复购概率,从多个最低层级类目中确定复购类目。
222.在一些实施例中,步骤s92可以为:将第二复购概率最高的预设数量个最低层级类目作为复购类目。
223.预设数量可以为预先设定的具体数值,如30、50、100或400等。预设数量也可以根据最低层级类目的总数量和预设比例确定,例如,电子设备可以统计最低层级类目的总数量;将预设比例的总数量作为预设数量。预设比例的大小可以根据实际需求进行设定,如20%、30%或35%等。以预设比例为30%为例,电子设备可以统计最低层级类目的总数量为1000,则预设数量为:1000*30%=300。
224.在另一些实施例中,步骤s92可以为:将第二复购概率大于预设概率的最低层级类目作为复购类目。
225.预设概率可以根据实际需求进行设定,如0.70、0.75、0.8或0.9等。以预设概率为0.7为例,电子设备可以将第二复购概率大于0.7的最低层级类目作为复购类目。
226.本公开实施例中,电子设备还可以采用其他方式确定复购类目,对此不进行限定。
227.应用本公开实施例提供的技术方案,电子设备在群体的角度,统计每个最低层级类目的复购指标,确定每个最低层级类目的第二复购概率,进而筛选出复购类目,后续仅对复购类目下的用户复购行为预测,确定是否向用户推荐复购类目下的商品,减轻了电子设备的负担,同时提高了商品推荐的准确率和召回率。
228.在一些实施例中,如图10所示,本公开实施例还提供了一种商品推荐方法,可以包括如下步骤:
229.步骤s101,确定当前时刻之前的第五预设时长内被购买的目标商品和购买目标商品的目标用户。与上述步骤s81相同。
230.步骤s102,响应于目标商品所属的目标最低层级类目为复购类目,提取目标用户复购目标最低层级类目的目标复购行为特征。与上述步骤s82相同。
231.步骤s103,将目标复购行为特征输入训练得到的预测模型,获得目标用户的第一复购概率。与上述步骤s83相同。
232.步骤s104,响应于目标最低层级类目的第一复购概率大于预设阈值,为目标用户建立目标最低层级类目的召回通路。
233.本公开实施例中,预设阈值可以根据实际需求进行设定,如预设阈值可以为0.6、0.7或0.8等。电子设备在获取到目标最低层级类目的第一复购概率后,判断标最低层级类目的第一复购概率是否大于预设阈值;若大于预设阈值,则电子设备为该目标用户建立目标最低层级类目的召回通路。该召回通路用于从目标最低层级类目的资源池中召回目标最低层级类目下的商品。
234.步骤s105,将召回通路融入推荐系统,推荐系统用于向目标用户推荐目标最低层级类目下的商品。
235.本公开实施例中,推荐系统用于调用召回通路从目标最低层级类目的资源池中召回目标最低层级类目下的商品,并向召回通路对应的用户推荐所召回的商品。
236.在建立目标最低层级类目的召回通路之后,电子设备将该召回通路融入推荐系统。这种情况下,推荐系统可以调用目标最低层级类目的召回通路,召回目标最低层级类目下的商品,进而向目标用户推荐所召回的商品。
237.本公开实施例提供的技术方案中,电子设备通过为目标用户建立召回通路,来实现向目标用户推荐目标最低层级类目下的商品的目的,可以准确的完成商品的推荐,即提高了商品推荐的准确率。
238.此外,在商品推荐的准确率提高的情况下,用户可以获得其感兴趣的商品信息,有助于提高商品推荐的业务规模,以及业务的商品交易总额(gross merchandise volume,gmv),提高电商平台的商业价值贡献率以及用户粘性。
239.基于相同的发明构思,与上述预测模型的训练方法实施例对应,本公开实施例还提供了一种预测模型的训练装置,参见图11,图11为本公开实施例提供的预测模型的训练装置的一种结构示意图,该装置包括:
240.第一确定模块111,用于确定每个最低层级类目的样本用户;
241.第一提取模块112,用于提取每个样本用户复购对应的类目的复购行为特征,样本用户对应的类目包括样本用户复购对应的最低层级类目和最低层级类目的上级类目;
242.训练模块113,用于基于每个样本用户的复购行为特征训练预测模型。
243.本公开实施例提供的预测模型的训练装置中,电子设备提取每个样本用户复购最低层级类目的复购行为特征,并提取每个样本用户复购最低层级类目的上级类目的复购行为特征,综合最低层级类目和上级类目的复购行为特征,训练预测复购概率的预测模型。这扩宽了复购行为特征的维度,增大了训练预测模型的单个用户的复购行为数据,进而利用更大的单个用户的复购行为数据训练得到预测模型能够更为准确的预测复购概率,基于准确预测的复购概率,在提高商品推荐的准确率的同时,提高了商品的召回率。
244.在一些实施例中,第一确定模块111可以包括:
245.第一确定子模块,用于确定第一指定时刻之后的第一预设时长内购买商品的用户作为备选用户;
246.第二确定子模块,用于确定第二指定时刻之后的第二预设时长内购买每个最低层级类目的备选用户为该最低层级类目的正样本用户,并确定第二指定时刻之后的第二预设时长内未购买每个最低层级类目的备选用户为该最低层级类目的负样本用户,第二指定时刻在第一指定时刻之后,且第二指定时刻与第一指定时刻之间的时长为第三预设时长。
247.在一些实施例中,第二确定子模块具体可以用于:
248.针对每个最低层级类目,确定第二指定时刻之后的第二预设时长内未购买任何最低层级类目的备选用户为该最低层级类目的第一负样本用户,并确定第二指定时刻之后的第二预设时长内未购买该最低层级类目且购买其他最低层级类目的备选用户为该最低层级类目的第二负样本用户。
249.在一些实施例中,训练模块113具体可以用于:
250.按照多种比例组合正样本用户、第一负样本用户和第二负样本用户,得到多个样本用户集;
251.利用每个样本用户集中用户的复购行为特征,分别训练预测模型;
252.从训练得到的多个预测模型中,选择损失最小的预测模型作为预测复购概率的预测模型。
253.在一些实施例中,复购行为特征可以包括:用户在最低层级类目的近期行为特征和在最低层级类目的上级类目的近期行为特征。
254.在一些实施例中,近期行为特征可以包括:在第三指定时刻之前的第四预设时长内多个预设时间尺度的点击量、浏览量、收藏量和评论量中的一个或多个。
255.在一些实施例中,复购行为特征还可以包括以下至少一个维度特征:最低层级类目的复购属性特征,用户在最低层级类目的已购时间特征,最低层级类目的类目特征。
256.在一些实施例中,复购属性特征可以包括用户层复购指标、下单层复购指标和综合复购指标中的一个或多个;
257.已购时间特征包括在第三指定时刻之前的第四预设时长内首次购买最低层级类目下商品的时刻距第三指定时刻的时长、最后一次购买最低层级类目下商品的时刻距第三指定时刻的时长、购买最低层级类目下商品的平均时间间隔、购买最低层级类目下商品的次数中的一个或多个;
258.类目特征包括最低层级类目下的商品数量、商品价格均值、在多个预设时间尺度内的点击率和转化率的一个或多个。
259.在一些实施例中,用户层复购指标可以为最低层级类目的复购用户数量占全部购买用户数量的比例;
260.下单层复购指标为最低层级类目的复购次数占全部购买次数的比例;
261.综合复购指标为用户层复购指标和下单层复购指标的乘积值,或,综合复购指标为最低层级类目的多个复购指标的加权求平均值。
262.基于相同的发明构思,与上述商品推荐方法实施例对应,本公开实施例还提供了一种商品推荐装置,参见图12,图12为本公开实施例提供的商品推荐装置的一种结构示意
图,该装置包括:
263.第二确定模块121,用于确定当前时刻之前的第五预设时长内被购买的目标商品和购买目标商品的目标用户;
264.第二提取模块122,用于响应于目标商品所属的目标最低层级类目为复购类目,提取目标用户复购目标最低层级类目的目标复购行为特征;
265.输入模块123,用于将目标复购行为特征输入训练得到的预测模型,获得目标用户的第一复购概率;
266.推荐模块124,用于基于第一复购概率,向目标用户推荐目标最低层级类目下的商品。
267.本公开实施例提供的技术方案中,电子设备在当前时刻之前的第五预设时长内被购买的目标商品所属的目标最低层级类目为复购类目的情况下,再利用预测模型,向目标用户推荐商品,提高了商品推荐的准确率和召回率。此外,在利用预测模型,向目标用户推荐商品时,电子设备提取目标用户复购目标最低层级类目的目标复购行为特征,该目标复购行为特征综合了最低层级类目和上级类目的复购行为特征,扩宽了复购行为特征的维度,提高了预测模型预测复购概率的准确率,进一步提高了商品推荐的准确率和召回率。
268.在一些实施例中,上述装置还可以包括第三确定模块,用于确定复购类目,包括:
269.第三确定子模块,用于根据每个最低层级类目的复购指标,确定每个最低层级类目的第二复购概率;
270.第四确定子模块,用于根据每个最低层级类目的第二复购概率,确定复购类目。
271.在一些实施例中,复购指标的数量可以为多个;
272.第三确定子模块具体用于:
273.对每个最低层级类目的多个复购指标进行乘积处理,得到每个最低层级类目的第二复购概率;或,
274.对每个最低层级类目的多个复购指标进行加权求平均,得到每个最低层级类目的第二复购概率。
275.在一些实施例中,其中,复购指标可以包括用户层复购指标和下单层复购指标中的一种或多种。
276.在一些实施例中,用户层复购指标可以为最低层级类目的复购次数占全部购买次数的比例;
277.下单层复购指标为最低层级类目的复购次数占全部购买次数的比例。
278.在一些实施例中,第四确定子模块具体可以用于:
279.将第二复购概率最高的预设数量个最低层级类目作为复购类目;或
280.将第二复购概率大于预设概率的最低层级类目作为复购类别。
281.在一些实施例中,第四确定子模块还用于:
282.统计最低层级类目的总数量;将预设比例的总数量作为预设数量。
283.在一些实施例中,推荐模块具体可以用于:
284.响应于目标最低层级类目的第一复购概率大于预设阈值,为目标用户建立目标最低层级类目的召回通路;
285.将召回通路融入推荐系统,推荐系统用于向目标用户推荐目标最低层级类目下的
商品。
286.本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
287.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
288.图13示出了可以用来实施本公开的实施例的示例电子设备130的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
289.如图13所示,设备130包括计算单元131,其可以根据存储在只读存储器(rom)132中的计算机程序或者从存储单元138加载到随机访问存储器(ram)133中的计算机程序,来执行各种适当的动作和处理。在ram 133中,还可存储设备130操作所需的各种程序和数据。计算单元131、rom 132以及ram 133通过总线134彼此相连。输入/输出(i/o)接口135也连接至总线134。
290.设备130中的多个部件连接至i/o接口135,包括:输入单元136,例如键盘、鼠标等;输出单元137,例如各种类型的显示器、扬声器等;存储单元138,例如磁盘、光盘等;以及通信单元139,例如网卡、调制解调器、无线通信收发机等。通信单元139允许设备130通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
291.计算单元131可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元131的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元131执行上文所描述的各个方法和处理,例如预测模型训练方法或者商品推荐方法。例如,在一些实施例中,预测模型训练方法或者商品推荐方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元138。在一些实施例中,计算机程序的部分或者全部可以经由rom 132和/或通信单元139而被载入和/或安装到设备130上。当计算机程序加载到ram 133并由计算单元131执行时,可以执行上文描述的预测模型训练方法或者商品推荐方法的一个或多个步骤。备选地,在其他实施例中,计算单元131可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行预测模型训练方法或者商品推荐方法。
292.本公开实施例还提供了一种电子设备,如图14所示,包括:至少一个处理器141;以及与至少一个处理器通信连接的存储器142;其中,
293.存储器142存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述预测模型训练方法或者商品推荐方法。
294.本公开实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述预测模型训练方法或者商品推荐方法。
295.本公开实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述预测模型训练方法或者商品推荐方法。
296.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
297.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
298.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
299.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
300.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
301.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
302.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例
如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
303.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。