一种基于大数据的商品推荐方法及装置与流程

文档序号:17148610发布日期:2019-03-19 23:13阅读:244来源:国知局
一种基于大数据的商品推荐方法及装置与流程

本发明涉及大数据处理技术领域,具体涉及一种基于大数据的商品推荐方法及装置。



背景技术:

在家装领域,尤其是地板、瓷砖等用品,用户的复购率一般较低,难以通过用户的历史数据预测购买行为,而在销售过程中,如何准确把握用户的购买需求,进而推荐用户需要的商品是一个十分重要的环节。传统的推荐行为大多根据销售人员的行业经验来判断,而面对新用户时,不确定因素太多,导致推荐商品的准确度起伏较大。

基于大数据,通过对前期沉淀的消费者购买行为和商品信息形成比较稳定的购物模型,通过获取新用户的信息数据,形成用户画像,可以提供一种比较稳定的商品推荐方式,因此,如何利用大数据对新用户提供较高准确度的商品推荐成为值得解决的问题。



技术实现要素:

本发明提供一种基于大数据的商品推荐方法及装置,能够对新用户提供较高准确度的商品推荐。

本发明提供的一种基于大数据的商品推荐方法,包括以下步骤:

步骤a、收集已成交商品的商品数据和用户数据,对所述用户数据进行预处理,形成包含商品数据和用户数据的特征样本;

步骤b、根据所述特征样本构建模型;

步骤c、获取新用户的行为记录数据;

步骤d、为新用户发送排序后的推荐商品数据。

进一步,所述步骤a中:

所述商品信息包括;商品的名称、型号、规格、价格;

所述用户数据包括:用户的个人基本信息、地理位置信息、浏览记录信息、消费记录信息、与所述浏览记录信息、消费记录信息对应的时间信息;

所述预处理包括:数据清洗、填充、归一化在内的操作。

进一步,所述步骤b具体包括:

步骤b1、设置使损失函数极小化的常数值,计算损失函数的负梯度在当前模型的值,作为残差值;

步骤b2、设置回归树的叶节点区域,拟合得出残差值;

步骤b3、利用线性搜索估计节点区域的值,使损失函数极小化;

步骤b4、更新回归树,得到输出的模型。

进一步,所述步骤c中新用户的行为记录数据具体包括:用户的个人基本信息、地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息。

进一步,所述步骤d具体包括:

步骤d1、将所述新用户的行为记录数据与所述模型进行关联度匹配,按关联度排序;其中,对地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息、用户的个人基本信息按由大到小的顺序赋予不同权重;

步骤d2、根据匹配的结果获取待推荐的商品信息;

步骤d3、将所述待推荐商品按照商品被购买的概率由大到小排列进行排序,生成推荐商品集合;

步骤d4、将所述推荐商品集合的商品数据发送给所述新用户。

进一步,所述步骤d3中商品被购买的概率由如下公式计算获得:

d表示用户购买商品的概率,u表示新用户,in(i)表示指向商品i的商品集合,out(j)表示商品j指向的商品集合,pr(j)表示商品j的被购买概率,pr(i)即为商品i的被购买概率。

进一步,所述商品集合根据大于支持度阈值的商品组成,所述支持度表示商品同时被购买的概率,由如下公式计算获得:

freq(a∩b)表示商品a和商品b同时被购买的次数,n表示总销售笔数,support(a∩b)为商品a和商品b同时被购买的概率,即为商品a和商品b的支持度。

本发明提供的一种基于大数据的商品推荐装置,包括计算机可读介质,所述介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述任一项所述的方法。

本发明的有益效果是:本发明公开一种基于大数据的商品推荐方法及装置,通过收集已成交商品的商品数据和用户数据,形成特征样本,进而构建模型;通过获取新用户的行为记录数据,为新用户推荐个性化的商品,并对所述商品进行排序,本发明能够对新用户提供较高准确度的商品推荐。

附图说明

下面结合附图和实例对本发明作进一步说明。

图1是本发明实施例一种基于大数据的商品推荐方法的流程图;

图2是本发明实施例一种基于大数据的商品推荐方法步骤b的流程图;

图3是本发明实施例一种基于大数据的商品推荐方法步骤d的流程图。

具体实施方式

参考图1~3,本发明实施例提供的一种基于大数据的商品推荐方法,其特征在于,包括以下步骤:

步骤a、收集已成交商品的商品数据和用户数据,对所述用户数据进行预处理,形成包含商品数据和用户数据的特征样本;

步骤b、根据所述特征样本构建模型;

步骤c、获取新用户的行为记录数据;

步骤d、为新用户发送排序后的推荐商品数据。

进一步,所述步骤a中:

所述商品信息包括;商品的名称、型号、规格、价格;

所述用户数据包括:用户的个人基本信息、地理位置信息、浏览记录信息、消费记录信息、与所述浏览记录信息、消费记录信息对应的时间信息,所述个人基本信息包括姓名、性别、年龄、电话。

所述预处理包括:数据清洗、填充、归一化在内的操作,所述数据清洗包括清除异常数据和无用数据。

进一步,所述步骤b具体包括:

步骤b1、设置使损失函数极小化的常数值,计算损失函数的负梯度在当前模型的值,作为残差值;

步骤b2、设置回归树的叶节点区域,拟合得出残差值;

步骤b3、利用线性搜索估计节点区域的值,使损失函数极小化;

步骤b4、更新回归树,得到输出的模型。

让损失函数沿着梯度方向的下降,利用损失函数的负梯度在当前模型的值作为回归问题提升树算法中的残差的近似值去拟合一个回归树,每轮迭代的时候,都去拟合损失函数在当前模型下的负梯度。

通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练,对弱分类器的要求一般是足够简单,并且是低方差和高偏差的,因为训练的过程是通过降低偏差来不断提高最终分类器的精度。

进一步,所述步骤c中新用户的行为记录数据具体包括:用户的个人基本信息、地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息。

进一步,所述步骤d具体包括:

步骤d1、将所述新用户的行为记录数据与所述模型进行关联度匹配,按关联度排序;其中,对地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息、用户的个人基本信息按由大到小的顺序赋予不同权重;

步骤d2、根据匹配的结果获取待推荐的商品信息;

步骤d3、将所述待推荐商品按照商品被购买的概率由大到小排列进行排序,生成推荐商品集合;

步骤d4、将所述推荐商品集合的商品数据发送给所述新用户。

进一步,所述步骤d3中商品被购买的概率由如下公式计算获得:

d表示用户购买商品的概率,u表示新用户,in(i)表示指向商品i的商品集合,out(j)表示商品j指向的商品集合,pr(j)表示商品j的被购买概率,pr(i)即为商品i的被购买概率。

进一步,所述商品集合根据大于支持度阈值的商品组成,所述支持度表示商品同时被购买的概率,由如下公式计算获得:

freq(a∩b)表示商品a和商品b同时被购买的次数,n表示总销售笔数,support(a∩b)为商品a和商品b同时被购买的概率,即为商品a和商品b的支持度。

本发明实施例提供的一种基于大数据的商品推荐装置,包括计算机可读介质,所述介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述任一项所述的方法。

以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1